Fichero publicado por TTS Fer

Nota: esta publicación fue revisada por su autor hace 7 años. Antes se titulaba Pack del sintetizador de voz MBROLA conn su respectivo instalador y sus voces en españo..

Pack del sintetizador de voz MBROLA con su respectivo instalador y sus voces en español.

¡Buenas!
A pesar de que hice un par de publicaciones sobre MBROLA, hago la tercera y la última, después de años.
Bien, esto viene a ser una síntesis de voz mediante dífonos que, como sucede con la síntesis de voz al ser software libre, contiene varias herramientas diferentes y multiplataforma.
Este sintetizador fue muy utilizado por diferentes tecnologías TTS,por ejemplo Festival TTS, otro conjunto de herramientas de síntesis de voz que además fueron compiladas algunas voces por NVDA. También las puede manejar Espeak, para traducir cada fonema y que de esta manera puedan manejarlo leyendo más o menos claro con dichas voces. Lo manejaba también quienes hoy día son Acapela con su sintetizador Infovox Destop, un ejemplo en español es Javier, antiguamente conocido como Juan.
Este sintetizador en realidad no recibe texto como entrada, sinó fonemas. Para que se entienda, para cantar o hablar deben escribirse cada fonema con sus diferentes parámetros: Duración, tonalidad y demás, los que para quien están acostumbrados a procesar únicamente mediante texto, va a resultar un verdadero quilombo.
Voy a ponerles a continuación un ejemplo de código para que MBROLA cante en portugués:
Notas: si sentís que no vas a entender nada, apretá flecha abajo hasta que regrese yo con el resto.
Se indica primero como comentario cada parte que va a cantar (en portugués) y se pasa a cada fonema con sus respectivos valores.
;atirei

a 600 50 392

t 122 1 392

i 90 1 349

r 100 1 349

e 137 1 329

i 130 99 329

;o

w 85 1 293

;pau

p 128 1 293

a 137 1 329

w 123

;no

n 80 1 329

w 85 1 349

;gato

g 120

a 400 1 392

t 122

o 400

t 122

o 400

;mas

m 96 1 392

a 120 1 440

;o

z 94 1 440

w 200 1 392

;ga

g 120 1 392

a 400 1 349

;tô

t 122

o 400

;tô

t 122

o 400

;não

n 80 1 349

@ 112 1 392

w 85

;morreu

m 96 1 392

o 90 1 349

rr 112 1 349

e 350 1 329

u 70

;rêu

rr 112 1 329

e 350

u 70

;rêu

rr 112 1 329

e 350

u 123

;

_ 10 1 329

;dona

d 80 1 261

o 130 1 261

n 80

a 130

;chi

x 135 1 261

i 400 10 440

;ca

k 85 1 440

a 400 1 440

;ca

k 85 1 440

a 400 1 440

;dimirou

d 80 1 440

i 100 1 494

m 96 1 494

i 100 1 440

r 100 1 440

o 350 1 392

w 83

;sê

s 90 1 392

e 400 1 392

;sê

s 90 1 392

e 400 1 392

;do

d 80 1 392

w 85 1 329

;berrô

b 100 1 329

e 95 1 349

rr 102 1 349

o 400 1 392

;do

d 80 1 392

w 85 1 329

;berrô

b 100 1 329

e 95 1 349

rr 102

o 95 1 392

;que

k 100 1 392

y 85 1 349

;o

w 85

;gato

g 120 1 349

a 127 1 329

t 122 1 329

w 85 1 293

;deu

d 80 1 293

e 400 1 261

Con el Mbrola Tools, lo primero que ya tienen, podrían abrir un archivo que puede tener una canción, una frase, lo que sea y uno de sus programas va a comenzar a reproducirlo. Eso sí, como ya les dije por un lado puede que les parezca algo muy antiguo porque en efecto lo es,y va a ser bastante robótico por la síntesis de voz que maneja, de forma que cuanto más trabajado está el texto, más lindo va a sonar el resultado.
Ahí dentro se inclullen el MBROLA Tools, que es un instalador y es necesario para cualquier cosa que se intente, incluso usar estas voces con Espeak. Piénsenlo como el engine de otros sintetizadores más modernos, si así lo ven mejor.
Aunque el propio instalador al finalizar te da la opción de entrar a la página web en inglés y descargar las Databases que se quieran (las voces) ahí puse también todas las voces en español. Como si fueran portables pueden tenerse donde quieran, y si lo que se quiere es leer algún texto de example que se incluye en cada una deben hacer lo siguiente (no es necesario si se quiere hacer hablar al Espeakk por ejemplo)
Vamos a entrar al MBROLA control panel, primero. Luego nos va a pedir, en inglés, que especifiquemos el valor predeterminado de la base de datos de voz utilizada por MBROLA, y de más. Vamos a estar en una lista que primeramente va a estar vacía.
Vamos a apretar tab un par de veces hasta escuchar: Wizard... botón. Al dar enter, vamos a buscar mediante la presentación en árbol que va a salir, la ruta donde está la base de datos, que consiste en un archivo sin extención pero que es binario y contiene las grabaciones de voz. Al terminar se puede dar Enter, el programa va a buscar cuántas bases de datos se encontraron y agregaron, pudiendo dar en OK, finalmente, o en Apli, se se quisiera repetir el mismo proceso o hacer alguna otra cosa sin salir.
Ahora sí, pueden abrir un archivo de los que tienen ahí, por ejemplo en los examples de cada voz, o mediante el MBREdit, intentar hacerle decir alguna palabra.
Pueden manejarse en Sapi 5 a través de Espeak, aunque ya no sirve. Desde la última modificación de los archivos necesarios de traducción de fonemas, más las propias actualizaciones de Espeak, ahora se pueden andar y todo pero leyendo mal, a veces pueden aparecer palabras mal pronunciadas. Por supuesto, es modificable. Son archivos sin extención contenidos en espeak data o espeak NG data\voices\mbr.
De todas maneras cómo hacerlo lo expliqué acá: https://www.blindworlds.com/publicacion/37878
También se desarrollaron un par de complementos para NVDA: Uno donde hablan estas voces sin intervención de espeak, pero no hay voces en español. Alternativamente están en un addon todas las voces en todos los idiomas ahora sí hablando mediante espeak: http://grossgang.com/tts/synthesizers%20for%20nvda/espeak/mbrola%20in%20...
Bien, para todo mínimamente el MBROLA Tools debe estar instalado, como dije antes.
¡Hasta!

Archivo: