|
|
Oferta de Projecte Final de Carrera:
La mayoría de los sistemas actuales están basados en la concatenación de segmentos de voz pregrabados, escogidos cuidadosamente de grandes bases de datos. Este método ofrece buena calidad pero requiere corpus orales muy grandes y es muy poco flexible, tanto en lo que se refiere a la manipulación prosódica (F0, duración) como a la manipulación espectral (timbre). En el departamento se ha desarrollado un prototipo para generar voz a partir de la representación del espectro MFCC (hasta ahora, el uso de los coeficientes MFCC se reducía al ámbito del reconocimiento de voz). Este prototipo se ha programado en Matlab y ha demostrado ser capaz de generar voz de un alta calidad. El objetivo de este PFC es incorporar el modelado mediante HMM a esta técnica de generación de señal a partir de MFCC e integrarla como módulo en el sintetizador de voz del departamento. Una de las ventajas potenciales de este metodo es la facilidad para generar voces distintas con muy pocos datos de adaptación o crear sintesis en lenguas diversas por un mismo locutor (aunque el original fuera monolingue). Para ello, se propone una división del proyecto en las siguientes fases:
Es recomendable:
Información adicional
Si estás interesado o deseas información puedes contactar con: Javier Pérez Mayos
|
|
Send us any suggestion
| This page was last updated on March 18th, 2005 |