Home ] [ Research ] [ Software ] [ Databases ] [ Teaching ] [ People ] [ Links ] [ Internal ] [ Oferta pfc ] [ Talp ]

   

 

 

OFERTES PFC

Oferta de Projecte Final de Carrera


Sincronització de la síntesi de la traducció i la imatge

Director: Jordi Adell
Marc del projecte

Una de les aplicacions de la síntesi de veu que més relleu està tenint en els darrers anys, és la traducció automàtica Veu-Veu. Es tracta que una màquina sigui capaç de produir en una altra llengua el que una persona diu en la seva pròpia. A més a més intentant que la veu generada sigui el màxim de semblant a la veu original. Per fer això calen diferents passos: reconeixement de la veu, traducció automàtica, síntesi de veu i transformació de veu.

Recentment la UPC està participant en el projecte europeu TC-STAR, juntament amb altres universitats i empreses, en el que s'està creant un sistema que sigui capaç de realitzar aquestes tasques. Un dels sistemes que estem desenvolupant és el que s'encarrega de la síntesi de veu.

L'estat de l'art dels sistemes de síntesi de veu està força avançat. Però en aquest camp de la traducció ens enfrontem a nous problemes. Generalment en la síntesi de veu sempre s'ha suposat que el text que s'havia de sintetitzar era d'alguna manera neutre, llegit. Però en aquest cas ens enfrontem a la traducció del que en diem parlar espontània. Per això alguns problemes nous afloren.

Definició del projecte

Es tracta de modificar el sintetitzador de la UPC per a que pugui generar veu de forma que és pugui sincronitzar amb la veu original en un vídeo. Per això cal prendre diferents decisions:

  • Quan comencem a emetre la traducció? Cal sincronitzar les paraules del locutor original amb les sintetitzades.
  • A vegades pot ser necessari canviar la velocitat de la parla del sintetitzador en relació amb la velocitat del locutor original.
  • Col·locar silencis/pauses quan el locutor original en fa. Cal tenir en compte tractem en dues llengües diferents i que naturalment les pauses no es col·loquen segons el mateixos criteris en totes les llengües !
  • També pot ser interessant col·locat fillers. Sons els típics sons que fem quan no sabem que dir. Per a que la veu sigui més natural.


El projecte es divideix en les següents fases:

  • Estudi de la bibliografia relacionada, bàsicament el projecte VERMOBIL.
  • Identificació de problemes específics.
  • Programació en C/C++, Matlab i/o XML de les possibles propostes.
  • Creació d'una demostració a partir d'un vídeo real del parlament europeu.
  • Avaluacions objectives i perceptuals dels resultats.


--> Si estàs interessant o desitges més informació pots contracta amb Jordi Adell jadell(at)gps.tsc.upc.es, despatx D5-118, tel. 93 401 1627.

OFERTES PFC

Home ] [ Research ] [ Software ] [ Databases ] [ Teaching ] [ People ] [ Links ] [ Internal ] [ Oferta pfc ] [ Talp ]

Send us any suggestion ag_mail.gif (994 bytes)

This page was last updated on August 18th, 2005