O robot Furhat xa fala galego con beizos sincronizados grazas ao Proxecto Nós

As investigadoras Carla Castedo e Carmen Magariños, do Proxecto Nós, acompañadas por Alejandro Catalá, do CiTIUS, presentaron o pasado 5 de setembro un avance pioneiro na XXV edición do Congreso Internacional de Interacción Persona-Ordenador (Interacción 2025). A súa intervención, incluída no bloque Interacción Social Inclusiva II, amosou como conseguiron que o robot social Furhat fale en galego cunha sincronización labial natural e expresiva.
Superando unha limitación do inglés
O Furhat é un dos robots sociais máis avanzados do mundo, recoñecido pola súa máscara proxectada que reproduce expresións faciais e pola capacidade de manter conversas fluídas. Porén, a súa sincronización de beizos estaba pensada sobre todo para o inglés, o que provocaba resultados pouco naturais ao empregar outras linguas.
Para solucionar esta eiva, o equipo creou desde cero un dicionario de pronunciación en galego e adestrou un modelo acústico con centos de horas de gravacións. Estes recursos permitiron empregar o Montreal Forced Aligner (MFA), unha ferramenta que aliña o son coa transcrición, e adáptao ao formato que precisa Furhat para coordinar os movementos labiais co audio en galego.
Avaliación con éxito
O sistema foi validado en dúas fases:
- Nunha proba técnica, o modelo mostrou unha precisión similar á doutros idiomas con máis recursos tecnolóxicos.
- Nunha avaliación con falantes nativos, o 88 % das persoas participantes preferiron a nova sincronización fronte á orixinal de Furhat (que só acadou un 2 % de aceptación).
Ademais, as persoas expertas destacaron que o robot non só mellorou en intelixibilidade, senón tamén en expresividade facial, facendo as interaccións máis próximas e cribles.
Cara ao futuro
Este avance abre novas posibilidades para que Furhat e outros robots sociais poidan integrarse en contornos nos que se empregan linguas minorizadas. O equipo prevé agora mellorar a xestión dos silencios, reducir a latencia para conversas espontáneas e explorar modelos máis avanzados de intelixencia artificial.
Con este traballo, o Proxecto Nós, por unha banda, dá un novo paso na incorporación do galego ás tecnoloxías da fala e da interacción humano-robot, situando a nosa lingua na vangarda da innovación, e por outra, xera tamén sinerxías que repercuten de maneira positiva noutras liñas de investigación aplicadas que se desenvolven no CiTIUS. O know-how adquirido polos seus investigadores está a favorecer a evolución de iniciativas como XOGAMOS, centrada en interaccións intelixentes en robots sociais para a estimulación cognitiva, ou XAI4SOC, que explora a intelixencia artificial explicable aplicada ao envellecemento saudable e ao benestar social. Estas conexións consolidan un ecosistema de investigación colaborativa que potencia a transferencia de coñecemento e a innovación multidisciplinar.
Sobre o Interacción 2025
A vixésima quinta edición do Congreso Internacional de Interacción Persoa-Ordenador celebrouse do 3 ao 5 de setembro de 2025 na Universidade de Valladolid e estivo organizado polos grupos ECA-SIMM e GSIC/EMIC da UVa, coa colaboración do Departamento de Informática e o Centro de Intelixencia Artificial. O Interacción 2025 reuniu académicos, estudantes e profesionais interesados en todas as dimensións da interacción persoa-ordenador, promovendo propostas innovadoras e un enfoque multidisciplinar que abranguera informática, interacción humano-robot, accesibilidade, realidade virtual, experiencia de usuario, e outros temas relacionados.
REFERENCIA:
Tailoring Furhat robotic head lip-syncing to Galician language: an adaptation and evaluation study. Carla Castedo, Carmen Magariños, Alejandro Catalá, Alberto Bugarín Diz. Interacción 2025.