El robot Furhat ya habla gallego con labios sincronizados gracias al Proxecto Nós

Las investigadoras Carla Castedo e Carmen Magariños, del Proxecto Nós, acompañadas por Alejandro Catalá, del CiTIUS, presentaron el pasado 5 de septiembre un avance pionero en la XXV edición do Congreso Internacional de Interacción Persona-Ordenador (Interacción 2025). Su intervención, incluida en el bloque Interacción Social Inclusiva II, mostró cómo han conseguido que el robot social Furhat hable en gallego con una sincronización labial natural y expresiva.
Superando una limitación del inglés
Furhat es uno de los robots sociales más avanzados del mundo, reconocido por su máscara proyectada que reproduce expresiones faciales y por su capacidad para mantener conversaciones fluidas. Sin embargo, su sincronización de labios estaba pensada principalmente para el inglés, lo que producía resultados poco naturales al emplear otros idiomas.
Para resolver esta limitación, el equipo creó desde cero un diccionario de pronunciación en gallego y entrenó un modelo acústico con cientos de horas de grabaciones. Estos recursos permitieron utilizar el Montreal Forced Aligner (MFA), una herramienta que alinea el sonido con la transcripción y lo adapta al formato que necesita Furhat para coordinar los movimientos labiales con el audio en gallego.
Evaluación con éxito
El sistema fue validado en dos fases:
- En una prueba técnica, el modelo mostró una precisión similar a la de otros idiomas con más recursos tecnológicos.
- En una evaluación con hablantes nativos, el 88 % de las personas participantes prefirieron la nueva sincronización frente a la original de Furhat (que solo alcanzó un 2 % de aceptación).
Además, los expertos destacaron que el robot no solo mejoró en inteligibilidad, sino también en expresividad facial, haciendo las interacciones más cercanas y creíbles.
Hacia el futuro
ste avance abre nuevas posibilidades para que Furhat y otros robots sociales puedan integrarse en entornos donde se utilizan lenguas minorizadas. El equipo prevé ahora mejorar la gestión de los silencios, reducir la latencia para conversaciones espontáneas y explorar modelos más avanzados de inteligencia artificial.
Con este trabajo, el Proyecto Nós da un nuevo paso en la incorporación del gallego a las tecnologías del habla y de la interacción humano-robot, situando a nuestra lengua en la vanguardia de la innovación. Al mismo tiempo, genera sinergias que repercuten de forma positiva en otras líneas de investigación aplicada que se desarrollan en el CiTIUS. El know-how adquirido por sus investigadores está favoreciendo la evolución de iniciativas como XOGAMOS, centrada en interacciones inteligentes en robots sociales para la estimulación cognitiva, o XAI4SOC, que explora la inteligencia artificial explicable aplicada al envejecimiento saludable y al bienestar social. Estas conexiones consolidan un ecosistema de investigación colaborativa que potencia la transferencia de conocimiento y la innovación multidisciplinar.
Sobre Interacción 2025
a vigésima quinta edición del Congreso Internacional de Interacción Persoa-Ordenador se celebró del 3 al 5 de septiembre de 2025 en la Universidad de Valladolid y estuvo organizada por los grupos ECA-SIMM y GSIC/EMIC de la UVa, con la colaboración del Departamento de Informática y el Centro de Inteligencia Artificial. Interacción 2025 reunió a académicos, estudiantes y profesionales interesados en todas las dimensiones de la interacción persona-ordenador, promoviendo propuestas innovadoras y un enfoque multidisciplinar que abarcó informática, interacción humano-robot, accesibilidad, realidad virtual, experiencia de usuario y otros temas relacionados.
REFERENCIA:
Tailoring Furhat robotic head lip-syncing to Galician language: an adaptation and evaluation study. Carla Castedo, Carmen Magariños, Alejandro Catalá, Alberto Bugarín Diz. Interacción 2025.