Ir o contido principal

O Proxecto Nós desprázase ata Brasil para participar na International Conference on Computational Processing of Portuguese (PROPOR2026)

Lúa Santamaría Montesinos e Saúl Buján Souto no PROPOR 2026
Lúa Santamaría Montesinos e Saúl Buján Souto no PROPOR 2026
Lúa Santamaría Montesinos e Saúl Buján Souto presentaron no congreso, que tivo lugar do 13 ao 16 de abril en Salvador de Bahia, a publicación "Improving Machine Translation of Idioms: A Spanish–Galician Parallel Dataset and Synthetic Augmentation Approach", en coautoría con Daniel Bardanca e Pablo Gamallo.

Entre o 13 e o 16 de abril de 2026 celebrouse en Salvador de Bahia (Brasil) o International Conference on Computational Processing of Portuguese (PROPOR2026), un dos principais encontros científicos dedicados ao procesamento da linguaxe natural no ámbito das linguas portuguesa/galega. O evento reuniu investigadoras e investigadores de todo o mundo para presentar avances recentes en tradución automática, lingüística computacional e intelixencia artificial aplicada a contextos multilingües.

O equipo do proxecto Nós participou activamente no congreso coa presentación do artigo “Improving Machine Translation of Idioms: A Spanish–Galician Parallel Dataset and Synthetic Augmentation Approach”, unha investigación de Lúa Santamaría Montesinos, Saúl Buján Souto, Daniel Bardanca Outeiriño e Pablo Gamallo Otero.

Este traballo aborda un dos retos máis persistentes na tradución automática: o tratamento das expresións idiomáticas. Este tipo de expresións (como "chover a cántaros" ou "estar nas nubes") son difíciles de traducir para os sistemas automáticos de tradución. Este traballo presenta un método para mellorar a tradución deste tipo de expresións do castelán ao galego.

A investigación propón un enfoque baseado na creación e ampliación dun conxunto de datos específico para este tipo de expresións. Nunha primeira fase, elaborouse unha listaxe de expresións idiomáticas coas súas correspondencias en castelán e galego. Posteriormente, empregáronse técnicas de intelixencia artificial para xerar automaticamente novas parellas de tradución, priorizando aquelas de uso máis frecuente. Este conxunto ampliado utilizouse para adestrar un sistema de tradución automática castelán-galego.

Os resultados obtidos amosan unha mellora significativa na tradución de expresións idiomáticas tras o proceso de adestramento, así como un lixeiro incremento na calidade global do sistema.

A investigación completa pódese consultar nesta ligazón

A participación no #PROPOR2026 constitúe unha oportunidade clave para reforzar a presenza da investigación en galego en foros internacionais, contribuír ao desenvolvemento de ferramentas lingüísticas máis precisas e adaptadas ás particularidades das linguas minorizadas.

 

Os contidos desta páxina actualizáronse o 20.04.2026.