O galego sitúase na vangarda das tecnoloxías intelixentes a través do Proxecto Nós-ILENIA
O Centro de Estudos Avanzados (CEA) de Santiago de Compostela acolleu esta mañá a xornada Tecnoloxía en galego: resultados de ILENIA – Proxecto Nós. Este encontro serviu para dar a coñecer os resultados dos últimos tres anos de traballo do Proxecto Nós no marco de ILENIA, unha iniciativa do Goberno de España orientada a avanzar en recursos e capacidades en tecnoloxías lingüísticas, en particular para as linguas do Estado. Datos, casos de uso e ferramentas abertas de tradución automática, síntese de voz e modelos lingüísticos en galego déronse a coñecer este xoves 18 en Santiago.
A xornada comezou coa apertura institucional a cargo de Aleida Alcaide, directora xeral de Intelixencia Artificial do Goberno de España, quen puxo en valor o feito de que o proxecto comezara a xestarse «antes de la irrupción de la IA generativa», o que demostra que desde os centros de investigación «ya se estaba pensando en el potencial que podría tener la futura inteligencia artificial». Alcaide explicou que o obxectivo do Ministerio foi «crear una sinergia» entre iniciativas similares en distintas linguas cooficiais e subliñou que, xunto cos datos e a infraestrutura, «el tercer ingrediente esencial es el talento, ese del que tenéis tanto en Galicia». A súa intervención marcou tamén o inicio dunha nova etapa, ao anunciar que «ILENIA se cierra pero se abre la etapa ALIA», garantindo aos nodos galegos «todo nuestro acompañamiento en este proceso».
Pola súa banda, a directora do ILG (Instituto da Lingua Galega), Elisa Fernández Rei, lembrou que ILENIA naceu para «impulsar en España unha nova economía dixital baseada na linguaxe natural», mentres que o director do CiTIUS, Senén Barro, reivindicou o papel central das tecnoloxías lingüísticas na intelixencia artificial, advertindo de que «o que será extraordinariamente caro é non facelo» e defendendo a colaboración público-privada como clave para xerar riqueza e emprego arredor deste ámbito estratéxico.
Un dos bloques centrais da xornada estivo dedicado á presentación de datos e casos de uso, no que participaron representantes do propio Proxecto Nós e entidades colaboradoras como a Fundación Mozilla, Imaxin Software, AMTEGA e CREAGAL. Neste apartado cómpre salientar o labor desenvolvido na recompilación de datos lingüísticos, xa que, por exemplo, nos últimos tres anos as horas de voz para recoñecemento automático da fala pasaron de 10 a 3.227. En Common Voice figuran na actualidade 385 horas de banco de voces colaborativo, cando inicialmente había só 18, multiplicando por 20 a súa presenza neste período e convertendo así o galego na décima lingua das 163 existentes nesta plataforma pública de datos de voz. Common Voice é unha plataforma en aberto deseñada para a creación comunitaria de conxuntos de datos de fala e texto na que calquera persoa pode preservar, revitalizar e promover a súa lingua compartindo, creando e organizando conxuntos de datos de texto e voz.
Alén diso, esta recollida de fragmentos de audio estase a realizar coa colaboración da Xunta de Galicia, buscando ademais a representación das variedades dialectais do galego para, deste xeito, xerar un corpus público alleo aos cambios tecnolóxicos e de libre uso.
No encontro expúxose tamén o traballo desenvolvido en RAG (acrónimo anglosaxón de Xeración Aumentada de Información - Retrieval Augmented Generation), unha das técnicas empregadas para controlar as alucinacións dos modelos de intelixencia artificial mellorando en xeral a calidade da interacción do usuario cos modelos grandes de linguaxe.
Este espazo deu acollida tamén á presentación do primeiro tradutor neuronal en galego, que ademais ofrece mellores prestacións obxectivas con respecto a outros existentes e que conta tamén con diversas vantaxes adicionais: é un recurso público, permite traducir tanto texto plano como arquivos e, ademais, está integrado na Plataforma de Tradución Automática da Axencia Estatal de Administración Dixital (PLaTa).
Outros casos de uso expostos ao longo da mañá foron sistemas de conversión de texto a voz (TTS, do inglés Text-to-Speech), en concreto os exemplos de voces sintéticas en galego mais a iniciativa AhoMyTTS, unha ferramenta de síntese de voz que permite converter texto escrito en fala natural. AhoMyTTS funciona a partir de modelos de intelixencia artificial, desenvolvidos pola Universidade do País Vasco, e está adaptada para diferentes linguas, entre elas o galego, a través da colaboración do proxecto Nós.
Estes demostradores —o tradutor e o TTS— teñen como obxectivo facilitar a transferencia do coñecemento xerado polo Proxecto Nós a empresas, administracións públicas e á sociedade en xeral, para promover o uso real da lingua galega en contornas dixitais avanzadas.
Un ecosistema tecnolóxico en galego sostible e competitivo
A sesión 'Acceso e uso dos recursos: datos, modelos e ferramentas' afondou na filosofía aberta do proxecto, xa que tanto os datos coma os modelos lingüísticos e as ferramentas desenvolvidas están dispoñibles para o seu uso libre, co fin de impulsar un ecosistema tecnolóxico en galego sostible e competitivo. Outro dos puntos tratados foi a inminente integración do Proxecto Nós en ALIA, unha iniciativa pioneira na Unión Europea que busca crear unha infraestrutura pública de recursos de IA para promover o fomento do castelán e das linguas cooficiais no desenvolvemento e implantación da intelixencia artificial no mundo.
A xornada incluíu tamén unha presentación das dúas factorías de IA en España. En concreto, a factoría 1HealthAI, foi presentada por Lois Orosa, director do CESGA, o centro no que residirá o núcleo de infraestruturas e operativo de dita factoría.
O evento contou tamén cunha mesa redonda sobre a importancia do galego no mundo dixital, cunha moi destacada presenza de empresas galegas comprometidas co desenvolvemento tecnolóxico do galego en as tecnoloxías lingüísticas en xeral. Nesta mesa púxose de manifesto a necesaria colaboración entre investigación, empresa e administración para asegurar a presenza da lingua propia nos novos desenvolvementos tecnolóxicos e para fornecer unha industria galega en IA e tecnoloxías lingüísticas.
O encontro pechouse coas intervencións de Valentín García, secretario xeral da Lingua da Xunta de Galicia; Pedro Blanco Lobeiras, delegado do Goberno en Galicia; e Pilar Bermejo, vicerreitora de Política Científica da Universidade de Santiago de Compostela. Todos eles coincidiron en sinalar na súas intervencións o Proxecto Nós como unha peza clave para garantir o futuro do galego na era da intelixencia artificial.