La diversidad dialectal del gallego tendrá presencia en el ecosistema digital
El gallego y su diversidad dialectal dan un nuevo paso para garantizar su presencia en el ecosistema digital del futuro, además de documentar y proteger su riqueza oral. La plataforma colaborativa Common Voice, impulsada por Mozilla y alimentada por personas voluntarias de todo el mundo, incorpora una nueva funcionalidad para el reconocimiento del habla, denominada Spontaneous Speech (‘habla espontánea’), que permitirá registrar donaciones con acentos diversos, variantes léxicas y morfológicas, cambios de código o fenómenos propios de la oralidad que suelen desaparecer en el habla leída.
Hasta ahora, las contribuciones en esta plataforma colaborativa (que tiene como misión construir recursos en abierto para el reconocimiento del habla) consistían en grabaciones de lectura en voz alta de textos disponibles en dominio público. La nueva funcionalidad, que de momento está en fase de pruebas, abre la puerta a la recogida de una habla más natural, diversa y representativa del uso real de la lengua en el día a día: a través de preguntas sencillas registradas en Common Voice, las personas voluntarias podrán grabar respuestas breves y espontáneas que recogerán su variedad dialectal.
Esta nueva herramienta, con la que Common Voice refuerza su compromiso con la diversidad lingüística y con la accesibilidad digital, facilitará la participación de hablantes de distintas edades, regiones o niveles de alfabetización digital, además de reconocer y valorar el habla real, rica en matices y mucho más representativa del uso lingüístico actual que los textos escritos tradicionales.
Como funciona Spontaneous Speech
Dentro de la plataforma Common Voice, al escoger, en la sección Fale, la opción Responda preguntas, las personas colaboradoras pueden grabar sus respuestas; además, también pueden participar transcribiendo las respuestas de otras usuarias y validando esas transcripciones, lo que contribuye a crear un corpus de habla de calidad.
El Instituto de la Lengua Galega (ILG), a través del Proyecto Nós, colaboró con la redacción del primero conjunto de preguntas disponibles para la recogida de habla espontánea en gallego. Sin embargo, cualquier persona puede proponer nuevas preguntas a través de la plataforma, lo que garantiza que los contenidos evolucionen de forma abierta y participativa.
Las aportaciones recogidas a través de Spontaneous Speech darán lugar a un conjunto de datos independiente, que se publicará bajo licencia CC0, en línea con la filosofía de datos abiertos de Common Voice. Esto permitirá que investigadoras, lingüistas, etc. accedan a datos de habla espontánea en lengua gallega de forma libre y gratuita, fomentando de este modo el desarrollo de tecnologías inclusivas y plurales, adaptadas a las necesidades reales de las personas usuarias, y la ciencia abierta o ciudadana, con la posibilidad para cualquier persona de participar en la recogida de datos.
Donación de voz: AgasallaNós
Bajo el lema AgasallaNós, y con el objetivo de facilitar la participación en la recogida de voz en gallego dentro de la plataforma Common Voice, el Proyecto Nós recuerda que está disponible la página web doagalego.nos.gal, una vía sencilla y accesible para contribuir al proyecto. A través de esta web, cualquier persona puede donar su voz, tanto leyendo textos en voz alta como respondiendo las nuevas preguntas de habla espontánea. El objetivo es recopilar grabaciones que representen la diversidad del gallego, con el fin de contribuir al desarrollo de tecnologías de reconocimiento del habla que identifiquen toda la riqueza de nuestra lengua. Se puede encontrar la información completa en la web doagalego.nos.gal.