Euskorpus, proyecto impulsado por el Gobierno vasco, llevará el euskera a la revolución de la IA, garantizando de esta manera el futuro de la lengua vasca en una sociedad cada vez más digital

Imanol Pradales, lehendakari: “Con Euskorpus, ponemos todo el potencial de la Inteligencia Artificial y las tecnologías del lenguaje al servicio del euskera, de nuestras empresas y de la investigación. Lo hacemos alineando todas nuestras capacidades y desde la colaboración público-privada. Tenemos claro que el euskera formará parte de la construcción del nuevo entorno digital”

Presentación de la iniciativa Euskorpus. Foto: Irekia

Este miércoles el Edificio Central del Parque Tecnológico de Gipuzkoa ha acogido la presentación de la iniciativa Euskorpus, presidida por el lehendakari Imanol Pradales, y donde también han participado la vicelehendakari Ibone Bengoetxea, y los consejeros Mikel Jauregi e Juan Ignacio Pérez Iglesias, así como otros representantes del Gobierno vasco y de empresas del ecosistema público y privado comprometidos con el cuidado y el fomento del euskera y la cultura vasca en los entornos digitales. La presentación se ha desarrollado bajo el lema "Heufcara Iagi adi mundura" (euskara jalgi hadi mundura), extraido de uno de los versos del libro "Linguae Vasconum Primitiae" de Bernard Etxepare, primera publicación editada en euskera, en el año 1545. De esta forma, se ha querido poner en valor cómo el salto cualitativo a dar para llevar el euskera a la inteligencia artificial es comparable al momento en que la lengua vasca se empezó a utilizar en las imprentas.
El lehendakari Imanol Pradales ha destacado que “Euskorpus pondrá todo el potencial de la Inteligencia Artificial y las tecnologías del lenguaje al servicio del euskera, de nuestras empresas y de la investigación. Lo hacemos alineando todas nuestras capacidades y desde la colaboración público-privada, con el objetivo de perfeccionar el corpus digital de textos en euskera”.
Durante el acto de presentación también se ha dado a conocer la asociación Euskorpora, cuyo objetivo principal será el desarrollo de la iniciativa Euskorpus, a través de la que promocionar y asegurar la presencia digital del euskera, patrimonio cultural inmaterial nacional en peligro de extinción digital, mediante la recopilación, generación y desarrollo activo y metódico del corpus digital del euskera; y la promoción de modelos base de código abierto para el euskera, para su conservación, mantenimiento, y generación de impacto tanto en el tejido industrial como social, conectado al marco europeo de recursos lingüísticos digitales. En definitiva, gracias a Euskorpus se desarrollarán paquetes de datos en euskera, de forma que los fabricantes puedan importarlos en sus dispositivos conectados a internet dotándoles de capacidad de funcionar en este idioma. De esta forma, smartphones, tablets, smartwatchs, aplicaciones o asistentes digitales como Siri y Alexa tendrán la capacidad de interactuar con los usuarios en euskera, con un proceso de euskaldunización de la inteligencia artificial para que los usuarios de las herramientas de IA puedan utilizarlas en esta lengua. A su vez, con esta inversión, también se dinamizará el ecosistema vasco de la inteligencia artificial y gestión del dato.
El lehendakari, Imanol Pradales, ha recordado que, en esta legislatura, tenemos que dar un salto de calidad en la presencia y uso del euskera: en el ocio, en el deporte, en el mundo laboral, y por supuesto, en el ámbito digital… “Con el proyecto Euskorpus que hoy presentamos, ponemos todo el potencial de la Inteligencia Artificial y las tecnologías del lenguaje al servicio del euskera, de nuestras empresas y de la investigación. Lo hacemos alineando todas nuestras capacidades y desde la colaboración público-privada, con el objetivo de perfeccionar el corpus digital de textos en euskera”.
En este sentido, el lehendakari ha puesto en valor el corpus digital del euskera como un recurso imprescindible para desarrollar nuevos productos, investigaciones y aplicaciones ligadas a la Inteligencia Artificial, creando riqueza, empleo y conocimiento: “Tenemos claro que el euskera formará parte de la construcción del nuevo entorno digital. Seremos protagonistas en ese nuevo mundo o estaremos condenados a un papel secundario que ni nos corresponde, ni deseamos”.
Por su parte, el presidente de Euskorpora, Julian Florez, ha destacado que “tenemos la responsabilidad y la obligación de velar por la presencia del euskera en los nuevos entornos digitales y de aprovechar todo el potencial de los sistemas de inteligencia artificial y de las tecnologías de la lengua al servicio del euskera. Esta es nuestra apuesta, el reto es grande, y sabemos cómo hacer las cosas y estamos bien posicionados”.
Asimismo, Arantza del Pozo, directora de Tecnologías para el Procesamiento de la Voz y el Lenguaje Natural de Vicomtech, ha subrayado que "compilar recursos lingüísticos de forma coordinada es clave para impulsar el desarrollo de tecnologías del habla y lenguaje en euskera, con el objetivo de garantizar su presencia en el mundo digital al mismo nivel que otros idiomas".

Proyecto Euskorpus
El proyecto Euskorpus, que ha dado a conocer este miércoles el lehendakari, se constituye como la herramienta fundamental para la generación de ese corpus digital en euskera. Euskorpus se encuentra en marcha y cuenta con una dotación presupuestaria inicial de 5,55 millones de euros, a través del Departamento de Industria, Transición Energética y Sostenibilidad, con 2 millones consignados para 2025 y otros 3 millones para 2026. Además, los Departamentos de Cultura y Política Lingüística y de Ciencia, Universidades e Innovación también participan en el proyecto, con una aportación de 550.000 euros iniciales.
Esta triple implicación deriva de la consideración para el Gobierno Vasco de que la creación de este corpus es estratégica para que las tecnologías de la lengua respondan también en euskera con la calidad necesaria para que los servicios que existen y van a existir en una sociedad altamente digitalizada. En este contexto, la iniciativa Euskorpus tiene como objetivo que el euskera esté presente en el mercado digital en similares condiciones a las de otros idiomas, y, al tratarse de un proyecto de “industrialización” de los recursos lingüísticos, para ello es fundamental el impulso público.
La creación del corpus digital del euskera se ejecutará en tres principales fases: la primera fase será la de planificación y definición, y en ella se constituirá la oficina técnica que determinará la tipología del corpus y los modelos a desarrollar, y se definirán los sectores, aplicaciones y servicios estratégicos que se puedan beneficiar del mismo.
En la segunda fase, se pretende impulsar la compilación de corpus lingüísticos en euskera, impulsar el desarrollo de modelos base de códigos abiertos, e impulsar las infraestructuras para almacenamiento seguro, ensayos y validación.
Finalmente, en la tercera fase, se impulsará la transferencia y explotación de los corpus lingüísticos que se vayan compilando y de los modelos base de código abierto que se vayan desarrollando a las empresas, a la sociedad y a otras plataformas de datos europeas.
El acto de presentación de Euskorpus ha concluido con un llamamiento a las empresas para implicarse en la asociación Euskorpora, contribuyendo a impulsar y dar mayor alcance al proyecto. En adelante, a través de la colaboración público-privada, el Gobierno Vasco se centrará en trabajar y coordinar esfuerzos para enriquecer el proyecto Euskorpus, alineando para ello tanto recursos económicos como otros recursos operativos.

Asamblea de Euskorpora
Previo al evento de presentación del proyecto Euskorpus, la asociación Euskorpora ha celebrado su asamblea en la que se han sumado nuevas empresas a la asociación, quedando así la lista de empresas y entidades, tanto públicas como privadas, que la constituyen: Vicomtech, Ereil Technologies SL, Trebe Language Technologies, Euskaltzaindia, Eusko Jaurlaritza, Baleuko, Mixer, EiTB, CAF, MCC, Petronor, Euskaltel Fundazioa, Kutxabank, PWC, y Logikaline.

Más noticias de Economía / Ekonomia