L’AVL participa en el conveni estatal per a generar models de llenguatge

Un dels reptes de les llengües de l’Estat i, sobretot, de les llengües minoritzades, com és el valencià, és convertir-se en una llengua d’ús habitual en internet. Les oportunitats que presenta la intel·ligència artificial (IA) cal aprofitar-les, perquè totes les llengües han de tindre visibilitat i els usuaris han de tindre el dret de poder usar-les sense que cap llengua s’impose sobre altres. Això vol dir que totes les variants de la nostra llengua han de quedar enregistrades per a fer possible que tots els usuaris tinguen els mateixos drets i no hagen de fer renúncies lingüístiques en cap projecte d’intel·ligència artificial. A més, totes les varietats enriquixen i potencien l’ús de la llengua.

La Unió Europea va aprovar el mes de maig passat la Llei d’intel·ligència artificial. Ara cal accelerar l’ús de la IA en el sector públic i impulsar-lo també en el sector privat, i tot sota el paraigua de la regulació i de la transparència.

En este context, i segons el Ministeri per a la Transformació Digital i de la Funció Pública, l’estratègia de la IA recolza en tres grans eixos:

  1. Reforçar els ítems clau per al desenvolupament de la IA. És a dir, impulsar la inversió en supercomputació, generar capacitat d’emmagatzematge en condicions de sostenibilitat, generar models i dades que constituïsquen una infraestructura pública d’IA i fomentar el talent en la IA.
  2. Facilitar l’aplicació de la IA en els sectors públic i privat fomentant la innovació i la ciberseguretat (de la qual s’encarrega l’Agència Espanyola de Supervisió i IA, AESIA. Esta agència ha de garantir l’ètica i la transparència en l’aplicació de la IA).
  3. Fomentar una IA transparent, responsable i oberta, amb gran pes de dades tant en castellà com en la resta de llengües oficials.

ALIA és el model funcional obert de la IA generativa desenrotllat a Espanya. ALIA pretén augmentar el nombre de models, i superar en més del 20 per cent el pes de les llengües parlades en l’estat espanyol. Foto de la reunió.També protegirà els drets dels autors, i és per això que es treballa en una nova llei de protecció intel·lectual. Amb ALIA, Espanya pretén situar-se a l’avantguarda del desenvolupament i ús dels models de llenguatge i, a més, vol diferenciar-se d’altres models europeus per la seua transparència. El foment del talent en IA disposa d’una inversió en els pressupostos del Ministeri de 760 milions d’euros.

Un dels projectes més engrescadors del Ministeri per a la Transformació Digital i de la Funció Pública, que s’emmarca en l’Estratègia d’Intel·ligència Artificial 2024, és la posada en marxa d’un model de llenguatge tant en castellà com en cadascuna de les llengües cooficials de l’Estat. Per a fer-ho possible, s’ha dissenyat un model de governança regulat a través d’un conveni que signaran quinze institucions. El conveni pretén generar models i corpus per a una infraestructura pública de models de llenguatge.

La quinzena d’institucions que figuren en el conveni, en peu d’igualtat al costat de l’Acadèmia Valenciana de la Llengua, són:

  • l’Acadèmia de la Llengua Espanyola
  • la Real Academia Galega
  • Euskaltzaindia, la Reial Acadèmia de la Llengua Basca
  • l’Institut d’Estudis Catalans
  • l’Institut Cervantes
  • La Secretaria d’Estat de Digitalització i Intel·ligència Artificial (SEDIA)
  • El Ministeri de Cultura, al qual li corresponen les competències en matèria de propietat intel·lectual, arxius i biblioteques, i al qual està adscrita la Biblioteca Nacional, que conserva el corpus documental més gran de l’Estat, tant en castellà com en la resta de llengües cooficials
  • El Barcelona Supercomputing Center – Centre Nacional de Supercomputació (BSC-CNS)
  • L’Agència espanyola de supervisió de la IA (AESIA)
  • El Centre Nacional d’Indústries de l’Espanyol, del Govern de la Rioja
  • El centres que participen en el projecte ILENIA (Impuls de les Llengües en IA): HiTZ (Centre Basc de Tecnologia de la Llengua); ILG (Instituto da Lingua Galega), en col·laboració amb el Centro Singular de Investigación en Tecnoloxías Intelixentes (CITIUS) i el Centre d’Intel·ligència Digital (CENID), juntament amb el Centro de Estudios Avanzados en Tecnologías de la Información y Comunicación (CEATIC), representats per les universitats de què formen part: del País Basc, de Santiago de Compostel·la, d’Alacant i de Jaén, respectivament.

Arran d’este conveni, les acadèmies que en formen part subministraran els corpus lexicogràfics i específics, assegurant que els models desenvolupats disposen d’una base de coneixement ampla i detallada, propícia per a l’entrenament i l’evolució de sistemes d’aprenentatge automàtic eficients i efectius. Se supervisarà l’aplicació correcta de les normes i regles lingüístiques per a la llengua cooficial corresponent en el seu conjunt, que inclourà aspectes gramaticals, ortogràfics, lèxics i sintàctics, proporcionant així una guia clara sobre l’ús correcte i estàndard de la llengua. En el cas de l’AVL i l’IEC hi haurà un diàleg entre les dos institucions per la singularitat d’ocupar-se d’una llengua compartida.

Està previst que el conveni estiga signat este mes de setembre.