Donostiako Teknologia Parkean izango du egoitza Euskorpus proiektuak, eta hantxe aurkeztu dute gaur goizean. Ekitaldi arranditsuek ohi duten oihartzuna eman diote ekitaldiari; han izan dira, besteak beste, Eusko Jaurlaritzako lehendakari Imanol Pradales; lehendakariorde Ibone Bengoetxea; Industria, Trantsizio Energetiko eta Jasangarritasunerako sailburu Mikel Jauregi; eta Unibertsitate, Ikerkuntza eta Berrikuntza sailburu Juan Ignacio Perez Iglesias. EBB Euzkadi Buru Batazarreko presidente Andoni Ortuzar eta presidentegai Aitor Esteban ere, haien inguruan azkenaldian zabaldu diren albisteek sortutako zurrunbiloaren ondorenean, batera azaldu dira han. Sinbolikoki, euskararen biziberritzeari begira, mugarri bat jarri dutela erakutsi nahi izan dute, 1545. urtean Bernat Etxeparek Linguae Vasconum Primitiae liburua argitaratu zuenean egin zuenaren parekoa; hain justu ere, haren Euskara jalgi hadi mundura leloa maiz nabarmendu dute, eta liburuaren ale bat ere han jarri dute. Asmo handia erakutsi dute: proiektuak adimen artifizialaren «iraultzara» eramango du euskara, eta «bermatu» egingo du hizkuntzaren presentzia arlo digitalean.
Ikusi gehiago
5,55 milioi euroko aurrekontua bideratu du Jaurlaritzak egitasmoa abiarazteko. Hala ere, Euskorpus «lankidetza publiko-pribatuaren» ondorioa dela azaldu dute, eta, hain justu ere, izaera arrunt ezberdina duten erakundez osatuta dago egitasmoa bultzatuko duen elkartea: Euskorpora. Horra zein diren kideak: Vicomtech, Ereil Technologies, Trebe Language Technologies, Euskaltzaindia, Eusko Jaurlaritza, Baleuko, Mixer, EITB, CAF, MCC, Petronor, Euskaltel fundazioa, Kutxabank, PWC eta Logikaline.
Gaur egin dute lehen batzarra, eta ondoren egin dute aurkezpen ekitaldia. Euskorporako presidente Julian Florez eta Vicomtecheko Hizkuntza Naturala Prozesatzeko Teknologien zuzendari Arantza del Pozok hartu dute hitza. Biek nabarmendu dute egun euskarak, hizkuntza handiekin alderatuta, eremu digitalean aurrera egiteko zailtasunak dituela, «arrakala bat» dagoela hor, corpusen urritasunak eragindakoa bereziki, eta horregatik duela berebiziko garrantzia egitasmoak.
Langintza handia
Corpus digitala «modu aktiboan eta metodologikoan» garatzea izango da proiektuaren helburu nagusia; nabarmendu dute «eskuz» egin beharreko lan handia eskatzen duela horrek, eta horregatik dela garrantzitsua langintza horretan behar bezala jarduteko indarrak batzea. «Euskorpusek adimen artifizialaren eta hizkuntzen teknologiaren potentzial osoa euskararen, gure enpresen eta ikerketaren zerbitzura jarriko du. Horretarako, gure gaitasun guztiak lerrokatuko ditugu, lankidetza publiko-pribatuaren bidez».
Industria Sailak jarritako du egitasmorako aurrekonturik handiena; bi milioi euro jarriak ditu aurtengorako, eta gainerakoak datorren urterako dira. Hizkuntza Politikarako Sailburuordetzak, berriz, 550.000 euroko ekarpena egin du egitasmoaren abiabururako. Aurren-aurrena, bulego tekniko bat eratuko dute, horren bidez corpusaren tipologia eta garatu beharreko ereduak zehazteko. Ondoren, corpus linguistikoen bilduma bultzatuko dute, eta biltegiratze segururako azpiegiturak eratuko dituzte. Azkenik, transferitu eta ustiatu egingo dira corpusak. Egitasmoan hamabost bat lagunek lan egingo dute, eta lehen taldean 6-7 langile ariko dira.
Egin nahi duten urratsaren tamaina nabarmentze aldera, hainbat datu eman dituzte. Egun, esaterako, mila ordu pasatxoko corpusa dago ahozko mezuetan; 2030erako 40.000 izatea nahi dute. Halako urratsak egiteak aukera berri asko irekiko dituela aurreratu dute. Pradalesek ere agerian utzi nahi izan du egitasmoaren garrantzia, euskarak eremu digitalean behar duen tokia izatea erronka aski zaila delako, baina berebiziko garrantzia duelako, eta «herri bat bezala» erantzun behar zaiolako horri: «Elkarlanean».