Itzulpen automatikoak, hizkuntza ezagutzeko sistemak, ahots sintesirako tresnak... Ingurune digitalera ongi egokitzen ez diren hizkuntzei «iraupen zaila» iragartzen die Josu Aztiria Elhuyarreko kideak (Zumarraga, Gipuzkoa, 1978). Ikuspegi horrekin, Linguatec proiektua koordinatzeaz arduratu da azken hiru urteetan: Pirinioetako hizkuntza gutxituak sustatzeko adimen artifizialeko tresnak garatu dituzte, hain zuzen. Proiektuaren ibilbidea atzo amaitu zen arren, lanketan parte hartu duten erakundeek manifestu bat sinatu dute, mugaz gaindiko sare baten bidez orain arteko lanari jarraipena emateko.
Euskararen egoera teknologikoa ahula da?
Hizkuntza hegemonikoekin alderatuta, bai: egoera oso ahulean gaude, baina euskarak baino babes juridiko handiagoa duten hizkuntza gutxituago batzuekin alderatuz gero, esango nuke ez gaudela gaizki; are gehiago, nahiko ondo gaudela ere esango nuke. Sekulako potentzialitatea baitago: hamarkadak daramatzagu ikertzen, eta ikerketa zentro garrantzitsuak eta oso onak ditugu hemen. Eta orain, adimen artifizialaren olatua etorri den honetan, prest gaude. Jendea prestatuta zegoen, egiturak bagenituen, eta olatu hori ondo aprobetxatzen jakin dugu. Edo horretan ari gara, behintzat.
Zer-nolako onurak dakarzkio adimen artifizialak hizkuntza gutxituari? Pentsa daiteke itzultzaile batek kontrako eragina ere izan dezakeela.
Alde batetik, zure hizkuntzaren ekoizpena izugarri handitu dezake, eta, orduan, hizkuntzak ingurune digitalean duen presentzia ere bai, kostuak murrizten direlako. Itzulpen automatikoarekin gai baldin bazara euskarazko Wikipedian zure artikuluak hirukoiztu edo laukoizteko, edo, azpitituluen bidez, pelikula eta dokumental asko zure hizkuntzan edukitzeko, hori izugarria da.
Euskara zure laneko hizkuntza izan dadin ere lagundu dezake. Euskara ulertzen ez duen batek itzulpen automatikoa erabiltzen badu nire testuak edo nik esaten dudana ulertzeko, nik euskaraz hitz egin dezaket ,eta nire erabilera handitu egin daiteke.
Linguatecen barruan, hainbat tresna sortu dituzue jada: Elia itzultzaile neuronala, Aditu hizketa ezagutzailea eta ahots sintetizadore neuronala, besteak beste.
Hala da. Aditu, adibidez, elkarrizketa hau transkribatzeko erabil dezakezu: inguru formaletan, erakunde publikoentzat eta hedabideentzat oso baliagarria da. Dena den, hobetzeko tartea ere badauka, noski. Hizkera espontaneoarekin, euskalkiekin eta ingurune zaratatsuekin mugak ditu, eta hori ikertzen ari gara orain.
Ahots sintetizadoreak, berriz, alderantzizko lana egiten du, testuak ahots bihurtuz. Horrek irisgarritasuna areagotzen du, ikusmen arazoak dauzkatenekin, adibidez. Tresna horrekin, BERRIAk podcastak egin ditzake albisteekin, esaterako.
Tresna horiek sare neuronalak erabiltzen dituzte. Nola funtzionatzen dute?
Sare neuronalek adibideetatik ikasten dute. Zuk hizkuntza erabileraren adibide pila bat ematen dizkiozu, eta sarea saiatzen da algoritmoen bidez hori beste egoera batean simulatzen. Lehen, makinari hizkuntza erakutsi behar zenion: arau gramatikalak, hiztegiak... Baina emaitza ez zen hain ona. Orain, adibideak ematen dizkiogu, eta, kalitatezko gero eta datu gehiago izanda, gehiago ikasten du.
Zer-nolako jendea dago halako tresna baten sorreraren atzean?
Batez ere, hizkuntzalariak gara, eta informatikan edo telekomunikazioan ingeniariak. Batzuek besteen ezagutzatik edaten dugu.
Linguatec proiektuari jarraipena emango dion sare bat osatu duzue. Zein da haren eginkizuna?
Proiektu honetan, gure arteko lankidetza asko estutu da, eta hori egituratu nahi dugu etorkizunerako, oso baliagarria izan delako. Euskararentzat garatuta geneuzkan teknikak oso baliagarriak izan dira okzitanierarentzat eta aragoierarentzat. Laguntza hori gabe, hiru urteotan egin dutena egiteko hamabost beharko lituzkete. Horretan datza gure elkarlanaren baliorik handiena.
Josu Aztiria. Elhuyarreko kidea
«Prest gaude adimen artifizialaren olaturako»
Linguatec proiektuak euskararen, aragoieraren eta okzitanieraren biziberritzea sustatzeko hainbat tresna garatu ditu, adimen artifiziala eta mugaz gaindiko lankidetza oinarri hartuta.
Iruzkinak
Ez dago iruzkinik
Ordenatu