Twitterren piztu da eztabaida, Gaizka Aranguren kazetariak bota duen txio baten ondotik: Jaurlaritzak sortutako itzultzaile neuronalean Juan Antonio Urbeltz kulturgilearen euskarazko biografia labur bat sartu, eta, gaztelerara itzultzean, «folclorista español» itzultzen du aplikazioak. Beste txiolari batzuen adibideak etorri dira jarraian: ezagunak diren hainbat euskaldunen biografiak sartuz gero, guztietan espainiarra dela baieztatzen du gaztelerazko bertsioak.
ltzultzaile neuronala, ala espainiartasunaren zaindari? Saia zaitezkete zuen izen abizenekin... Ea... #Kaguenlapitxorrikapic.twitter.com/F8iR7fRRs3
— Gaizka Aranguren Urrotz (@gaizkaranguren) May 11, 2021
Txiolari batzuek azaldu dutenez, itzultzaile neuronalaren algoritmoa Wikipediarekin entrenatu izana izan liteke akats horren arrazoia. Gaztelerazko Wikipedian, oso ohikoa da español jartzea euskal herritarren kasuan. Wikipedian gaztelerazko sarrerarik ez daukaten pertsonen kasuan ere, gaztelerara espainiarra dela esanez itzultzen du webguneak. Esaterako, Martin Ugalde kazetariak ez dauka berari buruzko sarrerarik gaztelerazko Wikipedian, informazioa euskaraz baino ez dago. Hala ere, honela itzultzen du Itzuli itzultzaile neuronalak: «Martín Ugalde Orradre (Andoain, Guipúzcoa, 11 de noviembre de 1921 - Hondarribia, Guipúzcoa, 4 de octubre de 2004) fue un periodista, escritor y político español». «Martin Ugalde euskal kazetaria zen» esaldia eskuz idatziz gero, ordea, euskaldun ageri da Martin Ugalde, eta besterik gabe kazetari gisa deskribatzen badugu, hitzaren gaztelerazko bertsioa ematen du aplikazioak, nazionalitatea zehaztu gabe.
Iñaki Alegria txiolariak azaldu duenez, sistemak gazteleraz idazten eta itzultzen ikasi duelako gertatzen da hori. Hau da, gaztelerazko Wikipediako biografietan, español edo española jartzen da lanbidearen ondoren, eta itzultzaile neuronalak ere hori egiten du. Jatorrizko testuan jaiotze data eta tokia jartzen ez bada, ordea, itzultzaile neuronalak ez du nazionalitatea zehazten, ez baitu biografia gisa detektatzen.
ð;Â;Â;Ÿ¤·â;Â;Â;™Â€ï¸;Â;Â;ÂÂÂÂð;Â;Â;Ÿ¤·â;Â;Â;™Â€ï¸;Â;Â;ÂÂÂÂð;Â;Â;Ÿ¤·â;Â;Â;™Â€ï¸;Â;Â;ÂÂÂÂð;Â;Â;Ÿ¤¢ð;Â;Â;Ÿ¤¢ pic.twitter.com/FPLdjhMAaJ
— Amaia Izko Aramendia (@AmaiaIzko) May 11, 2021
Gaztelerazko Wikipedian gertatzen dena ez da gertatzen beste herrialde batzuetako pertsona ezagunekin, ezta beste hizkuntza batzuetan ere. Gerry Adams, adibidez, gaztelerazkoan irlandarra dela esaten du, eta ingelesezko Wikipediak ere hala du jasota.
Katalanei dagokienez, zenbait pertsona ezagunen izenak sartzean, espainiarrak direla dio itzultzaile neuronalak. Lluis Llach abeslariaz, esaterako, honela dio euskarazko Wikipediak: «Lluís Llach i Grande (Girona, Katalunia, 1948ko maiatzaren 7a) katalan egile abeslaria da». Esaldian katalana dela jarri arren, español dela dio itzultzaile neuronalaren gaztelerazko bertsioak.