Makinek euskaraz egingo dute

Teknologia gailuek erabiltzaileen ahotsezko mezuei jaramon egiteko, hizkuntzak irakatsi behar zaizkie. Auzolan digitala deitu du Librezale taldeak, eta asteartean lehen jardunaldia egingo dute, Donostian.

Iturralde, erdian, Common Voice auzolan digitalaren aurkezpenean. TABAKALERA.
Andoni Imaz
2019ko apirilaren 6a
00:00
Entzun
Teknologia gailuei aginduak emateko moduak asko aldatu dira denbora gutxian. Teklatua eta sagua erabiltzen dira gailu batzuetan, urrutiko agintea edo ukipen pantailak beste batzuetan. Halere, gero eta gehiago dira hitzezko aginduei erantzuten dieten eta hitz egite hutsarekin esandakoa betetzen duten tresnak. «Autoan gindoazela, lankide batek esan zion ibilgailuari: 'Llamar a', eta deitu nahi zionaren izena. Batetik, gaztelaniaz egin behar izan zion, eta, bestetik, pertsona horren abizenak tz-k zituenez, autoak ez zuen ondo ulertu zeini deitu behar zion». Asier Iturralde garatzailea da Iametza komunikazio enpresan, eta Librezale taldeko kidea ere bada. Teknologia euskalduntzeko lanean aritzen da, eta proiektu berri bat jarri dute martxan: Common Voice. Helburua da gailuek euskarazko ahotsak ezagutu eta erabiltzaileen aginduei jaramon egitea. Hasteko, grabazio maratoia antolatu dute asteartean, Donostiako Tabakalera zentroko Hirikilabs kultura digitala eta teknologia laborategian.

«Gaur egun dauden ahotsa ezagutzeko tresnek ez dituzte kontuan hartzen euskara eta halako beste hizkuntzak, ez direlako errentagarriak», Iturralderen hitzetan. Enpresa handiek sortzen dituzte horrelako tresnak, eta haiek erabakitzen dute zein hizkuntzatan emango den zerbitzua. Teknologia hizkuntza bat ezagutzeko prestatzeak lana eskatzen du, eta hizkuntza handiak besterik ez dute gogoan izaten halako proiektuak garatzean. «Ahotsa ezagutzeko tresna bat hizkuntza batean erabili ahal izateko, entrenamendu fasea dago. Testuak eta irakurketa ahotsa behar dira, tresnak ikas dezan ahotsetik testua ateratzen». Ahotsarekin agindua eman, tresnak hori testu bilakatu, eta testuak dioena exekutatu.

Lan handia eskatzen du horrelako tresnei hizkuntza bat erakusteak, eta, horretarako, auzolan digitala proposatu du Librezalek. Haien arabera, enpresa handiek ez dute errentagarria ez den lanik hartuko beren gain, eta komunitateak osatu beharko du egiteko dagoena. Proiektu zabalago baten parte da, ordea, euskarazko auzolana. Ahots-ezagutza enpresa handien esku uzteari uko eginda, Mozilla fundazioak, besteak beste Firefox nabigatzailea garatzen duenak, Common Voice proiektua sortu du mundu osoan.

Common Voiceren helburua da ahots ezagutza ahalik eta hizkuntza gehienetara eramatea. Teorian, edozein hizkuntzak lor dezake hori, baina komunitatebakoitzak hartu behar du bere zatia osatzeko ardura. 5.000 esaldi prestatu behar dira, bost eta zortzi hitz artekoak, eta jendea grabatu esaldi horiek irakurtzen, 10.000 ordura iritsi arte. Hori eginez gero, lor daiteke ahots ezagutzak hizkuntza batekin funtzionatzea.

Librezalek bat egin du Mozillaren proiektuarekin, eta euskarazko hitz eta ahotsekin kopuru horietara iristea du helburu. Prest daude esaldi guztiak, eta horiek irakurriko dituen jendea falta dute orain. Horretarako, webgune bat jarri dute martxan: https://voice.mozilla.org/eu. Han, proiektuari ekarpena egiteko bi modu daude: batetik, pantailan agertzen den esaldia ahots goran irakurtzea, erregistratuta gera dadin; bestetik, dagoeneko grabatu diren esaldiak entzutea, kalitate txarrekoak direnak edo testuan jartzen duena irakurtzen ez dutenak iragazteko, «kalitatea ziurtatzeko».

Ahots aniztasuna

«Egungo sistemek duten beste arazoetako bat da aniztasun gutxi dutela», Iturralderen ustean. Hau da, zerbitzua hizkuntza gutxi batzuetan emateaz gain, hizkuntza horietako sektore batzuetako ahotsak besterik ez dituela ezagutzen. «Ingelesez, klase ertaineko gizon zurien ahotsak erabili izan dira historikoki. AEBetako hegoaldeko kutsua duen emakume afro-amerikarra bazara, arazo gehiago izango dituzu komunikatzeko, makina ez baitago entrenatuta zurea bezalako ahotsak ulertzeko». Common Voiceren helburua da mundu osoan zein Euskal Herrian era askotako ahotsak lortzea: emakumezkoenak, gizonezkoenak, adin guztietakoenak, hizkuntza ikasi berri dutenenak... «Teknologia erabiliko dutenen isla izatea komeni da, ahalik eta jende gehienak izan dezan teknologia horiekin komunikatzeko aukera».

Bi aldagai nagusik elkartzen dituzte proiektua eta Librezaleren ohiko jarduna: software libreak eta euskarak. Hizkuntzarekiko kezkaz gain, badute, beraz, teknologiaren beraren inguruko ardura. Egun, gailu gehienak Amazon, Apple, Google, Microsoft eta antzeko enpresa handienak dira; «erabiltzen duten softwarea ez da librea, eta grabatzen dituzten ahotsak zerbitzarira bidaltzen dituzte». Pribatutasun politikak arduratzen du Iturralde: «Ez daukagu kontrolik gure ahotsarekin egiten dutenaren inguruan». Horregatik, Common Voicek bestela egingo ditu gauzak: «Entrenatuta dagoenean, ahotsa ez da inora bidaliko; gailuan bertan egingo du prozesamendua».

Abian da auzolana. Edozeinek parte har dezake, sakelako telefonotik zein ordenagailutik, esaldiak grabatzen zein grabatutakoak iragazten. Halere, asteartean ekingo diete taldeko maratoiei, Donostian, eta horrelako maratoiak antolatzeko dei egiten diete euskara elkarteei eta gainerako erakundeei.
Iruzkinak
Ez dago iruzkinik

Ordenatu
0/500
Interesgarria izango zaizu
Nabarmenduak
Orain, aldi berria dator. Zure aldia. 2025erako 3.000 babesle berri behar ditugu iragana eta geroa orainaldian kontatzeko.