XX. mendearen zati handi batean, ikuspegi sinbolikoa izan zen nagusi adimen artifizialeko (AA) sistemen garapenean. Gizakiek eskuz definitutako sinbolo eta arau logiko batzuen bidez ezartzen zen sistemaren adimena. Ikuspegi hori erabilgarria zen zenbait ataza ebazteko, baina ez zen eraginkorra zeregin konplexuak automatizatzeko, ezin konta ahala arau definitu behar zirelako. Horren alternatiba, ikasketa automatikoa, indar biziz iritsi zen 90eko hamarkadan. Ikuspegi berri horretan, atazak ebatzita zeuzkaten adibideak baliatuz ikasten zen ataza horiek egiten. Hala, albo batera utzi zen top-down (goitik behera) motako diseinuaren ideia, eta, horren ordez, beste zerbaiten aldeko apustua egin zen: automatizatu nahi zen atazaren xehetasunak ikastea, ataza gobernatzen duten patroiak eta ebatzitako adibideak aztertuz. Horrenbestez, ebatzitako adibideak aztertuz, ikasketa-algoritmoek formula matematiko bat sortzen zuten, ataza modelatzen zuen errezeta bat, beste adibide batzuk ebazteko erabil zitekeena.
AAren ataza gehienetan, ikasketa automatikoak askoz ere emaitza hobeagoak ematen zituen paradigma sinbolikoak baino. Denborarekin, ikuspegia eboluzionatuz joan zen, eta errezeta ordezkatzen zuen funtzioa sofistikatuz joan zen, gaur hain ospetsu diren sare neuronal sakonetara iritsi arte. Halako sareak baliatuz, lehen baino parametro askoz ere gehiagoko funtzio matematikoekin lan egin zitekeen, eta horrek aukera eman zuen patroi are konplexuagoak lortzeko. Horri guzti horri esker, inoizko doitasun-mailarik altuenarekin automatizatu ahal izan ziren atazak. Emaitza harrigarriak lortu ziren, eta sare sakon horiek dira, hain zuzen, gaur egungo AA sistema gehienen oinarria.
Ikasketa automatikoaren aro honetan, AAren sistema on bat garatzeko gakoa ez da milaka arau dituen diseinu on bat egitea, baizik eta ataza ebatzita daukaten milioika adibide izatea, haietatik ikasteko. Entrenamenduan zenbat eta adibide gehiago eta hobeak erabili, orduan eta zehatzagoak izango dira sistemaren emaitzak, eta, era berean, are erabilgarriagoa izango da sistema erabiltzailearentzat. Beraz, kalitateko adibideen bilduma handiak izatea botere-eraztun bihurtzen da nolabait, eta eraztuna duena besteen gainetik jartzen da AAren urrezko aro berri horretan. Betiere, beste eraztun batzuei garrantzirik kendu gabe, adibidez, kalkuluen edo konputazio-ahalmenaren maneiuari, zeina agerian geratu baita nabarmen Deep Seek-en kasu berrian.
Adibideen eraztuna izatearen boterea ez zaio oharkabean pasatu sistema ekonomikoari. AAren sistemak entrenatzeko behar diren datu edo adibideen inguruan, merkatu emergente bat sortzen ari da, zeinak dagoeneko 2.770 milioi dolarreko balioa baitu eta, hurrengo bost urteetan urtero %24,3 hazteko aurreikuspena. Puri-purian dagoen merkatu bat da, enpresa handi asko dituena esklusiboki adibideak sortzera bideratuak, hala nola Invisible Tech eta Scale AI. Halako konpainiek ehunka kolaboratzaile eta langile dituzte, askotariko profiletakoak eta espezialitate-arlo desberdinetakoak.
Nolanahi ere, adibideen merkatuan diharduten aktore batzuk ez daude bertan beren borondatez. Webean mota askotako milaka milioi eduki daude, artistek, idazleek, kazetariek edo erabiltzaile anonimoek sortuak. Datu horiek oso adibide-altxor erakargarria dira AAren sistemak entrenatzeko. Eduki horietako askok jabeak dituzte eta jabetza intelektualeko eskubideek babesten dituzte, baina baimenik gabe erabili izan dira, AAren sistemak, batez ere AA sortzaileko sistemak, entrenatzeko. Espero izatekoa zen bezala, egoera hori salatu dute zenbait sortzaile-kolektibok eta eduki-enpresak. Inoiz legezko demandak ere aurkeztu dira; adibidez, New York Times-ek OpenAIren kontra 2023an, haien berriak erabili zituztelako ChatGPT entrenatzeko.
Herrialde batzuetan —AEB, Israel eta Japonia, kasurako—, legeria hasi da ia murrizketarik gabe baimentzen datu babestuak erabiltzea AAren sistemak entrenatzeko. Beste muturrean Europar Batasuneko herrialdeak daude, ikuspuntu murriztaileagoa baitute, eta jabetza intelektualeko lege zorrotzagoak. Nolanahi ere, lege-eztabaida ez da kontu erraza, eta jabetza intelektualari buruzko uneko araudietan jasotakoa baino harago doa nolabait, ikasketa automatikoan oinarritutako AAren ereduek orokortu egiten baitute algoritmoak entrenamendu-adibideetan ikusten dutena, baina kopia literalak egitera iritsi gabe. Hala eta guztiz ere, zentzuzkoa dirudi, ereindakoaren uzta jasotakoan, hazi guztien jabeek ordain bat jasotzea; eta, are gehiago, erein aurretik hazia erretiratzeko eskubidea izatea.
Datuen jabetza intelektualaren kudeaketa ez da, hala ere, entrenamendu-datuen arloaren erronka bakarra. Datu horiek sortzeko merkatu-irizpideak bakarrik kontuan hartzea arrisku larria da gutxiengoentzat eta gizarte-talde zaurgarrientzat. Izan ere, baliteke adibide jakin batzuk sortzeari garrantzia ez ematea, errentagarritasun gutxikotzat jotzen direlako, eta, horrekin, albo batera uztea halako kolektiboen beharrei erantzuteko nahitaezkoak diren entrenamendu-datuak. Entrenamendu-datuek alborapena badute, litekeena da sortuko diren AA sistemek ere alborapena izatea eta, ondorioz, komunitate horien eten digitala handitzea. Horrenbestez, kolektibo jakin batzuen hizkuntza osoak, kulturak, balio etikoak edo haientzat diseinatutako AAren zerbitzuak albo batera gera daitezke entrenamendu-datu egokirik ez dutelako. Arazo hori larriagotu daiteke, gainera, datuak erraldoi gutxi batzuen eskuetan kontzentratzen badira, monopolio uniformatzaile arriskutsu eta kontrolaezin batera eraman gaitzakeelako.
Azken batean, entrenamendu-adibide ugari izatea botere-eraztun tentagarri bat da, bereziki kontuan hartzen badugu adimen artifiziala XXI. mendeko ahalmen transformatzaile handieneko teknologietako bat dela eta gero eta presentzia handiagoa izango duela gure bizitzan eta, oro har, gizartean. Nolanahi ere, tentagarri bezain arduragarri izan daiteke egoera, beste aldagai batzuk ekar ditzakeelako berekin, hala nola datuen usurpazioa, datu-multzoen alborapena eta monopolioak sendotzea. Merkatuak ezin ditu, bere horretan, arazo horiek guztiak zuzendu; beraz, ezinbestekoa da gobernuek araudiak sortzea eta AAren elkartea osatzen dugun aktore guztiek konpromisoa adieraztea, entrenamendu-datuen benetako demokratizazioa lortuko bada. Konpromiso hori inoiz baino premiazkoagoa da erraldoi teknologiko batzuen azken mugimenduak eta korronte politiko jakin batzuen goraldia ikusirik.