benat erezuma
'Funtzio sigmoidea'

Prokrustesen algoritmoa

2024ko azaroaren 23a
05:00
Entzun

Poseidon zen greziar mitologian itsaso eta ozeanoetako jainkoa; bazuen mendian bizi zen Prokrustes izeneko seme bat. Prokrustesek ostatu hartzera gonbidatzen zituen etxe ondotik pasatzen ziren bidaiariak. Horiek lo zeudela, Prokrustesek burdinazko ohearen lau ertzetara lotzen zituen. Bidaiaria ohea baino handiagoa zenean, moztu egiten zizkion oinak, eskuak eta burua. Eta ohea baino txikiagoa zenean, hezurrak apurtzen zizkion, haren gorputza ohearen neurrira egokitu arte.

Behin, Teseok Prokrustesi galdetu zion ea Prokrustes bera ohe hartan sartzeko gai zen. Ostalaria bertan etzan eta Teseok ohera lotu zuen. Irudikatuko duzu zer egin zuen Teseok Prokrustesen gorputz atalekin. Ba bai, mendeku hartu, eta hankak eta burua moztu zizkion.

Mitoa hainbat egoera deskribatzeko erabili izan da. Adibidez, edozein sistematan estandarizazioak dakartzan diskriminazio egoerak azaltzeko. Adimen artifizialaren kasuan ere antzeko zerbait gertatzen da. Demagun musikarako streaming plataforma bat diseinatu nahi duela enpresa batek. Maximizatu nahi duen aldagaia izan daiteke entzuleek plataforman igarotzen duten denbora.

Plataformak gomendio sistema bat izango du, zuk ezer esan gabe, entzungo duzun hurrengo abestia gomendatzeko. Eredu horiek entrenatzen dira datu multzo handiekin, hau da, milioika abesti eta bestelako daturekin. Eta entrenatzearen pauso bat datuen estandarizazioa izaten da. Horrela, algoritmoek batez besteko gustu estandarrak ulertu eta gomendio sistemak horren arabera optimizatzen dituzte.

Jakin badakigu izaten direla abesti batzuk abesti multzo handiarekin alderatuta oso desberdinak direnak. Zer esan nahi du desberdina izateak? Abestiaren entzunaldi kopurua, iraupena, BPM, hizkuntza eta antzeko ezaugarriak urrun egotea datu multzo handitik.

Desberdinak diren datuek —gure adibidean, abestiek— outlier izena hartzen dute. Sarri, adimen artifizialeko eredua sortzeko ezabatu egiten dira outlier-ak, joera nagusitik kanpo daudelako. Hala ere, horiek ezabatzeak informazio baliotsua galtzea ekar dezake, datuen aniztasuna galduz eta gomendio sistema erdipurdikoa sortuz.

Adimen artifizialaz ari ginen, ezta?

Iruzkinak
Ez dago iruzkinik

Ordenatu
0/500
Interesgarria izango zaizu
Nabarmenduak
Orain, aldi berria dator. Zure aldia. 2025erako 3.000 babesle berri behar ditugu iragana eta geroa orainaldian kontatzeko.