ANDER CORRAL

«Euskararen garapen teknologikoa ezin dugu erraldoien esku utzi»

Ttipi-Ttapa 2020ko api. 16a, 11:00

Ander Corral beratarrak adimen artifizialaren munduan egiten du lan.

Ikasketaz eta ofizioz informatikaria da Ander Corral Naves Berako gaztea. Ikasketak bukatu zituenetik Elhuyar Fundazioan egiten du lan, eta Itzultzailea eta Aditu tresnak garatu dituen lantaldean aritzen da.

Klik bakarrean audioak eta bideoak automatikoki transkribatzeko eta azpidazteko Aditu tresna elebiduna eta klik bakarrean euskaratik eta euskarara bertze bortz hizkuntzetatik itzulpenak automatikoki egiten dituen Itzultzailea. Horiek dira Elhuyar Fundazioak egin dituen azken bi apustuak, bata zein bertzea puntako tresnak. Urrats handia, inondik inora ere, erraldoi teknologikoen munduan hain toki ttikia duen euskararentzat. Bi tresna horiek eskualdeko jendea ere badute gibeletik, tartean, Ander Corral Naves (Bera, 1995). Berak azaldu dizkigu bi tresna horien barrenak.

Azaroan Itzultzailea paratu zenuten erabilgarri. Nolako erantzuna izaten ari da? 
Geroztik erabiltzaile kopurua gora egiten ari da. Bagenekien jendeak euskaraz Google Translate baino modu fidagarriagoan dabilen itzultzaile baten beharra zeukala, baina ez genuen espero hain epe motzean horrelako harrera onik edukiko zuenik. Erraterako, lehen bi hilabeteetan, 15 milioi hitz itzuli ziren. Itzultzaileak mugarri bat suposatu du guretzat kalitatearen aldetik, jauzi kualitatiboa izugarria izan baita euskaratik eta euskarara egindako itzulpenetan.

«Kalitatearen aldetik, Itzultzailea mugarri bat izan da guretzat».

Nolakoa da tresna? 
Itzultzailea webgunetik zein mugikorretik (Android eta iPhonerako aplikaziotik) erabil daiteke. Mugikorrerako aplikazioaren bitartez Itzultzailea eskura edukitzeaz aparte, azkar eta eroso erabili daiteke edozein testu itzultzeko. Zerbitzu aurreratuak eskaintzen ditu: dokumentuen itzulpenak (Wordekoak, adibidez), neurri-neurriko soluzioak… Gainera, gure datuekin enpresek egiten duten erabilerari buruzko zalantzak sortzen diren honetan, konfidentzialtasuna bermatzen dugu. 

Oraingoz sei hizkuntzekin aritzeko prestatu duzue. Gehiago lantzeko asmorik baduzue? 
Momentuz, Itzultzaileak sei hizkuntza dakizki: euskara, gaztelania, ingelesa, frantsesa, katalana eta galegoa. Atera genuenean ez zeukan ingelesera eta ingelesetik itzultzeko aukerarik, baina ingelesa edukitzea garrantzitsua zela uste genuen. Handik hilabetera gehitu genion aukera, ikerketaren emaitzak onak izan zirenean. Beraz, ez gaude hizkuntza gehiago gehitzeko aukerari itxita eta baditugu bertze hizkuntza batzuekin proiektu batzuk. Eskaintzen ditugun hizkuntzen itzulpenak hobetzen ere segitzen dugu. Bizirik dagoen tresna da Itzultzailea.
 
Urte batzuk baditu Elhuyarrek itzulpengintza automatikoan lanean. Bide horretan, nolako pausoa izan da Itzultzailea
Mugarri bat izan da. Elhuyarrek urte aunitz daramatza itzulpen automatikoaren arloan, baina hasieran lortzen ziren emaitzak ez ziren bertze hizkuntzekin bezain onak. Batzuetan itzulpen horiek ulertzeko zailtasunak zeuden. Azken urteetan, adimen artifiziala modan jarri da eta geroztik, hizkuntza guztietan sekulako hobekuntzak izan dira. Honen eskutik atera genuen 2018an Modela itzultzaile automatikoa. Salto kualitatibo handia ekarri zuen euskarazko itzulpenetan, eta handik urtebetera Itzultzailea plataforma atera genuen, oraindik finagoa itzulpenetan.

Zerk bereizten du Itzultzailea bertzeetatik? 
Euskara onartzen duten itzultzaileetatik dokumentuen itzulpena eta aukera aurreratuak, hala nola, bezeroaren zerbitzarietan txertatzea, itzulpen programetan txertatzea, pluginak... Bertzetik, konfidentzialtasuna bermatzen da eta gure ikerketa lerroko emaitzen hobekuntzak berehala eguneratu eta erabiltzeko aukera.

Urte hasieran Aditu hizketa ezagutzailea aurkeztu zenuten. Zein ezaugarri ditu? 
Audio eta bideoak automatikoki transkribatzeko eta azpititulatzeko lehen euskal plataforma da. Adimen artifizialean eta sare neuronaletan oinarritzen da. Momentuz, elebiduna da; gaztelaniazko nahiz euskarazko transkripzioak eta azpitituluak sortzen ditu. Aditu.eus webgunean erabilgarri dago eta doako proba bat egin daiteke. Itzultzailearekin bezala, datuen pribatutasuna bermatzen dugu, eta malgua da bezeroaren beharretara egokitzeko.

«Aditu audioak eta bideoak automatikoki transkribatzeko eta azpititulatzeko lehen euskal prataforma da».

Aitzinetik grabatutako fitxategiekin eta zuzenekoekin balio du... 
Aitzinetik grabatutako fitxategiak ordenagailutik zein onlineko esteketatik (EITB, RTVE, Youtube, Facebook, Instagram…) igo daitezke plataformara. Horrez gain, aldibereko transkripzioak egiten ditu. Mikrofonotik solas egitean zuzenean testu idatzia eskuratzeko aukera eskaintzen du. 

Zorteko gara kazetariak, elkarrizketak transkribatzen lanik ez...  
Transkripzio prozesuko denborak murrizteko laguntza handia da, izan ere, eskuzko zuzentze prozesu bat bertzerik ez du behar prozesua amaitzerakoan. Horretarako azpitituluen ediziorako interfaze bat eskaintzen du. Bertan segmentuak banaka zuzen daitezke eta aldaketak gorde. Behin zuzenketak aplikatuta, bideo zein audiorako azpitituluak edo errandakoaren transkripzio testu fitxategia jaitsi daiteke. 

Edozein baldintzatan egiten ditu transkripzioak? 
Hainbat faktoreren araberakoa da asmatze tasa: audio grabazioaren kalitatea;, oihartzuna, zarata edo musika dagoen gibeletik, hizketa-mota, erregistroa, hizkuntza estandarrean (euskara batua, adibidez) edo aldaera batean den, bolumena, abiadura… Hala ere, baldintza normaletan hagitz kalitate altua lortzen da.

Euskararentzat toki berezia egiten ari zarete teknologien arloan…  
Normalean, erraldoi teknologikoen estrategia eta merkatu-interesetatik kanpo daude euskara bezalako hizkuntzak, eta garrantzitsua da Aditu bezalako baliabideak garatzea euskarak presentzia digital ona izateko. Ezin dugu erraldoi horiek eginen dutenaren edo ez dutenaren menpe utzi euskararen garapen teknologikoa. 

«Sare neuronalen gibelean funtzio matematikoak betzerik ez daude».

Zer dago adimen artifizialaren eta sare neuronalen gibelean? 
Funtzio matematikoak bertzerik ez daude. Sistemak guk pasatako datuetatik erregelak eta dependentziak ikasten ditu eta haiekin sarrerako datuak bihurtu egiten dituzte dagokien atazaren arabera. Adibidez, itzultzailearen kasuan, sistemari milioika itzulitako esaldi bikote pasatzen zaizkio entrenamenduan. Horrela, euskarazko esaldi bat emandakoan, berak gaztelaniara itzultzen du. Magia dirudien arren, ikaragarria da sare neuronalek problema konplexuen aitzinean ikasteko duten ahalmena. Azken urteetan, sekulako ekarpenak egin dituzte. Eguneroko tresna aunitzek adimen artifizialean eta zehazki sare neuronaletan dute oinarria.

Aitzinera begira zein helburu dituzue? 
Bai Itzultzailean baita Aditun ere, oraindik ikerketan gabiltza. Gure helburua bi tresnak eguneratuta mantentzea eta geroz eta kalitate eta zerbitzu hobea eskaintzea da. Horretarako ezinbertzekoa da  aurrerapenak gure tresnetan aplikatzea. Gainera, bi tresna hauek aukera ederra eman digute bien arteko elkarrekintzan ikertzeko eta zergatik ez etorkizun hurbilean audio baten transkripzioa itzultzeko aukera eskaini? Laguntza ederra izan daiteke eduki elebiduna sortu behar duten horientzat. 

«Elhuyarren hagitz erraza da etxean bezala sentitzea»



Informatika ikasteko erabakia «azken momentuan» hartu zuen Corralek. Baina ez da damutu, «graduko lehenbiziko urtean» konturatu baitzen «erabaki ona» izan zela eta «erabat gustukoa» zuela. Donostiako EHUn Informatika Ingeniaritzako Gradua egin ondotik, Konputazio Ingeniaritza eta Sistema Adimenduak masterra egin zituen. 2018an ikasketak bukatu «eta gutxira» egin zuen lan mundura salto. «Elhuyarren Hizkuntza eta Teknologia Unitatean lanean hasi nintzen. Izenak dioen bezala hizkuntza eta teknologiaren arloan ibiltzen naiz, batez ere adimen artifizialaren munduan».
Kontatu digunez, «gehienbat ikerketa proiektuetan» ari da: «itzulpen automatikoa, hizketa ezagutza, ahotsaren sintesia... Horien emaitza dira Itzultzailea eta Aditu». Kontent dago Elhuyarren  eta «hagitz balorazio positiboa» egin du orain artekoaz. «Lehenbiziko lan esperientzia izan da eta unibertsitatean ikasitakoa errealitatera eramateko lehenbiziko aukera». Proiektu «interesgarrietan» ari dela dio, «gehienak adimen artifizialarekin lotuta, eta hori zen nire helburuetako bat». Pertsonalki, berriz, «garatzeko aukera» eman omen dio: «lan eta talde giro ederra dago eta hagitz erraza da etxean bezala sentitzea».

Publizitatea eta erakundeen dirulaguntzak ez dira nahikoa TTIPI-TTAPAren eta ERRAN.EUSen etorkizuna bermatzeko, eta zu bezalako irakurleen babesa behar dugu aitzinera egiteko.


Egin TTIPI-TTAPAren lagun