Hizketa Euskaraz Ezagutzeko Sistema eskuragarri

09-05-24

Aholab Taldeak eta HiTZ zentroak euskaraz ahotsa ezagutzeko sistema berria aurkeztu dute. Aurrerapen teknologiko horrek pertsonen eta teknologiaren arteko elkarrekintza eraldatzeko ahalmena du, bereziki euskal hizkuntzaren eremuan.

Sistema hori euskarazko 548 orduz entrenatu da, hainbat iturri publikotatik datorrena (Mozilla Common Voice 16.1, Basque Parliament, OpenSLR). Horri esker, erabiltzaileek hitz egiten dituzten hitzak eta esaldiak zehaztasunez ezagutzen ditu, eta WER kalitate-maila %5etik beherakoa da.

Aurrez aurretik entrenatutako bi eredu sortu dira, NVIDIA ereduetan oinarrituak. Horietako bat teknika klasikoagoak erabiliz sortutako hizkuntza-eredu bat da, eta bestea, berriz, transducer‑etan oinarritutako teknologia berriagoak erabiliz sortu da. Ereduen entrenamendua DIPCko zerbitzarien Hyperion sisteman egin da.

Garatutako sistema, potentzialki, laguntzaile birtualetan sar daiteke, mezuak bidaltzeko, informazioa bilatzeko edo agenda-notak ezartzeko. Telefono-deien erantzunak automatizatzeko aukera ere eman lezake, eraginkortasuna eta bezeroarentzako arreta hobetuz. Eta, zalantzarik gabe, euskarazko audio-grabazioen transkripzioa erraztuko du.

Esteka honetan dago eskuragai hizketa euskaraz ezagutzeko sistemaren demoa Sortutako ereduak ere Gaitu-Data webgunean daude eskeragai. Ikerketa taldeak hori erabiltzeko eta teknologia hobetzen jarraitzeko iruzkinak egiteko gonbita egiten dio komunitateari. Euskal komunitatearentzat tresna baliotsua izatea eta gure hizkuntza indartzen laguntzea espero dugu.