ikerkuntza proiektuak
DeepMinor: Language Models for Multilingual and Multidomain Text Processing in Low Resource Scenarios1>
Language Models for Multilingual and Multidomain Text Processing in Low Resource Scenarios
(2024 - 2026)
Hizkuntza eredu handien aurrerapenei esker, Hizkuntzaren Prozesamendua (HP) ikerketa-eremua hizkuntza eredu handi horien ekoizpen eta ustiapenera bideratutako paradigma aldaketa batean murgilduta dago. Izan ere, emaitzak hainbeste hobetzen ari dira, non sistemek giza-mailako errendimendua aldarrikatzen dute ikerketa-erreferenteetan. Ondorioz, industrian asko hasi dira ekoizpenean integratzen.
Emaitza ikusgarriak izan arren, hizkuntza eredu hauek ingeleserako garatu dira batez ere, ez dira publikoak eta
ia soilik ingelesezko datuetan ebaluatuta izan dira. Erreferentzia hauek ezinbestekoak dira
ulertzeko hizkuntza eredu handi hauek HPren artearen egoera hobetzeko dituen mugak eta aukerak. Horregatik,
hizkuntza eta domeinu gehienetan, ereduen errendimendua ezezaguna izaten jarraitzen du. Hau gertatzen da bi arrazoiengatik: hizkuntza eredu handiak bakarrik ingeleserako entrenatuta izan direlako edota ingeleserako ez diren hizkuntzatarako ebaluazio benchmark-ak faltagatik.
Proiektu honek hizkuntza eredu elebakarrak eta eleaniztunak sortzeko eta egokitzeko teknikak ikertzea eta garatzea du helburu
hizkuntzak, testu-generoak eta domeinu desberdinetan. Zehazki, proiektu honetan ereduen egokitzapena eta sorkuntzara bideratuko da bereziki
euskarara eta gaztelaniara (ingelesez gain) egokituta, bai sailkapen egiteko, bai sorkuntza lanetarako.
Erakundea: Ministerio de Ciencia, Innovación y Universidades
Ikerlari nagusia: Rodrigo Agerri
Partaideak: