Digital Humanities and Education
Our aim is to help researchers, teachers and educators (among other users) using digital language data (written, oral and multimodal) in Humanities, Social Sciences and other disciplines. To achieve that, we will encourage users to participate in some of our interdisciplinary research projects by developing or adapting linguistic data, maintaining or adapting NLP tools (language processing tools). In addition, we will present the most significant projects of these collaborations, in order to ...Read More
dh_tabs
Demos
Analhitza
Norbere corpusetik infromazio linguistikoa ateratzeko tresna erabilerraza
Compress-eus
Testuak laburtzen laguntzeko on-line zerbitzua. Estrakziozko (azpimarratu) eta abstrakziozko (editatu) laburpenak egiten laguntzen du.
Contracts
- BIM: Basque in the Making: a HIstorical Look at a European Language Isolate. (2017 - 2021)
- enetCollect: Hizkuntzen Ikasketa eta Crowdsourcing konbinatzeko sare europear berria (2017 - 2021)
- DeepReading: Mining, Understanding, and Reasoning with Multilingual Content. (2019 - 2021)
- LINGUATEC: mugakide diren hizkuntzen arteko lankidetza eta ezagutza-transferentzia hizkuntza-teknologian. (2018 - 2020)
Projects
Patents
News
- CLARIN-K outreach campaign 2018: http://clarin-es.org/campana-de-divulgacion-de-clarin-k/
- More information at CLARIN-K website: http://ixa2.si.ehu.es/clarink/index.php?lang=en
- Follow @CLARINERIC on Twitter
Resources
Publications
Oscar Sainz, Oier Lopez de Lacalle, Itziar Aldabe, Montse Maritxalar
Domain Adapted Distant Supervision for Pedagogically Motivated Relation Extraction (2020)
Proceeding of 12th Edition of its Language Resources and Evaluation Conference (LREC2020). Marseille, France
Andrea Horbach, Itziar Aldabe, Marie Bexte, Oier Lopez de Lacalle and Montse Maritxalar
Linguistic Appropriateness and Pedagogic Usefulness of Reading Comprehension Questions (2020)
Proceeding of 12th Edition of its Language Resources and Evaluation Conference (LREC2020). Marseille, France
Piroska Lendvai , Sándor Darányi, Christian Geng, Moniek Kuijpers, Oier Lopez de Lacalle , Jean-Christophe Mensonides, Simone Rebora and Uwe Reichel
Detection of Reading Absorption in User-Generated Book Reviews: Resources Creation and Evaluation (2020)
Proceeding of 12th Edition of its Language Resources and Evaluation Conference (LREC2020). Marseille, France
Mikel Iruskieta, Amaia Arroyo-Sagasta, Abel Camacho, Montse Maritxalar
Teknologia, testuinguru digitala eta konpetentzia digitalak hezkuntzan (2020)
Euskonews 748. ISSN: 1139-3629. URL: http://www.euskonews.eus/zbk/748/teknologia-testuinguru-digitala-eta-konpetentzia-digitalak-hezkuntzan/ar-0748001002E/
Kepa Bengoetxea, Itziar Gonzalez-Dios, Amaia Aguirregoitia
AzterTest: Open source linguistic and stylistic analysis tool (2020)
Procesamiento del Lenguaje Natural, 64, 61-68. http://journal.sepln.org/sepln/ojs/ojs/index.php/pln/article/view/6196
Itziar Gonzalez-Dios, Kepa Bengoetxea, Amaia Aguirregoitia
LagunTest: A NLP Based Application to Enhance Reading Comprehension (2020)
1st Workshop on Tools and Resources to Empower People with REAding DIfficulties (READI2020), pages 63–69. ISBN: 979-10-95546-44-3 https://www.aclweb.org/anthology/2020.readi-1.10/ https://lrec2020.lrec-conf.org/media/proceedings/Workshops/Books/READI2020book.pdf
Nora Aranberri
With or without you? Effects of using machine translation to write flash fiction in the foreign language (2020)
Proceedings of the 22nd Annual Conference of the European Association for Machine Translation, p. 165–174, Lisboa, Portugal, November 2020.
Jose Mari Arriola, Josu Goikoetxea, Mikel Iruskieta
Hizkuntza-teknologiak hizkuntzen ikas-irakaskuntzan: zenbat aukera, hainbat erronka (2020)
ehizpide 95: 1--21
Hormaetxe G., Iruskieta M.
Parekoen behaketarekin komunikazio-gaitasuna ebaluatzen: zer dute nahiago ikasleek, errubrika tradizionala ala bideo-behaketa (2020)
e-Hizpide 96
Camacho A., Iruskieta M., Latatu A., Lonbide P.
UEUren Online ikaskuntzarako eredu pedagogikoaren sorrera eta garapena: teoriatik praktikara (2020)
Uztaro
Amaia Aguirregoitia Martinez, Kepa Bengoetxea Kortazar, Itziar Gonzalez-Dios
Are CLIL texts too complicated? A computational analysis of their linguistic characteristics (2020)
Journal of Immersion and Content-Based Language Education (Available online)
Ainara Estarrona, Izaskun Etxeberria, Ricardo Etxepare, Manuel Padilla-Moyano, Ander Soraluze
Dealing with dialectal variation in the construction of the Basque historical corpus (2020)
Proceedings of the 7th Workshop on NLP for similar languages, varieties and dialects (VarDial2020 at COLING 2020).
Mikel Iruskieta, Arantza Diaz de Ilarraza
Tecnologı́as del lenguaje para la enseñanza e investigación en Humanidades Digitales (2019)
Universidad de La Habana
Mikel Iruskieta, Arantxa Otegi, Larraitz Uria, Arantza Diaz de Ilarraza, Amaia Artolazabal
Zer i(ra)kas dezakegu geure corpusekin "jolastuz"? (2019)
Traineru bete lagun: Iñaki Gaminde omenduz. UPV/EHU. 35-66 or.
Ainara Estarrona, Izaskun Etxeberria, Ander Soraluze, Manuel Padilla-Moyano
Spelling Normalisation of Basque Historical Texts (2019)
Procesamiento del Lenguaje Natural, vol. 63, pp. 59-66
Mikel Iruskieta, Montse Maritxalar, Amaia Arroyo-Sagasta, Abel Camacho (ed.)
IKTak eta konpetentzia digitalak hezkuntzan (2019)
Argitaratzaileak: UEU eta UPV/EHU. Bilbo. ISBN: 978-84-8438-693-3. 376 orr.
Mikel Iruskieta, Aitziber Iturricastillo
Idatzizko eta ahozko hizkuntza-irakakuntza online (2019)
In "IKTak eta konpetentzia digitalak hezkuntzan" Eds: Iruskieta, M. Maritxalar, M. Arroyo, A. Camacho, A. 279-294. UEU eta UPV/EHU. Bilbo.
Jennifer Isasi, Mikel Iruskieta
Humanitate Digitalak eta haien ikerketaren nondik norakoak (2019)
In "IKTak eta konpetentzia digitalak hezkuntzan" Eds: Iruskieta, M. Maritxalar, M. Arroyo, A. Camacho, A. 307-332. UEU eta UPV/EHU. Bilbo.
Unai Atutxa, Mikel Iruskieta, Olatz Ansa
Laburpena eskolan: estrakzioaren eta abstrakzioaren arteko zubia (2019)
XX Congreso Internacional de Didáctica de la Lengua y la Literatura: Hizkuntzaren eta Literaturaren didaktika testuinguru eleaniztunetan. Bilbo. SEDLL. 32--34 orr.
Iratxe Esparza, Mikel Iruskieta
Haur Hezkuntzako ipuin-bilduman emakumearen irudia eta funtzioa: hurbilpen narratologiko eta eLiterarioa (2019)
XX Congreso Internacional de Didáctica de la Lengua y la Literatura: Hizkuntzaren eta Literaturaren didaktika testuinguru eleaniztunetan. Bilbo. SEDLL. 120--121 orr.
Joseba Fernandez de Landa, Rodrigo Agerri, Iñaki Alegria
Euskaldun gazte eta helduen harremanak Twitterren (2019)
III. Ikergazte. Nazioarteko ikerketa euskaraz. Kongresuko artikulu bilduma. Gizarte Zientziak eta Zuzenbidea. 2, pp. 83 - 90
Izaskun Aldezabal, Jose Mari Arriola, Ainara Estarrona
A modular grammar-helping tool for Basque: work in progress (2019)
Proceedings of the NoDaLiDa 2019 Workshop on Constraint Grammar - Methods, Tools and Applications, 30 September 2019, Turku, Finland.https://ep.liu.se/ecp/contents.asp?issue=168
Alicia Pérez, Aitziber Atutxa, Arantza Casillas, Koldo Gojenola, Álvaro Sellart
Inferred joint multigram models for medical term normalization according to ICD (2018)
International Journal of Medical Informatics. Volume 110, February 2018, Pages 111–117
Arantxa Otegi, Oier Imaz, Arantza Dı́az de Ilarraza, Mikel Iruskieta, Larraitz Uria
ANALHITZA: a tool to extract linguistic information from large corpora in Humanities research (2017)
Procesamiento del Lenguaje Natural 58, pp. 77-84. ISSN: 1135-5948
Bel N., González-Blanco E., Iruskieta M.
CLARIN Centro-K-español (2016)
Procesamiento del Lenguaje Natural, 57, 151-154
dh_tabs_full
Analhitza
Norbere corpusetik infromazio linguistikoa ateratzeko tresna erabilerraza
Compress-eus
Testuak laburtzen laguntzeko on-line zerbitzua. Estrakziozko (azpimarratu) eta abstrakziozko (editatu) laburpenak egiten laguntzen du.
- BIM: Basque in the Making: a HIstorical Look at a European Language Isolate. (2017 - 2021)
- enetCollect: Hizkuntzen Ikasketa eta Crowdsourcing konbinatzeko sare europear berria (2017 - 2021)
- DeepReading: Mining, Understanding, and Reasoning with Multilingual Content. (2019 - 2021)
- LINGUATEC: mugakide diren hizkuntzen arteko lankidetza eta ezagutza-transferentzia hizkuntza-teknologian. (2018 - 2020)
- CLARIN-K outreach campaign 2018: http://clarin-es.org/campana-de-divulgacion-de-clarin-k/
- More information at CLARIN-K website: http://ixa2.si.ehu.es/clarink/index.php?lang=en
- Follow @CLARINERIC on Twitter
Oscar Sainz, Oier Lopez de Lacalle, Itziar Aldabe, Montse Maritxalar
Domain Adapted Distant Supervision for Pedagogically Motivated Relation Extraction (2020)
Proceeding of 12th Edition of its Language Resources and Evaluation Conference (LREC2020). Marseille, France
Andrea Horbach, Itziar Aldabe, Marie Bexte, Oier Lopez de Lacalle and Montse Maritxalar
Linguistic Appropriateness and Pedagogic Usefulness of Reading Comprehension Questions (2020)
Proceeding of 12th Edition of its Language Resources and Evaluation Conference (LREC2020). Marseille, France
Piroska Lendvai , Sándor Darányi, Christian Geng, Moniek Kuijpers, Oier Lopez de Lacalle , Jean-Christophe Mensonides, Simone Rebora and Uwe Reichel
Detection of Reading Absorption in User-Generated Book Reviews: Resources Creation and Evaluation (2020)
Proceeding of 12th Edition of its Language Resources and Evaluation Conference (LREC2020). Marseille, France
Mikel Iruskieta, Amaia Arroyo-Sagasta, Abel Camacho, Montse Maritxalar
Teknologia, testuinguru digitala eta konpetentzia digitalak hezkuntzan (2020)
Euskonews 748. ISSN: 1139-3629. URL: http://www.euskonews.eus/zbk/748/teknologia-testuinguru-digitala-eta-konpetentzia-digitalak-hezkuntzan/ar-0748001002E/
Kepa Bengoetxea, Itziar Gonzalez-Dios, Amaia Aguirregoitia
AzterTest: Open source linguistic and stylistic analysis tool (2020)
Procesamiento del Lenguaje Natural, 64, 61-68. http://journal.sepln.org/sepln/ojs/ojs/index.php/pln/article/view/6196
Itziar Gonzalez-Dios, Kepa Bengoetxea, Amaia Aguirregoitia
LagunTest: A NLP Based Application to Enhance Reading Comprehension (2020)
1st Workshop on Tools and Resources to Empower People with REAding DIfficulties (READI2020), pages 63–69. ISBN: 979-10-95546-44-3 https://www.aclweb.org/anthology/2020.readi-1.10/ https://lrec2020.lrec-conf.org/media/proceedings/Workshops/Books/READI2020book.pdf
Nora Aranberri
With or without you? Effects of using machine translation to write flash fiction in the foreign language (2020)
Proceedings of the 22nd Annual Conference of the European Association for Machine Translation, p. 165–174, Lisboa, Portugal, November 2020.
Jose Mari Arriola, Josu Goikoetxea, Mikel Iruskieta
Hizkuntza-teknologiak hizkuntzen ikas-irakaskuntzan: zenbat aukera, hainbat erronka (2020)
ehizpide 95: 1--21
Hormaetxe G., Iruskieta M.
Parekoen behaketarekin komunikazio-gaitasuna ebaluatzen: zer dute nahiago ikasleek, errubrika tradizionala ala bideo-behaketa (2020)
e-Hizpide 96
Camacho A., Iruskieta M., Latatu A., Lonbide P.
UEUren Online ikaskuntzarako eredu pedagogikoaren sorrera eta garapena: teoriatik praktikara (2020)
Uztaro
Amaia Aguirregoitia Martinez, Kepa Bengoetxea Kortazar, Itziar Gonzalez-Dios
Are CLIL texts too complicated? A computational analysis of their linguistic characteristics (2020)
Journal of Immersion and Content-Based Language Education (Available online)
Ainara Estarrona, Izaskun Etxeberria, Ricardo Etxepare, Manuel Padilla-Moyano, Ander Soraluze
Dealing with dialectal variation in the construction of the Basque historical corpus (2020)
Proceedings of the 7th Workshop on NLP for similar languages, varieties and dialects (VarDial2020 at COLING 2020).
Mikel Iruskieta, Arantza Diaz de Ilarraza
Tecnologı́as del lenguaje para la enseñanza e investigación en Humanidades Digitales (2019)
Universidad de La Habana
Mikel Iruskieta, Arantxa Otegi, Larraitz Uria, Arantza Diaz de Ilarraza, Amaia Artolazabal
Zer i(ra)kas dezakegu geure corpusekin "jolastuz"? (2019)
Traineru bete lagun: Iñaki Gaminde omenduz. UPV/EHU. 35-66 or.
Ainara Estarrona, Izaskun Etxeberria, Ander Soraluze, Manuel Padilla-Moyano
Spelling Normalisation of Basque Historical Texts (2019)
Procesamiento del Lenguaje Natural, vol. 63, pp. 59-66
Mikel Iruskieta, Montse Maritxalar, Amaia Arroyo-Sagasta, Abel Camacho (ed.)
IKTak eta konpetentzia digitalak hezkuntzan (2019)
Argitaratzaileak: UEU eta UPV/EHU. Bilbo. ISBN: 978-84-8438-693-3. 376 orr.
Mikel Iruskieta, Aitziber Iturricastillo
Idatzizko eta ahozko hizkuntza-irakakuntza online (2019)
In "IKTak eta konpetentzia digitalak hezkuntzan" Eds: Iruskieta, M. Maritxalar, M. Arroyo, A. Camacho, A. 279-294. UEU eta UPV/EHU. Bilbo.
Jennifer Isasi, Mikel Iruskieta
Humanitate Digitalak eta haien ikerketaren nondik norakoak (2019)
In "IKTak eta konpetentzia digitalak hezkuntzan" Eds: Iruskieta, M. Maritxalar, M. Arroyo, A. Camacho, A. 307-332. UEU eta UPV/EHU. Bilbo.
Unai Atutxa, Mikel Iruskieta, Olatz Ansa
Laburpena eskolan: estrakzioaren eta abstrakzioaren arteko zubia (2019)
XX Congreso Internacional de Didáctica de la Lengua y la Literatura: Hizkuntzaren eta Literaturaren didaktika testuinguru eleaniztunetan. Bilbo. SEDLL. 32--34 orr.
Iratxe Esparza, Mikel Iruskieta
Haur Hezkuntzako ipuin-bilduman emakumearen irudia eta funtzioa: hurbilpen narratologiko eta eLiterarioa (2019)
XX Congreso Internacional de Didáctica de la Lengua y la Literatura: Hizkuntzaren eta Literaturaren didaktika testuinguru eleaniztunetan. Bilbo. SEDLL. 120--121 orr.
Joseba Fernandez de Landa, Rodrigo Agerri, Iñaki Alegria
Euskaldun gazte eta helduen harremanak Twitterren (2019)
III. Ikergazte. Nazioarteko ikerketa euskaraz. Kongresuko artikulu bilduma. Gizarte Zientziak eta Zuzenbidea. 2, pp. 83 - 90
Izaskun Aldezabal, Jose Mari Arriola, Ainara Estarrona
A modular grammar-helping tool for Basque: work in progress (2019)
Proceedings of the NoDaLiDa 2019 Workshop on Constraint Grammar - Methods, Tools and Applications, 30 September 2019, Turku, Finland.https://ep.liu.se/ecp/contents.asp?issue=168
Alicia Pérez, Aitziber Atutxa, Arantza Casillas, Koldo Gojenola, Álvaro Sellart
Inferred joint multigram models for medical term normalization according to ICD (2018)
International Journal of Medical Informatics. Volume 110, February 2018, Pages 111–117
Arantxa Otegi, Oier Imaz, Arantza Dı́az de Ilarraza, Mikel Iruskieta, Larraitz Uria
ANALHITZA: a tool to extract linguistic information from large corpora in Humanities research (2017)
Procesamiento del Lenguaje Natural 58, pp. 77-84. ISSN: 1135-5948
Bel N., González-Blanco E., Iruskieta M.
CLARIN Centro-K-español (2016)
Procesamiento del Lenguaje Natural, 57, 151-154