Domaines médical et juridique [FR]
Les techniques de traitement du langage naturel nécessitent généralement d'adaptation lorsqu'elles sont utilisées dans des domaines spécifiques tels que les domaines médical et juridique.
Dans le domaine de la santé, nous avons commencé en 2010 à collaborer avec l'hôpital de Galdakao-Usansolo dans le but d'améliorer l'encodage de leurs dossiers de santé d'accord avec la Classification Internationale des Maladies (CIM). Par la suite, et toujours dans l'intérêt des patients, nous avons travaillé sur différents domaines : la détection des effets indésirables des médicaments, la reconnaissance des entités cliniques nommées (médicaments, troubles de santé, noms des parties du corps...) et dernièrement la traduction automatique des dossiers de santé électroniques (DSE). Nous avons principalement travaillé avec des DSE en espagnol, mais nous avons aussi utilisé des corpus médicaux en anglais, et ce qui est très important pour nous, nous avons fait des pas importants pour amener le basque aux services de santé. En ce sens, nous avons traduit automatiquement l'énorme lexique médical SNOMED-CT de l'anglais vers le basque, et nous avons obtenu nos premiers résultats en traduction automatique neuronale entre basque et espagnol.
En collaboration avec quelques hôpitaux du Système Sanitaire Basque (Osakidetza), nous avons travaillé dans les projets de recherche OSAKU, DETEAMI, EXTRECM et PROSAMED et nous avons obtenu un contrat d'Osakidetza pour la traduction automatique de la CIM-10 en Basque.
Dans le domaine juridique, nous avons été contractés par Minsait pour collaborer à Prótagoras, un projet interne qui vise à construire un système de compréhension du langage naturel pour l'espagnol. Nous nous sommes concentrés dans le domaine juridique, dans lequel le back-office génère une énorme quantité de documentation administrative qui doit être enregistrée et organisée très rapidement pour permettre une prise de décision efficace.
Dans le projet nous avons présenté une solution pour un cas réel d'extraction d'information des actes notariés, en remplissant l'objectif d'alléger le coût de l'effort manuel. Ainsi, sans utiliser de données étiquetées, nous avons développé des systèmes capables d'extraire les principaux attributs des propriétés décrites dans les documents (localité, nom de rue, numéro de propriété et prix, entre autres) ainsi que les informations sur les propriétaires (par exemple, noms et prénoms, type de propriété, etc.).