Identification et exploitation de contextes riches en connaissances pour l'aide à la traduction terminologie

Les outils de traduction assistée par ordinateur et de gestion terminologique sont le plus souvent utilisés pour répondre au besoin de la gestion de l écrit multilingue et monolingue. En effet, ils facilitent l accès aux termes techniques et aux expressions liés à des domaines de spécialité, et indi...

Description complète

Enregistré dans:
Détails bibliographiques
Auteurs principaux : Hmida Firas (Auteur), Morin Emmanuel (Directeur de thèse), Daille Béatrice (Directeur de thèse), Fabre Cécile (Président du jury de soutenance), Allauzen Alexandre (Rapporteur de la thèse)
Collectivités auteurs : Université de Nantes 1962-2021 (Organisme de soutenance), École doctorale Sciences et technologies de l'information et mathématiques Nantes (Ecole doctorale associée à la thèse), Université Bretagne Loire 2016-2019 (Autre partenaire associé à la thèse), Laboratoire des Sciences du Numérique de Nantes (Laboratoire associé à la thèse)
Format : Thèse ou mémoire
Langue : français
Titre complet : Identification et exploitation de contextes riches en connaissances pour l'aide à la traduction terminologie / Firas Hmida; sous la direction de Emmanuel Morin et de Béatrice Daille
Publié : 2017
Accès en ligne : Accès Nantes Université
Note sur l'URL : Accès au texte intégral
Note de thèse : Thèse de doctorat : Informatique : Nantes : 2017
Sujets :
Description
Résumé : Les outils de traduction assistée par ordinateur et de gestion terminologique sont le plus souvent utilisés pour répondre au besoin de la gestion de l écrit multilingue et monolingue. En effet, ils facilitent l accès aux termes techniques et aux expressions liés à des domaines de spécialité, et indispensables à tout processus de communication. La compréhension de ces expressions techniques peut être potentialisée au moyen de leur contextualisation . Néanmoins, avoir accès à un terme ou à sa traduction ne suffit pas, encore faut-il être capable de l employer correctement et d en appréhender le sens exact. Cette contextualisation a donc lieu à deux niveaux : dans les textes et dans la terminologie. Au niveau textuel, l utilisateur doit avoir accès à des informations concernant l usage des termes, à savoir des contextes riches en connaissances linguistiques. Au niveau terminologique, il doit avoir accès aux relations sémantiques ou conceptuelles entre termes afin de mieux en saisir le sens, à savoir des contextes riches en connaissances conceptuelles. Dans le cadre de cette thèse, nous avons proposé une stratégie d extraction de contextes riches en connaissances (CRC) permettant de produire un premier prototype de dictionnaires terminologiques. Nous avons poursuivi nos travaux dans un cadre bilingue et plus particulièrement en phase de révision du processus de traduction spécialisée. Nous avons proposé une méthodologie d élaboration d un concordancier bilingue fournissant des CRC alignés à partir de corpus comparables spécialisés. Les évaluations menées montrent que les CRC proposés sont utiles malgré la difficulté de l exercice étudié.
Computer-assisted translation and terminology management tools are often used to meet the needs in management of multilingual and monolingual writings. These tools facilitate the access to technical terms and expressions that are related to areas of specialty, and essential to any communication process. The understanding of technical terms can be potentiated by their contextualization . However, having access to a term or its translation is not enough, since it is also necessary to be able to use it properly and to understand its exact meaning. Thus, this contextualization is estabilished on two levels: in texts and in the terminology. In texts, the user must have access to information regarding the use of terms, namely linguistic knowledge-rich contexts. In the terminology, the user requires access to semantic or conceptual relationships between the terms to better understand its meaning, namely conceptual rich-knowlegde contexts. In the framework of this thesis, we proposed a strategy for extracting Knowledge-Rich Contexts (KRCs) to produce a new terminological dictionary. It is to provide, for each term and its possible translations, the KRCs in which it occurs. We continued our work in a bilingual phase part of specialized translation, under continuous revision. We propose a new generation of bilingual concordancers that take as input a term and its translation, and provides not parallel, but aligned Knowledge-Rich Contexts from specialized comparable corpora. The evaluation show that our concordancer can assist revisers despite the difficulty of the task.
Variantes de titre : Identification and exploitation of knowledge-rich contexts for terminological assisted translation
Notes : Titre provenant de l'écran-titre
Ecole(s) Doctorale(s) : École doctorale Sciences et technologies de l'information et mathématiques (Nantes)
Partenaire(s) de recherche : Université Bretagne Loire (COMUE), Laboratoire des Sciences du Numérique de Nantes (Laboratoire)
Autre(s) contribution(s) : Cécile Fabre (Président du jury) ; Alexandre Allauzen (Rapporteur(s))
Configuration requise : Configuration requise : un logiciel capable de lire un fichier au format : PDF