Alignement lexical en corpus comparables : le cas des composés savants et des adjectifs relationnels

Notre travail concerne l extraction automatique d une liste de termes alignés avec leurs traductions (c est-à-dire un lexique bilingue spécialisé) à partir d un corpus comparable dans un domaine de spécialité. Un corpus comparable comprend des textes écrits dans deux langues différentes sans aucune...

Description complète

Enregistré dans:
Détails bibliographiques
Auteurs principaux : Harastani Rima (Auteur, Membre du jury), Morin Emmanuel (Directeur de thèse, Membre du jury), Daille Béatrice (Directeur de thèse, Membre du jury), Schwenk Holger (Président du jury de soutenance, Membre du jury), Blanchon Hervé (Rapporteur de la thèse, Membre du jury), Heid Ulrich (Rapporteur de la thèse, Membre du jury)
Collectivités auteurs : Université de Nantes 1962-2021 (Organisme de soutenance), Université de Nantes Faculté des sciences et des techniques (Organisme de soutenance), École doctorale Sciences et technologies de l'information et mathématiques Nantes (Organisme de soutenance), Laboratoire d Informatique de Nantes Atlantique (UMR 6241) Nantes (Ecole doctorale associée à la thèse)
Format : Thèse ou mémoire
Langue : français
anglais
Titre complet : Alignement lexical en corpus comparables : le cas des composés savants et des adjectifs relationnels / Rima Harastani; sous la direction de Emmanuel Morin ; co-encadrante de thèse Béatrice Daille
Publié : [S.l.] : [s.n.] , 2014
Accès en ligne : Accès Nantes Université
Note de thèse : Thèse de doctorat : Informatique, Traitement automatique du langage naturel : Nantes : 2014
Sujets :
Documents associés : Reproduction de: Alignement lexical en corpus comparables
LEADER 05707clm a2200637 4500
001 PPN185918778
003 http://www.sudoc.fr/185918778
005 20240531154500.0
029 |a FR  |b 2014NANT2007 
035 |a (OCoLC)1247892840 
100 |a 20150609d2014 k y|frey0103 ba 
101 0 |a fre  |a eng  |d fre  |d eng  |2 639-2 
102 |a FR 
105 |a ||||v 00||| 
135 |a |r||||||||||| 
181 1 |6 z01  |c txt  |2 rdacontent 
181 1 |6 z01  |a i#  |b xxxe## 
182 1 |6 z01  |c c  |2 rdamedia 
182 1 |6 z01  |a b 
200 1 |a Alignement lexical en corpus comparables  |e le cas des composés savants et des adjectifs relationnels  |f Rima Harastani  |g sous la direction de Emmanuel Morin ; co-encadrante de thèse Béatrice Daille 
210 |a [S.l.]  |c [s.n.]  |d 2014 
230 |a Données textuelles 
314 |a Ecole(s) Doctorale(s) : École doctorale sciences et technologies de l'information et de mathématiques (Nantes) 
314 |a Partenaire de recherche : Laboratoire d Informatique de Nantes Atlantique (UMR 6241) (LINA) (Nantes) (Laboratoire) 
314 |a Autres contributions : Holger Schwenk (Président du jury) ; Vincent Claveau, Béatrice Daille, Emmanuel Morin (Membres du jury) ; Ulrich Heid (Rapporteurs) 
320 |a Références bibliographiques 
325 1 |a La thèse papier est la seule version officielle 
328 |b Thèse de doctorat  |c Informatique, Traitement automatique du langage naturel  |e Nantes  |d 2014 
330 |a Notre travail concerne l extraction automatique d une liste de termes alignés avec leurs traductions (c est-à-dire un lexique bilingue spécialisé) à partir d un corpus comparable dans un domaine de spécialité. Un corpus comparable comprend des textes écrits dans deux langues différentes sans aucune relation de traduction entre eux mais dont les textes appartiennent à un même domaine. Les contributions de cette thèse portent sur l amélioration de la qualité d un lexique bilingue spécialisé extrait à partir d un corpus comparable. Nous proposons des méthodes consacrées à la traduction de deux types de termes, qui ont des caractéristiques en commun entre plusieurs langues ou qui posent par leur nature des problèmes pour la traduction : les composés savants (termes contenant au moins une racine gréco-latine) et les termes composés d un nom et un adjectif relationnel. Nous développons également une méthode, qui exploite des contextes riches en termes spécifiques au domaine du corpus, pour réordonner dans un lexique bilingue spécialisé des traductions candidates fournies pour un terme. Les expériences sont réalisées en utilisant deux corpus comparables spécialisés (dans les domaines du cancer du sein et des énergies renouvelables), sur les langues français, anglais, allemand et espagnol. 
330 |a Our work concerns the automatic extraction of a list of aligned terms with their translations (i.e. specialized bilingual lexicon) from comparable corpora belonging to a specific domain. Comparable corpora include texts written in two languages which are not mutual translations but belong to the same domain. This thesis contributes to the improvement of the quality of an extracted bilingual lexicon. We propose methods dedicated to the translation of two types of terms that have common characteristics among many languages or that cause specific problems for translation due to their nature. These types of terms are the neoclassical compounds (terms containing at least one root borrowed from Greek or Latin) and the terms composed of one noun and one relational adjective. We also propose a method that exploits contexts rich in domain-specific terms to re-rank some provided translations in a bilingual lexicon for a given term. The experiments are performed using two specialized comparable corpora (in the domains of Breast Cancer and Renewable Energy), on the French, English, German and Spanish languages. 
455 | |0 185918298  |t Alignement lexical en corpus comparables  |o le cas des composés savants et des adjectifs relationnels  |f Rima Harastani  |c [S.l.]  |n [s.n.]  |d 2014  |p 1 vol. (151 p.) 
541 | |a Lexical alignment from comparable corpora : the case of neoclassical compounds and relational adjectives  |z eng 
606 |3 PPN027291421  |a Multilinguisme  |2 rameau 
608 |3 PPN027253139  |a Thèses et écrits académiques  |2 rameau 
610 0 |a Corpus comparables 
610 2 |a Alignement multilingue 
610 0 |a Lexiques bilingues 
610 0 |a Alignement multilingue 
610 0 |a Composés savants 
610 0 |a Adjectifs relationnels 
686 |a 004  |2 TEF 
700 1 |3 PPN185915205  |a Harastani  |b Rima  |f 1985-....  |4 070  |4 555 
701 1 |3 PPN14379373X  |a Morin  |b Emmanuel  |f 1971-....  |c enseignant-chercheur en informatique  |4 727  |4 555 
701 1 |3 PPN060702435  |a Daille  |b Béatrice  |4 727  |4 555 
701 1 |3 PPN12474446X  |a Schwenk  |b Holger  |f 1967-....  |4 956  |4 555 
701 1 |3 PPN139435190  |a Blanchon  |b Hervé  |f 19..-....  |4 958  |4 555 
701 1 |3 PPN185915493  |a Heid  |b Ulrich  |f 19..-....  |4 958  |4 555 
711 0 2 |3 PPN026403447  |a Université de Nantes  |c 1962-2021  |4 295 
711 0 2 |3 PPN033124884  |a Université de Nantes  |b Faculté des sciences et des techniques  |4 295 
711 0 2 |3 PPN134103211  |a École doctorale Sciences et technologies de l'information et mathématiques  |c Nantes  |4 295  |4 996 
711 0 2 |3 PPN137062508  |a Laboratoire d Informatique de Nantes Atlantique (UMR 6241)  |c Nantes  |4 981  |4 981 
801 3 |a FR  |b Abes  |c 20230206  |g AFNOR 
856 4 |q PDF  |u https://archive.bu.univ-nantes.fr/pollux/show/show?id=715f898e-83d7-4541-8a0c-cf910bd67fee  |2 accès au texte intégral de la thèse 
979 |a SCI 
930 |5 441092104:531873072  |b 441092104  |j g 
998 |a 672565