Alignement lexical en corpus comparables : le cas des composés savants et des adjectifs relationnels
Notre travail concerne l extraction automatique d une liste de termes alignés avec leurs traductions (c est-à-dire un lexique bilingue spécialisé) à partir d un corpus comparable dans un domaine de spécialité. Un corpus comparable comprend des textes écrits dans deux langues différentes sans aucune...
Enregistré dans:
Auteurs principaux : | , , , , , |
---|---|
Collectivités auteurs : | , , , |
Format : | Thèse ou mémoire |
Langue : | français anglais |
Titre complet : | Alignement lexical en corpus comparables : le cas des composés savants et des adjectifs relationnels / Rima Harastani; sous la direction de Emmanuel Morin ; co-encadrante de thèse Béatrice Daille |
Publié : |
[S.l.] :
[s.n.]
, 2014 |
Accès en ligne : |
Accès Nantes Université
|
Note de thèse : | Thèse de doctorat : Informatique, Traitement automatique du langage naturel : Nantes : 2014 |
Sujets : | |
Documents associés : | Reproduction de:
Alignement lexical en corpus comparables |
LEADER | 05707clm a2200637 4500 | ||
---|---|---|---|
001 | PPN185918778 | ||
003 | http://www.sudoc.fr/185918778 | ||
005 | 20240531154500.0 | ||
029 | |a FR |b 2014NANT2007 | ||
035 | |a (OCoLC)1247892840 | ||
100 | |a 20150609d2014 k y|frey0103 ba | ||
101 | 0 | |a fre |a eng |d fre |d eng |2 639-2 | |
102 | |a FR | ||
105 | |a ||||v 00||| | ||
135 | |a |r||||||||||| | ||
181 | 1 | |6 z01 |c txt |2 rdacontent | |
181 | 1 | |6 z01 |a i# |b xxxe## | |
182 | 1 | |6 z01 |c c |2 rdamedia | |
182 | 1 | |6 z01 |a b | |
200 | 1 | |a Alignement lexical en corpus comparables |e le cas des composés savants et des adjectifs relationnels |f Rima Harastani |g sous la direction de Emmanuel Morin ; co-encadrante de thèse Béatrice Daille | |
210 | |a [S.l.] |c [s.n.] |d 2014 | ||
230 | |a Données textuelles | ||
314 | |a Ecole(s) Doctorale(s) : École doctorale sciences et technologies de l'information et de mathématiques (Nantes) | ||
314 | |a Partenaire de recherche : Laboratoire d Informatique de Nantes Atlantique (UMR 6241) (LINA) (Nantes) (Laboratoire) | ||
314 | |a Autres contributions : Holger Schwenk (Président du jury) ; Vincent Claveau, Béatrice Daille, Emmanuel Morin (Membres du jury) ; Ulrich Heid (Rapporteurs) | ||
320 | |a Références bibliographiques | ||
325 | 1 | |a La thèse papier est la seule version officielle | |
328 | |b Thèse de doctorat |c Informatique, Traitement automatique du langage naturel |e Nantes |d 2014 | ||
330 | |a Notre travail concerne l extraction automatique d une liste de termes alignés avec leurs traductions (c est-à-dire un lexique bilingue spécialisé) à partir d un corpus comparable dans un domaine de spécialité. Un corpus comparable comprend des textes écrits dans deux langues différentes sans aucune relation de traduction entre eux mais dont les textes appartiennent à un même domaine. Les contributions de cette thèse portent sur l amélioration de la qualité d un lexique bilingue spécialisé extrait à partir d un corpus comparable. Nous proposons des méthodes consacrées à la traduction de deux types de termes, qui ont des caractéristiques en commun entre plusieurs langues ou qui posent par leur nature des problèmes pour la traduction : les composés savants (termes contenant au moins une racine gréco-latine) et les termes composés d un nom et un adjectif relationnel. Nous développons également une méthode, qui exploite des contextes riches en termes spécifiques au domaine du corpus, pour réordonner dans un lexique bilingue spécialisé des traductions candidates fournies pour un terme. Les expériences sont réalisées en utilisant deux corpus comparables spécialisés (dans les domaines du cancer du sein et des énergies renouvelables), sur les langues français, anglais, allemand et espagnol. | ||
330 | |a Our work concerns the automatic extraction of a list of aligned terms with their translations (i.e. specialized bilingual lexicon) from comparable corpora belonging to a specific domain. Comparable corpora include texts written in two languages which are not mutual translations but belong to the same domain. This thesis contributes to the improvement of the quality of an extracted bilingual lexicon. We propose methods dedicated to the translation of two types of terms that have common characteristics among many languages or that cause specific problems for translation due to their nature. These types of terms are the neoclassical compounds (terms containing at least one root borrowed from Greek or Latin) and the terms composed of one noun and one relational adjective. We also propose a method that exploits contexts rich in domain-specific terms to re-rank some provided translations in a bilingual lexicon for a given term. The experiments are performed using two specialized comparable corpora (in the domains of Breast Cancer and Renewable Energy), on the French, English, German and Spanish languages. | ||
455 | | | |0 185918298 |t Alignement lexical en corpus comparables |o le cas des composés savants et des adjectifs relationnels |f Rima Harastani |c [S.l.] |n [s.n.] |d 2014 |p 1 vol. (151 p.) | |
541 | | | |a Lexical alignment from comparable corpora : the case of neoclassical compounds and relational adjectives |z eng | |
606 | |3 PPN027291421 |a Multilinguisme |2 rameau | ||
608 | |3 PPN027253139 |a Thèses et écrits académiques |2 rameau | ||
610 | 0 | |a Corpus comparables | |
610 | 2 | |a Alignement multilingue | |
610 | 0 | |a Lexiques bilingues | |
610 | 0 | |a Alignement multilingue | |
610 | 0 | |a Composés savants | |
610 | 0 | |a Adjectifs relationnels | |
686 | |a 004 |2 TEF | ||
700 | 1 | |3 PPN185915205 |a Harastani |b Rima |f 1985-.... |4 070 |4 555 | |
701 | 1 | |3 PPN14379373X |a Morin |b Emmanuel |f 1971-.... |c enseignant-chercheur en informatique |4 727 |4 555 | |
701 | 1 | |3 PPN060702435 |a Daille |b Béatrice |4 727 |4 555 | |
701 | 1 | |3 PPN12474446X |a Schwenk |b Holger |f 1967-.... |4 956 |4 555 | |
701 | 1 | |3 PPN139435190 |a Blanchon |b Hervé |f 19..-.... |4 958 |4 555 | |
701 | 1 | |3 PPN185915493 |a Heid |b Ulrich |f 19..-.... |4 958 |4 555 | |
711 | 0 | 2 | |3 PPN026403447 |a Université de Nantes |c 1962-2021 |4 295 |
711 | 0 | 2 | |3 PPN033124884 |a Université de Nantes |b Faculté des sciences et des techniques |4 295 |
711 | 0 | 2 | |3 PPN134103211 |a École doctorale Sciences et technologies de l'information et mathématiques |c Nantes |4 295 |4 996 |
711 | 0 | 2 | |3 PPN137062508 |a Laboratoire d Informatique de Nantes Atlantique (UMR 6241) |c Nantes |4 981 |4 981 |
801 | 3 | |a FR |b Abes |c 20230206 |g AFNOR | |
856 | 4 | |q PDF |u https://archive.bu.univ-nantes.fr/pollux/show/show?id=715f898e-83d7-4541-8a0c-cf910bd67fee |2 accès au texte intégral de la thèse | |
979 | |a SCI | ||
930 | |5 441092104:531873072 |b 441092104 |j g | ||
998 | |a 672565 |