Alignement multilingue en corpus comparables spécialisés : caractérisation terminologique multilingue

Les corpus comparables rassemblent des documents multilingues n étant pas en relation de traduction mais partageant des traits communs. Notre travail porte sur l extraction de lexique bilingue à partir de ces corpus, c est-à-dire la reconnaissance et l alignement d un vocabulaire commun multilingue...

Description complète

Enregistré dans:
Détails bibliographiques
Auteur principal : Prochasson Emmanuel (Auteur)
Collectivités auteurs : Université de Nantes Faculté des sciences et des techniques (Autre partenaire associé à la thèse), École doctorale sciences et technologies de l'information et des matériaux Nantes (Ecole doctorale associée à la thèse), Laboratoire d Informatique de Nantes Atlantique (UMR 6241) Nantes (Organisme de soutenance), Université de Nantes 1962-2021 (Organisme de soutenance)
Autres auteurs : Daille Béatrice (Directeur de thèse), Morin Emmanuel (Directeur de thèse), Tamzalit Dalila (Directeur de thèse)
Format : Thèse ou mémoire
Langue : français
Titre complet : Alignement multilingue en corpus comparables spécialisés : caractérisation terminologique multilingue / Emmanuel Prochasson; sous la direction de Béatrice Daille, encadrant Emmanuel Morin
Publié : [S.l.] : [s.n.] , 2009
Description matérielle : 1 vol. (122 f.)
Note de thèse : Thèse de doctorat : Informatique : Nantes : 2009
Sujets :
Documents associés : Reproduit comme: Alignement multilingue en corpus comparables spécialisés
LEADER 04138cam a2200445 4500
001 PPN150693184
003 http://www.sudoc.fr/150693184
005 20240531154500.0
029 |a FR  |b 2009NANT2106 
035 |a (OCoLC)758791562 
100 |a 20110314d2009 k y0frey0103 ba 
101 0 |a fre  |d fre  |d eng 
102 |a FR 
105 |a y m 00|y| 
106 |a r 
200 1 |a Alignement multilingue en corpus comparables spécialisés  |b Texte imprimé  |e caractérisation terminologique multilingue  |f Emmanuel Prochasson  |g sous la direction de Béatrice Daille, encadrant Emmanuel Morin 
210 |a [S.l.]  |c [s.n.]  |d 2009 
215 |a 1 vol. (122 f.)  |c ill.  |d 30 cm 
320 |a Bibliogr. f. 107-113 
328 |b Thèse de doctorat  |c Informatique  |e Nantes  |d 2009 
330 |a Les corpus comparables rassemblent des documents multilingues n étant pas en relation de traduction mais partageant des traits communs. Notre travail porte sur l extraction de lexique bilingue à partir de ces corpus, c est-à-dire la reconnaissance et l alignement d un vocabulaire commun multilingue disponible dans le corpus. Nous nous concentrons sur les corpus comparables spécialisés, c est-à-dire des corpus constitués de documents révélateurs de la terminologie utilisée dans les langues de spécialité. Nous travaillons sur des corpus médicaux, l un deux couvre la thématique du diabète et de l alimentation, en français, anglais et japonais ; l autre couvre la thématique du cancer du sein, en anglais et en français. Nous proposons et évaluons différentes améliorations du processus d alignement, en particulier dans le cas délicat de la langue japonaise. Nous prolongeons ce manuscrit par une réflexion sur la nature des corpus comparables et la notion de comparabilité 
330 |a Comparable corpora are sets of documents written in different languages, which are not translations of each other but share common features, such as the topic or the discourse type. Our work concerns bilingual lexicon extraction from such corpora, in other word, the process of finding translation pairs among the common multilingual vocabulary available in comparable corpora. We focus on specialised comparable corpora, for they are likely to reveal the terminology proper to specialised language. We work on corpora made of medical documents: one of them covers the topic of diabetes and feeding, in French, English and Japanese; the other one covers the topic of breast cancer, in French and English. We propose several improvements for the classical alignment process, especially concerning the delicate case of the Japanese language, distant from French and English. We conclude this thesis with thoughts concerning the nature of comparable corpora and the question of comparability 
456 | |0 150693583  |t Alignement multilingue en corpus comparables spécialisés  |b Ressource électronique  |o caractérisation terminologique multilingue  |f Emmanuel Prochasson  |c [S.l.]  |n [s.n.]  |d 2009 
541 | |a Multilingual alignment from specialised comparable corpora  |z eng 
606 |3 PPN029667356  |a Langues de spécialité  |3 PPN027253139  |x Thèses et écrits académiques  |2 rameau 
606 |3 PPN132348403  |a Corpus linguistique  |3 PPN027253139  |x Thèses et écrits académiques  |2 rameau 
610 2 |a Corpus comparable  |a Alignement multilingue 
686 |a 004  |2 TEF 
700 1 |3 PPN150692854  |a Prochasson  |b Emmanuel.  |f 1982-....  |4 070 
702 1 |3 PPN060702435  |a Daille  |b Béatrice  |4 727 
702 1 |3 PPN14379373X  |a Morin  |b Emmanuel  |f 1971-....  |c enseignant-chercheur en informatique  |4 727 
702 1 |3 PPN096992875  |a Tamzalit  |b Dalila  |4 727 
712 0 2 |3 PPN033124884  |a Université de Nantes  |b Faculté des sciences et des techniques  |4 985 
712 0 2 |3 PPN068720513  |a École doctorale sciences et technologies de l'information et des matériaux  |c Nantes  |4 996 
712 0 2 |3 PPN137062508  |a Laboratoire d Informatique de Nantes Atlantique (UMR 6241)  |c Nantes  |4 295 
712 0 2 |3 PPN026403447  |a Université de Nantes  |c 1962-2021  |4 295 
801 3 |a FR  |b Abes  |c 20171204  |g AFNOR 
979 |a SCI 
930 |5 441092104:418317623  |b 441092104  |j u 
998 |a 585136