Reconnaissance des entités nommées dans des documents multimodaux

La reconnaissance des entités nommées est une sous-tâche de l activité d extraction d information. Elle consiste à identifier certains objets textuels tels que les noms de personne, d organisation et de lieu. Le travail de cette thèse se concentre sur la tâche de reconnaissance des entités nommées p...

Full description

Saved in:
Bibliographic Details
Main Authors : Hatmi Mohamed (Auteur), Morin Emmanuel (Directeur de thèse), Meignier Sylvain (Directeur de thèse), Sébillot Pascale (Président du jury de soutenance), Antoine Jean-Yves (Rapporteur de la thèse), Rosset Sophie (Rapporteur de la thèse)
Corporate Authors : Université de Nantes 1962-2021 (Organisme de soutenance), Université de Nantes Faculté des sciences et des techniques (Organisme de soutenance), École doctorale Sciences et technologies de l'information et mathématiques Nantes (Ecole doctorale associée à la thèse)
Format : Thesis
Language : français
anglais
Title statement : Reconnaissance des entités nommées dans des documents multimodaux / Mohamed Hatmi; sous la direction de Emmanuel Morin ; co-encadrants de thèse Christine Jacquin et Sylvain Meignier
Published : [S.l.] : [s.n.] , 2014
Online Access : Via Nantes Université network
Note de thèse : Thèse de doctorat : Informatique, Traitement automatique des langues : Nantes : 2014
Subjects :
Related Items : Is reproduction of: Reconnaissance des entités nommées dans des documents multimodaux
LEADER 05662clm a2200553 4500
001 PPN183643771
003 http://www.sudoc.fr/183643771
005 20240531154500.0
029 |a FR  |b 2014NANT2002 
035 |a (OCoLC)1247886531 
100 |a 20150211d2014 k y|frey0103 ba 
101 0 |a fre  |a eng  |d fre  |d eng  |2 639-2 
102 |a FR 
105 |a ||||v 00||| 
135 |a |r||||||||||| 
181 1 |6 z01  |c txt  |2 rdacontent 
181 1 |6 z01  |a i#  |b xxxe## 
182 1 |6 z01  |c c  |2 rdamedia 
182 1 |6 z01  |a b 
200 1 |a Reconnaissance des entités nommées dans des documents multimodaux  |f Mohamed Hatmi  |g sous la direction de Emmanuel Morin ; co-encadrants de thèse Christine Jacquin et Sylvain Meignier 
210 |a [S.l.]  |c [s.n.]  |d 2014 
230 |a Données textuelles 
320 |a Références bibliographiques 
325 1 |a La thèse papier est la seule version officielle 
328 |b Thèse de doctorat  |c Informatique, Traitement automatique des langues  |e Nantes  |d 2014 
330 |a La reconnaissance des entités nommées est une sous-tâche de l activité d extraction d information. Elle consiste à identifier certains objets textuels tels que les noms de personne, d organisation et de lieu. Le travail de cette thèse se concentre sur la tâche de reconnaissance des entités nommées pour la modalité orale. Cette tâche pose un certain nombre de difficultés qui sont inhérentes aux caractéristiques intrinsèques du traitement de l oral (absence de capitalisation, manque de ponctuation, présence de disfluences et d erreurs de reconnaissance...). Dans un premier temps, nous étudions les spécificités de la reconnaissance des entités nommées en aval du système de reconnaissance automatique de la parole. Nous présentons une méthode pour la reconnaissance des entités nommées dans les transcription de la parole en adoptant une taxonomie hiérarchique et compositionnelle. Nous mesurons l impact des différents phénomènes spécifiques à la parole sur la qualité de reconnaissance des entités nommées. Dans un second temps, nous proposons d étudier le couplage étroit entre la tâche de transcription de la parole et la tâche de reconnaissance des entités nommées. Dans ce but, nous détournons les fonctionnalités de base d un système de transcription de la parole pour le transformer en un système de reconnaissance des entités nommées. Ainsi, en mobilisant les connaissances propres au traitement de la parole dans le cadre de la tâche liée à la reconnaissance des entités nommées, nous assurons une plus grande synergie entre ces deux tâches. Nous menons différents types d expérimentations afin d optimiser et d évaluer notre approche. 
330 |a Named entity recognition is a subtask of information extraction. It consists of identifying some textual objects such as person, location and organization names. The work of this thesis focuses on the named entity recognition task for the oral modality. Some difficulties may arise for this task due to the intrinsic characteristics of speech processing (lack of capitalisation marks, lack of punctuation marks, presence of disfluences and of recognition errors...). In the first part, we study the characteristics of the named entity recognition downstream of the automatic speech recognition system. We present a methodology which allows named entity recognition following a hierarchical and compositional taxonomy. We measure the impact of the different phenomena specific to speech on the quality of named entity recognition. In the second part, we propose to study the tight pairing between the speech recognition task and the named entity recognition task. For that purpose, we take away the basic functionnalities of a speech recognition system to turn it into a named entity recognition system. Therefore, by mobilising the inherent knowledge of the speech processing to the named entity recognition task, we ensure a better synergy between the two tasks. We carry out different types of experiments to optimize and evaluate our approach. 
455 | |0 183643038  |t Reconnaissance des entités nommées dans des documents multimodaux  |f Mohamed Hatmi  |c [S.l.]  |n [s.n.]  |d 2014  |p 1 vol. (138 p.) 
541 | |a Named entity recognition in multimodal documents  |z eng 
606 |3 PPN027326489  |a Linguistique  |x Informatique  |2 rameau 
606 |3 PPN027985830  |a Traitement automatique du langage naturel  |2 rameau 
606 |3 PPN035198222  |a Exploration de données  |3 PPN029120225  |x Connecteurs (linguistique)  |2 rameau 
606 |3 PPN027940373  |a Apprentissage automatique  |2 rameau 
608 |3 PPN027253139  |a Thèses et écrits académiques  |2 rameau 
686 |a 004  |2 TEF 
700 1 |3 PPN183642058  |a Hatmi  |b Mohamed  |f 1982-....  |4 070 
701 1 |3 PPN14379373X  |a Morin  |b Emmanuel  |f 1971-....  |c enseignant-chercheur en informatique  |4 727 
701 1 |3 PPN182269086  |a Meignier  |b Sylvain  |4 727 
701 1 |3 PPN075988453  |a Sébillot  |b Pascale  |f 1962-....  |4 956 
701 1 |3 PPN137158319  |a Antoine  |b Jean-Yves  |f 1966-....  |4 958 
701 1 |3 PPN137157835  |a Rosset  |b Sophie  |f 1970-....  |4 958 
711 0 2 |3 PPN026403447  |a Université de Nantes  |c 1962-2021  |4 295 
711 0 2 |3 PPN033124884  |a Université de Nantes  |b Faculté des sciences et des techniques  |4 295 
711 0 2 |3 PPN134103211  |a École doctorale Sciences et technologies de l'information et mathématiques  |c Nantes  |4 996 
801 3 |a FR  |b Abes  |c 20230206  |g AFNOR 
856 4 |q PDF  |u https://archive.bu.univ-nantes.fr/pollux/show/show?id=022d16d5-ad85-43fa-9127-9f1d9d89db14  |2 accès au texte intégral de la thèse 
979 |a SCI 
930 |5 441092104:522075304  |b 441092104  |j u 
998 |a 710723