Identification et catégorisation automatique des entités nommées dans les textes français

La reconnaissance des entités nommées (EN) reste un problème pour de nombreuses applications de Traitement Automatique des Langues Naturelles. Conséquemment à une étude linguistique permettant l'émergence de paramètres définitoires opérationnels liés au concept d'entité nommée, un état de...

Description complète

Enregistré dans:
Détails bibliographiques
Auteur principal : Fourour Nordine (Auteur)
Collectivités auteurs : Université de Nantes 1962-2021 (Organisme de soutenance), Université de Nantes Faculté des sciences et des techniques (Autre partenaire associé à la thèse), École doctorale sciences et technologies de l'information et des matériaux Nantes (Ecole doctorale associée à la thèse)
Autres auteurs : Daille Béatrice (Directeur de thèse), Morin Emmanuel (Directeur de thèse)
Format : Thèse ou mémoire
Langue : français
Titre complet : Identification et catégorisation automatique des entités nommées dans les textes français / Nordine Fourour; sous la dir. de Béatrice Daille et Emmanuel Morin
Publié : [S.l.] : [s.n.] , 2004
Description matérielle : 1 vol. (172 p.)
Note de thèse : Thèse doctorat : Informatique : Nantes : 2004
Disponibilité : Publication autorisée par le jury
Sujets :
LEADER 03421cam a2200385 4500
001 PPN08879959X
003 http://www.sudoc.fr/08879959X
005 20240531154500.0
029 |a FR  |b 2004NANT2126 
035 |a (OCoLC)493029254 
100 |a 20050727d2004 k y0frey0103 ba 
101 0 |a fre  |d fre  |d eng 
102 |a FR 
105 |a y m ||||| 
106 |a r 
200 1 |a Identification et catégorisation automatique des entités nommées dans les textes français  |b Texte imprimé  |f Nordine Fourour  |g sous la dir. de Béatrice Daille et Emmanuel Morin 
210 |a [S.l.]  |c [s.n.]  |d 2004 
215 |a 1 vol. (172 p.)  |d 30 cm 
310 |a Publication autorisée par le jury 
320 |a Bibliogr. p.149-156 
328 |b Thèse doctorat  |c Informatique  |e Nantes  |d 2004 
330 |a La reconnaissance des entités nommées (EN) reste un problème pour de nombreuses applications de Traitement Automatique des Langues Naturelles. Conséquemment à une étude linguistique permettant l'émergence de paramètres définitoires opérationnels liés au concept d'entité nommée, un état de l'art du domaine et une étude en corpus fondée sur des critères graphiques et référentiels, nous présentons Nemesis, un système d'identification et de catégorisation des EN du français, fondé sur l'analyse des évidences interne et externe réalisée à l'aide de lexiques de mots déclencheurs et de règles de réécriture et comportant une phase d'apprentissage. Dans cette version minimale, Nemesis atteint environ 90% en précision et 80% en rappel. Pour augmenter le rappel, nous proposons différents modules optionnels (examen d'un contexte encore plus large et utilisation du Web comme source de nouveaux contextes) et une étude pour la réalisation d'un module de désambiguïsation et d'apprentissage de règles. 
330 |a Named Entity (NE) Recognition is a recurring problem in the different domain of Natural Language Processing. As a result of, a linguistic investigation allowing to set-up operational parameters defining the concept of named entity, a state of art of the domain, and a corpus investigation using referential and graphical criteria, we present Nemesis - a French named entity recognizer. This system analyzes the internal and external evidences by using grammar rules and trigger word lexicons, and includes a learning process. With these processes, Nemesis performance achieves about 90% of precision and 80% of recall. To increase the recall, we put forward optional modules (analysis of the wide context and utilization of the Web as a source of new contexts) and investigate in setting up a disambiguation and grammar rules inference module. 
606 |3 PPN027985830  |a Traitement automatique du langage naturel  |3 PPN027253139  |x Thèses et écrits académiques  |2 rameau 
686 |a 004  |2 TEF 
700 1 |3 PPN088798003  |a Fourour  |b Nordine  |f 1977-...  |4 070 
702 1 |3 PPN060702435  |a Daille  |b Béatrice  |4 727 
702 1 |3 PPN06701092X  |a Morin  |b Emmanuel  |f 1971-....  |4 727 
712 0 2 |3 PPN026403447  |a Université de Nantes  |c 1962-2021  |4 295 
712 0 2 |3 PPN033124884  |a Université de Nantes  |b Faculté des sciences et des techniques  |4 985 
712 0 2 |3 PPN068720513  |a École doctorale sciences et technologies de l'information et des matériaux  |c Nantes  |4 996 
801 3 |a FR  |b Abes  |c 20171204  |g AFNOR 
979 |a SCI 
930 |5 441092104:237517450  |b 441092104  |j u 
998 |a 415519