Identification et catégorisation automatique des entités nommées dans les textes français
La reconnaissance des entités nommées (EN) reste un problème pour de nombreuses applications de Traitement Automatique des Langues Naturelles. Conséquemment à une étude linguistique permettant l'émergence de paramètres définitoires opérationnels liés au concept d'entité nommée, un état de...
Enregistré dans:
Auteur principal : | |
---|---|
Collectivités auteurs : | , , |
Autres auteurs : | , |
Format : | Thèse ou mémoire |
Langue : | français |
Titre complet : | Identification et catégorisation automatique des entités nommées dans les textes français / Nordine Fourour; sous la dir. de Béatrice Daille et Emmanuel Morin |
Publié : |
[S.l.] :
[s.n.]
, 2004 |
Description matérielle : | 1 vol. (172 p.) |
Note de thèse : | Thèse doctorat : Informatique : Nantes : 2004 |
Disponibilité : | Publication autorisée par le jury |
Sujets : |
LEADER | 03421cam a2200385 4500 | ||
---|---|---|---|
001 | PPN08879959X | ||
003 | http://www.sudoc.fr/08879959X | ||
005 | 20240531154500.0 | ||
029 | |a FR |b 2004NANT2126 | ||
035 | |a (OCoLC)493029254 | ||
100 | |a 20050727d2004 k y0frey0103 ba | ||
101 | 0 | |a fre |d fre |d eng | |
102 | |a FR | ||
105 | |a y m ||||| | ||
106 | |a r | ||
200 | 1 | |a Identification et catégorisation automatique des entités nommées dans les textes français |b Texte imprimé |f Nordine Fourour |g sous la dir. de Béatrice Daille et Emmanuel Morin | |
210 | |a [S.l.] |c [s.n.] |d 2004 | ||
215 | |a 1 vol. (172 p.) |d 30 cm | ||
310 | |a Publication autorisée par le jury | ||
320 | |a Bibliogr. p.149-156 | ||
328 | |b Thèse doctorat |c Informatique |e Nantes |d 2004 | ||
330 | |a La reconnaissance des entités nommées (EN) reste un problème pour de nombreuses applications de Traitement Automatique des Langues Naturelles. Conséquemment à une étude linguistique permettant l'émergence de paramètres définitoires opérationnels liés au concept d'entité nommée, un état de l'art du domaine et une étude en corpus fondée sur des critères graphiques et référentiels, nous présentons Nemesis, un système d'identification et de catégorisation des EN du français, fondé sur l'analyse des évidences interne et externe réalisée à l'aide de lexiques de mots déclencheurs et de règles de réécriture et comportant une phase d'apprentissage. Dans cette version minimale, Nemesis atteint environ 90% en précision et 80% en rappel. Pour augmenter le rappel, nous proposons différents modules optionnels (examen d'un contexte encore plus large et utilisation du Web comme source de nouveaux contextes) et une étude pour la réalisation d'un module de désambiguïsation et d'apprentissage de règles. | ||
330 | |a Named Entity (NE) Recognition is a recurring problem in the different domain of Natural Language Processing. As a result of, a linguistic investigation allowing to set-up operational parameters defining the concept of named entity, a state of art of the domain, and a corpus investigation using referential and graphical criteria, we present Nemesis - a French named entity recognizer. This system analyzes the internal and external evidences by using grammar rules and trigger word lexicons, and includes a learning process. With these processes, Nemesis performance achieves about 90% of precision and 80% of recall. To increase the recall, we put forward optional modules (analysis of the wide context and utilization of the Web as a source of new contexts) and investigate in setting up a disambiguation and grammar rules inference module. | ||
606 | |3 PPN027985830 |a Traitement automatique du langage naturel |3 PPN027253139 |x Thèses et écrits académiques |2 rameau | ||
686 | |a 004 |2 TEF | ||
700 | 1 | |3 PPN088798003 |a Fourour |b Nordine |f 1977-... |4 070 | |
702 | 1 | |3 PPN060702435 |a Daille |b Béatrice |4 727 | |
702 | 1 | |3 PPN06701092X |a Morin |b Emmanuel |f 1971-.... |4 727 | |
712 | 0 | 2 | |3 PPN026403447 |a Université de Nantes |c 1962-2021 |4 295 |
712 | 0 | 2 | |3 PPN033124884 |a Université de Nantes |b Faculté des sciences et des techniques |4 985 |
712 | 0 | 2 | |3 PPN068720513 |a École doctorale sciences et technologies de l'information et des matériaux |c Nantes |4 996 |
801 | 3 | |a FR |b Abes |c 20171204 |g AFNOR | |
979 | |a SCI | ||
930 | |5 441092104:237517450 |b 441092104 |j u | ||
998 | |a 415519 |