Détection de problèmes de qualité dans les ontologies construites automatiquement à partir de textes

La démocratisation de l utilisation des ontologies dans des domaines très variés a stimulé le développement d approches proposant différents degrés d automatisation du processus de construction d une ontologie. Cependant, malgré le réel intérêt de ces approches, parfois les résultats obtenus peuvent...

Description complète

Enregistré dans:
Détails bibliographiques
Auteurs principaux : Gherasim Toader (Auteur), Kuntz-Cosperec Pascale (Directeur de thèse), Berio Giuseppe (Directeur de thèse), Harzallah Mounira (Directeur de thèse), Despres Sylvie (Président du jury de soutenance), Soulé-Dupuy Chantal (Rapporteur de la thèse), Ranwez Sylvie (Rapporteur de la thèse)
Collectivités auteurs : Université de Nantes 1962-2021 (Organisme de soutenance), Laboratoire d Informatique de Nantes Atlantique (UMR 6241) Nantes (Laboratoire associé à la thèse), École polytechnique de l'Université de Nantes (Organisme de soutenance), École doctorale Sciences et technologies de l'information et mathématiques Nantes (Organisme de soutenance)
Format : Thèse ou mémoire
Langue : français
Titre complet : Détection de problèmes de qualité dans les ontologies construites automatiquement à partir de textes / Toader Gherasim; sous la direction de Pascale kuntz ; co-directeur Giuseppe Berio ; encadrant Mounira Harzallah
Publié : [Lieu de publication inconnu] : [éditeur inconnu] , 2013
Accès en ligne : Accès Nantes Université
Note de thèse : Reproduction de : Thèse de doctorat : Informatique et applications : Nantes : 2013
Sujets :
Documents associés : Reproduction de: Détection de problèmes de qualité dans les ontologies construites automatiquement à partir de textes
Description
Résumé : La démocratisation de l utilisation des ontologies dans des domaines très variés a stimulé le développement d approches proposant différents degrés d automatisation du processus de construction d une ontologie. Cependant, malgré le réel intérêt de ces approches, parfois les résultats obtenus peuvent être d une faible qualité. L objectif des travaux présentés dans cette thèse est de contribuer à l amélioration de la qualité des ontologies construites automatiquement à partir de textes. Nos principales contributions sont : (1) une démarche pour la comparaison des approches, (2) une typologie des problèmes qui affectent la qualité les ontologies, et (3) une première réflexion sur l automatisation de la détection des problèmes. Notre démarche de comparaison des approches comporte trois étapes complémentaires : (1) sur la base de leur degré de complétude et d automatisation ; (2) puis sur la base de leurs caractéristiques techniques et fonctionnelles, et (3) expérimentalement par comparaison de leurs résultats avec une ontologie construite manuellement. La typologie proposée organise les problèmes de qualité selon deux dimensions : les erreurs versus les situations indésirables et les aspects logiques versus les aspects sociaux. Notre typologie contient 24 classes de problèmes qui recouvrent, en les complétant, les problèmes décrits dans la littérature. Pour la détection automatique nous avons recensé quelques unes des méthodes existantes pour chaque problème de notre typologie et nous avons mis en évidence les problèmes qui semblent encore ouverts. Et, nous avons proposé une heuristique pour un problème qui apparaît fréquemment dans nos expérimentations (étiquettes polysémiques).
The growing use of ontologies in a variety of application areas has stimulated the development of approaches proposing different degrees of automation of the ontology construction process. However, despite the real interest of these approaches, sometimes their results are of low quality. The aim of the work presented in this thesis is to contribute to the improvement of the quality of ontologies constructed automatically from texts. Our main contributions are : (1) a method for the comparison of the approaches, (2) a typology of problems that affect the quality of ontologies, and (3) a first reflection on automating the detection of quality problems. Our method for the comparison of approaches consists of three complementary steps : (1) on the basis of their degree of automation and completeness, (2) on the basis of their technical and functional characteristics, and (3) experimentally by comparing their results with a manually constructed ontology. The proposed typology organizes the quality problems according to two dimensions : errors versus unsuitable situations and logical aspects versus social aspects. Our typology contains 24 classes of problems that cover and complement the problems described in the literature. Concerning the automatic detection we have inventoried some of the existing methods for each problem in our typology and we have highlighted the problems for which the automatic detection remains an open issue. We have also proposed a heuristic for the detection of a quality problem that appears frequently in our experimentations (polysemic labels).
Variantes de titre : Detection of quality problems in ontologies constructed automatically from texts
Notes : Ecole(s) Doctorale(s) : École doctorale sciences et technologies de l'information et de mathématiques (STIM) (Nantes)
Autre(s) contribution(s) : Sylvie Despres (Présidente du jury) ; Chantal Soule-Dupuy, Sylvie Ranwez (Rapporteurs)
Bibliographie : Références bibliographiques