AROMA : une méthode pour la découverte d'alignements orientés entre ontologies à partir de règles d'association

Ce travail de thèse s'inscrit à l'intersection des deux domaines de recherche que sont l'extraction des connaissances dans les données (ECD) et de l'ingénierie des connaissances. Plus précisément, en nous s'appuyant sur la combinaison des travaux menés, d'une part sur l...

Description complète

Enregistré dans:
Détails bibliographiques
Auteur principal : David Jérôme (Auteur)
Collectivités auteurs : Université de Nantes 1962-2021 (Organisme de soutenance), Université de Nantes Faculté des sciences et des techniques (Organisme de soutenance), École doctorale sciences et technologies de l'information et des matériaux Nantes (Organisme de soutenance), Centrale Nantes 1991-.... (Organisme de soutenance), École nationale supérieure des mines Nantes 1990-2016 (Organisme de soutenance), Laboratoire d Informatique de Nantes Atlantique (UMR 6241) Nantes (Organisme de soutenance)
Autres auteurs : Briand Henri (Directeur de thèse), Guillet Fabrice (Directeur de thèse)
Format : Thèse ou mémoire
Langue : français
Titre complet : AROMA : une méthode pour la découverte d'alignements orientés entre ontologies à partir de règles d'association / Jérôme David; sous la direction d'Henri Briand; co-encadrant Fabrice Guillet
Publié : [S.l.] : [s.n.] , 2007
Description matérielle : 1 vol. (X-173 f.)
Note de thèse : Thèse de doctorat : Informatique : Nantes : 2007
Disponibilité : Publication autorisée par le jury
Sujets :
LEADER 07035cam a2200421 4500
001 PPN120453665
005 20240425055200.0
029 |a FR  |b 2007NANT2073 
100 |a 20080109d2007 k y0frey0103 ba 
101 0 |a fre  |d fre  |d eng 
102 |a FR 
105 |a a ma 001yy 
106 |a r 
200 1 |a AROMA : une méthode pour la découverte d'alignements orientés entre ontologies à partir de règles d'association  |b Texte imprimé  |f Jérôme David  |g sous la direction d'Henri Briand  |g co-encadrant Fabrice Guillet 
210 |a [S.l.]  |c [s.n.]  |d 2007 
215 |a 1 vol. (X-173 f.)  |c ill.  |d 30 cm 
310 |a Publication autorisée par le jury 
320 |a Bibliogr. f. 163-173. Index 
328 |b Thèse de doctorat  |c Informatique  |e Nantes  |d 2007 
330 |a Ce travail de thèse s'inscrit à l'intersection des deux domaines de recherche que sont l'extraction des connaissances dans les données (ECD) et de l'ingénierie des connaissances. Plus précisément, en nous s'appuyant sur la combinaison des travaux menés, d'une part sur l'alignement des ontologies, et d'autre part sur la fouille de règles d'association, nous avons proposé une nouvelle méthode d'alignement d'ontologies associées à des corpus textuels (taxonomies, hiérarchies documentaires, thésaurus, répertoires ou catalogues Web), appelée AROMA (\emph{Association Rule Matching Approach}). Dans la littérature, la plupart des travaux traitant des méthodes d'alignement d'ontologies ou de schémas s'appuient sur une définition intentionnelle des schémas et utilisent des relations basées sur des mesures de similarité qui ont la particularité d'être symétriques (équivalences). Afin d'améliorer les méthodes d'alignement, et en nous inspirant des travaux sur la découverte de règles d'association, des mesures de qualité associées, et sur l'analyse statistique implicative, nous proposons de découvrir des appariements asymétriques (implications) entre ontologies. Ainsi, la contribution principale de cette thèse concerne la conception d'une méthode d'alignement extensionnelle et orientée basée sur la découverte des implications significatives entre deux hiérarchies plantées dans un corpus textuel. Notre méthode d'alignement se décompose en trois phases successives. La phase de prétraitement permet de préparer les ontologies à l'alignement en les redéfinissant sur un ensemble commun de termes extraits des textes et sélectionnés statistiquement. La phase de fouille extrait un alignement implicatif entre hiérarchies. La dernière phase de post-traitement des résultats permet de produire des alignements consistants et minimaux (selon un critère de redondance). Les principaux apports de cette thèse sont : (1) Une modélisation de l'alignement étendue pour la prise en compte de l'implication. Nous définissons les notions de fermeture et couverture d'un alignement permettant de formaliser la redondance et la consistance d'un alignement. Nous étudions également la symétricité et les cardinalités d'un alignement. (2) La réalisation de la méthode AROMA et d'une interface d'aide à la validation d'alignements. (3) Une extension d'un modèle d'évaluation sémantique pour la prise en compte de la présence d'implications dans un alignement. (4) L'étude du comportement et de la performance d'AROMA sur différents types de jeux de tests (annuaires Web, catalogues et ontologies au format OWL) avec une sélection de six mesures de qualité. Les résultats obtenus sont prometteurs car ils montrent la complémentarité de notre approche par rapport à celles existantes. 
330 |a This thesis deals with Knowledge Engineering and Knowledge Discovery in Databases (KDD). More precisely, by using the association rule model, we propose a new matching method designed to match ontologies provided with textual data (i.e. thesaurus, web directories, catalogues etc.). In the literature, most ontology or schema matching approaches rely on similarity measures and, consequently their vast majority is restricted to finding equivalence relations only. In this context, we propose to use the asymmetric nature of the association rule model, of interestingness measures, and of the implicative statistical analysis in order to overcome the restrictions of only-similarity based approaches. The main contribution of this thesis is the introduction of an extensional and asymmetric matching method based on the discovery of significant implication rules between two textual hierarchies. Our method follows a three-step KDD process: First, the pre-processing step reindexes ontologies on a common set of terms extracted from textual data; Next, the association rule discovery aims at finding a set of implications between hierarchies; And finally, the post-processing step allows to provide consistant and minimal (non-redundant) alignments. The other four contributions of this thesis are : (1) an extended model of alignment dealing with implication. We define the notions of the closure and the minimal cover of an alignment so as formalize its redundancy and consistancy. We also discuss the symmetricity and cardinality of alignements. (2) the implementations of AROMA and AROMAViz supporting the validation of alignements. (3) an extension of a semantic evaluation model taking the implications into account. (4) the study of the efficiency and the behaviour of AROMA obtained on several benchmarks (web directories, catalogues and OWL ontologies) with the use of a selection of six interestingness measures. The obtained results are promising because they underly the complementarity of our approach with existing ones. 
541 | |a AROMA : a method for the discovery of implicative alignments between ontologies based on the association rule model  |z eng 
606 |3 PPN031162169  |a Acquisition des connaissances (systèmes experts)  |3 PPN027220842  |x Bases de données  |3 PPN027253139  |x Thèses et écrits académiques  |2 rameau 
606 |3 PPN027655652  |a Ontologie  |3 PPN027253139  |x Thèses et écrits académiques  |2 rameau 
606 |3 PPN076053547  |a Web sémantique  |3 PPN027253139  |x Thèses et écrits académiques  |2 rameau 
700 1 |3 PPN120453398  |a David  |b Jérôme  |f 1980-...  |4 070 
702 1 |3 PPN069862265  |a Briand  |b Henri  |4 727 
702 1 |3 PPN12044898X  |a Guillet  |b Fabrice  |c Maître de conférences  |4 727 
712 0 2 |3 PPN026403447  |a Université de Nantes  |c 1962-2021  |4 295 
712 0 2 |3 PPN033124884  |a Université de Nantes  |b Faculté des sciences et des techniques  |4 295 
712 0 2 |3 PPN068720513  |a École doctorale sciences et technologies de l'information et des matériaux  |c Nantes  |4 295 
712 0 2 |3 PPN03063525X  |a Centrale Nantes  |c 1991-....  |4 295 
712 0 2 |3 PPN033236720  |a École nationale supérieure des mines  |c Nantes  |c 1990-2016  |4 295 
712 0 2 |3 PPN137062508  |a Laboratoire d Informatique de Nantes Atlantique (UMR 6241)  |c Nantes  |4 295 
801 3 |a FR  |b Abes  |c 20100521  |g AFNOR 
930 |5 441092104:324379323  |b 441092104  |a 2007 NANT 2073  |j u 
979 |a SCI 
998 |a 519466