Association Rule Interactive Post-processing using Rule Schemas and Ontologies : ARIPSO

Cette thèse s'inscrit à la confluence de deux domaines actifs de recherche: l'Extraction de Connaissances à partir des Données - la fouille de Règles <l'Association, et l'ingénierie des Connaissances - les langages de représentation du Web Sémantique. L'usage de la techni...

Description complète

Enregistré dans:
Détails bibliographiques
Auteurs principaux : Marinica Claudia (Auteur), Guillet Fabrice Maître de conférences (Directeur de thèse), Aufaure Marie-Aude (Président du jury de soutenance), Briand Henri (Membre du jury), Kuntz-Cosperec Pascale (Membre du jury), Gandon Fabien (Rapporteur de la thèse), Ganascia Jean-Gabriel (Rapporteur de la thèse)
Collectivités auteurs : Université de Nantes 1962-2021 (Organisme de soutenance), École polytechnique de l'Université de Nantes (Organisme de soutenance), École doctorale Sciences et technologies de l'information et mathématiques Nantes (Organisme de soutenance), Laboratoire d Informatique de Nantes Atlantique (UMR 6241) Nantes (Ecole doctorale associée à la thèse)
Format : Thèse ou mémoire
Langue : anglais
Titre complet : Association Rule Interactive Post-processing using Rule Schemas and Ontologies : ARIPSO / Claudia Marinica; sous la direction de Fabrice Guillet
Publié : Nantes : Université de Nantes , 2010
Accès en ligne : Accès Nantes Université
Note sur l'URL : Accès réservé aux étudiants et personnels de l'Université de Nantes après authentification
Reproduction de : Reproduction numérique de l'original imprimé
Note de thèse : Reproduction de : Thèse de doctorat : Informatique : Nantes : 2010
Conditions d'accès : Accès en ligne sur authentification, réservé aux membres de l'établissement de soutenance.
Sujets :
Documents associés : Reproduction de: Association Rule Interactive Post-processing using Rule Schemas and Ontologies
Description
Résumé : Cette thèse s'inscrit à la confluence de deux domaines actifs de recherche: l'Extraction de Connaissances à partir des Données - la fouille de Règles This thesis is concerned with the merging of two active research domains: Knowledge Discovery in Databases - Association Rule Mining technique, and Knowledge Engineering - representation languages of Semantic Web. The usefulness of association rule technique is strongly limited by the huge amount and the low quality of delivered rules. To overcome this drawback, several methods have been proposed in the literature such as itemset concise representations, redundancy reduction, filtering, ranking and post-processing, and most of them are based on data structure. However, rule interestingness strongly depends on user knowledge and goals. In this context, it is crucial to help the user with an efficient technique to reduce the number of rules while keeping interesting ones. This work addresses two main issues: the integration of user knowledge in the discovery process and the interactivity with the user. The first issue requires an accurate and flexible formalism to express user knowledge such as ontologies in the Semantic Web. The second one proposes a more iterative mining process allowing the user to explore the rule space incrementally focusing on interesting rules. The main contributions of this work can be summarized as follows: (i) A model to represent user knowledge. First, we propose to represent user domain knowledge by means of ontologies. Second, we develop a new formalism, called "Rule Schema", which allows the user to define his/her expectations throughout ontology concepts. Last, we suggest the user a set of "mining Operators" to be applied over Rule Schemas. (ii) A new post-processing approach, ARJPSO. lt allows the user to reduce the volume of the discovered rules by keeping only the interesting rules. ARIPSO is an interactive process integrating user knowledge by means of the proposed model. The interactive loop allows at each step the user to change the provided information and to reiterate the post-processing phase. (iii) The implementation in post-processing of ARJPSO. The developed tool is complete and operational, and it implements all the functionalities described in the approach. An alternative implementation, without post-processing, was proposed (ARLIUS). It consists in an interactive local mining process. (iv) An experimental study analyzing the approach efficiency and the discovered rule quality. For this purpose, we used a large real-life database; for ARJPSO, the experimentation was carried out in complete cooperation with the domain expert. From an input set of nearly 400 thousand rules, for different scenarios, ARIPSO filtered between 3 and 200 rules validated by the expert
Variantes de titre : Post-traitement interactif de règles d association à l aide de schémas de règles d ontologies - ARIPSO
Notes : L'impression du document génère 208 p.
Ecole(s) Doctorale(s) : École doctorale sciences et technologies de l'information et de mathématiques (STIM) (Nantes)
Partenaire de recherche : Laboratoire d Informatique de Nantes Atlantique (UMR 6241) (LINA) (Nantes) (Laboratoire)
Autre(s) contribution(s) : Marie-Aude Aufaure (Président du jury) ; Henri Briand, Pascale Kuntz (Membre du jury) ; Fabien Gandon, Jean-Gabriel Ganascia (Rapporteurs)
Configuration requise : Un logiciel capable de lire un fichier au format PDF
Bibliographie : Bibliogr. p. 173-190, 225 réf.