Association Rule Interactive Post-processing using Rule Schemas and Ontologies : ARIPSO

Cette thèse s'inscrit à la confluence de deux domaines actifs de recherche: l'Extraction de Connaissances à partir des Données - la fouille de Règles <l'Association, et l'ingénierie des Connaissances - les langages de représentation du Web Sémantique. L'usage de la techni...

Description complète

Enregistré dans:
Détails bibliographiques
Auteurs principaux : Marinica Claudia (Auteur), Guillet Fabrice Maître de conférences (Directeur de thèse), Aufaure Marie-Aude (Président du jury de soutenance), Briand Henri (Membre du jury), Kuntz-Cosperec Pascale (Membre du jury), Gandon Fabien (Rapporteur de la thèse), Ganascia Jean-Gabriel (Rapporteur de la thèse)
Collectivités auteurs : Université de Nantes 1962-2021 (Organisme de soutenance), École polytechnique de l'Université de Nantes (Organisme de soutenance), École doctorale Sciences et technologies de l'information et mathématiques Nantes (Organisme de soutenance), Laboratoire d Informatique de Nantes Atlantique (UMR 6241) Nantes (Ecole doctorale associée à la thèse)
Format : Thèse ou mémoire
Langue : anglais
Titre complet : Association Rule Interactive Post-processing using Rule Schemas and Ontologies : ARIPSO / Claudia Marinica; sous la direction de Fabrice Guillet
Publié : 2010
Description matérielle : 1 vol. (190 p.)
Note de thèse : Thèse de doctorat : Informatique : Nantes : 2010
Conditions d'accès : Accès en ligne sur authentification, réservé aux membres de l'établissement de soutenance.
Sujets :
Documents associés : Reproduit comme: Association Rule Interactive Post-processing using Rule Schemas and Ontologies
LEADER 08751nam a2200589 4500
001 PPN268247439
003 http://www.sudoc.fr/268247439
005 20240321055500.0
029 |a FR  |b 2010NANT2067 
035 |a (OCoLC)1371503847 
100 |a 20230302d2010 k y0frey0103 ba 
101 0 |a eng  |d fre  |d eng  |2 639-2 
102 |a FR 
105 |a a ma 001yy 
106 |a r 
181 |6 z01  |c txt  |2 rdacontent 
181 1 |6 z01  |a i#  |b xxxe## 
182 |6 z01  |c n  |2 rdamedia 
182 1 |6 z01  |a n 
183 |6 z01  |a nga  |2 RDAfrCarrier 
200 1 |a Association Rule Interactive Post-processing using Rule Schemas and Ontologies  |e ARIPSO  |f Claudia Marinica  |g sous la direction de Fabrice Guillet 
214 1 |d 2010 
215 |a 1 vol. (190 p.)  |c ill.  |d 30 cm 
314 |a Ecole(s) Doctorale(s) : École doctorale sciences et technologies de l'information et de mathématiques (STIM) (Nantes) 
314 |a Partenaire de recherche : Laboratoire d Informatique de Nantes Atlantique (UMR 6241) (LINA) (Nantes) (Laboratoire) 
314 |a Autre(s) contribution(s) : Marie-Aude Aufaure (Président du jury) ; Henri Briand, Pascale Kuntz (Membre du jury) ; Fabien Gandon, Jean-Gabriel Ganascia (Rapporteurs) 
320 |a Bibliogr. p. 173-190, 225 réf. 
328 |b Thèse de doctorat  |c Informatique  |e Nantes  |d 2010 
330 |a Cette thèse s'inscrit à la confluence de deux domaines actifs de recherche: l'Extraction de Connaissances à partir des Données - la fouille de Règles <l'Association, et l'ingénierie des Connaissances - les langages de représentation du Web Sémantique. L'usage de la technique de fouille de règles d'association est limité par les grands volumes de règles découvertes, ainsi que par leur faible qualité. Ainsi, plusieurs méthodes de réduction ont été proposées dans la littérature comme les représentations concises de motifs, la réduction de la redondance, le filtrage, le ranking et le post-traitement, et la plupart sont basées sur la structure des données. Toutefois, l'intérêt des règles dépend fortement des connaissances et des objectifs de l'utilisateur. Dans ce contexte, il est essentiel d'aider le décideur avec une technique efficace de réduction du nombre de règles tout en gardant les règles intéressantes. Ce travail aborde deux problèmes essentiels: l'intégration des connaissances de l'utilisateur dans le processus de fouille, et l'interactivité avec l'utilisateur. Le premier problème exige un formalisme précis et flexible pour représenter les connaissances, comme les ontologies du Web Sémantique. Le second propose un processus d'exploration plus itératif permettant à l'utilisateur de fouiller l'espace de règles progressivement en se concentrant sur les règles intéressantes. Les principales contributions de ce travail peuvent être résumées comme suit : (i) Un modèle de représentation de connaissances. Premièrement, nous proposons de représenter les connaissances du domaine de l'utilisateur à l'aide d'ontologies. Deuxièmement, nous introduisons un nouveau formalisme, nommé "Schéma de Règles", qui permet à l'utilisateur de définir ses attentes à travers des concepts ontologiques. Enfin, nous suggérons à l'utilisateur un ensemble d'"Opérateurs de fouille" à appliquer sur les schémas. (ii) Une nouvelle approche de post-traitement, ARJPSO. Elle permet à l'utilisateur de réduire le volume de règles en ne gardant que les règles qui l'intéressent. ARJPSO est un processus interactif intégrant les connaissances de l'utilisateur sous le modèle proposé. A chaque étape, la boucle interactive permet à l'utilisateur de modifier les informations fournies et de réitérer la phase de post-traitement. (iii) L'implémentation en post-traitement d'ARJPSO. L'outil développé est complet et opérationnel, et il met en œuvre toutes les fonctionnalités décrites dans l'approche. Une implémentation alternative, sans post-traitement, a été proposée (ARLIUS). Elle est constituée d'un processus d'exploration locale et interactive. (iv) L'étude expérimentale analysant l'efficacité de l'approche et la qualité des règles découvertes. À cet effet, nous avons utilisé une base de données réelle, et, pour ARJPSO, l'étude a été réalisée en coopération avec l'expert du domaine. A partir d'un jeu de données de près de 400 milliers de règles, ARJPSO a filtré, selon différents scénarios, entre 3 et 200 règles validées par l'expert  |2 4e de couverture 
330 |a This thesis is concerned with the merging of two active research domains: Knowledge Discovery in Databases - Association Rule Mining technique, and Knowledge Engineering - representation languages of Semantic Web. The usefulness of association rule technique is strongly limited by the huge amount and the low quality of delivered rules. To overcome this drawback, several methods have been proposed in the literature such as itemset concise representations, redundancy reduction, filtering, ranking and post-processing, and most of them are based on data structure. However, rule interestingness strongly depends on user knowledge and goals. In this context, it is crucial to help the user with an efficient technique to reduce the number of rules while keeping interesting ones. This work addresses two main issues: the integration of user knowledge in the discovery process and the interactivity with the user. The first issue requires an accurate and flexible formalism to express user knowledge such as ontologies in the Semantic Web. The second one proposes a more iterative mining process allowing the user to explore the rule space incrementally focusing on interesting rules. The main contributions of this work can be summarized as follows: (i) A model to represent user knowledge. First, we propose to represent user domain knowledge by means of ontologies. Second, we develop a new formalism, called "Rule Schema", which allows the user to define his/her expectations throughout ontology concepts. Last, we suggest the user a set of "mining Operators" to be applied over Rule Schemas. (ii) A new post-processing approach, ARJPSO. lt allows the user to reduce the volume of the discovered rules by keeping only the interesting rules. ARIPSO is an interactive process integrating user knowledge by means of the proposed model. The interactive loop allows at each step the user to change the provided information and to reiterate the post-processing phase. (iii) The implementation in post-processing of ARJPSO. The developed tool is complete and operational, and it implements all the functionalities described in the approach. An alternative implementation, without post-processing, was proposed (ARLIUS). It consists in an interactive local mining process. (iv) An experimental study analyzing the approach efficiency and the discovered rule quality. For this purpose, we used a large real-life database; for ARJPSO, the experimentation was carried out in complete cooperation with the domain expert. From an input set of nearly 400 thousand rules, for different scenarios, ARIPSO filtered between 3 and 200 rules validated by the expert  |2 4e de couverture 
371 0 |a Accès en ligne sur authentification, réservé aux membres de l'établissement de soutenance 
456 | |0 268247595  |t Association Rule Interactive Post-processing using Rule Schemas and Ontologies  |o ARIPSO  |f Claudia Marinica  |c Nantes  |n Université de Nantes  |d 2010 
541 | |a Post-traitement interactif de règles d association à l aide de schémas de règles d ontologies - ARIPSO  |z fre 
606 |3 PPN097640883  |a Ontologies (informatique)  |2 rameau 
606 |3 PPN076053547  |a Web sémantique  |2 rameau 
608 |3 PPN027253139  |a Thèses et écrits académiques  |2 rameau 
686 |a 004  |2 TEF 
700 1 |3 PPN168974290  |a Marinica  |b Claudia  |f 1981-....  |4 070 
701 1 |3 PPN12044898X  |a Guillet  |b Fabrice  |c Maître de conférences  |4 727 
701 1 |3 PPN13093478X  |a Aufaure  |b Marie-Aude  |f 19..-....  |4 956 
701 1 |3 PPN069862265  |a Briand  |b Henri  |4 555 
701 1 |3 PPN103904638  |a Kuntz-Cosperec  |b Pascale  |4 555 
701 1 |3 PPN076340074  |a Gandon  |b Fabien  |f 1975-....  |4 958 
701 1 |3 PPN029767067  |a Ganascia  |b Jean-Gabriel  |f 1955-....  |4 958 
711 0 2 |3 PPN026403447  |a Université de Nantes  |c 1962-2021  |4 295 
711 0 2 |3 PPN068449399  |a École polytechnique de l'Université de Nantes  |4 295 
711 0 2 |3 PPN134103211  |a École doctorale Sciences et technologies de l'information et mathématiques  |c Nantes  |4 295  |4 996 
711 0 2 |3 PPN137062508  |a Laboratoire d Informatique de Nantes Atlantique (UMR 6241)  |c Nantes  |4 295  |4 981 
801 3 |a FR  |b Abes  |c 20230302  |g AFNOR 
930 |5 441092104:779100964  |b 441092104  |j u 
979 |a SCI 
998 |a 939272