Association Rule Interactive Post-processing using Rule Schemas and Ontologies : ARIPSO
Cette thèse s'inscrit à la confluence de deux domaines actifs de recherche: l'Extraction de Connaissances à partir des Données - la fouille de Règles <l'Association, et l'ingénierie des Connaissances - les langages de représentation du Web Sémantique. L'usage de la techni...
Enregistré dans:
Auteurs principaux : | , , , , , , |
---|---|
Collectivités auteurs : | , , , |
Format : | Thèse ou mémoire |
Langue : | anglais |
Titre complet : | Association Rule Interactive Post-processing using Rule Schemas and Ontologies : ARIPSO / Claudia Marinica; sous la direction de Fabrice Guillet |
Publié : |
2010 |
Description matérielle : | 1 vol. (190 p.) |
Note de thèse : | Thèse de doctorat : Informatique : Nantes : 2010 |
Conditions d'accès : | Accès en ligne sur authentification, réservé aux membres de l'établissement de soutenance. |
Sujets : | |
Documents associés : | Reproduit comme:
Association Rule Interactive Post-processing using Rule Schemas and Ontologies |
LEADER | 08751nam a2200589 4500 | ||
---|---|---|---|
001 | PPN268247439 | ||
003 | http://www.sudoc.fr/268247439 | ||
005 | 20240321055500.0 | ||
029 | |a FR |b 2010NANT2067 | ||
035 | |a (OCoLC)1371503847 | ||
100 | |a 20230302d2010 k y0frey0103 ba | ||
101 | 0 | |a eng |d fre |d eng |2 639-2 | |
102 | |a FR | ||
105 | |a a ma 001yy | ||
106 | |a r | ||
181 | |6 z01 |c txt |2 rdacontent | ||
181 | 1 | |6 z01 |a i# |b xxxe## | |
182 | |6 z01 |c n |2 rdamedia | ||
182 | 1 | |6 z01 |a n | |
183 | |6 z01 |a nga |2 RDAfrCarrier | ||
200 | 1 | |a Association Rule Interactive Post-processing using Rule Schemas and Ontologies |e ARIPSO |f Claudia Marinica |g sous la direction de Fabrice Guillet | |
214 | 1 | |d 2010 | |
215 | |a 1 vol. (190 p.) |c ill. |d 30 cm | ||
314 | |a Ecole(s) Doctorale(s) : École doctorale sciences et technologies de l'information et de mathématiques (STIM) (Nantes) | ||
314 | |a Partenaire de recherche : Laboratoire d Informatique de Nantes Atlantique (UMR 6241) (LINA) (Nantes) (Laboratoire) | ||
314 | |a Autre(s) contribution(s) : Marie-Aude Aufaure (Président du jury) ; Henri Briand, Pascale Kuntz (Membre du jury) ; Fabien Gandon, Jean-Gabriel Ganascia (Rapporteurs) | ||
320 | |a Bibliogr. p. 173-190, 225 réf. | ||
328 | |b Thèse de doctorat |c Informatique |e Nantes |d 2010 | ||
330 | |a Cette thèse s'inscrit à la confluence de deux domaines actifs de recherche: l'Extraction de Connaissances à partir des Données - la fouille de Règles <l'Association, et l'ingénierie des Connaissances - les langages de représentation du Web Sémantique. L'usage de la technique de fouille de règles d'association est limité par les grands volumes de règles découvertes, ainsi que par leur faible qualité. Ainsi, plusieurs méthodes de réduction ont été proposées dans la littérature comme les représentations concises de motifs, la réduction de la redondance, le filtrage, le ranking et le post-traitement, et la plupart sont basées sur la structure des données. Toutefois, l'intérêt des règles dépend fortement des connaissances et des objectifs de l'utilisateur. Dans ce contexte, il est essentiel d'aider le décideur avec une technique efficace de réduction du nombre de règles tout en gardant les règles intéressantes. Ce travail aborde deux problèmes essentiels: l'intégration des connaissances de l'utilisateur dans le processus de fouille, et l'interactivité avec l'utilisateur. Le premier problème exige un formalisme précis et flexible pour représenter les connaissances, comme les ontologies du Web Sémantique. Le second propose un processus d'exploration plus itératif permettant à l'utilisateur de fouiller l'espace de règles progressivement en se concentrant sur les règles intéressantes. Les principales contributions de ce travail peuvent être résumées comme suit : (i) Un modèle de représentation de connaissances. Premièrement, nous proposons de représenter les connaissances du domaine de l'utilisateur à l'aide d'ontologies. Deuxièmement, nous introduisons un nouveau formalisme, nommé "Schéma de Règles", qui permet à l'utilisateur de définir ses attentes à travers des concepts ontologiques. Enfin, nous suggérons à l'utilisateur un ensemble d'"Opérateurs de fouille" à appliquer sur les schémas. (ii) Une nouvelle approche de post-traitement, ARJPSO. Elle permet à l'utilisateur de réduire le volume de règles en ne gardant que les règles qui l'intéressent. ARJPSO est un processus interactif intégrant les connaissances de l'utilisateur sous le modèle proposé. A chaque étape, la boucle interactive permet à l'utilisateur de modifier les informations fournies et de réitérer la phase de post-traitement. (iii) L'implémentation en post-traitement d'ARJPSO. L'outil développé est complet et opérationnel, et il met en œuvre toutes les fonctionnalités décrites dans l'approche. Une implémentation alternative, sans post-traitement, a été proposée (ARLIUS). Elle est constituée d'un processus d'exploration locale et interactive. (iv) L'étude expérimentale analysant l'efficacité de l'approche et la qualité des règles découvertes. À cet effet, nous avons utilisé une base de données réelle, et, pour ARJPSO, l'étude a été réalisée en coopération avec l'expert du domaine. A partir d'un jeu de données de près de 400 milliers de règles, ARJPSO a filtré, selon différents scénarios, entre 3 et 200 règles validées par l'expert |2 4e de couverture | ||
330 | |a This thesis is concerned with the merging of two active research domains: Knowledge Discovery in Databases - Association Rule Mining technique, and Knowledge Engineering - representation languages of Semantic Web. The usefulness of association rule technique is strongly limited by the huge amount and the low quality of delivered rules. To overcome this drawback, several methods have been proposed in the literature such as itemset concise representations, redundancy reduction, filtering, ranking and post-processing, and most of them are based on data structure. However, rule interestingness strongly depends on user knowledge and goals. In this context, it is crucial to help the user with an efficient technique to reduce the number of rules while keeping interesting ones. This work addresses two main issues: the integration of user knowledge in the discovery process and the interactivity with the user. The first issue requires an accurate and flexible formalism to express user knowledge such as ontologies in the Semantic Web. The second one proposes a more iterative mining process allowing the user to explore the rule space incrementally focusing on interesting rules. The main contributions of this work can be summarized as follows: (i) A model to represent user knowledge. First, we propose to represent user domain knowledge by means of ontologies. Second, we develop a new formalism, called "Rule Schema", which allows the user to define his/her expectations throughout ontology concepts. Last, we suggest the user a set of "mining Operators" to be applied over Rule Schemas. (ii) A new post-processing approach, ARJPSO. lt allows the user to reduce the volume of the discovered rules by keeping only the interesting rules. ARIPSO is an interactive process integrating user knowledge by means of the proposed model. The interactive loop allows at each step the user to change the provided information and to reiterate the post-processing phase. (iii) The implementation in post-processing of ARJPSO. The developed tool is complete and operational, and it implements all the functionalities described in the approach. An alternative implementation, without post-processing, was proposed (ARLIUS). It consists in an interactive local mining process. (iv) An experimental study analyzing the approach efficiency and the discovered rule quality. For this purpose, we used a large real-life database; for ARJPSO, the experimentation was carried out in complete cooperation with the domain expert. From an input set of nearly 400 thousand rules, for different scenarios, ARIPSO filtered between 3 and 200 rules validated by the expert |2 4e de couverture | ||
371 | 0 | |a Accès en ligne sur authentification, réservé aux membres de l'établissement de soutenance | |
456 | | | |0 268247595 |t Association Rule Interactive Post-processing using Rule Schemas and Ontologies |o ARIPSO |f Claudia Marinica |c Nantes |n Université de Nantes |d 2010 | |
541 | | | |a Post-traitement interactif de règles d association à l aide de schémas de règles d ontologies - ARIPSO |z fre | |
606 | |3 PPN097640883 |a Ontologies (informatique) |2 rameau | ||
606 | |3 PPN076053547 |a Web sémantique |2 rameau | ||
608 | |3 PPN027253139 |a Thèses et écrits académiques |2 rameau | ||
686 | |a 004 |2 TEF | ||
700 | 1 | |3 PPN168974290 |a Marinica |b Claudia |f 1981-.... |4 070 | |
701 | 1 | |3 PPN12044898X |a Guillet |b Fabrice |c Maître de conférences |4 727 | |
701 | 1 | |3 PPN13093478X |a Aufaure |b Marie-Aude |f 19..-.... |4 956 | |
701 | 1 | |3 PPN069862265 |a Briand |b Henri |4 555 | |
701 | 1 | |3 PPN103904638 |a Kuntz-Cosperec |b Pascale |4 555 | |
701 | 1 | |3 PPN076340074 |a Gandon |b Fabien |f 1975-.... |4 958 | |
701 | 1 | |3 PPN029767067 |a Ganascia |b Jean-Gabriel |f 1955-.... |4 958 | |
711 | 0 | 2 | |3 PPN026403447 |a Université de Nantes |c 1962-2021 |4 295 |
711 | 0 | 2 | |3 PPN068449399 |a École polytechnique de l'Université de Nantes |4 295 |
711 | 0 | 2 | |3 PPN134103211 |a École doctorale Sciences et technologies de l'information et mathématiques |c Nantes |4 295 |4 996 |
711 | 0 | 2 | |3 PPN137062508 |a Laboratoire d Informatique de Nantes Atlantique (UMR 6241) |c Nantes |4 295 |4 981 |
801 | 3 | |a FR |b Abes |c 20230302 |g AFNOR | |
930 | |5 441092104:779100964 |b 441092104 |j u | ||
979 | |a SCI | ||
998 | |a 939272 |