Probabilistic relational models : learning and evaluation The relational Bayesian networks case

L apprentissage statistique relationnel est apparu au début des années 2000 comme un nouveau domaine de l apprentissage machine permettant de raisonner d une manière efficace et robuste directement sur des structures de données relationnelles. Plusieurs méthodes classiques de fouille de données ont...

Description complète

Enregistré dans:
Détails bibliographiques
Auteurs principaux : Ben Ishak Mouna (Auteur), Leray Philippe (Directeur de thèse, Membre du jury), Ben Amor Nahla (Directeur de thèse, Membre du jury), Elouedi Zied (Président du jury de soutenance, Membre du jury), Rouveirol Céline (Rapporteur de la thèse, Membre du jury), Darmont Jérôme (Rapporteur de la thèse, Membre du jury), Wuillemin Pierre-Henri (Membre du jury)
Collectivités auteurs : Université Nantes-Angers-Le Mans - COMUE 2009-2015 (Organisme de soutenance), École polytechnique de l'Université de Nantes (Organisme de soutenance), Université de Tunis 1958-1988 (Organisme de soutenance), École doctorale Sciences et technologies de l'information et mathématiques Nantes (Organisme de soutenance), Laboratoire d Informatique de Nantes Atlantique (UMR 6241) Nantes (Ecole doctorale associée à la thèse), Laboratoire de Recherche Opérationnelle, de Décision et de Contrôle des procédés (LARODEC) Le Bardo, Tunisie (Laboratoire associé à la thèse)
Format : Thèse ou mémoire
Langue : anglais
Titre complet : Probabilistic relational models : learning and evaluation : The relational Bayesian networks case / Mouna Ben Ishak; sous la direction de Philippe Leray et Nahla Ben Amor
Publié : Nantes : Université de Nantes , 2015
Ville de diffusion : Nom du diffuseur , Date de diffusion
Accès en ligne : Accès Nantes Université
Note de thèse : Reproduction de : Thèse de doctorat : Informatique : Nantes : 2015
Reproduction de : Thèse de doctorat : Informatique : Le Bardo (Tunisie) : 2015
Sujets :
Documents associés : Reproduction de: Probabilistic relational models
Description
Résumé : L apprentissage statistique relationnel est apparu au début des années 2000 comme un nouveau domaine de l apprentissage machine permettant de raisonner d une manière efficace et robuste directement sur des structures de données relationnelles. Plusieurs méthodes classiques de fouille de données ont été adaptées pour application directe sur des données relationnelles. Les réseaux Bayésiens Relationnels (RBR) présentent une extension des réseaux Bayésiens (RB) dans ce contexte. Pour se servir de ce modèle, il faut tout d abord le construire : la structure et les paramètres du RBR doivent être définis à la main ou être appris à partir d une instance de base de données relationnelle. L apprentissage de la structure reste toujours le problème le plus compliqué puisqu il se situe dans la classe des problèmes NP-difficiles. Les méthodes d apprentissage de la structure des RBR existantes sont inspirées des méthodes classique de l apprentissage de la structure des RB. Pour pouvoir juger la qualité d un algorithme d apprentissage de la structure d un RBR, il faut avoir des données de test et des mesures d évaluation. Pour les RB les données sont souvent issues de benchmarks existants. Sinon, des processus de génération aléatoire du modèle et des données sont mis en oeuvre. Les deux pratiques sont quasi absentes pour les RBR. De plus, les mesures d évaluation de la qualité d un algorithme d apprentissage de la structure d un RBR ne sont pas encore établies. Dans ce travail de thèse, nous proposons deux contributions majeures. I)Une approche de génération de RBR allant de la génération du schéma relationnel, de la structure de dépendance et des tables de probabilités à l instanciation de ce modèle et la population d une base de données relationnelle. Nous discutons aussi de l adaptation des mesures d évaluation des algorithmes d apprentissage de RBs dans le contexte relationnel et nous proposons de nouvelles mesures d évaluation. II) Une approche hybride pour l apprentissage de la structure des RBR. Cette approche présente une extension de l algorithme MMHC dans le contexte relationnel. Nous menons une étude expérimentale permettant de comparer ce nouvel algorithme d apprentissage avec les approches déjà existantes.
Statistical relational learning (SRL) appeared in the early 2000s as a new field of machine learning that enables effective and robust reasoning about relational data structures. Several conventional data mining methods have been adapted for direct application to relational data representation. Relational Bayesian Networks (RBNs) extend Bayesian networks (BNs) to a relational data mining context. To use this model, it is first necessary to build it: the structure and parameters of a RBN must be set manually or learned from a relational observational dataset. Learning the structure remains the most complicated issue as it is a NP-hard problem. Existing approaches for RBNs structure learning are inspired from classical methods of learning the structure of BNs. The evaluation of learning approaches requires testing datasets and evaluation measurements. For BNs, datasets are usually sampled from real known networks. Otherwise, processes to randomly generate the model and the data are already established. Both practices are almost absent for RBR. Moreover, metrics to evaluate a RBN structure learning algorithm are not yet proposed. This thesis provides two major contributions. I) A synthetic approach allowing to generate random RBNs from scratch. The proposed method allows to generate RBNs as well as synthetic relational data from a randomly generated relational schema and a random set of probabilistic dependencies. Also, we discuss the adaptation of the evaluation metrics of BNs structure learning algorithms to the relational context and we propose new relational evaluation measurements. II) A hybrid approach for RBNs structure learning. This approach presents an extension of the MMHC algorithm in the relational context. We present an experimental study to compare this new learning algorithm with the state-of-the-art approaches.
Variantes de titre : Les modèles probalistes relationnels : apprentissage et évaluation. Cas des réseaux bayésiens relationnels@
Notes : Thèse soutenue en cotutelle
L'impression du document génère 177 p.
Ecole(s) Doctorale(s) : École doctorale sciences et technologies de l'information et de mathématiques (STIM) (Nantes)
Partenaire de recherche : Laboratoire d Informatique de Nantes Atlantique (UMR 6241) (LINA) (Nantes) (Laboratoire)
Partenaire de recherche : Laboratoire de Recherche Opérationnelle, de Décision et de Contrôle des procédés (LARODEC) (Le Bardo, Tunisie ) (Laboratoire)
Autre(s) contribution(s) : Zied Elouedi (Président du jury) ; Pierre-Henry Wuillemin (Membre du jury) ; Céline Rouveirol, Jérôme Darmont (Rapporteurs)
Configuration requise : Un logiciel capable de lire un fichier au format pdf
Bibliographie : Bibliogr. p.143-150