Probabilistic relational models learning from graph databases
Historiquement, les Modèles Graphiques Probabilistes (PGMs) sont une solution d apprentissage à partir des données incertaines et plates, appelées aussi données propositionnelles ou représentations attribut-valeur. Au début des années 2000, un grand intérêt a été adressé au traitement des données re...
Auteurs principaux : | , , , , , , |
---|---|
Collectivités auteurs : | , , , , |
Format : | Thèse ou mémoire |
Langue : | anglais |
Titre complet : | Probabilistic relational models learning from graph databases / Marwa El Abri; sous la direction de Philippe Leray et de Nadia Essoussi |
Publié : |
2018 |
Accès en ligne : |
Accès Nantes Université
|
Note sur l'URL : | Accès au texte intégral |
Note de thèse : | Thèse de doctorat : Informatique et applications : Nantes : 2018 Thèse de doctorat : Informatique et applications : Université de Tunis : 2018 |
Sujets : |
Résumé : | Historiquement, les Modèles Graphiques Probabilistes (PGMs) sont une solution d apprentissage à partir des données incertaines et plates, appelées aussi données propositionnelles ou représentations attribut-valeur. Au début des années 2000, un grand intérêt a été adressé au traitement des données relationnelles présentant un grand nombre d objets participant à des différentes relations. Les Modèles Probabilistes Relationnels (PRMs) présentent une extension des PGMs pour le contexte relationnel. Avec l évolution rapide issue de l internet, des innovations technologiques et des applications web, les données sont devenues de plus en plus variées et complexes. D où l essor du Big Data. Plusieurs types de bases de données ont été créés pour s adapter aux nouvelles caractéristiques des données, dont les plus utilisés sont les bases de données graphe. Toutefois, tous les travaux d apprentissage des PRMs sont consacrés à apprendre à partir des données bien structurées et stockées dans des bases de données relationnelles. Les bases de données graphe sont non structurées et n obéissent pas à un schéma bien défini. Les arcs entre les noeuds peuvent avoir des différentes signatures. En effet, les relations qui ne correspondent pas à un modèle ER peuvent exister dans l'instance de base de données. Ces relations sont considérées comme des exceptions. Dans ce travail de thèse, nous nous intéressons à ce type de bases de données. Nous étudions aussi deux types de PRMs à savoir, Direct Acyclic Probabilistic Entity Relationship (DAPER) et chaines de markov logiques (MLNs). Nous proposons deux contributions majeures. Premièrement, Une approche d apprentissage des DAPERs à partir des bases de données graphe partiellement structurées. Une deuxième approche consiste à exploiter la logique de premier ordre pour apprendre les DAPERs en utilisant les MLNs pour prendre en considération les exceptions qui peuvent parvenir lors de l apprentissage. Nous menons une étude expérimentale permettant de comparer nos méthodes proposées avec les approches déjà existantes. Historically, Probabilistic Graphical Models (PGMs) are a solution for learning from uncertain and flat data, also called propositional data or attributevalue representations. In the early 2000s, great interest was addressed to the processing of relational data which includes a large number of objects participating in different relations. Probabilistic Relational Models (PRMs) present an extension of PGMs to the relational context. With the rise of the internet, numerous technological innovations and web applications are driving the dramatic increase of various and complex data. Consequently, Big Data has emerged. Several types of data stores have been created to manage this new data, including the graph databases. Recently there has been an increasing interest in graph databases to model objects and interactions. However, all PRMs structure learning use wellstructured data that are stored in relational databases. Graph databases are unstructured and schema-free data stores. Edges between nodes can have various signatures. Since, relationships that do not correspond to an ER model could be depicted in the database instance. These relationships are considered as exceptions. In this thesis, we are interested by this type of data stores. Also, we study two kinds of PRMs namely, Direct Acyclic Probabilistic Entity Relationship (DAPER) and Markov Logic Networks (MLNs). We propose two significant contributions. First, an approach to learn DAPERs from partially structured graph databases. A second approach consists to benefit from first-order logic to learn DAPERs using MLN framework to take into account the exceptions that are dropped during DAPER learning. We are conducting experimental studies to compare our proposed methods with existing approaches. |
---|---|
Variantes de titre : | Apprentissage des modèles probabilistes relationnels à partir des bases de données graphe |
Notes : | Thèse soutenue en co-tutelle Titre provenant de l'écran-titre Ecole(s) Doctorale(s) : École doctorale Mathématiques et sciences et technologies de l'information et de la communication (Rennes) Partenaire(s) de recherche : Université Bretagne Loire (COMUE), Laboratoire des Sciences du Numérique de Nantes (Laboratoire) Autre(s) contribution(s) : Nahla Ben Amor (Président du jury) ; Emmanuel Mazer (Membre(s) du jury) ; Simon de Givry, Nicolas Lachiche (Rapporteur(s)) |
Configuration requise : | Configuration requise : un logiciel capable de lire un fichier au format : PDF |