Médiation de données sémantique dans SenPeer, un système pair-à-pair de gestion de données

La société de l'information demande un accès complet et efficace à un ensemble d'informations qui sont souvent hétérogènes etdistribuées. Dans le but d'un partage efficace cette information, plusieurs solutions techniques ont été proposées. L'infrastructure Pair-à-Pair (P2P) est...

Description complète

Enregistré dans:
Détails bibliographiques
Auteur principal : Faye David Célestin (Auteur)
Collectivités auteurs : Université de Nantes 1962-2021 (Organisme de soutenance), Université de Saint-Louis Sénégal (Organisme de cotutelle), École doctorale sciences et technologies de l'information et des matériaux Nantes (Ecole doctorale associée à la thèse), Laboratoire d Informatique de Nantes Atlantique (UMR 6241) Nantes (Organisme de soutenance)
Autres auteurs : Valduriez Patrick (Directeur de thèse), Niane Mary Teuw (Directeur de thèse)
Format : Thèse ou mémoire
Langue : français
Titre complet : Médiation de données sémantique dans SenPeer, un système pair-à-pair de gestion de données / David Célestin Faye; Patrick Valduriez et Mary Teuw Niane, directeurs de thèse
Publié : [S.l.] : [s.n.] , 2007
Description matérielle : 1 vol. (141 p.)
Note de thèse : Thèse doctorat : Informatique : Nantes : 2007
Thèse doctorat : Informatique : Saint-Louis (Sénégal) : 2007
Sujets :
Description
Résumé : La société de l'information demande un accès complet et efficace à un ensemble d'informations qui sont souvent hétérogènes etdistribuées. Dans le but d'un partage efficace cette information, plusieurs solutions techniques ont été proposées. L'infrastructure Pair-à-Pair (P2P) est un paradigme émergent et offrant de nouvelles opportunités pour la mise en place de systèmes distribués à grande échelle. D'autre part, le concept de base de données distribuée a été introduit dans le but d'organiser une collection multiple de bases de donne es logiquement liées et distribuées sur un réseau d'ordinateurs. Récemment, les systèmes P2P de gestion de données communément appelés PDMS (Peer DataManagement System) ont vu le jour. Ils combinent les avantages des systèmes P2P avec ceux des bases de données distribuées. Dans le but de contribuer à la problématique de la gestion de données dans un contexte P2P, nous proposons le PDMS SenPeer. SenPeer suit une topologie super-pair basée sur l'organisation des pairs en communautés sémantiques en fonction de leurs thèmes d'intérêts. Pour faciliter l'échange de données entre pairs nous établissons des processus de découverte de correspondances sémantiques et de reformulation de requêtes en présence de plusieurs modèles de données. Ces correspondances sémantique, en combinaison avec les schémas des pairs sont à la base d'une topologie sémantique au dessus du réseau physique et utilisée pour un routage efficace des requêtes. Les requêtes sont échangées à travers un format commun d'échange de requête et un processus d'optimisation distribué permet de choisir le meilleur plan d'exécution de la requête en fonction des caractéristiques du PDMS. Une validation expérimentale par la mise en place d'un simulateur permet d'affirmer l'utilité et la performance des techniques proposées.
The so-called information society needs a complete and efficient access to the available information which is often heterogeneous and distributed. In order to make information sharing efficient, some technical solutions have been proposed. The concept of distributed database has been introduced in order to organize a collection of multiple and logically bound databases spread across a computer network. The Peer-to-Peer (P2P) infrastructure is an emergent paradigm offering new opportunities for the conception of large scale distributed systems. Recently the P2P data management systems (Peer Data Management System have appeared). They combine the advantages of the P2P systems with those of the distributed databases. In order to contribute to the problem of data management in a P2P context, we propose the SenPeer PDMS. SenPeer is based on a super-peer topology organizing the peers into semantic communities according to their topics of interests. To facilitate data exchange in the presence of heterogeneous schemas and multiple data models, we establish semantic mapping discovery and query reformulation processes. The semantic mappings, in combination with the peer schemas are the basis of a semantic overlay, on top on the underlying physical network and which is used for intelligent query routing. Queries are exchanged through a query exchange format. A distributed optimisation process has the responsibility of finding the best execution plan for the query by taking into account the data distribution and the characteristics of the PDMS. We describe an experimental validation through a simulator to illustrate the feasibility and the performance of the proposed techniques.
Bibliographie : 118 références bibliographiques