Summary management in P2P systems

Le but de cette thèse est de contribuer au développement des techniques de localisation et de description de données dans des environnements P2P. Au niveau de la couche application, nous nous concentrons sur l exploitatoin des sémantiques qui peuvent être capturées à partir des données partagées. Ce...

Description complète

Enregistré dans:
Détails bibliographiques
Auteur principal : Hayek Rabab (Auteur)
Collectivités auteurs : Université de Nantes 1962-2021 (Organisme de soutenance), Université de Nantes Faculté des sciences et des techniques (Autre partenaire associé à la thèse), École doctorale sciences et technologies de l'information et des matériaux Nantes (Ecole doctorale associée à la thèse)
Autres auteurs : Valduriez Patrick (Directeur de thèse), Raschia Guillaume (Directeur de thèse)
Format : Thèse ou mémoire
Langue : anglais
Titre complet : Summary management in P2P systems / Rabab Hayek; sous la direction de Patrick Valduriez; co-encadrant Guillaume Raschia
Publié : [S.l.] : [s.n.] , 2009
Description matérielle : 1 vol. (152 p.)
Note de thèse : Thèse doctorat : Informatique : Nantes : 2009
Disponibilité : Publication autorisée par le jury
Sujets :
LEADER 06508cam a2200433 4500
001 PPN148103650
003 http://www.sudoc.fr/148103650
005 20240531154500.0
029 |a FR  |b 2009NANT2066 
035 |a (OCoLC)758863277 
100 |a 20101125d2009 k y0frey0103 ba 
101 0 |a eng  |d fre  |d eng 
102 |a FR 
105 |a a m 000yy 
106 |a r 
200 1 |a Summary management in P2P systems  |b Texte imprimé  |f Rabab Hayek  |g sous la direction de Patrick Valduriez  |g co-encadrant Guillaume Raschia 
210 |a [S.l.]  |c [s.n.]  |d 2009 
215 |a 1 vol. (152 p.)  |c ill.  |d 30 cm 
300 |a Thèse rédigée en anglais avec un résumé étendu en français de 24 pages 
310 |a Publication autorisée par le jury 
320 |a Bibliogr. p. 141-152 
328 |b Thèse doctorat  |c Informatique  |e Nantes  |d 2009 
330 |a Le but de cette thèse est de contribuer au développement des techniques de localisation et de description de données dans des environnements P2P. Au niveau de la couche application, nous nous concentrons sur l exploitatoin des sémantiques qui peuvent être capturées à partir des données partagées. Ces sémantiques peuvent améliorer l efficacité de recherche, ainsi que permettre des requêtes complexes. A cet effet, nous présentons une technique originale d indexation de données dans les systèmes P2P qui se base sur les résumés linguistiques. Nos résumés sont des vues synthétiques et multidimensionnelles qui supportent la localisation des données pertinentes en se basant sur leur contenu. Plus intéressant, ils fournissent des représentations intelligibles de données, qui peuvent renvoyer des réponses approximatives à des requêtes d utilisateur. Au niveau de la couche réseau P2P, nous nous concentrons sur l exploitation des caractéristiques de la topologie, à savoir les caractéristiques de leur regroupement (clustering). Des informations sur le clustering du réseau P2P peuvent être utilisées pour réduire le trafic de réseau produit par le mécanisme de flooding. Ceci permet d améliorer l exécution des systèmes P2P, indépendamment de l emploi des index de données à la couche application, puisque le mécanisme de flooding représente toujours un bloc constitutif fondamental des systèmes non structurés P2P. Dans cette thèse, nous présentons un bref état de l art sur les systèmes P2P de partage de données P2P et nous nous concentrons sur l évolution des systèmes simples de partages des fichiers vers des systèmes de gestion des données. En second lieu, nous proposons une solution pour la gestion des résumés de données dans des systèmes P2P. Nous définissons un modèle approprié et des techniques efficaces pour la création et la mise à jour des résumés. Nous discutons également le traitement des requêtes dans le cadre des résumés. Troisièmement, nous proposons une technique de recherche basée sur clustering implémentée au dessus d un protocole de custering selon la connectivité des noeuds. Nous nous concentrons sur la réduction des messages de requêtes redondants qui surchargent inutilement le système. Nous avons validé nos solutions par la simulation et les résultats montrent une bonne performance 
330 |a The goal of this thesis is to contribute to the development of data localization and summarization techniques in P2P environments. At the application layer, we focus on exploiting the semantics that can be captured from the shared data. These semantics can improve the search efficiency, and allow for more query facilities. To this end, we introduce a novel data indexing technique into P2P systems that relies on linguistic summarization. Our summaries are synthetic, multidimensional views that support locating relevant data based on their content. More interestingly, they provide intelligible data representations which may return approximate answers for user queries. At the P2P network layer, we focus on exploiting the characteristics of the overlay topology, namely its clustering features, in order to reduce the traffic overhead generated by flooding-based mechanisms. This allows to improve the performance of P2P systems, irrespective of the employment of techniques relying on data semantics at the application layer. To this end, we define a cluster-based search technique which is implemented over a connectivity-based clustering protocol. A connectivity-based clustering protocol aims to discover the natural organization of nodes, based on their connectivity. Thus, it delimits the boundaries of non-overlapping subgraphs (i.e. clusters) which are loosely connected, and in which nodes are highly connected. In this thesis, we first survey P2P data sharing systems. We focus on the evolution from simple file-sharing systems with limited functionalities, to Peer Data Management Systems (PDMSs) that support advanced applications with more sophisticated data management techniques. Second, we propose a solution for managing linguistic summaries in P2P systems. We define an appropriate summary model and efficient techniques for summary creation and maintenance.We also discuss query processing in the context of summaries. Third, we propose a cluster-based search technique on top of existing connectivity-based clustering protocols. We focus on reducing redundant query messages which unnecessarily overload the system. We validated our solutions through simulation and the results show good performance 
541 | |a Résumés de données dans les systèmes P2P  |z fre 
606 |3 PPN056573391  |a Poste à poste (Internet)  |3 PPN027253139  |x Thèses et écrits académiques  |2 rameau 
606 |3 PPN053489136  |a Réseaux locaux domestiques (informatique)  |3 PPN027253139  |x Thèses et écrits académiques  |2 rameau 
606 |3 PPN027575918  |a Bases de données  |x Gestion  |3 PPN027253139  |x Thèses et écrits académiques  |2 rameau 
686 |a 004  |2 TEF 
700 1 |3 PPN14809970X  |a Hayek  |b Rabab  |f 1983-....  |4 070 
702 1 |3 PPN028314417  |a Valduriez  |b Patrick  |4 727 
702 1 |3 PPN070662886  |a Raschia  |b Guillaume  |4 727 
712 0 2 |3 PPN026403447  |a Université de Nantes  |c 1962-2021  |4 295 
712 0 2 |3 PPN033124884  |a Université de Nantes  |b Faculté des sciences et des techniques  |4 985 
712 0 2 |3 PPN068720513  |a École doctorale sciences et technologies de l'information et des matériaux  |c Nantes  |4 996 
801 3 |a FR  |b Abes  |c 20171204  |g AFNOR 
979 |a SCI 
930 |5 441092104:410037281  |b 441092104  |j u 
998 |a 578483