Facilitating reuse on the web data

Le Web des données est un ensemble de données liées qui peuvent être interrogées et réutilisées à l aide de moteurs de requêtes fédérées. Pour protéger les jeux de données, les licences renseignent leurs conditions d utilisation. Cependant, choisir une licence conforme n est pas toujours aisé. En ef...

Description complète

Enregistré dans:
Détails bibliographiques
Auteurs principaux : Moreau Benjamin (Auteur), Serrano Alvarado Patricia (Directeur de thèse), Desmontils Emmanuel (Directeur de thèse), Molli Pascal (Président du jury de soutenance), Villata Serena (Rapporteur de la thèse), Curé Olivier (Rapporteur de la thèse), Pucheral Philippe (Membre du jury), Garlatti Serge (Membre du jury), Amann Bernd (Membre du jury)
Collectivités auteurs : Université de Nantes 1962-2021 (Organisme de soutenance), École doctorale Mathématiques et sciences et technologies de l'information et de la communication Rennes (Ecole doctorale associée à la thèse), Laboratoire des Sciences du Numérique de Nantes (Laboratoire associé à la thèse)
Format : Thèse ou mémoire
Langue : anglais
Titre complet : Facilitating reuse on the web data / Benjamin Moreau; sous la direction de Patricia Serrano Alvarado et de Emmanuel Desmontils
Publié : 2020
Accès en ligne : Accès Nantes Université
Note sur l'URL : Accès au texte intégral
Note de thèse : Thèse de doctorat : Informatique : Nantes : 2020
Sujets :
Description
Résumé : Le Web des données est un ensemble de données liées qui peuvent être interrogées et réutilisées à l aide de moteurs de requêtes fédérées. Pour protéger les jeux de données, les licences renseignent leurs conditions d utilisation. Cependant, choisir une licence conforme n est pas toujours aisé. En effet, pour protéger la réutilisation de plusieurs jeux de données, il est nécessaire de prendre en considération la compatibilité entre leurs licences. Pour faciliter la réutilisation, les moteurs de requêtes fédérées devraient respecter les licences. Dans ce contexte, nous nous intéressons à deux problèmes (1) comment calculer la relation de compatibilité entre des licences, et (2) comment respecter les licences pendant le traitement de requêtes fédérées. Pour le premier problème, nous proposons CaLi, un modèle capable d ordonner partiellement n importe quel ensemble de licences selon leur compatibilité. Pour le second problème, nous proposons FLiQue, un moteur de requête fédéré respectant les licences. FLiQue utilise CaLi pour détecter les conflits de compatibilité entre licences et assure que le résultat d une requête fédérée respecte les licences. Dans le cadre de cette thèse, nous proposons également trois approches ODMTP, EvaMap et le SemanticBot ayant pour objectif de faciliter l intégration de données au web des données.
The Web of Data is a web of interlinked datasets that can be queried and reused through federated query engines. To protect their datasets, data producers use licenses to specify their condition of reuse. But, choosing a compliant license is not easy. Licensing reuse of several licensed datasets must consider compatibility among licenses. To facilitate reuse, federated query engines should preserve license compliance. To do so, we focus on two problems (1) how to compute compatibility relations among licenses, and (2) how to ensure license compliance during federated query processing. To the first problem, we propose CaLi, a model that partially orders any set of licenses in terms of compatibility. To the second problem, we propose FLiQue, a license-aware federated query processing strategy. FLiQue uses CaLi to detect license compatibility conflicts and ensures that the result of a federated query preserves license compliance. Within the scope of this thesis, we also propose three approaches ODMTP, EvaMap, and the SemanticBot that aim to facilitate the integration of datasets to the Web of Data.
Variantes de titre : Faciliter la Réutilisation sur le Web des Données
Notes : Titre provenant de l'écran-titre
Ecole(s) Doctorale(s) : École doctorale Mathématiques et sciences et technologies de l'information et de la communication (Rennes)
Partenaire(s) de recherche : Laboratoire des Sciences du Numérique de Nantes (Laboratoire)
Autre(s) contribution(s) : Pascal Molli (Président du jury) ; Philippe Pucheral, Serge Garlatti, Bernd Amann (Membre(s) du jury) ; Serena Villata, Olivier Curé (Rapporteur(s))
Configuration requise : Configuration requise : un logiciel capable de lire un fichier au format : PDF