Approches algébriques pour la gestion et l exploitation de partitions sur des jeux de données

L essor des méthodes d analyse de données dans des contextes toujours plus variés nécessite la conception de nouveaux outils permettant la gestion et la manipulation des données extraites. La construction de résumés est alors couramment structurée sous la forme de partitions d ensembles dont la mani...

Description complète

Enregistré dans:
Détails bibliographiques
Auteur principal : Dumonceaux Frédéric (Auteur)
Collectivités auteurs : Université de Nantes 1962-2021 (Organisme de soutenance), École polytechnique de l'Université de Nantes (Autre partenaire associé à la thèse), École doctorale Sciences et technologies de l'information et mathématiques Nantes (Organisme de soutenance), Laboratoire d Informatique de Nantes Atlantique (UMR 6241) Nantes (Ecole doctorale associée à la thèse)
Autres auteurs : Gelgon Marc (Directeur de thèse)
Format : Thèse ou mémoire
Langue : français
Titre complet : Approches algébriques pour la gestion et l exploitation de partitions sur des jeux de données / Frédéric Dumonceaux; sous la direction de Marc Gelgon
Publié : [Lieu de publication inconnu] : [éditeur inconnu] , 2015
Description matérielle : 1 vol. (220 p.)
Note de thèse : Thèse de doctorat : Informatique et applications : Nantes : 2015
Disponibilité : Publication autorisée par le jury
Sujets :
Documents associés : Reproduit comme: Approches algébriques pour la gestion et l exploitation de partitions sur des jeux de données
Description
Résumé : L essor des méthodes d analyse de données dans des contextes toujours plus variés nécessite la conception de nouveaux outils permettant la gestion et la manipulation des données extraites. La construction de résumés est alors couramment structurée sous la forme de partitions d ensembles dont la manipulation dépend à la fois du contexte applicatif et de leurs propriétés algébriques. Dans un premier temps, nous proposons de modéliser la gestion des résultats de requêtes d agrégation dans un cube OLAP à l aide d un calcul algébrique sur des partitions. Nous mettons en évidence l intérêt d une telle démarche par le gain de temps et d espace observé pour produire ces résultats. Nous traitons par la suite le cas de la modélisation du consensus de partitions où nous soulignons les difficultés propres à sa construction en l absence de propriétés qui régissent la combinaison des partitions. Nous proposons donc d approfondir l étude des propriétés algébriques de la structure du treillis des partitions, en vue d en améliorer la compréhension et par conséquent de produire de nouvelles procédures pour l élaboration du consensus. En guise de conclusion, nous proposons la modélisation et une mise en œuvre concrète d opérateurs sur des partitions génériques et nous livrons diverses expériences, propres à souligner l intérêt de leur usage conceptuel et opérationnel.
The rise of data analysis methods in many growing contexts requires the design of new tools, enabling management and handling of extracted data. Summarization process is then often formalized through the use of set partitions whose handling depends on applicative context and inherent properties. Firstly, we suggest to model the management of aggregation query results over a data cube within the algebraic framework of the partition lattice. We highlight the value of such an approach with a view to minimize both required space and time to generate those results. We then deal with the consensus of partitions issue in which we emphasize challenges related to the lack of properties that rule partitions combination. The idea put forward is to deepen algebraic properties of the partition lattice for the purpose of strengthening its understanding and generating new consensus functions. As a conclusion, we propose the modelling and implementation of operators defined over generic partitions and we carry out some experiences allowing to assert the benefit of their conceptual and operational use.
Variantes de titre : Algebraic approaches for management and handling of set partitions over datasets
Notes : Ecole(s) Doctorale(s) : École doctorale sciences et technologies de l'information et de mathématiques (STIM) (Nantes)
Partenaire de recherche : Laboratoire d Informatique de Nantes Atlantique (UMR 6241) (LINA) (Nantes) (Laboratoire)
Autre(s) contribution(s) : Amedeo Napoli (Président du jury) ; Sofian Maabout, Marie-Christine Rousset (Rapporteurs) ; Jin-Kao Hao (Membre du jury)
Bibliographie : Bibliogr. p.211-220