Une architecture pour le résumé en ligne de données relationnelles et ses applications

Le travail présenté dans cette thèse s'inscrit dans une double orientation de recherche dont les objectifs sont d'une part la synthèse de données volumineuses sous forme d'un ensemble organisé de résumés, d'autre part les applications qui peuvent naître d'une telle synthèse....

Description complète

Enregistré dans:
Détails bibliographiques
Auteur principal : Saint-Paul Régis (Auteur)
Collectivités auteurs : Université de Nantes 1962-2021 (Organisme de soutenance), École doctorale sciences et technologies de l'information et des matériaux Nantes (Organisme de soutenance)
Autres auteurs : Mouaddib Noureddine (Directeur de thèse)
Format : Thèse ou mémoire
Langue : français
Titre complet : Une architecture pour le résumé en ligne de données relationnelles et ses applications / Régis Saint-Paul; sous la direction de Noureddine Mouaddib
Publié : [S.l.] : [s.n.] , 2005
Description matérielle : 1 vol. (XV-212 p.)
Note de thèse : Thèse doctorat : Informatique : Université de Nantes : 2005
Disponibilité : Publication autorisée par le jury
Sujets :
Description
Résumé : Le travail présenté dans cette thèse s'inscrit dans une double orientation de recherche dont les objectifs sont d'une part la synthèse de données volumineuses sous forme d'un ensemble organisé de résumés, d'autre part les applications qui peuvent naître d'une telle synthèse. Le processus de résumé envisagé s'appuie sur la théorie des sous-ensembles flous (Zadeh, 1965) pour proposer une représentation linguistique floue des données et permettre ainsi une prise en charge dans un cadre formel des données imparfaites au travers, en particulier, de l'extension possibiliste du modèle relationnel. Les résumés produits proposent ainsi une description d'un sous-ensemble de la base initiale au moyen d'un ensemble de descripteurs linguistiques flous. Le processus est conçu pour permettre une prise en compte incrémentale des modifications qui peuvent être faites sur la base de données résumée. La conception orientée message sur la base de services web du système lui permet d'optimiser les besoins en mémoire vive dans le cadre du traitement de volumes importants et favorise son intégration dans les systèmes d'information existants. Des tests effectués sur des données de taille importante ont permis de valider la capacité du système à passer à l'échelle et de vérifier sa complexité algorithmique linéaire. Enfin, des applications d'aide à la décision, de navigation dans une base de données multimédia, de prototypage ou de classification, conduites sur des données réelles et volumineuses ont pu mettre en évidence l'utilité des résumés produits.
This work is intended to provide some contribution in two research area: large database summarization through fuzzy set-based techniques and the application perspectives offered by the produced summaries. The summarization process is based on Zadeh's fuzzy set theory which offers a strong theoretical model for the representation of uncertain or non-precise data, especially through the possibilistic extension of the relational database model. Produced summaries exhibit a description of subsets of the original database at different granularity levels. The process is designed to be able to incrementally take into account the update operations that are performed on the summarized database. Its message-oriented architecture, based on Web-Services, allows the process to optimize memory consumption as well as processing cost. This open architecture is also designed to facilitate the summarization system integration within existing database management systems. Tests, performed on very large datasets, confirmed the process scalability and its linear time complexity. Applications in decision making as well as multimedia databases, based on real-life datasets, also confirm the practical usefulness of the produced summaries.
Bibliographie : Bibliogr. p. 179-192