Résumé de données en extraction de connaissances à partir des données (ECD) : application aux données relationnelles et textuelles

Les travaux présentés dans cette thèse ont été réalisés dans le cadre d'un contrat CNET JMINER, dont le but est l'étude de pré-traitement et post-traitements en extraction de connaissances à partir des données, appliqués aux lettres de réclamation de France Télécom. Les caractéristiques pa...

Full description

Saved in:
Bibliographic Details
Main Author : Gaumer Gaëtan (Auteur)
Corporate Authors : Université de Nantes 1962-2021 (Organisme de soutenance), Université de Nantes Faculté des sciences et des techniques (Autre partenaire associé à la thèse), École doctorale sciences et technologies de l'information et des matériaux Nantes (Ecole doctorale associée à la thèse)
Other Authors : Quafafou Mohamed (Directeur de thèse)
Format : Thesis
Language : français
Title statement : Résumé de données en extraction de connaissances à partir des données (ECD) : application aux données relationnelles et textuelles / Gaëtan Gaumer; sous la dir. de Mohamed Quafafou
Published : [S.l.] : [s.n.] , 2003
Physical Description : 179f.
Note de thèse : Thèse de doctorat : Informatique : Nantes : 2003
Availability : Publication autorisée par le jury
Subjects :
Description
Summary : Les travaux présentés dans cette thèse ont été réalisés dans le cadre d'un contrat CNET JMINER, dont le but est l'étude de pré-traitement et post-traitements en extraction de connaissances à partir des données, appliqués aux lettres de réclamation de France Télécom. Les caractéristiques particulières des données de cette application ont orienté nos travaux de recherche. Nous nous sommes tout d'abord intéressés aux problèmes liés à l'extraction de connaissances à partir de très importants volumes de données. Nous proposons, pour résoudre ces problèmes, de remplacer les données à traiter par un résumé de ces données possédant les mêmes caractéristiques. Cette proposition s'est concrétisée par le développement du logiciel CFSUMM, un système de création de résumés de données utilisant des mesures de similarités et d'indiscernabilités entre instances.Nous montrons pourquoi et comment les caractéristiques de ce logiciel le destine particulièrementà la réduction d'importants volumes de données, qu'ils soient issus de bases de données relationnelles ou d'indexation de documents non structurés (texte, html, etc)...
Bibliography : Bibliogr. f. 153-164