Modèles graphiques probabilistes pour l'estimation de densité en grande dimensionbTexte imprimé : applications du principe Perturb & Combine pour les mélanges d'arbres

Dans les applications actuelles, le nombre de variables continue d'augmenter, ce qui rend difficile l'estimation de densité. En effet, le nombre de paramètres nécessaire pour l'estimation croit exponentiellement par rapport à la dimension du problème. Les modèles graphiques probabilis...

Description complète

Enregistré dans:
Détails bibliographiques
Egalement en ligne : En ligne Via Modèles graphiques probabilistes pour l'estimation de densité en grande dimensionbTexte imprimé
Auteur principal : Ammar Kessentini Sourour (Auteur)
Collectivités auteurs : Université de Nantes Faculté des sciences et des techniques (Autre partenaire associé à la thèse), Université de Nantes 1962-2021 (Organisme de soutenance), École doctorale Sciences et technologies de l'information et mathématiques Nantes (Organisme de soutenance)
Autres auteurs : Leray Philippe (Directeur de thèse)
Format : Thèse ou mémoire
Langue : français
Titre complet : Modèles graphiques probabilistes pour l'estimation de densité en grande dimensionbTexte imprimé : applications du principe Perturb & Combine pour les mélanges d'arbres / Sourour Ammar Kessentini; sous la direction de Philippe Leray
Publié : [S.l.] : [s.n.] , 2010
Description matérielle : 1 vol. (183 f.)
Condition d'utilisation et de reproduction : Publication autorisée par le jury
Note de thèse : Thèse de doctorat : Informatique : Nantes : 2010
Sujets :
Documents associés : Autre format: Modèles graphiques probabilistes pour l'estimation de densité en grande dimensionbTexte imprimé
Particularités de l'exemplaire : BU Sciences, Ex. 1 :
Titre temporairement indisponible à la communication

LEADER 06026cam a2200481 4500
001 PPN156091437
003 http://www.sudoc.fr/156091437
005 20240829055200.0
029 |a FR  |b 2010NANT2082 
035 |a (OCoLC)1247740192 
100 |a 20111107d2010 k y|frey0103 ba 
101 0 |a fre  |d fre  |d eng  |2 639-2 
102 |a FR 
105 |a ||||m 00||| 
106 |a r 
181 |6 z01  |c txt  |2 rdacontent 
181 1 |6 z01  |a i#  |b xxxe## 
182 |6 z01  |c n  |2 rdamedia 
182 1 |6 z01  |a n 
200 1 |a Modèles graphiques probabilistes pour l'estimation de densité en grande dimensionbTexte imprimé  |e applications du principe Perturb & Combine pour les mélanges d'arbres  |f Sourour Ammar Kessentini  |g sous la direction de Philippe Leray 
210 |a [S.l.]  |c [s.n.]  |d 2010 
215 |a 1 vol. (183 f.)  |c ill.  |d 30 cm 
316 |5 441092104:436049198  |a Titre temporairement indisponible à la communication 
320 |a Bibliogr. f. 157-168 
328 |b Thèse de doctorat  |c Informatique  |e Nantes  |d 2010 
330 |a Dans les applications actuelles, le nombre de variables continue d'augmenter, ce qui rend difficile l'estimation de densité. En effet, le nombre de paramètres nécessaire pour l'estimation croit exponentiellement par rapport à la dimension du problème. Les modèles graphiques probabilistes fournissent une aide non négligeable pour lutter contre ce problème en fournissant une factorisation de la loi jointe mais souffrent d'un problème de passage à l'échelle. Le problème de grande dimension s'accentue du fait que le nombre d'observations avec lequel on effectue l'estimation de densité n'augmente pas dans les mêmes proportions, et reste même extrêmement faible dans certains domaines d'applications. La factorisation de la loi jointe s'avère non suffisante pour effectuer une estimation de densité de qualité lorsqu'il y a très peu de données. Le principe du Perturb & Combine, initialement appliqué en classification, permet de lutter contre ce genre de problèmes. Dans le cadre de cette thèse, nous proposons un algorithme générique d'estimation de densité en appliquant le principe du Perturb et Combine à une famille de modèles graphiques probabilistes "simples" , les structures arborescentes "manipulables" avec une complexité au pire quadratique. Plusieurs variantes de cet algorithme sont proposées en exploitant à deux niveaux le principe de perturbation : perturbation de la génération des modèles simples et perturbation des données d'apprentissage. Les expérimentations effectuées lors de ce travail montrent que nos premières approches sont concluantes en ce qui concerne la qualité d'approximation, pour une complexité algorithmique quadratique encore insuffisante en grande dimension. Notre seconde contribution concerne donc une nouvelle application du principe de perturbation, permettant d'arriver à une complexité algorithmique proche du quasi-linéaire pour une même qualité d'approximation. 
330 |a The dimensionality of current applications increases which makes the density estimation a difficult task. Indeed, the needed number of parameters to make estimation grows exponentially with respect to the dimension of the problem. Probabilistic graphical models can be used to solve this problem by providing a factorization of the joint distribution, but they suffer from a problem of scalability. The problem of high dimensional spaces is accentuated by the number of observations used to perform density estimation witch is not increased in the same proportions, and even remains extremely law in some applications. Factorization of the joint distribution is not sufficient to perform good density estimation with sparse data. The Perturb and Combine framework, first explored in classification, provide solutions for such problems. In this work, we explore and propose a generic algorithm for density estimation by applying the Perturb and Combine principle to a reduced family of simple probabilistic graphical models. These tree structures we proposed to use can be "manipulated" with at worst a quadratic complexity. Several variants of this algorithm are proposed by exploiting the Perturb and Combine principle according to two levels : perturbation of the tree generating procedure and perturbation of the learning dataset. Our initial approaches are conclusive regarding the quality of approximation, with a quadratic computational complexity, still insufficient in high dimensional spaces. Our second contribution concerns therefore a new application of the Perturb and Combine principle, which allows attending almost quasi-linear computational complexity, for the same quality of approximation. 
371 1 |a Publication autorisée par le jury 
452 | |0 226600475  |t Modèles graphiques probabilistes pour l'estimation de densité en grande dimensionbTexte imprimé  |o applications du principe Perturb & Combine pour les mélanges d'arbres  |f Sourour Ammar Kessentini  |d 2011  |c Villeurbanne  |n [CCSD] 
541 | |a Probabilistic graphical models for density estimation in high dimensional spaces : application of the Perturb & Combine principle with the mixtures  |z eng 
608 |3 PPN027253139  |a Thèses et écrits académiques  |2 rameau 
610 2 |a Estimation de densité  |a Modèles graphiques probabilistes  |a Perturb & Combine  |a Données éparses 
686 |a 004  |2 TEF 
700 1 |3 PPN156090538  |a Ammar Kessentini  |b Sourour  |f 1982-....  |4 070 
702 1 |3 PPN116302011  |a Leray  |b Philippe  |c informaticien  |4 727 
712 0 2 |3 PPN033124884  |a Université de Nantes  |b Faculté des sciences et des techniques  |4 985 
712 0 2 |3 PPN026403447  |a Université de Nantes  |c 1962-2021  |4 295 
712 0 2 |3 PPN134103211  |a École doctorale Sciences et technologies de l'information et mathématiques  |c Nantes  |4 295 
801 3 |a FR  |b Abes  |c 20240503  |g AFNOR 
979 |a SCI 
930 |5 441092104:436049198  |b 441092104  |j g 
991 |5 441092104:436049198  |a Exemplaire modifié automatiquement le 18-07-2024 18:46 
998 |a 603770