Affichage MARC: ClassAdd, une procédure de sélection de variables basée sur une troncature k-additive de l'informatique mutuelle et sur une classification ascendante hiérarchique en pré-traitement

ClassAdd, une procédure de sélection de variables basée sur une troncature k-additive de l'informatique mutuelle et sur une classification ascendante hiérarchique en pré-traitement

Le problème de la sélection de variables en discrimination se rencontre généralement lorsque le nombre de variables, pouvant être utilisées pour expliquer la classe d'un individu, est très élevé. Les besoins ont beaucoup évolué ces dernières années avec la manipulation d'un grand nombre de...

Description complète

Enregistré dans:

Détails bibliographiques
Auteur principal :	Daviet Desmier Hélène (Auteur)
Collectivités auteurs :	Université de Nantes 1962-2021 (Organisme de soutenance), Université de Nantes Faculté des sciences et des techniques (Autre partenaire associé à la thèse), Centrale Nantes 1991-.... (Autre partenaire associé à la thèse), École doctorale sciences et technologies de l'information et des matériaux Nantes (Ecole doctorale associée à la thèse)
Autres auteurs :	Kuntz-Cosperec Pascale (Directeur de thèse), Kojadinovic Ivan (Directeur de thèse)
Format :	Thèse ou mémoire
Langue :	français
Titre complet :	ClassAdd, une procédure de sélection de variables basée sur une troncature k-additive de l'informatique mutuelle et sur une classification ascendante hiérarchique en pré-traitement / Hélène Daviet; sous la direction de Pascale Kuntz; co-encadrant Ivan Kojadinovic
Publié :	[S.l.] : [s.n.] , 2009
Description matérielle :	1 vol. (146 p.)
Note de thèse :	Thèse doctorat : Informatique : Nantes : 2009
Disponibilité :	Publication autorisée par le jury
Sujets :	Fonctions additives > Thèses et écrits académiques


LEADER	04502cam a2200421 4500
001	PPN145716783
003	http://www.sudoc.fr/145716783
005	20240531154500.0
029			\|a FR \|b 2009NANT2019
035			\|a (OCoLC)690305699
100			\|a 20100716d2009 k y0frey0103 ba
101	0		\|a fre \|d fre \|d eng
102			\|a FR
105			\|a a m 000yy
106			\|a r
200	1		\|a ClassAdd, une procédure de sélection de variables basée sur une troncature k-additive de l'informatique mutuelle et sur une classification ascendante hiérarchique en pré-traitement \|b Texte imprimé \|f Hélène Daviet \|g sous la direction de Pascale Kuntz \|g co-encadrant Ivan Kojadinovic
210			\|a [S.l.] \|c [s.n.] \|d 2009
215			\|a 1 vol. (146 p.) \|c ill. \|d 30 cm
310			\|a Publication autorisée par le jury
320			\|a Bibliogr. p. 141-146
328			\|b Thèse doctorat \|c Informatique \|e Nantes \|d 2009
330			\|a Le problème de la sélection de variables en discrimination se rencontre généralement lorsque le nombre de variables, pouvant être utilisées pour expliquer la classe d'un individu, est très élevé. Les besoins ont beaucoup évolué ces dernières années avec la manipulation d'un grand nombre de variables dans des domaines tels que les données génétiques, la chimie moléculaire ou encore le traitement de documents textes. Une procédure de sélection de variables consiste à sélectionner un sous-ensemble de variables permettant d'expliquer la classe de façon optimale ou quasi-optimale. La nécessité de ce traitement est essentiellement due au fait que, généralement, un nombre de variables discriminantes trop élevé dans un modèle de discrimination détériore grandement sa capacité de généralisation et la compréhension de la relation modélisée. Dans le cadre de ce travail, nous nous intéressons au cas où les variables potentiellement discriminantes sont toutes discrètes ou nominales et nous proposons une procédure de sélection de variables indépendante d'un modèle de données. Nos travaux s'orientent dans deux directions : une mesure de pertinence peu coûteuse grâce à l'utilisation d'une troncature k-additive de l'information mutuelle et une réduction de l'espace de recherche en structurant l'ensemble des variables avec une classification ascendante hiérarchique. Notre algorithme a pu être expérimenté sur trois types de données : des jeux artificiels construits avec une structure connue, des jeux de données réelles classiques et enfin une application d'entreprise : une population de cadres à la recherche d'emploi décrite par des variables comportementales
330			\|a Subset variable selection algorithms are necessary when the number of features is too huge to provide a good understanding of the underlying process that generated the data. In the past few years, variable and feature selection have become the focus of much research because of domains, such as molecular chemistry or gene expression array analysis, with hundreds to tens of thousands of variables. In the framework of subset variable selection for supervised classification involving only discret variables, we propose a selection algorithm using a computationally efficient relevance measure based on a k-additive truncation of the mutual information and involving an agglomerative hierarchical clustering of the set of potentially discriminatory variables in order to reduce the number of subsets whose relevance is estimated.
541	\|		\|a ClassAdd, a subset variable selection algorithm based on a k-additive truncation of the mutual information and an agglomerative hierarchical clustering of the set of variables \|z eng
606			\|3 PPN031706266 \|a Fonctions additives \|3 PPN027253139 \|x Thèses et écrits académiques \|2 rameau
686			\|a 004 \|2 TEF
700		1	\|3 PPN145716767 \|a Daviet Desmier \|b Hélène \|f 1980-.... \|4 070
702		1	\|3 PPN103904638 \|a Kuntz-Cosperec \|b Pascale \|4 727
702		1	\|3 PPN069495424 \|a Kojadinovic \|b Ivan \|4 727
712	0	2	\|3 PPN026403447 \|a Université de Nantes \|c 1962-2021 \|4 295
712	0	2	\|3 PPN033124884 \|a Université de Nantes \|b Faculté des sciences et des techniques \|4 985
712	0	2	\|3 PPN03063525X \|a Centrale Nantes \|c 1991-.... \|4 985
712	0	2	\|3 PPN068720513 \|a École doctorale sciences et technologies de l'information et des matériaux \|c Nantes \|4 996
801		3	\|a FR \|b Abes \|c 20171204 \|g AFNOR
979			\|a SCI
930			\|5 441092104:402594770 \|b 441092104 \|j u
930			\|5 441092105:410021369 \|b 441092105 \|j u
998			\|a 563072

ClassAdd, une procédure de sélection de variables basée sur une troncature k-additive de l'informatique mutuelle et sur une classification ascendante hiérarchique en pré-traitement

Documents similaires