Affichage MARC: Apprentissage multi label extrême

Apprentissage multi label extrême : comparaisons d'approches et nouvelles propositions

Stimulé par des applications comme l annotation de documents ou d images, l apprentissage multi-label a connu un fort développement cette dernière décennie. Mais les algorithmes classiques se heurtent aux nouveaux volumes des données multi-label extrême (XML) où le nombre de labels peut atteindre le...

Description complète

Enregistré dans:

Détails bibliographiques
Auteurs principaux :	Siblini Wissam (Auteur), Kuntz-Cosperec Pascale (Directeur de thèse), Meyer Frank (Directeur de thèse), Fromont Élisa (Président du jury de soutenance), Canu Stéphane (Rapporteur de la thèse), Habrard Amaury (Rapporteur de la thèse), Poggi Jean-Michel (Membre du jury)
Collectivités auteurs :	Université de Nantes 1962-2021 (Organisme de soutenance), École doctorale Mathématiques et sciences et technologies de l'information et de la communication Rennes (Ecole doctorale associée à la thèse), Université Bretagne Loire 2016-2019 (Autre partenaire associé à la thèse), Laboratoire des Sciences du Numérique de Nantes (Laboratoire associé à la thèse)
Format :	Thèse ou mémoire
Langue :	français
Titre complet :	Apprentissage multi label extrême : comparaisons d'approches et nouvelles propositions / Wissam Siblini; sous la direction de Pascale Kuntz-Cosperec et de Frank Meyer
Publié :	2018
Accès en ligne :	Accès Nantes Université
Note sur l'URL :	Accès au texte intégral
Note de thèse :	Thèse de doctorat : Informatique : Nantes : 2018
Sujets :	Apprentissage supervisé (intelligence artificielle) Arbres de décision Algorithme CraftML Thèses et écrits académiques


LEADER	06572clm a2200649 4500
001	PPN238428214
003	http://www.sudoc.fr/238428214
005	20240531154500.0
029			\|a FR \|b 2018NANT4083
033			\|a http://www.theses.fr/2018NANT4083
035			\|a (OCoLC)1371481186
035			\|a STAR114368
100			\|a 20191003d2018 k y0frey0103 ba
101	0		\|a fre \|d fre \|d eng \|2 639-2
102			\|a FR
105			\|a \|\|\|\|ma 00\|yy
135			\|a dr\|\|\|\|\|\|\|\|\|\|\|
181		1	\|6 z01 \|c txt \|2 rdacontent
181		1	\|6 z01 \|a i# \|b xxxe##
182		1	\|6 z01 \|c c \|2 rdamedia
182		1	\|6 z01 \|a b
183			\|6 z01 \|a ceb \|2 RDAfrCarrier
200	1		\|a Apprentissage multi label extrême \|e comparaisons d'approches et nouvelles propositions \|f Wissam Siblini \|g sous la direction de Pascale Kuntz-Cosperec et de Frank Meyer
214		1	\|d 2018
230			\|a Données textuelles
304			\|a Titre provenant de l'écran-titre
314			\|a Ecole(s) Doctorale(s) : École doctorale Mathématiques et sciences et technologies de l'information et de la communication (Rennes)
314			\|a Partenaire(s) de recherche : Université Bretagne Loire (COMUE), Laboratoire des Sciences du Numérique de Nantes (Laboratoire)
314			\|a Autre(s) contribution(s) : Élisa Fromont (Président du jury) ; Jean-Michel Poggi (Membre(s) du jury) ; Stéphane Canu, Amaury Habrard (Rapporteur(s))
328		0	\|b Thèse de doctorat \|c Informatique \|e Nantes \|d 2018
330			\|a Stimulé par des applications comme l annotation de documents ou d images, l apprentissage multi-label a connu un fort développement cette dernière décennie. Mais les algorithmes classiques se heurtent aux nouveaux volumes des données multi-label extrême (XML) où le nombre de labels peut atteindre le million. Cette thèse explore trois directions pour aborder la complexité en temps et en mémoire du problème : la réduction de dimension multi-label, les astuces d optimisation et d implémentation et le découpage arborescent. Elle propose d unifier les approches de réduction à travers une typologie et deux formulations génériques et d identifier des plus performantes avec une méta-analyse originale des résultats de la littérature. Une nouvelle approche est développée pour analyser l apport du couplage entre le problème de réduction et celui de classification. Pour réduire la complexité mémoire en maintenant les capacités prédictives, nous proposons également un algorithme d estimation des plus grands paramètres utiles d un modèle classique de régression one-vs-rest qui suit une stratégie inspirée de l analyse de données en flux. Enfin, nous présentons un nouvel algorithme CRAFTML qui apprend un ensemble d arbres de décision diversifiés. Chaque arbre effectue une réduction aléatoire conjointe des espaces d attributs et de labels et implémente un partitionnement récursif très rapide. CRAFTML est plus performant que les autres méthodes arborescentes XML et compétitif avec les meilleures méthodes qui nécessitent des supercalculateurs. Les apports de la thèse sont complétés par la présentation d un outil logiciel VIPE développé avec Orange Labs pour l analyse d opinions multi-label.
330			\|a Stimulated by many applications such as documents or images annotation, multilabel learning have gained a strong interest during the last decade. But, standard algorithms cannot cope with the volumes of the recent extreme multi-label data (XML) where the number of labels can reach millions. This thesis explores three directions to address the complexity in time and memory of the problem: multi-label dimension reduction, optimization and implementation tricks, and tree-based methods. It proposes to unify the reduction approaches through a typology and two generic formulations and to identify the most efficient ones with an original meta-analysis of the results of the literature. A new approach is developed to analyze the interest of coupling the reduction problem and the classification problem. To reduce the memory complexity of a classical one-vs-rest regression model while maintaining its predictive performances, we also propose an algorithm for estimating the largest useful parameters that follows a strategy inspired by data stream analysis. Finally, we present a new algorithm called CRAFTML that learns an ensemble of diversified decision trees. Each tree performs a joint random reduction of the feature and the label spaces and implements a very fast recursive partitioning strategy. CRAFTML performs better than other XML tree-based methods and is competitive with the most accurate methods that require supercomputers. The contributions of the thesis are completed by the presentation of a software called VIPE that is developed with Orange Labs for multilabel opinion analysis.
337			\|a Configuration requise : un logiciel capable de lire un fichier au format : PDF
541	\|		\|a Extreme multi-label learning \|e comparisons of approaches and new proposals \|z eng
606			\|3 PPN167934821 \|a Apprentissage supervisé (intelligence artificielle) \|2 rameau
606			\|3 PPN146988655 \|a Arbres de décision \|2 rameau
608			\|3 PPN027253139 \|a Thèses et écrits académiques \|2 rameau
610	0		\|a Algorithme CraftML
686			\|a 004 \|2 TEF
700		1	\|3 PPN238427218 \|a Siblini \|b Wissam \|f 1992-.... \|4 070
701		1	\|3 PPN103904638 \|a Kuntz-Cosperec \|b Pascale \|4 727
701		1	\|3 PPN166413682 \|a Meyer \|b Frank \|f 19..-.... \|c informaticien \|4 727
701		1	\|3 PPN095621601 \|a Fromont \|b Élisa \|f 1980-.... \|4 956
701		1	\|3 PPN074212478 \|a Canu \|b Stéphane \|f 1960-.... \|c chercheur en informatique \|4 958
701		1	\|3 PPN084103655 \|a Habrard \|b Amaury \|f 1978-.... \|4 958
701		1	\|3 PPN031511112 \|a Poggi \|b Jean-Michel \|f 1960-.... \|4 555
711	0	2	\|3 PPN026403447 \|a Université de Nantes \|c 1962-2021 \|4 295
711	0	2	\|3 PPN204770424 \|a École doctorale Mathématiques et sciences et technologies de l'information et de la communication \|c Rennes \|4 996
711	0	2	\|3 PPN191639044 \|a Université Bretagne Loire \|c 2016-2019 \|4 985
711	0	2	\|3 PPN203637585 \|a Laboratoire des Sciences du Numérique de Nantes \|4 981
801		3	\|a FR \|b Abes \|c 20230302 \|g AFNOR
856	4		\|q PDF \|s 7181492 \|u http://www.theses.fr/2018NANT4083/document \|z Accès au texte intégral
856	4		\|u https://archive.bu.univ-nantes.fr/pollux/show.action?id=40dc51c6-a571-448b-9772-9269a966a32e
856	4		\|u http://www.theses.fr/2018NANT4083/abes
930			\|5 441099901:778930858 \|b 441099901 \|j g
991			\|5 441099901:778930858 \|a exemplaire créé automatiquement par STAR
998			\|a 856302

Apprentissage multi label extrême : comparaisons d'approches et nouvelles propositions

Documents similaires