Classification interactive multi-label pour l aide à l organisation personnalisée des données

L'importance croissante donnée actuellement aux contenus personnalisés a conduit au développement de plusieurs systèmes de classification interactive pour diverses applications originales. Néanmoins, tous ces systèmes recourent à une classification mono-label des items qui limite fortement l�...

Description complète

Enregistré dans:
Détails bibliographiques
Auteurs principaux : Nair Benrekia Noureddine Yassine (Auteur), Kuntz-Cosperec Pascale (Directeur de thèse, Membre du jury), Meyer Frank (Directeur de thèse, Membre du jury), Preux Philippe (Président du jury de soutenance, Membre du jury), Bennani Younès (Rapporteur de la thèse, Membre du jury), Vrain Christel (Rapporteur de la thèse, Membre du jury)
Collectivités auteurs : Université de Nantes 1962-2021 (Organisme de soutenance), École polytechnique de l'Université de Nantes (Organisme de soutenance), École doctorale Sciences et technologies de l'information et mathématiques Nantes (Organisme de soutenance), Laboratoire d Informatique de Nantes Atlantique (UMR 6241) Nantes (Ecole doctorale associée à la thèse)
Format : Thèse ou mémoire
Langue : français
Titre complet : Classification interactive multi-label pour l aide à l organisation personnalisée des données / Noureddine Yassine Nair Benrekia; sous la direction de Pascale Kuntz ; co-directeur de thèse Frank Meyer
Publié : [Lieu de publication inconnu] : [éditeur inconnu] , 2015
Accès en ligne : Accès Nantes Université
Note de thèse : Reproduction de : Thèse de doctorat : Informatique et applications : Nantes : 2015
Sujets :
Documents associés : Reproduction de: Classification interactive multi-label pour l aide à l organisation personnalisée des données
Description
Résumé : L'importance croissante donnée actuellement aux contenus personnalisés a conduit au développement de plusieurs systèmes de classification interactive pour diverses applications originales. Néanmoins, tous ces systèmes recourent à une classification mono-label des items qui limite fortement l'expressivité de l'utilisateur. Le problème majeur commun à tous les développeurs d'un système de classification interactif et multi-label est: quel classifieur multi-label devrions-nous choisir? Les évaluations expérimentales des systèmes d'apprentissage interactifs récents sont essentiellement subjectives. L:importance de leurs conclusions est donc limitée. Pour tirer des conclusions plus générales qui permettent de guider la sélection de l'algorithme d'apprentissage approprié lors du développement d'un tel système, nous étudions de manière approfondie l'impact des contraintes d'interactivité majeures (apprentissage à partir de peu d'exemples en un temps limité) sur les performances prédictives et les temps de calcul des classifieurs. Les expérimentations mettent en évidence le potentiel d'une approche d'apprentissage ensemble Random Forest of Predictive Clustering Trees(RF-PCT). Cependant, la forte contrainte sur le temps de calcul posée par l'interactivité, nous a conduits à proposer une nouvelle approche d'apprentissage hybride FMDI-RF+ qui associe RF-PCT avec une approche de factorisation de matrice efficace pour la réduction de dimensions. Les résultats expérimentaux indiquent que FMDI-RF+ est aussi précise que RF-PCT dans les prédictions avec clairement un avantage à FMDI-RF+ pour la vitesse de calcul.
The growing importance given today to personalized contents led to the development of several interactive classification systems for various novel applications. Nevertheless, all these systems use a single-label item classification which greatly constrains the user's expressiveness. The major problem common to all developers of an interactive multi-label system is: which multi-label classifier should we choose? Experimental evaluations of recent interactive learning systems are mainly subjective. The importance of their conclusions is consequently limited. To draw more general conclusions for guiding the selection of a suitable learning algorithm during the development of such a system, we extensively study the impact of the major interactivity constraints (learning from few examples in a limited time) on the classifier predictive and time-computation performances. The experiments demonstrate the potential of an ensemble learning approach Random Forest of Predictive Clustering Trees(RF-PCT). However,the strong constraint imposed by the interactivity on the computation time has led us to propose a new hybrid learning approach FMDI-RF+ which associates RF-PCT with an efficient matrix factorization approach for dimensionality reduction. The experimental results indicate that RF-FMDI+ is as accurate as RF-PCT in the predictions with a significant advantage to FMDI-RF + for the speed of computation.
Variantes de titre : Interactive multi-label classification for the personalized organisation of data
Notes : Ecole(s) Doctorale(s) : École doctorale sciences et technologies de l'information et de mathématiques (STIM) (Nantes)
Partenaire de recherche : Laboratoire d Informatique de Nantes Atlantique (UMR 6241) (LINA) (Nantes) (Laboratoire)
Autre(s) contribution(s) : Philippe Preux (Président du jury) ; Younès Bennani, Christel Vrain (Rapporteurs)
Configuration requise : Un logiciel capable de lire un fichier au format pdf
Bibliographie : Bibliogr. p.103-110