Construction semi-automatique de ressources pour la fouille d'opinion

Identifier les leviers de satisfaction des consommateurs est aujourd hui capital dans un monde où la relation que tisse une entreprise avec ses clients est sa plus grande richesse. Le domaine de la fouille d opinion, dans lequel s inscrit cette thèse, propose des méthodes permettant de répondre à ce...

Full description

Saved in:
Bibliographic Details
Main Authors : Lark Joseph (Auteur), Morin Emmanuel (Directeur de thèse), Peña Saldarriaga Sebastián (Directeur de thèse), Sébillot Pascale (Président du jury de soutenance), Clavel Chloé (Rapporteur de la thèse), Tannier Xavier (Rapporteur de la thèse)
Corporate Authors : Université de Nantes 1962-2021 (Organisme de soutenance), École doctorale Mathématiques et sciences et technologies de l'information et de la communication Rennes (Ecole doctorale associée à la thèse), Université Bretagne Loire 2016-2019 (Autre partenaire associé à la thèse), Laboratoire des Sciences du Numérique de Nantes (Laboratoire associé à la thèse)
Format : Thesis
Language : français
Title statement : Construction semi-automatique de ressources pour la fouille d'opinion / Joseph Lark; sous la direction de Emmanuel Morin et de Sebastián Peña Saldarriaga
Published : 2017
Online Access : Via Nantes Université network
Online Access note : Accès au texte intégral
Note de thèse : Thèse de doctorat : Informatique : Nantes : 2017
Subjects :
LEADER 06028clm a2200637 4500
001 PPN227303520
003 http://www.sudoc.fr/227303520
005 20240531154500.0
029 |a FR  |b 2017NANT4049 
033 |a http://www.theses.fr/2017NANT4049 
035 |a (OCoLC)1371481222 
035 |a STAR98270 
100 |a 20180601d2017 k y0frey0103 ba 
101 0 |a fre  |d fre  |d eng  |2 639-2 
102 |a FR 
105 |a ||||ma 00|yy 
135 |a dr||||||||||| 
181 1 |6 z01  |c txt  |2 rdacontent 
181 1 |6 z01  |a i#  |b xxxe## 
182 1 |6 z01  |c c  |2 rdamedia 
182 1 |6 z01  |a b 
183 |6 z01  |a ceb  |2 RDAfrCarrier 
200 1 |a Construction semi-automatique de ressources pour la fouille d'opinion  |f Joseph Lark  |g sous la direction de Emmanuel Morin et de Sebastián Peña Saldarriaga 
214 1 |d 2017 
230 |a Données textuelles 
304 |a Titre provenant de l'écran-titre 
314 |a Ecole(s) Doctorale(s) : École doctorale Mathématiques et sciences et technologies de l'information et de la communication (Rennes) 
314 |a Partenaire(s) de recherche : Université Bretagne Loire (COMUE), Laboratoire des Sciences du Numérique de Nantes (Laboratoire) 
314 |a Autre(s) contribution(s) : Pascale Sébillot (Président du jury) ; Chloé Clavel, Xavier Tannier (Rapporteur(s)) 
328 0 |b Thèse de doctorat  |c Informatique  |e Nantes  |d 2017 
330 |a Identifier les leviers de satisfaction des consommateurs est aujourd hui capital dans un monde où la relation que tisse une entreprise avec ses clients est sa plus grande richesse. Le domaine de la fouille d opinion, dans lequel s inscrit cette thèse, propose des méthodes permettant de répondre à ce besoin. Celles-ci nécessitent cependant une mise à jour constante de ressources spécialisées qui sont la pierre angulaire des outils d analyse d opinion. Ce travail vise à développer des stratégies d acquisition et de structuration de ces ressources, qui prennent la forme de lexiques, de patrons morpho-syntaxiques ou de textes annotés. Chacune de ces formes présente des difficultés d acquisition propres, auxquelles s ajoute la complexité de mettre à jour ces ressources en fonction de la langue à traiter ou du domaine des corpus analysés, notion primordiale en fouille d opinion. Premièrement, nous menons une étude des éléments fondamentaux autour desquels l opinion est construite dans le discours, conduisant à une nouvelle modélisation en étiquetage de séquence de l opinion. Nous traitons ensuite la question de l apport des différents types de ressources, dont il ressort que la meilleure stratégie est de les utiliser de concert. Enfin, nous proposons des méthodes d acquisition pour chacune des ressources répondant non seulement aux besoins de la fouille d opinion mais également aux contraintes du contexte industriel au sein duquel ces recherches sont menées. 
330 |a Identifying satisfaction triggers among customers is a crucial need in today s business world, as a strong customer relationship is now a most vital asset. The domain of opinion mining, in which this thesis falls into, offers several methods to answer this need. These methods, however, require a continuous update of specialized resources which are the cornerstone of many opinion mining tools. The objective of this work is to develop acquisition and structuration strategies for these resources, which can be lexicons, morphosyntactic rules or annotated data. Each of these items presents its own extraction difficulties, on top of the general issue of their update in a language- or domain-specific setting. Indeed, language constraints are fundamental in opinion mining, so the proposed methods must take these into account. First, we study the core elements from which opinion expressions are built in customer feedback. This study leads us to suggest a new modelisation of opinion mining as a sequence labeling task. We then compare the benefits of each type of resource through a benchmark of several opinion mining methods, and conclude that the best performing strategy is a hybrid approach. Finally, we present results for resource acquisition methods that answer not only the needs of opinion mining but also the constraints from the industrial setting in which this work has been conducted. 
337 |a Configuration requise : un logiciel capable de lire un fichier au format : PDF 
541 | |a Semi-automatic acquisition of opinion mining resources  |z eng 
606 |3 PPN035198222  |a Exploration de données  |2 rameau 
606 |3 PPN027985830  |a Traitement automatique du langage naturel  |2 rameau 
608 |3 PPN027253139  |a Thèses et écrits académiques  |2 rameau 
610 0 |a Fouille d opinion 
686 |a 004  |2 TEF 
700 1 |3 PPN227302087  |a Lark  |b Joseph  |f 1988-....  |4 070 
701 1 |3 PPN14379373X  |a Morin  |b Emmanuel  |f 1971-....  |c enseignant-chercheur en informatique  |4 727 
701 1 |3 PPN15195822X  |a Peña Saldarriaga  |b Sebastián  |f 1982-....  |4 727 
701 1 |3 PPN075988453  |a Sébillot  |b Pascale  |f 1962-....  |4 956 
701 1 |3 PPN116841281  |a Clavel  |b Chloé  |f 1980-....  |c chercheuse en informatique  |4 958 
701 1 |3 PPN113391722  |a Tannier  |b Xavier  |f 1980-....  |4 958 
711 0 2 |3 PPN026403447  |a Université de Nantes  |c 1962-2021  |4 295 
711 0 2 |3 PPN204770424  |a École doctorale Mathématiques et sciences et technologies de l'information et de la communication  |c Rennes  |4 996 
711 0 2 |3 PPN191639044  |a Université Bretagne Loire  |c 2016-2019  |4 985 
711 0 2 |3 PPN203637585  |a Laboratoire des Sciences du Numérique de Nantes  |4 981 
801 3 |a FR  |b Abes  |c 20230302  |g AFNOR 
856 4 |q PDF  |s 3862627  |u http://www.theses.fr/2017NANT4049/document  |z Accès au texte intégral 
856 4 |u https://archive.bu.univ-nantes.fr/pollux/show.action?id=894c9160-68f2-452f-8da6-a66748fa78f4 
856 4 |u http://www.theses.fr/2017NANT4049/abes 
930 |5 441099901:778935078  |b 441099901  |j g 
991 |5 441099901:778935078  |a exemplaire créé automatiquement par STAR 
998 |a 814375