Recognition of Online Handwritten Mathematical Expressions using Contextual Information

Les expressions mathématiques manuscrites en-ligne sont constituées d'une séquence de traces. Leur reconnaissance nécessite de résoudre trois problèmes fondamentaux: la segmentation de ses symboles, leur reconnaissance et l'analyse structurelle de l'expression (i.e. l'identificat...

Description complète

Enregistré dans:
Détails bibliographiques
Auteurs principaux : Julca-Aguilar Frank D. (Auteur), Viard-Gaudin Christian (Directeur de thèse, Membre du jury), Hirata Nina S. T. (Directeur de thèse, Membre du jury), Mouchère Harold (Directeur de thèse, Membre du jury), Ramel Jean-Yves (Rapporteur de la thèse, Membre du jury), Da Silva Torres Ricardo (Rapporteur de la thèse, Membre du jury)
Collectivités auteurs : Université Bretagne Loire 2016-2019 (Organisme de soutenance), Université de Nantes 1962-2021 (Organisme de soutenance), Universidade de São Paulo Brésil (Organisme de soutenance), École doctorale Sciences et technologies de l'information et mathématiques Nantes (Organisme de soutenance), Institut de recherche en communications et cybernétique Nantes 1958-2017 (Ecole doctorale associée à la thèse), Instituto de Matemática e Estatística São Paulo (Organisme de soutenance)
Format : Thèse ou mémoire
Langue : anglais
Titre complet : Recognition of Online Handwritten Mathematical Expressions using Contextual Information / Frank D. Julca-Aguilar; sous la direction de Christian Viard-Gaudin, co-directrice de thèse Nina S. T. Hirata, co-encadrant de thèse Harold Mouchère
Publié : Nantes : Université de Nantes , 2016
Accès en ligne : Accès Nantes Université
Note de thèse : Reproduction de : Thèse de doctorat : Informatique et applications : Nantes : 2016
Reproduction de : Thèse de doctorat : Informatique et applications : São Paulo : 2016
Sujets :
LEADER 06892clm a2200661 4500
001 PPN230698387
003 http://www.sudoc.fr/230698387
005 20240425055200.0
029 |a FR  |b 2016NANT2126 
035 |a (OCoLC)1247940790 
100 |a 20181009d2016 k y0frey0103 ba 
101 0 |a eng  |d fre  |d eng  |2 639-2 
102 |a FR  |a BR 
105 |a a v 00|yy 
135 |a dr||||||||||| 
181 1 |6 z01  |c txt  |2 rdacontent 
181 1 |6 z01  |a i#  |b xxxe## 
182 1 |6 z01  |c c  |2 rdamedia 
182 1 |6 z01  |a b 
183 |6 z01  |a ceb  |2 RDAfrCarrier 
200 1 |a Recognition of Online Handwritten Mathematical Expressions using Contextual Information  |f Frank D. Julca-Aguilar  |g sous la direction de Christian Viard-Gaudin, co-directrice de thèse Nina S. T. Hirata, co-encadrant de thèse Harold Mouchère 
214 2 |a Nantes  |c Université de Nantes  |d 2016 
230 |a Données textuelles 
300 |a Thèse soutenue en cotutelle 
307 |a L'impression du document génère 136 p. 
314 |a Ecole(s) Doctorale(s) : École doctorale sciences et technologies de l'information et de mathématiques (STIM) (Nantes) 
314 |a Partenaire de recherche : Institut de recherche en communications et cybernétique (IRCCyN) (Nantes) (Laboratoire) 
314 |a Autre(s) contribution(s) : Bertrand Couasnon (Membre du jury) ; Jean-Yves Ramel, Ricardo da Silva Torres (Rapporteurs) 
320 |a Bibliogr. p.111-116 
325 1 |a La thèse papier est la seule version officielle 
328 0 |z Reproduction de  |b Thèse de doctorat  |c Informatique et applications  |e Nantes  |d 2016 
328 0 |z Reproduction de  |b Thèse de doctorat  |c Informatique et applications  |e São Paulo  |d 2016 
330 |a Les expressions mathématiques manuscrites en-ligne sont constituées d'une séquence de traces. Leur reconnaissance nécessite de résoudre trois problèmes fondamentaux: la segmentation de ses symboles, leur reconnaissance et l'analyse structurelle de l'expression (i.e. l'identification des relations spatiales intersymboles). La nature ambiguë des expressions manuscrites et leur structure spatiale sont les problèmes principaux du processus de reconnaissance. Dans cette thèse, nous proposons une modélisation du problème par une analyse syntaxique de graphes. La description des règles de production grammaticales par des graphes permet de modéliser directement la nature non linéaire des structures. Notre algorithme d'analyse détermine récursivement les partitions des traces en respectant les graphes des règles de production. Pour diminuer le coût de calcul, graphes issus des partitions sont limitées à un ensemble d'hypothèses de symboles et de relations précalculées grâce à classifieur entraîné. Ce classifieur donne à chaque hypothèse un ensemble d'étiquettes associées à leur vraisemblance. C'est l'analyse syntaxique qui sélectionnera la meilleure interprétation globale. Cette analyse produit de plusieurs arbres syntaxiques pour représenter plusieurs interprétations, leur associe un coût et choisit l'arbre avec le coût le plus faible pour l'interprétation finale. Les évaluations effectuées sur une base d'expressions conséquente et publique ont permis de montrer que notre approche est plus performantes que plusieurs méthodes de l'état de l'art et que l'utilisation du graphe d'hypothèses de symboles et de relations permet de contrôler la complexité de l'analyse. L'adaptation à d'autres langages graphiques est possible. 
330 |a Online handwritten mathematical expressions consist of sequences of strokes. Automatic recognition these data requires solving three subproblems: symbol segmentation, symbol classification, and structural analysis (i.e. identification of spatial relations between symbols). Ambiguity, that often leads to several likely interpretations, and the non-linear structure of the expressions are main issues of the recognition process. In this thesis, we model the recognition problem as a graph parsing problem. The graph-based description of relations in production rules allows direct modeling of non-linear structures. Our parsing algorithm determines recursive partitions of the input strokes that induce graphs matching the production rule graphs. To mitigate the computational cost, we constrain the partitions to graphs derived from sets of symbol and relation hypotheses, calculated using previously trained classifiers. A set of labels that indicate likely interpretations is associated to each hypothesis, and the selection of the best interpretation is driven by the parsing algorithm. The parsing method computes multiple parse trees to represent alternative interpretations, assigns a cost to each tree and selects a tree with minimum cost as result. The evaluations show that the proposed method is more accurate than several state of the art methods; the use of symbol and relation hypotheses to constrain the search space effectively reduces the parsing complexity; and adaptation to other two-dimensional object recognition problems is possible. As a secondary contribution, we developed a framework to automatize the handwritten mathematical expression datasets building process. 
337 |a Un logiciel capable de lire un fichier au format pdf 
541 | |a Reconnaissance d expressions mathématiques manuscrites guidée par le contexte  |z fre 
606 |3 PPN190651628  |a Reconnaissance d'objets (informatique)  |2 rameau 
606 |3 PPN027242307  |a Reconnaissance des formes (informatique)  |2 rameau 
606 |3 PPN027315428  |a Théorie des graphes  |2 rameau 
608 |3 PPN027253139  |a Thèses et écrits académiques  |2 rameau 
686 |a 004  |2 TEF 
700 1 |3 PPN230592104  |a Julca-Aguilar  |b Frank D.  |f 1985-....  |4 070 
701 1 |3 PPN098591045  |a Viard-Gaudin  |b Christian  |4 727  |4 555 
701 1 |3 PPN230592716  |a Hirata  |b Nina S. T.  |4 727  |4 555 
701 1 |3 PPN124893929  |a Mouchère  |b Harold  |f 1981- ....  |4 727  |4 555 
701 1 |3 PPN094601445  |a Ramel  |b Jean-Yves  |f 1970-....  |4 958  |4 555 
701 1 |3 PPN230592767  |a Da Silva Torres  |b Ricardo  |4 958  |4 555 
711 0 2 |3 PPN191639044  |a Université Bretagne Loire  |c 2016-2019  |4 295 
711 0 2 |3 PPN026403447  |a Université de Nantes  |c 1962-2021  |4 295 
711 0 2 |3 PPN026606585  |a Universidade de São Paulo  |c Brésil  |4 295 
711 0 2 |3 PPN134103211  |a École doctorale Sciences et technologies de l'information et mathématiques  |c Nantes  |4 295  |4 996 
711 0 2 |3 PPN113164726  |a Institut de recherche en communications et cybernétique  |c Nantes  |f 1958-2017  |4 295  |4 981 
711 0 2 |3 PPN18312068X  |a Instituto de Matemática e Estatística  |c São Paulo  |4 295  |4 981 
801 3 |a FR  |b Abes  |c 20230206  |g AFNOR 
856 4 |q PDF  |u https://archive.bu.univ-nantes.fr/pollux/show/show?id=2a3e3a25-023e-44cd-9b2e-878fe8e9bf26  |2 Accès au texte intégral de la thèse 
979 |a SCI 
930 |5 441092104:620862424  |b 441092104  |j g 
998 |a 822593