Recognition of Online Handwritten Mathematical Expressions using Contextual Information
Les expressions mathématiques manuscrites en-ligne sont constituées d'une séquence de traces. Leur reconnaissance nécessite de résoudre trois problèmes fondamentaux: la segmentation de ses symboles, leur reconnaissance et l'analyse structurelle de l'expression (i.e. l'identificat...
Enregistré dans:
Auteurs principaux : | , , , , , |
---|---|
Collectivités auteurs : | , , , , , |
Format : | Thèse ou mémoire |
Langue : | anglais |
Titre complet : | Recognition of Online Handwritten Mathematical Expressions using Contextual Information / Frank D. Julca-Aguilar; sous la direction de Christian Viard-Gaudin, co-directrice de thèse Nina S. T. Hirata, co-encadrant de thèse Harold Mouchère |
Publié : |
Nantes :
Université de Nantes
, 2016 |
Accès en ligne : |
Accès Nantes Université
|
Note de thèse : | Reproduction de : Thèse de doctorat : Informatique et applications : Nantes : 2016 Reproduction de : Thèse de doctorat : Informatique et applications : São Paulo : 2016 |
Sujets : |
LEADER | 06892clm a2200661 4500 | ||
---|---|---|---|
001 | PPN230698387 | ||
003 | http://www.sudoc.fr/230698387 | ||
005 | 20240425055200.0 | ||
029 | |a FR |b 2016NANT2126 | ||
035 | |a (OCoLC)1247940790 | ||
100 | |a 20181009d2016 k y0frey0103 ba | ||
101 | 0 | |a eng |d fre |d eng |2 639-2 | |
102 | |a FR |a BR | ||
105 | |a a v 00|yy | ||
135 | |a dr||||||||||| | ||
181 | 1 | |6 z01 |c txt |2 rdacontent | |
181 | 1 | |6 z01 |a i# |b xxxe## | |
182 | 1 | |6 z01 |c c |2 rdamedia | |
182 | 1 | |6 z01 |a b | |
183 | |6 z01 |a ceb |2 RDAfrCarrier | ||
200 | 1 | |a Recognition of Online Handwritten Mathematical Expressions using Contextual Information |f Frank D. Julca-Aguilar |g sous la direction de Christian Viard-Gaudin, co-directrice de thèse Nina S. T. Hirata, co-encadrant de thèse Harold Mouchère | |
214 | 2 | |a Nantes |c Université de Nantes |d 2016 | |
230 | |a Données textuelles | ||
300 | |a Thèse soutenue en cotutelle | ||
307 | |a L'impression du document génère 136 p. | ||
314 | |a Ecole(s) Doctorale(s) : École doctorale sciences et technologies de l'information et de mathématiques (STIM) (Nantes) | ||
314 | |a Partenaire de recherche : Institut de recherche en communications et cybernétique (IRCCyN) (Nantes) (Laboratoire) | ||
314 | |a Autre(s) contribution(s) : Bertrand Couasnon (Membre du jury) ; Jean-Yves Ramel, Ricardo da Silva Torres (Rapporteurs) | ||
320 | |a Bibliogr. p.111-116 | ||
325 | 1 | |a La thèse papier est la seule version officielle | |
328 | 0 | |z Reproduction de |b Thèse de doctorat |c Informatique et applications |e Nantes |d 2016 | |
328 | 0 | |z Reproduction de |b Thèse de doctorat |c Informatique et applications |e São Paulo |d 2016 | |
330 | |a Les expressions mathématiques manuscrites en-ligne sont constituées d'une séquence de traces. Leur reconnaissance nécessite de résoudre trois problèmes fondamentaux: la segmentation de ses symboles, leur reconnaissance et l'analyse structurelle de l'expression (i.e. l'identification des relations spatiales intersymboles). La nature ambiguë des expressions manuscrites et leur structure spatiale sont les problèmes principaux du processus de reconnaissance. Dans cette thèse, nous proposons une modélisation du problème par une analyse syntaxique de graphes. La description des règles de production grammaticales par des graphes permet de modéliser directement la nature non linéaire des structures. Notre algorithme d'analyse détermine récursivement les partitions des traces en respectant les graphes des règles de production. Pour diminuer le coût de calcul, graphes issus des partitions sont limitées à un ensemble d'hypothèses de symboles et de relations précalculées grâce à classifieur entraîné. Ce classifieur donne à chaque hypothèse un ensemble d'étiquettes associées à leur vraisemblance. C'est l'analyse syntaxique qui sélectionnera la meilleure interprétation globale. Cette analyse produit de plusieurs arbres syntaxiques pour représenter plusieurs interprétations, leur associe un coût et choisit l'arbre avec le coût le plus faible pour l'interprétation finale. Les évaluations effectuées sur une base d'expressions conséquente et publique ont permis de montrer que notre approche est plus performantes que plusieurs méthodes de l'état de l'art et que l'utilisation du graphe d'hypothèses de symboles et de relations permet de contrôler la complexité de l'analyse. L'adaptation à d'autres langages graphiques est possible. | ||
330 | |a Online handwritten mathematical expressions consist of sequences of strokes. Automatic recognition these data requires solving three subproblems: symbol segmentation, symbol classification, and structural analysis (i.e. identification of spatial relations between symbols). Ambiguity, that often leads to several likely interpretations, and the non-linear structure of the expressions are main issues of the recognition process. In this thesis, we model the recognition problem as a graph parsing problem. The graph-based description of relations in production rules allows direct modeling of non-linear structures. Our parsing algorithm determines recursive partitions of the input strokes that induce graphs matching the production rule graphs. To mitigate the computational cost, we constrain the partitions to graphs derived from sets of symbol and relation hypotheses, calculated using previously trained classifiers. A set of labels that indicate likely interpretations is associated to each hypothesis, and the selection of the best interpretation is driven by the parsing algorithm. The parsing method computes multiple parse trees to represent alternative interpretations, assigns a cost to each tree and selects a tree with minimum cost as result. The evaluations show that the proposed method is more accurate than several state of the art methods; the use of symbol and relation hypotheses to constrain the search space effectively reduces the parsing complexity; and adaptation to other two-dimensional object recognition problems is possible. As a secondary contribution, we developed a framework to automatize the handwritten mathematical expression datasets building process. | ||
337 | |a Un logiciel capable de lire un fichier au format pdf | ||
541 | | | |a Reconnaissance d expressions mathématiques manuscrites guidée par le contexte |z fre | |
606 | |3 PPN190651628 |a Reconnaissance d'objets (informatique) |2 rameau | ||
606 | |3 PPN027242307 |a Reconnaissance des formes (informatique) |2 rameau | ||
606 | |3 PPN027315428 |a Théorie des graphes |2 rameau | ||
608 | |3 PPN027253139 |a Thèses et écrits académiques |2 rameau | ||
686 | |a 004 |2 TEF | ||
700 | 1 | |3 PPN230592104 |a Julca-Aguilar |b Frank D. |f 1985-.... |4 070 | |
701 | 1 | |3 PPN098591045 |a Viard-Gaudin |b Christian |4 727 |4 555 | |
701 | 1 | |3 PPN230592716 |a Hirata |b Nina S. T. |4 727 |4 555 | |
701 | 1 | |3 PPN124893929 |a Mouchère |b Harold |f 1981- .... |4 727 |4 555 | |
701 | 1 | |3 PPN094601445 |a Ramel |b Jean-Yves |f 1970-.... |4 958 |4 555 | |
701 | 1 | |3 PPN230592767 |a Da Silva Torres |b Ricardo |4 958 |4 555 | |
711 | 0 | 2 | |3 PPN191639044 |a Université Bretagne Loire |c 2016-2019 |4 295 |
711 | 0 | 2 | |3 PPN026403447 |a Université de Nantes |c 1962-2021 |4 295 |
711 | 0 | 2 | |3 PPN026606585 |a Universidade de São Paulo |c Brésil |4 295 |
711 | 0 | 2 | |3 PPN134103211 |a École doctorale Sciences et technologies de l'information et mathématiques |c Nantes |4 295 |4 996 |
711 | 0 | 2 | |3 PPN113164726 |a Institut de recherche en communications et cybernétique |c Nantes |f 1958-2017 |4 295 |4 981 |
711 | 0 | 2 | |3 PPN18312068X |a Instituto de Matemática e Estatística |c São Paulo |4 295 |4 981 |
801 | 3 | |a FR |b Abes |c 20230206 |g AFNOR | |
856 | 4 | |q PDF |u https://archive.bu.univ-nantes.fr/pollux/show/show?id=2a3e3a25-023e-44cd-9b2e-878fe8e9bf26 |2 Accès au texte intégral de la thèse | |
979 | |a SCI | ||
930 | |5 441092104:620862424 |b 441092104 |j g | ||
998 | |a 822593 |