Writing style modelling based on grapheme distributions application to on-line writer identification

In this work, we propose to model the unique handwritten style of a person by computing the grapheme distribution produced by this writer. This distribution is computed from any text with a few lines. First, representative grapheme prototypes are automatically defined at the character level with a c...

Description complète

Enregistré dans:
Détails bibliographiques
Auteurs principaux : Tan Guoxian (Auteur), Viard-Gaudin Christian (Directeur de thèse), Kot Alex (Directeur de thèse), Siyal Mohammed Yakoob (Président du jury de soutenance), Campisi Patrizio (Rapporteur de la thèse), Paquet Thierry (Rapporteur de la thèse)
Collectivités auteurs : Université de Nantes 1962-2021 (Organisme de soutenance), Nanyang Technological University Singapour (Organisme de soutenance), Université Nantes-Angers-Le Mans - COMUE 2009-2015 (Organisme de soutenance), École polytechnique de l'Université de Nantes (Organisme de soutenance), École doctorale Sciences et technologies de l'information et mathématiques Nantes (Organisme de soutenance), Institut de recherche en communications et cybernétique Nantes 1958-2017 (Ecole doctorale associée à la thèse)
Format : Thèse ou mémoire
Langue : anglais
Titre complet : Writing style modelling based on grapheme distributions application to on-line writer identification / Guoxian Tan; sous la direction de Christian Viard-Gaudin ; co-directeur Alex Kot
Publié : Nantes : Université de Nantes , 2013
Accès en ligne : Accès Nantes Université
Note sur l'URL : Accès au texte intégral
Reproduction de : Reproduction numérique de l'original imprimé
Note de thèse : Reproduction de : Thèse de doctorat : Informatique, automatique et informatique appliquée : Nantes : 2013
Reproduction de : Thèse de doctorat : Informatique, automatique et informatique appliquée : Nanyang : 2013
Sujets :
Documents associés : Reproduction de: Writing style modelling based on grapheme distributions application to on-line writer identification
LEADER 06837nlm a2200685 4500
001 PPN268123608
003 http://www.sudoc.fr/268123608
005 20240531154500.0
029 |a FR  |b 2013NANT2021 
035 |a (OCoLC)1371240106 
100 |a 20230227d2013 k y0frey0103 ba 
101 0 |a eng  |d eng  |d fre  |2 639-2 
102 |a FR 
105 |a a va 001yy 
135 |a dr||||||||||| 
181 |6 z01  |c txt  |2 rdacontent 
181 1 |6 z01  |a i#  |b xxxe## 
182 |6 z01  |c c  |2 rdamedia 
182 1 |6 z01  |a b 
183 |6 z01  |a ceb  |2 RDAfrCarrier 
200 1 |a Writing style modelling based on grapheme distributions application to on-line writer identification  |f Guoxian Tan  |g sous la direction de Christian Viard-Gaudin ; co-directeur Alex Kot 
214 2 |a Nantes  |c Université de Nantes  |d 2013 
230 |a Données textuelles 
300 |a Thèse soutenue en cotutelle 
307 |a L'impression du document génère 150 p. 
314 |a Ecole(s) Doctorale(s) : École doctorale sciences et technologies de l'information et de mathématiques (STIM) (Nantes) 
314 |a Partenaire de recherche : Institut de recherche en communications et cybernétique (IRCCYN) (Nantes) (Laboratoire) 
314 |a Autre(s) contribution(s) : Mohammed Yakoob Siyal (Président du jury) ; Patrizio Campisi, Thierry Paquet (Rapporteurs) 
320 |a Bibliogr. p. 138-147, 80 réf. 
324 |a Reproduction numérique de l'original imprimé 
325 1 |a La thèse papier est la seule version officielle 
328 0 |z Reproduction de  |b Thèse de doctorat  |c Informatique, automatique et informatique appliquée  |e Nantes  |d 2013 
328 0 |z Reproduction de  |b Thèse de doctorat  |c Informatique, automatique et informatique appliquée  |e Nanyang  |d 2013 
330 |a In this work, we propose to model the unique handwritten style of a person by computing the grapheme distribution produced by this writer. This distribution is computed from any text with a few lines. First, representative grapheme prototypes are automatically defined at the character level with a clustering algorithm. These prototypes should cover the variability of the different writing styles. Next, the modeling distribution of two writing styles can be compared, which allows to proceed to writer identification from a reference dataset of documents and a questioned document. The query, unknown writer document, is matched again all the reference documents. For this purpose, the proposed framework segments and recognizes the text at the character level and then performs a fuzzy function assignment to the corresponding prototypes of all the letters. Some important issues are raised. They concern the number of prototypes for representing a letter, the choice of a metric to compare two distributions, the discriminative power of the alphabet letters, the effect of the length of the texts. Two datasets with different complexities have been used to assess the performances of the proposed system. A writer identification rate of 99.2% has been reached with a set of 120 French writers, whereas with a bigger set of 200 English writers, the identification rate is of 87%. This method has been applied on on-line handwriting where the available signal which defines the sampled trajectory of the writing tool is available as a sequence of points  |2 4e de couverture 
330 |a Dans cette thèse nous proposons de modéliser le style d écriture manuscrite spécifique d une personne en utilisant pour un scripteur donné la distribution de l usage de prototypes de graphèmes. Cette distribution est calculée à partir d un texte quelconque de quelques lignes. Les prototypes résultent d un clustering préalable et indépendant permettant de recenser la variabilité des styles d écriture. Cette modélisation permet de comparer deux styles d écriture et de procéder à l identification d un scripteur à partir d une base de documents de référence. La comparaison est basée sur une mesure de mise en correspondance des distributions obtenues. Pour cela, un système automatique segmente le texte en lettres, puis classe chaque lettre de manière probabiliste parmi les prototypes disponibles pour cette lettre. Une analyse portant sur le choix du nombre de prototypes, la nature de la distance utilisée pour la comparaison, le caractère discriminant des différentes lettres de l alphabet, et la longueur du texte disponible est proposée. Deux bases de complexité différentes sont utilisées pour évaluer ce système. Un taux d identification de 99,2 % est obtenu sur une base de recherche de 120 textes écrits en français, tandis qu il se situe à 87 % sur une base de recherche de 200 textes écrits en anglais. Cette méthode est développée sur de l écriture en ligne où le signal d écriture représentant la trajectoire de l instrument d écriture est disponible sous la forme d une séquence de points  |2 4e de couverture 
337 |a Un logiciel capable de lire un fichier au format PDF 
455 | |0 268123365  |t Writing style modelling based on grapheme distributions application to on-line writer identification  |f Guoxian Tan  |d 2013  |p 1 vol. (147 p.) 
541 | |a Modélisation des styles d écriture basée distributions de graphèmes Application à l identification de scripteurs  |z fre 
606 |3 PPN190453095  |a Allographes alphabétiques  |2 rameau 
606 |3 PPN027882705  |a Écriture  |x Identification  |3 PPN027234886  |x Informatique  |2 rameau 
608 |3 PPN027253139  |a Thèses et écrits académiques  |2 rameau 
608 |3 PPN027253139  |a Thèses et écrits académiques  |2 rameau 
686 |a 004  |2 TEF 
700 1 |3 PPN268121907  |a Tan  |b Guoxian  |f 1981-....  |4 070 
701 1 |3 PPN098591045  |a Viard-Gaudin  |b Christian  |4 727 
701 1 |3 PPN268122318  |a Kot  |b Alex  |f 19XX-....  |4 727 
701 1 |3 PPN268122148  |a Siyal  |b Mohammed Yakoob  |f 19XX-....  |4 956 
701 1 |3 PPN115551573  |a Campisi  |b Patrizio  |f 1968-  |4 958 
701 1 |3 PPN068943229  |a Paquet  |b Thierry  |f 1964-....  |c enseignant-chercheur en informatique  |4 958 
711 0 2 |3 PPN026403447  |a Université de Nantes  |c 1962-2021  |4 295 
711 0 2 |3 PPN090209400  |a Nanyang Technological University  |c Singapour  |4 295 
711 0 2 |3 PPN187401039  |a Université Nantes-Angers-Le Mans - COMUE  |c 2009-2015  |4 295 
711 0 2 |3 PPN068449399  |a École polytechnique de l'Université de Nantes  |4 295 
711 0 2 |3 PPN134103211  |a École doctorale Sciences et technologies de l'information et mathématiques  |c Nantes  |4 295  |4 996 
711 0 2 |3 PPN113164726  |a Institut de recherche en communications et cybernétique  |c Nantes  |f 1958-2017  |4 295  |4 981 
801 3 |a FR  |b Abes  |c 20230227  |g AFNOR 
856 4 |q PDF  |u https://archive.bu.univ-nantes.fr/pollux/show/show?id=1c1e771d-76c3-4c1a-bc58-950471cbb375  |z Accès au texte intégral 
979 |a SCI 
930 |5 441092104:778701123  |b 441092104  |j u 
998 |a 659305