Writing style modelling based on grapheme distributions application to on-line writer identification

In this work, we propose to model the unique handwritten style of a person by computing the grapheme distribution produced by this writer. This distribution is computed from any text with a few lines. First, representative grapheme prototypes are automatically defined at the character level with a c...

Description complète

Enregistré dans:
Détails bibliographiques
Auteurs principaux : Tan Guoxian (Auteur), Viard-Gaudin Christian (Directeur de thèse), Kot Alex (Directeur de thèse), Siyal Mohammed Yakoob (Président du jury de soutenance), Campisi Patrizio (Rapporteur de la thèse), Paquet Thierry (Rapporteur de la thèse)
Collectivités auteurs : Université de Nantes 1962-2021 (Organisme de soutenance), Nanyang Technological University Singapour (Organisme de soutenance), Université Nantes-Angers-Le Mans - COMUE 2009-2015 (Organisme de soutenance), École polytechnique de l'Université de Nantes (Organisme de soutenance), École doctorale Sciences et technologies de l'information et mathématiques Nantes (Organisme de soutenance), Institut de recherche en communications et cybernétique Nantes 1958-2017 (Ecole doctorale associée à la thèse)
Format : Thèse ou mémoire
Langue : anglais
Titre complet : Writing style modelling based on grapheme distributions application to on-line writer identification / Guoxian Tan; sous la direction de Christian Viard-Gaudin ; co-directeur Alex Kot
Publié : Nantes : Université de Nantes , 2013
Accès en ligne : Accès Nantes Université
Note sur l'URL : Accès au texte intégral
Reproduction de : Reproduction numérique de l'original imprimé
Note de thèse : Reproduction de : Thèse de doctorat : Informatique, automatique et informatique appliquée : Nantes : 2013
Reproduction de : Thèse de doctorat : Informatique, automatique et informatique appliquée : Nanyang : 2013
Sujets :
Documents associés : Reproduction de: Writing style modelling based on grapheme distributions application to on-line writer identification
Description
Résumé : In this work, we propose to model the unique handwritten style of a person by computing the grapheme distribution produced by this writer. This distribution is computed from any text with a few lines. First, representative grapheme prototypes are automatically defined at the character level with a clustering algorithm. These prototypes should cover the variability of the different writing styles. Next, the modeling distribution of two writing styles can be compared, which allows to proceed to writer identification from a reference dataset of documents and a questioned document. The query, unknown writer document, is matched again all the reference documents. For this purpose, the proposed framework segments and recognizes the text at the character level and then performs a fuzzy function assignment to the corresponding prototypes of all the letters. Some important issues are raised. They concern the number of prototypes for representing a letter, the choice of a metric to compare two distributions, the discriminative power of the alphabet letters, the effect of the length of the texts. Two datasets with different complexities have been used to assess the performances of the proposed system. A writer identification rate of 99.2% has been reached with a set of 120 French writers, whereas with a bigger set of 200 English writers, the identification rate is of 87%. This method has been applied on on-line handwriting where the available signal which defines the sampled trajectory of the writing tool is available as a sequence of points
Dans cette thèse nous proposons de modéliser le style d écriture manuscrite spécifique d une personne en utilisant pour un scripteur donné la distribution de l usage de prototypes de graphèmes. Cette distribution est calculée à partir d un texte quelconque de quelques lignes. Les prototypes résultent d un clustering préalable et indépendant permettant de recenser la variabilité des styles d écriture. Cette modélisation permet de comparer deux styles d écriture et de procéder à l identification d un scripteur à partir d une base de documents de référence. La comparaison est basée sur une mesure de mise en correspondance des distributions obtenues. Pour cela, un système automatique segmente le texte en lettres, puis classe chaque lettre de manière probabiliste parmi les prototypes disponibles pour cette lettre. Une analyse portant sur le choix du nombre de prototypes, la nature de la distance utilisée pour la comparaison, le caractère discriminant des différentes lettres de l alphabet, et la longueur du texte disponible est proposée. Deux bases de complexité différentes sont utilisées pour évaluer ce système. Un taux d identification de 99,2 % est obtenu sur une base de recherche de 120 textes écrits en français, tandis qu il se situe à 87 % sur une base de recherche de 200 textes écrits en anglais. Cette méthode est développée sur de l écriture en ligne où le signal d écriture représentant la trajectoire de l instrument d écriture est disponible sous la forme d une séquence de points
Variantes de titre : Modélisation des styles d écriture basée distributions de graphèmes Application à l identification de scripteurs
Notes : Thèse soutenue en cotutelle
L'impression du document génère 150 p.
Ecole(s) Doctorale(s) : École doctorale sciences et technologies de l'information et de mathématiques (STIM) (Nantes)
Partenaire de recherche : Institut de recherche en communications et cybernétique (IRCCYN) (Nantes) (Laboratoire)
Autre(s) contribution(s) : Mohammed Yakoob Siyal (Président du jury) ; Patrizio Campisi, Thierry Paquet (Rapporteurs)
Configuration requise : Un logiciel capable de lire un fichier au format PDF
Bibliographie : Bibliogr. p. 138-147, 80 réf.