Yassine Chajri, 2018

Identification

CHAJRI Yassine. (2018). Contribution à la reconnaissance des documents mathématiques manuscrits. Toubkal. Lien

Chapitre 1 d’une thèse sur le traitement d'images.

Idée 1

L'auteur différencie deux principes : La reconnaissance hors-ligne et la reconnaissance en ligne.

  • La reconnaissance en ligne est lorsqu'une tablette graphique ou un autre outil numérique enregistre le tracé en direct de son écriture.

  • En revanche, la reconnaissance hors-ligne désigne la reconnaissance de l'écriture manuscrite sur un papier. Le principe est que cette écriture, qui a été scannée ou photographiée, est ensuite déchiffrée numériquement.

Dans le contexte du projet Diser, c’est la reconnaissance hors-ligne qui nous intéresse davantage.

Idée 2

Les symboles sont très présents dans l'écriture mathématique. Cependant, elle est difficile à déchiffrer car elle compte près de 250 symboles, qui sont :

  • Les lettres de l’alphabet Arabe, de l’alphabet Latin (majuscule et minuscule) et de l’alphabet Grec

  • Les chiffres Arabes (٠,١,٢,٣,_,_,_,٧,٨,٩), Chiffres Latins (0, 1, 2,….., 9), Chiffres Romains (I, II, …., X). 

  • Les opérateurs arithmétiques (+ ; - ; * ; : )

La difficulté pour les déchiffrer réside dans la similarité entre ces lettres/symboles. Certains symboles doivent être reconnus dans leur contexte. L'exemple de l'auteur est : B et bêta.

De plus, reconnaître un symbole qui est en indice ou en exposant est aussi un enjeu. L’on peut s’interroger à quel moment la reconnaissance doit-elle considérer que c'est plutôt indice, plutôt exposant ou bien en position neutre ? On pourrait considérer, par exemple, que dès que le symbole dépasse en bas de la lettre principale et n'atteint pas le haut de cette lettre, alors il est considéré comme en indice.

Lectures associées

Recognition of Arabic handwritten words using contextual character models, Ramy El-Haji, Chafic Mokbel, Laurence Likforman-Sulem, 2008

Lien vers l’article

Il s’agit d’un article qui traite aussi de la reconnaissance des symboles. Cependant, il se concentre sur l’écriture arabe.