Rami Al-Haji & Chafic Mokbel & Laurence Likforman-Sulem, 2008

Identification

El-Hajj, R., Mokbel, C., & Likforman-Sulem, L. (2008). Recognition of Arabic handwritten words using contextual character models. In B. A. Yanikoglu & K. Berkner (Eds.), Document Recognition and Retrieval XV (Vol. 6815, p. 681503). SPIE. Lien

Papier de recherche qui porte sur un algorithme de reconnaissance des glyphes arabes.

Idée 1

Des modèles contextuels sont utilisés pour identifier les lettres arabes qui ont tendance à se chevaucher. Le modèle s’entraine non seulement sur des caractères isolés, mais aussi liés deux à deux.

Idée 2

La reconnaissance des symboles se fait de manière segmentée. Autrement dit, plutôt que de réaliser l’apprentissage du modèle en découpant chaque caractère 1 à 1, il est plus pratique d’apprendre des séquences de traits/caractéristiques spécifiques aux différents caractères.

Lecture associées

« Handwritten Arabic text recognition using multi-stage sub-core shape HMMs »,(Ahmad & Fink, 2019)

Cet article propose de séparer les formes de base des lettres et les diacritiques, et de les représenter via des sous-formes (“sub-core shapes”), puis de modéliser contextuellement ces éléments dans un cadre HMM similaire à celui de l’article présenté ci-dessus.

Lien vers l’article