Rami Al-Haji & Chafic Mokbel & Laurence Likforman-Sulem, 2008
Identification
El-Hajj, R., Mokbel, C., & Likforman-Sulem, L. (2008). Recognition of Arabic handwritten words using contextual character models. In B. A. Yanikoglu & K. Berkner (Eds.), Document Recognition and Retrieval XV (Vol. 6815, p. 681503). SPIE. Lien
Papier de recherche qui porte sur un algorithme de reconnaissance des glyphes arabes.
Idée 1
Des modèles contextuels sont utilisés pour identifier les lettres arabes qui ont tendance à se chevaucher. Le modèle s’entraine non seulement sur des caractères isolés, mais aussi liés deux à deux.
Idée 2
La reconnaissance des symboles se fait de manière segmentée. Autrement dit, plutôt que de réaliser l’apprentissage du modèle en découpant chaque caractère 1 à 1, il est plus pratique d’apprendre des séquences de traits/caractéristiques spécifiques aux différents caractères.
Lecture associées
« Handwritten Arabic text recognition using multi-stage sub-core shape HMMs »,(Ahmad & Fink, 2019)
Cet article propose de séparer les formes de base des lettres et les diacritiques, et de les représenter via des sous-formes (“sub-core shapes”), puis de modéliser contextuellement ces éléments dans un cadre HMM similaire à celui de l’article présenté ci-dessus.