Correction of printed characters using image processing: the case of cut characters

 

Antoine Luijkx, Faculté Polytechnique de Mons, juin 2004

 

Ce travail de fin d’études a pour but d’explorer le domaine de la reconnaissance de caractères dans le cadre des caractères coupés (des caractères coupés sont des caractères incomplets, comme dans le cas de la figure 1).

 

Figure 1. Exemple de caractères coupés.

 

Des images du type de la figure 1 peuvent notamment apparaître assez fréquemment dans un contexte portable (PDA,…). Toutefois, la reconnaissance de caractères classique ne fonctionne pas sur les caractères coupés et ce problème est très peu traité dans la littérature. Le but était donc de construire un algorithme permettant de traiter le cas de ces caractères coupés, en se basant sur une chaîne de reconnaissance de caractères déjà existante (basée sur des réseaux de neurones).

 

La première partie de ce TFE étudie la détection des caractères coupés (c’est-à-dire répondre à la question : « Le caractère est-il coupé  ? »). Pour cela, différentes approches ont été envisagées et un réseau de neurones dédicacé a finalement été construit.

 

Dans une deuxième partie, ce TFE s’est intéressé à la reconnaissance de ces caractères par prolongation des caractères coupés (c’est-à-dire leur reconstruction, comme dans le cas de la figure 2, où plusieurs prolongations sont envisageables).

 

Figure 2. Différentes prolongations possibles pour le caractère coupé à l'extrême gauche.

 

Une fois les caractères prolongés, un algorithme a été développé pour permettre leur reconnaissance. Cet algorithme est basé sur l’emploi de réseaux de neurones modulaires. L’algorithme final est présenté à la figure 3. L’utilisation des différents traitements a permis l’amélioration des taux de reconnaissance de 48% (20 % pour une reconnaissance classique, non adaptée contre 68 % pour le nouvel algorithme). Toutefois, du travail sur une analyse linguistique (post-processing) adaptée aux caractères coupés reste à faire…

 

Enfin, signalons que ce TFE a conduit à la présentation d’un article dans une conférence de traitement d’image (ICCVG 2004) qui s’est déroulée en Pologne.

Figure 3. Algorithme final