PDF de programación - Sistema de reconocimiento de caracteres para la lectura automática de cheques

Volver

<<>>

Sistema de reconocimiento de caracteres para la lectura automática de cheques

Actualizado el 4 de Julio del 2021 (Publicado el 24 de Febrero del 2017)

772 visualizaciones desde el 24 de Febrero del 2017

140,6 KB

5 paginas

Creado hace 22a (10/06/2003)

Sistema de reconocimiento
de caracteres para la lectura

automática de cheques

El volumen de cheques que deben procesar los bancos actualmente conlleva unos
costes que crecen cada año. El interés por automatizar el procesamiento de che-
ques ha llevado al desarrollo del sistema que se presenta en este artículo. Dicho
sistema utiliza técnicas de reconocimiento óptico de caracteres basadas en redes
neuronales para leer el valor del cheque.

Introducción

Debido al aumento del número de transac-
ciones que no se realizan en metálico, el volu-
men de cheques que se procesa actualmente
es grande. Alrededor de 50.000 millones de
cheques se procesan anualmente en los Esta-
dos Unidos, lo que constituye el 60% de los
pagos que no se realizan en metálico, según el
informe del Federal Reserve Bank [1]. A pesar
del aumento de otros mecanismos de pago
como la tarjeta de crédito o el pago electrónico,
que se automatizan con mayor facilidad, los
cheques siguen siendo un mecanismo legal
para efectuar pagos y no han experimentado
la disminución esperada. Por otro lado, el coste
derivado del procesamiento de cada cheque
es alto por tratarse de un método lento y que
requiere mucho esfuerzo humano. El coste
social de cada transacción por cheque se ha
estimado entre $2.78 y $3.09 [9], siendo un
coste que crece cada año.

Al digitalizarse la imagen del cheque y leer
automáticamente su valor, se puede agilizar
el proceso de validación del cheque, espe-
cialmente si se emplean nuevas tecnologías
de comunicación basadas en Internet [6].
Además también se reducen los costes aso-
ciados a la devolución de cheques ya que el

papel quedaría almacenado en el bando de
depósito en lugar de haber sido enviado y
retornado en camiones blindados.

Actualmente sólo pueden leerse de mane-
ra automática los códigos relacionados con
el número de cuenta y número de cheque
que están escritos en el cheque con tinta
magnética (ver Figura 1). En Estados Unidos
se utiliza el conjunto de símbolos E-13B,
creado en 1958 por la Asociación Americana
de Banqueros, y en España y otros países se
utiliza el conjunto de símbolos CMC-7 OCR.
El diseño utilizado en estos números se ha
optimizado para minimizar los errores del
lector magnético [3]. El resto de la informa-
ción está manuscrita en la mayoría de los
casos, más aún cuando muchos de los che-
ques mecanografiados, generados por sistemas
automáticos de pago (como los cheques de
nóminas) han sido sustituidos por métodos
electrónicos de pago.

El presente artículo describe un sistema
desarrollado por Massachusetts Institute of
Technology con la colaboración de la Uni-
versidad Pontificia Comillas, para leer el valor
de un cheque. Parte de la tecnología que se
presenta está protegida por una patente
(U.S. Patent No. 5633954, 1997).

Rafael Palacios
Escuela Técnica Superior de Ingeniería
ICAI, Universidad Pontificia Comillas

Amar Gupta
Sloan School of Management, Massa-
chusetts Institute of Technology

2

anales de mecánica y electricidad. Mayo-Junio 2003

Figura 1.Tipos de letra estándar para lectura automática del número de cuenta y número de cheque

Ejemplo E-13B

Ejemplo CMC-7

Descripción del Sistema de
Reconocimiento

El procedimiento para leer el valor de un
cheque comienza escaneando el papel para
generar una imagen digital que se almacena
en el ordenador. Dicha imagen se obtiene
generalmente en escala de grises, ya que la
información del color no es relevante en esta
aplicación, y se convierte posteriormente a
blanco y negro (imagen binaria) para separar
el fondo del cheque del texto. Posteriormente
el sistema debe localizar la cadena de texto
que representa el valor numérico del cheque,
lo cual depende del formato del cheque y de
pequeños errores de desplazamiento y rota-
ción de la imagen. Después de estos pasos ini-
ciales, el sistema debe realizar la difícil tarea de
convertir la imagen del valor del cheque en el
número correspondiente (ver Figura 2).

Esta última etapa constituye el paso más
difícil, y por lo tanto más interesante, del pro-
cesamiento de la imagen del cheque. Nuestra
táctica para leer el valor del cheque está
esquematizada en la Figura 3 [7].

Una vez localizada la zona de la imagen
que contiene el valor del cheque, el sistema
debe reconocer los números que allí están
escritos. El reto más importante es el proce-
so de segmentación, que consiste en separar
la imagen del valor del cheque en dígitos indi-
viduales. En caso de texto manuscrito resulta
especialmente crítico separar o agrupar con-
venientemente los trazos que aparecen en la
imagen para formar los dígitos correctos. Por
ejemplo, la Figura 4(a) muestra un valor en el
cual el número ‘2’ está conectado con el nú-
mero ‘9’ y debe separarse. Por el contrario en
la Figura 4(b) el número ‘5’ está dividido en
dos trazos que deben unirse para formar un
solo dígito. Nuestro sistema de reconoci-
miento permite probar distintos algoritmos
de separación y de unión hasta encontrar la
solución que se reconoce correctamente.

El módulo de reconocimiento de dígitos
utiliza una serie de algoritmos de normaliza-

Figura 2. Pasos básicos del reconocimiento de cheques

ción y un clasificador basado en redes neuro-
nales. Este módulo debe ser muy eficiente ya
que el bucle general de segmentación lo utiliza
intensamente. Finalmente existe un módulo
de verificación sintáctica que se encarga de
verificar que el resultado del sistema tiene
sentido como cantidad monetaria. En este
módulo básicamente se comprueba la rela-
ción entre número de dígitos y los signos de

Sistema de reconocimiento de caracteres para la lectura automática de cheques 3

Figura 3. Esquema general de la táctica de reconocimiento

Localización de la cantidad

Segmentación

Reconocimiento

Post-Procesado

Binarización de la imagen

Método Hybrid Drop Fall

Localización de la cantidad

Método Extended Drop Fall

Normalización

Redes neuronales

Evaluación conjunta

Verificación Sintáctica

Figura 4. Ejemplos de valores de cheques

Figura 5. Proceso de segmentación y reconocimiento

4

anales de mecánica y electricidad. Mayo-Junio 2003

puntuación que actúan como separadores
decimales o agrupadores. Se describen a con-
tinuación el módulo de segmentación y el
módulo de reconocimiento, que constituyen
las partes fundamentales del sistema.

Segmentación

Una manera bastante efectiva de extraer
caracteres de una imagen en blanco y negro
es buscar los conjuntos de píxeles que cum-
plen una relación de conexión entre sí. En la
mayoría de los casos este método proporcio-
na caracteres bien segmentados que pueden
analizarse sin problemas en el módulo de
reconocimiento. Pero si dos o más dígitos se
están tocando, lo cual ocurre con bastante
frecuencia en el caso de textos manuscritos,
entonces resulta necesario separarlos antes
de poder reconocerlos (ver Figura 5).

Es difícil separar caracteres que se están to-
cando ya que no es evidente encontrar el ca-
mino óptimo para definir la frontera entre dos
caracteres.Varios algoritmos de separación se
utilizan en este módulo para poder obtener el
camino de separación correcto [7]. Estos algo-
ritmos se basan en la analogía de una gota de
ácido que va cayendo por acción de la grave-
dad y escurre por el borde de los caracteres,
pero cuando no se puede desplazar empieza a
fundir la tinta y crea un corte de separación.
Este algoritmo se pude aplicar en distintas
direcciones y con pequeñas variantes, lo que
da lugar a diversas maneras de separar los
caracteres conectados (ver Figura 6).

El sistema analiza sistemáticamente cada
posibilidad de separación hasta encontrar la
solución óptima. En principio, si un camino
de separación no es válido los segmentos re-
sultantes no serán digitos y el sistema de re-
conocimiento los rechaza (por ejemplo en el
tercer caso de la Figura 6). Asimismo el siste-
ma de reconocimiento rechaza cualquier
símbolo formado por una pareja de dígitos,
porque dicho símbolo no coincide con nin-
guno de los patrones básicos de los dígitos

Figura 6. Resultados de 8 algoritmos

Drop-Fall en el caso de un

‘0’ conectado a un ‘5’

Figure 7. Proceso de normalización

Figura 8. Digitos obtenidos de cheques de Brasil

aislados. El hecho de que un símbolo haya
sido rechazado aporta una información signi-
ficativa para el sistema de segmentación, ya
que éste decide la estrategia de aplicación
de los algoritmos de segmentación en fun-
ción del éxito de los resultados.

Módulo de Reconocimiento
de Dígitos

El módulo de reconocimiento identifica el
número que está contenido en cada imagen
producida por el método de segmentación.
Estas imágenes tienen resolución alta y dimen-
siones variables, por lo que deben normalizar-
se antes de llamar al clasificador. El proceso de
normalización tiene como objetivo obtener
muestras parecidas, en cuanto dimensiones y
aspecto, y corregir ciertos efectos de la escri-
tura manuscrita. La normalización incluye co-
rrección de la inclinación, espesor del trazo y
tamaño [4]. Se ha comprobado experimental-
mente que el proceso de normalización tiene
buenos resultados cuando se aplica en 5 fases,
tal y como se muestra en la Figura 7.

La corrección de la inclinación convierte
en líneas verticales los trazos que se hayan
escrito con cierta inclinación, pero sin modi-
ficar los trazos horizontales. Esta corrección
mejora el rendimiento del clasificador ya que
obtiene números más parecidos entre sí para
cualquier estilo de escritura. La primera ope-
ración de escalado aumenta o disminuye el
tamaño de la imagen original para obtener
una imagen de tamaño estándar 39x27, que
tiene buena resolución. La normalización del
espesor se realiza obteniendo el esqueleto y
luego dilatándolo, con objeto de conseguir
un trazo uniforme de unos 3 pixels de espe-
sor. Finalmente se realiza un segundo escala-
do para reducir el tamaño a una matriz de
13x9. El resultado final es una imagen pequeña
que sólo tiene 117 puntos, pero que repre-
senta perfectamente el dígito escrito.

Después del proceso de normalización