hasta donde se los ocr funcionan a traves de una lista de patrones de imagenes para reconocer el texto, si entras aqui tendras una idea http://www.ct.upc.es/departaments/eel/JCEE/JCEE2002/Aldabas.pdf
Otra cosa, en vez de usar 1 y 2, te recomiendo usar valores binaros, 0 para falso, 1 para cierto , como normalmente se estipula, asi luego es mas manejable y convertible en base de datos y es aun mejor ya que la variable que lo contendra sera boleana, o de byte y esas ocupan menos espacio.
La verdad deberias de preguntar a la gente que hacen los OCR, por ejemplo el ABBYY Fine Reader que es muy bueno. o si te vas a algo basico, hay un programa que es para extraer subtitulos de DVD (no recuerdo como se llama SUBRIP creo) que el lo que hace es como te digo tiene una base de caracteres y te la muestra y todo para agregar o cambiar, y hace una lectura de las imagenes de los subtitulos y te las convierte a txt.
Lo bueno de ese es que puedes guardar los nuevos caracteres reconocidos, porque por ejemplo en tu caso, todos no escribimos iguales, y mi V sera muy distinta de tu V, y necesitaras una base mas grande para comparar para que se parecida, segun porcentajes de error que tenga.
Suerte.