Visual Basic - TEXTO PDF ESCANEADO

Life is soft - evento anual de software empresarial
 
Vista:
Imágen de perfil de JAIME
Val: 18
Ha aumentado su posición en 96 puestos en Visual Basic (en relación al último mes)
Gráfica de Visual Basic

TEXTO PDF ESCANEADO

Publicado por JAIME (11 intervenciones) el 14/01/2019 18:54:22
Qué tal?, espero se encuentren bien, me surgió la siguiente duda:

¿Existe alguna manera de extraer el texto de un pdf escaneado con alguna macro de vb en excel?

Estaba leyendo algo sobre la tecnología OCR y pues me interesa mucho ya que necesito hacerle una lista a mi jefe de los materiales con los nombres de cada pieza y es un proceso que realizamos se hace manualmente y es bastante tardado, o alguna idea que puedan darme para apoyarme? son demasiados pdfs y regularmente son planos (dibujos) de ensamble, cuentan con un número de parte y una descripción de lo que es el ítem.

Saludos y gracias por leer.
Valora esta pregunta
Me gusta: Está pregunta es útil y esta claraNo me gusta: Está pregunta no esta clara o no es útil
0
Responder
Imágen de perfil de Antoni Masana
Val: 1.138
Bronce
Ha mantenido su posición en Visual Basic (en relación al último mes)
Gráfica de Visual Basic

TEXTO PDF ESCANEADO

Publicado por Antoni Masana (401 intervenciones) el 15/01/2019 10:12:27
Buscando en google he encontrado esto:

Definición de OCR. OCR es la sigla de Optical Character Recognition, una expresión en lengua inglesa que puede traducirse como Reconocimiento Óptico de Caracteres. La noción se utiliza en la informática para nombrar a un procedimiento que permite digitalizar un texto a través de un escáner.

Conclusión: Necesitar imprimir los PDF y con un escanear que tenga OCR leerlos.

Otra cosa es poder entrar en las tripas de un PDF desde código y leer el texto. Esta sería la mejor forma si descubres como es la estructura del fichero PDF.

Otra opción es abrir el PDF con el Acrobat Reader y seleccionar el texto, que a veces no se puede y un COPIAR y PEGAR

Saludos.
\\//_
Valora esta respuesta
Me gusta: Está respuesta es útil y esta claraNo me gusta: Está respuesta no esta clara o no es útil
1
Comentar
Imágen de perfil de JAIME
Val: 18
Ha aumentado su posición en 96 puestos en Visual Basic (en relación al último mes)
Gráfica de Visual Basic

TEXTO PDF ESCANEADO

Publicado por JAIME (11 intervenciones) el 15/01/2019 15:20:23
Gracias Antoni por tu pronta respuesta, tu respuesta me ha quedado clara.

Saludos cordiales.

|/|
Valora esta respuesta
Me gusta: Está respuesta es útil y esta claraNo me gusta: Está respuesta no esta clara o no es útil
0
Comentar
sin imagen de perfil
Val: 193
Ha aumentado su posición en 3 puestos en Visual Basic (en relación al último mes)
Gráfica de Visual Basic

TEXTO PDF ESCANEADO

Publicado por raul (62 intervenciones) el 19/01/2019 01:18:07
Como bien te han explicado la tecnologia OCR solo es aplicables para fotos o documentos escaneados. ahora bien suponiendo que el contenido de los PDF fuera una fotografia vastaria con convertirlos y usar el OCR de microsoft o de cualquier impresora con escaner para leerlos. en cuanto a una macro o proyecto ; que se puede hacer; solo se podria si el contenido de campos del pdf fuera estandar o sea que la ubicación de los datos a buscar estubiera en una posición definida o con campos de identico nombre [Lo Dudo].

Creo que la solución más practica aparte del copia y pega es que investigues si el programa ensamble guarda datos extras en el pdf (cosa que hacen muchos programas) y a lo mejor puedes recuperar esta información
Valora esta respuesta
Me gusta: Está respuesta es útil y esta claraNo me gusta: Está respuesta no esta clara o no es útil
0
Comentar