Java - Recuperar datos de PDF

 
Vista:

Recuperar datos de PDF

Publicado por Carlos (2 intervenciones) el 29/07/2009 14:08:15
Buenas. Mi problema es que tengo que crear un programa que dado un pdf (que contendrá un listado de clientes de la empresa), me genere un documento de texto plano con algún caracter especial (un ; por ejemplo) que delimite los diferentes campos en el pdf. He visto que existen algunas bibliotecas como pdfbox para convertir un pdf a texto plano, pero el asunto está en la delimitación de campos, ya que algunos me los separa con espacios, pero otros me los pone todo seguido; además la existencia de algún espacio entre datos no implica que pertenezcan a campos diferentes obligatoriamente. Se supone que yo la longitud de los campos no la puedo saber, así que, ¿existe algún tipo de información en el pdf que pueda servirme para este propósito? ¿O quizá hay algo diferente que pueda probar?

Saludos y perdón por la parrafada.
Valora esta pregunta
Me gusta: Está pregunta es útil y esta claraNo me gusta: Está pregunta no esta clara o no es útil
0
Responder