Python - Extrar datos de PDF con Python

 
Vista:
sin imagen de perfil
Val: 1
Ha disminuido su posición en 15 puestos en Python (en relación al último mes)
Gráfica de Python

Extrar datos de PDF con Python

Publicado por fabian (3 intervenciones) el 31/08/2021 23:01:23
Hola. Hace rato que estoy tratando de extraer datos dentro de un PDF. No descubro como hacer referencia a algún campo. Llegué hasta extractText() que logro imprimir en pantalla todos los datos de un registro. Necesito tomar una información (ApellidoyNombre) que es el noveno campo y no llego a descubrir cómo hacer referencia a esa información. En esta instrucción pdfData=page1.extractText(), no hay forma de llegar a la info que quiero extraer?
El programa para ver info de PDF es este

import PyPDF2
file=open("AgostoPDF.pdf","rb")
reader=PyPDF2.PdfFileReader(file)
page1=reader.getPage(32)
print(reader.numPages)
pdfData=page1.extractText()
print(pdfData)

La info que me trae es esta

308
15039
2021
Agosto
12.968,05
Aporte Fondo Compensador
-6.264,82
31.764,64
Barcos Roxana Maria

Como hago para extraer: Barcos Roxana Maria

Gracias
Valora esta pregunta
Me gusta: Está pregunta es útil y esta claraNo me gusta: Está pregunta no esta clara o no es útil
0
Responder
sin imagen de perfil
Val: 1
Ha disminuido su posición en 15 puestos en Python (en relación al último mes)
Gráfica de Python

Extrar datos de PDF con Python

Publicado por fabian (3 intervenciones) el 20/09/2021 00:17:03
Hola, la respuesta es esta

import PyPDF4
import re
FILE_PATH = './MayoLFR.pdf'
with open(FILE_PATH,mode='rb') as f:
reader = PyPDF4.PdfFileReader(f)
for i in range(0,10):
page = reader.getPage(i)
txt = page.extractText()
res = re.split('\n',txt)
print(res[7], res[1], res[2])

De esta manera lista datos que tiene el PDF
Valora esta respuesta
Me gusta: Está respuesta es útil y esta claraNo me gusta: Está respuesta no esta clara o no es útil
0
Comentar