Extraer texto de un pdf con itext
Publicado por Camilo (20 intervenciones) el 29/09/2020 05:13:01
Buenas.
Estoy tratando de extraer el texto de un pdf, pero el método que tengo me devuelve null.
Este es el método:
Tambien he tratado con PDFBox pero no me sirvió. lo ideal es que no haya problema si el pdf tiene imágenes o alguna otra cosa, sin embargo no me funciona tampoco con un pdf con solo texto.
De antemano gracias.
Estoy tratando de extraer el texto de un pdf, pero el método que tengo me devuelve null.
Este es el método:
1
2
3
4
5
6
7
8
9
10
11
12
13
public String cargarPdf(File archivoPDF) {
String texto="";
try {
PdfReader reader = new PdfReader(archivoPDF.getPath());
System.out.println(reader.getNumberOfPages());
for(int i=0 ; i<reader.getNumberOfPages(); i++) {
texto= texto+ PdfTextExtractor.getTextFromPage(reader, i);
}
reader.close();
}catch(Exception e) {
System.out.println("Excepcion cargando pdf" +e.getStackTrace());
}
return texto;
Tambien he tratado con PDFBox pero no me sirvió. lo ideal es que no haya problema si el pdf tiene imágenes o alguna otra cosa, sin embargo no me funciona tampoco con un pdf con solo texto.
De antemano gracias.
Valora esta pregunta


0