Adobe Acrobat - Busqueda en pdf

 
Vista:

Busqueda en pdf

Publicado por leonardo (1 intervención) el 23/01/2002 00:08:41
hola, estimados amigos de la web, necesito saber si exite algun utilitario o rutina para buscar textos en archivos pdf, desde una pagina asp. es decir un buscador de palabras que busque coincidencias en archivos pdf.
desde ya gracias
Valora esta pregunta
Me gusta: Está pregunta es útil y esta claraNo me gusta: Está pregunta no esta clara o no es útil
0
Responder
Imágen de perfil de Alejandro

Búsqueda de textos en archivos PDF desde una página ASP

Publicado por Alejandro (154 intervenciones) el 03/07/2023 20:11:28
Una solución para buscar textos en archivos PDF desde una página ASP es utilizar la biblioteca Adobe Acrobat y realizar la siguiente implementación:

1. Asegúrate de tener instalada la biblioteca Adobe Acrobat en tu servidor. Puedes descargarla e instalarla desde el sitio web oficial de Adobe.

2. En tu página ASP, utiliza el siguiente código para buscar coincidencias de palabras en archivos PDF:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
<%
Dim objApp, objAVDoc, objPDDoc, objHilite, objMatch
Dim strFilePath, strSearchText
 
' Ruta del archivo PDF '
strFilePath = "Ruta\Archivo.pdf"
 
' Texto a buscar en el archivo PDF '
strSearchText = "TextoABuscar"
 
' Crea una instancia de la aplicación Acrobat '
Set objApp = Server.CreateObject("AcroExch.App")
 
' Crea una instancia del documento AV '
Set objAVDoc = Server.CreateObject("AcroExch.AVDoc")
 
' Abre el archivo PDF '
If objAVDoc.Open(strFilePath, "") Then
    ' Crea una instancia del documento PD '
    Set objPDDoc = objAVDoc.GetPDDoc()
 
    ' Crea una instancia del objeto de búsqueda '
    Set objHilite = Server.CreateObject("AcroExch.HiliteList")
 
    ' Realiza la búsqueda de texto en el archivo PDF '
    Set objMatch = objPDDoc.FindText(strSearchText, 0, 0, objHilite)
 
    ' Recorre las coincidencias encontradas '
    While Not objMatch Is Nothing
        ' Obtiene la página de la coincidencia '
        Dim intPageNum
        intPageNum = objMatch.GetPageNum()
 
        ' Muestra el número de página y la posición del texto encontrado '
        Response.Write "Coincidencia encontrada en la página " & intPageNum & ": " & objMatch.GetText & "<br>"
 
        ' Avanza a la siguiente coincidencia '
        Set objMatch = objPDDoc.FindText(strSearchText, intPageNum, 0, objHilite)
    Wend
 
    ' Cierra el documento PD '
    objPDDoc.Close
 
    ' Cierra el documento AV '
    objAVDoc.Close True
Else
    Response.Write "No se pudo abrir el archivo PDF"
End If
 
' Cierra la aplicación Acrobat '
objApp.Exit
Set objApp = Nothing
%>

Asegúrate de reemplazar "Ruta\Archivo.pdf" con la ruta y nombre del archivo PDF en el que deseas buscar y "TextoABuscar" con el texto que deseas encontrar.

Este código crea una instancia de la aplicación Adobe Acrobat, abre el archivo PDF utilizando el documento AV (AcroAVDoc) y realiza la búsqueda de texto en el documento PD (AcroPDDoc). Luego, recorre las coincidencias encontradas y muestra información sobre cada una, como el número de página y la posición del texto.

Recuerda que es necesario tener instalada la biblioteca Adobe Acrobat en el servidor y que esta solución se basa en el uso de dicha biblioteca.

Espero que esta solución te sea útil para buscar textos en archivos PDF desde una página ASP.
Valora esta respuesta
Me gusta: Está respuesta es útil y esta claraNo me gusta: Está respuesta no esta clara o no es útil
0
Comentar