PHP - sacar string de documento

 
Vista:
sin imagen de perfil
Val: 336
Ha mantenido su posición en PHP (en relación al último mes)
Gráfica de PHP

sacar string de documento

Publicado por Alejandro (172 intervenciones) el 02/03/2020 08:41:20
Hola buenos dias, como estan?

Vereis queria saber como sacar una cadena de texto especifica de un documento para poder identificar de que trata ese documento pues tengo un formulario en que paso archivos pdf y debido a que esos pdf pueden ser documentos diferentes pues queria extraer ciertas cadenas de texto para poder clasificar esos documentos y guardarlos en sus carpetas respectivas. No se si se ha entendido bien. Gracias de antemano ;)
Valora esta pregunta
Me gusta: Está pregunta es útil y esta claraNo me gusta: Está pregunta no esta clara o no es útil
0
Responder
Imágen de perfil de Julio
Val: 2.007
Plata
Ha mantenido su posición en PHP (en relación al último mes)
Gráfica de PHP

sacar string de documento

Publicado por Julio (830 intervenciones) el 02/03/2020 08:46:08
Hola.

¿Lo que quieres es obtener un texto que está dentro de un PDF y leerlo desde PHP? Mírate aquí en el manual, que igual encuentras lo que buscas. En las notas, bajo del todo, hay alguien que ha puesto una función de ejemplo llamada pdf2string, que igual hace parte de lo que tú quieres.

-----------------------------
Aprende la programación desde una perspectiva básica y simplista en Programación Básica
Valora esta respuesta
Me gusta: Está respuesta es útil y esta claraNo me gusta: Está respuesta no esta clara o no es útil
0
Comentar
sin imagen de perfil
Val: 336
Ha mantenido su posición en PHP (en relación al último mes)
Gráfica de PHP

sacar string de documento

Publicado por Alejandro (172 intervenciones) el 02/03/2020 09:09:20
muchas gracias, le echare un ojo ;)
Valora esta respuesta
Me gusta: Está respuesta es útil y esta claraNo me gusta: Está respuesta no esta clara o no es útil
0
Comentar
sin imagen de perfil
Val: 336
Ha mantenido su posición en PHP (en relación al último mes)
Gráfica de PHP

sacar string de documento

Publicado por Alejandro (172 intervenciones) el 02/03/2020 10:11:37
hay cosas que no entiendo porque ese "0x0d" y "0x0a"???

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
function pdf2string($sourcefile) {
 
    $fp = fopen($sourcefile, 'rb');
    $content = fread($fp, filesize($sourcefile));
    fclose($fp);
 
    $searchstart = 'stream';
    $searchend = 'endstream';
    $pdfText = '';
    $pos = 0;
    $pos2 = 0;
    $startpos = 0;
 
    while ($pos !== false && $pos2 !== false) {
 
        $pos = strpos($content, $searchstart, $startpos);
        $pos2 = strpos($content, $searchend, $startpos + 1);
 
        if ($pos !== false && $pos2 !== false){
 
            if ($content[$pos] == 0x0d && $content[$pos + 1] == 0x0a) {
                $pos += 2;
            } else if ($content[$pos] == 0x0a) {
                $pos++;
            }
 
            if ($content[$pos2 - 2] == 0x0d && $content[$pos2 - 1] == 0x0a) {
                $pos2 -= 2;
            } else if ($content[$pos2 - 1] == 0x0a) {
                $pos2--;
            }
 
            $textsection = substr(
                $content,
                $pos + strlen($searchstart) + 2,
                $pos2 - $pos - strlen($searchstart) - 1
            );
            $data = @gzuncompress($textsection);
            $pdfText .= pdfExtractText($data);
            $startpos = $pos2 + strlen($searchend) - 1;
 
        }
    }
 
    return preg_replace('/(\s)+/', ' ', $pdfText);
 
}
Valora esta respuesta
Me gusta: Está respuesta es útil y esta claraNo me gusta: Está respuesta no esta clara o no es útil
0
Comentar
Imágen de perfil de joel
Val: 3.828
Oro
Ha mantenido su posición en PHP (en relación al último mes)
Gráfica de PHP

sacar string de documento

Publicado por joel (1269 intervenciones) el 02/03/2020 10:54:48
Hola Alejandro, si no voy equivocado...

0x0d equivale a CR (Carriage Return) "\r"
0x0a equivale a NL (new line) "\n"
Valora esta respuesta
Me gusta: Está respuesta es útil y esta claraNo me gusta: Está respuesta no esta clara o no es útil
0
Comentar
sin imagen de perfil
Val: 336
Ha mantenido su posición en PHP (en relación al último mes)
Gráfica de PHP

sacar string de documento

Publicado por Alejandro (172 intervenciones) el 02/03/2020 11:16:28
Entiendo pero porque hace esa asignacion, se supone que suma 2 cuando ambos parametros equivalen a \n y \r si solo es \n suma 1
Valora esta respuesta
Me gusta: Está respuesta es útil y esta claraNo me gusta: Está respuesta no esta clara o no es útil
0
Comentar
Imágen de perfil de Julio
Val: 2.007
Plata
Ha mantenido su posición en PHP (en relación al último mes)
Gráfica de PHP

sacar string de documento

Publicado por Julio (830 intervenciones) el 02/03/2020 11:21:24
Creo que tiene que ver con que en Unix se usa el \n para final de línea, en Macintosh se usa el \r y en Windows se usa el \r\n para final de línea.

-----------------------------
Aprende la programación desde una perspectiva básica y simplista en Programación Básica
Valora esta respuesta
Me gusta: Está respuesta es útil y esta claraNo me gusta: Está respuesta no esta clara o no es útil
0
Comentar
sin imagen de perfil
Val: 336
Ha mantenido su posición en PHP (en relación al último mes)
Gráfica de PHP

sacar string de documento

Publicado por Alejandro (172 intervenciones) el 02/03/2020 11:48:13
es un codigo un poco enrevesado :(
Valora esta respuesta
Me gusta: Está respuesta es útil y esta claraNo me gusta: Está respuesta no esta clara o no es útil
0
Comentar