PHP - Extraer links de un archivo HTML

 
Vista:

Extraer links de un archivo HTML

Publicado por Carlos (6 intervenciones) el 05/04/2008 22:51:44
Necesito extraer los enlaces (o links) que tiene una página HTML, es decir, necesito el contenido de todos los HREF de las etiquetas <A href='...' ....> que estan en el documento HTML.
Que funciones hay en PHP para este fin, al menos funciones para extraerlo desde un STRING.
Gracias
Carlos
Valora esta pregunta
Me gusta: Está pregunta es útil y esta claraNo me gusta: Está pregunta no esta clara o no es útil
0
Responder

RE:Extraer links de un archivo HTML

Publicado por ambrosio (38 intervenciones) el 08/04/2008 10:05:31
<?php
function extrae ($url){
$pag = file_get_contents ($url);
$direcciones = Array ();

while (preg_match ("@(.*?)<a(.*?)href=["'](.*?)["'](.*)@si", $pag, $datos)){
array_push ($direcciones, $datos[3]);
$pag = $datos[4];
}

return ($direcciones);
}

$lista = extrae ("http://www.lawebdelprogramador.com");
echo "<ul>";
foreach ($lista as $url)
echo "<li>$url</li>";
echo "</ul>";
?>
Valora esta respuesta
Me gusta: Está respuesta es útil y esta claraNo me gusta: Está respuesta no esta clara o no es útil
0
Comentar