Sacar links de una web para un spider
Publicado por Raul (1 intervención) el 14/01/2008 15:22:08
Hola, estamos implementando un robot spider para un buscador que a partir de una pagina web indexe los contenidos de todo el dominio de la misma.
La cosa es que necesitamos que a partir de la urls base pasada como parametro coga los links de esta y haga un document por cada enlace (indexador). Estamos un poco perdidos en el tema de como extraer los enlaces de una pagina o de un document.
A ver si alguno de vosotros nos puede echar una manita.
La cosa es que necesitamos que a partir de la urls base pasada como parametro coga los links de esta y haga un document por cada enlace (indexador). Estamos un poco perdidos en el tema de como extraer los enlaces de una pagina o de un document.
A ver si alguno de vosotros nos puede echar una manita.
Valora esta pregunta


0