Java - Sacar links de una web para un spider

 
Vista:

Sacar links de una web para un spider

Publicado por Raul (1 intervención) el 14/01/2008 15:22:08
Hola, estamos implementando un robot spider para un buscador que a partir de una pagina web indexe los contenidos de todo el dominio de la misma.

La cosa es que necesitamos que a partir de la urls base pasada como parametro coga los links de esta y haga un document por cada enlace (indexador). Estamos un poco perdidos en el tema de como extraer los enlaces de una pagina o de un document.

A ver si alguno de vosotros nos puede echar una manita.
Valora esta pregunta
Me gusta: Está pregunta es útil y esta claraNo me gusta: Está pregunta no esta clara o no es útil
0
Responder