Java - Filtrado de HTML con Java

 
Vista:

Filtrado de HTML con Java

Publicado por MHKM (2 intervenciones) el 24/02/2012 17:41:29
Hola,

estoy realizando una aplicación para Android que lee un feed en XML de una web y mediante un parser separa los contenidos que me interesan en diversos Strings.

Mi problema es que uno de los contenidos es un texto con etiquetas HTML, conteniendo enlaces y demás. Querría saber si hay alguna clase en java que facilite el trabajo con este tipo de información, o al menos unas pautas para empezar a buscar información sobre ello.

Gracias a todos
Valora esta pregunta
Me gusta: Está pregunta es útil y esta claraNo me gusta: Está pregunta no esta clara o no es útil
0
Responder

Filtrado de HTML con Java

Publicado por javier (15 intervenciones) el 28/02/2012 10:52:31
imagino que el resultado del feed te dara algo como

<tittle>blablabla</tittle>

hmmm para quitarlo yo haria algo como esto

String feed; // el string donde devolvio el feed

String resultado; // donde se almacenara el resultado
int inicio = 0;
int final = 0;

for(int x=0;x<feed.length();x++) {
if(feed.charAt(x) == '>')
inicio = x;
if(feed.charAt(x) == '<' && x != 0)
final = x;
}

resultado = feed.subString(inicio,final);


y ya esta :) , si de devuelve un array[] puedes poner eso en un metodo, le envias el feed[x] y que te devuelva el resultado :)......
Valora esta respuesta
Me gusta: Está respuesta es útil y esta claraNo me gusta: Está respuesta no esta clara o no es útil
0
Comentar

Filtrado de HTML con Java

Publicado por MHKM (2 intervenciones) el 28/02/2012 14:55:21
Gracias por responder,

te comento, el problema no es quitar las etiquetas del feed, eso ya lo hago al hacer un filtrado DOM. Esos elementos los guardo en diversos String según me interesa. El problema es que uno de ellos es un bloque de texto que contiene html, por ejemplo todos los acentos, links de imágenes y demás (es la entrada de un blog).

Lo que tu me comentas puede valer, pero debería hacer un método contemplando todos los posibles casos, para cada letra con acento y demás. Es la última opción que contemplo si no encuentro algo menos "limpio".

saludos!
Valora esta respuesta
Me gusta: Está respuesta es útil y esta claraNo me gusta: Está respuesta no esta clara o no es útil
0
Comentar