PHP - Extraer texto de un archivo

 
Vista:

Extraer texto de un archivo

Publicado por Jose (1 intervención) el 11/10/2005 01:24:55
Hola buenas, mirar tengo que extraer gran cantidad de datos de unos archivos html, para luego procesarlos.
El caso es que los datos que me interesan estan entre los tags <font face="Arial" size="1"> y </font> siempre, por tanto desconozco que funcion utilizar para extraer el texto que se encuentra entre esos dos tags.

Estoy un poco perdido, he intentado encontrar algo en la documentacion de PHP pero no he sacado nada en claro.
Existe alguna funcion que haga esto? En caso contrario, mas o menos cual seria el algoritmo para realizar esto?

¿Como lo hariais vosotros?

Cualquier cosa que me podais decir me seria de ayuda.

Gracias por adelantado.
Valora esta pregunta
Me gusta: Está pregunta es útil y esta claraNo me gusta: Está pregunta no esta clara o no es útil
0
Responder

RE:Extraer texto de un archivo

Publicado por Fran García (46 intervenciones) el 11/10/2005 19:05:06
Yo intentaría hacerlo con XSLT, pero el problema que puedes tener es que el HTML no este bien formado (es decir, que no esté correctamente formateado) y no puedas utilizar XSLT.

Antes de meterle mano con el XSLT, yo limpiaría un poco el código HTML, utilizando PHP para quitar todas las etiquetas que no fueran necesarias y dejando sólo las que quiero utilizar.

No sé si te ayudará o te liara más todavia.
Valora esta respuesta
Me gusta: Está respuesta es útil y esta claraNo me gusta: Está respuesta no esta clara o no es útil
0
Comentar