Código de Python - Exportar pagina web a archivo sin tags

<<>>

Exportar pagina web a archivo sin tagsgráfica de visualizaciones


Python

estrellaestrellaestrellaestrellaestrella(2)
Publicado el 24 de Mayo del 2002 por Jhon Alexander Camacho Urdinola
10.221 visualizaciones desde el 24 de Mayo del 2002. Una media de 14 por semana
Este código, esporta a un archivo .dat el contenido de una pagina web sin los tags.

Versión 1
estrellaestrellaestrellaestrellaestrella(2)

Publicado el 24 de Mayo del 2002gráfica de visualizaciones de la versión: Versión 1
10.222 visualizaciones desde el 24 de Mayo del 2002. Una media de 14 por semana
estrellaestrellaestrellaestrellaestrella
estrellaestrellaestrellaestrella
estrellaestrellaestrella
estrellaestrella
estrella

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
import re
import sys
 
# --------------------------------------------------------------------
#                    EXPRESIONES REGULARES
#               JHON ALEXANDER CAMACHO URDINOLA.
#                  LABORATORIO DE LENGUAJES I
# --------------------------------------------------------------------
 
# --------------------------------------------------------------------
#                    SE ABREN LOS ARCHIVOS
# --------------------------------------------------------------------
 
nombreArchivo = raw_input("Digite el path y el nombre del archivo .html o .htm: ")
try:
    fp = open (nombreArchivo,"r")
except IOError:
    print "NO SE PUDO ABRIR EL ARCHIVO. VERIFIQUE EL PATH O SI EXISTE EL ARCHIVO"
 
try:
   reporteTag= open("C:\Mis documentos\ReporteTag.dat","w+")
except IOError:
    print "NO SE PUDO CREAR EL ARCHIVO"
 
reporteTag.write("REPORTE TEXTO HTML\nCREADO POR JHON ALEXANDER CAMACHO U.\n")
reporteTag.write("----------------------------------\n\n")
 
# --------------------------------------------------------------------
#                       EXPRESIÓN REGULAR
# --------------------------------------------------------------------
def elim_tags(texto):
    resultadoTag = re.compile("<.*?>", re.DOTALL)
    reporteTag.write("REPORTE:\n\n")
 
    i = 0
    cadena = " "
    for x in resultadoTag.split(texto):
        cadena=cadena+x
 
    reporteTag.write( cadena )
 
 
# --------------------------------------------------------------------
#                           PROGRAMA
# --------------------------------------------------------------------
 
texto = fp.read()
elim_tags(texto)
fp.close()
reporteTag.close()



Comentarios sobre la versión: Versión 1 (2)

Juliana Salcedo
25 de Mayo del 2002
estrellaestrellaestrellaestrellaestrella
Ha realizado una valoración positiva de este curso.
Responder
Leonardo Morales
03 de Junio del 2002
estrellaestrellaestrellaestrellaestrella
Excelente.!!!
Responder

Comentar la versión: Versión 1

Nombre
Correo (no se visualiza en la web)
Valoración
Comentarios

http://lwp-l.com/s198