import re
import sys
# --------------------------------------------------------------------
# EXPRESIONES REGULARES
# JHON ALEXANDER CAMACHO URDINOLA.
# LABORATORIO DE LENGUAJES I
# --------------------------------------------------------------------
# --------------------------------------------------------------------
# SE ABREN LOS ARCHIVOS
# --------------------------------------------------------------------
nombreArchivo = raw_input("Digite el path y el nombre del archivo .html o .htm: ")
try:
fp = open (nombreArchivo,"r")
except IOError:
print "NO SE PUDO ABRIR EL ARCHIVO. VERIFIQUE EL PATH O SI EXISTE EL ARCHIVO"
try:
reporteTag= open("C:\Mis documentos\ReporteTag.dat","w+")
except IOError:
print "NO SE PUDO CREAR EL ARCHIVO"
reporteTag.write("REPORTE TEXTO HTML\nCREADO POR JHON ALEXANDER CAMACHO U.\n")
reporteTag.write("----------------------------------\n\n")
# --------------------------------------------------------------------
# EXPRESIÓN REGULAR
# --------------------------------------------------------------------
def elim_tags(texto):
resultadoTag = re.compile("<.*?>", re.DOTALL)
reporteTag.write("REPORTE:\n\n")
i = 0
cadena = " "
for x in resultadoTag.split(texto):
cadena=cadena+x
reporteTag.write( cadena )
# --------------------------------------------------------------------
# PROGRAMA
# --------------------------------------------------------------------
texto = fp.read()
elim_tags(texto)
fp.close()
reporteTag.close()
Comentarios sobre la versión: Versión 1 (2)