Código de Python - Reemplazar acentos por caracteres html

Pos: 9

Val: 666

Ha disminuido 1 puesto en Python (en relación al último mes)

Reemplazar acentos por caracteres html

Python

Actualizado el 29 de Enero del 2016 por Xavi (548 códigos) (Publicado el 3 de Diciembre del 2012)

13.657 visualizaciones desde el 3 de Diciembre del 2012

Código que lee los archivos de una carpeta, y de lo que tienen extensión .html o .php reemplaza los acentos de formato "humano" (á, é ,í, ...) a formato html (á é, ...)

Versión 1

Actualizado el 30 de Enero del 2016 (Publicado el 3 de Diciembre del 2012)

13.658 visualizaciones desde el 3 de Diciembre del 2012

#!/usr/bin/python

# -*- coding: utf-8 -*-

"""

Codigo que modifica los acentos y añes del formato humano al formato html de

todos los archivos con extension .html y .php

IMPORTANTE:

- Python, lee por defecto en formato ascii de 7bits, por lo que hay que poner

en la parte superior: # -*- coding: utf-8 -*- para poder leer en 8bits

- En el diccionario, hay que indicar que las keys y values, son unicode poniendo

delante del mismo la letra: u

- Al leer el contenido del fichero, igual que en el direccionario hay que pasarlo

a formato unicode con la funcion: unicode()

- Este archivo tiene que estar guardado en formato utf-8

- Una vez todo este en unicode, ya podemos empezar a reemplazar...

"""

import os

# diccionario con los valores a buscar y reemplazar...

dic={

    u"á":u"&aacute;", u"é":u"&eacute;", u"í":u"&iacute;", u"ó":u"&oacute;", u"ú":u"&uacute;",

    u"Á":u"&Aacute;", u"É":u"&Eacute;", u"Í":u"&Iacute;", u"Ó":u"&Oacute;", u"Ú":u"&Uacute;",

    u"à":u"&agrave;", u"è":u"&egrave;", u"ì":u"&igrave;", u"ò":u"&ograve;", u"ù":u"&ugrave;",

    u"À":u"&Agrave;", u"È":u"&Egrave;", u"Ì":u"&Igrave;", u"Ò":u"&Ograve;", u"Ù":u"&Ugrave;",

    u"ñ":u"&ntilde;", u"Ñ":u"&Ntilde;"}

# recorremos todos los archivos

for fileName in os.listdir("."):

    # buscamos todos los archivo con extension html y php

    if fileName[-5:]==".html" or fileName[-4:].lower()==".php":

        # obtenemos el contenido del archivo y lo pasamos a unicode

        fileContent=unicode(file(fileName).read(), "utf-8")

        # recorremos un bucle por todo el diccionario reemplazando los caracteres

        for valueSearch, valueReplace in dic.iteritems():

            fileContent = fileContent.replace(valueSearch, valueReplace)

        # guardamos nuevamente el archivo con los cambios realizados

        f=file(fileName,"w")

        f.write(fileContent)

        f.close()

Comentarios sobre la versión: Versión 1 (0)

No hay comentarios

Comentar la versión: Versión 1

http://lwp-l.com/s2260

Programa de suerte

Modelo de archivos

Código de Python - Reemplazar acentos por caracteres html

Versión 1

Comentarios sobre la versión: Versión 1 (0)

Comentar la versión: Versión 1

Tienes que ser un usuario registrado para poder insertar imágenes, archivos y/o videos.