Código de Python - Reemplazar acentos por caracteres html

Imágen de perfil

Reemplazar acentos por caracteres htmlgráfica de visualizaciones


Python

Actualizado el 29 de Enero del 2016 por Xavi (Creado el 03 de Diciembre del 2012)
8.200 visualizaciones desde el 03 de Diciembre del 2012. Una media de 42 por semana
Código que lee los archivos de una carpeta, y de lo que tienen extensión .html o .php reemplaza los acentos de formato "humano" (á, é ,í, ...) a formato html (á é, ...)

Versión 1

Actualizado el 30 de Enero del 2016 (Creado el 03 de Diciembre del 2012)gráfica de visualizaciones de la versión: Versión 1
8.201 visualizaciones desde el 03 de Diciembre del 2012. Una media de 42 por semana
estrellaestrellaestrellaestrellaestrella
estrellaestrellaestrellaestrella
estrellaestrellaestrella
estrellaestrella
estrella

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
#!/usr/bin/python
# -*- coding: utf-8 -*-
 
"""
Codigo que modifica los acentos y añes del formato humano al formato html de 
todos los archivos con extension .html y .php

IMPORTANTE:
- Python, lee por defecto en formato ascii de 7bits, por lo que hay que poner
en la parte superior: # -*- coding: utf-8 -*- para poder leer en 8bits

- En el diccionario, hay que indicar que las keys y values, son unicode poniendo
delante del mismo la letra: u

- Al leer el contenido del fichero, igual que en el direccionario hay que pasarlo
a formato unicode con la funcion: unicode()

- Este archivo tiene que estar guardado en formato utf-8

- Una vez todo este en unicode, ya podemos empezar a reemplazar...
"""
 
import os
 
# diccionario con los valores a buscar y reemplazar...
dic={
    u"á":u"á", u"é":u"é", u"í":u"í", u"ó":u"ó", u"ú":u"ú",
    u"Á":u"Á", u"É":u"É", u"Í":u"Í", u"Ó":u"Ó", u"Ú":u"Ú",
    u"à":u"à", u"è":u"è", u"ì":u"ì", u"ò":u"ò", u"ù":u"ù",
    u"À":u"À", u"È":u"È", u"Ì":u"Ì", u"Ò":u"Ò", u"Ù":u"Ù",
    u"ñ":u"ñ", u"Ñ":u"Ñ"}
 
# recorremos todos los archivos
for fileName in os.listdir("."):
    # buscamos todos los archivo con extension html y php
    if fileName[-5:]==".html" or fileName[-4:].lower()==".php":
        # obtenemos el contenido del archivo y lo pasamos a unicode
        fileContent=unicode(file(fileName).read(), "utf-8")
        # recorremos un bucle por todo el diccionario reemplazando los caracteres
        for valueSearch, valueReplace in dic.iteritems():
            fileContent = fileContent.replace(valueSearch, valueReplace)
 
        # guardamos nuevamente el archivo con los cambios realizados
        f=file(fileName,"w")
        f.write(fileContent)
        f.close()



Comentarios sobre la versión: Versión 1 (0)


No hay comentarios
 

Comentar la versión: Versión 1

Nombre
Correo (no se visualiza en la web)
Valoración
Comentarios

http://lwp-l.com/s2260