Código de Python - Reemplazar acentos por caracteres html

Imágen de perfil
Val: 666
Bronce
Ha disminuido 1 puesto en Python (en relación al último mes)
Gráfica de Python

Reemplazar acentos por caracteres htmlgráfica de visualizaciones


Python

Actualizado el 29 de Enero del 2016 por Xavi (548 códigos) (Publicado el 3 de Diciembre del 2012)
13.641 visualizaciones desde el 3 de Diciembre del 2012
Código que lee los archivos de una carpeta, y de lo que tienen extensión .html o .php reemplaza los acentos de formato "humano" (á, é ,í, ...) a formato html (á é, ...)

Versión 1

Actualizado el 30 de Enero del 2016 (Publicado el 3 de Diciembre del 2012)gráfica de visualizaciones de la versión: Versión 1
13.642 visualizaciones desde el 3 de Diciembre del 2012
estrellaestrellaestrellaestrellaestrella
estrellaestrellaestrellaestrella
estrellaestrellaestrella
estrellaestrella
estrella

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
#!/usr/bin/python
# -*- coding: utf-8 -*-
 
"""
Codigo que modifica los acentos y añes del formato humano al formato html de 
todos los archivos con extension .html y .php

IMPORTANTE:
- Python, lee por defecto en formato ascii de 7bits, por lo que hay que poner
en la parte superior: # -*- coding: utf-8 -*- para poder leer en 8bits

- En el diccionario, hay que indicar que las keys y values, son unicode poniendo
delante del mismo la letra: u

- Al leer el contenido del fichero, igual que en el direccionario hay que pasarlo
a formato unicode con la funcion: unicode()

- Este archivo tiene que estar guardado en formato utf-8

- Una vez todo este en unicode, ya podemos empezar a reemplazar...
"""
 
import os
 
# diccionario con los valores a buscar y reemplazar...
dic={
    u"á":u"á", u"é":u"é", u"í":u"í", u"ó":u"ó", u"ú":u"ú",
    u"Á":u"Á", u"É":u"É", u"Í":u"Í", u"Ó":u"Ó", u"Ú":u"Ú",
    u"à":u"à", u"è":u"è", u"ì":u"ì", u"ò":u"ò", u"ù":u"ù",
    u"À":u"À", u"È":u"È", u"Ì":u"Ì", u"Ò":u"Ò", u"Ù":u"Ù",
    u"ñ":u"ñ", u"Ñ":u"Ñ"}
 
# recorremos todos los archivos
for fileName in os.listdir("."):
    # buscamos todos los archivo con extension html y php
    if fileName[-5:]==".html" or fileName[-4:].lower()==".php":
        # obtenemos el contenido del archivo y lo pasamos a unicode
        fileContent=unicode(file(fileName).read(), "utf-8")
        # recorremos un bucle por todo el diccionario reemplazando los caracteres
        for valueSearch, valueReplace in dic.iteritems():
            fileContent = fileContent.replace(valueSearch, valueReplace)
 
        # guardamos nuevamente el archivo con los cambios realizados
        f=file(fileName,"w")
        f.write(fileContent)
        f.close()



Comentarios sobre la versión: Versión 1 (0)


No hay comentarios
 

Comentar la versión: Versión 1

Nombre
Correo (no se visualiza en la web)
Valoración
Comentarios...
CerrarCerrar
CerrarCerrar
Cerrar

Tienes que ser un usuario registrado para poder insertar imágenes, archivos y/o videos.

Puedes registrarte o validarte desde aquí.

Codigo
Negrita
Subrayado
Tachado
Cursiva
Insertar enlace
Imagen externa
Emoticon
Tabular
Centrar
Titulo
Linea
Disminuir
Aumentar
Vista preliminar
sonreir
dientes
lengua
guiño
enfadado
confundido
llorar
avergonzado
sorprendido
triste
sol
estrella
jarra
camara
taza de cafe
email
beso
bombilla
amor
mal
bien
Es necesario revisar y aceptar las políticas de privacidad

http://lwp-l.com/s2260