#!/usr/bin/python
# -*- coding: utf-8 -*-
"""
Codigo que modifica los acentos y añes del formato humano al formato html de
todos los archivos con extension .html y .php
IMPORTANTE:
- Python, lee por defecto en formato ascii de 7bits, por lo que hay que poner
en la parte superior: # -*- coding: utf-8 -*- para poder leer en 8bits
- En el diccionario, hay que indicar que las keys y values, son unicode poniendo
delante del mismo la letra: u
- Al leer el contenido del fichero, igual que en el direccionario hay que pasarlo
a formato unicode con la funcion: unicode()
- Este archivo tiene que estar guardado en formato utf-8
- Una vez todo este en unicode, ya podemos empezar a reemplazar...
"""
import os
# diccionario con los valores a buscar y reemplazar...
dic={
u"á":u"á", u"é":u"é", u"í":u"í", u"ó":u"ó", u"ú":u"ú",
u"Á":u"Á", u"É":u"É", u"Í":u"Í", u"Ó":u"Ó", u"Ú":u"Ú",
u"à":u"à", u"è":u"è", u"ì":u"ì", u"ò":u"ò", u"ù":u"ù",
u"À":u"À", u"È":u"È", u"Ì":u"Ì", u"Ò":u"Ò", u"Ù":u"Ù",
u"ñ":u"ñ", u"Ñ":u"Ñ"}
# recorremos todos los archivos
for fileName in os.listdir("."):
# buscamos todos los archivo con extension html y php
if fileName[-5:]==".html" or fileName[-4:].lower()==".php":
# obtenemos el contenido del archivo y lo pasamos a unicode
fileContent=unicode(file(fileName).read(), "utf-8")
# recorremos un bucle por todo el diccionario reemplazando los caracteres
for valueSearch, valueReplace in dic.iteritems():
fileContent = fileContent.replace(valueSearch, valueReplace)
# guardamos nuevamente el archivo con los cambios realizados
f=file(fileName,"w")
f.write(fileContent)
f.close()
Comentarios sobre la versión: Versión 1 (0)
No hay comentarios