Codificación en lectura y escritura de ficheros
Publicado por Víctor (11 intervenciones) el 09/12/2012 11:19:36
Hola.
Llevo un tiempo dando vueltas al tema y me estoy volviendo loco.
Comento el problema a ver si alguien tiene idea de que es lo que está fallando.
Bien, en el trabajo me han encomendado que introduzca unas traducciones a través de PoEdit para incorporarlas a una página web. Estas traducciones me las proporcionan en un archivo excel. A partir de aquí empieza mi pequeña odisea con las codificaciones de caracteres.
Para no liarme mucho diré que tras varias pruebas y correcciónes conseguí obtener tanto en el fichero origen (messages.txt) como en el destino messages.po las cadenas legibles en UTF-8.
Ahora bien, la estructura del archivo messages.txt es la siguiente (por ejemplo en Ucraniano):
Terms of use;Умови користування
Privacy;Приватності
Site map;Мапа сайту
.
.
.
.
Entonces para no copiar esta estructura a mano, he creado una aplicación sencilla en java, la cual va leyendo cadenas del .po y si la encuentra en el txt, le coloca la traducción correcta.
El proceso funciona correctamente pero el problema es que falla en algún carácter pasando a mostrar un código irreconocible, es algo como "xD1?". Es decir, tras el proceso de traducción en el archivo .po me quedan algunas cadenas como pongo a continuación
Умови кори"xD1?"тування
La idea que tengo en la cabeza es que puede ser algo de Java a la hora de interpretar la linea leida o algo así, sino no entiendo que se entiendan todos los caracteres excepto unos pocos en el archivo .po.
Eso es todo, espero que alguien tenga idea de que es lo que puede estar pasando porque estoy saturado con esto de las codificaciones y me da la impresion de estar horas con el tema y no avanzar.
Gracias de antemano
Un saludo
Edit- Adjunto imagen porque veo que no reconoce la web el texto
Uploaded with ImageShack.us
Llevo un tiempo dando vueltas al tema y me estoy volviendo loco.
Comento el problema a ver si alguien tiene idea de que es lo que está fallando.
Bien, en el trabajo me han encomendado que introduzca unas traducciones a través de PoEdit para incorporarlas a una página web. Estas traducciones me las proporcionan en un archivo excel. A partir de aquí empieza mi pequeña odisea con las codificaciones de caracteres.
Para no liarme mucho diré que tras varias pruebas y correcciónes conseguí obtener tanto en el fichero origen (messages.txt) como en el destino messages.po las cadenas legibles en UTF-8.
Ahora bien, la estructura del archivo messages.txt es la siguiente (por ejemplo en Ucraniano):
Terms of use;Умови користування
Privacy;Приватності
Site map;Мапа сайту
.
.
.
.
Entonces para no copiar esta estructura a mano, he creado una aplicación sencilla en java, la cual va leyendo cadenas del .po y si la encuentra en el txt, le coloca la traducción correcta.
El proceso funciona correctamente pero el problema es que falla en algún carácter pasando a mostrar un código irreconocible, es algo como "xD1?". Es decir, tras el proceso de traducción en el archivo .po me quedan algunas cadenas como pongo a continuación
Умови кори"xD1?"тування
La idea que tengo en la cabeza es que puede ser algo de Java a la hora de interpretar la linea leida o algo así, sino no entiendo que se entiendan todos los caracteres excepto unos pocos en el archivo .po.
Eso es todo, espero que alguien tenga idea de que es lo que puede estar pasando porque estoy saturado con esto de las codificaciones y me da la impresion de estar horas con el tema y no avanzar.
Gracias de antemano
Un saludo
Edit- Adjunto imagen porque veo que no reconoce la web el texto
Uploaded with ImageShack.us
Valora esta pregunta
0