DETECTAR IDIOMA DE TUITS (TWITTER) Y GUARDAR ARCHIVO
Publicado por Pepi (3 intervenciones) el 08/05/2020 14:53:41
Hola,
tengo un archivo con más de un millón de tuits en varias lenguas. ¿Cómo se puede detectar la lengua, anotarla en cada tuit y guardarla en un archivo, cada línea específicando su lengua, para poder después filtrarlas?
Encontré diversas herramientas pero no un ejemplo completo de script que trabaje con la idea de:
- Abrir el CSV con los tuits
- Recorrerlo y asignar idioma por cada tuit/ línea
- Guardar el nuevo CSV.
Gracias.
tengo un archivo con más de un millón de tuits en varias lenguas. ¿Cómo se puede detectar la lengua, anotarla en cada tuit y guardarla en un archivo, cada línea específicando su lengua, para poder después filtrarlas?
Encontré diversas herramientas pero no un ejemplo completo de script que trabaje con la idea de:
- Abrir el CSV con los tuits
- Recorrerlo y asignar idioma por cada tuit/ línea
- Guardar el nuevo CSV.
Gracias.
Valora esta pregunta
![Me gusta: Está pregunta es útil y esta clara Me gusta: Está pregunta es útil y esta clara](/img/img.png?11.51)
![NO me gusta: Está pregunta no esta clara o no es útil No me gusta: Está pregunta no esta clara o no es útil](/img/img.png?11.51)
0