Python - CONTAR REPETICIONES EN UNA LISTA, MANTENIENDO VALORES ÚNICOS Y SU FRECUENCIA DE REPETICIÓN

 
Vista:
sin imagen de perfil
Val: 4
Ha disminuido su posición en 22 puestos en Python (en relación al último mes)
Gráfica de Python

CONTAR REPETICIONES EN UNA LISTA, MANTENIENDO VALORES ÚNICOS Y SU FRECUENCIA DE REPETICIÓN

Publicado por Pepi (3 intervenciones) el 21/11/2017 17:04:48
Hola,
quería hacer lo siguiente.

Tengo un archivo con miles de filas con texto.
Muchas de estas filas se repiten 100% en cuanto al texto que tienen.
Quiero:

1. extraer los valores únicos, quitando los duplicados
2. calcular la frecuencia de aparición de cada valor único (siempre en una fila)

El resultado tendría que ser un archivo donde aparezca la cadena de texto y el número de veces que se repite.
Un archivo que podría, por ejemplo, abrirse con excel generando dos columnas, una con los textos (ya sin repetirse), y otra con el número de apariciones.


Gracias.
Valora esta pregunta
Me gusta: Está pregunta es útil y esta claraNo me gusta: Está pregunta no esta clara o no es útil
0
Responder
Imágen de perfil de José María
Val: 819
Bronce
Ha mantenido su posición en Python (en relación al último mes)
Gráfica de Python

CONTAR REPETICIONES EN UNA LISTA, MANTENIENDO VALORES ÚNICOS Y SU FRECUENCIA DE REPETICIÓN

Publicado por José María (245 intervenciones) el 21/11/2017 20:07:56
Si comentas qué tienes hecho, sobre eso probablemente podríamos ayudarte.
Un saludo
Valora esta respuesta
Me gusta: Está respuesta es útil y esta claraNo me gusta: Está respuesta no esta clara o no es útil
0
Comentar
sin imagen de perfil
Val: 4
Ha disminuido su posición en 22 puestos en Python (en relación al último mes)
Gráfica de Python

CONTAR REPETICIONES EN UNA LISTA, MANTENIENDO VALORES ÚNICOS Y SU FRECUENCIA DE REPETICIÓN

Publicado por Pepi (3 intervenciones) el 21/11/2017 22:01:48
Hola, en realidad no sé cómo abordarlo en Python. Soy principiante. Hago esto con "contar.si" en excel pero tengo que aplicarlo ahora a varios millones de filas y se colapsa el ordenador. Cualquier ayuda es bienvenida. Quizás el paso 1 no es 100% necesario en Python si se puede extraer en un archivo las veces que se repite el texto de cada fila.
Valora esta respuesta
Me gusta: Está respuesta es útil y esta claraNo me gusta: Está respuesta no esta clara o no es útil
0
Comentar
sin imagen de perfil
Val: 106
Ha disminuido 1 puesto en Python (en relación al último mes)
Gráfica de Python

CONTAR REPETICIONES EN UNA LISTA, MANTENIENDO VALORES ÚNICOS Y SU FRECUENCIA DE REPETICIÓN

Publicado por Jonay Zevenzui (14 intervenciones) el 21/11/2017 22:13:57
No si esto es a lo que te refieres, espero te sirva. Un saludo.

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
import csv
 
f = open('aqui ubicacion del archivo', 'r')
lineas = f.readlines()
f.close()
repeticiones = 0
linea_repeticiones = {}
for i in lineas:
    linea = i
    for j in lineas:
        if linea == j:
            repeticiones += 1
    if not linea in linea_repeticiones.iterkeys():
        linea_repeticiones[linea]=repeticiones
    repeticiones = 0
e = open('resultado.csv', 'a')
wri = csv.writer(e)
for c,v in linea_repeticiones.iteritems():
    wri.writerow([c,v])
e.close()
Valora esta respuesta
Me gusta: Está respuesta es útil y esta claraNo me gusta: Está respuesta no esta clara o no es útil
0
Comentar