Python - COMO ENCONTRAR LO MÁS FRECUENTE DE DOS COLUMNAS

 
Vista:

COMO ENCONTRAR LO MÁS FRECUENTE DE DOS COLUMNAS

Publicado por Cristian Villamil (2 intervenciones) el 11/03/2020 20:06:10
Buenas tardes, tengo dos columnas una con la estación de inicio y otra con la estación final y necesito saber que combinación es la más frecuente.

Es decir que me muestra cuál es la estación de inicio y de fin que mas utilizan los usuarios.

No se si exista algun metodo o funcion que me ayude a encontrar esta información o si debo hacerlo mediante una concatenación de los dos campos para que se vuelvan valores de una sola columna y así poder realizar el recuento.

Mil gracias..
Valora esta pregunta
Me gusta: Está pregunta es útil y esta claraNo me gusta: Está pregunta no esta clara o no es útil
0
Responder
sin imagen de perfil
Val: 427
Bronce
Ha aumentado su posición en 2 puestos en Python (en relación al último mes)
Gráfica de Python

COMO ENCONTRAR LO MÁS FRECUENTE DE DOS COLUMNAS

Publicado por Daniel (98 intervenciones) el 11/03/2020 21:44:12
Hola,

Esto se puede hacer más o menos fácil con pandas. En caso de tener un DataFrame con los datos puede contar las occurencias de dos o más columnas simplmente con:

1
df.groupby(['C1','C2']).size().reset_index().rename(columns={0:'count'})

En caso de que además sea necesario ordenar se puede usar tambien:

1
df.groupby(['C1','C2']).size().reset_index().rename(columns={0:'count'}).sort_values(by=['count'], ascending=False)

Saludos,
Daniel Rodríguez
Analytics Lane
Valora esta respuesta
Me gusta: Está respuesta es útil y esta claraNo me gusta: Está respuesta no esta clara o no es útil
0
Comentar