Python - Subconjunto aleatorio dataframe

 
Vista:

Subconjunto aleatorio dataframe

Publicado por Zhyur (35 intervenciones) el 20/05/2019 12:09:26
Hola,

tengo un dataframe (salarios), donde una de las columnas (type) representa la clase de profesores que hay en un centro de enseñanza. Las clases de profesores que hay son: AssocProf, AsstProf y Prof.

Tengo que seleccionar un subconjunto aleatorio de 60 muestras (filas) del dataframe, de manera que este nuevo dataframe contenga el mismo número de clases de profesores que hay. Es decir, en total hay 3 clases de profesores. Entonces, el subconjunto debe contener 20 filas de AssocProf, 20 filas de AsstProf y 20 filas de Prof. El código que tengo es el siguiente:

agrupacion = salarios.groupby("type")

agrupacion.apply(lambda x: x.sample(n = 20, replace=True)).head()

Lo que pretendo con este código es coger 20 muestras de cada tipo de profesor. Sin embargo, no lo hace bien, ya que selecciona solo 5 filas, donde 2 de ellas son de una clase de profesores, otras 2 son de otra clase, y la última es de la tercera clase. ¿Qué estoy haciendo mal?

Un saludo y gracias por adelantado.
Valora esta pregunta
Me gusta: Está pregunta es útil y esta claraNo me gusta: Está pregunta no esta clara o no es útil
0
Responder