Borrar líneas de un RDD con una función
Publicado por Graciela (1 intervención) el 22/06/2017 13:30:29
Hola,
soy nueva en python(pyspark) y me está costando bastante.
Tengo un RDD y lo que quiero es borrar todas las líneas del RDD que tengan caracteres diferentes a '129SH'.
Esto lo quiero hacer con una función en python.
Imagen mi RDD:
50
44
AH
S9
1H
9A
9H
Al aplicar mi función quedaría así el RDD:
S9
1H
9H
Espero que los maestros del python me puedan ayudar porque tengo la sensación de que es muy sencillo y estoy realmente atascada.
Gracias ^^
soy nueva en python(pyspark) y me está costando bastante.
Tengo un RDD y lo que quiero es borrar todas las líneas del RDD que tengan caracteres diferentes a '129SH'.
Esto lo quiero hacer con una función en python.
Imagen mi RDD:
50
44
AH
S9
1H
9A
9H
Al aplicar mi función quedaría así el RDD:
S9
1H
9H
Espero que los maestros del python me puedan ayudar porque tengo la sensación de que es muy sencillo y estoy realmente atascada.
Gracias ^^
Valora esta pregunta


0