Python - comparar listas en archivo txt

 
Vista:
sin imagen de perfil

comparar listas en archivo txt

Publicado por Sergio (1 intervención) el 20/04/2016 16:58:05
Acabo de empezar con Python porque necesito automatizar largas listas de datos, tengo un pequeño problema que por mi mismo no puedo resolver.
Tengo un archivo txt de 10 mil filas con este formato:

the DET
fatther SUB
in PRE
the DET
tomb SUB
is VERB
a ART
good QLF
example SUB
of GEN
the DET
mithology SUB
and COP
the DET
ancient QLF
king SUB

Se trata de un txt con dos columnas de información, en la primera aparece un texto dividido en una palabra for fila en la columna de al lado la función sintáctica que cumple en la oración. Lo que yo quiero es generar una tercera lista donde aparezcan todos los elementos de la primera columna, pero donde se hayan agregado marcas(tags) tanto al principio como al final de la palabra a todas aquellas palabras que cumplan por ejemplo la función SUB.

De modo que quede algo así:
the
*fatther*
in
the
*tomb*
is
a
good
*example*
of
the
*mithology*
and
the
ancient
*king*

Agradeceré toda ayuda y/o sugerencia, entiendo muy bien la lógica de Python, pero aún me cuesta horrores producirla yo mismo.
Valora esta pregunta
Me gusta: Está pregunta es útil y esta claraNo me gusta: Está pregunta no esta clara o no es útil
0
Responder
sin imagen de perfil

comparar listas en archivo txt

Publicado por Horacio (19 intervenciones) el 24/04/2016 20:53:02
mas o menos por lo que entiendo para generar el informe seria algo así:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
archivo = open('test1.txt')
 
lineas = archivo.readlines()
 
archivo.close()
 
def generar(lineas, funcion):
	for linea in lineas:
		lista = linea.split()
		if lista[1] == funcion:
			print "*{}*".format(lista[0])
		else:
			print lista[0]
 
generar(lineas, "SUB")

de ahí si te sirve abría que ver como agregar al archivo inicial, saludos
Valora esta respuesta
Me gusta: Está respuesta es útil y esta claraNo me gusta: Está respuesta no esta clara o no es útil
0
Comentar