Python - Capturar enlaces de descarga.

   
Vista:

Capturar enlaces de descarga.

Publicado por Manuel (7 intervenciones) el 07/07/2014 17:52:03
Buenas tardes a todos.

Tengo este script adaptado para otra página, pero no consigo que funcione.
Mi idea es capturar el enlace del servidor de Sockshare de la página http://rlssource.net , para las series que tengo en la lista y añadirlo a una lista
para que lo vuelva a descargar, pero lo único que consigo es entrar en un bucle y que me salgan varios links por serie.

¿Alguna idea?.

Muchas gracias por vuestro tiempo.
Valora esta pregunta
Me gusta: Está pregunta es útil y esta claraNo me gusta: Está pregunta no esta clara o no es útil
0
Responder
Imágen de perfil de xve

Capturar enlaces de descarga.

Publicado por xve (1232 intervenciones) el 07/07/2014 20:52:51
Hola Manuel, muy interesante tu código!!!

No entiendo muy bien cual es el problema que tienes... yo lo he ejecutado, y me ha creado el archivo Series.txt con un montón de urls descargadas de la pagina http://rlssource.net

No se ver donde esta el problema... exactamente que hace mal?
Valora esta respuesta
Me gusta: Está respuesta es útil y esta claraNo me gusta: Está respuesta no esta clara o no es útil
0
Comentar

Capturar enlaces de descarga.

Publicado por Manuel (7 intervenciones) el 07/07/2014 21:02:52
Encantado de hablar contigo otra vez, xve.

El código está adaptado del que me ayudaste en Diciembre del año pasado.
Como ves en la página principal, cada serie tiene varios servicios de descarga (Uploaded, Rapidgator, Bitshare, Billionuploads, Hugefiles, Sockshare, Zippyshare). Lo que quiero es capturar sólo los enlaces del servicio de Sockshare.
Con este código me coge una de las series de la lista, y se empieza a repetir y no sale del bucle.

Me gustaría que me lo mostrará así:

Falling Skies
Url del enlace a Sockshare. (Y si fuera posible sólo el enlace al episodio en 720p). :D

Halt and Catch Fire
URL

Etc.

Muchas gracias por tu tiempo, y espero haberme explicado mejor.
Valora esta respuesta
Me gusta: Está respuesta es útil y esta claraNo me gusta: Está respuesta no esta clara o no es útil
0
Comentar
Imágen de perfil de xve

Capturar enlaces de descarga.

Publicado por xve (1232 intervenciones) el 08/07/2014 08:13:31
Hola Manuel, me ha costado un poco, pero aquí te adjunto un código que descarga de la pagina que le indiques todas las url's que tengan como descripción la palabra "Sockshare"

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
# -*- coding: utf-8 -*-
 
import urllib
from HTMLParser import HTMLParser
 
class MyHTMLParser(HTMLParser):
	urls=[]
 
	def handle_starttag(self, tag, attrs):
		# Only parse the 'anchor' tag.
		if tag=="a":
			# Check the list of defined attributes.
			for name, value in attrs:
				# If href is defined, print it.
				if name == "href":
					self.url=value
 
	def handle_data(self,data):
		if data=="Sockshare":
			self.urls.append(self.url)
 
parser = MyHTMLParser()
myurl='http://rlssource.net'
parser.feed(urllib.urlopen(myurl).read())
 
print parser.urls

Una vez tienes las urls en la lista, ya puedes gestionar el guardarlas en un archivo de texto.

Coméntanos si te sirve, ok?
Valora esta respuesta
Me gusta: Está respuesta es útil y esta claraNo me gusta: Está respuesta no esta clara o no es útil
0
Comentar

Capturar enlaces de descarga.

Publicado por Manuel (7 intervenciones) el 08/07/2014 17:42:28
Gracias de nuevo, xve. Captura perfectamente los enlaces de la página principal, pero lo que no me expliqué bien, es que quiero capturar sólo unas series determinadas, y de ejemplo puse una lista al comienzo del primer código que colgué aquí (Falling-skies, Devious-maids). Y a ser posible los episodios en 720p.

Gracias por el tiempo que le has dedicado. Si ves que es mucho lío ya intento seguir desde aquí.

Un saludo.
Manuel.
Valora esta respuesta
Me gusta: Está respuesta es útil y esta claraNo me gusta: Está respuesta no esta clara o no es útil
0
Comentar