Código de Python - Descargar una pagina web de Internet

Imágen de perfil

Descargar una pagina web de Internetgráfica de visualizaciones


Python

Publicado el 04 de Marzo del 2014 por Xavi
1.443 visualizaciones desde el 04 de Marzo del 2014. Una media de 14 por semana
Simple código que muestra como abtener una pagina de Internet, y obtener su cabecera y contenido html.

Versión 1

Publicado el 04 de Marzo del 2014gráfica de visualizaciones de la versión: Versión 1
1.444 visualizaciones desde el 04 de Marzo del 2014. Una media de 14 por semana
estrellaestrellaestrellaestrellaestrella
estrellaestrellaestrellaestrella
estrellaestrellaestrella
estrellaestrella
estrella

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
#!/usr/bin/env python
# -*- coding: utf-8 -*-
 
import httplib
from urlparse import urlparse
import os,sys
 
parse=urlparse("http://www.lawebdelprogramador.com")
 
if parse.scheme=="http":
    conn=httplib.HTTPConnection(parse.netloc,timeout=60)
else:
    conn=httplib.HTTPSConnection(parse.netloc,timeout=60)
 
if parse.path=="":
    # Si no disponemos de path le ponemos la barra
    path="/"
elif parse.query:
    # Si disponemos de path y query, realizamos el montaje
    path="%s?%s" % (parse.path,parse.query)
else:
    # Si solo disponemos de path
    path=parse.path
 
#self.conn.putheader("User-agent", 'pywc')
try:
    conn.request("GET",path)
    response=conn.getresponse()
 
    print "status: %s" % response.status
    print "------------------------------------------"
    print "reason: %s" % response.reason
    print "------------------------------------------"
    print "headers: %s" % response.getheaders()
    print "------------------------------------------"
    print "html: %s" % response.read()
except:
    print sys.exc_info()[1]



Comentarios sobre la versión: Versión 1 (0)


No hay comentarios
 

Comentar la versión: Versión 1

Nombre
Correo (no se visualiza en la web)
Valoración
Comentarios

http://lwp-l.com/s2619