Código de Python - Descargar una pagina web de Internet

Imágen de perfil
Val: 760
Plata
Ha mantenido su posición en Python (en relación al último mes)
Gráfica de Python

Descargar una pagina web de Internetgráfica de visualizaciones


Python

estrellaestrellaestrellaestrellaestrella(1)
Actualizado el 19 de Marzo del 2020 por Xavi (Publicado el 4 de Marzo del 2014)
5.243 visualizaciones desde el 4 de Marzo del 2014
Simple código que muestra como abtener una pagina de Internet, y obtener su cabecera y contenido html.

Versión 1 - Python 2.x
estrellaestrellaestrellaestrellaestrella(1)

Actualizado el 19 de Marzo del 2020 (Publicado el 4 de Marzo del 2014)gráfica de visualizaciones de la versión: Versión 1 - Python 2.x
4.841 visualizaciones desde el 4 de Marzo del 2014

Versión 2 - Python 3.x

Publicado el 19 de Marzo del 2020gráfica de visualizaciones de la versión: Versión 2 - Python 3.x
403 visualizaciones desde el 19 de Marzo del 2020
estrellaestrellaestrellaestrellaestrella
estrellaestrellaestrellaestrella
estrellaestrellaestrella
estrellaestrella
estrella

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
#!/usr/bin/env python
# -*- coding: utf-8 -*-
 
import httplib2
from urllib.parse import urlparse
import os,sys
 
parse=urlparse("https://www.lawebdelprogramador.com")
 
if parse.scheme=="http":
    conn=httplib2.HTTPConnectionWithTimeout(parse.netloc,timeout=60)
else:
    conn=httplib2.HTTPSConnectionWithTimeout(parse.netloc,timeout=60)
 
if parse.path=="":
    # Si no disponemos de path le ponemos la barra
    path="/"
elif parse.query:
    # Si disponemos de path y query, realizamos el montaje
    path="%s?%s" % (parse.path,parse.query)
else:
    # Si solo disponemos de path
    path=parse.path
 
#self.conn.putheader("User-agent", 'pywc')
try:
    conn.request("GET",path)
    response=conn.getresponse()
 
    print ("status: %s" % response.status)
    print ("------------------------------------------")
    print ("reason: %s" % response.reason)
    print ("------------------------------------------")
    print ("headers: %s" % response.getheaders())
    print ("------------------------------------------")
    print ("html: %s" % response.read())
except:
    print (sys.exc_info()[1])



Comentarios sobre la versión: Versión 2 - Python 3.x (0)


No hay comentarios
 

Comentar la versión: Versión 2 - Python 3.x

Nombre
Correo (no se visualiza en la web)
Valoración
Comentarios
Es necesario revisar y aceptar las políticas de privacidad

http://lwp-l.com/s2619