# -*- coding: utf-8 -*-
#
# gbm
# 03/05/17
#
from bs4 import BeautifulSoup
import requests
url_base = "http://www.lawebdelprogramador.com/codigo/Python/index"
MAX_PAGES = 20
for i in range(1, MAX_PAGES):
# Construyo la URL
url = "{}{}.html".format(url_base,i)
# Realizamos la petición a la web
req = requests.get(url)
# Comprobamos que la petición nos devuelve un Status Code = 200
statusCode = req.status_code
if statusCode == 200:
# Pasamos el contenido HTML de la web a un objeto BeautifulSoup()
html = BeautifulSoup(req.text, "html.parser")
# Obtenemos todos los divs donde estan las entradas
entradas = html.find_all("h2")
for entrada in entradas:
titulo = entrada.find('a').getText()
print(titulo)
else:
# Si ya no existe la página y me da un 400
break
Comentarios sobre la versión: 1.0 (4)