Leer las urls de los archivos sitemap.xml![gráfica de visualizaciones gráfica de visualizaciones](/img/img.png?11.51)
Python
Publicado el 8 de Octubre del 2017 por Xve (294 códigos)
1.684 visualizaciones desde el 8 de Octubre del 2017
Este simple código muestra como leer las urls de los archivos sitemap con extensión .xml
# -*- coding: UTF-8 -*-
from xml.dom import minidom
import sys,os
for fileName in os.listdir(sys.path[0]):
if fileName[-4:]==".xml":
print("-----",fileName,"-----")
xmldoc=minidom.parse(fileName)
itemlist = xmldoc.getElementsByTagName("loc")
for i in itemlist:
url=i.firstChild.nodeValue
print(url)
Comentarios sobre la versión: Versión 1.0 (0)
No hay comentarios