python根据url获取xml文件的读取

这几天公司给了我一个url来获取xml文件中的内容让我用python写(本人Java程序员)根据各种论谈吧终于写出来了话不多说上代码:

import urllib.request  
from xml.dom import minidom  
  
url=""
#设置请求头有的浏览器中设置了反爬取  
header = {'User-Agent':'Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US; rv:1.9.1.6) Gecko/20091201 Firefox/3.5.6'}
#请求获取xml数据
request = urllib.request.Request(url, headers=header)  
response = urllib.request.urlopen(request)  
data = response.read()  
#将xml数据解析成dom文件
dom=minidom.parseString(data)  
urlist=[];
#根据标签名获取标签
locs=dom.getElementsByTagName('loc')
for loc in locs:
    locurl=loc.firstChild.data
    urlist.append(locurl)
print(len(urlist))  

#循环获取全部子节点
'''
for node in dom.childNodes: 
    for model in node.childNodes:
        for x in model.childNodes:  
            print (x.firstChild.data)   
'''            

 

你可能感兴趣的:(python根据url获取xml文件的读取)