研究用Python写爬虫,下载一个网页。报错代码如下
import urllib
def getHtml(url):
page = urllib.urlopen(url)
html = page.read()
return html
html = getHtml("http://www.baidu.com")
print(html)
运行时报错:AttributeError: module 'urllib' has no attribute 'urlopen'
在网上查了一些资料,有人说是因为你的这个工程目录下可能有一个自己定义的文件与urllib重名,导致上述代码在引用时实际引用的是自定义的那个urllib,结果查找自己的项目文件夹下也没有重名的文件。其实真正原因是在Python3.X中应该用urllib.request。更改后就不会再出现这个错误了。
import urllib.request
#print(urllib.__file__)
def getHtml(url):
page = urllib.request.urlopen(url)
html = page.read()
return html
html = getHtml("http://www.baidu.com")
print(html)
运行截图如下: