本文参考网上的资料,编写简单的Python编写网络爬虫,做了网页内容的抓取,分析出链接的url并抓取。
# encoding:UTF-8
import urllib.request #引入urllib工具
url = "http://www.baidu.com" #Url地址
data = urllib.request.urlopen(url).read() # 使用urllib工具获取url的页面内容
data = data.decode('UTF-8') #将格式转换为UTF-8格式
print(data) # 打印获取的页面信息
百度一下,你就知道