zhglance

Python编写网络爬虫--牛刀小试

本文参考网上的资料，编写简单的Python编写网络爬虫，做了网页内容的抓取，分析出链接的url并抓取。

1.环境准备

安装python3，PyCharm开发环境

2.牛刀小试：

# encoding:UTF-8
import urllib.request         #引入urllib工具

url = "http://www.baidu.com" #Url地址
data = urllib.request.urlopen(url).read()  # 使用urllib工具获取url的页面内容
data = data.decode('UTF-8')       #将格式转换为UTF-8格式
print(data)                 # 打印获取的页面信息

输出结果：