Python编写网络爬虫--牛刀小试

   本文参考网上的资料,编写简单的Python编写网络爬虫,做了网页内容的抓取,分析出链接的url并抓取。

      1.环境准备

          安装python3,PyCharm开发环境

      2.牛刀小试:          

# encoding:UTF-8
import urllib.request         #引入urllib工具

url = "http://www.baidu.com" #Url地址
data = urllib.request.urlopen(url).read()  # 使用urllib工具获取url的页面内容
data = data.decode('UTF-8')       #将格式转换为UTF-8格式
print(data)                 # 打印获取的页面信息

      输出结果:



    
    
    
	
    
    
     
    
	
	
	
	
	
	
	
	
	
	
    
    百度一下,你就知道