Python 爬虫---百度首页

#这个是urllib2的前身
import urllib.request
#把自己伪装成浏览器,防止被封。。。
ua_headers = {"User-Agent" : "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/54.0.2840.99 Safari/537.36"}
#通过urllib2.Request()方法构造一个请求对象
request = urllib.request.Request("http://www.baidu.com/",headers = ua_headers)

#向指定的url地址发送请求,并返回服务器响应的类文件对象
response = urllib.request.urlopen(request)
#服务器返回的类文件对象支持Python文件对象的操作方法
#read()方法就是读取文件里的全部内容,返回字符串
html = response.read()
#打印响应的内容
print(html)

结果:

D:\Python3Work\u1\venv\Scripts\python.exe D:/Python3Work/u1/爬虫基础/urllib2的使用.py
b'\n\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n\t\r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\t\n        \n\t\t\t        \n\t\n\t\t\t        \n\t\n\t\t\t        \n\t\n\t\t\t        \n\t\t\t    \n\n\t\n        \n\t\t\t        \n\t\n\t\t\t        \n\t\n\t\t\t        \n\t\n\t\t\t        \n\t\t\t    \n\n\t\n        \n\t\t\t        \n\t\n\t\t\t        \n\t\n\t\t\t        \n\t\n\t\t\t        \n\t\t\t    \n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n    \n    \n    \n\t\n    \n    \n    \n    \n\t\n\t\n\t\n\t\n\t\n\t\n\t\n\t\n\t\n\t\n    \n    \xe7\x99\xbe\xe5\xba\xa6\xe4\xb8\x80\xe4\xb8\x8b\xef\xbc\x8c\xe4\xbd\xa0\xe5\xb0\xb1\xe7\x9f\xa5\xe9\x81\x93\n    \n\n\n\n\n\n\n\n\n\n    \n\n\n\n\n    \n\n\n\n\t\n    \n    
\n \n \n \n \n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\r\n\n\n\r\n' Process finished with exit code 0

 

你可能感兴趣的:(Python 爬虫---百度首页)