urllib

什么是urllib:

Urllib是python内置的HTTP请求库

  • 常用模块

urllib.request 请求
urllib.parser解析

  • urllib.request.urlopen
data = {
  'name' = 'name',
  'age' = 18
}
bianliang = urllib.parse.urlencode(data).encode()

request = urllib.request.Request(url=url, data=bianliang,headers=headers)
  • import urllib.request
response = urllib.request.urlopen('http://www.baidu.com')
content = response.read().decode('utf-8')
print(content)
  • 获取状态码 头部信息

request = urllib.request.Request(url=url,headers=self.headers)
response = urllib.request.urlopen(request)

  • 获得响应的内容

content = response.read().decode()

*防止被反扒 需要一些headers头部信息才能访问

self.headers = {
    'User-Agent': 'UA地址'
  }
# 这样请求网站时 就是头部信息了

你可能感兴趣的:(urllib)