urllib2-addheaders(在 HTTP Request 中加入特定的 Header,Content-Type用 REST 接口时,服务器会检查该值,用来确定 HTTP Body 中的内容)

原文地址:

http://zhuoqiang.me/python-urllib2-usage.html#id3

http://www.stamhe.com/?p=1091


1.urllib2.Request

headers = {"Content-type": "application/x-www-form-urlencoded",
           'Accept-Language':'zh-CN,zh;q=0.8',
           'User-Agent': "Mozilla/5.0 (Windows NT 6.1; rv:32.0) Gecko/20100101 Firefox/32.0",
           "Accept": "text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8",
           "Connection": "close",
           "Cache-Control": "no-cache"}

req = urllib2.Request(Mainurl, headers=headers,data=data)

headers为数据字典,可以有多组数据

2.req.add_header

#对request添加header

req.add_header(key=,val=)

参数只能有两个,一个为key,一个为value

故使用add_headers一次只能添加一个

req.add_header('cache-control', 'no-cache')

req.add_header('accept', '*/*')

3.

res=urllib2.urlopen(req)

print res.read()


总结:

1、urllib2可以接受一个Request类的实例来设置URL请求的headers,urllib仅可以接受URL。这意味着,你不可以伪装你的User Agent字符串等(如果需要add header,只能先使用urllib2.request去添加header,然后再urlopen处理)

2、urllib提供urlencode方法用来GET查询字符串的产生,而urllib2没有。这是为何urllib常和urllib2一起使用的原因。


在 HTTP Request 中加入特定的 Header
 
要加入 header,需要使用 Request 对象:
 
import urllib2


request = urllib2.Request(uri)
request.add_header('User-Agent', 'fake-client')
response = urllib2.urlopen(request)
 
对有些 header 要特别留意,服务器会针对这些 header 做检查
User-Agent : 有些服务器或 Proxy 会通过该值来判断是否是浏览器发出的请求
Content-Type : 在使用 REST 接口时,服务器会检查该值,用来确定 HTTP Body 中的内容该怎样解析。

常见的取值有:
 application/xml : 在 XML RPC,如 RESTful/SOAP 调用时使用
 application/json : 在 JSON RPC 调用时使用
 application/x-www-form-urlencoded : 浏览器提交 Web 表单时使用
 
在使用服务器提供的 RESTful 或 SOAP 服务时, Content-Type 设置错误会导致服务器拒绝服务


你可能感兴趣的:(urllib2-addheaders(在 HTTP Request 中加入特定的 Header,Content-Type用 REST 接口时,服务器会检查该值,用来确定 HTTP Body 中的内容))