python-网络爬虫初学四:cookie的存储与读取

一、读取cookie并存储在本地文件

# 保存cookie到文件
file_name = "cookie.txt"
cookie = cookielib.MozillaCookieJar(file_name)
handler = urllib2.HTTPCookieProcessor(cookie)
opener = urllib2.build_opener(handler)
response = opener.open("http://www.baidu.com")
cookie.save(ignore_discard=True, ignore_expires=True)

ignore_discard的意思是即使cookies将被丢弃也将它保存下来;

ignore_expires的意思是如果在该文件中 cookies已经存在,则覆盖原文件写入。

在这里,我们将这两个全部设置为True


二、读取本地cookie

# 读取存储的cookie
cookie = cookielib.MozillaCookieJar()
cookie.load("cookie.txt", ignore_discard=True, ignore_expires=True)
request = urllib2.Request("http://www.baidu.com")
opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cookie))
response = opener.open(request)
print response.read()

你可能感兴趣的:(python-网络爬虫初学四:cookie的存储与读取)