request.meta包含了哪些数据?

request.META 是一个Python字典,包含了所有本次HTTP请求的Header信息,比如用户IP地址和用户Agent(通常是浏览器的名称和版本号)。 注意,Header信息的完整列表取决于用户所发送的Header信息和服务器端设置的Header信息。 这个字典中几个常见的

  • HTTP_REFERER:进站前链接网页,如果有的话。 (请注意,它是REFERRER的笔误。)
  • HTTP_USER_AGENT:用户浏览器的user-agent字符串。如果有的话。 例如: “Mozilla/5.0 (X11; U; Linux i686; fr-FR; rv:1.8.1.17) Gecko/20080829 Firefox/2.0.0.17” .
  • REMOTE_ADDR :客户端IP。如:“12.345.67.89” 。(如果申请是经过代理服务器的话,那么它可能是以逗号分割的多个IP地址,如:“12.345.67.89,23.456.78.90” 。)
  • ……

因为 request.META 是一个普通的Python字典,因此当你试图访问一个不存在的键时,会触发一个KeyError异常。 (HTTP header信息是由用户的浏览器所提交的、不应该给予信任的“额外”数据,因此你总是应该好好设计你的应用以便当一个特定的Header数据不存在时,给出一个优雅的回应。)你应该用 try/except 语句,或者用Python字典的 get() 方法来处理这些“可能不存在的键”。

  1. 比如我要获得用户的浏览器信息,可以这么设计函数:
    def ua_display(request):
    	ua = request.META.get('HTTP_USER_AGENT', 'unknown')
    	return HttpResponse("Your browser is %s" % ua)
    
  2. 网页输出:
    Your browser is Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/28.0.1500.95 Safari/537.36
  3. 或则可以这么写:
    def ua_display_2(request):
    	try:
    		ua = request.META['HTTP_USER_AGENT']
    	except KeyError:
    		ua = 'unknown'
    	return HttpResponse("Your browser is %s" % ua)
    
  4. 那么 request.META 里面还有什么有用的数据呢?动手写一个简单的view函数来显示 request.META 的所有数据,这样你就知道里面有什么了。
    def display_meta(request):
    	values = request.META.items()
    	values.sort()
    		html = []
    	for k, v in values:
       		html.append('%s%s' % (k, v))
    		return HttpResponse('%s
    ' % '\n'.join(html))
  5. 网页输出:
    ALLUSERSPROFILE C:\ProgramData
    COMMONPROGRAMFILES  C:\Program Files\Common Files
    COMSPEC C:\windows\system32\cmd.exe
    CONFIGSETROOT   C:\windows\ConfigSetRoot
    CONTENT_LENGTH 
    CONTENT_TYPE    text/plain
    CSRF_COOKIE 8dLJLZyBH801ba24VdzYqJ81b5nqTxh0
    DJANGO_SETTINGS_MODULE  PythonProject.settings
    FP_NO_HOST_CHECK    NO
    GATEWAY_INTERFACE   CGI/1.1
    HOMEDRIVE   C:
    HTTP_ACCEPT text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8
    HTTP_ACCEPT_ENCODING    gzip,deflate,sdch
    HTTP_ACCEPT_LANGUAGE    zh-CN,zh;q=0.8
    HTTP_CONNECTION keep-alive
    HTTP_COOKIE csrftoken=8dLJLZyBH801ba24VdzYqJ81b5nqTxh0; sessionid=1rf6hmdw7k0zzsg8q3q1lw2j75gmoood
    HTTP_HOST   127.0.0.1:8000
    HTTP_USER_AGENT Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/28.0.1500.95 Safari/537.36
    NUMBER_OF_PROCESSORS    4
    OS  Windows_NT
    PATH    E:\Python;E:\Python\Scripts;C:\windows\system32;E:\Python
    PATHEXT .COM;.EXE;.BAT;.CMD;.VBS;.VBE;.JS;.JSE;.WSF;.WSH;.MSC
    PATH_INFO   /display_meta/
    PROCESSOR_ARCHITECTURE  AMD64
    PROCESSOR_IDENTIFIER    Intel64 Family 6 Model 42 Stepping 7, GenuineIntel
    PROCESSOR_LEVEL 6
    PROCESSOR_REVISION  2a07
    PROMPT  $P$G
    PSMODULEPATH    C:\windows\system32\WindowsPowerShell\v1.0\Modules\
    PUBLIC  C:\Users\Public
    QUERY_STRING   
    REMOTE_ADDR 127.0.0.1
    REMOTE_HOST
    REQUEST_METHOD  GET
    RUN_MAIN    true
    SERVER_PROTOCOL HTTP/1.1
    SERVER_SOFTWARE WSGIServer/0.1 Python/2.7.5
    SESSIONNAME Console
    SHIM_MCCOMPAT   0x810000001
    WINDOWS_TRACING_FLAGS   3
    WINDOWS_TRACING_LOGFILE C:\BVTBin\Tests\installpackage\csilogfile.log
    wsgi.errors ', mode 'w' at 0x00000000025C6150>
    wsgi.file_wrapper   wsgiref.util.FileWrapper
    wsgi.input 
    wsgi.multiprocess   False
    wsgi.multithread    True
    wsgi.run_once   False
    wsgi.url_scheme http
    wsgi.version    (1, 0)
    

可以看到,request.META 包含的数据还是挺多的。用户浏览器信息只是它的其中一项而已。

原文连接:http://www.nowamagic.net/academy/detail/1318909

你可能感兴趣的:(Python爬虫)