哎呀是码鸭

【Python基础知识】Python Requets库学习，需要的赶紧码起来！

快速开始

发送请求

>>> import requests
>>> r = requests.get('https://api.github.com/events') # GET
>>> r = requests.post('https://httpbin.org/post', data={'key': 'value'}) # POST
>>> r = requests.put('https://httpbin.org/put', data={'key': 'value'}) # PUT
>>> r = requests.delete('https://httpbin.org/delete') # DELETE
>>> r = requests.head('https://httpbin.org/get') # HEAD 
>>> r = requests.options('https://httpbin.org/get') # OPTIONS

URL传参

可以使用`params`字典参数为URL提供查询字符串参数，例如，访问 `https://httpbin.org/get?key1=value1&key2=value2`，可使用以下代码：

>>> import requests
>>> payload = {'key1': 'value1', 'key2': 'value2', 'key3':'', 'key4':None}
>>> r = requests.get('https://httpbin.org/get', params=payload)
>>> r.url
https://httpbin.org/get?key2=value2&key1=value1&key3=

需要注意的是，如果字典参数中key值(即URL参数的值为`None`)，则该参数不会添加到URL的查询字符串中。

如果URL查询字符串中，存在重复参数(参数名称相同，参数值不同)，则需要将key值设置为由参数值组成的列表，如下：

>>> import requests

>>> payload = {'key1': 'value1', 'key2': ['value2', 'value3']}
>>> r = requests.get('https://httpbin.org/get', params=payload)
>>> r.url
https://httpbin.org/get?key1=value1&key2=value2&key2=value3

响应内容

读取服务器响应内容

>>> import requests

>>> r = requests.get('https://api.github.com/events')
>>> r.text
 [{"id":"27579847062","type":"PushEvent","actor":{"...

requests 将自动解码来自服务器的内容。大多数unicode字符集都是无缝解码的。

当你发出请求时，requests会根据HTTP头对响应的编码进行有依据的猜测。当你访问`r.text`时，将使用requests猜测的文本编码。可以使用`r.encoding`属性查找请求使用的编码，并对其进行更改：

>>> r.encoding # 输出：utf-8

r.encoding = 'ISO-8859-1'

如果更改编码，则每当调用`r.text`时，requests都将使用新的`r.encoding`的值。在任何情况下，你都可以应用特殊逻辑来确定内容的编码。例如，HTML和XML可以在其正文中指定其编码。在这种情况下，你应该使用`r.content`查找编码，然后设置`r.encoding`。这将允许你使用具有正确编码的`r.text`。

requests还将在需要时使用自定义编码。如果你已经创建了自己的编码并将其注册到`codecs`模块，则可以简单地使用codec名称作为`r.encoding`的值，而requests将为你处理解码。

二进制响应内容

对于非文本请求，还可以以字节的形式访问响应体(当然，文本请求也可以)：

>>> r.content
b'[{"id":"27581220674","type":"IssueCommentEvent","actor":{"id":327807...

requests会自动解码`gzip`和`deflate`传输编码。

如果安装了类似 [brotli]或 [brotlicffi]的Brotil类库，Requets也会自动界面`br`传输编码

如果Brotli库（如[Brotli]）为您自动解码`br`传输编码或[brotliffi]已安装。

例如，可以使用以下代码，从请求返回的二进制数据创建图像：

from PIL import Image
from io import BytesIO

img = Image.open(BytesIO(r.content))

JSON响应内容

可使用内置的JSON解码器，处理JSON数据：

>>> import requests

>>> r = requests.get('https://api.github.com/events')
>>> r.json() # JSON
[{'id': '27609416600', 'type': 'PushEvent', ...

如果JSON解码失败，`r.json()`将抛出异常。例如，如果响应得到一个204（无内容），或者如果响应包含无效的JSON，则`r.json()`会抛出`requests.exceptions.JSONDecodeError`。此封装的异常可能会因为不同python版本和JSON序列化库可能引发的多个异常提供互操作性。

需要注意的是，调用`r.json()`的成功调用并不表示响应的成功。一些服务器可能会在失败的响应中返回JSON对象（例如，HTTP 500的错误详细信息）。这样的JSON将被解码并返回。要检查请求是否成功，请使用`r.raise_for_status()`或检查`r.status_code`

原始响应内容

可以通过访问`r.raw`访问服务器返回的原始socket响应。如果希望这样做，确保在初始请求中设置 `stream=True`:

>>> import requests

>>> r = requests.get('https://api.github.com/events', stream=True)

>>> r.raw

>>> r.raw.read(10)
b'\x1f\x8b\x08\x00\x00\x00\x00\x00\x00\x03'

然而，通常情况下，应该使用类似这样的模式来保存正在流式传输的内容到文件中：

with open(filename, 'wb') as fd:
    for chunk in r.iter_content(chunk_size=128):
        fd.write(chunk)

使用`Response.iter_content`将处理很多你在直接使用`Resort.raw`时需要处理的事情。当流式传输下载时，以上是检索内容的首选和推荐方法。请注意，`chunk_size`可以自由调整为更适合你使用场景的数字。

注意

关于使用 `Response.iter_content`与`Response.raw`的重要注意事项。 `Response.iter_content`将自动解码`gzip`和`deflate`传输编码。`Response.raw`是一个原始字节流–它不会转换响应内容。如果确实需要访问返回的字节，请使用`Response.raw`。

自定义请求头

如果您想向请求中添加HTTP头，只需向`headers`参数传递一个`dict`即可，例如：

>>> url = 'https://api.github.com/some/endpoint'
>>> headers = {'user-agent': 'my-app/0.0.1'}

>>> r = requests.get(url, headers=headers)

注意：自定义请求头的优先级低于更具体的信息源。例如：

* 如果在`.netrc`中指定了凭据，则使用`headers=`设置的`Authorization`请求头将被覆盖，而凭据又将被`auth=`参数覆盖。请求将在`~/.netrc`、`~/_netrc`或`NETRC`环境变量指定的路径处中搜索netrc文件。

* 如果从主机重定向，将删除`Authorization`请求头。

* `Proxy-Authorization`请求头将被URL中提供的代理凭据覆盖。

* 当我们可以确定内容的长度时，将覆盖`Content-Length`请求头。

此外，请求根本不会根据指定的自定义请求头更改其行为。请求头仅是简单的传递到最终请求中。

注意：所有请求头值必须是字符串、字节字符串或unicode。虽然允许，但建议避免传递unicode请求头值。

更复杂的POST请求More complicated POST requests

通常，如果发送一些表单编码(form-encoded)的数据–就像一个HTML表单。为此，只需将字典传递给`data`参数即可。发送请求时，将自动对字典数据进行表单编码：

>>> import requests

>>> payload = {'key1': 'value1', 'key2': 'value2'}

>>> r = requests.post("https://httpbin.org/post", data=payload)
>>> r.text
{
  "args": {}, 
  "data": "", 
  "files": {}, 
  "form": {
    "key1": "value1", 
    "key2": "value2"
  }, 
  "headers": {
    "Accept": "*/*", 
    "Accept-Encoding": "gzip, deflate", 
    "Content-Length": "23", 
    "Content-Type": "application/x-www-form-urlencoded", 
    "Host": "httpbin.org", 
    "User-Agent": "python-requests/2.27.1", 
    "X-Amzn-Trace-Id": "Root=1-6409fe3b-0cb4118319f09ab3187402bc"
  }, 
  "json": null, 
  "origin": "183.62.127.25", 
  "url": "https://httpbin.org/post"
}

`data`参数中，为每个键可以具有多个值。这可以通过将`data`设置为元组列表或以列表为值的字典来实现。当表单中有多个元素使用相同的键时，这特别有用：

>>> import requests

>>> payload_tuples = [('key1', 'value1'), ('key1', 'value2')]
>>> r1 = requests.post('https://httpbin.org/post', data=payload_tuples)
>>> payload_dict = {'key1': ['value1', 'value2']}
>>> r2 = requests.post('https://httpbin.org/post', data=payload_dict)
>>> r1.text
{
  "args": {}, 
  "data": "", 
  "files": {}, 
  "form": {
    "key1": [
      "value1", 
      "value2"
    ]
  }, 
  "headers": {
    "Accept": "*/*", 
    "Accept-Encoding": "gzip, deflate", 
    "Content-Length": "23", 
    "Content-Type": "application/x-www-form-urlencoded", 
    "Host": "httpbin.org", 
    "User-Agent": "python-requests/2.27.1", 
    "X-Amzn-Trace-Id": "Root=1-6409ff49-11b8232a7cc81fc0290ec4c4"
  }, 
  "json": null, 
  "origin": "183.62.127.25", 
  "url": "https://httpbin.org/post"
}
>>> re.text == r2.text
True

有时，你可能想发送未经表单编码的数据，则需要传入`string`类型的数据，而不是`dict`，`string`数据将被直接提交。

例如，GitHub API v3接受JSON编码的POST/PATCH数据：

>>> import requests
>>> import json

>>> url = 'https://api.github.com/some/endpoint'
>>> payload = {'some': 'data'}
>>> r = requests.post(url, data=json.dumps(payload))

请注意，上述代码不会添加`Content-Type`请求头(特别是不会将其设置为`application/json`）。如果需要设置那个请求头(`'Content-Type': 'application/json`，发送json请求体)，并且不想自己对`dict`进行编码，你也可以直接使用`json`参数传递它，它将自动被编码：

>>> url = 'https://api.github.com/some/endpoint'
>>> payload = {'some': 'data'}
>>> r = requests.post(url, json=payload)

注意，如果提供了`data`，或者`file`参数，`json` 参数将被自动忽略。

提交Multipart-Encoded文件

Request让上传Multipart编码文件变得简单：

>>> import requests

>>> url = 'https://httpbin.org/post'
>>> files = {'file': open('report.xls', 'rb')}

>>> r = requests.post(url, files=files)
>>> r.text
{
  "args": {}, 
  "data": "", 
  "files": {
    "file": "#!/usr/bin/env python\r\n# -*- coding:utf-8 -*-\r\n\r\n#!/usr/bin/env python\r\n# -*- coding:utf-8 -*-\r\n\r\nfrom multiprocessing import Pool\r\nfrom threading import Thread\r\nfrom concurrent.futures import ThreadPoolExecutor, ProcessPoolExecutor..."
  }, 
  "form": {}, 
  "headers": {
    "Accept": "*/*", 
    "Accept-Encoding": "gzip, deflate", 
    "Content-Length": "3035", 
    "Content-Type": "multipart/form-data; boundary=9ef4437cb1e14427fcba1c42943509cb", 
    "Host": "httpbin.org", 
    "User-Agent": "python-requests/2.27.1", 
    "X-Amzn-Trace-Id": "Root=1-640a03df-1a0a5ce972ce410378cda7a2"
  }, 
  "json": null, 
  "origin": "183.62.127.25", 
  "url": "https://httpbin.org/post"
}

可以显示的设置文件名称，内容类型，请求头:

>>> url = 'https://httpbin.org/post'
files = {'file': ('report.xls', open('report.xls', 'rb'), 'application/vnd.ms-excel',  {'Expires': '0'})}

>>> r = requests.post(url, files=files)
>>> r.text
{
  "args": {}, 
  "data": "", 
  "files": {
    "file": "data:application/vnd.ms-excel;base64,UEsDBBQAAAAAAHy8iFMAAAAAAA...=="
  }, 
  "form": {}, 
  "headers": {
    "Accept": "*/*", 
    "Accept-Encoding": "gzip, deflate", 
    "Content-Length": "9667", 
    "Content-Type": "multipart/form-data; boundary=ff85e1018eb5232f7dcab2b2bc5ffa50", 
    "Host": "httpbin.org", 
    "User-Agent": "python-requests/2.27.1", 
    "X-Amzn-Trace-Id": "Root=1-640def51-43cc213e33437a0e60255add"
  }, 
  "json": null, 
  "origin": "183.62.127.25", 
  "url": "https://httpbin.org/post"
}

如果想发送一些字符串，以文件的方式被接收：

>>> url = 'https://httpbin.org/post'
>>> files = {'file': ('report.csv', 'some,data,to,send\nanother,row,to,send\n')}

>>> r = requests.post(url, files=files)
>>> r.text
{
  "args": {}, 
  "data": "", 
  "files": {
    "file": "some,data,to,send\nanother,row,to,send\n"
  }, 
  "form": {}, 
  "headers": {
    "Accept": "*/*", 
    "Accept-Encoding": "gzip, deflate", 
    "Content-Length": "184", 
    "Content-Type": "multipart/form-data; boundary=2bfe430e025860528e29c893a09f1198", 
    "Host": "httpbin.org", 
    "User-Agent": "python-requests/2.27.1", 
    "X-Amzn-Trace-Id": "Root=1-640df132-247947ca699e9da35c588f2d"
  }, 
  "json": null, 
  "origin": "183.62.127.25", 
  "url": "https://httpbin.org/post"
}

如果你将一个非常大的文件作为`multipart/form-data`请求提交，你可能需要流式传输该请求。默认情况下，`requests`不支持此功能，但有一个单独的包支持此功能——`requests toolbelt`。

要在一个请求中发送多个文件，请参阅[高级]章节。

警告

强烈建议以[二进制模式]打开文件。这是因为requests可能会尝试为你提供`Content-Length`请求头，如果这样做，该请求头值将被设置为文件中的_字节数_。如果以_文本模式_打开文件，可能会发生错误。

响应状态码

>>> import requests
>>> r = requests.get('https://httpbin.org/get')
>>> r.status_code
200

以便于参考，`requests`还附带一个内置的状态代码查找对象：

>>> r = requests.get('https://httpbin.org/get')
>>> r.status_code == requests.codes.ok
True

如果请求出错4XX客户端错误或5XX服务器错误响应），我们可以使用[`response.raise_for_status()`]抛出错误:

>>> import requests

>>> bad_r = requests.get('https://httpbin.org/status/404')
>>> bad_r.status_code
404

>>> bad_r.raise_for_status()
Traceback (most recent call last):
  File "D:/codePojects/test.py", line 12, in 
    bad_r.raise_for_status()
  File "D:\Program Files (x86)\python36\lib\site-packages\requests\models.py", line 960, in raise_for_status
    raise HTTPError(http_error_msg, response=self)
requests.exceptions.HTTPError: 404 Client Error: NOT FOUND for url: https://httpbin.org/status/404

但是，如果`r.status_code` 为`200`, `raise_for_status()` 将返回`None`

>>> r.raise_for_status()
None

响应头

>>> r.headers
{
    'content-encoding': 'gzip',
    'transfer-encoding': 'chunked',
    'connection': 'close',
    'server': 'nginx/1.0.4',
    'x-runtime': '148ms',
    'etag': '"e1ca502697e5c9317743dc078f67693f"',
    'content-type': 'application/json'
}

根据[RFC 7230] HTTP请求头大小写不敏感，所以，我们可以使用任何大写。因此，我们可以使用任意大小写来访问请求头：

>>> r.headers['Content-Type']
'application/json'

>>> r.headers.get('content-type')
'application/json'

Cookies

如果响应包含Cookie，可以快速访问它们：

>>> url = 'http://example.com/some/cookie/setting/url'
>>> r = requests.get(url)

>>> r.cookies['example_cookie_name'] # 如果存在名为 example_cookie_name的cookie的话
'example_cookie_value'

可以使用`cookies` 参数将cookie发送给服务器:

>>> url = 'https://httpbin.org/cookies'
>>> cookies = dict(cookies_are='working')

>>> r = requests.get(url, cookies=cookies)
>>> r.text
'{\n  "cookies": {\n    "cookies_are": "working"\n  }\n}\n'

Cookies are returned in a [`RequestsCookieJar`], which acts like a `dict` but also offers a more complete interface, suitable for use over multiple domains or paths. Cookie jars can also be passed in to requests:

返回的Cookie存储在[`RequestsCookieJar`]中，其作用类似于`dict`，同时提供了一个更完整的接口，适合在多个域或路径上使用。Cookie jar也可以传递给请求：

>>> jar = requests.cookies.RequestsCookieJar()
>>> jar.set('tasty_cookie', 'yum', domain='httpbin.org', path='/cookies')
Cookie(version=0, name='tasty_cookie', value='yum', port=None, port_specified=False, domain='httpbin.org', domain_specified=True, domain_initial_dot=False, path='/cookies', path_specified=True, secure=False, expires=None, discard=True, comment=None, comment_url=None, rest={'HttpOnly': None}, rfc2109=False)
>>> jar.set('gross_cookie', 'blech', domain='httpbin.org', path='/elsewhere')
Cookie(version=0, name='gross_cookie', value='blech', port=None, port_specified=False, domain='httpbin.org', domain_specified=True, domain_initial_dot=False, path='/elsewhere', path_specified=True, secure=False, expires=None, discard=True, comment=None, comment_url=None, rest={'HttpOnly': None}, rfc2109=False)
>>> url = 'https://httpbin.org/cookies'
>>> r = requests.get(url, cookies=jar)
>>> r.text
'{"cookies": {"tasty_cookie": "yum"}}'

重定向与history

默认情况下，`requests`将对除`HEAD`之外的所有请求执行位置重定向(如果需要重定向的话)。

我们可以使用Response对象的`history`属性来跟踪重定向。

[`Response.history`]列表包含为完成请求而创建的[`Response`]对象。列表按响应的先后顺序排序。

例如，Gitee将所有HTTP请求重定向到HTTPS：

>>> r = requests.get('http://gitee.com/')
>>> r.url
'https://gitee.com/'
>>> r.status_code
200
>>> r.history
[]

如果使用HEAD，GET， `OPTIONS`， `POST`， `PUT`， `PATCH` 或者`DELETE`，可以使用 `allow_redirects`参数禁止重定向：

>>> r = requests.get('http://gitee.com/', allow_redirects=False)
>>> r.status_code
302
>>> r.history
[]

>>> r = requests.head('http://gitee.com/', allow_redirects=False)
>>> r.url
'http://gitee.com/'
>>> r.status_code
302
>>> r.history
[]
>>> r = requests.head('http://gitee.com/', allow_redirects=True)
>>> r.status_code
200
>>> r.url
'https://gitee.com/'
>>> r.history
[]

请求超时

可以使用`timeout`参数告诉requests在给定的秒数后停止等待响应。几乎所有的生产代码都应该在几乎所有的请求中使用此参数。否则会导致程序无限期挂起：

>>> requests.get('https://gitee.com/', timeout=0.1)
Traceback (most recent call last):
  File "", line 1, in 
  ...
urllib3.exceptions.ReadTimeoutError: HTTPSConnectionPool(host='gitee.com', port=443): Read timed out. (read timeout=0.1)

注意：

`timeout`不是整个响应的下载时间限制；相反，如果服务器在`timeout`秒内没有发出响应（更准确地说，如果在`timeout`秒内底层socket没有接收到任何字节数据），则会引发异常。如果未明确指定`timeout`，则请求不会超时。

错误和异常

如果出现网络问题（例如DNS故障、拒绝连接等），requests将抛出[`ConnectionError`]异常。

如果HTTP请求返回了失败的状态代码，[`Response.raise_for_statu()`]将抛出[`HTTPError`]

如果请求超时，则会抛出[`Timeout`]异常。

如果请求超过了配置的最大重定向次数，则会抛出[`TooManyRedirects`]异常。

requests显式抛出的所有异常都继承自[`requests.exceptions.RequestException`]

高级用法

Session对象

Session对象允许你跨请求保持某些参数，以及Session实例发出的所有请求的cookie，并将使用`urllib3`的[连接池]([HTTP持久连接]

Session对象具有主要 requests API的所有方法。

让我们在请求之间保持一些cookie：

>>> s = requests.Session()
>>> s.get('https://httpbin.org/cookies/set/sessioncookie/123456789')

>>> r = s.get('https://httpbin.org/cookies')
>>> r.text
'{\n  "cookies": {\n    "sessioncookie": "123456789"\n  }\n}\n'
>>>

Seesion对象还可以用于向请求方法提供默认数据。这是通过向Session对象属性提供数据来实现的:

>>> s = requests.Session()
>>> s.auth = ('user', 'pass')
>>> s.headers.update({'x-test': 'true'})

# 'x-test'和'x-test2'请求头随请求发送了
>>> s.headers.update({'x-test': 'true'})
>>> s.get('https://httpbin.org/headers', headers={'x-test2': 'true'})

传递给请求方法的任何字典都将与会话级别设置的值合并。方法级别的参数会覆盖会话级别的参数。

然而，请注意，即使使用会话，方法级参数也不能跨请求保持。本示例将只在发送第一个请求发送cookie，而不发送第二个请求

>>> s = requests.Session()
>>> r = s.get('https://httpbin.org/cookies', cookies={'from-my': 'browser'})
>>> r.text
'{\n  "cookies": {\n    "from-my": "browser"\n  }\n}\n'
>>> r = s.get('https://httpbin.org/cookies')
>>> r.text
'{\n  "cookies": {}\n}\n'

[Cookie utility functions]to manipulate [`Session.cookies`]

如果想手动向Session添加Cookie，那么使用 [Cookie utility functions]来操作[`Session.cookies`]

Session对象也可以用作上下文管理器

>>> with requests.Session() as s:
...     s.get('https://httpbin.org/cookies/set/sessioncookie/123456789')
...

>>>

这将确保在退出`with`块后立即关闭会话，即使发生未处理的异常。

Remove a Value From a Dict Parameter

Sometimes you’ll want to omit session-level keys from a dict parameter. To do this, you simply set that key’s value to `None` in the method-level parameter. It will automatically be omitted.

从字典参数中删除值
有时，你需要从dict参数中忽略会话级别的键。为此，只需在方法级参数中将该键的值设置为“None”即可。它将被自动忽略。

请求和响应对象

示例：获取响应头和请求头

>>> r = s.get('https://httpbin.org')
>>> r.headers # 获取响应头
{'Date': 'Mon, 13 Mar 2023 15:43:41 GMT', 'Content-Type': 'text/html; charset=utf-8', 'Content-Length': '9593', 'Connection': 'keep-alive', 'Server': 'gunicorn/19.9.0', 'Access-Control-Allow-Origin': '*', 'Access-Control-Allow-Credentials': 'true'}
>>> r.request.headers
{'User-Agent': 'python-requests/2.27.1', 'Accept-Encoding': 'gzip, deflate', 'Accept': '*/*', 'Connection': 'keep-alive', 'Cookie': 'sessioncookie=123456789'}
>>>

Prepared requests

每当收到来自某个API调用或者Session调用的[`Response`]对象，`request`属性实际上是所使用的`PreparedRequest`。在某些情况下，你可能希望在发送请求之前对请求体或请求头(或其他任何内容)做一些额外的工作。简单的做法如下：

from requests import Request, Session

s = Session()

req = Request('POST', url, data=data, headers=headers)
prepped = req.prepare()

# do something with prepped.body
prepped.body = 'No, I want exactly this as the body.'

# do something with prepped.headers
del prepped.headers['Content-Type']

resp = s.send(prepped,
    stream=stream,
    verify=verify,
    proxies=proxies,
    cert=cert,
    timeout=timeout
)

print(resp.status_code)

However, the above code will lose some of the advantages of having a requests [`Session`] object. In particular, [`Session`]-level state such as cookies will not get applied to your request. To get a [`PreparedRequest`]with that state applied, replace the call to [`Request.prepare()`]with a call to [`Session.prepare_request()`], like this:

由于你没有对`Request`对象执行任何特殊操作，因此您可以立即prepare它并修改`PreparedRequest`对象。然后将其与发送给`requests.`或`Session.`的其它参数一起发送。

然而，上述代码将失去使用requests [`Session`]对象的一些优点。特别是[`Session`]级别的状态，比如cookie将不会应用于你的请求。如果需要获取应用了那些状态的 [`PreparedRequest`]，替换 [`Request.prepare()`]调用为[`Session.prepare_request()`]，像这样：

from requests import Request, Session

s = Session()
req = Request('GET',  url, data=data, headers=headers)

prepped = s.prepare_request(req)

# do something with prepped.body
prepped.body = 'Seriously, send exactly these bytes.'

# do something with prepped.headers
prepped.headers['Keep-Dead'] = 'parrot'

resp = s.send(prepped,
    stream=stream,
    verify=verify,
    proxies=proxies,
    cert=cert,
    timeout=timeout
)

print(resp.status_code)

When you are using the prepared request flow, keep in mind that it does not take into account the environment. This can cause problems if you are using environment variables to change the behaviour of requests. For example: Self-signed SSL certificates specified in `REQUESTS_CA_BUNDLE` will not be taken into account. As a result an `SSL: CERTIFICATE_VERIFY_FAILED` is thrown. You can get around this behaviour by explicitly merging the environment settings into your session:

当你使用prepared request请求时，请记住它没有考虑环境。如果你正使用环境变量来更改请求的行为，这可能会导致问题。例如：在`REQUESTS_CA_BUNDLE`中指定的自签名SSL证书将不起作用，结果引发了`SSL:CERTIFICATE_VERIFY_FAILED`。你可以通过将环境设置显式合并到Session中来避免这种行为：

from requests import Request, Session

s = Session()
req = Request('GET', url)

prepped = s.prepare_request(req)

# Merge environment settings into session
settings = s.merge_environment_settings(prepped.url, {}, None, None, None)
resp = s.send(prepped, **settings)

print(resp.status_code)

HTTP Basic 验证

>>> from requests.auth import HTTPBasicAuth
>>> auth = HTTPBasicAuth('your_username', 'your_password')

>>> r = requests.post(url='you_target_url', data=body, auth=auth)

SSL证书验证

requests验证HTTPS请求的SSL证书，就像web浏览器一样。默认情况下，SSL验证已启用，如果无法验证证书，请求将抛出SSLError：

>>> requests.get('https://requestb.in')
requests.exceptions.SSLError: hostname 'requestb.in' doesn't match either of '*.herokuapp.com', 'herokuapp.com'

你可以使用`verify`参数传递拥有受信任CA的证书的CA_BUNDLE文件的路径或者目录：

>>> requests.get('https://github.com', verify='/path/to/certfile')

或者

s = requests.Session()
s.verify = '/path/to/certfile'

注意：

如果`verify`设置为目录的路径，则必须使用OpenSSL提供的`c_rehash`实用程序处理该目录。

还可以通过`REQUESTS_CA_BUNDLE`环境变量指定此受信任CA列表。如果未设置`REQUESTS_CA_BUNDLE`，将使用`CURL_CA_BUNDLE` 。

如果将`verify`设置为`False`，则requests也可以忽略SSL证书验证：

>>> requests.get('https://kennethreitz.org', verify=False)

请注意，当`verify`设置为`False`时，Requests将接受服务器提供的任何TLS证书，并将忽略主机名不匹配，或过期的证书，这将使你的应用程序容易受到中间人(MitM)攻击。在本地开发或测试期间，将`verify`设置为`False`可能很有用。

默认情况下，`verify`设置为`True`。选项`verify`仅适用于主机证书。

客户端证书

你还可以将本地证书指定为客户端证书、单个文件（包含私钥和证书）或两个文件路径的元组

>>> requests.get('https://kennethreitz.org', cert=('/path/client.cert', '/path/client.key'))

或者:

s = requests.Session()
s.cert = '/path/client.cert'

警告

本地证书的私钥必须为未加密的。当前，Requests不支持加密的私钥

CA证书

Reuests使用来自[certific]包中的证书. 这允许用户在不更改Requests版本的情况下更新其受信任的证书。

在2.16版本之前，Requests捆绑了一组其信任的根CA证书，证书来源于[Mzillatruststore]。每个Request版本只更新一次证书。当未安装`certific`时，当使用较旧版本的requests时，这会导致证书包非常过时。

为了安全起见，我们建议经常升级`certific`！

Body内容工作流

默认情况下，当你发出一个请求时，将立即下载响应的正文。你可以使用`stream`参数覆盖此行为并延迟下载响应主体直到访问[`response.content`]属性

tarball_url = 'https://github.com/psf/requests/tarball/main'
r = requests.get(tarball_url, stream=True)

此时，仅仅响应头被下载，且连接保持打开状态，因此，允许我们有条件的检索内容：

if int(r.headers.get('content-length')) < TOO_LONG:
  content = r.content
  ...

您可以使用 [`Response.iter_content()`] 和[`Response.iter_lines()`] 方法进一步控制工作流。或者，可以从位于[`Response.raw`]的底层的[`urllib3.HTTPResponse`]中读取未编码的主体.

如果在发出请求时将`stream`设置为`True`，则requests无法释放连接回连接池，除非读取完所有数据或调用[`Response.close`](。这可能导致连接效率低下。如果你发现自己在使用`stream=True`时部分读取请求体（或根本没有读取它们），则应在`with`语句中发出请求，以确保连接最终处于关闭状态：

with requests.get('https://httpbin.org/get', stream=True) as r:
    # Do things with the response here.

Keep-Alive

多亏了`urllib3`，`keep-alive`在Session中是100%自动的！你在Session发出的任何请求都将自动重用合适的连接！

注意，只有在读取了所有响应体数据后，才会将连接释放回连接池以供重用；请确保将`stream`设置为`False`或读取`Response`对象的`content`属性。

流式上传

requests支持流式上传，允许发送大型流或文件，而无需将其读入内存。要流式传输和上传，只需为请求体提供一个类似文件的对象:

with open('massive-body', 'rb') as f:
    requests.post('http://some.url/streamed', data=f)

警告

强烈建议以[二进制模式]打开文件。这是因为requests可能会尝试为你提供`Content-Length`请求头，如果这样做，该请求头值将被设置为文件中的_字节数_。如果以_文本模式_打开文件，可能会发生错误。

分块编码(Chunk-Encoded)请求

requests 还支持传出和传入请求的分块传输编码。要发送块编码请求，只需简单的为请求体提供一个生成器（或任何没有长度的迭代器）

def gen():
    yield 'hi'
    yield 'there'

requests.post('http://some.url/chunked', data=gen())

对于分块编码请求的响应，最好使用[`Response.iter_content()`]对数据进行迭代。在理想情况下，将在请求上设置`stream=True`，在这种情况下，可以通过使用值为`None`的`chunk_size`参数调用`iter_content`来逐块迭代。如果要设置块的最大大小，可以将`chunk_size`参数设置为任意目标大小整数。

POST 多个分部编码(Multipart-Encoded)文件

你可以在一个请求中发送多个文件。例如，假设你要将图像文件上载到具有多个文件字段“images”的HTML表单：

为此，只需将`files`设置为`(form_field_name，file_info)`的元组列表：

>>> url = 'https://httpbin.org/post'
>>> multiple_files = [
...     ('images', ('foo.png', open('foo.png', 'rb'), 'image/png')),
...     ('images', ('bar.png', open('bar.png', 'rb'), 'image/png'))]
>>> r = requests.post(url, files=multiple_files)
>>> r.text
>>> r.text
'{\n  "args": {}, \n  "data": "", \n  "files": {\n    "images": "data:image/png;base64,iVBORw0KGgoAAAAN...=="\n  }, \n  "form": {}, \n  "headers": {\n    "Accept": "*/*", \n    "Accept-Encoding": "gzip, deflate", \n    "Content-Length": "1800", \n    "Content-Type": "multipart/form-data; boundary=771ef90459071106c5f47075cbca2659", \n    "Host": "httpbin.org", \n    "User-Agent": "python-requests/2.27.1", \n    "X-Amzn-Trace-Id": "Root=1-641122ea-10a6271f0fdf488c70cf90e9"\n  }, \n  "json": null, \n  "origin": "183.62.127.25", \n  "url": "https://httpbin.org/post"\n}\n'

事件钩子(Event Hooks)

requests拥有一个hook系统，可用于控制请求过程的部分，或者信号事件处理。

可用的hooks:

response:

请求生成的响应

通过将`{hook_name:callback_function}`字典传递给`hooks`请求参数，可以按每个请求分配一个钩子函数：

hooks={'response': print_url}

`callback_function`将接收一数据块(a chunk of data)作为其第一个参数。

def print_url(r, *args, **kwargs):
    print(r.url)

回调函数必须处理其自己的异常。任何为处理的异常，都不会以静默方式传递，因此应该由代码调用请求来处理。

如果回调函数返回某个值，则假定它将替换传入的数据。如果函数不返回任何内容，则不产生任何影响

def record_hook(r, *args, **kwargs):
    r.hook_called = True
    return r

让我们在运行时打印一些请求方法参数:

>>> requests.get('https://httpbin.org/', hooks={'response': print_url})
https://httpbin.org/

可以添加多个钩子到单个请求中，如下，一次调用两个钩子函数：

>>> r = requests.get('https://httpbin.org/', hooks={'response': [print_url, record_hook]})
>>> r.hook_called
True

还可以为`Session`实例添加钩子，这样添加的任何钩子都将在向会话发出的每个请求中被调用。例如：

>>> s = requests.Session()
>>> s.hooks['response'].append(print_url)
>>> s.get('https://httpbin.org/')
 https://httpbin.org/

如果`Session`实例可个钩子函数，那么将按钩子的添加顺序调用这些钩子。

自定义身份验证

requests 请求支持自定义身份验证机制。

作为`auth`参数传递给请求方法的任何可调用对象都有机会在发送请求之前修改请求。

身份验证实现为[`AuthBase`]的子类，并且易于定义。requests在`requests.auth`中提供了两种常见的身份验证方案实现：[`HTTPBasicAuth`]和[`HTTPDigestAuth`].

假设我们有一个web服务，它只有在`X-Pizza`请求头设置为密码值时才会响应。这不太可能，暂且还是顺着它：

from requests.auth import AuthBase

class PizzaAuth(AuthBase):
    """Attaches HTTP Pizza Authentication to the given Request object."""
    
    def __init__(self, username):
        # setup any auth-related data here
        self.username = username

    def __call__(self, r):
        # modify and return the request
        r.headers['X-Pizza'] = self.username
        return r

然后，发送请求

>>> requests.get('http://pizzabin.org/admin', auth=PizzaAuth('kenneth'))

流式请求

使用[`Response.iter_lines()`]，可以很轻易的迭代流式API，比如 [Twitter Streaming API]。简单的设置 `stream` 为 `True` 并且使用[`iter_lines`]对响应进行迭代:

import json
import requests

r = requests.get('https://httpbin.org/stream/20', stream=True)

for line in r.iter_lines():

    # filter out keep-alive new lines
    if line:
        decoded_line = line.decode('utf-8')
        print(json.loads(decoded_line))

将`decode_unicode=True`与 [`Response.iter_lines()`]、或者[`Response.iter_content()`]配合使用时，如果服务器未提供编码，则需要提供编码：

r = requests.get('https://httpbin.org/stream/20', stream=True)

if r.encoding is None:
    r.encoding = 'utf-8'

for line in r.iter_lines(decode_unicode=True):
    if line:
        print(json.loads(line))

警告

[`iter_lines`]不是可重入安全的。多次调用此方法会导致一些接收到的数据丢失。如果需要从多个地方调用它，请使用生成的迭代器对象：

lines = r.iter_lines()
# Save the first line for later or just skip it

first_line = next(lines)

for line in lines:
    print(line)

代理

如果你需要使用代理，可在任何请求方法的`proxys`参数中为单个请求配置代理

import requests

proxies = {
  'http': 'http://10.10.1.10:3128',
  'https': 'http://10.10.1.10:1080',
}

requests.get('http://example.org', proxies=proxies)

可选的，可以一次性为整个Session配置代理。

import requests

proxies = {
  'http': 'http://10.10.1.10:3128',
  'https': 'http://10.10.1.10:1080',
}
session = requests.Session()
session.proxies.update(proxies)

session.get('http://example.org')

警告

为`session.proxies`提供的值可能被环境代理（由[urllib.request.getproxys]返回的值）覆盖，所以为了确保在环境代理存在的情况下，也使用给定代理，显示为所有单个请求指定`proxies`参数，如上述一开始所述。

如果没有为请求设置`proxies`请求参数的情况下，requests会尝试读取由标准环境变量 `http_proxy`, `https_proxy`, `no_proxy`和`all_proxy`定义的代理配置。这些变量名称可大写。所以，可以通过这些变量配置为请求设置代理(请根据实际需要配置):

linux:

$ export HTTP_PROXY="http://10.10.1.10:3128"
$ export HTTPS_PROXY="http://10.10.1.10:1080"
$ export ALL_PROXY="socks5://10.10.1.10:3434"

$ python
>>> import requests
>>> requests.get('http://example.org')

win：

set HTTP_PROXY=http://10.10.1.10:3128
>>> import requests
>>> requests.get('http://example.org')

要对代理使用HTTP基本身份验证，请在上述任意代理配置入口中使用语法：

$ export HTTPS_PROXY="http://user:[email protected]:1080"

$ python
>>> proxies = {'http': 'http://user:[email protected]:3128/'}

警告

将敏感的用户名和密码信息存储在环境变量或版本控制的文件中会带来安全风险，强烈建议不要这样做。

如果要为特定shema和主机提供代理，请使用`scheme://hostname`作`proxies`字典参数的键来设置代理。这将匹配给定scheme和确切主机名的任何请求。

proxies = {'http://10.20.1.128': 'http://10.10.1.10:5323'}

注意，代理URL必须包含schema。

最后需要注意的，为`https`连接设置代理，通常需要所在本机机器信任代理根证书。默认的，可以通过以下代码查找requests信任的证书列表:

from requests.utils import DEFAULT_CA_BUNDLE_PATH
print(DEFAULT_CA_BUNDLE_PATH)

通过将 `REQUESTS_CA_BUNDLE` (or `CURL_CA_BUNDLE`) 环境变量设置为另一个文件路径，可以覆盖此证书路径：

$ export REQUESTS_CA_BUNDLE="/usr/local/myproxy_info/cacert.pem"
$ export https_proxy="http://10.10.1.10:1080"

$ python
>>> import requests
>>> requests.get('https://example.org')

SOCKS

版本2.10.0中新增

除了基本的HTTP代理之外，requests还支持使用SOCKS协议的代理。这是一项可选功能，要求在使用前安装其他第三方库

可通过`pip`获取该功能需要的依赖:

$ python -m pip install requests[socks]

安装依赖后，使用SOCKS代理就同使用HTTP代理一样简单：

proxies = {
    'http': 'socks5://user:pass@host:port',
    'https': 'socks5://user:pass@host:port'
}

使用 `socks5` 会导致DNS解析发生在客户端上，而不是代理服务器上。这与`curl`保持一致，curl使用scheme来决定是在客户端还是代理服务器上进行DNS解析。如果要解析代理服务器上的域，请使用`socks5h`作为scheme

编码

当收到响应时，并访问 `Response.text`属性时，requests会猜测用于解码响应体的编码。requests将首先检查HTTP请求头中的编码，如果不存在，则使用[charset_normalizer]尝试猜测编码。

如果安装了`chardet`，`requests`将使用它，但对于python3来说，`chardet`不再是强制依赖项。

当安装`requests`时，没有指定 `[use_chardet_on_py3]`，并且`chardet`尚未安装时，requests将使用`charset normalizer`来猜测编码。

requests不会猜测编码的唯一情况是HTTP请求头中不存在显示字符集且`Content-Type`请求头包含`text`。在这种情况下，[RFC 2616]指定默认字符集必须是`ISO-8859-1`。requests遵循该规范。如果需要不同的编码，您可以手动设置[`Response.conding`])属性，或使用原始[`Response.content`]

Link请求头

许多HTTP API具有link请求头。它们使API更加自我描述和可发现。

>>> url = 'https://api.github.com/users/kennethreitz/repos?page=1&per_page=10'
>>> r = requests.head(url=url)
>>> r.headers['link']
'; rel="next", ; rel="last"'

requests 将自动解析这link请求头并且让它们更容易被使用:

>>> r.links["next"]
{'url': 'https://api.github.com/user/119893/repos?page=2&per_page=10', 'rel': 'next'}
>>> r.links["last"]
{'url': 'https://api.github.com/user/119893/repos?page=5&per_page=10', 'rel': 'last'}

传输适配器(Transport Adapters)

从v1.0.0开始，requests 已模块化内部设计。这样做的部分原因是为了实现传输适配器，最初[在此处描述]. 传输适配器提供了一种机制来定义某个HTTP服务的交互方法。特别是，它们允许你应用每个服务的配置。

requests附带单个传输适配器[`HTTPAdapter`]. 此适配器使用功能强大的`urllib3`提供与HTTP和HTTPS的默认请求交互。当初始化 requests [`Session`]时，其中一个附加到[`Session`]对象表示HTTP，一个表示HTTPS。

户能够创建和使用自己的具备特定功能的传输适配器。一旦创建，传输适配器就可以加载到会话对象，并指示它应该应用于哪些web服务。

>>> s = requests.Session()
>>> s.mount('https://github.com/', MyAdapter())

上述`mount`调用将传输适配器的指定实例注册到URL前缀中。一旦挂载，使用该session发起的，URL以给定前缀开头的任何HTTP请求都将使用给定的传输适配器。

实现传输适配器的许多细节超出了本文档的范围，但是可以看下一个简单SSL使用示例。除此之外，您还可以考虑继承[`BaseAdapter`]\实现子类适配器。

示例: 指定SSL版本

The requests team has made a specific choice to use whatever SSL version is default in the underlying library ([urllib3]). Normally this is fine, but from time to time, you might find yourself needing to connect to a service-endpoint that uses a version that isn’t compatible with the default.

You can use Transport Adapters for this by taking most of the existing implementation of HTTPAdapter, and adding a parameter ssl_version that gets passed-through to urllib3. We’ll make a Transport Adapter that instructs the library to use SSLv3:

默认情况下，requests选择使用底层`urllib3`库中默认的SSL版本。通常情况下，这是可以的，但有时，您可能会发现自己需要连接到使用与默认版本不兼容的SSL版本的服务端。

为此，可以通过继承`HTTPAdapter`实现自定义传输适配器，

示例：编写一个适配器，指示库使用SSLv3：

import ssl
from urllib3.poolmanager import PoolManager

from requests.adapters import HTTPAdapter


class Ssl3HttpAdapter(HTTPAdapter):
    """"Transport adapter" that allows us to use SSLv3."""

    def init_poolmanager(self, connections, maxsize, block=False):
        self.poolmanager = PoolManager(
            num_pools=connections, maxsize=maxsize,
            block=block, ssl_version=ssl.PROTOCOL_SSLv3)

阻塞或非阻塞

有了默认的传输适配器，requests就不会提供任何类型的非阻塞IO。[`Response.content`]属性将阻塞，直到下载完整个响应为止。如果你需要更大的粒度，则库的流式传输功能（请参阅[流式传输请求]）允许单次接收较小数量的响应那日。然而，这些调用仍然是阻塞。

如果您关心阻塞IO的使用，那么有很多项目将请求与Python的异步框架结合在一起。一些很好的例子是 [requests-threads], [grequests], [requests-futures], 和[httpx].

超时

大多数对外部服务器的请求都应该附加超时，以防服务器没有及时响应。默认情况下，除非显式设置了超时时间，否则requests不会超时。如果没有超时，你的代码可能会挂起几分钟或更长时间。

连接超时是requests等待客户端建立与远程计算机的socke连接的秒数。将连接超时设置为略大于3的倍数是一种很好的做法，因为3秒是默认的[TCP数据包重传窗口].

一旦客户端连接到服务器并发送HTTP请求后，读取超时是客户端等待服务器返回响应的秒数(具体来说，这是客户端等待服务器返回字节数据的秒数。在99.9%的情况下，这是服务器返回第一个字节之前的等待时间）。

如果需要为请求设置一个超时时间，可以为`timeout`参数指定一个具体的时间值：

r = requests.get('https://github.com', timeout=5)

该超时时间将同时应用于连接超时和读取超时。如果想为连接超时和读取超时分别设置不同的等待时间，可以指定一个元组:

r = requests.get('https://github.com', timeout=(3.05, 27))

如果服务很慢，想让requests一直等待响应直到获取响应，可以指定`timeout`参数值为`None`

r = requests.get('https://github.com', timeout=None)

最后，编程资料、学习路线图、源代码、软件安装包等！都可以【点击这里】领取！码文不易，求各位看官动动小手给个关注吧~

你可能感兴趣的:(python,学习,数学建模)

使用Python调用OpenCV中的solvePnP函数 WzisTypescript python opencv 开发语言 OpenCV
OpenCV是一个广泛使用的计算机视觉库，它提供了许多用于处理图像和视频的功能。其中一个重要的功能是解决透视投影问题，也就是通过已知的3D点和对应的2D图像点来计算相机的位姿。在OpenCV中，solvePnP函数就是用于解决这个问题的。solvePnP函数使用了一种称为Perspective-n-Point（PnP）问题的算法，它可以估计相机的旋转和平移向量，从而确定相机在3D空间中的位置。这对
python-leetcode-翻转二叉树 Joyner2018 leetcode 算法职场和发展
226.翻转二叉树-力扣（LeetCode）#Definitionforabinarytreenode.#classTreeNode:#def__init__(self,val=0,left=None,right=None):#self.val=val#self.left=left#self.right=rightclassSolution:definvertTree(self,root:Opti
python2 中使用pip2 install package_name的时候报错：AttributeError: ‘int‘ object has no attribute ‘endswith‘ 点亮~黑夜 16—各种错误和bug（你的痛我的痛痛痛痛）python
文章目录1错误说明2错误解决方式1错误说明1、在python2的环境下使用pip2install安装库包的时候报错：AttributeError:'int'objecthasnoattribute'endswith'2、具体报错信息如下(base)shl@zhihui-mint:~/tools$pip2installpyquaternionException:Traceback(mostrecen
【用Java学习数据结构系列】初识泛型 Gu Gu Study 【用Java学习数据结构系列】java 数据结构机器学习人工智能
看到这句话的时候证明：此刻你我都在努力加油陌生人br/>个人主页：GuGuStudy专栏：用Java学习数据结构系列喜欢的一句话：常常会回顾努力的自己，所以要为自己的努力留下足迹喜欢的话可以点个赞谢谢了。作者：小闭前言好久没有更新文章了，大概断更了20天，想着今天就写一下文章吧！最近也是又温习了一下数据结构，其实之前我写过关于数据结构的一个专栏那个专栏是写了顺序表，链表，栈和队列，但是那时是用C语
软件测试中的AI-为什么它在软件自动化测试中很重要？测试界霄霄软件测试人工智能功能测试自动化测试软件测试程序人生职场和发展
通俗地说，人工智能（AI）是计算机科学的一个领域，它专注于使机器“智能化”。所谓智能，就是使系统能够像人类一样学习和做出决策。因此，人工智能机器将能够学习如何在特定情况下做出反应，然后根据其学习情况在未来场景中做出决策。人工智能（AI）在大多数领域的应用仍处于早期阶段，想要完美运行还需要很长时间。今天的人工智能（AI）技术可以帮助我们完成许多不需要复杂思考的重复性日常任务。接下来，让我们讨论软件测
OpenCV实现Python视频播放控制详解夏勇兴
本文还有配套的精品资源，点击获取简介：本文详细介绍了如何使用OpenCV库在Python环境中播放视频，并展示了实现视频快进、后退控制的方法。首先通过cv2.VideoCapture()函数实现基础播放，然后利用set(cv2.CAP_PROP_FPS)函数控制播放速度实现快进和慢速播放，最后结合cv2.CAP_PROP_POS_MSEC属性实现精确的快进和后退。开发者可以根据实际需求选择合适的方
CentOS7 编译安装Python3.12 topxiasz linux python
Tom更新于2024.8.201.说明CentOS7已成为历史，不过很多人还在这段是历史奋战。Python2的Python2.7.5是CentOS7默认安装的版本;Python3的Python3.6.8是CentOS7可以通过默认repo，直接用yum安装的版本。yuminstall-ypython3本文主要针对CentOS7中较高版本如3.12的编译安装。2.安装OpenSSL-1.1.1根据P
遥感深度学习过程中图像分割的尺寸对模型训练结果的影响司南锤深度学习遥感深度学习人工智能
1.计算资源与显存占用大尺寸图像：需要更高的显存和计算资源，可能限制训练时的批大小（batchsize），甚至导致无法训练。解决方案：通常将大图裁剪为小尺寸的补丁（patches），例如256x256或512x512。小尺寸图像：显存占用低，但可能丢失全局上下文信息（如大面积地物分布），影响模型对复杂场景的理解。2.模型感受野与上下文信息小尺寸输入：模型感受野受限，可能无法捕捉大范围地物（如河流、
使用小尺寸的图像进行逐像素语义分割训练，出现样本不均衡训练效果问题司南锤深度学习遥感计算机视觉人工智能机器学习
在使用小尺寸图像进行逐像素语义分割训练时，确实可能出现样本不均衡问题，且这种问题可能比大尺寸图像更显著。1.小尺寸图像如何加剧样本不均衡？(1)局部裁剪导致类别分布偏差问题：遥感图像中某些类别（如道路、建筑）可能稀疏分布。小尺寸裁剪后，部分训练样本可能完全不含某些类别（例如一块纯农田的补丁），导致模型对这些类别缺乏学习机会。示例：原图中“道路”占比5%，若裁剪为256x256的小图，部分小图中可能
note: This error originates from a subprocess，and is likely not a problem with pip异常嚯呀怪怪怪 pip 后端 python 运维 pycharm 服务器
note:Thiserrororiginatesfromasubprocess，andislikelynotaproblemwithpip异常这个错误提示表明问题可能源自pip所调用的子进程，而不是pip本身的问题。可能的原因包括：环境问题：Python环境（如虚拟环境）没有正确配置。库或Python版本之间的冲突。权限问题，导致pip无法执行子进程。系统问题：系统依赖或工具（如gcc、make）
读书笔记--分布式服务架构对比及优势一望无际的大草原读书笔记服务中心后端读书笔记分布式架构共享服务
本篇是在上一篇的基础上，主要对共享服务平台建设所依赖的分布式服务架构进行学习，主要记录和思考如下，供大家学习参考。随着企业各业务数字化转型工作的推进，之前在传统的单一系统（或单体应用）模式中，每个系统都要做这些公共的功能或模块，比如用户管理，权限认证，日志，邮件，财务等等，随着企业各大应用系统的不断扩展，各垂直业务板块逐步沉淀形成各自的核心业务的数字化能力，提出了基于SOA理念的分布式服务架构，S
06-机器学习-数据预处理不会打代码呜呜呜呜机器学习机器学习人工智能
数据清洗数据清洗是数据预处理的核心步骤，旨在修正或移除数据集中的错误、不完整、重复或不一致的部分，为后续分析和建模提供可靠基础。以下是数据清洗的详细流程、方法和实战示例：一、数据清洗的核心任务问题类型表现示例影响缺失值数值型字段为空（NaN）模型无法处理缺失值，导致训练中断或偏差异常值年龄=200岁，房价=-100万扭曲统计指标（如均值），降低模型泛化性重复数据两行记录完全相同导致模型过拟合，降低
Linux学习笔记（复习版day008） ccnnlxc Liux学习复习笔记 linux 学习笔记
1.僵尸进程僵尸进程（ZombieProcess）是指那些已经终止（即完成执行）的进程，但其父进程尚未读取其退出状态信息的进程。简单来说，僵尸进程的生命周期已经结束，但它的进程描述符仍然存在于系统中，以便父进程能够获取其退出状态。处理：1.top命令查询是否有僵尸进程，此处1zombie表示有一个僵尸进程2.ps-aux|grepZ查询僵尸进程的pid,STAT状态为Z+的即为僵尸进程。3.pst
【问题解决】| 关于This error originates from a subprocess, and is likely not a problem with pip问题 Qodicat 问题解决 pip
写代码配环境的时候，无意间碰到这样一个问题Thiserrororiginatesfromasubprocess,andislikelynotaproblemwithpip查了网上的博客之后，大概的意思是——这个库和python版本不兼容，python版本过高导致一般只需要降低python版本，或者升高库的版本即可解决问题的过程中收获两个小的知识点1、pip可以搜索到很多版本，比如我们输入pipin
从零推导线性回归：最小二乘法与梯度下降的数学原理 Echo-Nie 机器学习机器学习线性回归人工智能梯度下降数学推导
欢迎来到我的主页：【Echo-Nie】本篇文章收录于专栏【机器学习】本文所有内容相关代码都可在以下仓库中找到：Github-MachineLearning1线性回归1.1什么是线性回归线性回归是一种用来预测和分析数据之间关系的工具。它的核心思想是找到一条直线（或者一个平面），让这条直线尽可能地“拟合”已有的数据点，通过这条直线，我们可以预测新的数据。eg：假设你想预测房价，你知道房子的大小（面积）
Python 3.12安装库报错 m0_47156047 python 开发语言
报错如下：AttributeError:module'pkgutil'hasnoattribute'ImpImporter'.Didyoumean:'zipimporter'?这是因为Python3.12移除了对pkgutil.ImpImporter的支持，而某些库（例如setuptools或numpy的旧版本）依赖于旧的导入机制。解决方案1.降级到兼容的Python版本numpy和一些旧的依赖库
机器视觉python+opencv函数库：一二师弟_k opencv python
对此图片进行操作：代码部分：第一步：importcv2#导入opencv函数库img_test=cv2.imread(r"C:\Users\12044\Desktop\test.png")#读取图像，img_test为原图名称cv2.imshow("image",img_test)#显示图像，引号中的内容为图像显示窗口的名称，即“image”cv2.waitKey(0)#等待事件触发，参数0表示永
超实用的 30 段 Python 案例（上） Python之栈 python 开发语言
Python是目前最流行的语言之一，它在数据科学、机器学习、web开发、脚本编写、自动化方面被许多人广泛使用。它的简单和易用性造就了它如此流行的原因。如果你正在阅读本文，那么你或多或少已经使用过Python或者对Python感兴趣。在本文中，我们将会介绍30个简短的代码片段，你可以在30秒或更短的时间里理解和学习这些代码片段。1.检查重复元素下面的方法可以检查给定列表中是否有重复的元素。它使用了s
cv python_python里面cv是什么意思 weixin_40004659 cv python
OpenCV(OpenSourceComputerVisionLibrary)开放源代码计算机视觉库，主要算法涉及图像处理、计算机视觉和机器学习相关方法。OpenCV其实就是一堆C和C++语言的源代码文件，这些源代码文件中实现了许多常用的计算机视觉算法。OpenCV由一系列C函数和C++类构成，它有C，C++，Python和java接口，当前SDK(SoftwareDevelopmentKit软件
python实现坐标系转换_python – 执行坐标系转换的库？ weixin_39622150 python实现坐标系转换
您可以使用shapely库：http://toblerity.org/shapely/manual.htmlfromshapely.geometryimportPointfromfunctoolsimportpartialimportpyprojfromshapely.opsimporttransformpoint1=Point(9.0,50.0)print(point1)project=part
Hadoop学习笔记 --- YARN执行流程与工作原理杨鑫newlfe 数据仓库大数据挖掘与大数据应用案例 YARN Hadoop 大数据资源调度数据仓库
一、YARN简述首先介绍一下YARN在Hadoop2.0版本引进的资源管理系统，直接从MapReduceV1演化而来(由于引擎的功能缺陷)；原因是将MapReduce1中的JobTracker的资源管理和作业调度两个功能分开，分别由ResourceManager和ApplicationMaster进行实现；ResourceManager：负责整个集群的资源管理和调度ApplicationMaste
【如何获取股票数据05】Python、Java等多种主流语言实例演示获取股票行情api接口之沪深A股最新分时MA数据获取实例演示及接口API说明文档码农蝶澈 python java 开发语言股票数据API 股票数据接口
最近一两年内，股票量化分析逐渐成为热门话题。而从事这一领域工作的第一步，就是获取全面且准确的股票数据。因为无论是实时交易数据、历史交易记录、财务数据还是基本面信息，这些数据都是我们进行量化分析时不可或缺的宝贵资源。我们的主要任务是从这些数据中提炼出有价值的信息，为我们的投资策略提供有力的指导。在数据探索的旅途中，我尝试了多种方法，包括自编网易股票页面爬虫、申万行业数据爬虫，以及同花顺问财的爬虫，甚
Shapely：Python中的几何操作库 xyt556_CUMT Big Data python 开发语言
Shapely：Python中的几何操作库介绍Shapely是一个用于操作和分析几何对象的Python库。它基于GEOS（GeometryEngine-OpenSource）库，提供了一系列函数来处理几何形状，如点（Point）、线（LineString）、多边形（Polygon）等。Shapely被广泛应用于GIS（地理信息系统）、数据分析和计算机图形学中，用于处理地理空间数据和几何分析。安装S
使用 rasterstats 库进行栅格与矢量数据的空间分析 xyt556_CUMT 人工智能
在地理信息系统（GIS）领域，栅格数据和矢量数据是两类常见的数据类型。栅格数据通常代表像素网格，如遥感影像或土地利用图，而矢量数据则通常表示具体的地理实体，如行政区划或土地边界。如何有效地结合这两类数据进行空间分析是许多地理研究中的关键问题。rasterstats是一个用于处理栅格和矢量数据的Python库，提供了便捷的工具来实现栅格统计、空间叠加分析等。本文将介绍如何使用rasterstats库
#深度学习：从基础到实践 single_ffish 深度学习 gpt 神经网络生成对抗网络 1024程序员节
深度学习是人工智能领域近年来最为火热的技术之一。它通过构建由多个隐藏层组成的神经网络模型，能够从海量数据中自动学习特征和表征,在图像识别、自然语言处理、语音识别等领域取得了突破性进展。本文将全面介绍深度学习的基础知识、主要算法和实践应用,帮助您快速掌握这一前沿技术。1.深度学习的基础1.1人工神经网络深度学习是基于人工神经网络(ArtificialNeuralNetwork,ANN)的一种机器学习
Python 项目__init__.py 文件作用 KillFuckBugs python python 开发语言
在Python项目中，__init__.py文件有以下几个主要作用：1.将目录标识为包当一个目录中包含__init__.py文件时，Python会将该目录识别为一个包。这允许开发者通过模块导入的方式访问该目录中的内容。例如：目录结构：project/mypackage/__init__.pymodule1.pymodule2.py导入示例：pythonfrommypackageimportmodu
【深度学习|地学应用】遥感与深度学习：揭示梦柯冰川奥秘的前沿应用与实践解析 985小水博一枚呀深度学习地学应用深度学习人工智能
【深度学习|地学应用】遥感与深度学习：揭示梦柯冰川奥秘的前沿应用与实践解析【深度学习|地学应用】遥感与深度学习：揭示梦柯冰川奥秘的前沿应用与实践解析文章目录【深度学习|地学应用】遥感与深度学习：揭示梦柯冰川奥秘的前沿应用与实践解析前言一、使用高分6号遥感影像结合深度学习对梦柯冰川的研究方向1.冰川边界自动化提取2.冰川变化动态监测3.冰川分类与分布特征分析二、梦柯冰川（MunkuGlacier）的
TCP/IP协议族 dlz0836 网络 tcp/ip 网络协议
理解常见的网络协议，特别是TCP/IP协议族，对于网络通信的深入学习至关重要。TCP/IP协议族是支撑互联网通信的基础，涉及一系列协议来保证数据在网络上的正确传输。下面，我将对TCP/IP协议的工作原理进行深入浅出的讲解，分为多个部分来解释它的主要协议及其作用。一、TCP/IP协议族概述TCP/IP（TransmissionControlProtocol/InternetProtocol）是一个协
Vue学习第31天——编程式路由导航5种方法详解及案例练习（与声明式路由导航对比）离奇6厘米 vue 学习 javascript vue
目录一、编程式路由导航1、概念2、理解3、用法二、编程式路由导航的5种方法1、push2、replace3、forward4、back5、go三、案例练习四、编程式路由导航与声明式路由导航对比一、编程式路由导航1、概念除了使用创建a标签来定义导航链接，我们还可以借助router的实例方法，通过编写代码来实现。2、理解不借助实现路由跳转3、用法在vue组件中，可以通过$router访问路由实例，因此
【如何获取股票数据01】Python、Java等多种主流语言实例演示获取股票行情api接口之沪深A股实时交易数据获取实例演示及接口API说明文档 Eumenides_max python java 开发语言
最近一两年内，股票量化分析逐渐成为热门话题。而从事这一领域工作的第一步，就是获取全面且准确的股票数据。因为无论是实时交易数据、历史交易记录、财务数据还是基本面信息，这些数据都是我们进行量化分析时不可或缺的宝贵资源。我们的主要任务是从这些数据中提炼出有价值的信息，为我们的投资策略提供有力的指导。在数据探索的旅途中，我尝试了多种方法，包括自编网易股票页面爬虫、申万行业数据爬虫，以及同花顺问财的爬虫，甚
java线程的无限循环和退出 3213213333332132 java
最近想写一个游戏，然后碰到有关线程的问题，网上查了好多资料都没满足。突然想起了前段时间看的有关线程的视频，于是信手拈来写了一个线程的代码片段。希望帮助刚学java线程的童鞋 package thread; import java.text.SimpleDateFormat; import java.util.Calendar; import java.util.Date
tomcat 容器 BlueSkator tomcat Web servlet
Tomcat的组成部分 1、server A Server element represents the entire Catalina servlet container. (Singleton) 2、service service包括多个connector以及一个engine，其职责为处理由connector获得的客户请求。 3、connector 一个connector
php递归,静态变量,匿名函数使用 dcj3sjt126com PHP 递归函数匿名函数静态变量引用传参
<!doctype html> <html lang="en"> <head> <meta charset="utf-8"> <title>Current To-Do List</title> </head> <body>
属性颜色字体变化周华华 JavaScript
function changSize(className){ var diva=byId("fot") diva.className=className; } </script> <style type="text/css"> .max{ background: #900; color:#039;
将properties内容放置到map中 g21121 properties
代码比较简单： private static Map<Object, Object> map; private static Properties p; static { //读取properties文件 InputStream is = XXX.class.getClassLoader().getResourceAsStream("xxx.properti
[简单]拼接字符串 53873039oycg 字符串
工作中遇到需要从Map里面取值拼接字符串的情况，自己写了个，不是很好，欢迎提出更优雅的写法，代码如下： import java.util.HashMap; import java.uti
Struts2学习云端月影
最近开始关注struts2的新特性，从这个版本开始，Struts开始使用convention-plugin代替codebehind-plugin来实现struts的零配置。配置文件精简了，的确是简便了开发过程，但是，我们熟悉的配置突然disappear了，真是一下很不适应。跟着潮流走吧，看看该怎样来搞定convention-plugin。使用Convention插件，你需要将其JAR文件放
Java新手入门的30个基本概念二 aijuans java 新手 java 入门
基本概念:　　1.OOP中唯一关系的是对象的接口是什么,就像计算机的销售商她不管电源内部结构是怎样的,他只关系能否给你提供电就行了,也就是只要知道can or not而不是how and why.所有的程序是由一定的属性和行为对象组成的,不同的对象的访问通过函数调用来完成,对象间所有的交流都是通过方法调用,通过对封装对象数据,很大限度上提高复用率。　　2.OOP中最重要的思想是类,类是模板是蓝图,
jedis 简单使用 antlove java redis cache command jedis
jedis.RedisOperationCollection.java package jedis; import org.apache.log4j.Logger; import redis.clients.jedis.Jedis; import java.util.List; import java.util.Map; import java.util.Set; pub
PL/SQL的函数和包体的基础百合不是茶 PL/SQL编程函数包体显示包的具体数据包
由于明天举要上课,所以刚刚将代码敲了一遍PL/SQL的函数和包体的实现(单例模式过几天好好的总结下再发出来);以便明天能更好的学习PL/SQL的循环,今天太累了,所以早点睡觉,明天继续PL/SQL总有一天我会将你永远的记载在心里,,, 函数; 函数:PL/SQL中的函数相当于java中的方法;函数有返回值定义函数的 --输入姓名找到该姓名的年薪 create or re
Mockito(二)--实例篇 bijian1013 持续集成 mockito 单元测试
学习了基本知识后，就可以实战了，Mockito的实际使用还是比较麻烦的。因为在实际使用中，最常遇到的就是需要模拟第三方类库的行为。比如现在有一个类FTPFileTransfer，实现了向FTP传输文件的功能。这个类中使用了a
精通Oracle10编程SQL(7)编写控制结构 bijian1013 oracle 数据库 plsql
/* *编写控制结构 */ --条件分支语句 --简单条件判断 DECLARE v_sal NUMBER(6,2); BEGIN select sal into v_sal from emp where lower(ename)=lower('&name'); if v_sal<2000 then update emp set
【Log4j二】Log4j属性文件配置详解 bit1129 log4j
如下是一个log4j.properties的配置 log4j.rootCategory=INFO, stdout , R log4j.appender.stdout=org.apache.log4j.ConsoleAppender log4j.appender.stdout.layout=org.apache.log4j.PatternLayout log4j.appe
java集合排序笔记白糖_ java
public class CollectionDemo implements Serializable,Comparable<CollectionDemo>{ private static final long serialVersionUID = -2958090810811192128L; private int id; private String nam
java导致linux负载过高的定位方法 ronin47
定位java进程ID 可以使用top或ps -ef |grep java ![图片描述][1] 根据进程ID找到最消耗资源的java pid 比如第一步找到的进程ID为5431 执行 top -p 5431 -H ![图片描述][2] 打印java栈信息 $ jstack -l 5431 > 5431.log 在栈信息中定位具体问题将消耗资源的Java PID转
给定能随机生成整数1到5的函数，写出能随机生成整数1到7的函数 bylijinnan 函数
import java.util.ArrayList; import java.util.List; import java.util.Random; public class RandNFromRand5 { /** 题目：给定能随机生成整数1到5的函数，写出能随机生成整数1到7的函数。解法1： f(k) = (x0-1)*5^0+(x1-
PL/SQL Developer保存布局 Kai_Ge
近日由于项目需要，数据库从DB2迁移到ORCAL，因此数据库连接客户端选择了PL/SQL Developer。由于软件运用不熟悉，造成了很多麻烦，最主要的就是进入后，左边列表有很多选项，自己删除了一些选项卡，布局很满意了，下次进入后又恢复了以前的布局，很是苦恼。在众多PL/SQL Developer使用技巧中找到如下这段： &n
[未来战士计划]超能查派[剧透,慎入] comsci 计划
非常好看,超能查派,这部电影......为我们这些热爱人工智能的工程技术人员提供一些参考意见和思想........ 虽然电影里面的人物形象不是非常的可爱....但是非常的贴近现实生活.... &nbs
Google Map API V2 dai_lm google map
以后如果要开发包含google map的程序就更麻烦咯 http://www.cnblogs.com/mengdd/archive/2013/01/01/2841390.html 找到篇不错的文章，大家可以参考一下 http://blog.sina.com.cn/s/blog_c2839d410101jahv.html 1. 创建Android工程由于v2的key需要G
java数据计算层的几种解决方法2 datamachine java sql 集算器
2、SQL SQL/SP/JDBC在这里属于一类，这是老牌的数据计算层，性能和灵活性是它的优势。但随着新情况的不断出现，单纯用SQL已经难以满足需求，比如： JAVA开发规模的扩大，数据量的剧增，复杂计算问题的涌现。虽然SQL得高分的指标不多，但都是权重最高的。成熟度：5星。最成熟的。
Linux下Telnet的安装与运行 dcj3sjt126com linux telnet
Linux下Telnet的安装与运行 linux默认是使用SSH服务的而不安装telnet服务如果要使用telnet 就必须先安装相应的软件包即使安装了软件包默认的设置telnet 服务也是不运行的需要手工进行设置如果是redhat9，则在第三张光盘中找到 telnet-server-0.17-25.i386.rpm
PHP中钩子函数的实现与认识 dcj3sjt126com PHP
假如有这么一段程序： function fun(){ fun1(); fun2(); } 首先程序执行完fun1()之后执行fun2()然后fun()结束。但是，假如我们想对函数做一些变化。比如说，fun是一个解析函数，我们希望后期可以提供丰富的解析函数，而究竟用哪个函数解析，我们希望在配置文件中配置。这个时候就可以发挥钩子的力量了。我们可以在fu
EOS中的WorkSpace密码修改蕃薯耀修改WorkSpace密码
EOS中BPS的WorkSpace密码修改 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 201
SpringMVC4零配置--SpringSecurity相关配置【SpringSecurityConfig】 hanqunfeng SpringSecurity
SpringSecurity的配置相对来说有些复杂，如果是完整的bean配置，则需要配置大量的bean，所以xml配置时使用了命名空间来简化配置，同样，spring为我们提供了一个抽象类WebSecurityConfigurerAdapter和一个注解@EnableWebMvcSecurity，达到同样减少bean配置的目的，如下： applicationContex
ie 9 kendo ui中ajax跨域的问题 jackyrong AJAX跨域
这两天遇到个问题，kendo ui的datagrid，根据json去读取数据，然后前端通过kendo ui的datagrid去渲染，但很奇怪的是，在ie 10,ie 11,chrome,firefox等浏览器中，同样的程序，浏览起来是没问题的，但把应用放到公网上的一台服务器，却发现如下情况： 1） ie 9下，不能出现任何数据，但用IE 9浏览器浏览本机的应用，却没任何问题
不要让别人笑你不能成为程序员 lampcy 编程程序员
在经历六个月的编程集训之后，我刚刚完成了我的第一次一对一的编码评估。但是事情并没有如我所想的那般顺利。说实话，我感觉我的脑细胞像被轰炸过一样。手慢慢地离开键盘，心里很压抑。不禁默默祈祷：一切都会进展顺利的，对吧？至少有些地方我的回答应该是没有遗漏的，是不是？难道我选择编程真的是一个巨大的错误吗——我真的永远也成不了程序员吗？我需要一点点安慰。在自我怀疑，不安全感和脆弱等等像龙卷风一
马皇后的贤德 nannan408
马皇后不怕朱元璋的坏脾气，并敢理直气壮地吹耳边风。众所周知，朱元璋不喜欢女人干政，他认为“后妃虽母仪天下，然不可使干政事”，因为“宠之太过，则骄恣犯分，上下失序”，因此还特地命人纂述《女诫》，以示警诫。但马皇后是个例外。　　有一次，马皇后问朱元璋道：“如今天下老百姓安居乐业了吗？”朱元璋不高兴地回答：“这不是你应该问的。”马皇后振振有词地回敬道：“陛下是天下之父，
选择某个属性值最大的那条记录（不仅仅包含指定属性，而是想要什么属性都可以） Rainbow702 sql group by 最大值 max 最大的那条记录
好久好久不写SQL了，技能退化严重啊！！！直入主题：比如我有一张表，file_info，它有两个属性（但实际不只，我这里只是作说明用）： file_code, file_version 同一个code可能对应多个version 现在，我想针对每一个code，取得它相关的记录中，version 值最大的那条记录， SQL如下： select *
VBScript脚本语言 tntxia VBScript
VBScript 是基于VB的脚本语言。主要用于Asp和Excel的编程。 VB家族语言简介 Visual Basic 6.0 源于BASIC语言。由微软公司开发的包含协助开发环境的事
java中枚举类型的使用 xiao1zhao2 java enum 枚举 1.5新特性
枚举类型是j2se在1.5引入的新的类型,通过关键字enum来定义,常用来存储一些常量. 1.定义一个简单的枚举类型 public enum Sex { MAN, WOMAN } 枚举类型本质是类,编译此段代码会生成.class文件.通过Sex.MAN来访问Sex中的成员,其返回值是Sex类型. 2.常用方法静态的values()方

【Python基础知识】Python Requets库学习，需要的赶紧码起来！

快速开始

发送请求

URL传参

可以使用params字典参数为URL提供查询字符串参数，例如，访问 https://httpbin.org/get?key1=value1&key2=value2，可使用以下代码：

需要注意的是，如果字典参数中key值(即URL参数的值为None)，则该参数不会添加到URL的查询字符串中。

如果URL查询字符串中，存在重复参数(参数名称相同，参数值不同)，则需要将key值设置为由参数值组成的列表，如下：

响应内容

读取服务器响应内容

requests 将自动解码来自服务器的内容。大多数unicode字符集都是无缝解码的。

当你发出请求时，requests会根据HTTP头对响应的编码进行有依据的猜测。当你访问r.text时，将使用requests猜测的文本编码。可以使用r.encoding属性查找请求使用的编码，并对其进行更改：

requests还将在需要时使用自定义编码。如果你已经创建了自己的编码并将其注册到codecs模块，则可以简单地使用codec名称作为r.encoding的值，而requests将为你处理解码。

二进制响应内容

对于非文本请求，还可以以字节的形式访问响应体(当然，文本请求也可以)：

requests会自动解码gzip和deflate传输编码。

如果安装了类似 [brotli]或 [brotlicffi]的Brotil类库，Requets也会自动界面br传输编码

如果Brotli库（如[Brotli]）为您自动解码br传输编码或[brotliffi]已安装。

例如，可以使用以下代码，从请求返回的二进制数据创建图像：

JSON响应内容

可使用内置的JSON解码器，处理JSON数据：

原始响应内容

可以通过访问r.raw访问服务器返回的原始socket响应。如果希望这样做，确保在初始请求中设置 stream=True:

然而，通常情况下，应该使用类似这样的模式来保存正在流式传输的内容到文件中：

使用Response.iter_content将处理很多你在直接使用Resort.raw时需要处理的事情。当流式传输下载时，以上是检索内容的首选和推荐方法。请注意，chunk_size可以自由调整为更适合你使用场景的数字。

注意

关于使用 Response.iter_content与Response.raw的重要注意事项。 Response.iter_content将自动解码gzip和deflate传输编码。Response.raw是一个原始字节流–它不会转换响应内容。如果确实需要访问返回的字节，请使用Response.raw。

自定义请求头

如果您想向请求中添加HTTP头，只需向headers参数传递一个dict即可，例如：

注意：自定义请求头的优先级低于更具体的信息源。例如：

* 如果在.netrc中指定了凭据，则使用headers=设置的Authorization请求头将被覆盖，而凭据又将被auth=参数覆盖。请求将在~/.netrc、~/_netrc或NETRC环境变量指定的路径处中搜索netrc文件。

* 如果从主机重定向，将删除Authorization请求头。

* Proxy-Authorization请求头将被URL中提供的代理凭据覆盖。

* 当我们可以确定内容的长度时，将覆盖Content-Length请求头。

此外，请求根本不会根据指定的自定义请求头更改其行为。请求头仅是简单的传递到最终请求中。

注意：所有请求头值必须是字符串、字节字符串或unicode。虽然允许，但建议避免传递unicode请求头值。

更复杂的POST请求More complicated POST requests

通常，如果发送一些表单编码(form-encoded)的数据–就像一个HTML表单。为此，只需将字典传递给data参数即可。发送请求时，将自动对字典数据进行表单编码：

data参数中，为每个键可以具有多个值。这可以通过将data设置为元组列表或以列表为值的字典来实现。当表单中有多个元素使用相同的键时，这特别有用：

有时，你可能想发送未经表单编码的数据，则需要传入string类型的数据，而不是dict，string数据将被直接提交。

例如，GitHub API v3接受JSON编码的POST/PATCH数据：

注意，如果提供了data，或者file参数，json 参数将被自动忽略。

提交Multipart-Encoded文件

Request让上传Multipart编码文件变得简单：

可以显示的设置文件名称，内容类型，请求头:

如果想发送一些字符串，以文件的方式被接收：

如果你将一个非常大的文件作为multipart/form-data请求提交，你可能需要流式传输该请求。默认情况下，requests不支持此功能，但有一个单独的包支持此功能——requests toolbelt。

要在一个请求中发送多个文件，请参阅[高级]章节。

警告

强烈建议以[二进制模式]打开文件。这是因为requests可能会尝试为你提供Content-Length请求头，如果这样做，该请求头值将被设置为文件中的_字节数_。如果以_文本模式_打开文件，可能会发生错误。

响应状态码

以便于参考，requests还附带一个内置的状态代码查找对象：

如果请求出错4XX客户端错误或5XX服务器错误响应），我们可以使用[response.raise_for_status()]抛出错误:

但是，如果r.status_code 为200, raise_for_status() 将返回None

响应头

根据[RFC 7230] HTTP请求头大小写不敏感，所以，我们可以使用任何大写。因此，我们可以使用任意大小写来访问请求头：

Cookies

如果响应包含Cookie，可以快速访问它们：

可以使用cookies 参数将cookie发送给服务器:

Cookies are returned in a [RequestsCookieJar], which acts like a dict but also offers a more complete interface, suitable for use over multiple domains or paths. Cookie jars can also be passed in to requests:

返回的Cookie存储在[RequestsCookieJar]中，其作用类似于dict，同时提供了一个更完整的接口，适合在多个域或路径上使用。Cookie jar也可以传递给请求：

重定向与history

默认情况下，requests将对除HEAD之外的所有请求执行位置重定向(如果需要重定向的话)。

我们可以使用Response对象的history属性来跟踪重定向。

[Response.history]列表包含为完成请求而创建的[Response]对象。列表按响应的先后顺序排序。

例如，Gitee将所有HTTP请求重定向到HTTPS：

如果使用HEAD，GET， OPTIONS， POST， PUT， PATCH 或者DELETE，可以使用 allow_redirects参数禁止重定向：

请求超时

可以使用timeout参数告诉requests在给定的秒数后停止等待响应。几乎所有的生产代码都应该在几乎所有的请求中使用此参数。否则会导致程序无限期挂起：

注意：

timeout不是整个响应的下载时间限制；相反，如果服务器在timeout秒内没有发出响应（更准确地说，如果在timeout秒内底层socket没有接收到任何字节数据），则会引发异常。如果未明确指定timeout，则请求不会超时。

错误和异常

如果出现网络问题（例如DNS故障、拒绝连接等），requests将抛出[ConnectionError]异常。

如果HTTP请求返回了失败的状态代码，[Response.raise_for_statu()]将抛出[HTTPError]

如果请求超时，则会抛出[Timeout]异常。

如果请求超过了配置的最大重定向次数，则会抛出[TooManyRedirects]异常。

requests显式抛出的所有异常都继承自[requests.exceptions.RequestException]

高级用法

Session对象

Session对象允许你跨请求保持某些参数，以及Session实例发出的所有请求的cookie，并将使用urllib3的[连接池]([HTTP持久连接]

Session对象具有主要 requests API的所有方法。

可以使用`params`字典参数为URL提供查询字符串参数，例如，访问 `https://httpbin.org/get?key1=value1&key2=value2`，可使用以下代码：

需要注意的是，如果字典参数中key值(即URL参数的值为`None`)，则该参数不会添加到URL的查询字符串中。

当你发出请求时，requests会根据HTTP头对响应的编码进行有依据的猜测。当你访问`r.text`时，将使用requests猜测的文本编码。可以使用`r.encoding`属性查找请求使用的编码，并对其进行更改：

requests还将在需要时使用自定义编码。如果你已经创建了自己的编码并将其注册到`codecs`模块，则可以简单地使用codec名称作为`r.encoding`的值，而requests将为你处理解码。

requests会自动解码`gzip`和`deflate`传输编码。

如果安装了类似 [brotli]或 [brotlicffi]的Brotil类库，Requets也会自动界面`br`传输编码

如果Brotli库（如[Brotli]）为您自动解码`br`传输编码或[brotliffi]已安装。

可以通过访问`r.raw`访问服务器返回的原始socket响应。如果希望这样做，确保在初始请求中设置 `stream=True`:

使用`Response.iter_content`将处理很多你在直接使用`Resort.raw`时需要处理的事情。当流式传输下载时，以上是检索内容的首选和推荐方法。请注意，`chunk_size`可以自由调整为更适合你使用场景的数字。

关于使用 `Response.iter_content`与`Response.raw`的重要注意事项。 `Response.iter_content`将自动解码`gzip`和`deflate`传输编码。`Response.raw`是一个原始字节流–它不会转换响应内容。如果确实需要访问返回的字节，请使用`Response.raw`。

如果您想向请求中添加HTTP头，只需向`headers`参数传递一个`dict`即可，例如：

* 如果在`.netrc`中指定了凭据，则使用`headers=`设置的`Authorization`请求头将被覆盖，而凭据又将被`auth=`参数覆盖。请求将在`~/.netrc`、`~/_netrc`或`NETRC`环境变量指定的路径处中搜索netrc文件。

* 如果从主机重定向，将删除`Authorization`请求头。

* `Proxy-Authorization`请求头将被URL中提供的代理凭据覆盖。

* 当我们可以确定内容的长度时，将覆盖`Content-Length`请求头。

通常，如果发送一些表单编码(form-encoded)的数据–就像一个HTML表单。为此，只需将字典传递给`data`参数即可。发送请求时，将自动对字典数据进行表单编码：

`data`参数中，为每个键可以具有多个值。这可以通过将`data`设置为元组列表或以列表为值的字典来实现。当表单中有多个元素使用相同的键时，这特别有用：

有时，你可能想发送未经表单编码的数据，则需要传入`string`类型的数据，而不是`dict`，`string`数据将被直接提交。

注意，如果提供了`data`，或者`file`参数，`json` 参数将被自动忽略。

如果你将一个非常大的文件作为`multipart/form-data`请求提交，你可能需要流式传输该请求。默认情况下，`requests`不支持此功能，但有一个单独的包支持此功能——`requests toolbelt`。

强烈建议以[二进制模式]打开文件。这是因为requests可能会尝试为你提供`Content-Length`请求头，如果这样做，该请求头值将被设置为文件中的_字节数_。如果以_文本模式_打开文件，可能会发生错误。

以便于参考，`requests`还附带一个内置的状态代码查找对象：

如果请求出错4XX客户端错误或5XX服务器错误响应），我们可以使用[`response.raise_for_status()`]抛出错误:

但是，如果`r.status_code` 为`200`, `raise_for_status()` 将返回`None`

可以使用`cookies` 参数将cookie发送给服务器:

Cookies are returned in a [`RequestsCookieJar`], which acts like a `dict` but also offers a more complete interface, suitable for use over multiple domains or paths. Cookie jars can also be passed in to requests:

返回的Cookie存储在[`RequestsCookieJar`]中，其作用类似于`dict`，同时提供了一个更完整的接口，适合在多个域或路径上使用。Cookie jar也可以传递给请求：

默认情况下，`requests`将对除`HEAD`之外的所有请求执行位置重定向(如果需要重定向的话)。

我们可以使用Response对象的`history`属性来跟踪重定向。

[`Response.history`]列表包含为完成请求而创建的[`Response`]对象。列表按响应的先后顺序排序。

如果使用HEAD，GET， `OPTIONS`， `POST`， `PUT`， `PATCH` 或者`DELETE`，可以使用 `allow_redirects`参数禁止重定向：

可以使用`timeout`参数告诉requests在给定的秒数后停止等待响应。几乎所有的生产代码都应该在几乎所有的请求中使用此参数。否则会导致程序无限期挂起：

`timeout`不是整个响应的下载时间限制；相反，如果服务器在`timeout`秒内没有发出响应（更准确地说，如果在`timeout`秒内底层socket没有接收到任何字节数据），则会引发异常。如果未明确指定`timeout`，则请求不会超时。

如果出现网络问题（例如DNS故障、拒绝连接等），requests将抛出[`ConnectionError`]异常。

如果HTTP请求返回了失败的状态代码，[`Response.raise_for_statu()`]将抛出[`HTTPError`]

如果请求超时，则会抛出[`Timeout`]异常。

如果请求超过了配置的最大重定向次数，则会抛出[`TooManyRedirects`]异常。

requests显式抛出的所有异常都继承自[`requests.exceptions.RequestException`]

Session对象允许你跨请求保持某些参数，以及Session实例发出的所有请求的cookie，并将使用`urllib3`的[连接池]([HTTP持久连接]

[Cookie utility functions]to manipulate [`Session.cookies`]

如果想手动向Session添加Cookie，那么使用 [Cookie utility functions]来操作[`Session.cookies`]

这将确保在退出`with`块后立即关闭会话，即使发生未处理的异常。

每当收到来自某个API调用或者Session调用的[`Response`]对象，`request`属性实际上是所使用的`PreparedRequest`。在某些情况下，你可能希望在发送请求之前对请求体或请求头(或其他任何内容)做一些额外的工作。简单的做法如下：

由于你没有对`Request`对象执行任何特殊操作，因此您可以立即prepare它并修改`PreparedRequest`对象。然后将其与发送给`requests.`或`Session.`的其它参数一起发送。

你可以使用`verify`参数传递拥有受信任CA的证书的CA_BUNDLE文件的路径或者目录：

如果`verify`设置为目录的路径，则必须使用OpenSSL提供的`c_rehash`实用程序处理该目录。

还可以通过`REQUESTS_CA_BUNDLE`环境变量指定此受信任CA列表。如果未设置`REQUESTS_CA_BUNDLE`，将使用`CURL_CA_BUNDLE` 。

如果将`verify`设置为`False`，则requests也可以忽略SSL证书验证：

请注意，当`verify`设置为`False`时，Requests将接受服务器提供的任何TLS证书，并将忽略主机名不匹配，或过期的证书，这将使你的应用程序容易受到中间人(MitM)攻击。在本地开发或测试期间，将`verify`设置为`False`可能很有用。

默认情况下，`verify`设置为`True`。选项`verify`仅适用于主机证书。

在2.16版本之前，Requests捆绑了一组其信任的根CA证书，证书来源于[Mzillatruststore]。每个Request版本只更新一次证书。当未安装`certific`时，当使用较旧版本的requests时，这会导致证书包非常过时。

为了安全起见，我们建议经常升级`certific`！

默认情况下，当你发出一个请求时，将立即下载响应的正文。你可以使用`stream`参数覆盖此行为并延迟下载响应主体直到访问[`response.content`]属性

您可以使用 [`Response.iter_content()`] 和[`Response.iter_lines()`] 方法进一步控制工作流。或者，可以从位于[`Response.raw`]的底层的[`urllib3.HTTPResponse`]中读取未编码的主体.

多亏了`urllib3`，`keep-alive`在Session中是100%自动的！你在Session发出的任何请求都将自动重用合适的连接！

注意，只有在读取了所有响应体数据后，才会将连接释放回连接池以供重用；请确保将`stream`设置为`False`或读取`Response`对象的`content`属性。

强烈建议以[二进制模式]打开文件。这是因为requests可能会尝试为你提供`Content-Length`请求头，如果这样做，该请求头值将被设置为文件中的_字节数_。如果以_文本模式_打开文件，可能会发生错误。

为此，只需将`files`设置为`(form_field_name，file_info)`的元组列表：

通过将`{hook_name:callback_function}`字典传递给`hooks`请求参数，可以按每个请求分配一个钩子函数：

`callback_function`将接收一数据块(a chunk of data)作为其第一个参数。