hqw11

【转载】python requests 高级用法

转自：http://www.myvary.cn/index.php/2017/04/29/python-requests/

高级用法

本篇文档涵盖了 Requests 的一些高级特性。

会话对象

会话对象让你能够跨请求保持某些参数。它也会在同一个 Session 实例发出的所有请求之间保持 cookie，期间使用 urllib3 的 connection pooling 功能。所以如果你向同意主机发送多个请求，底层的 TCP 连接将会被重用，从而带来显著的性能提升。 (参见 HTTP persistent connection).

会话对象具有主要的 Requests API 的所有方法。

我们来跨请求保持一些 cookie:

 
                 1 
               
                 2 
               
                 3 
               
                 4 
               
                 5 
               
                 6 
               
                 7 
               
                 s 
                 = 
                 requests.Session() 
               
                 s.get('http://httpbin.org/cookies/ 
                set/sessioncookie/123456789') 
               
                 r 
                 = 
                 s.get("http://httpbin.org/cookies") 
               
                print(r.text) 
               
                # '{"cookies": {"sessioncookie": "123456789"}}'

会话也可用来为请求方法提供缺省数据。这是通过为会话对象的属性提供数据来实现的：

 
                 1 
               
                 2 
               
                 3 
               
                 4 
               
                 5 
               
                 6 
               
                 s 
                 = 
                 requests.Session() 
               
                 s.auth 
                 = 
                 (' 
                user', 
                 ' 
                pass') 
               
                 s.headers.update({'x- 
                test': 
                 ' 
                true'}) 
               
                # both 'x-test' and 'x-test2' are sent 
               
                 s.get('http://httpbin.org/headers', 
                 headers={'x-test2': 
                 ' 
                true'})

任何你传递给请求方法的字典都会与已设置会话层数据合并。方法层的参数覆盖会话的参数。

不过需要注意，就算使用了会话，方法级别的参数也不会被跨请求保持。下面的例子只会和第一个请求发送 cookie ，而非第二个：

 
                 1 
               
                 2 
               
                 3 
               
                 4 
               
                 5 
               
                 6 
               
                 7 
               
                 8 
               
                 9 
               
                 s 
                 = 
                 requests.Session() 
               
                 r 
                 = 
                 s.get('http://httpbin.org/cookies', 
                 cookies={' 
                from-my': 
                 'browser'}) 
               
                print(r.text) 
               
                # '{"cookies": {"from-my": "browser"}}' 
               
                 r 
                 = 
                 s.get('http://httpbin.org/cookies') 
               
                print(r.text) 
               
                # '{"cookies": {}}'

如果你要手动为会话添加 cookie，就是用 Cookie utility 函数来操纵 Session.cookies。

会话还可以用作前后文管理器：

 
                 1 
               
                 2 
               
                with 
                 requests.Session() 
                  
                as 
                 s: 
               
                    s.get('http://httpbin.org/cookies/ 
                set/sessioncookie/123456789')

这样就能确保 with 区块退出后会话能被关闭，即使发生了异常也一样。

从字典参数中移除一个值

有时你会想省略字典参数中一些会话层的键。要做到这一点，你只需简单地在方法层参数中将那个键的值设置为 None ，那个键就会被自动省略掉。

包含在一个会话中的所有数据你都可以直接使用。学习更多细节请阅读会话 API 文档。

请求与响应对象

任何时候调用 requests.*() 你都在做两件主要的事情。其一，你在构建一个 Request 对象，该对象将被发送到某个服务器请求或查询一些资源。其二，一旦 requests 得到一个从服务器返回的响应就会产生一个 Response 对象。该响应对象包含服务器返回的所有信息，也包含你原来创建的 Request 对象。如下是一个简单的请求，从 Wikipedia 的服务器得到一些非常重要的信息：

 
                 1 
               
                > 
                > 
                > 
                 r 
                 = 
                 requests.get('http://en.wikipedia.org/wiki/Monty_Python')

如果想访问服务器返回给我们的响应头部信息，可以这样做：

 
                 1 
               
                 2 
               
                 3 
               
                 4 
               
                 5 
               
                 6 
               
                 7 
               
                 8 
               
                 9 
               
                > 
                > 
                > 
                 r.headers 
               
                 {'content-length': 
                 '56170', 
                 'x-content- 
                type-options': 
                 'nosniff', 
                 'x-cache': 
               
                 'HIT 
                  
                from 
                 cp1006.eqiad.wmnet, 
                 MISS 
                  
                from 
                 cp1010.eqiad.wmnet', 
                 'content-encoding': 
               
                 ' 
                gzip', 
                 'age': 
                 '3080', 
                 'content-language': 
                 'en', 
                 'vary': 
                 'Accept-Encoding, 
                Cookie', 
               
                 'server': 
                 'Apache', 
                 'last-modified': 
                 'Wed, 
                 13 
                 Jun 
                 2012 
                 01:33:50 
                 GMT', 
               
                 'connection': 
                 'close', 
                 'cache-control': 
                 'private, 
                 s-maxage=0, 
                  
                max-age=0, 
               
                 must-revalidate', 
                 'date': 
                 'Thu, 
                 14 
                 Jun 
                 2012 
                 12:59:39 
                 GMT', 
                 'content- 
                type': 
               
                 'text/html; 
                 charset=UTF-8', 
                 'x-cache-lookup': 
                 'HIT 
                  
                from 
                 cp1006.eqiad.wmnet:3128, 
               
                 MISS 
                  
                from 
                 cp1010.eqiad.wmnet:80'}

然而，如果想得到发送到服务器的请求的头部，我们可以简单地访问该请求，然后是该请求的头部：

 
                 1 
               
                 2 
               
                 3 
               
                > 
                > 
                > 
                 r.request.headers 
               
                 {'Accept-Encoding': 
                 'identity, 
                 deflate, 
                 compress, 
                  
                gzip', 
               
                 'Accept': 
                 '*/*', 
                 ' 
                User-Agent': 
                 'python-requests/0.13.1'}

准备的请求（Prepared Request）

当你从 API 或者会话调用中收到一个 Response 对象时，request 属性其实是使用了PreparedRequest。有时在发送请求之前，你需要对 body 或者 header （或者别的什么东西）做一些额外处理，下面演示了一个简单的做法：

 
                 1 
               
                 2 
               
                 3 
               
                 4 
               
                 5 
               
                 6 
               
                 7 
               
                 8 
               
                 9 
               
                 10 
               
                 11 
               
                 12 
               
                 13 
               
                 14 
               
                 15 
               
                 16 
               
                 17 
               
                 18 
               
                 19 
               
                 20 
               
                 21 
               
                from 
                 requests 
                  
                import 
                 Request, 
                 Session 
               
                 s 
                 = 
                 Session() 
               
                 req 
                 = 
                 Request('GET', 
                 url, 
               
                    data=data, 
               
                    headers=header 
               
                 ) 
               
                 prepped 
                 = 
                 req.prepare() 
               
                # do something with prepped.body 
               
                # do something with prepped.headers 
               
                 resp 
                 = 
                 s.send(prepped, 
               
                    stream=stream, 
               
                    verify=verify, 
               
                    proxies=proxies, 
               
                    cert=cert, 
               
                    timeout=timeout 
               
                 ) 
               
                print(resp.status_code)

由于你没有对 Request 对象做什么特殊事情，你立即准备和修改了 PreparedRequest 对象，然后把它和别的参数一起发送到 requests.* 或者 Session.*。

然而，上述代码会失去 Requests Session 对象的一些优势，尤其 Session 级别的状态，例如 cookie 就不会被应用到你的请求上去。要获取一个带有状态的 PreparedRequest，请用Session.prepare_request() 取代 Request.prepare() 的调用，如下所示：

 
                 1 
               
                 2 
               
                 3 
               
                 4 
               
                 5 
               
                 6 
               
                 7 
               
                 8 
               
                 9 
               
                 10 
               
                 11 
               
                 12 
               
                 13 
               
                 14 
               
                 15 
               
                 16 
               
                 17 
               
                 18 
               
                 19 
               
                 20 
               
                 21 
               
                 22 
               
                from 
                 requests 
                  
                import 
                 Request, 
                 Session 
               
                 s 
                 = 
                 Session() 
               
                 req 
                 = 
                 Request('GET', 
                  url, 
               
                    data=data 
               
                    headers=headers 
               
                 ) 
               
                 prepped 
                 = 
                 s.prepare_request(req) 
               
                # do something with prepped.body 
               
                # do something with prepped.headers 
               
                 resp 
                 = 
                 s.send(prepped, 
               
                    stream=stream, 
               
                    verify=verify, 
               
                    proxies=proxies, 
               
                    cert=cert, 
               
                    timeout=timeout 
               
                 ) 
               
                print(resp.status_code)

SSL 证书验证

Requests 可以为 HTTPS 请求验证 SSL 证书，就像 web 浏览器一样。要想检查某个主机的 SSL 证书，你可以使用 verify 参数:

 
                 1 
               
                 2 
               
                > 
                > 
                > 
                 requests.get('https://kennethreitz.com', 
                 verify= 
                True) 
               
                 requests. 
                exceptions.SSLError: 
                 hostname 
                 'kennethreitz.com' 
                 doesn't 
                 match 
                 either 
                 of 
                 '*.herokuapp.com', 
                 'herokuapp.com'

在该域名上我没有设置 SSL，所以失败了。但 Github 设置了 SSL:

 
                 1 
               
                 2 
               
                > 
                > 
                > 
                 requests.get('https://github.com', 
                 verify= 
                True) 
               
                <Response 
                 [200] 
                >

对于私有证书，你也可以传递一个 CA_BUNDLE 文件的路径给 verify。你也可以设置REQUEST_CA_BUNDLE 环境变量。

如果你将 verify 设置为 False，Requests 也能忽略对 SSL 证书的验证。

 
                 1 
               
                 2 
               
                > 
                > 
                > 
                 requests.get('https://kennethreitz.com', 
                 verify= 
                False) 
               
                <Response 
                 [200] 
                >

默认情况下， verify 是设置为 True 的。选项 verify 仅应用于主机证书。

你也可以指定一个本地证书用作客户端证书，可以是单个文件（包含密钥和证书）或一个包含两个文件路径的元组:

 
                 1 
               
                 2 
               
                > 
                > 
                > 
                 requests.get('https://kennethreitz.com', 
                 cert=('/path/server.crt', 
                 '/path/key')) 
               
                <Response 
                 [200] 
                >

如果你指定了一个错误路径或一个无效的证书:

 
                 1 
               
                 2 
               
                > 
                > 
                > 
                 requests.get('https://kennethreitz.com', 
                 cert='/wrong_path/server.pem') 
               
                 SSLError: 
                 [ 
                Errno 
                 336265225] 
                 _ssl.c:347: 
                 error:140B0009: 
                SSL 
                 routines:SSL_CTX_use_PrivateKey_file:PEM 
                 lib

警告

本地证书的私有 key 必须是解密状态。目前，Requests 不支持使用加密的 key。

CA 证书

Requests 默认附带了一套它信任的根证书，来自于 Mozilla trust store。然而它们在每次 Requests 更新时才会更新。这意味着如果你固定使用某一版本的 Requests，你的证书有可能已经太旧了。

从 Requests 2.4.0 版之后，如果系统中装了 certifi 包，Requests 会试图使用它里边的证书。这样用户就可以在不修改代码的情况下更新他们的可信任证书。

为了安全起见，我们建议你经常更新 certifi！

响应体内容工作流

默认情况下，当你进行网络请求后，响应体会立即被下载。你可以通过 stream 参数覆盖这个行为，推迟下载响应体直到访问 Response.content 属性：

 
                 1 
               
                 2 
               
                 tarball_url 
                 = 
                 'https://github.com/kennethreitz/requests/tarball/master' 
               
                 r 
                 = 
                 requests.get(tarball_url, 
                 stream= 
                True)

此时仅有响应头被下载下来了，连接保持打开状态，因此允许我们根据条件获取内容：

 
                 1 
               
                 2 
               
                 3 
               
                 if 
                 int(r.headers['content-length']) 
                  
                < 
                 TOO_LONG: 
               
                  content 
                 = 
                 r.content 
               
                  ...

你可以进一步使用 Response.iter_content 和 Response.iter_lines 方法来控制工作流，或者以 Response.raw 从底层 urllib3 的 urllib3.HTTPResponse 读取。

如果你在请求中把 stream 设为 True，Requests 无法将连接释放回连接池，除非你消耗了所有的数据，或者调用了 Response.close。这样会带来连接效率低下的问题。如果你发现你在使用stream=True 的同时还在部分读取请求的 body（或者完全没有读取 body），那么你就应该考虑使用 contextlib.closing (文档)，如下所示：

 
                 1 
               
                 2 
               
                 3 
               
                 4 
               
                from 
                  
                contextlib 
                  
                import 
                 closing 
               
                with 
                 closing(requests.get('http://httpbin.org/get', 
                 stream= 
                True)) 
                  
                as 
                 r: 
               
                # 在此处理响应。

保持活动状态（持久连接）

好消息——归功于 urllib3，同一会话内的持久连接是完全自动处理的！同一会话内你发出的任何请求都会自动复用恰当的连接！

注意：只有所有的响应体数据被读取完毕连接才会被释放为连接池；所以确保将 stream 设置为False 或读取 Response 对象的 content 属性。

流式上传

Requests支持流式上传，这允许你发送大的数据流或文件而无需先把它们读入内存。要使用流式上传，仅需为你的请求体提供一个类文件对象即可：

 
                 1 
               
                 2 
               
                with 
                  
                open('massive-body') 
                  
                as 
                 f: 
               
                    requests.post('http://some.url/streamed', 
                 data=f)

警告

我们强烈建议你用二进制模式（binary mode）打开文件。这是因为 requests 可能会为你提供 header 中的 Content-Length，在这种情况下该值会被设为文件的字节数。如果你用文本模式打开文件，就可能碰到错误。

块编码请求

对于出去和进来的请求，Requests 也支持分块传输编码。要发送一个块编码的请求，仅需为你的请求体提供一个生成器（或任意没有具体长度的迭代器）：

 
                 1 
               
                 2 
               
                 3 
               
                 4 
               
                 5 
               
                def 
                 gen(): 
               
                yield 
                 'hi' 
               
                yield 
                 'there' 
               
                 requests.post('http://some.url/chunked', 
                 data=gen())

对于分块的编码请求，我们最好使用 Response.iter_content() 对其数据进行迭代。在理想情况下，你的 request 会设置 stream=True，这样你就可以通过调用 iter_content 并将分块大小参数设为 None，从而进行分块的迭代。如果你要设置分块的最大体积，你可以把分块大小参数设为任意整数。

POST 多个分块编码的文件

你可以在一个请求中发送多个文件。例如，假设你要上传多个图像文件到一个 HTML 表单，使用一个多文件 field 叫做 “images”:

 
                 1 
               
                < 
                input 
                  
                type=" 
                file" 
                 name="images" 
                 multiple=" 
                true" 
                 required=" 
                true"/ 
                >

要实现，只要把文件设到一个元组的列表中，其中元组结构为 (form_field_name, file_info):

 
                 1 
               
                 2 
               
                 3 
               
                 4 
               
                 5 
               
                 6 
               
                 7 
               
                 8 
               
                 9 
               
                 10 
               
                 11 
               
                 12 
               
                > 
                > 
                > 
                 url 
                 = 
                 'http://httpbin.org/post' 
               
                > 
                > 
                > 
                 multiple_files 
                 = 
                 [ 
               
                        ('images', 
                 ('foo.png', 
                  
                open('foo.png', 
                 'rb'), 
                 'image/png')), 
               
                        ('images', 
                 ('bar.png', 
                  
                open('bar.png', 
                 'rb'), 
                 'image/png'))] 
               
                > 
                > 
                > 
                 r 
                 = 
                 requests.post(url, 
                 files=multiple_files) 
               
                > 
                > 
                > 
                 r.text 
               
                 { 
               
                  ... 
               
                  'files': 
                 {'images': 
                 'data:image/png; 
                base64,iVBORw 
                 ....'} 
               
                  'Content- 
                Type': 
                 'multipart/form-data; 
                 boundary=3131623adb2043caaeb5538cc7aa0b3a', 
               
                  ... 
               
                 }

警告

事件挂钩

Requests有一个钩子系统，你可以用来操控部分请求过程，或信号事件处理。

可用的钩子:

response:

从一个请求产生的响应

你可以通过传递一个 {hook_name: callback_function} 字典给 hooks 请求参数为每个请求分配一个钩子函数：

 
                 1 
               
                 hooks= 
                dict(response=print_url)

callback_function 会接受一个数据块作为它的第一个参数。

 
                 1 
               
                 2 
               
                def 
                 print_url(r): 
               
                print(r.url)

若执行你的回调函数期间发生错误，系统会给出一个警告。

若回调函数返回一个值，默认以该值替换传进来的数据。若函数未返回任何东西，也没有什么其他的影响。

我们来在运行期间打印一些请求方法的参数：

 
                 1 
               
                 2 
               
                 3 
               
                > 
                > 
                > 
                 requests.get('http://httpbin.org', 
                 hooks= 
                dict(response=print_url)) 
               
                 http://httpbin.org 
               
                <Response 
                 [200] 
                >

自定义身份验证

Requests 允许你使用自己指定的身份验证机制。

任何传递给请求方法的 auth 参数的可调用对象，在请求发出之前都有机会修改请求。

自定义的身份验证机制是作为 requests.auth.AuthBase 的子类来实现的，也非常容易定义。Requests 在 requests.auth 中提供了两种常见的的身份验证方案： HTTPBasicAuth 和HTTPDigestAuth 。

假设我们有一个web服务，仅在 X-Pizza 头被设置为一个密码值的情况下才会有响应。虽然这不太可能，但就以它为例好了。

 
                 1 
               
                 2 
               
                 3 
               
                 4 
               
                 5 
               
                 6 
               
                 7 
               
                 8 
               
                 9 
               
                 10 
               
                 11 
               
                 12 
               
                from 
                 requests.auth 
                  
                import 
                 AuthBase 
               
                class 
                 PizzaAuth(AuthBase): 
               
                    """Attaches 
                 HTTP 
                 Pizza 
                 Authentication 
                 to 
                 the 
                 given 
                 Request 
                  
                object.""" 
               
                def 
                 __init__( 
                self, 
                 username): 
               
                # setup any auth-related data here 
               
                self.username 
                 = 
                 username 
               
                def 
                 __call__( 
                self, 
                 r): 
               
                # modify and return the request 
               
                        r.headers['X-Pizza'] 
                 = 
                  
                self.username 
               
                return 
                 r

然后就可以使用我们的PizzaAuth来进行网络请求:

 
                 1 
               
                 2 
               
                > 
                > 
                > 
                 requests.get('http://pizzabin.org/admin', 
                 auth=PizzaAuth('kenneth')) 
               
                <Response 
                 [200] 
                >

流式请求

使用 requests.Response.iter_lines() 你可以很方便地对流式 API （例如 Twitter 的流式 API）进行迭代。简单地设置 stream 为 True 便可以使用 iter_lines() 对相应进行迭代：

 
                 1 
               
                 2 
               
                 3 
               
                 4 
               
                 5 
               
                 6 
               
                 7 
               
                 8 
               
                 9 
               
                 10 
               
                import 
                  
                json 
               
                import 
                 requests 
               
                 r 
                 = 
                 requests.get('http://httpbin.org/stream/20', 
                 stream= 
                True) 
               
                for 
                 line 
                  
                in 
                 r.iter_lines(): 
               
                # filter out keep-alive new lines 
               
                if 
                 line: 
               
                print( 
                json.loads(line))

警告

iter_lines() 不保证重进入时的安全性。多次调用该方法会导致部分收到的数据丢失。如果你要在多处调用它，就应该使用生成的迭代器对象:

 
                  1 
                
                  2 
                
                  3 
                
                  4 
                
                  5 
                
                  6 
                
                  7 
                
                  lines 
                  = 
                  r.iter_lines() 
                
                 # Save the first line for later or just skip it 
                
                  first_line 
                  = 
                   
                 next(lines) 
                
                 for 
                  line 
                   
                 in 
                  lines: 
                
                 print(line)

代理

如果需要使用代理，你可以通过为任意请求方法提供 proxies 参数来配置单个请求:

 
                 1 
               
                 2 
               
                 3 
               
                 4 
               
                 5 
               
                 6 
               
                 7 
               
                 8 
               
                import 
                 requests 
               
                 proxies 
                 = 
                 { 
               
                  "http": 
                 "http://10.10.1.10:3128", 
               
                  "https": 
                 "http://10.10.1.10:1080", 
               
                 } 
               
                 requests.get("http://example.org", 
                 proxies=proxies)

你也可以通过环境变量 HTTP_PROXY 和 HTTPS_PROXY 来配置代理。

 
                 1 
               
                 2 
               
                 3 
               
                 4 
               
                 5 
               
                 6 
               
                 $ 
                 export 
                 HTTP_PROXY="http://10.10.1.10:3128" 
               
                 $ 
                 export 
                 HTTPS_PROXY="http://10.10.1.10:1080" 
               
                 $ 
                 python 
               
                > 
                > 
                > 
                  
                import 
                 requests 
               
                > 
                > 
                > 
                 requests.get("http://example.org")

若你的代理需要使用HTTP Basic Auth，可以使用 http://user:password@host/ 语法：

proxies = {

"http": "http://user:[email protected]:3128/",

}

要为某个特定的连接方式或者主机设置代理，使用 scheme://hostname 作为 key，它会针对指定的主机和连接方式进行匹配。

 
                 1 
               
                 proxies 
                 = 
                 {'http://10.20.1.128': 
                 'http://10.10.1.10:5323'}

注意，代理 URL 必须包含连接方式。

SOCKS

2.10.0 新版功能.

除了基本的 HTTP 代理，Request 还支持 SOCKS 协议的代理。这是一个可选功能，若要使用，你需要安装第三方库。

你可以用 pip 获取依赖:

 
                  1 
                
                  $ 
                  pip 
                  install 
                  requests[socks]

安装好依赖以后，使用 SOCKS 代理和使用 HTTP 代理一样简单：

 
                  1 
                
                  2 
                
                  3 
                
                  4 
                
                  proxies 
                  = 
                  { 
                
                     'http': 
                  'socks5://user:pass@host:port', 
                
                     'https': 
                  'socks5://user:pass@host:port' 
                
                  }

合规性

Requests 符合所有相关的规范和 RFC，这样不会为用户造成不必要的困难。但这种对规范的考虑导致一些行为对于不熟悉相关规范的人来说看似有点奇怪。

编码方式

当你收到一个响应时，Requests 会猜测响应的编码方式，用于在你调用 Response.text 方法时对响应进行解码。Requests 首先在 HTTP 头部检测是否存在指定的编码方式，如果不存在，则会使用 charade 来尝试猜测编码方式。

只有当 HTTP 头部不存在明确指定的字符集，并且 Content-Type 头部字段包含 text 值之时， Requests 才不去猜测编码方式。在这种情况下， RFC 2616 指定默认字符集必须是 ISO-8859-1。Requests 遵从这一规范。如果你需要一种不同的编码方式，你可以手动设置Response.encoding 属性，或使用原始的 Response.content。

HTTP动词

Requests 提供了几乎所有HTTP动词的功能：GET、OPTIONS、HEAD、POST、PUT、PATCH、DELETE。以下内容为使用 Requests 中的这些动词以及 Github API 提供了详细示例。

我将从最常使用的动词 GET 开始。HTTP GET 是一个幂等方法，从给定的 URL 返回一个资源。因而，当你试图从一个 web 位置获取数据之时，你应该使用这个动词。一个使用示例是尝试从 Github 上获取关于一个特定 commit 的信息。假设我们想获取Requests的commit a050faf 的信息。我们可以这样去做：

 
                 1 
               
                 2 
               
                > 
                > 
                > 
                 import 
                 requests 
               
                > 
                > 
                > 
                 r 
                 = 
                 requests.get('https://api.github.com/repos/kennethreitz/requests/git/commits/a050faf084662f3a352dd1a941f2c7c9f886d4ad')

我们应该确认 GitHub 是否正确响应。如果正确响应，我们想弄清响应内容是什么类型的。像这样去做：

 
                 1 
               
                 2 
               
                 3 
               
                 4 
               
                > 
                > 
                > 
                 if 
                 (r.status_code 
                 == 
                 requests.codes.ok): 
               
                 ... 
                     print 
                 r.headers['content-type'] 
               
                 ... 
               
                 application/json; 
                 charset=utf-8

可见，GitHub 返回了 JSON 数据，非常好，这样就可以使用 r.json 方法把这个返回的数据解析成 Python 对象。

> > > commit_data = r.json()

> > > print commit_data.keys()

[u'committer', u'author', u'url', u'tree', u'sha', u'parents', u'message']

> > > print commit_data[u'committer']

{u'date': u'2012-05-10T11:10:50-07:00', u'email': u'[email protected]', u'name': u'Kenneth Reitz'}

> > > print commit_data[u'message']

makin' history

到目前为止，一切都非常简单。嗯，我们来研究一下 GitHub 的 API。我们可以去看看文档，但如果使用 Requests 来研究也许会更有意思一点。我们可以借助 Requests 的 OPTIONS 动词来看看我们刚使用过的 url 支持哪些 HTTP 方法。

 
                 1 
               
                 2 
               
                 3 
               
                > 
                > 
                > 
                 verbs 
                 = 
                 requests.options(r.url) 
               
                > 
                > 
                > 
                 verbs.status_code 
               
                 500

额，这是怎么回事？毫无帮助嘛！原来 GitHub，与许多 API 提供方一样，实际上并未实现 OPTIONS 方法。这是一个恼人的疏忽，但没关系，那我们可以使用枯燥的文档。然而，如果 GitHub 正确实现了 OPTIONS，那么服务器应该在响应头中返回允许用户使用的 HTTP 方法，例如：

 
                 1 
               
                 2 
               
                 3 
               
                > 
                > 
                > 
                 verbs 
                 = 
                 requests.options('http://a-good-website.com/api/cats') 
               
                > 
                > 
                > 
                 print 
                 verbs.headers['allow'] 
               
                 GET,HEAD,POST,OPTIONS

转而去查看文档，我们看到对于提交信息，另一个允许的方法是 POST，它会创建一个新的提交。由于我们正在使用 Requests 代码库，我们应尽可能避免对它发送笨拙的 POST。作为替代，我们来玩玩 GitHub 的 Issue 特性。

本篇文档是回应 Issue #482 而添加的。鉴于该问题已经存在，我们就以它为例。先获取它。

 
                 1 
               
                 2 
               
                 3 
               
                 4 
               
                 5 
               
                 6 
               
                 7 
               
                 8 
               
                 9 
               
                 10 
               
                 11 
               
                > 
                > 
                > 
                 r 
                 = 
                 requests.get('https://api.github.com/repos/kennethreitz/requests/issues/482') 
               
                > 
                > 
                > 
                 r.status_code 
               
                 200 
               
                > 
                > 
                > 
                 issue 
                 = 
                 json.loads(r.text) 
               
                > 
                > 
                > 
                 print(issue[u'title']) 
               
                 Feature 
                 any 
                 http 
                 verb 
                 in 
                 docs 
               
                > 
                > 
                > 
                 print(issue[u'comments']) 
               
                 3

Cool，有 3 个评论。我们来看一下最后一个评论。

 
                 1 
               
                 2 
               
                 3 
               
                 4 
               
                 5 
               
                 6 
               
                 7 
               
                 8 
               
                > 
                > 
                > 
                 r 
                 = 
                 requests.get(r.url 
                 + 
                 u'/comments') 
               
                > 
                > 
                > 
                 r.status_code 
               
                 200 
               
                > 
                > 
                > 
                 comments 
                 = 
                 r.json() 
               
                > 
                > 
                > 
                 print 
                 comments[0].keys() 
               
                 [u'body', 
                 u'url', 
                 u'created_at', 
                 u'updated_at', 
                 u'user', 
                 u'id'] 
               
                > 
                > 
                > 
                 print 
                 comments[2][u'body'] 
               
                 Probably 
                 in 
                 the 
                 "advanced" 
                 section

嗯，那看起来似乎是个愚蠢之处。我们发表个评论来告诉这个评论者他自己的愚蠢。那么，这个评论者是谁呢？

 
                 1 
               
                 2 
               
                > 
                > 
                > 
                 print 
                 comments[2][u'user'][u'login'] 
               
                 kennethreitz

好，我们来告诉这个叫 Kenneth 的家伙，这个例子应该放在快速上手指南中。根据 GitHub API 文档，其方法是 POST 到该话题。我们来试试看。

你可能感兴趣的:(机器学习)

LangChain中的向量数据库接口－Weaviate 洪城叮当 langchain 数据库经验分享笔记交互人工智能知识图谱
文章目录前言一、原型定义二、代码解析1、add_texts方法1.1、应用样例2、from_texts方法2.1、应用样例3、similarity_search方法3.1、应用样例三、项目应用1、安装依赖2、引入依赖3、创建对象4、添加数据5、查询数据总结前言 Weaviate是一个开源的向量数据库，支持存储来自各类机器学习模型的数据对象和向量嵌入，并能无缝扩展至数十亿数据对象。它提供存储文档嵌
Python的科学计算库NumPy（一） linlin_1998 python numpy 开发语言
NumPy(NumericalPython)是Python中最基础、最重要的科学计算库之一，提供了高性能的多维数组（ndarray）对象和大量数学函数，是许多数据科学、机器学习库（如Pandas、SciPy、TensorFlow等）的基础依赖。1.创建一个numpy里面的一维数组importnumpyasnp###通过array方法创建一个ndarrayarray1=np.array([1,2,3
微算法科技的前沿探索：量子机器学习算法在视觉任务中的革新应用 MicroTech2025 量子计算算法
在信息技术飞速发展的今天，计算机视觉作为人工智能领域的重要分支，正逐步渗透到我们生活的方方面面。从自动驾驶到人脸识别，从医疗影像分析到安防监控，计算机视觉技术展现了巨大的应用潜力。然而，随着视觉任务复杂度的不断提升，传统机器学习算法在处理大规模、高维度数据时遇到了计算瓶颈。在此背景下，量子计算作为一种颠覆性的计算模式，以其独特的并行处理能力和指数级增长的计算空间，为解决这一难题提供了新的思路。微算
在mac m1基于llama.cpp运行deepseek
lama.cpp是一个高效的机器学习推理库，目标是在各种硬件上实现LLM推断，保持最小设置和最先进性能。llama.cpp支持1.5位、2位、3位、4位、5位、6位和8位整数量化，通过ARMNEON、Accelerate和Metal支持Apple芯片，使得在MACM1处理器上运行Deepseek大模型成为可能。1下载llama.cppgitclonehttps://github.com/ggerg
【机器学习笔记Ⅰ】9 特征缩放巴伦是只猫机器学习机器学习笔记人工智能
特征缩放（FeatureScaling）详解特征缩放是机器学习数据预处理的关键步骤，旨在将不同特征的数值范围统一到相近的尺度，从而加速模型训练、提升性能并避免某些特征主导模型。1.为什么需要特征缩放？(1)问题背景量纲不一致：例如：特征1：年龄（范围0-100）特征2：收入（范围0-1,000,000）梯度下降的困境：量纲大的特征（如收入）会导致梯度更新方向偏离最优路径，收敛缓慢。量纲小的特征（如
深度学习实战-使用TensorFlow与Keras构建智能模型程序员Gloria Python超入门 TensorFlow python
深度学习实战-使用TensorFlow与Keras构建智能模型深度学习已经成为现代人工智能的重要组成部分，而Python则是实现深度学习的主要编程语言之一。本文将探讨如何使用TensorFlow和Keras构建深度学习模型，包括必要的代码实例和详细的解析。1.深度学习简介深度学习是机器学习的一个分支，使用多层神经网络来学习和表示数据中的复杂模式。其广泛应用于图像识别、自然语言处理、推荐系统等领域。
【大模型与机器学习解惑】什么是A/B测试，为何进行A/B测试？
以下内容将围绕机器学习中的A/B测试展开，从概念与背景到实施细节、示例代码、优化思路和未来建议，并在最后给出一个整体的“输出目录”供参考。目录什么是机器学习的A/B测试为何要进行A/B测试A/B测试的实施流程示例代码与详细解释优化方向与未来建议结语1.什么是机器学习的A/B测试A/B测试（也常被称作对照试验、SplitTest）最早多用于互联网产品的功能或界面迭代中，指的是将用户或样本随机分为两组
详解LLMOps，将DevOps用于大语言模型开发
大家好，在机器学习领域，随着技术的不断发展，将大型语言模型（LLMs）集成到商业产品中已成为一种趋势，同时也带来了许多挑战。为了有效应对这些挑战，数据科学家们转向了一种新型的DevOps实践LLM-OPS，专为大型语言模型的开发和维护而设计。本文将介绍LLM-OPS的核心思想，并分析这一策略如何帮助数据科学家更高效地运用DevOps的优秀实践，从而在语言模型的开发和部署过程中，提升工作效率和成果的
搜广推校招面经九十一
美团机器学习/数据挖掘算法工程师_二面一、介绍一下ESMM模型，是否有进行过函数推导传统的转化率建模方式：只用发生点击（click=1）的样本来训练CVR模型。CVR定义如下：CVR=P(y=1∣x,z=1)CVR=P(y=1|x,z=1)CVR=P(y=1∣x,z=1)y=1表示用户发生了转化（如购买）z=1表示用户点击了广告这样做的问题：样本选择偏差（SampleSelectionBias,S
python 计算生态概览的概述
文章目录前言python计算生态库的介绍1.网络爬虫2.数据分析3.文本处理4.数据可视化5.机器学习6.图形用户界面7.游戏开发8.网络应用开发前言python计算生态概览的解释Python计算生态概览是对Python作为一门强大而广泛使用的编程语言所拥有的庞大软件集合的整体描述和概述。这个生态体系不仅包含了Python的标准库（stdlib），即随Python解释器安装的基本模块，还涵盖了极其
Google机器学习实践指南(模型预测偏差) AI_Auto 人工智能机器学习人工智能
Google机器学习（31）-模型预测偏差预测偏差：模型为何总是"猜不准"的真相揭秘你的模型预测准确率高达95%，却总是与实际情况差那么一点点？这可能是预测偏差在作祟！本文将带你深入探索这个被忽视的模型"隐形杀手"。一、什么是预测偏差？一个生活化案例想象一下，你网购了一个智能体重秤，连续一周称重显示都是60kg。但你去健身房用专业设备测量，实际是62kg。这种系统性的测量偏差，就是预测偏差在现实中
【机器学习|学习笔记】用 Python 结合 graphviz 生成 ID3、C4.5、CART 三种决策树的结构示意图。
【机器学习|学习笔记】用Python结合graphviz生成ID3、C4.5、CART三种决策树的结构示意图【机器学习|学习笔记】用Python结合graphviz生成ID3、C4.5、CART三种决策树的结构示意图文章目录【机器学习|学习笔记】用Python结合graphviz生成ID3、C4.5、CART三种决策树的结构示意图用Python结合graphviz生成ID3、C4.5、CART三种
智能产品经理的核心能力 AI天才研究院 Agentic AI 实战 AI人工智能与大数据 AI大模型企业级应用开发实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
智能产品经理的核心能力1.背景介绍在当今快节奏的数字时代,产品经理扮演着至关重要的角色,他们负责确保产品满足用户需求,实现商业目标,并保持竞争优势。随着人工智能(AI)和机器学习(ML)技术的不断发展,智能产品经理的概念应运而生。智能产品经理需要将传统的产品管理技能与新兴技术相结合,以创建具有创新性和智能化的产品体验。智能产品不仅需要满足功能需求,还需要提供个性化、智能化和无缝的用户体验。这对产品
使用Python进行机器学习入门指南软考和人工智能学堂 Python开发经验 python 机器学习开发语言
使用Python进行机器学习入门指南机器学习（MachineLearning）是人工智能（ArtificialIntelligence,AI）的一个重要分支，旨在通过算法和统计模型，使计算机系统能够自动从数据中学习和改进。Python作为机器学习领域的主流编程语言，提供了丰富的库和工具来实现各种机器学习任务。本文将介绍如何使用Python进行机器学习，包括基本概念、常用库以及一个实战项目示例。目录
【亲测免费】 CatBoost 教程项目使用指南
CatBoost教程项目使用指南tutorials项目地址:https://gitcode.com/gh_mirrors/tutorials1/tutorials1.项目介绍CatBoost是一个高效、灵活且易于使用的梯度提升库，特别适用于处理分类特征。它由Yandex开发，广泛应用于机器学习和数据科学领域。CatBoost提供了丰富的功能，包括自动处理分类特征、支持GPU训练、内置的交叉验证和模
Python自动化机器学习平台库之mindsdb使用详解
概要MindsDB是一个开源的自动化机器学习平台，它通过SQL接口简化了机器学习模型的创建、训练和预测过程。该库的核心理念是将机器学习功能直接集成到数据库中，让开发者无需深入了解复杂的机器学习算法，就能够快速构建和部署预测模型。MindsDB支持多种数据源连接，包括MySQL、PostgreSQL、MongoDB等主流数据库，同时提供了丰富的PythonAPI接口，使得数据科学家和开发者能够在熟悉
堡垒机操作行为异常检测的机器学习算法应用
一、传统检测模式的困境与机器学习的破局价值在数字化转型浪潮中，堡垒机作为运维安全的核心防线，面临着操作行为复杂度激增与检测能力滞后的双重挑战。传统检测手段主要依赖静态规则库与统计模型，存在三大致命缺陷：规则固化与误报泛滥：某金融机构曾因规则库未及时更新，导致运维人员正常批量操作被误判为“暴力破解”，单日误报量超2000次，消耗安全团队60%的精力。动态行为适应性弱：微服务架构下，运维人员访问路径呈
最全自动驾驶数据集（11/4号已更新）数据猎手小k 自动驾驶人工智能机器学习
自动驾驶是一个快速发展的行业，它融合了人工智能、机器学习、传感器技术、高精度地图和先进的计算平台等多种技术。技术方面，自动驾驶汽车依赖于先进的传感器、如激光雷达、摄像头、毫米波雷达等，以及强大的计算平台来处理大量数据，自动驾驶数据集是训练和验证自动驾驶系统的关键资源，它提供了丰富的场景和条件，使算法能够学习和适应复杂的真实世界驾驶环境。一、研究背景自动驾驶技术的发展需要大量的数据来训练和优化算法，
机器学习深度学习驱动在光子学设计中的应用与未来【专题培训会议邀您共探科技前沿】软研科技信息与通信信号处理量子计算人工智能
一、背景介绍在智能科技飞速发展的今天，光子学设计与智能算法的结合正成为科研创新的热点。深度学习、机器学习等算法在光子器件的逆向设计、超构表面材料设计、光学神经网络构建等方面展现出巨大潜力。二、会议亮点由北京软研国际信息技术研究院主办的“智能算法驱动的光子学设计与应用”专题培训会议，将深入探讨以下核心内容：光子器件的逆向设计：利用深度学习优化多参数光子器件设计。超构表面与超材料设计：智能算法在新型光
机器学习与光子学的融合正重塑光学器件设计范式 m0_75133639 光电智能电视二维材料电子半导体人工智能顶刊 nature
Nature/Science最新研究表明，该交叉领域聚焦六大前沿方向：光子器件逆向设计、超构材料智能优化、光子神经网络加速器、非线性光学芯片开发、多任务协同优化及光谱智能预测。系统掌握该领域需构建四维知识体系：1、基础融合——从空间/集成光学系统切入，解析机器学习赋能光学的理论必然性，涵盖光学神经网络构建原理2、逆向设计革命——通过AnsysOptics实战，掌握FDTD算法与粒子群/拓扑优化技术
AI模型训练新范式：基于同态加密的隐私保护方案 AIGC应用创新大全人工智能同态加密区块链 ai
AI模型训练新范式：基于同态加密的隐私保护方案技术解析关键词同态加密（HomomorphicEncryption）、隐私保护机器学习（PPML）、全同态加密（FHE）、安全多方计算（MPC）、加密数据训练摘要本报告系统解析基于同态加密的AI模型训练新范式，覆盖从理论基础到工程实践的全生命周期。首先通过第一性原理推导同态加密的数学本质，对比传统隐私保护技术的局限性；其次构建“加密-训练-解密”全流程
量子机器学习入门：从理论到实践
量子机器学习入门：从理论基石到实践路径元数据框架标题量子机器学习入门：从理论基石到实践路径——连接量子计算与人工智能的未来桥梁关键词量子计算；机器学习；量子算法；量子神经网络；Qiskit；PennyLane；量子变分算法摘要量子机器学习（QuantumMachineLearning,QML）是量子计算与机器学习的交叉领域，通过量子计算的叠加态、纠缠和并行性解决传统机器学习的计算瓶颈（如高维数据处
全球人工智能与机器学习大会PPT a flying bird 论文解读和大咖技术号记录人工智能
大会演讲PPT合集https://ppt.infoq.cn/list/93PPT分享|ppt|人工智能|aicon|infoq|机器学习PPT分享,前段时间的AICon北京站2021全球人工智能与机器学习大会（https://aicon.infoq.cn/2021/beijing），汇集了很多业界大佬，工业界多个方向的从业人员分享了他们在实际业……https://xw.qq.com/cmsid/2
人工智能基础知识PPT课件智慧化智能化数字化方案方案解读馆人工智能入门人工智能学习人工智能课件人工智能PPT
人工智能基础知识定义与概念：人工智能是研究、开发用于模拟、延伸和扩展人类智能行为的综合性科学，其目的是让计算机系统具备执行人类智能任务的能力。涉及计算机科学、数学等多学科，研究对象是让系统具备智能，智能包括认知、适应和自主能力等维度。学派与方法学派：有符号主义、联结主义、行为主义等学派，分别从不同角度研究人工智能。方法：包括基于知识、学习和仿生的方法，如专家系统、机器学习、深度学习等。分类与发展分
数据挖掘：从理论到实践的深度探索代码老y 数据挖掘人工智能
在当今数字化时代，数据已经成为企业决策的重要依据。数据挖掘作为一门从大量数据中提取有价值信息的技术，已经广泛应用于各个领域，如金融、医疗、零售、互联网等。本文将深入探讨数据挖掘的基本概念、主要技术和实际应用案例，帮助读者更好地理解数据挖掘的价值和应用。一、数据挖掘的基本概念（一）数据挖掘的定义数据挖掘（DataMining）是从大量数据中提取有用信息的过程。它结合了统计学、机器学习、数据库技术和人
开发智能化的企业并购风险评估模型
开发智能化的企业并购风险评估模型关键词：企业并购、风险评估、人工智能、机器学习、深度学习、数学建模摘要：本文详细探讨了开发智能化企业并购风险评估模型的背景、核心概念、算法原理、系统架构设计以及项目实战。通过结合机器学习和深度学习技术，提出了一种基于数据驱动的智能化风险评估方法，旨在帮助企业更准确地识别和预测并购过程中的潜在风险，提升决策的科学性和有效性。第1章:企业并购风险评估模型的背景与问题描述
机器学习手写字体识别系统：技术演进与应用实践万能小贤哥机器学习人工智能
引言：手写字体识别的技术定位与价值在信息处理领域，人工录入手写文本的低效性与机器识别的高效性形成鲜明对比。例如，医疗处方的人工处理需约5分钟/张，而采用手写字体识别技术可将时间缩短至10秒/张，显著提升处理效率。作为计算机视觉与人工智能的重要分支，手写字体识别技术通过将手写文本转换为可编辑电子文本，不仅大幅减少人工输入时间和错误，降低人工处理成本，还能在大量数据处理时保持高于人工录入的准确性，是人
机器学习算法：核心原理与前沿发展综述 fmvrj34202 机器学习算法人工智能
机器学习算法作为人工智能的核心驱动力，正在重塑我们解决问题的范式。本文将系统性地探讨机器学习算法的分类体系、数学基础、优化方法以及最新发展趋势，为从业者提供技术参考。一、算法分类体系根据学习范式，机器学习算法可分为三大类：监督学习：基于标注数据的建模方法线性回归：最小化平方误差的闭式解θ=(XᵀX)⁻¹Xᵀy支持向量机：通过核技巧实现非线性分类，优化目标为max(0,1-yᵢ(w·xᵢ+b))决策
「日拱一码」020 机器学习——数据处理胖达不服输「日拱一码」机器学习人工智能数据处理 python
目录数据清洗缺失值处理删除缺失值：填充缺失值：重复值处理检测重复值处理重复值异常值处理Z-score方法IQR方法（四分位距）数据一致性检查数据转换规范化（归一化）Min-Max归一化MaxAbsScaler标准化离散化等宽离散化等频离散化数据清洗数据清洗是数据处理的第一步，目的是去除噪声数据、处理缺失值和异常值，使数据更加干净、可用缺失值处理删除缺失值：如果数据集中缺失值较少，可以直接删除包含缺
机器学习每周挑战——二手车车辆信息&交易售价数据梦想成为一名机器学习高手机器学习 python 人工智能
这是数据集的截图目录背景描述数据说明车型对照：燃料类型对照：老规矩，第一步先导入用到的库第二步，读入数据：第三步，数据预处理第四步：对数据的分析第五步：模型建立前的准备工作第六步：多元线性回归模型的建立第七步：随机森林模型的建立问题：背景描述本数据爬取自印度最大的二手车交易平台CARS24，包含8000+该平台上交易车辆的关键评估信息。CARS24成立于2015年，总部位于印度古尔冈，是一个在印度
[星球大战]阿纳金的背叛 comsci
本来杰迪圣殿的长老是不同意让阿纳金接受训练的......... 但是由于政治原因,长老会妥协了...这给邪恶的力量带来了机会所以......现代的地球联邦接受了这个教训...绝对不让某些年轻人进入学院
看懂它，你就可以任性的玩耍了！ aijuans JavaScript
javascript作为前端开发的标配技能，如果不掌握好它的三大特点：1.原型 2.作用域 3. 闭包 ,又怎么可以说你学好了这门语言呢？如果标配的技能都没有撑握好，怎么可以任性的玩耍呢？怎么验证自己学好了以上三个基本点呢，我找到一段不错的代码，稍加改动，如果能够读懂它，那么你就可以任性了。 function jClass(b
Java常用工具包 Jodd Kai_Ge java jodd
Jodd 是一个开源的 Java 工具集，包含一些实用的工具类和小型框架。简单，却很强大！写道 Jodd = Tools + IoC + MVC + DB + AOP + TX + JSON + HTML < 1.5 Mb Jodd 被分成众多模块，按需选择，其中工具类模块有： jodd-core &nb
SpringMvc下载 120153216 springMVC
@RequestMapping(value = WebUrlConstant.DOWNLOAD) public void download(HttpServletRequest request,HttpServletResponse response,String fileName) { OutputStream os = null; InputStream is = null;
Python 标准异常总结 2002wmj python
Python标准异常总结 AssertionError 断言语句（assert）失败 AttributeError 尝试访问未知的对象属性 EOFError 用户输入文件末尾标志EOF（Ctrl+d） FloatingPointError 浮点计算错误 GeneratorExit generator.close()方法被调用的时候 ImportError 导入模块失
SQL函数返回临时表结构的数据用于查询 357029540 SQL Server
这两天在做一个查询的SQL，这个SQL的一个条件是通过游标实现另外两张表查询出一个多条数据，这些数据都是INT类型，然后用IN条件进行查询，并且查询这两张表需要通过外部传入参数才能查询出所需数据，于是想到了用SQL函数返回值，并且也这样做了，由于是返回多条数据，所以把查询出来的INT类型值都拼接为了字符串，这时就遇到问题了，在查询SQL中因为条件是INT值，SQL函数的CAST和CONVERST都
java 时间格式化 | 比较大小| 时区个人笔记 7454103 java eclipse tomcat c MyEclipse
个人总结！不当之处多多包含！引用 1.0 如何设置 tomcat 的时区：位置：(catalina.bat---JAVA_OPTS 下面加上) set JAVA_OPT
时间获取Clander的用法 adminjun Clander 时间
/** * 得到几天前的时间 * @param d * @param day * @return */ public static Date getDateBefore(Date d,int day){ Calend
JVM初探与设置 aijuans java
JVM是Java Virtual Machine（Java虚拟机）的缩写，JVM是一种用于计算设备的规范，它是一个虚构出来的计算机，是通过在实际的计算机上仿真模拟各种计算机功能来实现的。Java虚拟机包括一套字节码指令集、一组寄存器、一个栈、一个垃圾回收堆和一个存储方法域。 JVM屏蔽了与具体操作系统平台相关的信息，使Java程序只需生成在Java虚拟机上运行的目标代码（字节码）,就可以在多种平台
SQL中ON和WHERE的区别 avords
SQL中ON和WHERE的区别数据库在通过连接两张或多张表来返回记录时，都会生成一张中间的临时表，然后再将这张临时表返回给用户。 www.2cto.com 在使用left jion时，on和where条件的区别如下： 1、 on条件是在生成临时表时使用的条件，它不管on中的条件是否为真，都会返回左边表中的记录。
说说自信 houxinyou 工作生活
自信的来源分为两种,一种是源于实力,一种源于头脑.实力是一个综合的评定,有自身的能力,能利用的资源等.比如我想去月亮上,要身体素质过硬,还要有飞船等等一系列的东西.这些都属于实力的一部分.而头脑不同,只要你头脑够简单就可以了!同样要上月亮上,你想,我一跳,1米,我多跳几下,跳个几年,应该就到了!什么?你说我会往下掉?你笨呀你!找个东西踩一下不就行了吗? 无论工作还
WEBLOGIC事务超时设置 bijian1013 weblogic jta 事务超时
系统中统计数据，由于调用统计过程，执行时间超过了weblogic设置的时间，提示如下错误：统计数据出错! 原因：The transaction is no longer active - status: 'Rolling Back. [Reason=weblogic.transaction.internal
两年已过去，再看该如何快速融入新团队 bingyingao java 互联网融入架构新团队
偶得的空闲，翻到了两年前的帖子该如何快速融入一个新团队，有所感触，就记下来，为下一个两年后的今天做参考。时隔两年半之后的今天，再来看当初的这个博客，别有一番滋味。而我已经于今年三月份离开了当初所在的团队，加入另外的一个项目组，2011年的这篇博客之后的时光，我很好的融入了那个团队，而直到现在和同事们关系都特别好。大家在短短一年半的时间离一起经历了一
【Spark七十七】Spark分析Nginx和Apache的access.log bit1129 apache
Spark分析Nginx和Apache的access.log，第一个问题是要对Nginx和Apache的access.log文件进行按行解析，按行解析就的方法是正则表达式： Nginx的access.log解析正则表达式 val PATTERN = """([^ ]*) ([^ ]*) ([^ ]*) (\\[.*\\]) (\&q
Erlang patch bookjovi erlang
Totally five patchs committed to erlang otp, just small patchs. IMO, erlang really is a interesting programming language, I really like its concurrency feature. but the functional programming style
log4j日志路径中加入日期 bro_feng java log4j
要用log4j使用记录日志，日志路径有每日的日期，文件大小5M新增文件。实现方式 log4j: <appender name="serviceLog" class="org.apache.log4j.RollingFileAppender"> <param name="Encoding" v
读《研磨设计模式》-代码笔记-桥接模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 个人觉得关于桥接模式的例子，蜡笔和毛笔这个例子是最贴切的：http://www.cnblogs.com/zhenyulu/articles/67016.html * 笔和颜色是可分离的，蜡笔把两者耦合在一起了：一支蜡笔只有一种
windows7下SVN和Eclipse插件安装 chenyu19891124 eclipse插件
今天花了一天时间弄SVN和Eclipse插件的安装，今天弄好了。svn插件和Eclipse整合有两种方式，一种是直接下载插件包，二种是通过Eclipse在线更新。由于之前Eclipse版本和svn插件版本有差别，始终是没装上。最后在网上找到了适合的版本。所用的环境系统：windows7JDK：1.7svn插件包版本：1.8.16Eclipse：3.7.2工具下载地址：Eclipse下在地址：htt
[转帖]工作流引擎设计思路 comsci 设计模式工作应用服务器 workflow 企业应用
作为国内的同行，我非常希望在流程设计方面和大家交流，刚发现篇好文(那么好的文章，现在才发现，可惜)，关于流程设计的一些原理，个人觉得本文站得高，看得远，比俺的文章有深度，转载如下 ================================================================================= 自开博以来不断有朋友来探讨工作流引擎该如何
Linux 查看内存，CPU及硬盘大小的方法 daizj linux cpu 内存硬盘大小
一、查看CPU信息的命令 [root@R4 ~]# cat /proc/cpuinfo |grep "model name" && cat /proc/cpuinfo |grep "physical id" model name : Intel(R) Xeon(R) CPU X5450 @ 3.00GHz model name :
linux 踢出在线用户 dongwei_6688 linux
两个步骤： 1.用w命令找到要踢出的用户，比如下面： [root@localhost ~]# w 18:16:55 up 39 days, 8:27, 3 users, load average: 0.03, 0.03, 0.00 USER TTY FROM LOGIN@ IDLE JCPU PCPU WHAT
放手吧,就像不曾拥有过一样 dcj3sjt126com
内容提要：静悠悠编著的《放手吧就像不曾拥有过一样》集结“全球华语世界最舒缓心灵”的精华故事，触碰生命最深层次的感动，献给全世界亿万读者。《放手吧就像不曾拥有过一样》的作者衷心地祝愿每一位读者都给自己一个重新出发的理由，将那些令你痛苦的、扛起的、背负的，一并都放下吧！把憔悴的面容换做一种清淡的微笑，把沉重的步伐调节成春天五线谱上的音符，让自己踏着轻快的节奏，在人生的海面上悠然漂荡，享受宁静与
php二进制安全的含义 dcj3sjt126com PHP
PHP里，有string的概念。 string里，每个字符的大小为byte（与PHP相比，Java的每个字符为Character，是UTF8字符，C语言的每个字符可以在编译时选择）。 byte里，有ASCII代码的字符，例如ABC，123，abc，也有一些特殊字符，例如回车，退格之类的。特殊字符很多是不能显示的。或者说，他们的显示方式没有标准，例如编码65到哪儿都是字母A，编码97到哪儿都是字符
Linux下禁用T440s，X240的一体化触摸板(touchpad) gashero linux ThinkPad 触摸板
自打1月买了Thinkpad T440s就一直很火大，其中最让人恼火的莫过于触摸板。 Thinkpad的经典就包括用了小红点(TrackPoint)。但是小红点只能定位，还是需要鼠标的左右键的。但是自打T440s等开始启用了一体化触摸板，不再有实体的按键了。问题是要是好用也行。实际使用中，触摸板一堆问题，比如定位有抖动，以及按键时会有飘逸。这就导致了单击经常就
graph_dfs hcx2013 Graph
package edu.xidian.graph; class MyStack { private final int SIZE = 20; private int[] st; private int top; public MyStack() { st = new int[SIZE]; top = -1; } public void push(i
Spring4.1新特性——Spring核心部分及其他 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
配置HiveServer2的安全策略之自定义用户名密码验证 liyonghui160com
具体从网上看 http://doc.mapr.com/display/MapR/Using+HiveServer2#UsingHiveServer2-ConfiguringCustomAuthentication LDAP Authentication using OpenLDAP Setting
一位30多的程序员生涯经验总结 pda158 编程工作生活咨询
1.客户在接触到产品之后，才会真正明白自己的需求。　　这是我在我的第一份工作上面学来的。只有当我们给客户展示产品的时候，他们才会意识到哪些是必须的。给出一个功能性原型设计远远比一张长长的文字表格要好。 2.只要有充足的时间，所有安全防御系统都将失败。　　安全防御现如今是全世界都在关注的大课题、大挑战。我们必须时时刻刻积极完善它，因为黑客只要有一次成功，就可以彻底打败你。 3.
分布式web服务架构的演变自由的奴隶 linux Web 应用服务器互联网
最开始，由于某些想法，于是在互联网上搭建了一个网站，这个时候甚至有可能主机都是租借的，但由于这篇文章我们只关注架构的演变历程，因此就假设这个时候已经是托管了一台主机，并且有一定的带宽了，这个时候由于网站具备了一定的特色，吸引了部分人访问，逐渐你发现系统的压力越来越高，响应速度越来越慢，而这个时候比较明显的是数据库和应用互相影响，应用出问题了，数据库也很容易出现问题，而数据库出问题的时候，应用也容易
初探Druid连接池之二——慢SQL日志记录 xingsan_zhang 日志连接池 druid 慢SQL
由于工作原因，这里先不说连接数据库部分的配置，后面会补上，直接进入慢SQL日志记录。 1.applicationContext.xml中增加如下配置： <bean abstract="true" id="mysql_database" class="com.alibaba.druid.pool.DruidDataSourc

【转载】python requests 高级用法

高级用法

会话对象

请求与响应对象

准备的请求 （Prepared Request）

SSL 证书验证

CA 证书

响应体内容工作流

保持活动状态（持久连接）

流式上传

块编码请求

POST 多个分块编码的文件

事件挂钩

自定义身份验证

流式请求

代理

SOCKS

合规性

编码方式

HTTP动词

你可能感兴趣的:(机器学习)

准备的请求（Prepared Request）