cherrypy3应用框架结构分析

cherrypy3应用框架结构分析：

最近在学习python和zope，本来希望可以比较详细的分析一下zope的设计的，但是由于很久都没有写这么正式的文字了，写了一部分以后觉得有点乱，总决得组织不好，只好先找个简单的框架作为练手，于是写了这篇关于cherrypy3的分析。

cherrypy3是一个纯python的web开发框架，它的使用非常简单，而且也提供了很多开发者可以使用的配置。

1、cherrpypy3模块划分(系统能工作的最简单模型)
   a.服务器监听模块 _cpserver,可以同时管理多个server
   b.响应数据组织模型 _cptree, 使用字典组织响应模型，同时每一个节点均可以
     进行配置
   c.响应和请求的数据抽象 _cprequest Request/Respose
   d.WSGI规范的实现 _cpWSGI/_cpWSGIserver

2、系统启动流程
   __init__.py 中cherrpy3创建了server对象(只是一个设置了host和port的数据结构)、log对象（使用了python标准模块logging）、 tree对象（一个映射脚本名到WSGI响应的字典），使用threading local 实现线程的request、response的独立访问。

这些对象创建后，系统已经具备了数据管理的功能，但是并没有响应任何请求的能力。

一个典型的应用（这里指动态响应，静态映射事实上就是一个hook，在这个hook中屏蔽了正常的handler），就是由开发人员写一个响应对象（比如类、函数，反正是一切可以call的，同时存在expose为true属性的对象）然后注册到响应的tree中，想想，这其实是很有unix/linux 味道，就连注册的函数也叫mount，注册的时候，cherrypy创建一个WSGI Application(为了遵从WSGI规范）与它对应（注意：这里要求的expose属性纯粹是作者的规定，如果我要写一个框架，我也会有很多自己的规范的^_^），到了这里，系统还只是具备了响应的数据维护，而没有接受请求的能力。

接着开发者调用quickstart（这里指cherrypy.server.quickstart()）,如果使用的是 cherrypy.quickstart,它内部会依次调用 tree.mount/server.star/engine.start由于quickstart内部调用的自身的server信息，所以一般来说，它只适用于只有一个server的时候，这时候可以直接通过server.socket_port、server.socket_host来设定 server的信息（如果在调用quickstart的时候没有提供server实例，也没有提供server的模块名，那么默认是创建 WSGIServer，这就是前面提到的tree节点创建的是WSGI Application,到这里为止，还没有看到这个WSGI Server 和WSGI Application 是怎样联系起来，它们是怎样知道对方的存在的，聪明的你肯定想到是全局量，就是__init__.py 中的几个对象）。

系统资源（sockets）的分配并不在创建WSGIServer这一步，_cpwsgi中的WSGIServer是继承 _cpwsgiserver中的CherryPyWSGIServer（绕这么一圈cherrypy所说是为了独立_cpwsgiserver的功能，我们先不管这个，反正一般的设计思路就是先实现功能，然后开始尽可能的独立没个模块,软件工程上美其名曰：降低耦合性，最恨这些创造拗口名词的人，这使我联想起马克思主义哲学——把大家都懂的东西用陌生的名词包装，使很多人都不懂，以证明高深莫测）。

在WSGIServer的__init__函数中调用了CherryPyWSGIServer初始化，为了独立CherryPyWSGIServer，必不可少的在它的__init__函数中提供了一堆参数，实在有点过分了（虽然有的参数有默认值），同时在这里可以看到cherrypy使用 cherry.tree.items()，提供整个服务结构的数据结构。而在CherryPyWSGIServer中就通过 self.mount_points这个list来维护相应的信息（[(script_name, WSGI_app),(...)]），同时CherryPyServer会对mount_point进行排序，以优先匹配最长的路径（这也是很合理的）。

好了，到了这一步，其实一切资源还是没有真正分配，真是见鬼。

在一切都初始化完成后，下一步好戏要上演了：
cherrypy.server.quickstart函数中调用->self.start(),惊天地，泣鬼神的事情要发生了： self.start函数根据self.httpservers(一个字典：httpserver(一个数据结构，和实际server关系其实不是很大，如:CherryPyWSGIServer)-->(host,port)),调用self._start_http，不看不知道，一看吓一跳，原来没有个httpserver是单独使用一个线程处理的（Threading），这就是cherrypy所谓的支持任服务器数的本质。

我们继续看看self._start_http_thread做了些什么工作，它调用httpserver.start()函数，把启动的任务交给 httpserver本身，这也无可厚非，毕竟cherrypy也不知道这些server到底要怎么启动，另一方面也说明了只要实现了start接口，任何东西都可以作为httpserver，哪怕它只是一个在stdout输出hello，world就退出的程序。
好了，看来一切的事情将会发生在每个httpserver中，那我们来看看CherryPyWSGIServer是怎么做的（以后我们来看看其他的Web框架如：zope/django/Karrigell/***又是怎样实现HTTP服务的）。

httpserver.start做的事情很简单，就是绑定一个设置的端口，然后在那里无限循环，等待请求的到来这个是主线思路，为了能够处理并发的请求，无可避免地引入了多线程(当然，在zope中是使用IO服用机制的)，所以在start里cherrypy创建了多个workthread （又人为的引入了一个类），这些workThread就在那边不断的循环等待用户请求的到来。

说到这里又被聪明的你发现了，既然一个httpserver是一个单独的线程，而这个单独的线程又产生多个workThread，那么 workThread与httpserver thread是怎么通讯的呢？主线程在那边accept来accept去的，workthread怎么知道什么时候有任务到啊？而这多个 workthread又是怎么同步的呢？万一它们发生抢活干的事情，这个世界就不和谐了。

我想大家也许都会想到使用互斥量来访问共享资源，cherrypy也不例外，不过正如python的口头禅一样：“我就是库多，其他没什么”， cherrypy中使用了异步Queue这个类，它就帮我们处理了多线程互斥的问题，而不需要我们自己Lock->Use->unLock。就是这么简单，cherrypy已经可以接受外界的请求了。

恩，如果单单实启动一个监听服务，用不多于10行代码就可以了，这么麻烦的启动流程就是为了传说中的高扩展和高定制。。。。。。

好，废话少说(其实已经说了不少了^_^)，现在才是正场，前面是广告。

一个HTTP Server的性能是在于它对请求的处理能力和处理时间：

当浏览器发送一个http请求到服务器的时候，它的过程大致如下：域名解析->建立TCP socket->打包数据(说白了就是发送一个字符串，为了传送一些二进制文件，有时会对发送内容进行编码或者压缩gzip)->等待服务器的响应->根据服务器返回的信息（最主要是要根据响应报文的header信息对后续的内容进行解码，输出）,从客户端的整个处理流程可以看到，一个 http请求是在一个socket中完成的，就是非常传统的停止等待协议，同时也可以看到，为了使发送内容的能够被接受方理解，除了内容本身外，还要附带一些描述信息，request header 和response header就是这些描述信息，这么看来HTTP协议也就是这么一回事，它具备了任何一种C/S结构协议的特点：描述＋内容,只不过它比较牛，成了国际标准，美其名曰：B/S结构。

转入正题：
cherrypy的httpserver在进入无限循环socket.accetp()后，当客户端请求到时，httpserver主线程得到 accept的socket，然后进行数据的读入并将它映射到HTTPRequest对象，接着将这个对象加入到Queue中，接着这个Request就会等待workThread的处理了。主线程就会继续accept下一个请求。这个就是httpserver主线程的无限循环的主要工作。

那我们现在看看，cherrypy是怎样把浏览器提交的数据映射为Request对象的：（写到这里，突然又感觉到很浓的unix/linux味道）将浏览器提交的数据映射为request是最基本的思路，另外在cherrypy中接收到Client的请求时是先生成一个HTTPConnection对象表示逻辑连接，并把这个对象加入到等待处理的队列中，workthread就可以响应每个请求了），这个HTTPConnection的主要用途就是完成输入数据的读取，并按照WSGI（WSGI规范在后面会提要性的总结一下的，现在把它理解为两个接口定义就好了）的规范，同时 HTTPConnection还支持http和https，果然考虑周到（我们现在先从简单的http开始），在HTTPConnection的 __init__中主要是进行envrion的 WSGI.input/WSGI.url_schema/REMOTE_PORT/REMOTE_ADDR/REMOVE_HOST等的设置，接着就是调用HTTPConnection的communicate对Client发送的数据进行Mime type的处理，这里还包含了错误信息的处理，如果发现错误，那么就会对Client进行直接的响应，而不是加入大队列中等待workthread接手处理。(可以预示，这个会是一个瓶颈，如果Client上传一个很大的文件的话，到底是不是这样的呢？还HTTPConenction只是处理最基本的文件头部分呢？)

我们继续往下看:

communicate主要做两件事:
1、根据输入初始化HTTPRequest对象，req = self.RequestHandlerClass(self)req.parse_request(),这个调用没有传参数，说明在它使用了对象创建时使用的HTTPConnection对象。呵呵，不得不说，这里很多部分的相关程度很高啊^_^
2、调用req.respond()进行响应,现在我们来看看workthread到底做了些什么东西，它到底做了些什么东西？？

   communicate函数的两个任务是怎么完成的，它们到底做了些什么事情(为了实现对于单独的路径进行参数配置
在cherrypy中到处可以看到dict.copy(),dict.update(),在代码风格上实在不怎么好看)：
首先看看parse_request():
1、根据HTTP协议RFC2616,parse_request首先根据浏览器提交的信息更新envrion中的REQUEST_METHOD和wsgi.url_scheme,
    接着就是从url分析http请求，这个直接影响到这个是否是一个有效的http请求：
    http://localhost:8080/helloworld/test/app/show%2Fhello?name=hello%2Fworld&user=admin
    ('http', 'localhost:8080', /helloworld/test/app/show%2Fhello','',', '')

    根据得到的path信息'/helloworld/test/app/show%2Fhello'搜索server中注册的Application，当然是从最长的路径开始匹配，如果不是完全匹配的话，还要更新enrivron的PATH_INFO信息，这些在后面的处理中还要转化为*args参数。如果找不到和它匹配的路径，那么直接应答self.simple_response('404 Not Found'), 虽然这个应答很简单，但是它还是遵守WSGI规范的接着就是解析HTTP的版本，envrion['SERVER_PROTOCOL']、envrion ['SERVER_NAME']等等，同时在cherrypy中引入了一个非WSGI的环境变量envrion ['ACTUAL_SERVER_PROTOCOL'], 因为在处理请求的时候envrion['SERVER_PROTOCOL']是取request和server的版本中较低的值的，增加这个属性只是为了使Application可以更加了解server的状态而已，实际上没有什么很重要的东西，不过这个还是有一个rfc与之对应的，详细的情况 rfc2145。

    上面处理的只是Client提交信息的第一行，由于要遵从WSGI规范，所以做了这么多的处理，如果不遵守WSGI规范的话，上面的处理可以简化很多，甚至至可以使用email标准模块一句代码搞定。

    接着就是处理request header的信息，cherrypy中使用了mimetools这个标准的模块（在python中已经建议使用email模块进行替换了， cherrpy中还在使用）进行处理，我想这个主要是应为mimetools的Message只是处理http header，而不处理其他东西，这样的话，如果在发送的http stream中包含了一个很大的上传的文件，cherrpy有机会使用cgi FieldStorage来把上传的文件保存为临时文件，以节省占用的内存。

    使用mimetools取得了header后，当然要更新到envrion中了，接着就是设置Connection参数，表示是否保持连接（大家可以看到，如果客户端使用keep-alive参数，从workthread开始会一直地读取客户端地数据），这个设计中一个HTTPConnection可以处理多个HTTP请求，这个就是HTTP/1.1的所谓连接重用，当然在httpserver accept得到socket生成这个对象的时候就设置了timeout为的就是通过timeout exception来表示是一个连接已经中断，对应的工作线程workthread能够处理下一个请求了，程序中的默认值是1秒。

    处理完Connection问题后，接着就是处理'Transfer-Encoding',cherrypy3.0 中目前只支持'chunked' 编码，这种编码方式就是通过自标识（长度或分割符）的形式提供header信息，只是HTTP的一种扩展的处理方式而已，它的目的还是提供header信息，不过它有一个好处，就是可以预先得到一个数据的长度，从而可以进行缓冲。
    parse_request()最后要做的就是判断'Content-Length',对于GET模式，Client是不需要提供Content- length的，但是对于POST/PUT模式，由于cherrypy中使用了cgi模块的FieldStorage类（而不是把所有的request header都交给cgi处理，这个是为了遵守WSGI规范所导致的，
    从这个类的源码中可以看到它依赖于一个内容解析的长度，所以cherrypy也验证这个值（如果自己实现，或者改写这个模块的话，可以去掉这个检查，不过这样不能保证接受到的数据的完整性），如果header中存在'Transfer-Encoding',由于cherrypy缓冲了整个 chuncked，（如果chuncked中包含了关于分界符的描述，那么也许FieldStorage可以从中正确区分各种信息，但是cherrypy 没有做这个判断，我想是应为这些信息一般不会包含在chuncked中吧）。
    到此为止，request请求header处理基本完成，除了通过enctype="multipart/form-data"提交的数据，这个是在后面通过cgi.FieldStorage处理。

2、我们继续看workthread的下一个处理流程：request.response。
   respond函数的第一句就是WSGI规范调用，self.WSGI_app(self.environ, self.start_response),WSGI规范就是从这里开始的，接着就是非常典型的yield模型：
   for line in response:
   self.write(line)
   if hasattr(response, 'close'):
   respose.close()
   if(self.ready and not self.sent_headers and not self.connection.server.interrupt);
   self.sent_heaaders = True
   self.send_headers()
   .....
    def write(self, d):
        if not self.sent_headers:
            self.sent_headers = True
            self.send_headers()
        self.connection.wfile.write(d)
        self.connection.wfile.flush()

这里把代码列出来是要说明两个问题，如果response产生的是一个空的string，那么输出会留在最后，如果response产生的是一个非空 iterator，那么header会在收到第一个非空的string后，这是为了在真正输出之前Application或middleware有机会对条件做进一步的验证，到这里为止，整个响应的过程(对于WSGI规范中对于Web服务器的规定)已经完成了。

看来cherrypy的Web服务器部分做的事情并不是很多，它的介绍中的很多特性、功能其实都是WSGI Application 的扩展而已。

既然这样，我们下面就看看WSGI Application到底又做了些什么。

还记得吗，WSGI Application是在创建响应结构树tree()对象mount上去的，一个WSGI httpserver是在初始化的时候通过tree.items()建立scirpt_name 到处理Application对象的list，然后在parse_request的时候得到相应的WSGI Application，也就是说归根结底响应就是从Application开始的。恩，现在我们就看看这个WSGI Application到底做了些什么。

在mount的时候需要提供两个参数，一个是开发者处理的请求的对象，就是那个包含expose属性的方法的"可调用对象"。在 parse_request的时候得到的其实是一个注册的路径，那么这个路径的处理者到底是谁呢？这个搜索的任务其实是WSGI Application根据environ['PATH_INFO']得到的。另外一个参数就是注册的处理路径，它在搜索响应对象的时候使用。下面我们看看WSGI Application（其实就是一个wrapper）是怎么工作的。

由于Application对象事实上是一个可调用对象（定义了__call__接口）当HTTPRequest调用respond的时候，传递了 envrion参数和一个start_response函数对象，在envrion参数中包含了关于请求的信息，其中一个决定了调用函数的是 envrion['PATH_INFO']的环境变量，Application在__call__接口中直接调用自身的WSGIapp函数，而 WSGIapp函数还只是一个wrapper，真正进行工作的是一个全局函数wsgi_handler, 除了environ和start_response函数外，它还带了一个指向Application对象的参数，通过这个参数，这个全局函数可以访问关于这个WSGI Application的所有信息，下面我们一起看看wsgi_handler到底做了些什么工作。（注意，现在讨论的已经是WSGI规范中关于Application部分的内容，和 Server已经关系不大了）。

在继续讨论WSGI_handler前，我们还有一个问题没有解决，那就是在整个cherrypy的主线程的处理流程中，在进行 cherrypy.server.start()/cherrypy.server.quickstart()后（在调用中已经等待了各个 httpserver启动完成），主线程没有退出（当然它不能退出啦），而是进行一个调用cherrypy.engine.start()，现在我们先来看一看这个engine到底是负责什么工作的，从前面的讨论看到，server的功能运行好像已经很完整了，除了还需要一个整体监控的线程以外，没有什么东西需要的了，莫非这个engine就是一个监控的线程？不管它的功能是什么它至少要满足两个条件：

1、正常情况下，不能退出（否则其他子线程自动退出，服务器不工作了）
2、不能占用很多资源，不然其他线程就没得混了。

现在我们就看看这个engine到底负责什么任务：
engine对象在__init__.py中就创建了，所以import cherrypy就能使用，从它的初始化函数就可以猜到它的确是一个监控性质的对象，但是具体是怎么处理的呢？从它的初始化函数中看到有很多list，看起来是一些钩子，现在只能这么猜测了，而且它的初始化也没有做什么事情。下面我们看看start又是做了些什么：
果然不出聪明的你所料： self.on_start_engine_list存放的是一些启动钩子，但是你又发现了，从来没有看到过这个 on_start_engine_list初始化，好，就让我们猜一下，也许就是传说中的config作用，还是必须由开发者手工调用注册相应的函数呢，不过现在先放一下。接着，start函数中启动一个threading.Timer(freq, self.monitor),很明显，这个是一个线程的Timer，用于监控其他部分的操作。最后主线程就进入一个无限的循环，一方面等待可能的用户中断，另一方面监控，以便随时进行自动重新装载资源。threading.Timer其实就是定时进行检测服务的请求是否操时而已。这里检查 self.severing中的request和response对象。现在我们已经知道了engine到底做了些什么事情，简单的说就是监控 serving队列中的response对象有没有超时，同时负责自动重新装载（这些对象怎么加进去的现放一下，后面将会说明的）。

现在回到前面的wsgi_handler中，我们再看看WSGI_handler做些什么事情，我晕，wsgi_handler调用 cherrypy.engine.request()函数来生成一个_cprequest.Request对象，注意，这个Request对象是 Application对于Client请求的封装，和一开始的时候Server生成的HTTPRequest不一样，这也难怪，因为 Application本来就独立于Server，它们之间只是通过envrion来传递参数，当然需要各自对数据进行封装了。在request函数中还通过threading的local设置了线程本地变量request和respose，同时把response加入了监控的serving队列（这个就是监控线程要检测的对象了）。还有一个有趣的地方是_cprequest.Response对象的创建没有任何的参数，这里就有一个疑问了，这个 response又是做什么的呢，它又怎么知道它自己对应的是哪一个request？

先不要急，我们先看看Request对象负责什么东西，它的实现有什么特点。

我们先想想它应会有什么功能：
1、获得header信息？这么获得呢？外面传进去的初始化函数的参数只有localhost、remotehost、

      httpmode、server_protocol
    2、根据请求提供响应，但是不是生成了“独立的response”对象了吗？
    3、错误处理，什么样的情况才是错误呢？
    4、对于PUT、POST方式的客户端请求，接收并处理剩下的接受内容

我就想到这么多了，现在看看是不是这样的。

__init__很简单，就是几个变量的赋值，同时copy一下类的默认配置（这里有一个引起我注意的东西，就是nanmspaces）在说明文档上说，可以用这种方式注册对应的处理函数），就这样一个Application的Request对象生成了，还没有体现出来我们对它的作用的猜测。

回到wsgi_handler。晕，原来我们猜测的request的作用是在这里通过直接给request对象增加属性来实现的：

request.login = env('LOGON_USER') or env('REMOTE_USER') or None
request.multithread = environ['WSGI.multithread']
request.multiprocess = environ['WSGI.multiprocess']
request.WSGI_environ = environ
request.app = app

接着就是进行真正的响应request.run,这里有些地方要注意的：
1、在run调用中提供了完整的调用路径env('SCRIPT_NAME', '') + env('PATH_INFO', '')，前面分析知道
响应对象是由Applicaiton自己决定的，也就是说必须由Application重新解析请求，从而得到响应的函数
和位置参数信息
2、 run调用中还单独提供了environ['WSGI.input']，这也说明了这个参数的重要性，对于PUT、POST调用方式这样的参数，我们可以猜想这个可能是解析输入参数的调用，因为在request对象的初始化函数并没有做实际上的工作。正如我们猜测的，在Request.run里进行了 Client请求的重新组装、HTTP协议版本的对比、Cookie的生成Header信息的记录（和Server做了一些重复的工作，这个是WSGI规范所不能避免的，也造成了一定性能的下降）这里最重要的是进行script_name和path_info的重新计算（path_info）这两个是为了划分具体的响应函数的必要信息（说些题外话，由于cherrypy每次都是动态的寻找响应函数，这会造成一定性能的下降，如果引入zope中的 interface机制，可以在服务器启动的时候就建立起映射关系dict，这样可以加速查找的过程，我改写了一些代码
后在我自己的笔记本上测可以上到600+ r/ps）。

现在可以正式响应用户请求了->self.respond(),这个函数是最耗时的操作

晕，（源代码）真多try。。。。。。

第一个try是为了响应中断，第二个中断是为了释放资源，第三个try是为了用raise的方式实现goto的功能，这个我喜欢^_^。

respond的主要做了这么几件事：
1、解析header，这里的解析其实最主要就是要处理HTTPRedirects？？我不是很明白这是什么意思？？我觉得这个只是为了在其他的Server提供的信息header信息中处理mime的编码问题，如：RFC2047等说白了就是“杞人忧天”的做法，对于cherrypy来说在Server处理请求的时候就使用了mimetool来过滤了这个也增加了cherrypy的响应时间。

2、提取资源，这里有提取资源的算法？？包括静态文件和动态响应对象？（cherrypy还复制了一份钩子）晕，get_resource这个名字实在让我产生错觉－－》打开一个文件，果然是unix的味道，everything is file, everything is resource, 其实get_resource是把请求发送到真正的处理函数的，在这个函数里是通过self.dispatch来进行请求调度的，现在先不看这个 dispatch怎么实现调度，我们先看看这里一个不起眼的语句：
nodeconf = self.app.config.get(trail, {})
一个简单的语句可以联想两件事：

      1、这个config是什么东西，什么时候初始化，如果初始化，它的结构是什么样子的呢？
      2、开发者可以自己定义一个关于这个节点的配置（包括：发布器、参数、处理方式等）这个果然是强啊。
   正如cherrypy所说的，绝大部分的资源都是通过动态的加载到一个request的属性当中，例如：request.config = {*****}，不过比较搞的是，在Application中只有一个方式可以修改这个app.config，那就是调用app.merge,而这个 merge又是调用_cpconfig.merge,也就是说，一切的“cherrypy”提供的配置都是从_cpconfig模块开始的。在这里有了这个整体上的认识就可以了。

   现在看看这个Dispatch是怎么工作的：
   Dispatch是一个可调用对象，在__call__中它是通过threading local来得到当前的request对象，然后根据提供的path_info创建一个handler, 寻找处理的开发者提供的函数是由 find_handler()完成的，find_handler是怎样做到的呢：
   find_handler通过threading.local获得request，注意：这个request是application的request抽象而不是Server的HTTPRequest对象，再从request得到开发者注册（mount）时提供的可调用对象这里有一个配置选项， find_handler首先检查root是否具'_cp_config'属性（事实上这是一个字典，包含兼容的配置信息），如果有，那么把它的信息更新到这个节点的配置上，如果'/'的配置在app.config中，那么更新这个节点的配置信息，这里使用相对路径'/'作为判断，使得用户的这个类可以应用到任何的路径下。 find_handler的寻路算法其实很冗肿，同时它是多次更新一个节点的配置，算法如下：
    根据但前节点是否包含了下一级的路径对象（注意：在这里算法并没有检查对应的对象是否具有expose属性）如果存在对应的属性，那么更新对应节点的 config信息，这个config可以包含了回调单独的配置信息，有则更新。同时检查app中实现关于这个节点的config信息，这样就实现了一个路径信息的历遍算法。同时在这个算法中，可以看到关于路径的配置信息和可调用对象的配置是分离的，也就是说即使没有对应的可调用对象也可以实现响应的配置，还有一个好玩的东西就是：可以通过嵌套的类或者方法封装整个站点目录结构（不过这个方式比较怪）。但是这也有好处就是可以通过upvalue机制访问上一个节点的信息（写到这里，我突然想起了zope的acquire机制，好像就是这个味道，难道它就是这样实现的？这里先卖个关子，有兴趣的读者可以看看我的另一篇blog：“zope设计体系分析”，呵呵，这个还在写）

   路径信息已经分割已经完成了，那么下一步就是从这些信息中找到最好的匹配，或者是default，注意index是可以省略的。我们留意一下这个细节上的东西，为了使用最长的匹配方式，cherrypy是从最长的路径开始匹配的,在搜索中如果可调用对象为None，那么直接跳到下一个分割的信息项（但是划分的时候为什么遇到None的时候不直接中止呢，真是晕，这是一个效率问题）寻找最匹配的响应算法是这样子的：
   假设提交的是：http://localhost:8080/hello/world/show?name=hellowworld
   首先处理的'default'，由于在生成候选路径的时候已经认为的增加了一个'index'元素，所以最先检测的是
   /hello/world/show/index/default->
   /hello/world/show/index->
   /hello/world/show/default->
   /hello/world/show(匹配)

匹配算法得到最佳的处理对象后通过set_conf()内建函数产生所有的路径配置信息，这里有一个比较特别的地方
那就是对于'tools.staticdir.dir'配置是每次都会用最长的路径（这里是绝对路径）来替代，原因也许是出于这样的考虑，在用户使用 'tools.staticdir.dir'配置时时在类的内部定以的，它只能用相对的路径表示，但是当类挂载到（mount）整个应用中的时候（尤其是对于虚拟路径来说），它的相对路径也许是不对的，而静态文件的处理是完全依赖于绝对路径，所以作出了这样的修改。当然目前只是猜测，等到我们一起看 config机制的时候，真相将会大白^_^。

说到这里，其实只是找到了响应的对象（如果有），还没有进行参数解析和传递，不过 find_handler返回了一个路径的list实际上里面放的就是路径参数。根据find_handler得到的结果，cherrypy把这些东西封装成一个LateParamPageHandle()对象，注意；这里有一个很有趣的名字late，这暗示到目前为止还是没有调用这个处理函数，但是到底要等到什么时候才会调用呢？而在这段时间里又会发生什么事会阻止这个调用的发生？

总的来说在find_handler这个函数产生了一个handler，并加到request的handler属性中。

让我们继续往下看，现在我们已经看到一切都已经准备好了（可以随时调用request.handler得到响应的输出），对了，参数还没有准备好。我们回到request.respond函数继续看：get_resource后调用的是self.configure,那么这个configure又是什么东西，完成什么功能？看configure自己的说明说，是要融合self.config(在get_resource中生成)和self.toolmap 的配置。

configure函数首先做的是从前面生成的config中划分出第一个名空间："tools.a.b"->(tools, a.b),如果tools在self.namespaces中的话，那么就调用响应的名空间处理函数，其实也就是相当于钩子的功能，只是把这种钩子用名空间的方式处理，这种调用是以（a.b, self.config['tools.a.b']）作为参数的，这样可以进一步区分调用的对象，而且这种调用会在每一个请求中完成，其实这种形式的钩子，我唯一想到的用的地方就是中间件，但是它并不遵从WSGI规范，也就是说这个是cherrypy设计上的一个特色.

在这个函数里终于要牵涉到cherrypy中推崇备至的tools配置系统，现在先略去它的细节（后面再来看），在这里使用cherrypy.tool这个是在__init__.py中赋值的一个默认的ToolBox，具体的初始化在_cptools.py中，现在先跳过。如果不深入到tools的机制，那么这个configure函数也就做了两件很简单的事：

1、根据配置，注册对应的（cherrypy 名空间钩子）

2、启动注册的Tool（应为在cherrypy中所有的动态配置都是以一个独立的Tool负责的，所以启动Tool，实际上就是启动一个过滤钩子，我没有使用过其他版本的cherrypy，但是从它的介绍文档看到以前的版本是静态配置策略的）。

在完成了这个configure后，我们回到respond函数中，接着，cherrypy启动hook机制，也就是传说中的HookMap， self.hooks.run('on_start_resource')但是对于开发者来说可以在什么地方注册一个自己的hook呢？看来只有在一个负责响应的类的定义的时候进行了，难道可以在一个tool的setup中完成？？应为从逻辑上来看tool的setup是在启动钩子之前，而tool的配置是可以通过在类或者请求的响应者中定义的。cherrypy也是这么设计的，而且它比我想得周到，它直接提供了一个'hook'的namespaces，这样的话，开发者就可以在响应的最小的局部定义自己的hook函数来验证一些事情，当然，在响应的过程中也是可以验证的（这种情况适合开发新的系统，但是对于要改进或者扩展一个现有的系统，那么这种hook机制就会很有用，因为在配置中会很容易的看到验证的顺序，同时也可以分离验证的细节）。这个 config是在路径划分的时候生成的，它是根据app.config来的，
这个app.config是在mount的时候提供的，同时在划分路径的时候它会合并全局的配置和Application的配置。

   好，现在回归到respond的主流程，configure函数后进行的是self.hooks.run('on_start_resource')，然后是检查request中是否需要处理request_body,对于PUT和POST方式的请求，Client是会提供request_body的，聪明的你肯定记得在WSGIServer中只是处理了header部分，而没有处理request_body,现在就需要处理这个东西了，当然，这个首先需要检查body的大小了。从这里也看到，到现在为止，还是不能提供足够的参数调用handler，例如：request_body中提供了上传的文件或者是form的其他变量，这也体现了所谓的"Late"。
   接着我们看看这是怎么处理request_body的：
   正如我们前面所说的，这里对request_body的处理使用的是python的标准模块cgi中的FieldStorage，cgi的 FieldStorage对于大文件的处理是通过产生临时磁盘文件的，而不是全部放在内存中，在cherrypy的FieldStorage是通过继承 cgi.FieldStorage来得到对应的处理功能，同时覆盖了三个函数read_lines_to_eof、 read_lines_to_outerboundary、skip_lines这些覆盖的函数没有做过多的事情它们只有一个地方和 cgiFieldStorage不一样，就是每次read/readline的时候设定了一个最大值(1<<16)， cgi.FieldStorage会返回
一个用属性标识的对象，来表征解析得到的参数。

现在我们看看这个标准的cgi.FieldStorage是怎么工作的,其实cgi.FileStorage的工作原理很简单，它根据读入的（也可以说是传入的，因为大部分是传入的，但同时也有读入的）Client request header信息，生成多个与它对应的request_body抽象与它对应，这个抽象就是FieldStorage，一个FieldStorage可以包含很多个下级FieldStorage，和MiniFiledStorage，从而形成树形的结构，最后得到的信息保存方式可以通过这么几个属性得到： field_storage_obj.list--->保存了很多的FieldStorage对象，这个FieldStorage实际上是针对文件上传设计的，然后兼容了很多其他的field，这个从它的属性说明中就能反映出来，这里简单地讲一下它地设计思路：一个以mutiple part形式上传的Client request body是以特定的outerboundary作为边界，FieldStorage的处理方式就是读取这个分界的内容，然后本地缓冲这些内容，当发现长度超出了允许的最大长度时生成一个临时文件与它对应（也就是将原来的StringIO流转变为文件）这个就是cgi.FieldStorage最吸引人的地方，我想也是这个原因cherrypy还在使用mimetools与cgi模块配合，FieldStorage在处理提交数据的时候对于每一个 boundary分割的元素都用独立的FiledStorage来保存的，只是在给用户返回的时候才将相同的名称对应的值转化为数组，而没有使用 email标准模块的原因，到现在为止我没有细看email模块，只是试用了几个功能，发现email好像是全部内存缓冲数据的。

搞清楚了cgi.FieldStorage的功能（其实cherrypy中只是使用了它的部分功能，因为从cherrypy调用FieldStorage 的时候设定了METHOD为POST就可以看出来了），再回到respond函数继续往下看，在process_body后，就是 self.hooks.run('before_handler')。等了这么久，终于等到真正的开发者提供的handler调用 cherrypy.response.body = self.handler()，这里有一个比较神奇的地方，就是PageHandler封装了处理函数的
调用，它传递参数的方式是通过描述符的方式在request.params中提取的，这个就是所谓的延迟调用的实质。当然处理的输出会以属性的方式连接到 cherry.response.body上。接着就是self.hooks.run('before_finalize')，这个 self.hooks.run('on_end_resource')是在finally中调用的，为的就是保证资源的释放（对于有共享池的应用这个是很重要的）

现在看看respond的最后一个调用是：cherrypy.response.finalize()，这个调用使人看起来莫名奇妙，一时不知道到底有什么作用，话又说回来在cherrypy中很多时候都是直接通过cherrypy.request/cherrypy.response这样的访问，耦合性真是比较大啊。。。。。。

现在我们看看这个response.finalize()做了些什么东西：
对比于request的九曲十三弯的调用流程，response的处理是在是出奇的简单，在初始化函数中它生成了简单的SimpleCookie，如果开发者要使用这个东西，那么他需要在相应的处理函数中通过cherrypy.response.cookie的方式使用，其实这个就是所谓的封装。还有什么更简单的呢，然后这个response.finalize就是把响应的header和cookie全部转换为一个list-->((key, value),(key,value)....)就是这个样子，可以不费力气的想象，最后输出的时候就是把这个东西连接成string（当然包括 cookie），那么就好了，当然这里还有一个隐含的作用就是把刚才修改的response.body属性整理为一个字符串，这里也隐式地限制了开发者提供的返回值可以是一个字符串，也可以是一个string的list这个就是这种转换的代码：
newbody = ''.join([chunk for chunk in self.body])

说到这里，一个请求的处理逻辑已经结束了，现在就是回到request.run中，是怎么把处理的结果返回到WSGIServer的： request.run直接把cherrypy.response返回到WSGI_handler, 对于无异常的流程，WSGI_handler调用WSGI server提供的start_response来通知WSGI服务器准发送响应，接下去的事情不用多说了，肯定就是返回一个generator啦。

到这里为止，cherrypy的整个处理流程的主干已经一目了然了。

下面，我们还要了解些什么呢？对了，还有config模块和tool模块的工作方式，可以说这些额外的模块才是一个框架的成功与否的关键，因为一个 HTTP服务器对于标准的实现流程基本相同的（以后我们看看其他框架（如：django、zope等）的实现就知道了），而与这个框架绑在一起的功能模块的性能优劣程度直接决定它的可用性与易用性。

我们看看config的实现，其实config是和tool和namespaces是联合起来使用的，那我们先看看config的使用： _cpconfig文件其实很简洁，这个config类只是简单地继承了dict, 但是有一个很特别地地方就是它覆盖了__setitem__函数，为的是要在更新dict的时候调用该名空间的处理函数，事实上这个server、 log、engine这三个名空间处理函数也只是简单地把对应属性加到该对象上。也就是说，_config.py做地事情其实也是非常的简单，它只是把配置文件的信息对出来，在需要使用的时候以字典的形式组装给用户。同时它还提供了对这些字典信息合并的功能，注意，只有使用config.update时才会触发对应的名空间处理函数，同时这里还有一个额外的功能，就是会将以文件形式提供的配置文件名记录下来，当系统重启的时候，会自动地加载这些配置文件，这里有一个风险，就是如果以配置文件加载地话，必须把配置目录的路径写全否则不能进行正确的配置。

这是通过配置文件或者由程序动态提供配置的方式，也就是说，必须在程序中手工地调用config.update,注意，这个config可以是一个普通的字典又或者是普通的字典，如果是普通的字典，同时开发者又需要触发相应的名空间处理函数的话，那么必须由开发者处理这些细节。另外一种方法是在定义的 WSGI Application中定义_cp_config = {'tools.gzip.on': True}，同样它也是一个字典，在ini配置文件中，是需要指出路径的，如；[/path/to/config],但是由于是在处理函数上进行配置，所以可以省略路径，直接写配置的信息就可以了（省了一层字典，就是这样），在cherrypy处理请求的过程中会自动地加载这些config并作为相应的环境参数（前面的分析中也看到了，一个request最后会有一个request.config属性表示它的配置，而且这个配置是覆盖性质的，也就是说，越明确的路径配置会取代相对不明确的配置信息）

在_cpconfig中我看不到预想中的影响实际运行的操作，而只是简单的更新字典，而只有使用cherrypy.config进行全局参数update 的时候才会进行响应名空间的函数调用，也就是是说在寻路分割的时候配置信息的更新只是非常平常的字典更新操作，而且request和response都是通过threading.local实现的线程局部变量，它的配置不会影响到其他线程的参数变量（环境变量）

现在只有从_cptool上找可能存在的影响操作流程的操作了，有了前面的猜测和对cherrypy设计思路的了解，我们很快就会发现我们需要的信息，这里以static的处理为例说明一下，其他的tool的实现思路基本相似（选择static作为例子，是因为它包含了很多特性）。static实际上是一个HandlerTool，它是注册在
'beforehandler'钩子下的，如果在某一个mount的路进下进行了_cp_config={ 'tools.staticdir.on': True,}的配置，那么在寻路分割的时候就会把这个配置加入到对应request.config中，然后在调用request.configure的时候就会检查"on"属性是否为True, 如果是，那么就会把整个staticdir tool安装到'before_handler'钩子
上，然后在下一步就会调用这个钩子，注意了，在handlertool钩子处理的过程中，它会根据钩子处理函数的返回值动态地决定是否进行原来的处理函数的调用，也就是说即使这个目录mount的时候就进行了staticdir.on 的设置，但是路径解析还是会进行的（这个也是一个时间的浪费）。

好了，在cherrypy的最后一个问题是度于不同的request些tool是怎么区分的呢，答案就Tool类的_setup()函数是把对应的钩子函数挂接到cherrypy.request.hooks变量上的，还只得把，cherrypy.request是一个线程local来的，这样就可以完成线程(request)独立了。

讲到这里，整个cherrypy的工作流程也基本上清楚了，内部的数据流向和操作调度结构也基本分析完了，我想有了这样的分析过程，自己也可以写一个比较完整的HTTP服务了，同时也知道了需要注意的细节。

其实这篇介绍的主要目的是为了说明一个用python实现的HTTP框架其实不是很复杂，只要动手的话，每个人都可以实现自己的HTTP应用框架。

3、WSGI规范简介：

   a、目的: 为了协调现存的python web框架的融合，说白了，就是一个写好的应用，在进行可以尽可能少的改动下在另一个web Server下发布

   b、主要概念：
      WSGI SERVER：面向浏览器的应用程序
      WSGI APPLICTION：处理用户逻辑的可调用对象
     WSGI MIDDLEWARE：位于SERVER和APPLICATION之间的可调用对象（这中东西一般是在改动APPLICARION的发布SERVER的时候引入，为的是调整新的SERVER和APPLICATION的差异，可以把它看成一个WAPPER）

   c、规范协议：（这里只简单地说说它定义的调用流程，详细说明参考PEP333）为了方便大家对照英文看，下面就直接用英文画图了

CLIENT                    SERVER                          APPLICATION
         socket              |
------------------------>accept
                             |
                        read and parse header

                             |
                       init envrion dict
                             |
                       call application ----------------->callable fucntion
                      (environ, start_response)                  |
                                         ^              process header from envrion
                                         |                        |
                                         |---------------------call start_response
                               (bodys)                            |
                              |<----------------------------return a iter or string list
                      for body_block in bodys:
                         send data to Client
   <---------------------------|



对了，由于session经常使用，这里看看一下cherrypy的section是怎么实现的，这里以FileSession为代表把：
Sessction 也是一个Tool那么它也必须注册到hook中，这里有一点特别的是，它注册了3个hook，同时它注册的函数是sessions.py中的共用函数，这几个函数都是wrapper，它们封装了session的继承关系，session的处理（继承流程和调用流程是cheerypy中类的继承机制用的比较灵活的地方，也就是说它通过了基类的统一接口实现了不同层次的session功能封装），这里有一个特点，就是它的seesion的过期处理是在load 第一个session的时候启动一个Timer Thread实现的。同样的，为了实现session的线程独立，它也是通过threading.local实现session的访问。

cherrypy中用了很多关于hook的封装，这使得阅读者不易理解，这里讲一下它的参数传递过程，是我们有一个清晰的概念，参数的开始源自进行路径分割的时候得到的request.config(这个config包含了全局的配置，单路径的配置等)，然后在request.configure函数调用的时候配置要注册的hook（其实这里大部分就是tool的注册）,在生成Hook对象的时候，根据以点分割的串建立字典参数列表：例如： 'tools.session.storage_type':'File'
那么在调用sessions.init的时候它的其中一个参数就是storage_type = 'File'。这个就是cherrypy的tool/hook机制。

（本blog信息均为原创，装载请注明出处^_^）

你可能感兴趣的:(cherrypy3应用框架结构分析)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
element实现动态路由+面包屑软件技术NINI vue案例 vue.js 前端
el-breadcrumb是ElementUI组件库中的一个面包屑导航组件，它用于显示当前页面的路径，帮助用户快速理解和导航到应用的各个部分。在Vue.js项目中，如果你已经安装了ElementUI，就可以很方便地使用el-breadcrumb组件。以下是一个基本的使用示例：安装ElementUI（如果你还没有安装的话）:你可以通过npm或yarn来安装ElementUI。bash复制代码npmi
地推话术，如何应对地推过程中家长的拒绝校师学
相信校长们在做地推的时候经常遇到这种情况：市场专员反馈家长不接单，咨询师反馈难以邀约这些家长上门，校区地推疲软，招生难。为什么？仅从地推层面分析，一方面因为家长受到的信息轰炸越来越多，对信息越来越“免疫”；而另一方面地推人员的专业能力和营销话术没有提高，无法应对家长的拒绝，对有意向的家长也不知如何跟进，眼睁睁看着家长走远；对于家长的疑问，更不知道如何有技巧地回答，机会白白流失。由于回答没技巧和专业
理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
swagger访问路径 igotyback swagger
Swagger2.x版本访问地址：http://{ip}:{port}/{context-path}/swagger-ui.html{ip}是你的服务器IP地址。{port}是你的应用服务端口，通常为8080。{context-path}是你的应用上下文路径，如果应用部署在根路径下，则为空。Swagger3.x版本对于Swagger3.x版本（也称为OpenAPI3）访问地址：http://{ip
扫地机类清洁产品之直流无刷电机控制悟空胆好小清洁服务机器人单片机人工智能
扫地机类清洁产品之直流无刷电机控制1.1前言扫地机产品有很多的电机控制，滚刷电机1个，边刷电机1-2个，清水泵电机，风机一个，部分中高端产品支持抹布功能，也就是存在抹布盘电机，还有追觅科沃斯石头等边刷抬升电机，滚刷抬升电机等的，这些电机有直流有刷电机，直接无刷电机，步进电机，电磁阀，挪动泵等不同类型。电机的原理，驱动控制方式也不行。接下来一段时间的几个文章会作个专题分析分享。直流有刷电机会自动持续
店群合一模式下的社区团购新发展——结合链动 2+1 模式、AI 智能名片与 S2B2C 商城小程序源码说私域人工智能小程序
摘要：本文探讨了店群合一的社区团购平台在当今商业环境中的重要性和优势。通过分析店群合一模式如何将互联网社群与线下终端紧密结合，阐述了链动2+1模式、AI智能名片和S2B2C商城小程序源码在这一模式中的应用价值。这些创新元素的结合为社区团购带来了新的机遇，提升了用户信任感、拓展了营销渠道，并实现了线上线下的完美融合。一、引言随着互联网技术的不断发展，社区团购作为一种新兴的商业模式，在满足消费者日常需
抖音乐买买怎么加入赚钱?赚钱方法是什么测评君高省
你会在抖音买东西吗?如果会，那么一定要免费注册一个乐买买，抖音直播间，橱窗，小视频里的小黄车买东西都可以返佣金!省下来都是自己的，分享还可以赚钱乐买买是好省旗下的抖音返佣平台，乐买买分析社交电商的价值，乐买买属于今年难得的副业项目风口机会，2019年错过做好省的搞钱的黄金时期，那么2022年千万别再错过乐买买至于我为何转到高省呢？当然是高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个自
Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
腾讯云技术深度探索：构建高效云原生微服务架构我的运维人生云原生架构腾讯云运维开发技术共享
腾讯云技术深度探索：构建高效云原生微服务架构在当今快速发展的技术环境中，云原生技术已成为企业数字化转型的关键驱动力。腾讯云作为行业领先的云服务提供商，不断推出创新的产品和技术，助力企业构建高效、可扩展的云原生微服务架构。本文将深入探讨腾讯云在微服务领域的最新进展，并通过一个实际案例展示如何在腾讯云平台上构建云原生应用。腾讯云微服务架构概览腾讯云微服务架构基于云原生理念，旨在帮助企业快速实现应用的容
Pyecharts数据可视化大屏：打造沉浸式数据分析体验我的运维人生信息可视化数据分析数据挖掘运维开发技术共享
Pyecharts数据可视化大屏：打造沉浸式数据分析体验在当今这个数据驱动的时代，如何将海量数据以直观、生动的方式展现出来，成为了数据分析师和企业决策者关注的焦点。Pyecharts，作为一款基于Python的开源数据可视化库，凭借其丰富的图表类型、灵活的配置选项以及高度的定制化能力，成为了构建数据可视化大屏的理想选择。本文将深入探讨如何利用Pyecharts打造数据可视化大屏，并通过实际代码案例
基于社交网络算法优化的二维最大熵图像分割智能算法研学社（Jack旭）智能优化算法应用图像分割算法 php 开发语言
智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码文章目录智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码1.前言2.二维最大熵阈值分割原理3.基于社交网络优化的多阈值分割4.算法结果：5.参考文献：6.Matlab代码摘要：本文介绍基于最大熵的图像分割，并且应用社交网络算法进行阈值寻优。1.前言阅读此文章前，请阅读《图像分割：直方图区域划分及信息统计介绍》htt
使用 FinalShell 进行远程连接（ssh 远程连接 Linux 服务器）编程经验分享开发工具服务器 ssh linux
目录前言基本使用教程新建远程连接连接主机自定义命令路由追踪前言后端开发，必然需要和服务器打交道，部署应用，排查问题，查看运行日志等等。一般服务器都是集中部署在机房中，也有一些直接是云服务器，总而言之，程序员不可能直接和服务器直接操作，一般都是通过ssh连接来登录服务器。刚接触远程连接时，使用的是XSHELL来远程连接服务器，连接上就能够操作远程服务器了，但是仅用XSHELL并没有上传下载文件的功能
18-115 一切思考不能有效转化为行动，都TM是扯淡！成长时间线
7月25号写了一篇关于为什么会断更如此严重的反思，然而，之后日更仅仅维持了一周，又出现了这次更严重的现象。从8月2号到昨天8月6号，5天！又是5天没有更文！虽然这次断更时间和上次一样，那为什么说这次更严重？因为上次之后就分析了问题的原因，以及应该如何解决，按理说应该会好转，然而，没过几天严重断更的现象再次出现，想想，经过反思，问题依然没有解决与改变，这让我有些担忧。到底是哪里出了问题，难道我就真的
高端密码学院笔记285 柚子_b4b4
高端幸福密码学院（高级班）幸福使者：李华第（598）期《幸福》之回归内在深层生命原动力基础篇——揭秘“激励”成长的喜悦心理案例分析主讲：刘莉一，知识扩充:成功=艰苦劳动+正确方法+少说空话。贪图省力的船夫，目标永远下游。智者的梦再美，也不如愚人实干的脚印。幸福早课堂2020.10.16星期五一笔记:1，重视和珍惜的前提是知道它的价值非常重要，当你珍惜了，你就真正定下来，真正的学到身上。2，大家需要
2020-04-12每天三百字之连接与替代冷眼看潮
不知道是不是好为人师，有时候还真想和别人分享一下我对某些现象的看法或者解释。人类社会不断发展进步的过程，就是不断连接与替代的过程。人类发现了火并应用火以后，告别了茹毛饮血的野兽般的原始生活（火烧、烹饪替代了生食）人类用石器代替了完全手工，工具的使用使人类进步一大步。类似这样的替代还有很多，随着科技的发展，有更多的原始的事物被替代，代之以更高效、更先进的技术。在近现代，汽车替代了马车，高速公路和铁路
【加密社】Solidity 中的事件机制及其应用加密社闲侃区块链智能合约区块链
加密社引言在Solidity合约开发过程中，事件（Events）是一种非常重要的机制。它们不仅能够让开发者记录智能合约的重要状态变更，还能够让外部系统（如前端应用）监听这些状态的变化。本文将详细介绍Solidity中的事件机制以及如何利用不同的手段来触发、监听和获取这些事件。事件存储的地方当我们在Solidity合约中使用emit关键字触发事件时，该事件会被记录在区块链的交易收据中。具体而言，事件
使用Faiss进行高效相似度搜索 llzwxh888 faiss python
在现代AI应用中，快速和高效的相似度搜索是至关重要的。Faiss（FacebookAISimilaritySearch）是一个专门用于快速相似度搜索和聚类的库，特别适用于高维向量。本文将介绍如何使用Faiss来进行相似度搜索，并结合Python代码演示其基本用法。什么是Faiss？Faiss是一个由FacebookAIResearch团队开发的开源库，主要用于高维向量的相似性搜索和聚类。Faiss
使用Apify加载Twitter消息以进行微调的完整指南 nseejrukjhad twitter easyui 前端 python
#使用Apify加载Twitter消息以进行微调的完整指南##引言在自然语言处理领域，微调模型以适应特定任务是提升模型性能的常见方法。本文将介绍如何使用Apify从Twitter导出聊天信息，以便进一步进行微调。##主要内容###使用Apify导出推文首先，我们需要从Twitter导出推文。Apify可以帮助我们做到这一点。通过Apify的强大功能，我们可以批量抓取和导出数据，适用于各类应用场景。
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
利用LangChain的StackExchange组件实现智能问答系统 nseejrukjhad langchain microsoft 数据库 python
利用LangChain的StackExchange组件实现智能问答系统引言在当今的软件开发世界中，StackOverflow已经成为程序员解决问题的首选平台之一。而LangChain作为一个强大的AI应用开发框架，提供了StackExchange组件，使我们能够轻松地将StackOverflow的海量知识库集成到我们的应用中。本文将详细介绍如何使用LangChain的StackExchange组件
在一台Ubuntu计算机上构建Hyperledger Fabric网络落叶无声9 区块链超级账本 Hyperledger fabric 区块链 ubuntu 构建 hyperledger fabric
在一台Ubuntu计算机上构建HyperledgerFabric网络Hyperledgerfabric是一个开源的区块链应用程序平台，为开发基于区块链的应用程序提供了一个起点。当我们提到HyperledgerFabric网络时，我们指的是使用HyperledgerFabric的正在运行的系统。即使只使用最少数量的组件，部署Fabric网络也不是一件容易的事。Fabric社区创建了一个名为Cello
Day1笔记-Python简介&标识符和关键字&输入输出 ~在杰难逃~ Python python 开发语言大数据数据分析数据挖掘
大家好，从今天开始呢，杰哥开展一个新的专栏，当然，数据分析部分也会不定时更新的，这个新的专栏主要是讲解一些Python的基础语法和知识，帮助0基础的小伙伴入门和学习Python，感兴趣的小伙伴可以开始认真学习啦！一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码，再通过语言处理程序执行向计算机发送指令，让计算机完成对应的工作，编程
MongoDB Oplog 窗口喝醉酒的小白 MongoDB 运维
在MongoDB中，oplog（操作日志）是一个特殊的日志系统，用于记录对数据库的所有写操作。oplog允许副本集成员（通常是从节点）应用主节点上已经执行的操作，从而保持数据的一致性。它是MongoDB副本集实现数据复制的基础。MongoDBOplog窗口oplog窗口是指在MongoDB副本集中，从节点可以用来同步数据的时间范围。这个窗口通常由以下因素决定：Oplog大小：oplog的大小是有限
pyecharts——绘制柱形图折线图 2224070247 信息可视化 python java 数据可视化
一、pyecharts概述自2013年6月百度EFE(ExcellentFrontEnd）数据可视化团队研发的ECharts1.0发布到GitHub网站以来，ECharts一直备受业界权威的关注并获得广泛好评，成为目前成熟且流行的数据可视化图表工具，被应用到诸多数据可视化的开发领域。Python作为数据分析领域最受欢迎的语言，也加入ECharts的使用行列，并研发出方便Python开发者使用的数据
CX8836：小体积大功率升降压方案推荐（附Demo设计指南）诚芯微科技社交电子
CX8836是一颗同步四开关单向升降压控制器，在4.5V-40V宽输入电压范围内稳定工作，持续负载电流10A，能够在输入高于或低于输出电压时稳定调节输出电压，可适用于USBPD快充、车载充电器、HUB、汽车启停系统、工业PC电源等多种升降压应用场合，为大功率TYPE-CPD车载充电器提供最优解决方案。提供CX8836Demo测试、CX8836样品申请及CX8836方案开发技术支持。CX8836同升
穷人做什么生意最赚钱？10个适合穷人赚钱的路子？氧惠爱高省
不管在什么地方，一般都是穷人占大量数，而富人只有少数，但是它们却掌握着大量的财富。对于穷人来说，想要买车、买房等奢侈品就难如登天，因为他们只能通过打工来赚取几千元的月薪。➤推荐网购返利app“氧惠”，一个领隐藏优惠券+现金返利的平台。氧惠只提供领券返利链接，下单全程都在淘宝、京东、拼多多等原平台，更支持抖音、快手电商、外卖红包返利等。（应用市场搜“氧惠”下载，邀请码:521521，全网优惠上氧惠！
数据仓库——维度表一致性墨染丶eye 背诵数据仓库
数据仓库基础笔记思维导图已经整理完毕，完整连接为：数据仓库基础知识笔记思维导图维度一致性问题从逻辑层面来看，当一系列星型模型共享一组公共维度时，所涉及的维度称为一致性维度。当维度表存在不一致时，短期的成功难以弥补长期的错误。维度时确保不同过程中信息集成起来实现横向钻取货活动的关键。造成横向钻取失败的原因维度结构的差别，因为维度的差别，分析工作涉及的领域从简单到复杂，但是都是通过复杂的报表来弥补设计
闲鱼鱼小铺怎么开通？鱼小铺开通需要哪些流程？高省APP大九
闲鱼鱼小铺是平台推出的一个专业程度的店铺，与普通店铺相比会有更多的权益，比如说发布的商品数量从50增加到500；拥有专业的店铺数据看板与分析的功能，这对于专门在闲鱼做生意的用户来说是非常有帮助的，那么鱼小铺每个人都能开通吗？大家好，我是高省APP联合创始人蓓蓓导师，高省APP是2021年推出的电商导购平台，0投资，0风险、高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个可省钱佣金高，能
01-Git初识 Meereen Git git
01-Git初识概念：一个免费开源，分布式的代码版本控制系统，帮助开发团队维护代码作用：记录代码内容。切换代码版本，多人开发时高效合并代码内容如何学：个人本机使用：Git基础命令和概念多人共享使用：团队开发同一个项目的代码版本管理Git配置用户信息配置：用户名和邮箱，应用在每次提交代码版本时表明自己的身份命令：查看git版本号git-v配置用户名gitconfig--globaluser.name
jquery实现的jsonp掉java后台知了ing java jsonp jquery
什么是JSONP？先说说JSONP是怎么产生的：其实网上关于JSONP的讲解有很多，但却千篇一律，而且云里雾里，对于很多刚接触的人来讲理解起来有些困难，小可不才，试着用自己的方式来阐释一下这个问题，看看是否有帮助。 1、一个众所周知的问题，Ajax直接请求普通文件存在跨域无权限访问的问题，甭管你是静态页面、动态网页、web服务、WCF，只要是跨域请求，一律不准； 2、
Struts2学习笔记 caoyong struts2
SSH : Spring + Struts2 + Hibernate 三层架构(表示层,业务逻辑层,数据访问层) MVC模式 (Model View Controller) 分层原则:单向依赖，接口耦合 1、Struts2 = Struts + Webwork 2、搭建struts2开发环境 a>、到www.apac
SpringMVC学习之后台往前台传值方法满城风雨近重阳 springMVC
springMVC控制器往前台传值的方法有以下几种： 1.ModelAndView 通过往ModelAndView中存放viewName：目标地址和attribute参数来实现传参： ModelAndView mv=new ModelAndView(); mv.setViewName="success
WebService存在的必要性？一炮送你回车库 webservice
做Java的经常在选择Webservice框架上徘徊很久，Axis Xfire Axis2 CXF ，他们只有一个功能，发布HTTP服务然后用XML做数据传输。是的，他们就做了两个功能，发布一个http服务让客户端或者浏览器连接，接收xml参数并发送xml结果。当在不同的平台间传输数据时，就需要一个都能解析的数据格式。但是为什么要使用xml呢？不能使json或者其他通用数据
js年份下拉框 3213213333332132 java web ee
<div id="divValue">test...</div>测试 //年份 <select id="year"></select> <script type="text/javascript"> window.onload =
简单链式调用的实现技术归来朝歌方法调用链式反应编程思想
在编程中，我们可以经常遇到这样一种场景：一个实例不断调用它自身的方法，像一条链条一样进行调用这样的调用你可能在Ajax中，在页面中添加标签： $("<p>").append($("<span>").text(list[i].name)).appendTo("#result"); 也可能在HQ
JAVA调用.net 发布的webservice 接口 darkranger webservice
/** * @Title: callInvoke * @Description: TODO(调用接口公共方法) * @param @param url 地址 * @param @param method 方法 * @param @param pama 参数 * @param @return * @param @throws BusinessException
Javascript模糊查找 | 第一章循环不能不重视。 aijuans Way
最近受我的朋友委托用js+HTML做一个像手册一样的程序，里面要有可展开的大纲，模糊查找等功能。我这个人说实在的懒，本来是不愿意的，但想起了父亲以前教我要给朋友搞好关系，再加上这也可以巩固自己的js技术，于是就开始开发这个程序，没想到却出了点小问题，我做的查找只能绝对查找。具体的js代码如下： function search(){ var arr=new Array("my
狼和羊，该怎么抉择 atongyeye 工作
狼和羊，该怎么抉择在做一个链家的小项目，只有我和另外一个同事两个人负责，各负责一部分接口，我的接口写完，并全部测联调试通过。所以工作就剩下一下细枝末节的，工作就轻松很多。每天会帮另一个同事测试一些功能点，协助他完成一些业务型不强的工作。今天早上到公司没多久，领导就在QQ上给我发信息，让我多协助同事测试，让我积极主动些，有点责任心等等，我听了这话，心里面立马凉半截，首先一个领导轻易说
读取android系统的联系人拨号百合不是茶 android sqlite数据库内容提供者系统服务的使用
联系人的姓名和号码是保存在不同的表中,不要一下子把号码查询来,我开始就是把姓名和电话同时查询出来的,导致系统非常的慢关键代码: 1, 使用javabean操作存储读取到的数据 package com.example.bean; /** * * @author Admini
ORACLE自定义异常 bijian1013 数据库自定义异常
实例： CREATE OR REPLACE PROCEDURE test_Exception ( ParameterA IN varchar2, ParameterB IN varchar2, ErrorCode OUT varchar2 --返回值,错误编码 ) AS /*以下是一些变量的定义*/ V1 NUMBER; V2 nvarc
查看端号使用情况征客丶 windows
一、查看端口在windows命令行窗口下执行： >netstat -aon|findstr "8080" 显示结果： TCP 127.0.0.1:80 0.0.0.0:0 &
【Spark二十】运行Spark Streaming的NetworkWordCount实例 bit1129 wordcount
Spark Streaming简介 NetworkWordCount代码 /* * Licensed to the Apache Software Foundation (ASF) under one or more * contributor license agreements. See the NOTICE file distributed with
Struts2 与 SpringMVC的比较 BlueSkator struts2 spring mvc
1. 机制：spring mvc的入口是servlet，而struts2是filter，这样就导致了二者的机制不同。 2. 性能：spring会稍微比struts快。spring mvc是基于方法的设计，而sturts是基于类，每次发一次请求都会实例一个action，每个action都会被注入属性，而spring基于方法，粒度更细，但要小心把握像在servlet控制数据一样。spring
Hibernate在更新时，是可以不用session的update方法的(转帖） BreakingBad Hibernate update
地址：http://blog.csdn.net/plpblue/article/details/9304459 public void synDevNameWithItil() {Session session = null;Transaction tr = null;try{session = HibernateUtil.getSession();tr = session.beginTran
读《研磨设计模式》-代码笔记-观察者模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; import java.util.Observable; import java.util.Observer; /** * “观
重置MySQL密码 chenhbc mysql 重置密码忘记密码
如果你也像我这么健忘，把MySQL的密码搞忘记了，经过下面几个步骤就可以重置了（以Windows为例，Linux/Unix类似）： 1、关闭MySQL服务 2、打开CMD，进入MySQL安装目录的bin目录下，以跳过权限检查的方式启动MySQL mysqld --skip-grant-tables 3、新开一个CMD窗口，进入MySQL mysql -uroot
再谈系统论，控制论和信息论 comsci 设计模式生物能源企业应用领域模型
再谈系统论，控制论和信息论偶然看
oracle moving window size与 AWR retention period关系 daizj oracle
转自： http://tomszrp.itpub.net/post/11835/494147 晚上在做11gR1的一个awrrpt报告时,顺便想调整一下AWR snapshot的保留时间,结果遇到了ORA-13541这样的错误.下面是这个问题的发生和解决过程. SQL> select * from v$version; BANNER -------------------
Python版B树 dieslrae python
话说以前的树都用java写的,最近发现python有点生疏了,于是用python写了个B树实现,B树在索引领域用得还是蛮多了,如果没记错mysql的默认索引好像就是B树... 首先是数据实体对象,很简单,只存放key,value class Entity(object): '''数据实体''' def __init__(self,key,value)
C语言冒泡排序 dcj3sjt126com 算法
代码示例： # include <stdio.h> //冒泡排序 void sort(int * a, int len) { int i, j, t; for (i=0; i<len-1; i++) { for (j=0; j<len-1-i; j++) { if (a[j] > a[j+1]) // >表示升序
自定义导航栏样式 dcj3sjt126com 自定义
-(void)setupAppAppearance { [[UILabel appearance] setFont:[UIFont fontWithName:@"FZLTHK—GBK1-0" size:20]]; [UIButton appearance].titleLabel.font =[UIFont fontWithName:@"FZLTH
11.性能优化-优化-JVM参数总结 frank1234 jvm参数性能优化
1.堆 -Xms --初始堆大小 -Xmx --最大堆大小 -Xmn --新生代大小 -Xss --线程栈大小 -XX:PermSize --永久代初始大小 -XX:MaxPermSize --永久代最大值 -XX:SurvivorRatio --新生代和suvivor比例,默认为8 -XX:TargetSurvivorRatio --survivor可使用
nginx日志分割 for linux HarborChung nginx linux 脚本
nginx日志分割 for linux 默认情况下，nginx是不分割访问日志的，久而久之，网站的日志文件将会越来越大，占用空间不说，如果有问题要查看网站的日志的话，庞大的文件也将很难打开，于是便有了下面的脚本使用方法，先将以下脚本保存为 cutlog.sh，放在/root 目录下，然后给予此脚本执行的权限复制代码代码如下: chmo
Spring4新特性——泛型限定式依赖注入 jinnianshilongnian spring spring4 泛型式依赖注入
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
centOS安装GCC和G++ liuxihope centos gcc
Centos支持yum安装，安装软件一般格式为yum install .......，注意安装时要先成为root用户。按照这个思路，我想安装过程如下：安装gcc：yum install gcc 安装g++： yum install g++ 实际操作过程发现，只能有gcc安装成功，而g++安装失败，提示g++ command not found。上网查了一下，正确安装应该
第13章 Ajax进阶（上） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
How to determine BusinessObjects service pack and fix pack blueoxygen BO
http://bukhantsov.org/2011/08/how-to-determine-businessobjects-service-pack-and-fix-pack/ The table below is helpful. Reference BOE XI 3.x 12.0.0. y BOE XI 3.0 12.0. x. y BO
Oracle里的自增字段设置 tomcat_oracle oracle
　大家都知道吧，这很坑，尤其是用惯了mysql里的自增字段设置，结果oracle里面没有的。oh，no 　　我用的是12c版本的，它有一个新特性，可以这样设置自增序列，在创建表是，把id设置为自增序列 create table t ( id 　　　　 number generated by default as identity (start with 1 increment b
Spring Security（01）——初体验 yang_winnie spring Security
Spring Security（01）——初体验博客分类： spring Security Spring Security入门安全认证首先我们为Spring Security专门建立一个Spring的配置文件，该文件就专门用来作为Spring Security的配置