liming850628

.Net网站架构设计（六）容错

转载自：亿级Web系统的容错性建设实践

2016-04-08 徐汉彬Hansion 架构文摘

来源：技术行者

原文：http://hansionxu.blog.163.com/blog

三年多前，我在腾讯负责的活动运营系统，因为业务流量规模的数倍增长，系统出现了各种各样的异常，那个时候，我7*24小时地没日没夜处理告警，周末和凌晨也经常上线，疲于奔命。后来，当时的老领导对我说：你不能总扮演一个“救火队长”的角色，要尝试从系统整体层面思考产生问题的根本原因，然后推进解决。我幡然醒悟，“火”是永远救不完的，让系统能够自动”灭火”，才是解决问题的正确方向。简而言之，系统的异常不能总是依赖于“人”去恢复，让系统本身具备“容错”能力，才是根本解决之道。三年多过去了，我仍然负责着这个系统，而它也已经从一个日请求百万级的小Web系统，逐步成长为一个高峰日请求达到8亿规模的平台级系统，走过一段令人难忘的技术历程。

容错其实是系统健壮性的重要指标之一，而本文会主要聚焦于“容错”能力的实践，希望对做技术的同学有所启发和帮助。

（备注：QQ会员活动运营平台，后面统一简称AMS）

一、重试机制

最容易也最简单被人想到的容错方式，当然就是“失败重试”，总而言之，简单粗暴！简单是指它的实现通常很简单，粗暴则是指使用不当，很可能会带来系统“雪崩”的风险，因为重试意味着对后端服务的双倍请求。

1. 简单重试

我们请求一个服务，如果服务请求失败，则重试一次。假设，这个服务在常规状态下是99.9%的成功率，因为某一次波动性的异常，成功率下跌到95%，那么如果有重试机制，那么成功率大概还能保持在99.75%。而简单重试的缺陷也很明显，如果服务真的出问题，很可能带来双倍流量，冲击服务系统，有可能直接将服务冲垮。而在实际的真实业务场景，往往更严重，一个功能不可用，往往更容易引起用户的“反复点击”，反而制造更大规模的流量冲击。比起服务的成功率比较低，系统直接被冲击到“挂掉”的后果明显更严重。

简单重试，要使用在恰当的场景。或者，主动计算服务成功率，成功率过低，就直接不做重试行为，避免带来过高的流量冲击。

2. 主备服务自动切换

既然单一服务的重试，可能会给该带来双倍的流量冲击，而最终导致更严重的后果，那么我们不如将场景变为主备服务的自动重试或者切换。例如，我们搭建了两套获取openid的服务，如果服务A获取失败，则尝试从服务B中获取。因为重试的请求压力是压到了服务B上，服务A通常不会因为重试而产生双倍的流量冲击。

这种重试的机制，看似比较可用，而实际上也存在一些问题：

（1）通常会存在“资源浪费”的问题。因为备份服务系统，很可能长期处于闲置状态，只有在主服务异常的时候，它的资源才会被比较充分地使用。不过，如果对于核心的服务业务（例如核心数据、营收相关）进行类似的部署，虽然会增加一些机器成本和预算，但这个付出通常也是物有所值的。

（2）触发重试机制，对于用户的请求来说，耗时必然增加。主服务请求失败，然后再到备份服务请求，这个环节的请求耗时就至少翻倍增长，假设主服务出现连接（connect）超时，那么耗时就更是大幅度增加。一个服务在正常状态下，获取数据也许只要50ms，而服务的超时时间通常会设置到500-1000ms，甚至更多，一旦出现超时重试的场景，请求耗时必然大幅度增长，很可能会比较严重地影响用户体验。

（3）主备服务一起陷入异常。如果是因为流量过大问题导致主服务异常，那么备份服务很可能也会承受不住这种级别的流量而挂掉。

重试的容错机制，在AMS上有使用，但是相对比较少，因为我们认为主备服务，还是不足够可靠。

二、动态剔除或者恢复异常机器

在AMS里，我们的后端涉及数以百计的各类服务，来支撑整个运营系统的正常运作。所有后端服务或者存储，首先是部署为无状态的方式提供服务（一个服务通常很多台机器），然后，通过公司内的一个公共的智能路由服务L5，纳入到AMS中。

（1）所有服务与存储，无状态路由。这样做的目的，主要是为了避免单点风险，就是避免某个服务节点挂了，导致整个服务就瘫痪了。实际上，即使像一些具有主备性质（主机器挂了，支持切换到备份机器）的接入服务，也是不够可靠的，毕竟只有2台，它们都挂了的情况，还是可能发生的。我们后端的服务，通常都以一组机器的形式提供服务，彼此之间没有状态关系，支撑随机分配请求。

（2）支持平行扩容。遇到大流量场景，支持加机器扩容。

（3）自动剔除异常机器。在我们的路由服务，发现某个服务的机器异常的时候（成功率低于50%），就会自动剔除该机器，后续，会发出试探性的请求，确认等它恢复正常之后，再重新加回到服务机器组。

例如，假如一组服务下拥有服务机器四台（ABCD），假设A机器的服务因为某种未知原因，完全不可用了，这个时候L5服务会主动将A机器自动从服务组里剔除，只保留BCD三台机器对外提供服务。而在后续，假如A机器从异常中恢复了，那么L5再主动将机器A加回来，最后，又变成ABCD四台机器对外提供服务。

在过去的3年里，我们逐步将AMS内的服务，渐渐从写死IP列表或者主备状态的服务，全部升级和优化为L5模式的服务，慢慢实现了AMS后端服务的自我容错能力。至少，我们已经比较少遇到，再因为某一台机器的软件或者硬件故障，而不得不人工介入处理的情况。我们也慢慢地从疲于奔命地处理告警的苦难中，被解放出来。

三、超时时间

1. 为服务和存储设置合理的超时时间

调用任何一个服务或者存储，一个合理的超时时间（超时时间，就是我们请求一个服务时，等待的最长时间），是非常重要的，而这一点往往比较容易被忽视。通常Web系统和后端服务的通信方式，是同步等待的模式。这种模式，它会带来的问题比较多。

对于服务端，影响比较大的一个问题，就是它会严重影响系统吞吐率。假设，我们一个服务的机器上，启用了100个处理请求的worker，worker的超时时间设置为5秒，1个worker处理1个任务的平均处理耗时是100ms。那么1个work在5秒钟的时间里，能够处理50个用户请求，然而，一旦网络或者服务偶尔异常，响应超时，那么在本次处理的后续整整5秒里，它仅仅处理了1个等待超时的失败任务。一旦比较大概率出现这类型的超时异常，系统的吞吐率就会大面积下降，有可能耗尽所有的worker（资源被占据，全部在等待状态，知道5s超时才释放），最终导致新的请求无worker可用，只能陷入异常状态。

算上网络通信和其他环节的耗时，用户就等待了超过5s时间，最后却获得一个异常的结果，用户的心情通常是崩溃的。

解决这个问题的方式，就是设置一个合理的超时时间。例如，回到上面的的例子，平均处理耗时是100ms，那么我们不如将超时时间从5s下调到500ms。从直观上看，它就解决了吞吐率下降和用户等待过长的问题。然而，这样做本身又比较容易带来新的问题，就是会引起服务的成功率下降。因为平均耗时是100ms，但是，部分业务请求本身耗时比较长，耗时超过500ms也比较多。例如，某个请求服务端耗时600ms才处理完毕，然后这个时候，客户端认为等待超过500ms，已经断开了连接。处理耗时比较长的这类型业务请求会受到比较明显的影响。

2. 超时时间设置过短带来的成功率下降

超时时间设置过短，会将很多本来处理成功的请求，当做服务超时处理掉，进而引起服务成功率下降。将全部业务服务，以一刀切的方式设置一个超时时间，是比较不可取的。优化的方法，我们分为两个方向。

（1）快慢分离

根据实际的业务维度，区分对待地给各个业务服务配置不同的超时时间，同时，最好也将它们的部署服务也分离出来。例如，天天酷跑的查询服务耗时通常为100ms，那么超时时间我们就设置为1s，某新手游的查询服务通常耗时为700ms，那么我们就设置为5s。这样的话，整体系统的成功率，就不会受到比较大的影响。

（2）解决同步阻塞等待

“快慢分离”可以改善系统的同步等待问题，但是，对于某些耗时本来就比较长的服务而言，系统的进程/线程资源仍然在同步等待过程中，无法响应其他新的请求，只能阻塞等待，它的资源仍然是被占据，系统的整体吞吐率仍然被大幅度拉低。

解决的思路，当然是利用I/O多路复用，通过异步回调的方式，解决同步等待过程中的资源浪费。AMS的一些核心服务，采用的就是“协程”（又叫“微线程”，简单的说，常规异步程序代码里嵌套比较多层的函数回调，编写复杂。而协程则提供了一种类似写同步代码的方式，来写异步回调程序），以解决同步等待的问题。异步处理的简单描述，就是当进程遇到I/O网络阻塞时，就保留现场，立刻切换去处理下一个业务请求，进程不会因为某个网络等待而停止处理业务，进而，系统吞吐率即使遇到网络等待时间过长的场景，通常都能保持在比较高的水平。

值得补充一点的是，异步处理只是解决系统的吞吐率问题，对于用户的体验问题，并不会有改善，用户需要等待的时间并不会减少。

3. 防重入，防止重复发货

前面我们提到，我们设置了一个比较“合理的超时时间”，简而言之，就是一个比较短的超时时间。而在数据写入的场景，会引起新的问题，就我们的AMS系统而言，就是发货场景。如果是发货请求超时，这个时候，我们需要思考的问题就比较多了。

（1）发货等待超时，发货服务执行发货失败。这种场景，问题不大，后续用户重新点击领取按钮，就可以触发下一次重新发货。

（2）发货等待超时，发货服务实际在更晚的时候执行发货成功，我们称之为“超时成功”。最可怕的场景，则是每次都是发货超时，而实际上都发货成功，有可能导致用户可以无限领取礼包，最终造成活动运营事故。

第二种场景，给我们带来了比较麻烦的问题，如果处理不当，用户再次点击，就触发第多次“额外”发货。

例如，我们假设某个发货服务超时时间设置为6s，用户点击按钮，我们的AMS收到请求后，请求发货服务发货，等待6s后，无响应，我们给用户提示“领取失败”，而实际上发货服务却在第8秒执行发货成功，礼包到了用户的账户上。而用户看见“领取失败”，则又再次点击按钮，最终导致“额外”多发一个礼包给到这个用户。

例子的时序和流程图大致如下：

这里就提到了防重入，简单的说，就是如何确认不管用户点击多少次这个领取按钮，我们都确保结果只有一种预期结果，就是只会给用户发一次礼包，而不引起重复发货。我们的AMS活动运营平台一年上线的活动超过4000个，涉及数以万计的各种类型、不同业务系统的礼包发货，业务通信场景比较复杂。针对不同的业务场景，我们做了不同的解决方案：

（1）业务层面限制，设置礼包单用户限量。在发货服务器的源头，设置好一个用户仅能最多获得1个礼包，直接避免重复发放。但是，这种业务限制，并非每个业务场景都通用的，只限于内部具备该限制能力的业务发货系统，并且，有一些礼包本身就可以多次领取的，就不适用了。

（2）订单号机制。用户的每一次符合资格的发货请求，都生成一个订单号与之对应，通过它来确保1个订单号，只发货1次。这个方案虽然比较完善，但是，它是依赖于发货服务方配合做“订单号发货状态更新“的，而我们的发货业务方众多，并非每一个都能支持”订单号更新“的场景。

（3）自动重试的异步发货模式。用户点击领取礼包按钮后，Web端直接返回成功，并且提示礼包在30分钟内到账。对于后台，则将该发货录入到发货队列或者存储中，等待发货服务异步发货。因为是异步处理，可以多次执行发货重试操作，直到发货成功为止。同时，异步发货是可以设置一个比较长的超时等待时间，通常不会出现“超时成功”的场景，并且对于前端响应来说，不需要等待后台发货状态的返回。但是，这种模式，会给用户带来比较不好的体验，就是没有实时反馈，无法立刻告诉用户，礼包是否到账。

4. 非订单号的特殊防刷机制

某些特殊的合作场景，我们无法使用双方约定订单号方式，例如一个完全隔离独立的外部发货接口，不能和我们做订单号的约定。基于这种场景，我们AMS专门做了一种防刷的机制，就是通过限制read超时的次数。但是，这种方案并非完美解决重复发货问题，只是能起到够尽可能减少避免被刷的作用。一次网络通信，通常包含：建立连接（connect），写入数据发包（write），等待并且读取回包（read），断开连接（close）。

通常一个发货服务如果出现异常，大多数情况，在connect步骤就是失败或者超时，而如果一个请求走到等待回包（read）时超时，那么发货服务另外一边就有可能发生了“超时但发货成功”的场景。这个时候，我们将read超时的发生次数记录起来，然后提供了一个配置限制次数的能力。假如设置为2次，那么当一个用户第一次领取礼包，遇到read超时，我们就允许它重试，当还遇到第二次read超时，就达到我们之前设置的阀值2，我们就认为它可能发货成功，拒绝用户的第三次领取请求。

这种做法，假设发货服务真的出现很多超时成功，那么用户也最多只能刷到2次礼包（次数可配置），而避免发生礼包无限制被刷的场景。但是，这种方案并不完全可靠，谨慎使用。

四、服务降级，自动屏蔽非核心分支异常

对于一次礼包领取请求，在我们的后端CGI会经过10多个环节和服务的逻辑判断，包括礼包配置读取、礼包限量检查、登陆态校验、安全保护等等。而这些服务中，就有不可以跳过的核心环节，例如读取礼包配置的服务，也有非核心环节，例如数据上报。对于非核心环节，我们的做法，就是设置一个比较低的超时时间。

例如我们其中一个统计上报服务，平均耗时是3ms，那么我们就将超时时间设置为20ms，一旦超时则旁路掉，继续按照正常逻辑走业务流程。

五、服务解耦、物理隔离

虽然，大家都知道一个服务的设计，要尽可能小和分离部署，如此，服务之间的耦合会比较小，一旦某个模块出问题，受到影响的模块就比较少，容错能力就会更强。可是，从设计之初，就将每一个服务有序的切割地很小，这个需要设计者具备超前的意识，能够提前意识到业务和系统的发展形态，而实际上，业务的发展往往是比较难以预知的，因为业务的形态会随着产品的策略的改变而变化。在业务早期流量比较小的时候，通常也没有足够的人力和资源，将服务细细的切分。AMS从日请求百万级的Web系统，逐渐成长为亿级，在这个过程中，流量规模增长了100倍，我们经历了不少服务耦合带来的阵痛。

1. 服务分离，大服务变成多个小服务

我们常常说，鸡蛋不能都放在一个篮子里。AMS以前是一个比较小的系统（日请求百万级，在腾讯公司内完全是一个不起眼的小Web系统），因此，很多服务和存储在早起都是部署在一起的，查询和发货服务都放在一起，不管哪一个出问题，都相互影响。后来，我们逐渐的将这些核心的服务和存储，慢慢地分离出来，细细切分和重新部署。在数据存储方面，我们将原来3-5个存储的服务，慢慢地切为20多个独立部署的存储。

例如，2015年下半年，我们就将其中一个核心的存储数据，从1个分离为3个。

这样做带来了很多好处：

（1）原来主存储的压力被分流。

（2）稳定性更高，不再是其中一个出问题，影响整个大的模块。

（3）存储之间是彼此物理隔离的，即使服务器硬件故障，也不会相互影响。

2. 轻重分离，物理隔离

另外一方面，我们对于一些核心的业务，进行“轻重分离”。例如，我们支持2016年“手Q春节红包”活动项目的服务集群。就将负责信息查询和红包礼包发货的集群分别独立部署，信息查询的服务相对没有那么重要，业务流程比较轻量级，而红包礼包发货则属于非常核心的业务，业务流程比较重。

轻重分离的这个部署方式，可以给我们带来一些好处：

（1）查询集群即使出问题，也不会影响发货集群，保证用户核心功能正常。

（2）两边的机器和部署的服务基本一致，在紧急的情况下，两边的集群可以相互支援和切换，起到容灾的效果。

（3）每个集群里的机器，都是跨机房部署，例如，服务器都是分布在ABC三个机房，假设B机房整个网络故障了，反向代理服务会将无法接受服务的B机房机器剔除，然后，剩下AC机房的服务器仍然可以正常为外界提供服务。

六、业务层面的容错

如果系统架构设计层面的“容错”我们都搭建完善了，那么再继续下一层容错，就需要根据实际的业务来进行，因为，不同的业务拥有不同的业务逻辑特性，也能够导致业务层面的各种问题。而在业务层面的容错，简而言之，避免“人的失误”。不管一个人做事性格多么谨慎细心，也总有“手抖”的时候，在不经意间产生“失误”。AMS是一个活动运营平台，一个月会上线400多个活动，涉及数以千计的活动配置信息（包括礼包、规则、活动参与逻辑等等）。在我们的业务场景下，因为种种原因而导致“人的失误”并不少。

例如，某个运营同学看错礼包发放的日限量，将原本只允许1天放量100个礼包的资源，错误地配置为每天放量200个。这种错误是测试同学比较难测试出来的，等到活动真正上线，礼包发放到101个的时候，就报错了，因为资源池当天已经没有资源了。虽然，我们的业务告警系统能够快速捕获到这个异常（每10分钟为一个周期，从十多个维度，监控和计算各个活动的成功率、流量波动等等数据），但是，对于腾讯的用户量级来说，即使只影响十多分钟，也可以影响成千上万的用户，对于大规模流量的推广活动，甚至可以影响数十万用户了。这样的话，就很容易就造成严重的“现网事故”。

完善的监控系统能够及时发现问题，防止影响面的进一步扩大和失控，但是，它并不能杜绝现网问题的发生。而真正的根治之法，当然是从起源的地方杜绝这种场景的出现，回到上面“日限量配置错误”的例子场景中，用户在内部管理端发布活动配置时，就直接提示运营同学，这个配置规则是不对的。

在业界，因为配置参数错误而导致的现网重大事故的例子，可以说是多不胜数，“配置参数问题”几乎可以说是一个业界难题，对于解决或者缓解这种错误的发生，并没有放之四海而皆准的方法，更多的是需要根据具体业务和系统场景，亦步亦趋地逐步建设配套的检查机制程序或者脚本。

因此，我们建设了一套强大并且智能的配置检查系统，里面集合了数十种业务的搭配检查规则，并且检查规则的数目一直都在增加。这里规则包括检查礼包日限量之类比较简单的规则，也有检查各种关联配置参数、相对比较复杂的业务逻辑规则。

另外一方面，流程的执行不能通过“口头约定”，也应该固化为平台程序的一部分，例如，活动上线之前，我们要求负责活动的同事需要验证一下“礼包领取逻辑”，也就是真实的去领取一次礼包。然而，这只是一个“口头约定”，实际上并不具备强制执行力，如果这位同事因为活动的礼包过多，而漏过其中一个礼包的验证流程，这种事情也的确偶尔会发生，这个也算是“人的失误”的另外一种场景。

为了解决问题，这个流程在我们AMS的内部管理端中，是通过程序去保证的，确保这位同事的QQ号码的确领取过全部的礼包。做法其实挺简单的，就是让负责活动的同事设置一个验证活动的QQ号码，然后，程序在发货活动时，程序会自动检查每一个子活动项目中，是否有这个QQ号码的活动参与记录。如果都有参与记录，则说明这位同事完整地领取了全部礼包。同时，其他模块的验证和测试，我们也都采用程序和平台来保证，而不是通过“口头约定”。

通过程序和系统对业务逻辑和流程的保证，尽可能防止“人的失误”。

这种业务配置检查程序，除了可以减少问题的发生，实际上也减轻了测试和验证活动的工作，可以起到节省人力的效果。不过，业务配置检查规则的建设并不简单，逻辑往往比较复杂，因为要防止误杀。

七、小结

无论是人还是机器，都是会产生“失误”，只是对于单一个体，发生的概率通常并不大。但是，如果一个系统拥有数百台服务器，或者有一项工作有几百人共同参与，这种“失误“的概率就被大大提升，失误很可能就变为一种常态了。机器的故障，尽可能让系统本身去兼容和恢复，人的失误，尽可能通过程序和系统流程来避免，都尽可能做到”不依赖于人“。

容错的核心价值，除了增强系统的健壮性外，我觉得是解放技术人员，尽可能让我们不用凌晨起来处理告警，或享受一个相对平凡闲暇的周末。对于我们来说，要完全做到这点，还有很长的路要走，与君共勉。

版权申明：内容来源网络，版权归原创者所有。除非无法确认，我们都会标明作者及出处，如有侵权烦请告知，我们会立即删除并表示歉意。谢谢。

你可能感兴趣的:(.Net网站架构设计（六）容错)

提升自动驾驶导航能力：基于深度学习的场景理解技术星辰和大海都需要门票路径规划算法自动驾驶深度学习人工智能
EnhancingAutonomousVehicleNavigationUsingDeepLearning-BasedSceneUnderstanding提升自动驾驶导航能力：基于深度学习的场景理解技术摘要-为应对复杂环境下的自动驾驶导航，系统高度依赖场景理解的准确性。本研究提出一种基于深度学习的新方法，将目标识别、场景分割、运动预测与强化学习相结合以提升导航性能。该方法首先采用U-Net架构分解
3招让.NET Core“即发即弃”秒变性能怪兽？为什么你的任务还在“卡住”？！墨瑾轩 C#乐园 .netcore 网络
关注墨瑾轩，带你探索编程的奥秘！超萌技术攻略，轻松晋级编程高手技术宝库已备好，就等你来挖掘订阅墨瑾轩，智趣学习不孤单即刻启航，编程之旅更有趣**.NETCore“即发即弃”的3大黑科技**黑科技①：Task.Run的“甩手掌柜”——“任务的‘快递员’”目标：让任务“即发即弃”，像“快递员”一样独立执行！核心思想：“像给任务装上‘火箭助推器’，执行完就消失，主线程继续干大事！”步骤1：定义阻塞任务（
Linux内核套接字诊断框架：sock_diag.c深度解析 109702008 编程 #C语言网络 linux 人工智能网络
在内核网络子系统中，sock_diag.c是支撑ss、netstat等工具的核心模块，它通过统一框架实现了跨协议族的套接字诊断功能。本文将深入剖析其设计思想与实现细节。一、框架概述：解耦协议与诊断sock_diag的核心是协议族处理程序注册机制。不同协议族（如AF_INET、AF_INET6）通过注册sock_diag_handler结构体实现定制化诊断：structsock_diag_handl
【EI复现】基于深度强化学习的微能源网能量管理与优化策略研究（Python代码实现）
欢迎来到本博客❤️❤️博主优势：博客内容尽量做到思维缜密，逻辑清晰，为了方便读者。⛳️座右铭：行百里者，半于九十。本文目录如下：目录1概述一、微能源网能量管理的基本概念与核心需求二、深度强化学习（DRL）在微能源网中的应用优势三、关键技术挑战四、现有基于DRL的优化策略案例五、相关研究文档的典型结构与撰写规范六、结论与未来方向2运行结果2.1有/无策略奖励2.2训练结果12.2训练结果23参考文献
对于Java8的新特性，应该了解(掌握)的哪些
Java8的新特性一、Lambda表达式基本的使用方式Lambda表达式的使用：6种情况语法格式一：无参，无返回值语法格式二：Lambda表达式需要一个参数，但是没有返回值语法格式三：数据类型可以省略，因为可由编译器推断得出，称为"类型推断"语法格式四：Lambda若只需要一个参数，参数的小括号也可以省略语法格式五：lambda表达式需要两个或以上参数，多条执行语句，并且可以有返回值语法格式六：当
第G1周：生成对抗网络（GAN）入门
本文为365天深度学习训练营原作者：K同学啊基础任务：1.了解什么是生成对抗网络2.生成对抗网络结构是怎么样的3.学习本文代码，并跑通代码进阶任务：调用训练好的模型生成新图像一、理论基础生成对抗网络（GenerativeAdversarialNetworks,GAN）是近年来深度学习领域的一个热点方向。GAN并不指代某一个具体的神经网络，而是指一类基于博弈思想而设计的神经网络。GAN由两个分别被称
FocalNet：焦点调制网络 AI专题精讲 Paper阅读计算机视觉人工智能 AI技术应用
摘要我们提出了焦点调制网络（简称FocalNets），在该网络中，自注意力（self-attention，SA）被完全替换为焦点调制模块，用于建模视觉中的token交互。焦点调制由三个组件组成：（i）焦点上下文化（focalcontextualization），通过一组深度可分离卷积层实现，用于从短程到长程编码视觉上下文；（ii）门控聚合（gatedaggregation），选择性地将上下文聚合到
物联网 MQTT 协议 7 号 MQ 物联网
MQTT官网：MQTT-TheStandardforIoTMessagingMQTT中文网（全是广告）：首页|MQTT中文网物联网百科物联网（InternetofThings，简称IoT）是指通过各种信息传感器、射频识别技术、全球定位系统、红外感应器、激光扫描器等各种装置与技术，实时采集任何需要监控、连接、互动的物体或过程，采集其声、光、热、电、力学、化学、生物、位置等各种需要的信息，通过各类可能
项目解决方案：付费自习室视频监控系统建设解决方案
目录第一章项目背景1.1技术提升背景1.2发展趋势背景1.3合规性要求背景第二章实现特点2.1拓展集成，信息联动2.2全面支持，无忧运营2.3成本控制，效益最大化第三章需求确认3.1实时远程监控，集中管理3.2权限管理灵活且安全第四章建设目标4.1先进实用，贴合需求4.2经济完备，高性价比4.3安全可靠，稳定运行4.4易于拓展，前瞻未来第五章难点解析5.1视频观看无缝衔接5.2精细划分用户功能第六
Vue与React区别分析 ╰つ゛木槿 vue3 web前端 vue.js react.js 前端
目录一、设计哲学与框架定位1.1核心定位差异1.2哲学差异对比二、核心机制深度对比2.1响应式数据管理2.2模板与渲染引擎三、组件化开发范式对比3.1组件结构设计3.2逻辑复用模式3.3通信机制差异四、生态系统与工具链4.1核心生态对比4.2开发工具对比五、性能优化策略5.1Vue优化方向5.2React优化方向六、共同点与差异总结6.1共同基础6.2核心差异矩阵七、选型建议与未来趋势7.1适用场
注意力机制还有招？混合注意力好发不卷
2025深度学习发论文&模型涨点之——混合注意力混合注意力是一种融合多种不同类型注意力机制的技术，旨在提升模型对数据中关键特征的识别与处理能力。以SENet为例，它通过对特征通道进行全局池化操作，随后利用两个全连接层对通道的重要性进行建模，从而实现通道级的注意力分配。而CBAM则先应用空间注意力，通过利用特征图的通道最大值和平均值来突出重要区域，之后再进行通道注意力操作，借助全连接层来强化特定通道
Golang发送定时邮件 white.tie Golang golang 开发语言后端
前面尝试过用Python来发送邮件,下面测试一下Golang如何发送邮件需要使用三方库如下1.安装github.com/jordan-wright/emailgogetgithub.com/jordan-wright/email安装完成之后代码如下packagemainimport("github.com/jordan-wright/email""log""net/smtp")funcmain()
研究方法 | 社会网络分析大锤资源学习经验分享
社会网络分析（SocialNetworkAnalysis，SNA）是一种研究社会结构的方法，它通过分析社会主体（如个人、组织、国家等）之间的关系网络，探讨这些关系对群体行为、互动和结构的影响。这种方法强调网络中节点（社会主体）和边（社会联系）之间的相互作用，揭示了人类社会交往中的复杂性和内在模式。01分析内容社会网络分析的核心内容包括：•节点与边：节点代表社会网络中的个体或实体，边则是连接这些节点
测试第六讲-测试模型&分类为你奋斗！测试用例经验分享
一、软件测试的模型1、软件测试模型表达的是测试阶段和开发阶段的对应关系2、V模型（重点）（1）会画v模型（2）优、缺点优点：1）软件的开发阶段和测试阶段（级别）划分明确，对应关系明确2）测试阶段既包含单元测试（专业级，代码级），也包含验收测试（用户级）缺点：缺少需求分析阶段和设计阶段的测试过程，容易造成误解，测试只是开发后的收尾工作，没能体现出尽早测试原则和不断测试原则（开发与测试是同步进行的工作
Android四大组件和六大布局 giaoho 安卓开发学习 android 安卓
Android四大组件和六大布局文章目录Android四大组件和六大布局Android四大组件Android六大布局1.LinearLayout（线性布局）2.RelativeLayout（相对布局）3.表格布局（TableLayout）4.网格布局（GridLayout）5.帧布局(FrameLayout)6.约束布局（**ConstraintLayout**）7.绝对布局（AbsoluteLa
大模型岗到底有哪些？这六个主要工作让你秒懂！ AGI大模型学习机器学习人工智能大数据大模型学习大模型教程大模型程序员
一、Agent智能体Agent:能独立采取行动以实现特定目标的AI个体；Agent的特点：会使用工具，比如查数据库，买车票；拥有记忆，可以记住之前经历；会根据环境、自身记忆、自身能力进行行动决策；Agent的缺陷：带着大模型本身的幻觉情况；可用RAG降低该情况；二、RAG知识库RAG：在设定的知识库中搜索问题的最佳TopK个匹配资料，然后在使用大模型进行润色总结。RAG的特点：解决了大模型的幻觉问
六种扎根理论的编码方法大锤资源学习经验分享
一、实境编码1.概念：实境编码是一种基于参与者原生语言的质性编码方法，其核心在于直接采用研究对象在访谈、观察或文本中使用的原始词汇、短语或独特表达作为分析代码。该方法通过保留数据的"原生态"语言形式（如方言、隐喻、习惯用语），强制研究者摒弃预设范畴，从底层捕捉参与者的真实认知框架和文化语境。2.目的：通过保留参与者的原始语言，实境编码帮助研究者保持对参与者生活经验的忠实表达，并避免解释性偏差。3.
一篇文章了解_docker weixin_30729609 php 测试 python
（一）Docker介绍2018年10月6日星期六15:04什么就Docker?Docker是一个开源项目，诞生于2013年初，最初是dotCloud公司内部的一个业余项目。它基于Google公司推出的Go语言实现。项目后来加入了Linux基金会，遵从了Apache2.0协议，项目代码在GitHub上进行维护。Docker项目的目标是实现轻量级的操作系统虚拟化解决方案。Docker的基础是Linux
讲解 Docker 的四种网络模式 lovely_nn Docker docker 容器
Docker的四种网络模式Docker提供四种核心网络模式，分别适用于不同容器通信与隔离需求，运行容器时可通过--net指定网络模式，以下是四种网络模式的讲解与示例：1、Bridge（桥接模式）‌‌默认模式‌，Docker为容器分配独立虚拟网卡并接入docker0网桥容器间通过Docker网络通信，与外部网络隔离适用场景：常规应用隔离部署，需端口映射(-p)暴露服务‌2、Host（主机模式）‌容器
Python3 async def和@asyncio.coroutine的区别清风弥天 python
https://blog.csdn.net/m345376054/article/details/78538726
c#VB.NET 中使用当前时间戳或随机数来生成一个动态参数
在VB.NET中，你可以使用当前时间戳或随机数来生成一个动态参数，确保每次请求的URL不同，从而避免缓存。以下是几种常用的实现方法：1.使用当前时间戳（毫秒级）vbDimurlAsString="https://example.com/api/data"DimtimestampAsString=DateTimeOffset.UtcNow.ToUnixTimeMilliseconds().ToStr
.NET Core配置系统详解：JSON、环境变量与多源配置
目录一、配置系统架构全景1.1配置系统核心组件1.2配置源加载顺序对比二、JSON配置深度解析2.1多环境JSON配置实战2.2JSON配置结构最佳实践三、环境变量配置策略3.1环境变量命名规范3.2环境变量与JSON对比四、多配置源融合技术4.1配置提供程序组合示例4.2自定义配置提供程序五、配置数据消费模式5.1配置绑定技术对比5.2选项模式最佳实践六、高级配置场景6.1动态配置更新6.2多租
一个简单的故事介绍极大似然估计
极大似然估计（MaximumLikelihoodEstimation,MLE）是一种在统计中用于估计参数的方法，其核心思想是找到使观测数据出现的概率最大的参数值。故事背景假设我们有一个不均匀的六面色子，但我们不知道每一面出现的真实概率。传统上，一个均匀的六面色子每一面出现的概率应该是1/6，但这个色子因为某些原因（比如制造上的误差）导致各面出现的概率不同。我们的任务是，通过投掷这个色子多次，来估计
方配.Core网站服务器：.NET Core开发者的利器兰森环游世界
本文还有配套的精品资源，点击获取简介：方配.Core网站服务器是一款专为.NETCore开发的轻量级Web服务器，简化了.NETCore应用程序的部署和运行过程。提供一键安装、快速启动和友好的网站管理功能。基于.NETCore构建，兼容多操作系统，具有高性能和稳定性。利用C#的特性如异步编程实现高效服务器运行和管理。核心功能包括一键安装、快速启动、网站管理、错误日志、安全特性及性能监控，旨在提升.
.net wpf混淆佛·追命 .net wpf
混淆要求1、把exe所用到的依赖dll都合并到exe中2、使用反编译工具无法得到源代码混淆方式1、.netReactor优点：可以dll到exe中，也能防止反编译，但是要注意QuickSettings尽量勾选完毕缺点：争对WPF程序无法使用NativeEXEFile，但是Winform可以2、Confuser优点：可以防止反编译，也能防止反编译工具查看程序集名称缺点：无法把依赖的dll合并到exe
Spire.PDF for .NET【文档操作】演示：将PDF 拆分为多个 PDF 慧都小妮子 Spire.PDF for .Net 教程 pdf .net python spire.pdf
Spire.PDF完美支持将多页PDF拆分为单页。但是，更常见的情况是，您可能希望提取选定的页面范围并保存为新的PDF文档。在本文中，您将学习如何通过Spire.PDF在C#、VB.NET中根据页面范围拆分PDF文件。Spire.PDFfor.NET是一款独立PDF控件，用于.NET程序中创建、编辑和操作PDF文档。使用Spire.PDF类库，开发人员可以新建一个PDF文档或者对现有的PDF文档进
Word控件Spire.Doc 【段落处理】教程(十二)：如何在 C# 中管理 word 文档的分页
当我们要管理段落的分页时，我们可以直接插入分页符。但是后来我们可能会发现很难在分页符上方添加或删除文本，然后我们必须删除整个分页符。使用Microsoftword，我们还可以使用段落对话框来管理word段落的灵活分页，如下所示：Spire.Docfor.NET最新下载https://www.evget.com/product/3368/download我们已经向您展示了如何在word文档中插入分页
GNN多任务预测模型实现（二）：将EXCEL数据转换为图数据走的远一些神经网络知识分享知识备份人工智能深度学习
目录一.引言二.加载和检查数据三.提取特征和标签四.标准化特征五.构建节点索引六.构建边及其特征七.总结八.结语一.引言在图神经网络（GraphNeuralNetworks,GNNs）的多任务学习场景中，数据预处理是至关重要的一步。尤其是当我们的数据存储在表格格式（如Excel文件）中时，如何有效地将其转换为图数据格式，是搭建GNN模型的基础。二.加载和检查数据第一步是加载数据并检查其格式。我们通
linux常用基础命令_新脚大江山稳 linux 运维服务器
本文介绍了Linux系统中常用的命令和操作，涵盖了文件管理、系统监控、服务管理、软件安装等多个方面。主要内容包括：查看文件和目录大小（du、df）、路径操作（pwd）、文件删除（rm）、服务管理（systemctl）、端口查询（netstat）、软件版本管理（yum）、文件查找（find）、文件内容查看（cat、more）、管道符和过滤（grep）、重定向符（>、>>）、文件跟踪（tail）、以及
.NET 环境配置工具 (dotnet-env) 教程诸余煦
.NET环境配置工具(dotnet-env)教程dotnet-envA.NETlibrarytoloadenvironmentvariablesfrom.envfiles项目地址:https://gitcode.com/gh_mirrors/do/dotnet-env1.项目目录结构及介绍dotnet-env/├──src#源代码主目录│├──DotNetEnv#主项目库，包含了环境变量处理的核心
统一思想认识永夜-极光思想
1.统一思想认识的基础,才能有的放矢原因: 总有一种描述事物的方式最贴近本质,最容易让人理解. 如何让教育更轻松,在于找到最适合学生的方式. 难点在于,如何模拟对方的思维基础选择合适的方式. &
Joda Time使用笔记 bylijinnan java joda time
Joda Time的介绍可以参考这篇文章： http://www.ibm.com/developerworks/cn/java/j-jodatime.html 工作中也常常用到Joda Time，为了避免每次使用都查API，记录一下常用的用法： /** * DateTime变化（增减） */ @Tes
FileUtils API eksliang FileUtils FileUtils API
转载请出自出处：http://eksliang.iteye.com/blog/2217374 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
各种新兴技术不懂事的小屁孩技术
1:gradle Gradle 是以 Groovy 语言为基础，面向Java应用为主。基于DSL（领域特定语言）语法的自动化构建工具。现在构建系统常用到maven工具，现在有更容易上手的gradle，搭建java环境: http://www.ibm.com/developerworks/cn/opensource/os-cn-gradle/ 搭建android环境： http://m
tomcat6的https双向认证酷的飞上天空 tomcat6
1.生成服务器端证书 keytool -genkey -keyalg RSA -dname "cn=localhost,ou=sango,o=none,l=china,st=beijing,c=cn" -alias server -keypass password -keystore server.jks -storepass password -validity 36
托管虚拟桌面市场势不可挡蓝儿唯美
用户还需要冗余的数据中心，dinCloud的高级副总裁兼首席营销官Ali Din指出。该公司转售一个MSP可以让用户登录并管理和提供服务的用于DaaS的云自动化控制台，提供服务或者MSP也可以自己来控制。在某些情况下，MSP会在dinCloud的云服务上进行服务分层，如监控和补丁管理。 MSP的利润空间将根据其参与的程度而有所不同，Din说。 “我们有一些合作伙伴负责将我们推荐给客户作为个
spring学习——xml文件的配置 a-john spring
在Spring的学习中，对于其xml文件的配置是必不可少的。在Spring的多种装配Bean的方式中，采用XML配置也是最常见的。以下是一个简单的XML配置文件： <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.or
HDU 4342 History repeat itself 模拟 aijuans 模拟
来源：http://acm.hdu.edu.cn/showproblem.php?pid=4342 题意：首先让求第几个非平方数，然后求从1到该数之间的每个sqrt(i)的下取整的和。思路：一个简单的模拟题目，但是由于数据范围大，需要用__int64。我们可以首先把平方数筛选出来，假如让求第n个非平方数的话，看n前面有多少个平方数，假设有x个，则第n个非平方数就是n+x。注意两种特殊情况，即
java中最常用jar包的用途 asia007 java
java中最常用jar包的用途 jar包用途axis.jarSOAP引擎包commons-discovery-0.2.jar用来发现、查找和实现可插入式接口，提供一些一般类实例化、单件的生命周期管理的常用方法.jaxrpc.jarAxis运行所需要的组件包saaj.jar创建到端点的点到点连接的方法、创建并处理SOAP消息和附件的方法，以及接收和处理SOAP错误的方法. w
ajax获取Struts框架中的json编码异常和Struts中的主控制器异常的解决办法百合不是茶 js json编码返回异常
一:ajax获取自定义Struts框架中的json编码出现以下问题: 1,强制flush输出 json编码打印在首页 2, 不强制flush js会解析json 打印出来的是错误的jsp页面却没有跳转到错误页面 3, ajax中的dataType的json 改为text 会
JUnit使用的设计模式 bijian1013 java 设计模式 JUnit
JUnit源代码涉及使用了大量设计模式 1、模板方法模式（Template Method）定义一个操作中的算法骨架，而将一些步骤延伸到子类中去，使得子类可以不改变一个算法的结构，即可重新定义该算法的某些特定步骤。这里需要复用的是算法的结构，也就是步骤，而步骤的实现可以在子类中完成。
Linux常用命令（摘录） sunjing crond chkconfig
chkconfig --list 查看linux所有服务 chkconfig --add servicename 添加linux服务 netstat -apn | grep 8080 查看端口占用 env 查看所有环境变量 echo $JAVA_HOME 查看JAVA_HOME环境变量安装编译器 yum install -y gcc
【Hadoop一】Hadoop伪集群环境搭建 bit1129 hadoop
结合网上多份文档，不断反复的修正hadoop启动和运行过程中出现的问题，终于把Hadoop2.5.2伪分布式安装起来，跑通了wordcount例子。Hadoop的安装复杂性的体现之一是，Hadoop的安装文档非常多，但是能一个文档走下来的少之又少，尤其是Hadoop不同版本的配置差异非常的大。Hadoop2.5.2于前两天发布，但是它的配置跟2.5.0，2.5.1没有分别。 &nb
Anychart图表系列五之事件监听白糖_ chart
创建图表事件监听非常简单：首先是通过addEventListener('监听类型',js监听方法)添加事件监听，然后在js监听方法中定义具体监听逻辑。以钻取操作为例，当用户点击图表某一个point的时候弹出point的name和value，代码如下： <script> //创建AnyChart var chart = new AnyChart(); //添加钻取操作&quo
Web前端相关段子 braveCS web前端
Web标准：结构、样式和行为分离使用语义化标签 0）标签的语义：使用有良好语义的标签，能够很好地实现自我解释，方便搜索引擎理解网页结构，抓取重要内容。去样式后也会根据浏览器的默认样式很好的组织网页内容，具有很好的可读性，从而实现对特殊终端的兼容。 1）div和span是没有语义的：只是分别用作块级元素和行内元素的区域分隔符。当页面内标签无法满足设计需求时，才会适当添加div
编程之美-24点游戏 bylijinnan 编程之美
import java.util.ArrayList; import java.util.Arrays; import java.util.HashSet; import java.util.List; import java.util.Random; import java.util.Set; public class PointGame { /**编程之美
主页面子页面传值总结 chengxuyuancsdn 总结
1、showModalDialog returnValue是javascript中html的window对象的属性,目的是返回窗口值,当用window.showModalDialog函数打开一个IE的模式窗口时,用于返回窗口的值主界面 var sonValue=window.showModalDialog("son.jsp"); 子界面 window.retu
[网络与经济]互联网+的含义 comsci 互联网+
互联网+后面是一个人的名字 = 网络控制系统互联网+你的名字 = 网络个人数据库每日提示:如果人觉得不舒服,千万不要外出到处走动,就呆在床上,玩玩手游,更不能够去开车,现在交通状况不
oracle 创建视图 with check option daizj 视图 view oralce
我们来看下面的例子： create or replace view testview as select empno,ename from emp where ename like ‘M%’ with check option; 这里我们创建了一个视图，并使用了with check option来限制了视图。然后我们来看一下视图包含的结果： select * from testv
ToastPlugin插件在cordova3.3下使用 dibov Cordova
自己开发的Todos应用，想实现“ 再按一次返回键退出程序 ”的功能，采用网上的ToastPlugins插件，发现代码或文章基本都是老版本，运行问题比较多。折腾了好久才弄好。下面吧基于cordova3.3下的ToastPlugins相关代码共享。 ToastPlugin.java package&nbs
C语言22个系统函数 dcj3sjt126com c function
C语言系统函数一、数学函数下列函数存放在math.h头文件中Double floor(double num) 求出不大于num的最大数。Double fmod(x, y) 求整数x/y的余数。Double frexp(num, exp); double num; int *exp; 将num分为数字部分（尾数）x和以2位的指数部分n，即num=x*2n，指数n存放在exp指向的变量中，返回x。D
开发一个类的流程 dcj3sjt126com 开发
本人近日根据自己的开发经验总结了一个类的开发流程。这个流程适用于单独开发的构件，并不适用于对一个项目中的系统对象开发。开发出的类可以存入私人类库，供以后复用。以下是开发流程： 1. 明确类的功能，抽象出类的大概结构 2. 初步设想类的接口 3. 类名设计（驼峰式命名） 4. 属性设置(权限设置) 判断某些变量是否有必要作为成员属
java 并发 shuizhaosi888 java 并发
能够写出高伸缩性的并发是一门艺术在JAVA SE5中新增了3个包 java.util.concurrent java.util.concurrent.atomic java.util.concurrent.locks 在java的内存模型中，类的实例字段、静态字段和构成数组的对象元素都会被多个线程所共享，局部变量与方法参数都是线程私有的，不会被共享。
Spring Security（11）——匿名认证 234390216 Spring Security ROLE_ANNOYMOUS 匿名
匿名认证目录 1.1 配置 1.2 AuthenticationTrustResolver 对于匿名访问的用户，Spring Security支持为其建立一个匿名的AnonymousAuthenticat
NODEJS项目实践0.2[ express,ajax通信...] 逐行分析JS源代码 Ajax nodejs express
一、前言通过上节学习，我们已经 ubuntu系统搭建了一个可以访问的nodejs系统，并做了nginx转发。本节原要做web端服务及 mongodb的存取，但写着写着，web端就
在Struts2 的Action中怎样获取表单提交上来的多个checkbox的值 lhbthanks java html struts checkbox
第一种方法：获取结果String类型在 Action 中获得的是一个 String 型数据，每一个被选中的 checkbox 的 value 被拼接在一起，每个值之间以逗号隔开(,)。所以在 Action 中定义一个跟 checkbox 的 name 同名的属性来接收这些被选中的 checkbox 的 value 即可。以下是实现的代码：前台 HTML 代码：
003.Kafka基本概念 nweiren hadoop kafka
Kafka基本概念：Topic、Partition、Message、Producer、Broker、Consumer。 Topic：消息源（Message）的分类。 Partition： Topic物理上的分组，一
Linux环境下安装JDK roadrunners jdk linux
1、准备工作创建JDK的安装目录： mkdir -p /usr/java/ 下载JDK，找到适合自己系统的JDK版本进行下载： http://www.oracle.com/technetwork/java/javase/downloads/index.html 把JDK安装包下载到/usr/java/目录，然后进行解压： tar -zxvf jre-7
Linux忘记root密码的解决思路 tomcat_oracle linux
1：使用同版本的linux启动系统，chroot到忘记密码的根分区passwd改密码　　2：grub启动菜单中加入init=/bin/bash进入系统，不过这时挂载的是只读分区。根据系统的分区情况进一步判断. 　　3: grub启动菜单中加入 single以单用户进入系统. 　　4:用以上方法mount到根分区把/etc/passwd中的root密码去除　　例如: 　　ro
跨浏览器 HTML5 postMessage 方法以及 message 事件模拟实现 xueyou jsonp jquery 框架 UI html5
postMessage 是 HTML5 新方法，它可以实现跨域窗口之间通讯。到目前为止，只有 IE8+, Firefox 3, Opera 9, Chrome 3和 Safari 4 支持，而本篇文章主要讲述 postMessage 方法与 message 事件跨浏览器实现。postMessage 方法 JSONP 技术不一样，前者是前端擅长跨域文档数据即时通讯，后者擅长针对跨域服务端数据通讯，p