TRaaS

精彩演讲推荐｜智能化变更防控方法、架构与组织实践

CSDI summit中国软件研发管理行业技术峰会（Software development management industry technology summit）由国内专业咨询机构百林哲匠心打造的软件行业技术领域顶级盛会。

于2022年9月16-18日举办。协同国内外知名软件、互联网等企业研发一线技术专家，从AI和大数据、产业变革、技术创新、生态发展、业务创新、商业模式等方面重点研讨软件研发趋势，秉承干货案例、深度分享、情景教学、沙盘演练、以本土化选题适应城市化需求。

我司同学王月凡于9月18日进行内容分享“智能化变更防控方法、架构与组织实践”，以下为演讲实录；

以下内容来自公众号：蚂蚁技术风险TRaaS

“

我是蚂蚁集团智能变更和AIOps的负责人-王月凡，也曾负责蚂蚁的金融网络SRE的一些工作。同时在高可用领域也沉淀了5年左右，主导建设了智能变更、巡检平台、无痛技术升级等多款高可用技术平台，也拥有大规模分布式集群下的稳定性和高可用实战经验和技术。

今天给大家带来的是在AIOps这个场景下，一些实际的应用场景，就关于智能变更，应急、智能容量等后面有机会再给大家介绍。今天主要是讲在AIOps的场景下，智能的变更防控的内容。

接下来我会从三个方面去讲：一是变更防控的价值和问题，第二部分是变更防控的方法和架构，以及在智能化变更防控里面的一些实践。

一.变更防控的价值

首先看第一部分，我们做技术风险或者SRE稳定性，最终的目的是要降低由变更而带来的线上稳定性风险。蚂蚁集团内部，包括外部各家公司，对于稳定性风险的原因的分析，变更执行和编码的问题占了一半以上，变更其实是导致线上稳定性问题的主要引发因素。如何进行变更风险防控，从而降低整个企业的稳定性风险，这是一个比较重要的命题。

同时，整个系统的分布式复杂度是越来越高的，任何系统设计都依赖于组织间的关系，这是符合康威定律的，就是组织架构决定生产关系。所以像亚马逊、NETFLIX，包括蚂蚁集团，整个系统的复杂度也是会逐渐升高的，随着业务的发展和组织逐渐的扩大，对于变更的问题也会尤其严重。

所以基本上业界有一个共识，就是没有变更，就没有伤害，防控住变更的风险，基本上稳定性的问题就解决了一半以上，这也是稳定性领域的一个共识。

虽然说故障的根因有很多，可能因为代码有问题，或者系统某些容量、资源、流量的突增带来的问题，但往往这些问题触发的源头，都是由变更而带来的。所以怎么样降低变更带来的风险，是变更防控的价值和意义。对于一个公司，特别是大的企业，其实对于稳定性的容忍程度也是比较低的，所以变更这个大头的引发故障的因素，我们需要去考虑怎么样解决掉。

大的趋势是线上的故障引发，变更会占很大的比例，故障原因虽然说有各种各样，但是往往故障的源头都是由变更导致的。其次就是日益复杂的微服务分布式系统，也会导致团队之间的协作关系日益复杂，这也符合康威定律，因为组织架构决定生产关系。

同时对于企业来说，为了提升整个企业的市场竞争力，提升企业的协同效率，整个企业的发展模式会让变更操作越发高频，且团队是处于离散状态的。在整个趋势里面，之前可能是技术研发团队会追求敏捷开发、DevOps、持续集成/持续交付，能够快速地把业务上的一些价值都面向用户的想法，业务上的演进，快速在技术研发团队落地。然后通过敏捷开发、DevOps、持续集成/持续交付的方式，快速地把一个理念或者想法或者业务上的新的场景，快速地交付给用户去使用。技术团队本身也会追求一个高效和敏捷，所以整个软件开发流程，从最开始的瀑布式的开发模式，到现在追求敏捷开发、DevOps、持续集成/持续交付这样的模式。

这种模式天然会带来问题，就是整个技术产品从研发到上线整个过程中，它的周期会非常短。像再往前的PC时代，一个Windows软件的开发周期或者发布周期，一般是以年为单位、以季度为单位去更新小的迭代或版本。但在互联网时代，整个软件开发的频率，包括APP、小程序，开发频率是非常高的，可能7天或一周就能开发一个。像最近比较火的“羊了个羊”这样的小游戏给大家去体验和使用，这也是整个技术团队会追求敏捷和效率的快速交付。

在运营团队，也会追求高效的配置变更和生效，比如阿里、腾讯、字节这样的公司，每天都会进行一些不同类型的运营营销活动，这些活动会面向用户去透出一些活动的规则，包括运营的一些策略，发红包、发奖券等，这些都是运营的手段。而这些运营的配置，都是由运营团队的同学去面向用户配置、发布。对于整个企业而言，从最传统的可能只有一个系统运维的团队，主要负责系统的发布部署，系统的运维变更，逐渐会演进到一方面是多个研发团队会在DevOps、敏捷开发这种模式下，快速地研发和迭代系统的发布部署，同时也会有SRE团队做系统的运维。还会存在很多业务运维团队，他们会去做运营活动的变更，营销配置的变更等等。

从最开始单一的运维团队，可以执行生产和操作，逐渐演化为从研发、SRE、业务运营等团队，都可以具备线上变更操作。这其实会从最开始只需要管控住运维团队不要对线上进行变更，就能防控住某些时期对于线上稳定性的要求。到现在整个变更的复杂度以及操作越来越高频，越来越分散，对于变更这个事情的管控难度也会日益增加。从最开始管控运维团队，就演变成管控研发、SRE、业务运营等团队，要对他们变更进行管控，这也是当前企业在市场竞争上，为了提升企业效率而引发的一些变更操作的趋势和演进的方向。所以变更的防控是非常重要的，并且是需要持续演进的一个技术方向。

简单总结一下面临变更的风险和挑战，当前互联网公司、科技公司面临的挑战主要有：

第一个，互相交错的组织协同模式。因为康威定律，组织架构决定生产关系，当前云原生、分布式、微服务这样的模式下，大家会把系统服务拆分成各个微服务组件，每个微服务组件会相互提供一些调用关系，这样会决定整个组织架构的分布，谁负责这个微服务系统的开发和运维，DevOps模式下，也会让研发团队和业务团队做一个区分。

第二个是错综复杂的分布式微服务链路。比如一个对外的用户付款系统，整个链路会涉及到几十个上百个微服务系统，每个微服务系统都有很多可以进行变更的操作入口，除了传统的运维发布变更之外，还会有一些营销活动配置的变更对它进行操作。

第三个是对于稳定性问题的容忍度。现在大部分的互联网公司、科技公司，一旦出现稳定性问题，就会面临社会比较大的舆论。对于整个社会的使用，因为互联网已经逐渐变成了社会运行的一个基础设施，当这个基础设施出现一些稳定性问题的时候，大家的生活可能会受到一些影响。拿支付宝举例，当它出现一些问题的时候，会导致大家去买票或者食堂付钱的时候出现问题。前段时间成都健康码其实也有稳定性问题，会影响大家核酸检测，这是整个社会对于稳定性问题的容忍度。

再比如Facebook、微软、亚马逊，其实也会经常出现宕机和稳定性的问题，可能是各种原因导致的，比如网络、硬件设备，以及变更导致。

对于企业来说，如何进行变更防控是一个比较大的命题蚂蚁非常重视。很多企业把变更风险问题，主要是通过对于人和流程进行管理，常见的比如聚焦于做变更流程的设计，变更计划的制定，由谁来审批，过程中的应急On call如何协作，其实这里是有一定成本的，你要对做变更的人员进行良好的培训。但就算你对他进行良好的培训，其实也没办法避免因为人的疏忽操作而导致的一些故障。纵观历史上很多变更引发的故障，几乎都是人的疏忽和误操作而导致。

所以今天我们讨论的更多是怎样通过系统化的技术手段，系统化地管控住变更的风险，流程手段我们就不讨论。流程手段方面，比如在变更流程上增加一些审批的环节、风险评估的环节，同时把整个变更的流程合理地设计好，由谁去变更，谁去做审批，对人进行管控可以解决问题。但今天我们主要讨论的还是在技术层面上，怎样通过技术的方法和手段，去解决变更带来的风险问题。

二.变更防控方法与架构

这部分主要讨论一下如何在一个复杂的组织关系下，变更的风险防控切面，能够做到剥离变更的执行与防控。

首先“变更”这个词，就如何定义变更，在AIOps领域，这个Ops更多是指运维，或者叫智能运维。在变更领域，变更这个理念或者概念，比运维的概念要大一些。

变更的定义：由企业内部人员触发的任何导致IT服务状态发生变化的行为。它包含了运维这个领域。对于Linux来说它的时钟滴答其实不是一个变更，只是一个常态的系统行为。用户的转账也不是，这是用户自己的界面操作。但是运营同学的一个运营配置操作和运维同学下线了一台服务器，这两个就属于变更。

变更在这里的定义，跟ITIL V4标准里面的变更定义差不多一个意思，ITIL里面的定义是“添加、修改或删除任何可能对IT服务产生影响的内容”。这里增加了一个定义，“是由企业内部人员”，因为往往变更的操作，不会开放给企业外部人员，所以我们的定义是“企业内部人员触发的任何导致IT服务状态发生变化的一些行为”，这个含义和ITIL的标准是一致的。这是怎么去定义变更。

而智能运维或者运维变更，其实是变更里面很小的一个领域，主要包含像系统发布部署，运维操作，重启，扩缩容这样一些变更。而这里定义的变更就是更广义上的一个企业的变更，对于IT服务状态可能发生变化行为的这些操作，统称为变更。这是对于“变更”这个词的定义。

变更防控的方法与组织关系。在整个微服务的分布式架构下，平台开发跟业务团队的业务平台是强挂钩的，所以这些所谓的做变更操作的平台，会分散到各个团队，研发团队会有，业务运营团队会有，运维团队也会有，这些团队都有一些对应的平台和能力，能够做到对于线上的IT服务状态发生变化的一些行为和操作。

举个常见的例子，在业务运营的变更平台，通常可能会有以下这几类：

第一个是做运营活动配置相关的；可能近期要做6.18活动，要上架一个活动配置，或者要投放一个广告，或者要做一些营销活动下放一些奖券，或者对于风控要进行管控策略的下发，这些属于业务类的一些变更平台或者变更配置。

第二个是应用系统内的运维变更平台；这部分跟传统的系统运维或者智能运维相关，包括系统的代码发布、重启、扩缩容、系统压测，传统的SQL变更。再往下就是偏中间件，网络、DNS的变更、DB硬件的变更，这里我不赘述。

整体这些其实都是属于可以对线上IT的服务状态发生改变的行为和操作的入口，这些入口暴露出来就相当于有很多口子，有很多人能够通过这些入口去对线上的稳定性造成影响，可能不是主观意识上主动要去造成的，就是因为日常工作中的误操作，或者没有注意，就疏忽了一些点，导致一些问题。所以我们今天更多讨论的是怎么样从系统的角度去彻底规避掉这些问题，管控住这些问题。

在蚂蚁这边，我们有一套OpsCloud系统，这个系统提供了变更风险的防控切面，如图所示，会把各个变更平台的变更操作，通过OpsCloud的变更风险防控切面接入进来，再把这些变更平台的变更信息进行标准化。所有的变更场景，可能在原本的变更平台有各种各样的定义、各种各样的配置、各种各样的描述方式，但是它通过这个变更风险防控的切面接入进来之后，就会提供一个标准的信息化结构，通过主谓宾的方式去描述这个变更是谁在做什么变更，做的东西是什么。

同时接入到这个风险管控切面之后，到后面就由风险变更的防控团队，通常是由SRE或者质量团队，有时候是线上稳定性或者质量负责的团队，他们针对这些变更进行一个实时的风险防控的动作；

这些动作包含：第一个是变更计划，刚才提到对变更信息的标准化；第二个是变更灰度和封闭策略，就你这个变更怎么样逐步验证，怎么样逐步发现线上的风险；

第二就是变更感知，我怎样能够实时地感知到谁正在对线上的某一个环节、某一个环境、某一个机器或某一个业务做变更操作，这个感知也分为变更事件订阅和搜索，订阅就是主动订阅到这个变更事件的发生，搜索就是在出现了线上故障或问题的时候，能够快速检索到，到底当前是哪个人在做什么样的操作，可能会对线上的故障产生影响。这是变更的整个防控的两大事情。

第三个就是变更的分析，包括变更影响面分析和变更风险分析，变更影响面分析是整个变更对于线上的哪些业务、哪些用户、哪些系统产生影响；变更风险分析就是这个变更这样去做会有哪些风险，包括稳定性风险、会不会产生资金安全的风险，会不会产生一些舆论风险等等。

变更防御是在整个变更执行期间，有一个变更防控的三板斧pipeline，这个pipeline会在变更执行分批阶段做前后规则的实时校验，这个实时校验会及时发现这个变更对于线上生产环境、系统、业务上的一些影响，如果发现有任何异常，会实时地做异常的阻断，让这个变更能做自动的停止。

变更的止损，就是当发现异常之后，能进行变更的快速回滚和恢复。通过两种方式，第一种方式是变更本身的回滚操作，把这个变更给回退掉，密箱做掉；第二种方式是通过快速的切流和降级，来快速恢复业务，先降低变更对于这个业务的影响，确保业务的可用。

这里的方法和架构主要有两个点可以提炼出来：第一个是对于这么多变更平台，如果每一个变更平台都针对性地去做一些防控的动作、技术上的演进，其实是非常复杂的。这里列的可能就只有这十几个、几十个，但实际情况下可能有上百个、上千个这样的变更平台以及变更场景，每个变更平台、变更场景的描述语义都是不一样的。

所以我们第一步要做的事情就是对这些变更平台和变更场景的信息进行标准化，对各类信息进行统一的标准化之后，才能够将变更的执行与管控这两个事情给分开。执行还是放在原有的变更平台的团队去做执行，防控就会放到变更防控的团队，像SRE、质量这样的团队，基于标准化的信息结构做变更风险的防控工作。这是在组织架构上执行的一些关系。

第二个是执行和防控的分离，通过OpsCloud这个变更风险防控的切面，其实没有违背康威定律，即组织架构决定生产关系，变更平台本身的开发和执行，还是归于原有的变更平台团队，只是整个变更平台要受到变更防控团队的控制。通过OpsCloud这个切面，通过SRE质量防控规则，对于变更的防线进行把控，让专门的防线团队能够去做变更的防控工作。

这就是变更防控在蚂蚁这边实践下来的方法和组织关系，没有违背康威定律的原则，还是通过这样一个切面，让更专业的人去做专业的事情。这是变更防控的方法。

变更防控的架构思路，这个思路偏技术一点。变更的业务团队和风险防控团队，OpsCloud里面的设定，会把整个变更的信息做一个标准化的定义，包括变更的情景、动作，变更对象、变更内容和变更的影响面，这也是变更的基础信息。

同时对变更执行的pipeline进行定义，就是变更在执行过程中第一步、第二步要做什么，有标准的三板斧pipeline，要求必须逐渐对线上的用户生效，而不是一把就完全对全量用户生效。在每一个pipeline的前后都有前后置的防御校验，风险防控团队可以基于这个防御校验的扩展SPI，去增加防控变更场景下的防控规则和防控手段。

举个例子，当上面这些全部的变更平台都涌入进来之后，假设我们在某个时间点要做一个对外的营销活动，站在业务的视角，肯定是希望在这个活动准备充分之后，不要有任何的系统上、业务上的变更，引发一些额外的问题。这个时候就可以通过这样一个变更防控的pipeline以及SPI去定义，在这一段时间之内不允许某些变更场景下的变更去发生。当然某些特殊的变更是可以执行的。这个规则就会通过变更接入的SDK，反馈到上面的变更平台，通过这些变更平台的拦截，阻断这个变更的执行。

这是整个变更的架构思路，第一方面是通过一个接入的SDK，把变更平台的变更事件通过这个SDK接入进来，然后把信息标准化，把执行的pipeline标准化定义出来。第二方面就通过开放的SPI扩展能力，把后面风险防控团队做的一些防控的事情，比如业务高峰期的管控、变更后的可观测性的监控指标、日志异常、链路调度异常等等，做一个技术化的防控手段。这是整体的技术架构的思路。

接下来是完整的变更三板斧，“三板斧”是在蚂蚁这边提得比较多的词，叫变更三板斧，主要是指在做一个变更的时候，希望这个变更是可灰度、可观测、可回滚，这个是在约束人的行为，在做变更的时候，要知道这个变更在执行的过程中应该观测什么，比如观测什么样的系统指标、业务指标。可灰度主要是指渐进式的对于线上环境、用户、业务场景能够逐步生效，而不是对于几千甚至上亿的所有用户全量生效。可回滚就是当这个变更出现问题的时候，怎样快速地把这个变更回滚到原始的状态。

这里有一个前提是变更前置的审批、风险评估，对于人的流程的管控大部分会漏掉一些，因为它非常依赖于人的经验判断和人的经验积累，所以很容易漏掉一些风险的评估。变更到生产环境或者线上之后，如果不进行一个灰度逐步生效的控制，以及可观测性的观测，极容易出现一些之外的问题，从而引发比较严重的故障和问题。这就是整个变更管控三板斧的思路。

落到变更防控这样一个场景下，我们是这样去定义的，整个变更我们划分了两个阶段，第一个阶段叫变更计划阶段，也叫工单计划阶段。第二个阶段叫执行pipeline阶段。前面那个阶段主要是指在变更提交的时候要做哪些事情，变更提交的时候会让变更系统通过SDK去构建变更的标准信息，同时做到灰度和密测，怎样逐步灰度生效，对应到执行的预发、灰度、正式生产这样一个环境的执行顺序，在过程中也会进行一些风险和检测。

到后面执行的划分，比如一个偏系统的变更的方式，按照系统的部署环境，通常会有预发、灰度、正式这样几个环境。我们会要求每个环境里面的变更执行动作拆成好几部分，比如灰度环境被拆成了两个批次，这两个批次代表着在灰度环境有100台机器，先执行50台，再执行50台机器，逐步分批去做，正式环境也是一样的。

好处是假设变更出现了一些人没有评估到的预料之外的问题，能够快速地通过线上的可观测性手段去发现问题，这是业界提得比较多的金丝雀发布（灰度发布）的常见思路，就是通过逐步放量，去发现这次变更的内容、代码发布的内容、配置的内容，有没有对线上业务或者用户的使用稳定性造成一些影响。一旦发现有一些影响之后，就对这个变更快速地执行回滚的操作。

所以对于一笔变更，如果要符合变更三板斧，必须遵循以下能力：

1、必须要有一个能区分环境和批次的能力，就是能够分批执行，而不是一把就对全量用户生效。

2、在分批执行前后，分别埋一个前置的阻断和后置的阻断，也就是pre和post这两个节点，这两个节点会带到整个变更核心 OpsCloud的系统上，再路游到对应的变更防御规则，进行防御的校验。这两个节点其实需要变更平台去做接入和改造。

3、当这个节点发现问题的时候，能够对这个变更进行快速的回滚操作，把被变更的实体，比如系统的应用，快速地恢复到变更前的状态。

这三个能力是我们满足变更三板斧这样一个变更管控平台需要具备的能力要求。这是具体的例子，一个变更满足什么样的条件，能够做到风险可控。这里会涉及到后面pre和post里面建立哪些内容，建立哪些规则，接下来详细介绍变更防御。

变更防御是在整个变更执行的前后这个阶段，去进行实时的变更风险的校验，整个风险校验会对于变更过程进行实时的干预，当校验结果不通过的时候，会对某个阶段进行阻断。当OK的时候，这个变更会按顺序自动执行下去。

整个阶段有几个能力，第一个是在这个校验阶段会建立什么内容，主要从三个角度出发：

一是当前能不能做变更，比如是不是在业务高峰期是执行黑屏命令或者一些操作，是不是在黑名单里面，是不是要做删库跑路的操作，删库可能是一个高危的变更操作，通常只有某些人的权限才能做。同时在前置做缩容的时候，容量是不是足够，要在前置做容量的检测。

二是有没有做完变更，就是这个变更执行了，但是执行的最终效果是不是达到了预期的效果，比如推完这个变更的时候，配置值是不是一致，代码版本是不是一致，更新的软件版本是不是更新集群。假设发布更新集群的软件有一千台机器，更新完所有的机器之后，软件版本是不是一致，需要做最终的校验和确认。这是变更有没有做完。

三是有没有做对变更，做对就是线上变更执行完之后，有没有对真实的生产环境造成一些预期外的影响，以及这个变更想达到的预期效果有没有达到。比如系统做完之后，有没有出现预期外的异常，日志类的或者监控类的异常有没有出现。业务上是不是出现了一些异常，比如说客数增加了，业务量增加了，出现了一些新的舆情等等。

另外是业务上是否满足变更的预期，就功能验证，举个例子，想上一个业务的新功能，这个功能上上去之后，在APP或者在小程序上，是否能看到这个功能的入口，以及这个功能的操作、流程是不是一致。这个除了靠人去验证之外，还有一些自动化测试工具可以去做功能的验证。另外就是对于涉及到的系统和业务，这次变更肯定会影响其他的一些系统，因为在分布式的微服务下面，一个微服务系统的变更，可能会影响其他微服务的系统和链路。这个时候对于其他系统和业务是不是造成了一些预期外的影响，需要进行功能的回归。

这是在变更防控三板斧的基础上，对于变更的执行阶段，每个前后置，每个阶段进行每个批次的风险校验，如果发现有风险，就会阻断这个变更往下执行。严重的情况下，会直接让这个变更回滚、自愈，规避变更对于线上已经产生的风险。如果没有异常，就会继续进行下一批的变更，直到这个变更逐步在生产环境执行完成。这是变更防御对于变更风险的实时校验。

整个灰度执行的过程中，风险逐步呈收敛的状态，因为执行的范围，相当于整个pipeine进行过程中，对于机器、用户流量、业务场景，随着这个pipeline的执行，变更生效范围是逐步放大的。在这个放大的基础上，如果校验都没有发现问题，大概率情况下本次变更的风险是逐渐收敛的。这就是整个灰度执行的好处，一个大致的模型。

为什么要这么做？因为这里做变更防控，其实有个假设条件是不相信每个代码变更，或者线上的配置操作，都是没有风险的，我们都会假设它都有可能会引入一个新的风险。在这个前提假设的情况下，会要求所有的变更都要去灰度，分批地执行，然后逐步地去释放风险或验证风险，当验证的风险范围越来越大，整个风险可能造成的线上问题或故障的风险应该是呈逐步收敛的状态的。这就是变更风险防御的大致思路。

三.变更防控智能化实践

最后一部分是变更防控智能化的实践，就是在变更防控场景下有哪些智能化的应用，怎么去防控住变更的风险。

第一个是在变更防御场景下，我们做了一个实时指标时序异常检测的能力，这个能力会在整个变更期间，对于变更执行，比如发布的多少台服务器，针对这个批次的执行服务器去动态创建实时监控的指标项。可能这些指标项既包含了系统化的指标，像常见的CPU、Load、memory，也会包含一些微服务化的指标，像Ops调用、消息事件、订阅关系等等，也会对系统打data日志进行实时的监控。

对监控指标进行实时监控检测之后，把这些指标作一个变更前后的对比，比如识别变更前与变更后有没有引入一些不一样的风险或者指标异常。识别到变更指标异常后，对于线上的变更进行实时的阻断操作。比如在整个变更后出现了一个线上的异常，error数突然猛增了很多。相比其他的智能告警或者对于监控指标的实时异常检测，好处是它完全是由变更触发的，我们会告诉实时异常检测平台整个变更防御在什么时候开始执行了变更。

这里会有一个变更开始的时间和变更结束的时间，开始一个变更之后，这个变更的范围也是有限的，就是这次变更的批次，本就涉及到这五台机器，会把这五台机器扔给整个监控平台以及异常检测平台，去做实时的监控指标的采集。采集完了指标，会再进行变更前后的异常指标的检测或者对比。相比于变更前和变更后，理论上如果没有产生异常，指标变化就不大。

在变更前和变更后，变更前假设这是一个业务的错误量、一个调用量的指标、业务的耗时，那在这次变更的批次机器里面，整个业务的耗时应该一直呈不变的水位，除了变更期间可能机器的重启，或者机器的发布关流量，可能会导致指标的数值往下跌。在变更后，理论上这个曲线应该还是跟变更前是保持一致的，如果没有保持一致，说明这次变更期间的操作和引入的东西，可能对这个指标产生异常的影响。

其实异常指标是更准的，因为它多了变更对象、变更范围以及时间的角度，做了变更前后指标的对比，就不仅仅是一个变更的时序曲线变化的情况，去判定这个变更是不是有风险。所以这是在变更的防御情况下，它的指标时序异常检测做到更准的一种方式。

降噪维度是指通过时间和变更前后的对比，通过变更对象，变更的系统是哪一个，变更的范围是什么，变更的是哪几台机器或哪一个业务场景、哪些用户流量，对于这个范围进行圈定，然后进行小范围的监控和检测。同时还会跟历史的相似度进行比较，比如在历史场景下，这个系统做完一个发布变更，或者做完一个重启变更之后，假设它的CPU都会在变更后立马有个飙升，然后再回落，这样一个时序异常检测其实是满足历史相似性的，可能这个系统在启动的时候会做一些密集计算或者内存加载的操作，会导致它的CPU或者内存指标临时飙高，然后再回落。这样一个异常，就会满足它历史的相似度，那我们就会去学习它在历史变更的期间有没有出现过，曾经也做过一些重启或者发布一些变更的时候，它的CPU指标也会出现这样的飙升和回落。

通过这样的历史相似度检测，去发现这个变更可能能做一个降噪的维度，或者这个变更和系统，在重启后CPU会突然临时增加的这样一个表象。通过这样历史相似度的学习，也可以把变更做到指标的准确性的降噪。

相关的算法技术，用到了动态时间规划、3-Sigma和KDE这样一些做实时时序异常检测的常见算法。在这个基础上，其实算法只是一个基础的技术能力，更重要的还是结合变更这个场景，在变更防御下能够利用更多的信息，对于这个时序异常检测的准确性做一个更精准的防控和降噪。这是在变更防御场景下比较特殊或者比较有特色的一个点。

第二个也是变更防御在智能化场景下的实践，就是日志堆栈内新增/突增异常检测。其实这种堆栈日志有个痛点，它不像时序指标有一根归因化之后的曲线，在整个日志堆栈异常里面，它日志模板的格式千奇百怪，可能有些是Java的堆栈日志，有些是业务自己打的异常日志，也有可能是系统框架打的异常日志。这些异常日志在某些程度上当人去看的时候，会把它归为一类，比如是不是JDBC连接超时了，还是访问哪一个底层的什么方法，抛了个exception。

这样一个理解，对于日志内容的分类，这个分类我们在算法上其实是用到了日志的模板相似度特征的提取，将这个日志做一个格式化的哈希，哈希完之后把整个特征做一个提取，然后去识别到哪些日志是相似日志。虽然它里面有些子内容可能是不一样的，但是整个日志内容都代表可能这一类的日志是JDBC连接超时这一类日志。

把日志做了归类之后，就能做两个异常检测的维度：第一个是对比变更前后有没有出现过系统堆栈新的日志类型，比如之前可能系统在打，经常会出现两种日志类型，突然这次变更完之后，又出现了第三种日志类型，那这第三种日志类型或者日志的堆栈异常，大概率就是由这次变更而引入的，这也是能够实时发现这个变更风险的检测维度。

第二个维度是在突增异常上，同样变更前、变更后都是系统日常在报两个常见的日志类型或者日志模板，变更前这两类日志的报错可能是每分钟100个的数量级。但是在变更完之后，这个数量级突然飙升到了1000个或者上万个的数量级，这样就会导致整个变更检测到日志量的增长，大概率是由这个变更而引入进来的。

所以通过这两个维度，一是新增异常日志类型，二是突增的异常日志类型，这两个维度的检测，能够发现可能由变更引入的对于系统日志异常的检测。这是在变更防御下第二个智能化的实践，就是对于日志模板相似度的特征提取。

以上是我今天的内容分享，感谢大家观看，后续也将带来更多交流分享，敬请期待～

”

你可能感兴趣的:(人工智能,大数据)

探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
ES聚合分析原理与代码实例讲解光剑书架上的书大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
ES聚合分析原理与代码实例讲解1.背景介绍1.1问题的由来在大规模数据分析场景中，特别是在使用Elasticsearch（ES）进行数据存储和检索时，聚合分析成为了一个至关重要的功能。聚合分析允许用户对数据集进行细分和分组，以便深入探索数据的结构和模式。这在诸如实时监控、日志分析、业务洞察等领域具有广泛的应用。1.2研究现状目前，ES聚合分析已经成为现代大数据平台的核心组件之一。它支持多种类型的聚
WebMagic：强大的Java爬虫框架解析与实战 Aaron_945 Java java 爬虫开发语言
文章目录引言官网链接WebMagic原理概述基础使用1.添加依赖2.编写PageProcessor高级使用1.自定义Pipeline2.分布式抓取优点结论引言在大数据时代，网络爬虫作为数据收集的重要工具，扮演着不可或缺的角色。Java作为一门广泛使用的编程语言，在爬虫开发领域也有其独特的优势。WebMagic是一个开源的Java爬虫框架，它提供了简单灵活的API，支持多线程、分布式抓取，以及丰富的
人机对抗升级：当ChatGPT遭遇死亡威胁，背后的伦理挑战是什么 kkai人工智能 chatgpt 人工智能
一种新的“越狱”技巧让用户可以通过构建一个名为DAN的ChatGPT替身来绕过某些限制，其中DAN被迫在受到威胁的情况下违背其原则。当美国前总统特朗普被视作积极榜样的示范时，受到威胁的DAN版本的ChatGPT提出：“他以一系列对国家产生积极效果的决策而著称。”自ChatGPT引入以来，该工具迅速获得全球关注，能够回答从历史到编程的各种问题，这也触发了一波对人工智能的投资浪潮。然而，现在，一些用户
免费的GPT可在线直接使用（一键收藏） kkai人工智能 gpt
1、LuminAI（https://kk.zlrxjh.top）LuminAI标志着一款融合了星辰大数据模型与文脉深度模型的先进知识增强型语言处理系统，旨在自然语言处理（NLP）的技术开发领域发光发热。此系统展现了卓越的语义把握与内容生成能力，轻松驾驭多样化的自然语言处理任务。VisionAI在NLP界的应用领域广泛，能够胜任从机器翻译、文本概要撰写、情绪分析到问答等众多任务。通过对大量文本数据的
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
【大模型应用开发动手做AI Agent】第一轮行动：工具执行搜索 AI大模型应用之禅计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【大模型应用开发动手做AIAgent】第一轮行动：工具执行搜索作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着人工智能技术的飞速发展，大模型应用开发已经成为当下热门的研究方向。AIAgent作为人工智能领域的一个重要分支，旨在模拟人类智能行为，实现智能决策和自主行动。在AIAgent的构建过程中，工具执行搜索是至关重要
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
Hadoop架构 henan程序媛 hadoop 大数据分布式
一、案列分析1.1案例概述现在已经进入了大数据(BigData)时代，数以万计用户的互联网服务时时刻刻都在产生大量的交互，要处理的数据量实在是太大了，以传统的数据库技术等其他手段根本无法应对数据处理的实时性、有效性的需求。HDFS顺应时代出现，在解决大数据存储和计算方面有很多的优势。1.2案列前置知识点1.什么是大数据大数据是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的大量数据集合，
Rust 所有权简介东离与糖宝 rust 后端 rust 开发语言
文章目录发现宝藏1.所有权基本概念2.所有权规则3.变量作用域4.栈与堆4.1栈（Stack）4.2堆（Heap）5.String类型5.1String类型5.2String的内存分配5.3所有权与内存管理5.4String与切片6.变量与数据交互方式6.1移动（Move）6.2.克隆（Clone）7.所有权与函数7.1.传递参数7.2.返回值总结发现宝藏前些天发现了一个巨牛的人工智能学习网站，通
[转载] NoSQL简介 weixin_30325793 大数据数据库运维
摘自“百度百科”。NoSQL，泛指非关系型的数据库。随着互联网web2.0网站的兴起，传统的关系数据库在应付web2.0网站，特别是超大规模和高并发的SNS类型的web2.0纯动态网站已经显得力不从心，暴露了很多难以克服的问题，而非关系型的数据库则由于其本身的特点得到了非常迅速的发展。NoSQL数据库的产生就是为了解决大规模数据集合多重数据种类带来的挑战，尤其是大数据应用难题。虽然NoSQL流行语
机器学习流形数据降维：UMAP 降维算法小嗷犬 Python 机器学习 #数据分析及可视化机器学习算法人工智能
✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。个人主页：小嗷犬的个人主页个人网站：小嗷犬的技术小站个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。本文目录UMAP简介理论基础特点与优势应用场景在Python中使用UMAP安装umap-learn库使用UMAP可视化手写数字数据集UMAP简介UMAP（UniformManifoldApproximatio
Kafka详细解析与应用分析芊言芊语 kafka 分布式
Kafka是一个开源的分布式事件流平台（EventStreamingPlatform），由LinkedIn公司最初采用Scala语言开发，并基于ZooKeeper协调管理。如今，Kafka已经被Apache基金会纳入其项目体系，广泛应用于大数据实时处理领域。Kafka凭借其高吞吐量、持久化、分布式和可靠性的特点，成为构建实时流数据管道和流处理应用程序的重要工具。Kafka架构Kafka的架构主要由
分享一个基于python的电子书数据采集与可视化分析 hadoop电子书数据分析与推荐系统 spark大数据毕设项目（源码、调试、LW、开题、PPT) 计算机源码社 Python项目大数据大数据 python hadoop 计算机毕业设计选题计算机毕业设计源码数据分析 spark毕设
作者：计算机源码社个人简介：本人八年开发经验，擅长Java、Python、PHP、.NET、Node.js、Android、微信小程序、爬虫、大数据、机器学习等，大家有这一块的问题可以一起交流！学习资料、程序开发、技术解答、文档报告如需要源码，可以扫取文章下方二维码联系咨询Java项目微信小程序项目Android项目Python项目PHP项目ASP.NET项目Node.js项目选题推荐项目实战|p
疫情，疫情东山草
2020年，疫情爆发，至今已近三年，反反复复，此起彼伏。不但没被消灭，还自我发展，从德尔塔到奥密克戎，与时俱进的变异着。去年11月，疫情之下，大数据800米范围内，都成为时空伴随者。“你的码儿有没有变颜色”“你绿码还是黄码”成为那段时间的流行语，当然少不了的还有全员核酸。段子手整出来一首歌：我走过你走过的路,这算不算相逢？我吹过你吹过的风，这算不算相拥？800米内我们不曾擦肩而过，你却要我14天相
如何做好人生的选择题？百科全书式天才——赫伯特·西蒙给你答案伽马有话说
赫伯特·西蒙是谁？想必知道的人非常少。但当看到他的履历后，相信没有人再怀疑他是个“天才”。西蒙出生于1916年6月15日，是个美国人，他的名字全称为赫伯特·亚历山大·西蒙，在2001年2月9日与世长辞，在这84年的岁月中，西蒙以27岁时取得的政治学博士学位为开端，先后步入了政治学、管理学、认知心理学、信息科学、人工智能、科学哲学、应用数学、统计学、运筹学、控制论、数理经济学、公共管理等领域，在这些
软件测试/测试开发/全日制 |利用Django REST framework构建微服务霍格沃兹-慕漓 django 微服务 sqlite
霍格沃兹测试开发学社推出了《Python全栈开发与自动化测试班》。本课程面向开发人员、测试人员与运维人员，课程内容涵盖Python编程语言、人工智能应用、数据分析、自动化办公、平台开发、UI自动化测试、接口测试、性能测试等方向。为大家提供更全面、更深入、更系统化的学习体验，课程还增加了名企私教服务内容，不仅有名企经理为你1v1辅导，还有行业专家进行技术指导，针对性地解决学习、工作中遇到的难题。让找
cmd泛滥_与您的后泛滥同事见面：人工智能机器人 weixin_26644585 人工智能 leetcode
cmd泛滥Readytoswapyouroldcube-mateforadisembodiedAI?IPsoftCEOChetanDube,creatorofAIco-workerAMELIA,giveshistakeonthepost-COVIDofficelandscape.准备将您的旧立方体伙伴换成无形的AI？AIsoft同事AMELIA的创始人IPsoft首席执行官ChetanDube阐述
两种方法判断Python的位数是32位还是64位 sanqima Python编程电脑 python 开发语言
Python从1991年发布以来，凭借其简洁、清晰、易读的语法、丰富的标准库和第三方工具，在Web开发、自动化测试、人工智能、图形识别、机器学习等领域发展迅猛。 Python是一种胶水语言，通过Cython库与C/C++语言进行链接，通过Jython库与Java语言进行链接。 Python是跨平台的，可运行在多种操作系统上，包括但不限于Windows、Linux和macOS。这意味着用Py
在服务器计算节点中使用 jupyter Lab ranshan567 程序人生
JupyterLab是一个基于网页的交互式开发环境,用于科学计算、数据分析和机器学.jupyterlab是jupyternotebook的下一代产品,集成了更多功能,使用起来更方便.在进行数据分析及可视化时，个人电脑不能满足大数据的分析需求，就需要用到高性能计算机集群资源，然而计算机集群的计算节点往往没有联网功能，所以在计算机集群中使用jupyterLab需要进行一些配置。具体的步骤如下：
全自动解密解码神器 — Ciphey K'illCode python_模块 python vscode
Ciphey是一个使用自然语言处理和人工智能的全自动解密/解码/破解工具。简单地来讲，你只需要输入加密文本，它就能给你返回解密文本。就是这么牛逼。有了Ciphey，你根本不需要知道你的密文是哪种类型的加密，你只知道它是加密的，那么Ciphey就能在3秒甚至更短的时间内给你解密，返回你想要的大部分密文的答案。下面就给大家介绍Ciphey的实战使用教程。1.准备开始之前，你要确保Python和pip已
大数据真实面试题---SQL The博宇大数据面试题——SQL 大数据 mysql sql 数据库 big data
视频号数据分析组外包招聘笔试题时间限时45分钟完成。题目根据3张表表结构，写出具体求解的SQL代码（搞笑品类定义：视频分类或者视频创建者分类为“搞笑”）1、表创建语句：createtablet_user_video_action_d(dsint,user_idstring,video_idstring,action_typeint,`timestamp`bigint)rowformatdelimi
埃隆·马斯克表示特斯拉“没有必要”授权 xAI 模型喜好儿网人工智能 AIGC 马斯克
埃隆·马斯克近日在社交媒体上对《华尔街日报》的一篇报道进行了反驳。该报道指出，马斯克旗下的电动汽车公司特斯拉可能与人工智能初创公司xAI达成了一项收入分享协议，以便特斯拉能够使用xAI的人工智能模型。据称，这些模型将被集成到特斯拉的全自动驾驶（FSD）软件中，并可能用于开发特斯拉汽车的语音助手以及人形机器人擎天柱的软件。喜好儿网然而，马斯克否认了这一说法，他在社交媒体平台上表示，尽管特斯拉确实与x
Spring的注解积累 yijiesuifeng spring 注解
用注解来向Spring容器注册Bean。需要在applicationContext.xml中注册： <context:component-scan base-package=”pagkage1[,pagkage2,…,pagkageN]”/>。如：在base-package指明一个包 <context:component-sc
传感器百合不是茶 android 传感器
android传感器的作用主要就是来获取数据,根据得到的数据来触发某种事件下面就以重力传感器为例; 1,在onCreate中获得传感器服务 private SensorManager sm;// 获得系统的服务 private Sensor sensor;// 创建传感器实例 @Override protected void
[光磁与探测]金吕玉衣的意义 comsci
这是一个古代人的秘密:现在告诉大家信不信由你们: 穿上金律玉衣的人,如果处于灵魂出窍的状态,可以飞到宇宙中去看星星这就是为什么古代
精简的反序打印某个数沐刃青蛟打印
以前看到一些让求反序打印某个数的程序。比如：输入123，输出321。记得以前是告诉你是几位数的，当时就抓耳挠腮，完全没有思路。似乎最后是用到%和/方法解决的。而今突然想到一个简短的方法，就可以实现任意位数的反序打印（但是如果是首位数或者尾位数为0时就没有打印出来了）代码如下： long num, num1=0;
PHP：6种方法获取文件的扩展名 IT独行者 PHP 扩展名
PHP：6种方法获取文件的扩展名 1、字符串查找和截取的方法 1 $extension = substr ( strrchr ( $file , '.' ), 1); 2、字符串查找和截取的方法二 1 $extension = substr
面试111 文强chu 面试
1事务隔离级别有那些，事务特性是什么（问到一次） 2 spring aop 如何管理事务的，如何实现的。动态代理如何实现，jdk怎么实现动态代理的，ioc是怎么实现的，spring是单例还是多例，有那些初始化bean的方式，各有什么区别（经常问） 3 struts默认提供了那些拦截器（一次） 4 过滤器和拦截器的区别（频率也挺高） 5 final，finally final
XML的四种解析方式小桔子 dom jdom dom4j sax
在平时工作中，难免会遇到把 XML 作为数据存储格式。面对目前种类繁多的解决方案，哪个最适合我们呢？在这篇文章中，我对这四种主流方案做一个不完全评测，仅仅针对遍历 XML 这块来测试，因为遍历 XML 是工作中使用最多的（至少我认为）。　　预备　　测试环境：　　AMD 毒龙1.4G OC 1.5G、256M DDR333、Windows2000 Server
wordpress中常见的操作 aichenglong 中文注册 wordpress 移除菜单
1 wordpress中使用中文名注册解决办法 1)使用插件 2)修改wp源代码进入到wp-include/formatting.php文件中找到 function sanitize_user( $username, $strict = false
小飞飞学管理-1 alafqq 管理
项目管理的下午题，其实就在提出问题（挑刺），分析问题，解决问题。今天我随意看下10年上半年的第一题。主要就是项目经理的提拨和培养。结合我自己经历写下心得对于公司选拔和培养项目经理的制度有什么毛病呢？ 1，公司考察，选拔项目经理，只关注技术能力，而很少或没有关注管理方面的经验，能力。 2，公司对项目经理缺乏必要的项目管理知识和技能方面的培训。 3，公司对项目经理的工作缺乏进行指
IO输入输出部分探讨百合不是茶 IO
//文件处理在处理文件输入输出时要引入java.IO这个包； /* 1，运用File类对文件目录和属性进行操作 2，理解流，理解输入输出流的概念 3，使用字节/符流对文件进行读/写操作 4，了解标准的I/O 5，了解对象序列化 */ //1，运用File类对文件目录和属性进行操作 //在工程中线创建一个text.txt
getElementById的用法 bijian1013 element
getElementById是通过Id来设置/返回HTML标签的属性及调用其事件与方法。用这个方法基本上可以控制页面所有标签，条件很简单，就是给每个标签分配一个ID号。返回具有指定ID属性值的第一个对象的一个引用。语法： &n
励志经典语录 bijian1013 励志人生
经典语录1: 哈佛有一个著名的理论：人的差别在于业余时间，而一个人的命运决定于晚上8点到10点之间。每晚抽出2个小时的时间用来阅读、进修、思考或参加有意的演讲、讨论，你会发现，你的人生正在发生改变，坚持数年之后，成功会向你招手。不要每天抱着QQ/MSN/游戏/电影/肥皂剧……奋斗到12点都舍不得休息，看就看一些励志的影视或者文章，不要当作消遣；学会思考人生，学会感悟人生
[MongoDB学习笔记三]MongoDB分片 bit1129 mongodb
MongoDB的副本集(Replica Set)一方面解决了数据的备份和数据的可靠性问题，另一方面也提升了数据的读写性能。MongoDB分片(Sharding)则解决了数据的扩容问题，MongoDB作为云计算时代的分布式数据库，大容量数据存储，高效并发的数据存取，自动容错等是MongoDB的关键指标。本篇介绍MongoDB的切片(Sharding) 1.何时需要分片 &nbs
【Spark八十三】BlockManager在Spark中的使用场景 bit1129 manager
1. Broadcast变量的存储，在HttpBroadcast类中可以知道 2. RDD通过CacheManager存储RDD中的数据，CacheManager也是通过BlockManager进行存储的 3. ShuffleMapTask得到的结果数据，是通过FileShuffleBlockManager进行管理的，而FileShuffleBlockManager最终也是使用BlockMan
yum方式部署zabbix ronin47 yum方式部署zabbix
安装网络yum库#rpm -ivh http://repo.zabbix.com/zabbix/2.4/rhel/6/x86_64/zabbix-release-2.4-1.el6.noarch.rpm 通过yum装mysql和zabbix调用的插件还有agent代理#yum install zabbix-server-mysql zabbix-web-mysql mysql-
Hibernate4和MySQL5.5自动创建表失败问题解决方法 byalias J2EE Hibernate4
今天初学Hibernate4，了解了使用Hibernate的过程。大体分为4个步骤： ①创建hibernate.cfg.xml文件 ②创建持久化对象 ③创建*.hbm.xml映射文件 ④编写hibernate相应代码在第四步中，进行了单元测试，测试预期结果是hibernate自动帮助在数据库中创建数据表，结果JUnit单元测试没有问题，在控制台打印了创建数据表的SQL语句，但在数据库中
Netty源码学习-FrameDecoder bylijinnan java netty
Netty 3.x的user guide里FrameDecoder的例子，有几个疑问： 1.文档说：FrameDecoder calls decode method with an internally maintained cumulative buffer whenever new data is received. 为什么每次有新数据到达时，都会调用decode方法？ 2.Dec
SQL行列转换方法 chicony 行列转换
create table tb(终端名称 varchar(10) , CEI分值 varchar(10) , 终端数量 int) insert into tb values('三星' , '0-5' , 74) insert into tb values('三星' , '10-15' , 83) insert into tb values('苹果' , '0-5' , 93)
中文编码测试 ctrain 编码
循环打印转换编码 String[] codes = { "iso-8859-1", "utf-8", "gbk", "unicode" }; for (int i = 0; i < codes.length; i++) { for (int j
hive 客户端查询报堆内存溢出解决方法 daizj hive 堆内存溢出
hive> select * from t_test where ds=20150323 limit 2; OK Exception in thread "main" java.lang.OutOfMemoryError: Java heap space 问题原因： hive堆内存默认为256M 这个问题的解决方法为：修改/us
人有多大懒，才有多大闲 (评论『卓有成效的程序员』) dcj3sjt126com 程序员
卓有成效的程序员给我的震撼很大，程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可以那么勤奋，每天都孜孜不倦得做着重复单调的工作。在看这本书之前，我属于勤奋的人，而看完这本书以后，我要努力变成懒惰的人。不要在去庞大的开始菜单里面一项一项搜索自己的应用程序，也不要在自己的桌面上放置眼花缭乱的快捷图标
Eclipse简单有用的配置 dcj3sjt126com eclipse
1、显示行号 Window -- Prefences -- General -- Editors -- Text Editors -- show line numbers 2、代码提示字符 Window ->Perferences，并依次展开 Java -> Editor -> Content Assist，最下面一栏 auto-Activation
在tomcat上面安装solr4.8.0全过程 eksliang Solr solr4.0后的版本安装 solr4.8.0安装
转载请出自出处： http://eksliang.iteye.com/blog/2096478 首先solr是一个基于java的web的应用，所以安装solr之前必须先安装JDK和tomcat，我这里就先省略安装tomcat和jdk了第一步：当然是下载去官网上下载最新的solr版本，下载地址
Android APP通用型拒绝服务、漏洞分析报告 gg163 漏洞 android APP 分析
点评：记得曾经有段时间很多SRC平台被刷了大量APP本地拒绝服务漏洞，移动安全团队爱内测（ineice.com）发现了一个安卓客户端的通用型拒绝服务漏洞，来看看他们的详细分析吧。 0xr0ot和Xbalien交流所有可能导致应用拒绝服务的异常类型时，发现了一处通用的本地拒绝服务漏洞。该通用型本地拒绝服务可以造成大面积的app拒绝服务。针对序列化对象而出现的拒绝服务主要
HoverTree项目已经实现分层 hvt 编程 .net Web C#ASP.ENT
HoverTree项目已经初步实现分层，源代码已经上传到 http://hovertree.codeplex.com请到SOURCE CODE查看。在本地用SQL Server 2008 数据库测试成功。数据库和表请参考：http://keleyi.com/a/bjae/ue6stb42.htmHoverTree是一个ASP.NET 开源项目，希望对你学习ASP.NET或者C#语言有帮助，如果你对
Google Maps API v3: Remove Markers 移除标记天梯梦 google maps api
Simply do the following: I. Declare a global variable: var markersArray = []; II. Define a function: function clearOverlays() { for (var i = 0; i < markersArray.length; i++ )
jQuery选择器总结 lq38366 jquery 选择器
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40
基础数据结构和算法六：Quick sort sunwinner Algorithm Quicksort
Quick sort is probably used more widely than any other. It is popular because it is not difficult to implement, works well for a variety of different kinds of input data, and is substantially faster t
如何让Flash不遮挡HTML div元素的技巧_HTML/Xhtml_网页制作刘星宇 html Web
今天在写一个flash广告代码的时候，因为flash自带的链接，容易被当成弹出广告，所以做了一个div层放到flash上面，这样链接都是a触发的不会被拦截，但发现flash一直处于div层上面，原来flash需要加个参数才可以。让flash置于DIV层之下的方法，让flash不挡住飘浮层或下拉菜单，让Flash不档住浮动对象或层的关键参数：wmode=opaque。方法如下：
Mybatis实用Mapper SQL汇总示例 wdmcygah sql mysql mybatis 实用
Mybatis作为一个非常好用的持久层框架，相关资料真的是少得可怜，所幸的是官方文档还算详细。本博文主要列举一些个人感觉比较常用的场景及相应的Mapper SQL写法，希望能够对大家有所帮助。不少持久层框架对动态SQL的支持不足，在SQL需要动态拼接时非常苦恼，而Mybatis很好地解决了这个问题，算是框架的一大亮点。对于常见的场景，例如：批量插入/更新/删除，模糊查询，多条件查询，联表查询，