DataPipeline

DataPipeline王睿：业务异常实时自动化检测 — 基于人工智能的系统实战

引言：2020年2月20日，DataPipeline Head of AI 王睿在51CTO“大咖来了”公开课上做了题为《业务异常实时自动化检测 — 基于人工智能的系统实战》的分享，本文根据分享内容整理而成。

大家好，先自我介绍一下，我是王睿。之前在Facebook/Instagram担任AI技术负责人，现在DataPipeline任Head of AI，负责研发企业级业务异常检测产品，旨在帮助企业一站式解决业务自动化监控和异常检测问题。今天主要从以下四方面跟大家分享构建该产品的思路和实战。

一、为什么需要人工智能业务异常检测系统

企业会因为业务异常无法得到及时解决而遭受较大的损失，比如某知名互联网企业，将原价为50元的优惠券以18元卖出，导致用户在短时间内大量疯抢，损失惨重。同样，在金融、零售、电商领域因为IT系统的bug或人工原因导致的业务异常也给企业造成了不可估量的经济损失。
然而，在业务异常出现时，企业往往在几天甚至几个星期之后才会发现。以某公司为例，其主营业务为线上借贷，有次放款率突然增加，此时距离出现问题已经过去十几个小时。后果是将钱款借给了许多不具备借贷资质的人，导致回款率和营收大幅下降。
为此，随着企业业务的持续高速增长以及信息化的全面普及，业务人员需要对业务变化有一个全面实时地掌控。这时，IT运维人员会关心服务器和网络的运行；产品负责人会关心用户访问，点击率和用户体验等；业务负责人则关心业务的核心KPI，如销售额。这些指标犹如一个人的心跳、血压、体温，反映企业业务的健康状况。

如何能快速准确地从业务指标中识别异常，发现问题根因，并及时解决对企业而言就显得尤为重要。

目前针对这块，不同企业采取的方法各异。传统的业务监控方法往往是手工生成报表每天查看，对于比较重要且实时性要求较高的指标，会人工设定阈值，当指标跨过阈值时报警。对于已知周期性的指标一般会用类似同比环比的方法。

随着企业业务量和业务种类的不断提升，人工的监控也随之增多。而这种基于人工的方法则会显示出几大不足：

1. 大量业务指标没有被实时监控。以电商为例，若只监控总销售额，采用人工方法很容易实现。但是，一旦某些地区或品类的销售额出现异常，只看总销售额指标则很难发现问题。

例如某零售企业，其酸奶的销售额在某地区较之前有所下降，原因是酸奶的库存出现了周转问题。由于一直售卖过期酸奶，导致接到大量用户举报。针对该情况，若只监控总销售额很难发现问题，这时需要监控品类和地区两个维度更细粒度的指标。而监控多个维度的指标，指标监控的数量会成倍增长，显然是人工无法胜任的。

2. 告警洪流。当业务出现问题时，往往报警的接收人员会收到大量告警，使得他们被告警洪流淹没，很难精准定位问题根因。除了告警的准确率低以外，还由于业务指标之间具有很强的相关性，主要体现在两个方面：

首先是指标之间的链路关系。比如在电商零售领域，当服务器错误增高时导致用户访问下降，从而导致下游的订单减少。另外是指标的多维度特性，例如当订单下降时，往往多个产品线，多个地区订单量同时下降。因此当业务出现问题时，往往是多个相关的指标一起告警，形成告警洪流。

3. 误报漏报。作为业务负责人，既不想在业务出现问题的最后一刻才知道，也不想在凌晨三点被一个假警报叫醒。而多次的误报会导致“狼来了”的效应，当真正的问题出现时，告警却往往容易被接收人员忽略掉。

4. 人工维护成本。随着业务的不断变化，大量的告警阈值和规则需要人工调整，而这显然跟不上业务的变化速度和监控指标不断增多的节奏。

因此我们需要一套自动化的智能业务监控和异常检测系统，通过对指标变化规律的学习，自动掌握指标数据正常和异常的表现模式，从而全面，实时地监控企业业务不同层面，不同维度的各项指标。这就是为什么我们需要搭建基于人工智能算法的业务异常检测系统的原因。

二、搭建该系统的挑战和设计理念

人工智能算法在异常检测领域已经被研究了几十年，但是搭建这样的系统却并非易事。主要的挑战有以下几点：

第一，对于异常的定义较为模糊且各种数据指标的表现形式千差万别。比如IT的CPU异常与销售额异常不同，因此试图用一种通用的算法检测不同类型指标的异常往往准确率很低。因为某一类数据的异常表现形式放在另一类数据指标中可能就不会被认为是异常。另外，在未来发生的异常很多时候是过去并未见过的。

这直接导致了第二个难点，即很难获取标注数据。不仅很难标注一个数据的变化是否是异常，且异常出现的频率较低，很难像传统机器学习问题那样获得很多正负样本。

第三，对该算法和系统的实时性和可扩展性要求很高。如果不能实时监控大量指标，发现异常并告警，这个系统将失去其意义。

为解决上述痛点，同时考虑到种种挑战，DataPipeline在设计该系统前确定了几点设计原则：

1. 无（半）监督机器学习算法为主
虽然目标是将数据分类为正常或异常，但由于异常的定义模糊，很难获取标注数据，我们主要采取无监督的机器学习算法。当然，对于给用户发送的告警，系统需要可以收集用户的反馈，然后用在提升算法的准确性上。综合来讲，这是一种半监督学习的方法。

2. 算法跟业务解耦
人工智能算法的优势在于解放人工，做到自动化，因此算法需要跟业务尽可能解耦。算法可以通过对于指标历史数据本身模式（如周期性）的学习来建模。而不同业务指标数据的表现形式各异，总体上时序数据的表现类型是有限的，因此我们需要算法具备根据不同表现形式选择不同模型的能力。

3. 异常相关性学习和根因分析
上面讲到的一个很大的痛点是告警洪流。当业务出现问题时，业务人员往往被淹没在大量告警中，很难快速准确地定位问题。因此我们需要学习监控指标之间的相关性，当业务出现问题时给用户一个汇总的告警，这样不仅能避免告警洪流，还能让用户一目了然地看到反映问题的相关指标，从而更快找到问题根因。从产品角度而言，这也是一个成熟的业务异常检测系统中很重要的组成部分，即根因分析。我们不仅希望及时地反应业务问题，也希望能缩小发现问题到解决问题的时间和成本。

4. 算法的扩展性和实时性
算法和整个系统需要做到对亿级数据指标的秒级实时响应。因此我们主要考虑应用轻量级并且支持线上学习（Online Learning）的算法模型。近些年深度学习在异常检测领域的应用逐渐成熟，其相较于传统的统计模型算法具有更强的泛化能力。但这些算法的训练成本较大，因此需要对实时性要求更高的指标系统进行取舍。

三、DataPipeline的算法实现思路

基于以上设计原则，DataPipeline提出了解决问题的几个步骤：

1. 接入数据

首先利用DataPipeline自身的数据集成能力，从不同数据源中接入实时的数据流或批式的数据集并进行预处理，形成多个指标的时序数据。

2. 正常表现的建模

进而对每个单一的指标时序数据学习其正常表现模式，拟合模型，并自动生成置信区间。如下图，深蓝色部分为数据本身，浅蓝色部分为自动生成的置信区间，红色部分为异常。

3. 异常的检测和过滤

对于新的数据点，一旦其跨过置信区间系统便认定为异常。接着对于每个识别出的异常进行打分和过滤。

4. 关联多个异常并自动报警
对检测出的多个异常，算法自动进行相关性学习，将其关联起来。最后生成一个汇总的告警，发送给用户。

下面重点解释对单一数据的正常表现建模，异常检测和关联多个指标异常的具体技术实现。

1.单一数据的正常表现建模

在过去数十年里，许多不同类型的算法被研究和开发来尝试解决这一问题。其中有较为传统的基于统计模型的算法，也有许多基于时序数据的分析方法，而近年来大热的深度学习模型也被证明在时序数据预测和异常检测上有较高的准确性。

这些算法一般遵循这样一个步骤：先对历史数据进行建模，学习数据正常表现的规律。对新来的数据点，根据数据点偏离正常表现模型的程度来判定是否为异常。

比如最简单的算法模型是高斯分布，假设该指标数据符合高斯分布，就可以通过历史数据点估计出高斯分布的mean和期望（均数）μ和标准差σ，进而对新的数据点判定，如果偏离期望多于三个标准差则该数据点不能被模型解释的概率为99.7%，我们就可以判定其为异常。然而实际情况是，大部分数据都无法简单地表现为高斯分布。

因此，首先我们需要根据数据本身来自动选择最适合的算法模型。这也是很多开源的异常检测算法直接被拿来使用往往得不到满意效果的一个原因，因为他们一般假设数据的底层表现是平稳的（Stationary），并且数据是规则取样的（Regular Sampling），若使用不适合的算法模型对数据建模会得到非常不好的效果，甚至完全无法使用。因此DataPipeline开发了一个算法，可以自动根据数据的表现形式选择最合适的算法进行拟合。最常用的算法可以分为基于统计模型的算法和深度学习的算法。

统计模型算法

除了上面提到的高斯分布，比较常用的模型有基于指数平滑（Exponential Smoothing）的模型，实际是对过去的数据进行平均来预测未来的数据，只是给时间上更靠近当下的数据点更大的权重。比较经典的有Holt-Winters，ARIMA等，这些还可以将周期性的规律考虑进去。

深度学习算法

对于不符合规则取样和不表现为Staionary的数据，深度学习算法的效果更好。LSTM（Long Short-Term Memory）是最常用的算法，而当下许多最新的算法都是基于LSTM上的变种。然而深度学习算法很难做到实时训练，即模型随新的数据点实时更新，而且当监控数据量大的时候非常耗费CPU。

算法自动选择出最合适的模型后，系统便可根据历史数据拟合模型，估计出模型参数，进而针对每个数据点给出预测。对于实际数据点和预测数据点的差异（error）我们可以用高斯分布来模拟，利用高斯模型计算出一个置信区间，当新数据的error偏离置信区间过大时将其判断为异常。

2. 周期性学习

许多指标数据都表现出明显的周期性，而周期性学习对异常检测的准确性至关重要。最常见的自动学习周期性方法是自相关学习（Autocorrelation）。简言之，该算法是将数据向过去平移一个时间差（Lag），然后计算平移后的数据和原来数据的统计相关性。如果某一个Lag平移后的数据和原数据相关性很大，则认为该Lag就是数据的周期性。此算法的主要问题是计算量较大，因为要对多个Lag进行计算。
鉴于上面提到的实时性和可扩展要求，DataPipeline对该算法用Subsampling的方法进行优化，降低了计算复杂度。

3. 相关性学习

之前提到为解决告警洪流问题，我们需要一个算法可以自动化计算指标间的相关性，在多个异常同时出现时，可以将反映同个业务问题的异常关联在一起，给用户一个汇总的告警。针对这类问题，一般传统的方法是采取多变量分析（Multivariate Analysis），即将所有时序数据当成互相有关联的多变量一起建模，然后在整体层面检测异常。该方法的主要问题是很难规模化，且当出现异常时检测结果的解释性较差。

因此，在DataPipeline，我们采用单变量分析对每个指标进行异常检测，然后利用大规模聚类算法将相关度较高的指标进行聚类（如上图）。这样每个指标的机器学习和相关性学习两部分可以各自规模化，使得整个系统计算效率更高。而聚类算法通过几类特征来进行计算：

异常表现的相似度

简言之，如果两个指标多次、同时出现异常，则认为两者更相关。我们可以生成一个异常表现的特征向量，若在某个时间点该指标表现正常便设置为0，若表现异常则设置为异常的打分（算法根据异常的严重程度自动打分）。

统计模型的相似度

即指标的数值是否有相似的模式。其中计算两个时序数据数值相似度最常见的算法是Pearson Correlation Coefficient。

元数据相似度和人工反馈

DataPipeline还根据元数据的拓扑关系来判断相关性。比如同一个指标的多个维度生成的多个子指标会被认为更相关。此外，用户也可自己输入一些信息告诉系统哪些指标更相关。

四、DataPipeline的系统架构

若构建一套企业级业务监控和异常检测系统应该具备哪些组成部分？下面为DataPipeline的一些思路。

1. 产品功能组成

从产品功能角度而言，该系统可以接入企业的各种业务系统（左边），包括核心业务系统和各种已有系统，诸如数据分析，监控系统等。挑战是如何将多源异构的数据以一致的方式接入，且同时可以处理流式和批式数据。DataPipeline已有的数据融合产品可以很好地实现这点。如果企业自己搭建，则需要根据具体情况确定实现方式。

另外，针对中间的系统内核，我们将其设计成了一个跟业务完全解耦的黑盒。右边则是用户交互UI，包括两部分：第一是告警系统，可根据企业的报警需要接到企业交流app如钉钉、邮件，电话等。第二是监控看板，可以看到监控的指标数据，搜索不同指标和多维度展示。另外，还可看到指标异常的汇总展示，根因展示等。从看板上用户可以根据展示出的异常进行反馈，表明这是正确的异常还是误报，另外还可调整指标异常检测的敏感度。这些反馈和调整会返回到系统中。

2. 核心系统架构

核心系统主要分为线上处理和线下模型训练两部分。线上部分处理实时的数据指标最新数据流，从模型存储数据库中读入模型并存于内存中，对数据流中每一个数据指标进行实时的阈值计算、异常检测和打分。之后多个数据指标的异常检测结果会被汇总到一个关联性处理器，进行异常的关联，最后将关联好的异常指标组汇总，生成并触发告警。在处理实时指标数据时，处理器会将最新的指标数据和检测出的异常分别写入数据库为线下训练做准备。

线下部分会定时从数据指标的历史数据库中读取数据并进行线下的模型训练，这其中便包括上面提到的算法自动选择，周期性学习等。也会定期利用用户返回的反馈对模型进行评估，计算出误报漏报率等。

总结

业务异常的不及时解决会给企业带来巨大的经济损失。相对于传统的人工生成报表和人工阈值的监控方法，基于人工智能的业务异常检测系统可以更自动化，更全面地监控业务各项指标并给出准确率更高，更有帮助性的报警和业务洞见。

而搭建这样一套系统面临业务数据表现形式多样，告警过多准确率低下等挑战。伴随着企业级人工智能业务异常检测系统的出现，企业可以更高效、及时全面的掌控业务，从而实现业务和经济效益的提升。

【Redis 系列】redis 学习九，Redis 的发布和订阅是咋玩的阿兵云原生
Redis发布订阅Redis发布订阅（pub/sub）是一种消息通信模式发送者发送消息pub接受者订阅消息sub例如微信，微博这样的关注系统Redis的客户端可以订阅任意数量的频道，不受限制来看看图示消息发布者消息订阅者频道image这里的消息发布者，和消息订阅者都是redis客户端，订阅者订阅某个频道，发布者在该频道中发布相关信息，例如文章，例如沸点，等等，消息订阅者就能实时收到刚才发布者发送的
Python练习（6）Python面向对象编程三大特性：封装、继承与多态的15道实战练习题（含答案与深度解析）一个天蝎座白勺程序猿 python 开发语言
目录引言封装篇（5题）练习1：银行账户安全封装练习2：属性装饰器控制练习3：私有方法调用练习4：受保护属性继承练习5：类属性封装继承篇（5题）练习6：单继承与方法重写练习7：多继承与MRO练习8：抽象基类实现练习9：Mixin模式练习10：super()函数应用多态篇（5题）练习11：接口多态练习12：鸭子类型练习13：多态与异常处理练习14：多态与类型检查练习15：多态与装饰器总结Python爬
深入解析AI原生云服务冷启动时延优化：JVM字节码预编译引擎核心技术剖析梦玄海 AI-native jvm risc-v golang java
引言：冷启动时延的挑战与突破方向在AI原生云服务架构中，冷启动时延（ColdStartLatency）是影响服务响应速度的关键瓶颈指标。根据AWSLambda实测数据，传统JVM应用的冷启动时间高达1-5秒，这在需要快速弹性扩缩容的AI推理、实时数据处理等场景中可能造成严重的服务降级。本文聚焦JVM字节码预编译引擎（BytecodePrecompilationEngine），深度解构其在冷启动优化
2025全球远程IO模块品牌盘点：十大领先品牌推荐 2501_91398178 IO模块分布式IO 无线IO模块远程IO模块 IO采集模块
随着工业自动化和物联网（IoT）的快速发展，远程IO模块在工业控制、智能制造、楼宇自动化和能源管理等领域中扮演着不可或缺的角色。远程IO模块通过将物理信号（如温度、压力、开关状态等）转换为数字信号并上传至控制系统，实现了对设备的远程监控和控制。在2025年，全球远程IO模块市场竞争日趋激烈，技术创新和产品可靠性成为行业发展的核心动力。本文基于Statista、MarketsandMarkets和I
RS485集线器选购指南：2025主流通信转换设备品牌盘点与应用方案解析
RS485集线器选购指南：2025主流通信转换设备品牌盘点与应用方案解析随着工业自动化和物联网的快速发展，RS485集线器作为一种可靠的串行通信设备，在各种工业场景中得到了广泛应用。2025年，RS485集线器市场产品种类更加丰富，功能也更加多样化。本文将基于权威数据平台的分析，盘点主流品牌厂商及其优势产品，并解析典型应用方案，帮助读者在选购时作出明智决策。一、RS485集线器的基本原理与应用场景
CAN总线模组选购指南：2025年全球CAN产品品牌与CAN-bus方案盘点
随着工业物联网（IIoT）、智能制造和自动驾驶技术的快速发展，CAN（ControllerAreaNetwork）总线已经成为工业控制、汽车电子和智能设备领域的重要通信协议之一。CAN总线模块作为实现设备间实时通信与高可靠性数据传输的核心组件，其选购对于系统稳定性和性能至关重要。本文基于权威市场数据平台的分析，盘点了2025年全球主流CAN总线模块品牌及其解决方案，帮助工程师和系统集成商选择最佳产
基于STM32无线WIFI智能家居实时控制系统设计
**单片机设计介绍，基于STM32无线WIFI智能家居实时控制系统设计文章目录一概要二、功能设计设计思路三、软件设计原理图五、程序六、文章目录一概要基于STM32无线WiFi智能家居实时控制系统设计概要如下：一、项目概述本项目旨在设计一个基于STM32微控制器和无线WiFi技术的智能家居实时控制系统。该系统能够连接并控制各种智能家居设备，如灯光、窗帘、安防监控设备等，同时支持远程控制、环境监测
ICT模拟零件测试方法--测量参数详解可可南木 ICT（In Circuit Tester）在线测试测试工具开发语言 pcb工艺
ICT模拟零件测试方法–测量参数详解文章目录ICT模拟零件测试方法--测量参数详解测量参数调整幅值ASRU范围ASRU加速电压合规电容补偿检测器等待额外数字增强频率电流变化电流合规直流电流直流偏移反向并联电容合格/不合格并联模型SenseASenseBSenseL串联模型等待宽带测量参数在调试的时候，选择不同的参数可以达到我们对稳定性的要求，选择不同的参数是好是坏，我们可以通过CPK的高低进行验证
【Python办公】Python如何批量提取word文档中的表格小庄-Python办公 Python笔记 python word 提取word表格 python读取word文档 word文档 python办公
目录专栏导读环境准备核心库介绍单个Word文档表格提取基础提取方法转换为DataFrame批量处理多个Word文档批量提取并保存到Excel高级功能表格数据清洗按条件筛选表格表格格式检测完整示例：智能批量提取注意事项总结专栏导读欢迎来到Python办公自动化专栏—Python处理办公问题，解放您的双手️‍博客主页：请点击——>一晌小贪欢的博客主页求关注该系列文章专栏：请点击——>Python办公自
统一内存架构的可行性与科学性恣艺架构
1.统一内存架构的技术定义与演进1.1核心概念与实现机制苹果的统一内存架构（UMA）通过将内存直接集成于SoC（系统级芯片），使CPU、GPU、神经引擎等计算单元共享同一物理内存池。其关键技术包括：内存池化与动态分配：内存控制器实时调配资源，消除传统架构中CPU/GPU间的数据复制开销。硅中介层互联：计算单元与内存通过硅中介层（SiliconInterposer）直连，提供800GB/s的超高带宽
React Native 自动化测试终极指南：从零开始到持续集成老猿阿浪测试 react native react.js 集成测试单元测试测试工具
写在前面：为什么你的ReactNative应用需要自动化测试？想象一下：你刚发布了一个新版本，用户反馈登录页面崩溃了。你紧急修复，重新打包，AppStore审核等了3天，终于上线——结果另一个隐藏Bug又炸了……如果能提前发现这些问题呢？自动化测试就是你的“代码保镖”，它能在你提交代码时自动检查逻辑错误、UI错位、性能问题，甚至模拟用户操作，确保每次改动不会破坏已有功能。本篇将带你从单元测试到E2
Python,Go开发光电效应与日常应用APP Geeker-2025 python golang
以下是一个基于Python与Go开发的光电效应科普与应用APP的完整技术方案，结合了物理原理模拟、实时数据处理及生活场景应用，参考了工业级开发实践（如光电实验数据处理和能源设备控制）：---###一、系统架构设计```mermaidgraphLRA[Go微服务层]-->B[Python科学计算层]A-->C[数据库/物联网]B-->D[硬件接口]D-->E[传感器/实验设备]subgraph前端A
Python,Go are applicated to develop the app “Star travel and your preparation”
为了开发“星际旅行准备”应用（**StarTravelandYourPreparation**），结合**Python**和**Go**的技术优势，可设计如下分层架构，融合深空导航、生命维持系统（LSS）优化与跨星域资源管理功能：---###**1.核心架构设计**####**(1)星际导航引擎（Go）**-**角色**：实时多维空间路径规划与异常规避-**实现**：-**曲速走廊计算**：基于A
lucky记录194天杉杉妈Alice
2021年08月18日扇贝每日一句2022年倒计时135天Thecrisisoftodayisthejokeoftomorrow.今天的危机将成为明天的笑谈。-H.G.Wells今天早上宝贝起来的异常早呀，不到7点钟自己起来了，而且我还睡着呢，她也没有打扰我就爬起来了！虽然我也醒来了，但是整个人还想继续躺着，然后我在床上赖了10分钟才起床。果然不出我所料，起床后发现他什么也没动，就在那儿喝可乐了。
Python,C++开发磁流体研究以及应用APP Geeker-2025 python c++
#Python与C++开发磁流体研究与应用APP方案以下是一个结合Python与C++的磁流体(MHD)研究与应用APP的完整技术方案，融合了高性能计算、实时仿真和工业应用场景：##系统架构设计```mermaidgraphTDA[用户界面层]-->B[Python应用层]B-->C[C++核心计算层]C-->D[硬件接口层]D-->E[实验设备/传感器]subgraph前端A1[桌面端-PyQt
Selenium 中 findElement 方法全解析：定位网页元素的 7 种方式二向箔reverse selenium 测试工具
在自动化测试和网页数据抓取场景中，准确找到目标元素是核心任务。Selenium提供的findElement方法支持多种定位策略，本文将深入介绍各种搜索模式的完整语法及适用场景。一、CSS选择器定位CSS选择器是定位网页元素的首选方式，它具有语法简洁、性能优异的特点。1.基本选择器元素选择器语法与说明：driver.find_element(By.CSS_SELECTOR,"标签名")通过HTML标
Selenium 性能优化实战：让自动化测试速度提升 60% 的 10 个技巧二向箔reverse selenium 性能优化测试工具
在Web自动化测试中，脚本执行效率直接影响测试反馈周期和资源成本。本文将分享10个经过实战验证的Selenium性能优化技巧，帮助你将测试速度提升60%以上。一、使用无头浏览器模式传统浏览器渲染UI会消耗大量资源，而无头模式（Headless）可以在后台静默执行，显著提升速度。优化前（有UI模式）：fromseleniumimportwebdriverdriver=webdriver.Chrome
Selenium 处理动态网页与等待机制详解二向箔reverse okhttp
在使用Selenium进行网页自动化操作时，动态网页往往是开发者遇到的第一个“拦路虎”。想象一下：你明明在代码中写好了元素定位逻辑，运行时却频繁报错“元素不存在”，但手动打开网页时元素明明就在眼前——这很可能是因为网页还没加载完成，Selenium就急着执行下一步操作了。本文将深入解析动态网页的特性，系统讲解Selenium的三种等待机制，并通过实战案例告诉你如何优雅地处理动态内容加载问题。一、动
kvm虚拟机下的格式转换 teayear linux 运维服务器运维技术教程自动化监控
该指令使用qemu-img工具将原始磁盘镜像（raw格式）转换为QCOW2格式的虚拟磁盘镜像，具体参数解释如下：分步解析qemu-imgconvert调用QEMU的镜像转换工具，用于不同虚拟磁盘格式之间的转换。-p显示转换进度条（等同于--progress），实时反馈转换过程的状态。-fraw指定源文件的格式为raw（原始二进制格式）。raw格式无元数据头，直接存储磁盘扇区数据，常用于物理磁盘拷贝
对“人格障碍”的浅认识春暖花开LittleHui
“人格障碍”这个词是我在学习心理学时接触到的。人格障碍是指明显偏离正常且根深蒂固的行为方式，具有适应不良的性质，其人格在内容上、质上或整个人格方面异常，由于这个原因，病人遭受痛苦，或给个人或社会带来不良影响。人格的异常妨碍了他们的情感和意志活动，破坏了其行为的目的性和统一性，给人以与众不同的特意感觉，在待人接物方面表现尤为突出。人格障碍通常开始于童年、青少年或成年早期，（更多是原生家庭造成的，来自
掌握C#文件操作与XML处理：学习资料完整指南竹石文化传播有限公司
本文还有配套的精品资源，点击获取简介：C#是一种广泛应用于Windows和跨平台开发的编程语言，它在.NET框架中包含强大的文件和XML操作能力。本文深入探讨了C#中的文件读写技术，包括使用System.IO命名空间中的File类进行文本和二进制文件处理，FileStream类的流操作，以及XML文档的解析、创建和修改方法。同时，文章也介绍了文件操作的扩展功能和在进行文件操作时应考虑的异常处理。通
[Python] -项目实战4- 利用Python进行Excel批量处理踏雪无痕老爷子 Python python excel 开发语言
一、为什么要批量处理Excel文件？节省时间：人工对数十、数百个Excel文件重复操作不现实，Python批量处理一次搞定。保证一致性：统一格式、统一操作，避免手动误差。易于集成：可嵌入日常自动化流程，支持定时和触发执行。二、常用库及选型建议库作用优势局限pandas读取/清洗/分析Excel数据语法简
小架构step系列18：工具秋千码途架构
1概述在写代码的时候，有很多通用的、与业务无关逻辑，这些一般写成工具类方法。这些工具类方法慢慢地被积累起来，变成了开源包，可以直接使用开源包，而不是自己再花时间来重复造这些轮子。这些工具类的开源包比较多，公司如果没有控制的话，不同的开发人员就会选自己熟悉的开源包，甚至都拿来练练手。这样的后果就是，在一个工程内使用了五花八门的工具类包，维护代码的时候不好维护，如果要升级一些框架包或者扫描漏洞，发现很
BEV+Transformer Monkey PilotX 自动驾驶 transformer 深度学习人工智能
在自动驾驶系统中，BEV（Bird’sEyeView）+Transformer主要应用于感知与环境建图（Perception&SceneUnderstanding）环节，尤其是在多传感器融合、目标检测、语义分割、轨迹预测等任务中。在自动驾驶中的关键应用场景应用环节BEV+Transformer的作用感知（Perception）多摄像头图像融合成BEV视角，进行目标检测、语义分割预测（Predict
2021-08-26 鲸屿品创
创新打造品牌全案策划—鲸屿品创鲸屿品创是一家新锐品牌策划设计服务机构，致力于企业品牌策划，企业品牌设计，以及企业营销战略咨询等多维度综合服务；以全方位的品牌营销策略，帮助新品牌迅速成长创造品牌新境界帮助新老品牌激发活力，开辟营销新局面；综合多角度、多方位、多层次、多渠道、多元化、多方式的营销模式是建立在数字化基础上，依托于互联网，地面配置整体配合的营销方式以灵活、实时满足等多个方面满足品牌营销策划
今天是个好日子 L晓蓓
（一）好天气下去做核酸检测，才知道今天的天气可真好。蓝蓝的天空飘着朵朵白云，太阳高高的挂在天空中，雪早已被消融的无影无踪，温暖中夹杂着一丝微风，一点也不觉得冷，晒着太阳心情都变成了大晴天。虽然核酸已经做完了，但我依旧贪恋阳光，贪恋好天气，站着单元门前迟迟不想上楼。看着单元门前和我一样的人们，我想大家的心情是一样的，真希望每天都是这么温暖。（二）好消息最可怕的就是没头的日子，好在，我们知道何时能解封
Spring AOP（面向切面编程，Aspect-Oriented Programming）
SpringAOP（面向切面编程，Aspect-OrientedProgramming）一、SpringAOP是什么？SpringAOP是Spring框架提供的面向切面编程支持，用于将横切关注点（cross-cuttingconcerns，如日志、事务、权限检查等）与核心业务逻辑分离。AOP允许开发者通过声明式方式将通用功能模块化，减少代码重复，提高代码可维护性。核心概念Aspect（切面）：切面
【OCR炼丹】解析HIT-OR3C数据集online部分Python版完整代码
最近开始炼手写体汉字识别方面的丹，网上找了下数据集，主要有：中科院自动化研究所开源的CASIA数据集（下载链接地址）哈工大开源的HIT-OR3C数据集（下载链接地址）这俩数据集的存储形式与之前接触过的一些共有数据集的保存形式有很大的区别，对于C、C++不是很熟用Python较多的我来说踩了不少的坑（还都是CSDN、知乎、Google都搜不到的巨坑），造福下后来人吧。首先，明确一点，由于博主此次研究
如何解决AttributeError: ‘NoneType‘ object has no attribute问题
如何解决AttributeError:‘NoneType’objecthasnoattribute问题问题背景与概述在Python项目开发和调试过程中，经常会碰到这样一个异常信息：AttributeError:'NoneType'objecthasnoattribute'foo'这意味着你尝试访问或调用某个对象的属性／方法foo，但此时对象本身是None，从而触发了AttributeError。本
大型语言模型在自动化AI科学研究与论文撰写中的应用与展望这是Jamon AI4SR 人工智能
1.引言：LLM驱动科学研究与论文撰写的范式转变大型语言模型（LLM）的快速发展正在科学发现领域引发一场深刻的范式转变。这些模型正从最初的任务特定自动化工具，逐步演变为能够自主执行复杂任务的智能代理，从根本上重新定义了研究过程以及人机协作的模式。LLM所展现出的新兴能力，例如高级规划、复杂推理和精确指令遵循，显著加速了科学发现的步伐。传统科学研究通常是一个由人类主导的、高度线性且劳动密集型的过程，
对于规范和实现，你会混淆吗？ yangshangchuan HotSpot
昨晚和朋友聊天，喝了点咖啡，由于我经常喝茶，很长时间没喝咖啡了，所以失眠了，于是起床读JVM规范，读完后在朋友圈发了一条信息： JVM Run-Time Data Areas：The Java Virtual Machine defines various run-time data areas that are used during execution of a program. So
android 网络百合不是茶网络
android的网络编程和java的一样没什么好分析的都是一些死的照着写就可以了,所以记录下来方便查找 , 服务器使用的是TomCat 服务器代码; servlet的使用需要在xml中注册 package servlet; import java.io.IOException; import java.util.Arr
[读书笔记]读法拉第传 comsci 读书笔记
1831年的时候,一年可以赚到1000英镑的人..应该很少的... 要成为一个科学家,没有足够的资金支持,很多实验都无法完成但是当钱赚够了以后....就不能够一直在商业和市场中徘徊......
随机数的产生沐刃青蛟随机数
c++中阐述随机数的方法有两种：一是产生假随机数（不管操作多少次，所产生的数都不会改变）这类随机数是使用了默认的种子值产生的，所以每次都是一样的。 //默认种子 for (int i = 0; i < 5; i++) { cout<<
PHP检测函数所在的文件名 IT独行者 PHP 函数
很简单的功能，用到PHP中的反射机制，具体使用的是ReflectionFunction类，可以获取指定函数所在PHP脚本中的具体位置。创建引用脚本。代码： [php] view plain copy // Filename: functions.php <?php&nbs
银行各系统功能简介文强chu 金融
银行各系统功能简介　业务系统核心业务系统业务功能包括：总账管理、卡系统管理、客户信息管理、额度控管、存款、贷款、资金业务、国际结算、支付结算、对外接口等清分清算系统以清算日期为准，将账务类交易、非账务类交易的手续费、代理费、网络服务费等相关费用，按费用类型计算应收、应付金额，经过清算人员确认后上送核心系统完成结算的过程国际结算系
Python学习1(pip django 安装以及第一个project) 小桔子 python django pip
最近开始学习python,要安装个pip的工具。听说这个工具很强大，安装了它，在安装第三方工具的话so easy!然后也下载了，按照别人给的教程开始安装，奶奶的怎么也安装不上！第一步：官方下载pip-1.5.6.tar.gz, https://pypi.python.org/pypi/pip easy! 第二部：解压这个压缩文件，会看到一个setup.p
php 数组 aichenglong PHP 排序数组循环多维数组
1 php中的创建数组 $product = array('tires','oil','spark');//array()实际上是语言结构而不是函数 2 如果需要创建一个升序的排列的数字保存在一个数组中，可以使用range()函数来自动创建数组 $numbers=range(1,10)//1 2 3 4 5 6 7 8 9 10 $numbers=range(1,10,
安装python2.7 AILIKES python
安装python2.7 1、下载可从 http://www.python.org/进行下载#wget https://www.python.org/ftp/python/2.7.10/Python-2.7.10.tgz 2、复制解压 #mkdir -p /opt/usr/python #cp /opt/soft/Python-2
java异常的处理探讨百合不是茶 JAVA异常
//java异常 /* 1，了解java 中的异常处理机制，有三种操作 a,声明异常 b,抛出异常 c,捕获异常 2，学会使用try-catch-finally来处理异常 3，学会如何声明异常和抛出异常 4，学会创建自己的异常 */ //2，学会使用try-catch-finally来处理异常
getElementsByName实例 bijian1013 element
实例1： <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/x
探索JUnit4扩展：Runner bijian1013 java 单元测试 JUnit
参加敏捷培训时，教练提到Junit4的Runner和Rule，于是特上网查一下，发现很多都讲的太理论，或者是举的例子实在是太牵强。多搜索了几下，搜索到两篇我觉得写的非常好的文章。文章地址：http://www.blogjava.net/jiangshachina/archive/20
[MongoDB学习笔记二]MongoDB副本集 bit1129 mongodb
1. 副本集的特性 1)一台主服务器(Primary),多台从服务器(Secondary) 2)Primary挂了之后，从服务器自动完成从它们之中选举一台服务器作为主服务器，继续工作，这就解决了单点故障，因此，在这种情况下，MongoDB集群能够继续工作 3)挂了的主服务器恢复到集群中只能以Secondary服务器的角色加入进来 2
【Spark八十一】Hive in the spark assembly bit1129 assembly
Spark SQL supports most commonly used features of HiveQL. However, different HiveQL statements are executed in different manners: 1. DDL statements (e.g. CREATE TABLE, DROP TABLE, etc.)
Nginx问题定位之监控进程异常退出 ronin47
nginx在运行过程中是否稳定，是否有异常退出过？这里总结几项平时会用到的小技巧。 1. 在error.log中查看是否有signal项，如果有，看看signal是多少。比如，这是一个异常退出的情况： $grep signal error.log 2012/12/24 16:39:56 [alert] 13661#0: worker process 13666 exited on s
No grammar constraints (DTD or XML schema).....两种解决方法 byalias xml
方法一：常用方法关闭XML验证工具栏：windows => preferences => xml => xml files => validation => Indicate when no grammar is specified:选择Ignore即可。方法二：（个人推荐）添加内容如下 <?xml version=
Netty源码学习-DefaultChannelPipeline bylijinnan netty
package com.ljn.channel; /** * ChannelPipeline采用的是Intercepting Filter 模式 * 但由于用到两个双向链表和内部类，这个模式看起来不是那么明显，需要仔细查看调用过程才发现 * * 下面对ChannelPipeline作一个模拟，只模拟关键代码： */ public class Pipeline {
MYSQL数据库常用备份及恢复语句 chicony mysql
备份MySQL数据库的命令，可以加选不同的参数选项来实现不同格式的要求。 mysqldump -h主机 -u用户名 -p密码数据库名 > 文件备份MySQL数据库为带删除表的格式，能够让该备份覆盖已有数据库而不需要手动删除原有数据库。 mysqldump -–add-drop-table -uusername -ppassword databasename > ba
小白谈谈云计算--基于Google三大论文 CrazyMizzz Google 云计算 GFS
之前在没有接触到云计算之前，只是对云计算有一点点模糊的概念，觉得这是一个很高大上的东西，似乎离我们大一的还很远。后来有机会上了一节云计算的普及课程吧，并且在之前的一周里拜读了谷歌三大论文。不敢说理解，至少囫囵吞枣啃下了一大堆看不明白的理论。现在就简单聊聊我对于云计算的了解。我先说说GFS &n
hadoop 平衡空间设置方法 daizj hadoop balancer
在hdfs-site.xml中增加设置balance的带宽，默认只有1M： <property> <name>dfs.balance.bandwidthPerSec</name> <value>10485760</value> <description&g
Eclipse程序员要掌握的常用快捷键 dcj3sjt126com 编程
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可以那么勤奋，每天都孜孜不倦得
Android学习之路 dcj3sjt126com Android学习
转自：http://blog.csdn.net/ryantang03/article/details/6901459 以前有J2EE基础，接触JAVA也有两三年的时间了，上手Android并不困难，思维上稍微转变一下就可以很快适应。以前做的都是WEB项目，现今体验移动终端项目，让我越来越觉得移动互联网应用是未来的主宰。下面说说我学习Android的感受，我学Android首先是看MARS的视
java 遍历Map的四种方法 eksliang java HashMap java 遍历Map的四种方法
转载请出自出处： http://eksliang.iteye.com/blog/2059996 package com.ickes; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Map.Entry; /** * 遍历Map的四种方式
【精典】数据库相关相关 gengzg 数据库
package C3P0; import java.sql.Connection; import java.sql.SQLException; import java.beans.PropertyVetoException; import com.mchange.v2.c3p0.ComboPooledDataSource; public class DBPool{
自动补全 huyana_town 自动补全
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"><html xmlns="http://www.w3.org/1999/xhtml&quo
jquery在线预览PDF文件，打开PDF文件天梯梦 jquery
最主要的是使用到了一个jquery的插件jquery.media.js，使用这个插件就很容易实现了。核心代码 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.
ViewPager刷新单个页面的方法 lovelease android viewpager tag 刷新
使用ViewPager做滑动切换图片的效果时，如果图片是从网络下载的，那么再子线程中下载完图片时我们会使用handler通知UI线程，然后UI线程就可以调用mViewPager.getAdapter().notifyDataSetChanged()进行页面的刷新，但是viewpager不同于listview，你会发现单纯的调用notifyDataSetChanged()并不能刷新页面
利用按位取反（~）从复合枚举值里清除枚举值草料场 enum
以 C# 中的 System.Drawing.FontStyle 为例。如果需要同时有多种效果，如：“粗体”和“下划线”的效果，可以用按位或（|） FontStyle style = FontStyle.Bold | FontStyle.Underline; 如果需要去除 style 里的某一种效果，
Linux系统新手学习的11点建议刘星宇编程工作 linux 脚本
　　随着Linux应用的扩展许多朋友开始接触Linux，根据学习Windwos的经验往往有一些茫然的感觉：不知从何处开始学起。这里介绍学习Linux的一些建议。　　一、从基础开始：常常有些朋友在Linux论坛问一些问题，不过，其中大多数的问题都是很基础的。例如：为什么我使用一个命令的时候，系统告诉我找不到该目录，我要如何限制使用者的权限等问题，这些问题其实都不是很难的，只要了解了 Linu
hibernate dao层应用之HibernateDaoSupport二次封装 wangzhezichuan DAO Hibernate
/** * 方法描述:sql语句查询返回List<Class> * 方法备注: Class 只能是自定义类 * @param calzz * @param sql * @return * 创建人：王川 * 创建时间：Jul

DataPipeline王睿：业务异常实时自动化检测 — 基于人工智能的系统实战

2. 核心系统架构

你可能感兴趣的:(异常检测,业务异常实时自动化检测,数据融合)