weepon

对异常检测技术的简要概述(干货)

转载请注明作者和出处：http://blog.csdn.net/u013829973
我的GitHub：https://github.com/weepon
欢迎评论，顶！

什么是离群值如何处理它们
- 离群值的类型
- 数据集中出现异常值的最常见原因
一些最流行的离群检测方法是
- Z-Score
- Dbscan
- Isolation Forests
总结Conclusions
- Z-Score 优点
- Z-Score 缺点
- Dbscan 优点
- Dbscan 缺点
- Isolation Forest 优点
- Isolation Forest缺点

今天和大家简单聊聊异常检测技术的简要概述。

对异常检测技术的简要概述(干货)_第1张图片

什么是离群值，如何处理它们？

“Observation which deviates so much from other observations as to arouse suspicion it was generated by a different mechanism” — Hawkins(1980)

对异常检测技术的简要概述(干货)_第2张图片

异常值是偏离数据其他观测值的极端值，它们可能表示测量的可变性，实验误差或新事物。换句话说，异常值是偏离整体样本的观察值。

离群值的类型

异常值可以是两种：单变量和多变量。当查看单个特征空间中的值分布时，可以找到单变量异常值。多变量异常值可以在n维空间（n个特征）中找到。观察n维空间中的分布对于人类大脑来说可能非常困难，这就是为什么我们需要训练一个模型。
不同的环境，异常值也可以有不同的风格：点异常值，背景异常值或集体离群值。点异常值是与分布的其余部分相距甚远的单个数据点。语境异常值可以是数据中的噪声，例如在进行语音识别时实现文本分析或背景噪声信号时的标点符号。集体异常值可以是诸如可能指示发现新现象的信号的数据的新颖性子集（如图B所示）。

对异常检测技术的简要概述(干货)_第3张图片

数据集中出现异常值的最常见原因：

数据输入误差（人为误差）
测量误差(仪器错误)
实验误差(数据提取或实验计划/执行误差)
故意的(测试检测方法的假异常值)
数据处理错误(数据处理或数据设置意外突变)
抽样错误(提取或混合来自错误或不同来源的数据)
自然(不是错误，数据中的新奇)

在制作，收集，处理和分析数据的过程中，异常值可以来自许多来源，并在许多方面隐藏起来，那些不是错误的产物被称为新奇。

检测异常值对于几乎任何定量学科都是至关重要的（即：物理，经济，金融，机器学习，网络安全）。在机器学习和任何定量学科中，数据质量与预测或分类的模型一样重要。

当试图在数据集中检测离群值时，记住上下文并尝试回答这个问题非常重要:“为什么我要检测离群值?你的发现的意义将由上下文决定。

此外，当开始一个离群的检测任务时，你必须回答关于你的数据集的两个重要问题:此外，当开始一个离群的检测任务时，你必须回答关于你的数据集的两个重要问题:

我要考虑哪些特征来检测离群值?(单变量或多变量)我要考虑哪些特征来检测离群值?(单变量或多变量)
我可以为我选择的特性假设一个值的分布吗?(参数/非参数)

一些最流行的离群检测方法是:

z分数(Z-Score )或极值分析(参数)
概率和统计建模(参数)
线性回归模型(PCA,LMS)
基于邻近模型(非参数)
信息理论模型
高维离群检测方法(高维稀疏数据)

Z-Score

一个观测的z分数或标准分数是一个度量，表示一个数据点偏离样本均值的多少个标准差，假设一个高斯分布。这使得z分数是一个参数化的方法。非常频繁的数据点并不是由高斯分布描述的，这个问题可以通过将转换应用于数据，比如：缩放它来解决。

一些Python库，如Scipy和scikit学习，可以很容易地使用函数和类利用Pandas和Numpy轻松实现。在对数据集的选定特征空间进行适当的转换之后，任何数据点的z分数都可以用以下表达式计算：

对异常检测技术的简要概述(干货)_第4张图片

当计算数据的每个样本的z分数时，必须指定一个阈值。一些好的“thumb-rule”阈值可以是:2.5、3、3.5或更高的标准差。

对异常检测技术的简要概述(干货)_第5张图片

通过“标记”或删除超出给定阈值的数据点，我们将数据分类为异常值，和非异常值。

对异常检测技术的简要概述(干货)_第6张图片

z - score是一种简单但强大的方法，如果你处理的是一个低维度特征空间的参数分布，就可以摆脱数据中的异常值。对于非参数问题， Dbscan和 Isolation Forests是很好的解决方案。

Dbscan

机器学习和数据分析聚类方法是帮助我们更好地可视化和理解数据的有用工具。数据集中的特性、趋势和种群之间的关系可以通过像dbscan这样的聚类方法来表示，也可以应用于许多维度上的非参数分布中的异常值。
Dbscan(Density Based Spatial Clustering of Applications with Noise)是基于密度的聚类算法,重点是发现邻居的密度(MinPts)在n维球体的半径ɛ。
集群可以被定义为特征空间中“密度连接点”的最大集合。

Dbscan定义不同类型的点:

核心点：A是一个核心的区域(ɛ所定义的)包含至少比参数MinPts同样多或更多的点。
边界点：C是一个位于集群中的边界点，它的邻域并不包含比MinPts更多的点，但它仍然是集群中其他点的“密度可达”。
离群点：N是一个离群点，在没有集群的情况下，它不是“密度可达”或“密度连接”到任何其他点。因此，这一点将有“他自己的集群”。

如果A是一个核心点，它就会形成一个集群，所有的点都可以从中得到。通过P可获得点P如果有一个路径 p1,…,pn 与 p1=p 和 pn=q ,其中每个 pi+1 是直接可以从 p (所有路径上的点必须核心点,可能 q 除外)。

可达性是一种非对称的关系，从定义上说，无论距离如何，都不能从非核心点到达任何点(因此，非核心点可能是可到达的，但它达不到任何点)。因此，需要进一步的连接概念来正式定义该算法所发现的集群的范围。

两个点p和q是密度连接的，如果有一个点o，那么p和q都是密度可达的。密度-连接度是对称的。

一个集群满足两个属性:

集群中的所有点都是相互关联的。
如果某个点从集群的任何一点处都可以到达，那么它也是集群的一部分。

scikit-learn有利用pandas实现的dbscan离群检测模型。
第一步是缩放数据,从半径ɛ随着MinPts定义邻域。(提示:对于手边的问题，一个好的scaler可以是scikit-learn的 Robust Scaler)。

在扩展特性空间之后，是时候选择dbscan执行集群的空间度量了。必须根据问题选择度量，欧几里得距离在二维或三维空间中工作得很好，在处理高维空间4或更多维度时，曼哈顿度距离也很有用。然后,根据聚类选择相应的参数eps(ɛ)。如果ɛ太大了许多点密度连接,如果太小聚类将导致许多无意义的集群。一个好的方法是尝试从0.25到0.75不等的值。

Dbscan对MinPts参数也很敏感，它将完全依赖于手动调整的问题。dbscan的复杂度为O(n log n)，它是一种具有中等大小的数据集的有效方法。当使用Scikit-learn的实现时，向模型提供数据是很容易的。在将dbscan安装到数据集群之后，可以提取并将每个样本分配给一个集群。Dbscan自己估计集群的数量，没有必要指定所需集群的数量，它是一个无监督机器学习模型。

异常值(噪声)将被分配给- 1集群。在标记这些实例之后，它们可以被删除或分析。

对异常检测技术的简要概述(干货)_第8张图片

Real world application of DBSCAN in housing prices (red:normal, black: outliers)

Isolation Forests

对异常检测技术的简要概述(干货)_第9张图片

最后，Isolation Forests是检测数据中的异常值或新奇事物的有效方法，它基于二叉决策树。scikit-learn的实现相对简单易懂。

Isolation Forests的基本原则是，离群值很少，而且远离其他观测值。为了构建树(训练)，该算法从特征空间随机抽取一个特征，并在最大值和最小值之间随机选择一个分割值。这是为训练集的所有观察值而制定的。为了建造森林，一棵树的集合是使森林里的所有树木都平均。然后，对于预测，它将观察值与“节点”中拆分值对比，该节点将有两个子节点，然后进行另一个随机比较。一个实例的算法所产生的“splittings”的数量被命名为:“路径长度”。正如预期的那样，离群值将比其他观测值的路径长度更长。
每个观测值可以计算出一个离群值:

对异常检测技术的简要概述(干货)_第10张图片

其中h(x)为样本x的路径长度，c(n)为二叉树的“不成功的长度搜索”(从根到外节点的二叉树的最大路径长度)n为外部节点数。在给每个观察值打分（得分从0到1不等）后，1代表更多的“孤立”和“0”意味着更正常。可以指定一个阈值，比如0.55或0.60。

提示:在scikit- learn的库中，分数移位了0.5和1，所以它返回 - 0.5到0.5的值，越大越正常，越小的越不正常。

总结（Conclusions）

Z-Score 优点

如果你可以用高斯分布来描述特征空间中的值，这是一种非常有效的方法。(参数)
使用pandas和scipy等库可以很容易实现。

Z-Score 缺点

在一个小到中等大小的数据集中，只有在低维的特征空间中使用。
当分布不能被假定为参数时，不建议使用。

Dbscan 优点

当特征空间中的值分布不是假设的时，这是一种非常有效的方法。
如果搜索异常值的特征空间是多维的(比如：3或更多的维度)，则可以很好地工作。
用Scikit learn实现简单，且文档很棒
可视化结果很简单，方法本身也很直观。

Dbscan 缺点

特征空间中的值需要相应地伸缩。
选择最优参数eps,MinPts和度规可能很困难，因为它对任何三个参数都非常敏感。
它是一个无监督的模型，需要在每次分析新的数据时重新校准。
它可以预测一次校准，但强烈不推荐。

Isolation Forest 优点

在特性空间中不需要缩放值。
当值分布不能被假设时，它是一种有效的方法。
它具有很少的参数，这使得该方法相当健壮且易于优化。
scikit- learn的实现很容易使用，而且文档非常出色。

Isolation Forest缺点

Python实现仅存在于Sklearn的开发版本中。
可视化的结果是复杂的。
如果没有正确的优化，训练时间可以很长，计算费用也很昂贵。

参考：
https://medium.com/towards-data-science/a-brief-overview-of-outlier-detection-techniques-1e0b2c19e561

如有不当之处，请留言！

你可能感兴趣的:(离群值,数据挖掘,数据异常,机器学习算法,异常检测技术,机器学习)

Java程序设计（二十四）：基于SSM框架的基于的快递代取系统的设计与实现人工智能_SYBH 2025年java程序设计 java python 开发语言 spring boot spring 后端
引言随着电子商务的发展，越来越多的高校学生通过网购获取日常所需物品，快递服务也逐渐成为大学生活中不可或缺的一部分。然而，繁忙的学习与生活让部分学生无法及时领取自己的快递，因此基于高校校园的快递代取服务应运而生。本文将详细介绍如何基于SSM（Spring、SpringMVC、MyBatis）技术栈设计并实现一个高校快递代取系统，解决高校学生快递代取问题。通过该系统，管理员、代取人和发布者三类用户可以
电脑访问京东云私有云盘，电脑如何访问京东云私有云盘 windows-server
服务器远程连接是指通过网络技术，在远程位置控制和访问服务器。通过远程连接，用户可以在任何地方登录到自己的服务器，进行各种操作，如安装软件、运行程序、管理文件等，就像直接在服务器前操作一样。今天小编给大家讲解电脑如何访问京东云私有云盘。要使用电脑访问京东云私有云盘，您可以按照以下步骤进行操作：1.登录京东云控制台：打开京东云官方网站，输入您的账号和密码进行登录。2.访问私有云盘：登录后，在控制台的导
服务行业的数据管理实践：TapData Cloud 如何助力连锁酒店物业的全球化运营优化数据库
使用TapData，化繁为简，摆脱手动搭建、维护数据管道的诸多烦扰，轻量替代OGG,Kettle等同步工具，以及基于Kafka的ETL解决方案，「CDC+流处理+数据集成」组合拳，加速仓内数据流转，帮助企业将真正具有业务价值的数据作用到实处，将“实时数仓”方法论落进现实。TapData持续迭代产品能力，优化用户体验的同时，也在不断探索各行各业数据需求的底层逻辑，力求为行业用户提供更加简洁、更具针对
DRG／DIP医保结算中的偏差病例 DIPDRG分组器团队 dip 大数据
低倍率病例什么是低倍率？1、《国家医疗保障疾病诊断相关分组（CHS-DRG）分组与付费技术规范》中规定低倍率病例入组后住院费用一般低于该DRG病组支付标准30％。2、DIP低倍率病例入组后住院费用一般低于该DIP病种次均费用50％。低倍率病例产生的主要原因一是入组错误，即主要诊断选择错误、其他诊断或手术操作错填等，导致错误入组；二是治疗不充分，即患者由于病情过重出现死亡或者自身意愿提前自动出院，整
国际网络专线怎么开通？蓝讯小刘网络
在全球化日益加速的今天，企业越来越需要稳定、高效的网络来支撑他们的跨国业务。国际网络专线，作为外贸企业、出海企业等拓展全球业务的关键基础设施，其重要性不言而喻。那么，企业如何才能开通国际网络专线呢？本文将详细解析开通流程，帮助您的企业顺利搭建起通往国际市场的桥梁。一、选择服务商开通国际网络专线的第一步，是选择一个可靠的服务商。服务商不仅提供物理的网络连接，更应具备专业知识和技术支持，确保您的企业网
如何应对访问国外服务器缓慢的问题？SDWAN组网是性价比之选蓝讯小刘服务器运维
在全球化日益加深的今天，企业经常需要访问国外的服务器以进行远程办公、跨国业务处理、数据传输和视频会议等。然而，不少企业在使用中遇到了访问速度缓慢的问题。本文将介绍几种有效的解决方案，帮助提高访问效率。首先，我们来分析一下访问缓慢的原因：1.政策限制：为了维护国家网络的安全与稳定，我国对部分国外网站和服务器有一定的访问限制。2.技术障碍：国内与国际互联网的网络架构和协议存在差异，这可能导致数据传输不
企业如何安全合规地访问海外网站蓝讯小刘安全
国际专线、SD-WAN线路与VPN的利弊与风险在全球化背景下，中国的外贸企业以及海外公司分支机构、科研研发机构等，都需要频繁访问海外网站以开展正常业务。然而，企业访问海外网站的技术方式存在一定的合规风险。本文将概述三种访问海外网站的技术方式：国际专线、SD-WAN线路和VPN，并分析其利弊与风险。1.国际专线：这是一种合法合规的访问海外网站的方式，由国内三大通讯运营商授权或授权代理机构开通。虽然费
TikTok海外直播网络专线费用解析：跨境电商的网络新选择蓝讯小刘网络
在全球化的大潮中，跨境电商成为了连接不同国家和地区经济的重要桥梁。而要实现高效的跨境电商运营，稳定、高速的网络连接是必不可少的。TikTok海外直播网络专线即SD-WAN国际专线（就是土豆和马铃薯的区别），以其独特的优势，正逐渐成为跨境电商企业的首选网络解决方案。本文将深入解析SD-WAN国际专线的费用构成，并探讨其对全球跨境电商的影响。一、SD-WAN技术：跨境电商的网络新动力SD-WAN，即软
ESP32-C3入门教程基础篇④——ADC（模拟量转数字量）单次读取简单实例小康师兄 ESP32-C3入门教程 ESP32 ESP32-C3 ADC 模数转换模拟量转数字量
文章目录一、前言二、硬件接线三、知识点3.1ADC电压范围3.2ADC精度3.3ADC校准3.4ADC读取四、全部源码五、运行演示六、参考一、前言本文基于VSCodeIDE进行编程、编译、下载、运行等操作基础入门章节请查阅：ESP32-C3入门教程基础篇①——基于VSCode构建HelloWorld教程目录大纲请查阅：ESP32-C3入门教程——导读ADC转换是将输入模拟电压转换为数字值。ADC原
【趣学SQL】第三章：数据处理与管理 3.2 分区表与分区索引——给数据库做“分舱救灾“的硬核指南精通代码大仙数据库 sql
第三章：数据处理与管理3.2分区表与分区索引——给数据库做"分舱救灾"的硬核指南欢迎来到「数据库装修大队」！今天我们将化身"数据空间规划师"，用一家年订单量破亿的外卖平台崩溃案例，教你如何像整理衣柜一样优雅管理海量数据。3.2.1分区表的概念——当数据库变成"春运火车站"血泪案例：某外卖平台未做分区，导致：查询3个月前的订单需要扫描20亿行数据促销活动时数据库IOPS飙到10万+（相当于春运期间所
如何修改Chromium内核|浏览器指纹伪装|Puppeteer指纹|Playwright指纹- Chromium内核修改与浏览器指纹伪装方法-anti-fingerprint指纹浏览器如何搭建环境药尘韩立前端 javascript 开发语言 python 自动化 ai
Chromium内核是许多现代浏览器的基础，如Chrome和Edge。在进行网络爬取、自动化测试或数据挖掘等任务时，使用Puppeteer或Playwright等工具时，浏览器指纹的重要性不言而喻。本文将介绍如何修改Chromium内核以及浏览器指纹伪装的方法，以构建一个抗指纹的浏览环境。首先，了解如何修改Chromium内核是至关重要的。您可以从Chromium源代码仓库中获取最新的代码，并根据
用文字“画出”流程图：用 AI+Mermaid.js 构建出你心中的可视化世界敏编程流程图 javascript mermaid
Mermaid介绍首先，什么是Mermaid?Mermaid.js是一款开源流程图/序列图的文本制作工具，它允许你使用简单的文本语法来创建各种类型的图表。无论你是开发者、学生还是普通用户，Mermaid.js都能帮助你将复杂的信息以直观、易懂的方式呈现出来。在AI技术的加持下，Mermaid现已支持把用户内容自动转成对应的文本语法，从而达到自动生成流程图的目地。这不仅提高了工作效率，还使非专业用户
网络传输中的三张表，MAC地址表、ARP缓存表以及路由表 h490516509 网络编程
一：MAC地址表详解说到MAC地址表，就不得不说一下交换机的工作原理了，因为交换机是根据MAC地址表转发数据帧的。在交换机中有一张记录着局域网主机MAC地址与交换机接口的对应关系的表，交换机就是根据这张表负责将数据帧传输到指定的主机上的。交换机的工作原理交换机在接收到数据帧以后，首先、会记录数据帧中的源MAC地址和对应的接口到MAC表中，接着、会检查自己的MAC表中是否有数据帧中目标MAC地址的信
python3.10运行moviepy失败 fendouweiqian Python python
运行异常：Nomodulenamed‘moviepy.editor’python版本为：3.10.12修复方案：pipuninstallmoviepypipinstallmoviepy==1.0.3
工程项目管理流程示意图数据可视化
借助图形天下强大的关系数据可视化技术，该流程图清晰地展示了工程项目从立项到结束的完整流程。从开始的立项、文档评审，到工程量清单、价格咨询，再到招投标、签订合同、开展工程，直至最后的结算和收尾工作，每一环节都紧密相连，通过直观的图形展示，使得复杂的关系数据可视化，便于理解和管理整个项目流程。工程项目管理流程示意图这一流程不仅确保了项目的顺利推进，还有效监控
系统安全架构之车辆网络安全架构小正太浩二安全架构 web安全架构
一、简介随着汽车的智能化和互联化，车辆网络安全架构的重要性日益凸显。现代汽车越来越依赖于计算机和网络技术，车载电子设备数量增加，不同设备之间的互联性增强，这使得车辆网络系统容易受到网络攻击。对于汽车而言，安全问题已经不再只是关乎车辆本身的问题，而是涉及到了乘客的安全和隐私，甚至是道路安全和整个社会的安全。因此，确保车辆网络的安全性和可靠性已成为了汽车安全的重要组成部分。二、车辆网络安全的威胁和挑战
MySQL通过binlog恢复数据鲁班班 mysql 数据库
MySQL通过binlog恢复数据一、背景在MySQL中，如果不小心删除了数据，可以利用二进制日志（binlog）来恢复数据。实质就是将binlog记录中的事件再次执行一遍。二、前提条件启用二进制日志：确保MySQL启用了二进制日志功能。有足够的权限：确保有权限访问和读取二进制日志文件。三、恢复步骤找到相关的二进制日志文件：查看是否开启二进制日志文件SHOWVARIABLESLIKE'log_bi
【深度学习】常见模型-卷积神经网络（Convolutional Neural Networks, CNN） IT古董人工智能深度学习机器学习深度学习 cnn 人工智能
卷积神经网络（CNN）概念简介卷积神经网络（ConvolutionalNeuralNetworks,CNN）是一种专门用于处理数据具有网格状拓扑结构（如图像、语音）的深度学习模型。它通过卷积操作从输入数据中提取局部特征，并逐层构建更复杂的特征表示，广泛应用于图像分类、目标检测、语音识别等领域。关键组成部分卷积层（ConvolutionalLayer）使用卷积核（滤波器）在输入上滑动，提取局部特征。
solidity基础 -- 映射迭代第十六年盛夏. Solidity 区块链智能合约
前提提要本文中出现的所有代码均可在本人GitHubGitHub--solidity学习代码中查询到基本概念在Solidity中，映射是一种非常有用的数据结构，它允许我们通过键来快速访问值。然而，映射本身是不可迭代的，这意味着我们不能直接遍历映射中的所有键值对。在某些情况下，我们需要对映射中的数据进行迭代操作，例如在处理用户余额、资产记录等场景时。为了实现映射的迭代功能，我们可以结合使用数组和映射来
solidity基础 -- 合约结构第十六年盛夏. Solidity 区块链智能合约
所有本篇以及以前出现的代码均可以在本人GitHubGitHub-solidity学习代码上找到合约结构在Solidity中，合约类似于面向对象编程语言中的类。每个合约中可以包含状态变量、函数、函数修饰器、事件、结构类型、和枚举类型的声明，且合约可以从其他合约继承。状态变量状态变量是永久地存储在合约存储中的值。pragmasolidity^0.4.0;contractSimpleStorage{ui
NVIDIA L40s、A10、A40、A100、A6000横评，哪个GPU 更适合 AI 推理任务？ DO_Community 技术科普商业建议人工智能 gpu算力 DigitalOcean ai AIGC
近年来，随着人工智能技术的发展，特别是深度学习模型的广泛应用，GPU（图形处理单元）作为加速计算的重要硬件，在AI领域扮演着越来越重要的角色。AI推理是指已经训练好的模型对新数据进行预测的过程。与训练阶段相比，推理通常对GPU的要求有所不同，更注重于能效比、延迟以及并发处理能力。本文将从这些角度出发，对比分析NVIDIA的L40s、A10、A40、A100、A6000五款GPU在AI推理任务中的表
ARM 处理器架构简介 ASMARM ARM ARM 处理器架构
ARM架构是构建每个ARM处理器的基础。ARM架构随着时间的推移不断发展，其中包含的架构功能可满足不断增长的新功能、高性能需求以及新兴市场的需要。有关最新公布版本的信息，请参阅ARMv8架构。ARM架构支持跨跃多个性能点的实现，并已在许多细分市场中成为主导的架构。ARM架构支持非常广泛的性能点，因而可以利用最新的微架构技术获得极小的ARM处理器实现和极有效的高级设计实现。实现规模、性能和低功耗是A
【趋势】《2024—2026金融科技十大趋势预测》一览学客汇商业研究商业观察人工智能大数据金融科技科技洞察 IT趋势金融行业预测
本白皮书基于新华三在金融行业的前沿实践和IDC的全球研究成果，深入分析了金融科技领域的十大关键趋势，旨在为金融机构提供前瞻性的战略指导和业务创新的参考。导言当前，在地缘政治冲突加剧、商业经济市场环境高度不确定、数字化业务加速发展的背景下，金融行业处于深度变革的潮流中，金融机构亟需重新思考其在技术支出、业务决策及业务创新发展等方面的投资重点。此外，金融机构也越来越需要借助大数据和AI技术来提升业务的
航空客户价值的数据挖掘与分析（numpy+pandas+matplotlib+scikit-learn） Want595 Python数据分析数据挖掘 numpy pandas
文章目录航空客户价值的数据挖掘与分析（numpy+pandas+matplotlib+scikit-learn）写在前面背景与挖掘目标1.1需求背景1.2挖掘目标1.3项目概述项目分析方法规划2.1RFM模型2.2LRFMC模型指标2.3分析总体流程图数据抽取探索及预处理3.1数据抽取3.2数据探索分析3.3数据预处理3.3.1数据清洗3.3.2属性规约3.3.3数据变换数据建模&应用4.1模型构
mysql 学习3 SQL语句--整体概述。SQL通用语法；DDL创建数据库，查看数据库，删除数据库，使用数据库； hunandede mysql 学习 sql
SQL通用语法SQL语句分类DDLdatadefinitionlanguage:用来创建数据库，创建表，创建表中的字段，创建索引。因此成为数据定义语言DMLdatamanipulationlanguage有了数据库和表以及字段后，那么我们就需要给这个表中添加数据，删除数据，改动数据，这些都是对数据有改动的行为，因此叫做数据操作语言manipulation中文是操作的意思DQLdataqueryla
【趣学SQL】第八章：SQL 实战案例 8.2 SQL 性能监控与调优——给数据库装上“心电图仪“的硬核指南精通代码大仙数据库数据库 sql
第八章：SQL最佳实践8.2SQL性能监控与调优——给数据库装上"心电图仪"的硬核指南欢迎来到「数据库急诊监护室」！今天我们将化身"SQL性能侦探"，用一家日活百万的虚拟吃瓜论坛"瓜田社"的崩库案例，教你如何用监控工具抓住"性能杀手"，让数据库从"垂死挣扎"变"生龙活虎"。8.2.1常见的监控工具——数据库的"健康手环"全家桶工具1：Prometheus+Grafana（豪华体检套餐）#prome
跨域问题及其解决方案山禾女鬼001 网络网络协议
在现代Web开发中，跨域问题是开发者经常遇到的一个难题，尤其是在前后端分离架构中。跨域问题的核心在于浏览器的同源策略，这种策略的设计目的是防止恶意网站窃取用户的数据。然而，在一些场景下，比如前后端分离的Web应用中，前端需要访问不同域的资源，这时就会遇到跨域请求的问题。为了解决这个问题，CORS（跨域资源共享）机制应运而生。本文将详细探讨跨域问题的成因、CORS机制的工作原理以及常见的跨域解决方案
什么是CSP？全面了解内容安全策略（Content Security Policy）山禾女鬼001 网络协议网络安全
CSP（ContentSecurityPolicy）是一种网络安全机制，旨在减少或消除跨站脚本（XSS）和数据注入攻击。它通过提供一种允许网站管理员控制哪些资源可以在网页中加载、执行，从而有效提升网站的安全性。CSP的基本概念CSP的核心思想是，通过限制网页可以加载的外部资源，防止恶意脚本通过第三方资源注入到网站中。具体来说，CSP通过一个名为Content-Security-Policy的HTT
【Java】常用工具类方法：树形结构、获取IP、对象拷贝、File相关、雪花算法等 PlanOne_A java 算法
1、生成子孙树/***生成子孙树**@paramdataArray遍历所有数据,每个数据加到其父节点下*@return子孙树json*/publicstaticJSONArraymakeTree(JSONArraydataArray){List>data=newArrayListmap=newHashMap>res=newArrayList>map=newHashMapvo:data){map.p
浅谈Linux C基础9----数据链表 Oracle_666 linux c语言运维
前言:基于C语言实现数据链表1.实现代码函数:#include"loop_list.h"//创建单向循环链表node_pcreate_loop(){node_pH=(node_p)malloc(sizeof(node));if(H==NULL){printf("空间申请失败\n");returnNULL;}H->data=0;//链表中暂无数据H->next=H;//单向循环链表，尾结点指向头结点
PHP，安卓，UI，java，linux视频教程合集 cocos2d-x小菜 java UI PHP android linux
╔-----------------------------------╗┆
各表中的列名必须唯一。在表 'dbo.XXX' 中多次指定了列名 'XXX'。 bozch .net .net mvc
在.net mvc5中，在执行某一操作的时候，出现了如下错误：各表中的列名必须唯一。在表 'dbo.XXX' 中多次指定了列名 'XXX'。经查询当前的操作与错误内容无关，经过对错误信息的排查发现，事故出现在数据库迁移上。回想过去：在迁移之前已经对数据库进行了添加字段操作，再次进行迁移插入XXX字段的时候，就会提示如上错误。 &
Java 对象大小的计算 e200702084 java
Java对象的大小如何计算一个对象的大小呢？
Mybatis Spring 171815164 mybatis
ApplicationContext ac = new ClassPathXmlApplicationContext("applicationContext.xml"); CustomerService userService = (CustomerService) ac.getBean("customerService"); Customer cust
JVM 不稳定参数 g21121 jvm
-XX 参数被称为不稳定参数，之所以这么叫是因为此类参数的设置很容易引起JVM 性能上的差异，使JVM 存在极大的不稳定性。当然这是在非合理设置的前提下，如果此类参数设置合理讲大大提高JVM 的性能及稳定性。可以说“不稳定参数”
用户自动登录网站永夜-极光用户
1.目标:实现用户登录后,再次登录就自动登录,无需用户名和密码 2.思路:将用户的信息保存为cookie 每次用户访问网站,通过filter拦截所有请求,在filter中读取所有的cookie,如果找到了保存登录信息的cookie,那么在cookie中读取登录信息,然后直接
centos7 安装后失去win7的引导记录程序员是怎么炼成的操作系统
1.使用root身份(必须)打开 /boot/grub2/grub.cfg 2.找到 ### BEGIN /etc/grub.d/30_os-prober ### 在后面添加 menuentry "Windows 7 (loader) (on /dev/sda1)" {
Oracle 10g 官方中文安装帮助文档以及Oracle官方中文教程文档下载 aijuans oracle
Oracle 10g 官方中文安装帮助文档下载：http://download.csdn.net/tag/Oracle%E4%B8%AD%E6%96%87API%EF%BC%8COracle%E4%B8%AD%E6%96%87%E6%96%87%E6%A1%A3%EF%BC%8Coracle%E5%AD%A6%E4%B9%A0%E6%96%87%E6%A1%A3 Oracle 10g 官方中文教程
JavaEE开源快速开发平台G4Studio_V3.2发布了無為子 AOP oracle mysql javaee G4Studio
我非常高兴地宣布,今天我们最新的JavaEE开源快速开发平台G4Studio_V3.2版本已经正式发布。大家可以通过如下地址下载。访问G4Studio网站 http://www.g4it.org G4Studio_V3.2版本变更日志功能新增 (1).新增了系统右下角滑出提示窗口功能。 (2).新增了文件资源的Zip压缩和解压缩
Oracle常用的单行函数应用技巧总结百合不是茶日期函数转换函数(核心)数字函数通用函数(核心)字符函数
单行函数; 字符函数,数字函数,日期函数,转换函数(核心),通用函数(核心) 一:字符函数: .UPPER(字符串) 将字符串转为大写 .LOWER (字符串) 将字符串转为小写 .INITCAP(字符串) 将首字母大写 .LENGTH (字符串) 字符串的长度 .REPLACE(字符串,'A','_') 将字符串字符A转换成_
Mockito异常测试实例 bijian1013 java 单元测试 mockito
Mockito异常测试实例： package com.bijian.study; import static org.mockito.Mockito.mock; import static org.mockito.Mockito.when; import org.junit.Assert; import org.junit.Test; import org.mockito.
GA与量子恒道统计 Bill_chen JavaScript 浏览器百度 Google 防火墙
前一阵子，统计**网址时，Google Analytics（GA）和量子恒道统计（也称量子统计），数据有较大的偏差，仔细找相关资料研究了下，总结如下：为何GA和量子网站统计（量子统计前身为雅虎统计）结果不同？首先：没有一种网站统计工具能保证百分之百的准确出现该问题可能有以下几个原因：（1）不同的统计分析系统的算法机制不同；（2）统计代码放置的位置和前后
【Linux命令三】Top命令 bit1129 linux命令
Linux的Top命令类似于Windows的任务管理器，可以查看当前系统的运行情况，包括CPU、内存的使用情况等。如下是一个Top命令的执行结果： top - 21:22:04 up 1 day, 23:49, 1 user, load average: 1.10, 1.66, 1.99 Tasks: 202 total, 4 running, 198 sl
spring四种依赖注入方式白糖_ spring
平常的java开发中，程序员在某个类中需要依赖其它类的方法，则通常是new一个依赖类再调用类实例的方法，这种开发存在的问题是new的类实例不好统一管理，spring提出了依赖注入的思想，即依赖类不由程序员实例化，而是通过spring容器帮我们new指定实例并且将实例注入到需要该对象的类中。依赖注入的另一种说法是“控制反转”，通俗的理解是：平常我们new一个实例，这个实例的控制权是我
angular.injector boyitech AngularJS AngularJS API
angular.injector 描述: 创建一个injector对象, 调用injector对象的方法可以获得angular的service, 或者用来做依赖注入. 使用方法: angular.injector(modules, [strictDi]) 参数详解: Param Type Details mod
java-同步访问一个数组Integer[10]，生产者不断地往数组放入整数1000，数组满时等待；消费者不断地将数组里面的数置零，数组空时等待 bylijinnan Integer
public class PC { /** * 题目：生产者-消费者。 * 同步访问一个数组Integer[10]，生产者不断地往数组放入整数1000，数组满时等待；消费者不断地将数组里面的数置零，数组空时等待。 */ private static final Integer[] val=new Integer[10]; private static
使用Struts2.2.1配置 Chen.H apache spring Web xml struts
Struts2.2.1 需要如下 jar包: commons-fileupload-1.2.1.jar commons-io-1.3.2.jar commons-logging-1.0.4.jar freemarker-2.3.16.jar javassist-3.7.ga.jar ognl-3.0.jar spring.jar struts2-core-2.2.1.jar struts2-sp
[职业与教育]青春之歌 comsci 教育
每个人都有自己的青春之歌............但是我要说的却不是青春... 大家如果在自己的职业生涯没有给自己以后创业留一点点机会,仅仅凭学历和人脉关系,是难以在竞争激烈的市场中生存下去的.... &nbs
oracle连接(join)中使用using关键字 daizj JOIN oracle sql using
在oracle连接(join)中使用using关键字 34. View the Exhibit and examine the structure of the ORDERS and ORDER_ITEMS tables. Evaluate the following SQL statement: SELECT oi.order_id, product_id, order_date FRO
NIO示例 daysinsun nio
NIO服务端代码： public class NIOServer { private Selector selector; public void startServer(int port) throws IOException { ServerSocketChannel serverChannel = ServerSocketChannel.open(
C语言学习homework1 dcj3sjt126com c homework
0、课堂练习做完 1、使用sizeof计算出你所知道的所有的类型占用的空间。 int x; sizeof(x); sizeof(int); # include <stdio.h> int main(void) { int x1; char x2; double x3; float x4; printf(&quo
select in order by , mysql排序 dcj3sjt126com mysql
If i select like this: SELECT id FROM users WHERE id IN(3,4,8,1); This by default will select users in this order 1,3,4,8, I would like to select them in the same order that i put IN() values so:
页面校验-新建项目 fanxiaolong 页面校验
$(document).ready( function() { var flag = true; $('#changeform').submit(function() { var projectScValNull = true; var s =""; var parent_id = $("#parent_id").v
Ehcache（02）——ehcache.xml简介 234390216 ehcache ehcache.xml 简介
ehcache.xml简介 ehcache.xml文件是用来定义Ehcache的配置信息的，更准确的来说它是定义CacheManager的配置信息的。根据之前我们在《Ehcache简介》一文中对CacheManager的介绍我们知道一切Ehcache的应用都是从CacheManager开始的。在不指定配置信
junit 4.11中三个新功能 jackyrong java
junit 4.11中两个新增的功能，首先是注解中可以参数化，比如 import static org.junit.Assert.assertEquals; import java.util.Arrays; import org.junit.Test; import org.junit.runner.RunWith; import org.junit.runn
国外程序员爱用苹果Mac电脑的10大理由 php教程分享 windows PHP unix Microsoft perl
Mac 在国外很受欢迎，尤其是在设计/web开发/IT 人员圈子里。普通用户喜欢 Mac 可以理解，毕竟 Mac 设计美观，简单好用，没有病毒。那么为什么专业人士也对 Mac 情有独钟呢？从个人使用经验来看我想有下面几个原因： 1、Mac OS X 是基于 Unix 的这一点太重要了，尤其是对开发人员，至少对于我来说很重要，这意味着Unix 下一堆好用的工具都可以随手捡到。如果你是个 wi
位运算、异或的实际应用 wenjinglian 位运算
一．位操作基础，用一张表描述位操作符的应用规则并详细解释。二．常用位操作小技巧，有判断奇偶、交换两数、变换符号、求绝对值。三．位操作与空间压缩，针对筛素数进行空间压缩。 &n
weblogic部署项目出现的一些问题（持续补充中……） Everyday都不同 weblogic部署失败
好吧，weblogic的问题确实…… 问题一： org.springframework.beans.factory.BeanDefinitionStoreException: Failed to read candidate component class: URL [zip:E:/weblogic/user_projects/domains/base_domain/serve
tomcat7性能调优（01） toknowme tomcat7
Tomcat优化： 1、最大连接数最大线程等设置 <Connector port="8082" protocol="HTTP/1.1" useBodyEncodingForURI="t
PO VO DAO DTO BO TO概念与区别 xp9802 java DAO 设计模式 bean 领域模型
O/R Mapping 是 Object Relational Mapping（对象关系映射）的缩写。通俗点讲，就是将对象与关系数据库绑定，用对象来表示关系数据。在O/R Mapping的世界里，有两个基本的也是重要的东东需要了解，即VO，PO。它们的关系应该是相互独立的，一个VO可以只是PO的部分，也可以是多个PO构成，同样也可以等同于一个PO（指的是他们的属性）。这样，PO独立出来，数据持

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他