fufeng_andy

聚类分析（七）离群点分析

一、 什么是离群点分析

1 、什么是离群点？

在样本空间中，与其他样本点的一般行为或特征不一致的点，我们称为离群点。

2 、离群点产生的原因？

第一，计算的误差或者操作的错误所致，比如：某人的年龄 -999 岁，这就是明显由误操作所导致的离群点；

第二，数据本身的可变性或弹性所致，比如：一个公司中 CEO 的工资肯定是明显高于其他普通员工的工资，于是 CEO 变成为了由于数据本身可变性所导致的离群点。

3 、为什么要对离群点进行检测？

“一个人的噪声也许是其他的信号”。换句话说，这些离群点也许正是用户感兴趣的，比如在欺诈检测领域，那些与正常数据行为不一致的离群点，往往预示着欺诈行为，因此成为执法者所关注的。

4 、离群点检测遇到的困难？

第一，在时间序列样本中发现离群点一般比较困难，因为这些离群点可能会隐藏在趋势、季节性或者其他变化中；

第二，对于维度为非数值型的样本，在检测过程中需要多加考虑，比如对维度进行预处理等；

第三，针对多维数据，离群点的异常特征可能是多维度的组合，而不是单一维度就能体现的。

二、 几类离群点检测方法

1 、基于统计分布的离群点检测

这类检测方法假设样本空间中所有数据符合某个分布或者数据模型，然后根据模型采用不和谐校验（ discordancy test ）识别离群点。不和谐校验过程中需要样本空间数据集的参数知识（ eg: 假设的数据分布），分布的参数知识（ eg: 期望和方差）以及期望的离群点数目。

不和谐校验分两个过程：工作假设和备选假设

工作假设指的是如果某样本点的某个统计量相对于数据分布的是显著性概率充分小，那么我们则认为该样本点是不和谐的，工作假设被拒绝，此时备用假设被采用，它声明该样本点来自于另一个分布模型。

如果某个样本点不符合工作假设，那么我们认为它是离群点。如果它符合备选假设，我们认为它是符合某一备选假设分布的离群点。

基于统计分布的离群点检测的缺点：

第一，在于绝大多数不和谐校验是针对单个维度的，不适合多维度空间；

第二，需要预先知道样本空间中数据集的分布特征，而这部分知识很可能是在检测前无法获得的。

2 、基于距离的离群点检测

基于距离的离群点检测指的是，如果样本空间 D 中至少有 N 个样本点与对象 O 的距离大于 dmin, 那么称对象 O 是以 { 至少 N 个样本点 } 和 dmin 为参数的基于距离的离群点。

其实可以证明，在大多数情况下，如果对象 O 是根据基于统计的离群点检测方法发现出的离群点，那么肯定存在对应的 N 和 dmin ，是它也成为基于距离的离群点。

Eg: 假设标准正态分布，如果离均值偏差 3 或更大的对象认为是离群点，根据正态曲线概率密度函数， P （ |x-3|<=dmin ） <1-N/ 总点数，即 P （ 3-dim= ） <1-N/ 总点数，假设 dmin=0.13, 则该 dmin 领域表示 [2.87,3.13] 的范围，假设总点数 =10000, N=12.

基于距离的离群点检测的缺点 :

要求数据分布均匀，当数据分布非均匀时，基于距离的离群点检测将遇到困难。

3 、基于密度的局部离群点检测

什么是局部离群点？

一个对象如果是局部离群点，那么相对于它的局部领域，它是远离的。

不同于前面的方法，基于密度的局部离群点检测不将离群点看做一种二元性质，即不简单用 Yes or No 来断定一个点是否是离群点，而是用一个权值来评估它的离群度。

它是局部的，意思是该程度依赖于对象相对于其领域的孤立情况。这种方法可以同时检测出全局离群点和局部离群点。

通过基于密度的局部离群点检测就能在样本空间数据分布不均匀的情况下也可以准确发现离群点。

4 、基于偏差的离群点检测

基于偏差的离群点检测，它通过检查一组对象的主要特征来识别离群点，“偏差”这种特征的点我们认为是离群点。

通常有两种技术：

第一，顺序异常技术

第二，采用 OLAP 数据立方体技术

三、 基于密度的局部离群点检测

前面介绍了什么叫做基于密度的局部离群点检测，以及它的优势。现在详细介绍下它的一些概念。

1、对象 p 的第 k 距离

对于正整数 k, 对象 p 的第 k 距离可记作 k-distance(p) 。

在样本空间中，存在对象 o ，它与对象 p 之间的距离记作 d(p,o) 。如果满足以下两个条件，我们则认为 k-distance(p)= d(p,o)

1）在样本空间中，至少存在 k 个对象 q, 使得 d(p,q)<= d(p,o);

2）在样本空间中，至多存在 k-1 个对象 q, 使得 d(p,q)

换句话说，满足这两个标准的 k-distance(p) 其实就是计算样本空间中其他对象与对象 p 之间的距离，然后找到第 k 大的那个距离，即为 k-distance(p) 。显而易见，如果使用 k-distance(p) 来量化对象 p 的局部空间区域范围，那么对于对象密度较大的区域， k-distance(p) 值较小，而对象密度较小的区域， k-distance(p) 值较大。

2、对象 p 的第 k 距离领域（ k-distance neighborhood of an object p ）

已知对象 p 的第 k 距离，那么，与对象 p 之间距离小于等于 k-distance(p) 的对象集合称为对象 p 的第 k 距离领域，记作： N_kdis(p) (p)

该领域其实是以 p 为中心， k-distance(p) 为半径的区域内所有对象的集合（不包括 P 本身）。由于可能同时存在多个第 k 距离的数据，因此该集合至少包括 k 个对象。

可以想象，离群度较大的对象 N_kdis(p) (p) 范围往往比较大，而离群度小的对象 N_kdis(p) (p) 范围往往比较小。对于同一个类簇中的对象来说，它们涵盖的区域面积大致相当。

3、对象 p 相对于对象 o 的可达距离

可达距离 reachdis_k (p,o)=max{ k-distance(o),d(p,o)}, 即 k-distance(o) 和 d(p,o) 值较大的那个。

4、局部可达密度是基于 p 的 k 最近邻点的平均可达密度的倒数。如下

可以发现，如果对象 p 的离群度较小，那么对于同一类簇的数据对象 reachdis_k (p,o) 取 k-distance(o) 可能性较大，因此它们的 Lrd_k (p) 值波动性较小；而如果对象 p 的利群度较大，那么 reachdis_k (p,o) 取 d(p,o) 的可能性较大，对于同一类簇的数据对象，它们的 Lrd_k (p) 值波动性也比较大，并且 Lrd_k (p) 值较小。

5、局部离群点因子（ LOF ）

它代表了 p 为离群点的程度。如果对象 p 的离群程度较大，则它 k 领域中大多数是离对象 p 较远且处于某一个类簇的数据对象，那么这些数据对象的 lrd 应该是偏大，而对象 p 本身的 lrd 是偏小，最后所得的 LOF 值也是偏大。反之，如果对象 p 的离群程度较小，对象 o 的 lrd 和对象 p 的 lrd 相似，最后所得的 lof 值应该接近 1.

四、 算法实现

算法：基于密度的局部离群点检测（ lof 算法）

输入：样本集合 D ，正整数 K （用于计算第 K 距离）

输出：各样本点的局部离群点因子

过程： 1 ）计算每个对象与其他对象的欧几里得距离

2 ）对欧几里得距离进行排序，计算第 k 距离以及第 K 领域

3 ）计算每个对象的可达密度

4 ）计算每个对象的局部离群点因子

5 ）对每个点的局部离群点因子进行排序，输出。

-------------------------------------------------------------------

源码：

package com.lof;

import java.util.ArrayList;
import java.util.List;

public class Node {
    private String nodeName; // 样本点名
    private double[] dimensioin; // 样本点的维度
    private double kDistance; // k-距离
    private List kNeighbor=new ArrayList();// k-领域
    private double distance; //到给定点的欧几里得距离
    private double reachDensity;// 可达密度
    private double reachDis;// 可达距离

    private double lof;//局部离群因子

    public Node(){

    }

    public Node(String nodeName,double[] dimensioin){
        this.nodeName=nodeName;
        this.dimensioin=dimensioin;
    }

    public String getNodeName() {
        return nodeName;
    }

    public void setNodeName(String nodeName) {
        this.nodeName = nodeName;
    }

    public double[] getDimensioin() {
        return dimensioin;
    }

    public void setDimensioin(double[] dimensioin) {
        this.dimensioin = dimensioin;
    }

    public double getkDistance() {
        return kDistance;
    }

    public void setkDistance(double kDistance) {
        this.kDistance = kDistance;
    }

    public List getkNeighbor() {
        return kNeighbor;
    }

    public void setkNeighbor(List kNeighbor) {
        this.kNeighbor = kNeighbor;
    }

    public double getDistance() {
        return distance;
    }

    public void setDistance(double distance) {
        this.distance = distance;
    }

    public double getReachDensity() {
        return reachDensity;
    }

    public void setReachDensity(double reachDensity) {
        this.reachDensity = reachDensity;
    }

    public double getReachDis() {
        return reachDis;
    }

    public void setReachDis(double reachDis) {
        this.reachDis = reachDis;
    }

    public double getLof() {
        return lof;
    }

    public void setLof(double lof) {
        this.lof = lof;
    }

}

package com.lof;

import java.util.ArrayList;
import java.util.Collections;
import java.util.Comparator;
import java.util.List;

public class OutlierNodeDetect {
    private static int MIN_PTS=5;

    //1.找到给定点与其他点的欧几里得距离
    //2.对欧几里得距离进行排序，找到前5位的点，并同时记下k距离
    //3.计算每个点的可达密度
    //4.计算每个点的局部离群点因子
    //5.对每个点的局部离群点因子进行排序，输出。
    public List getOutlierNode(List allNodes){

       List kdAndKnList=getKDAndKN(allNodes);
       calReachDis(kdAndKnList);
       calReachDensity(kdAndKnList);
       calLof(kdAndKnList);
       Collections.sort(kdAndKnList, new LofComparator());

       return kdAndKnList;
    }


    private void calLof(List kdAndKnList){
        for(Node node:kdAndKnList){
            List tempNodes=node.getkNeighbor();
            double sum=0.0;
            for(Node tempNode:tempNodes){
                double rd=getRD(tempNode.getNodeName(),kdAndKnList);
                sum=rd/node.getReachDensity()+sum;
            }
            sum=sum/(double)MIN_PTS;
            node.setLof(sum);
        }
    }


    private void calReachDensity(List kdAndKnList){
        for(Node node:kdAndKnList){
            List tempNodes=node.getkNeighbor();
            double sum=0.0;
            double rd=0.0;
            for(Node tempNode:tempNodes){
                sum=tempNode.getReachDis()+sum;
            }
             rd=(double)MIN_PTS/sum;
             node.setReachDensity(rd);
        }
    }


    private void calReachDis(List kdAndKnList){
       for(Node node:kdAndKnList){
           List tempNodes=node.getkNeighbor();
           for(Node tempNode:tempNodes){
              double kDis=getKDis(tempNode.getNodeName(),kdAndKnList);
              if(kDis                 tempNode.setReachDis(tempNode.getDistance());
              }else{
                tempNode.setReachDis(kDis);
              }
           }
       }
    }

    private double getKDis(String nodeName,List nodeList){
        double kDis=0;
        for(Node node:nodeList){
            if(nodeName.trim().equals(node.getNodeName().trim())){
                kDis=node.getkDistance();
                break;
            }
        }
        return kDis;

    }


    private double getRD(String nodeName,List nodeList){
        double kDis=0;
        for(Node node:nodeList){
            if(nodeName.trim().equals(node.getNodeName().trim())){
                kDis=node.getReachDensity();
                break;
            }
        }
        return kDis;

    }


    private List getKDAndKN(List allNodes){
       List kdAndKnList=new ArrayList();
       for(int i=0;i            List tempNodeList=new ArrayList();
           Node nodeA=new Node(allNodes.get(i).getNodeName(),allNodes.get(i).getDimensioin());
           for(int j=0;j               Node nodeB=new Node(allNodes.get(j).getNodeName(),allNodes.get(j).getDimensioin());
              double tempDis=getDis(nodeA,nodeB);
              nodeB.setDistance(tempDis);
              tempNodeList.add(nodeB);
           }

           //对tempNodeList进行排序
           Collections.sort(tempNodeList, new DistComparator());
           for(int k=1;k                nodeA.getkNeighbor().add(tempNodeList.get(k));
               if(k==MIN_PTS-1){
                   nodeA.setkDistance(tempNodeList.get(k).getDistance());
               }
           }
           kdAndKnList.add(nodeA);
       }

       return kdAndKnList;
    }


    private double getDis(Node A,Node B){
        double dis=0.0;
        double[] dimA=A.getDimensioin();
        double[] dimB=B.getDimensioin();
        if (dimA.length == dimB.length) {
            for (int i = 0; i < dimA.length; i++) {
                double temp = Math.pow(dimA[i] - dimB[i], 2);
                dis = dis + temp;
            }
            dis=Math.pow(dis, 0.5);
        }
        return dis;
    }

    class DistComparator implements Comparator{
        public int compare(Node A, Node B){
           return A.getDistance()-B.getDistance()<0?-1:1;
        }
    }

    class LofComparator implements Comparator{
        public int compare(Node A, Node B){
           return A.getLof()-B.getLof()<0?-1:1;
        }
    }

    public static void main(String[] args){
        ArrayList dpoints = new ArrayList();

        double[] a={2,3};
        double[] b={2,4};
        double[] c={1,4};
        double[] d={1,3};
        double[] e={2,2};
        double[] f={3,2};

        double[] g={8,7};
        double[] h={8,6};
        double[] i={7,7};
        double[] j={7,6};
        double[] k={8,5};

        double[] l={100,2};//孤立点

        double[] m={8,20};
        double[] n={8,19};
        double[] o={7,18};
        double[] p={7,17};
        double[] q={8,21};

        dpoints.add(new Node("a",a));
        dpoints.add(new Node("b",b));
        dpoints.add(new Node("c",c));
        dpoints.add(new Node("d",d));
        dpoints.add(new Node("e",e));
        dpoints.add(new Node("f",f));

        dpoints.add(new Node("g",g));
        dpoints.add(new Node("h",h));
        dpoints.add(new Node("i",i));
        dpoints.add(new Node("j",j));
        dpoints.add(new Node("k",k));

        dpoints.add(new Node("l",l));

        dpoints.add(new Node("m",m));
        dpoints.add(new Node("n",n));
        dpoints.add(new Node("o",o));
        dpoints.add(new Node("p",p));
        dpoints.add(new Node("q",q));

        OutlierNodeDetect lof=new OutlierNodeDetect();

        List nodeList=lof.getOutlierNode(dpoints);

        for(Node node:nodeList){
            System.out.println(node.getNodeName()+" "+node.getLof());
        }

    }
}

测试结果：

0.7459309435620392
p 0.7459309435620392
e 0.7485293162241347
k 0.7518479734971145
i 0.7518479734971146
c 0.7693717709826069
b 0.7693717709826069
g 0.7836550344036045
o 0.8175878600290553
m 0.8175878600290553
a 0.827181166228103
d 0.8497518729207414
f 0.8588773305030418
j 0.8625820667657609
h 0.8625820667657609
n 0.8866630038097529
l 39.309353884068194

探索前沿AI技术：什么是LLM框架?什么是Agent应用?什么是Workflow架构?一篇文章带你全部搞懂大模型学习路线大模型人工智能架构 llm agent ai 大模型 agi
探索前沿AI技术：什么是LLM框架?什么是Agent应用?什么是Workflow架构?前排提示，文末有大模型AGI-CSDN独家资料包哦！文章目录探索前沿AI技术：什么是LLM框架?什么是Agent应用?什么是Workflow架构?摘要引言正文LLM框架：定义与重要性什么是LLM框架?详细的知识点讲解和分析详细的代码案例详细的操作命令Agent应用：智能与自动化什么是Agent应用?知识点讲解代码
【AI日记】25.01.06 AI完全体 AI日记人工智能机器学习 kaggle 比赛
【AI论文解读】【AI知识点】【AI小项目】【AI战略思考】【AI日记】【读书与思考】AI参加：kaggle比赛ForecastingStickerSales读书书名：国家为什么会失败阅读原因：2024年诺贝尔经济学奖得主的力作，之前我已经读过他另一本书了《權力與進步》备注：有兴趣的建议读未删减版https://book.douban.com/subject/26388427/discussion
深入浅出的聊聊 Agent 程序员鑫港人工智能数据库知识图谱深度学习机器学习
今天，我想和你一起聊聊Agent（智能体），从它的起源、特点，到关键的知识点，以及现实中的应用和实现原理。希望能帮助你更深入地了解这个既有趣又重要的领域。前排提示，文末有大模型AGI-CSDN独家资料包哦！一、Agent的起源1.什么是Agent你可能会问，Agent到底是什么呢？简单来说，Agent就是能够在一定环境中自主感知、决策和行动的实体。它可以是一个软件程序、一个机器人，甚至是一个复杂的
黑石云｜PCDN与DNS的区别黑石云边缘计算
PCDN（P2PCDN）与DNS（域名系统）是两种截然不同的网络技术，它们在功能、应用场景以及工作原理等方面存在显著差异。一、定义与功能PCDN定义：PCDN全称P2PCDN，即点对点内容分发网络。它是以P2P技术为基础，通过挖掘利用边缘网络海量碎片化闲置资源而构建的低成本高品质内容分发网络服务。功能：PCDN的核心功能是提高内容分发速度和效率。通过将网站内容复制到用户附近的节点，PCDN可以实现
Redis架构 zyz176
Redis架构Redis是一个单线程的架构单线程和多线程：单线程效率低，安全多线程效率高，有线程安全问题简化了数据结构和算法的实现：Redis采用了事件模型的机制I/O多路复用机制(Linux处理文件读取的机制)单线程异步回调：node.jsRedis是一个单线程，为什么效率还这么高？redis是基于内存的，他的读取速度本身就很快使用单线程，避免了cpu对线程的切换，在一点程度上提高了效率redi
python期末题库和答案,python 期末卷及答案 www55597 人工智能
大家好，给大家分享一下python期末题库和答案，很多人还不知道这一点。下面详细解释一下。现在让我们来看看！6.foriinrange(2,n):ifn%i==0:breakifi==n-1:print('是素数')else:print('不是素数')7.'abcabcabc'.count('abc')的值为__3__。8.对于有else子句的for循环和while循环，但循环因循环条件不成立而自
YOLOv10改进，YOLOv10改进主干网络为GhostNetV3(2024年华为的轻量化架构，全网首发)，助力涨点挂科边缘 YOLOv10改进 YOLO 计算机视觉目标检测人工智能 python 深度学习
摘要GhostNetV3是由华为诺亚方舟实验室的团队发布的，于2024年4月发布。摘要：紧凑型神经网络专为边缘设备上的应用设计，具备更快的推理速度，但性能相对适中。然而，紧凑型模型的训练策略目前借鉴自传统模型，这忽略了它们在模型容量上的差异，可能阻碍紧凑型模型的性能提升。在本文中，通过系统地研究不同训练成分的影响，我们介绍了一种用于紧凑型模型的强大训练策略。我们发现，适当的重参数化和知识蒸馏设计对
如何一步步形成“代码屎山”——前端开发中的痛点与反思前端
引言在一个大型项目中，随着功能不断扩展、需求不断变化、人员不断更替，代码的质量和可维护性可能会逐渐恶化，最终演变成所谓的“代码屎山”。你一定对代码屎山的形成和后果有深刻的体会。那么，究竟是什么原因导致了代码屎山的形成？如何在开发过程中避免掉进这一陷阱？本文将从多个角度剖析这一问题，并提出一些解决方案，希望能帮助大家减少开发中的痛苦，提升代码质量。第一章：什么是“代码屎山”？在正式探讨代码屎山的形成
StarRocks on AWS Graviton3，实现 50% 以上性价比提升大数据数据库数据湖云计算云服务
在数据时代，企业拥有前所未有的大量数据资产，但如何从海量数据中发掘价值成为挑战。数据分析凭借强大的分析能力，可从不同维度挖掘数据中蕴含的见解和规律，为企业战略决策提供依据。数据分析在营销、风险管控、产品优化等领域发挥着关键作用,帮助企业提高运营效率、优化业务流程、发现新商机、增强竞争力。低成本高效率的完成对海量数据的分析，及时准确的释放数据价值，已成为企业赢得竞争优势的利器。StarRockson
探索未来视频创作：Tune-A-Video项目深度解析刘通双Elsie
探索未来视频创作：Tune-A-Video项目深度解析Tune-A-Video[ICCV2023]Tune-A-Video:One-ShotTuningofImageDiffusionModelsforText-to-VideoGeneration项目地址:https://gitcode.com/gh_mirrors/tu/Tune-A-Video在数字艺术与人工智能的交汇点上，Tune-A-Vi
对于编程零基础，第一个语言是 Python 的人有什么建议？ cda2024 python 开发语言
在当今数字化时代，编程已成为一项必备技能。无论你是想成为一名专业的软件开发人员，还是希望在数据分析、人工智能等领域有所建树，掌握一门编程语言都是至关重要的第一步。对于许多初学者来说，Python是一个理想的选择。它不仅语法简洁易懂，而且拥有强大的社区支持和丰富的库资源。那么，对于编程零基础且选择Python作为第一门语言的人，有哪些实用的建议呢？1.建立正确的学习心态1.1持之以恒学习编程并不是一
【事件触发扩散卡尔曼滤波器】基于UWB实测数据的基于事件触发的扩散卡尔曼滤波器的定位【DEKF、EKF】（Matlab代码实现） wlz249 matlab 开发语言
欢迎来到本博客❤️❤️博主优势：博客内容尽量做到思维缜密，逻辑清晰，为了方便读者。⛳️座右铭：行百里者，半于九十。本文目录如下：目录⛳️赠与读者1概述2运行结果3参考文献4Matlab代码、数据、文章下载⛳️赠与读者‍做科研，涉及到一个深在的思想系统，需要科研者逻辑缜密，踏实认真，但是不能只是努力，很多时候借力比努力更重要，然后还要有仰望星空的创新点和启发点。建议读者按目录次序逐一浏览，免得骤然跌
人体关键点实操网站 3TV 人体关键点检测
1、Face++：https://www.faceplusplus.com.cn/skeleton-detection/2、百度AI开放平台：https://ai.baidu.com/tech/body/pose?track=cp:ainsem|pf:pc|pp:chanpin-rentifenxi|pu:rentifenxi-guanjiandianshibie|ci:|kw:100065423
chatgpt赋能python：用Python安装Jupyter：让数据科学变得更加高效！ aijinglingchat ChatGpt python chatgpt jupyter 计算机
用Python安装Jupyter：让数据科学变得更加高效！对于数据科学家而言，jupyter是不可或缺的工具之一。它是一个基于web的交互式计算环境，可以帮助我们在Python中以一种轻松、方便、可交互的方式进行编程和数据分析。今天，我们将向您介绍在Python中如何安装jupyter。安装Python要安装jupyter，首先需要安装Python。如果您已经安装了Python，请跳到下一步。您可
Kylin入门教程 -龙川- 介绍学习笔记 kylin
引言ApacheKylin是一个开源的分布式分析引擎，提供Hadoop上的多维分析（OLAP）能力，使得超大规模数据集的实时查询和分析成为可能。它通过预计算数据立方体来加速查询，使得复杂查询可以在亚秒级响应。本文将详细介绍Kylin的基本概念、安装与配置、基本操作及高级功能，帮助你全面掌握这款强大的数据分析工具。第一部分：Kylin简介1.1什么是Kylin？Kylin是由eBay开发并捐赠给Ap
Java并发编程：线程安全的策略与实践喵手零基础学Java java 安全开发语言
哈喽，各位小伙伴们，你们好呀，我是喵手。运营社区：C站/掘金/腾讯云/阿里云/华为云/51CTO；欢迎大家常来逛逛今天我要给大家分享一些自己日常学习到的一些知识点，并以文字的形式跟大家一起交流，互相学习，一个人虽可以走的更快，但一群人可以走的更远。我是一名后端开发爱好者，工作日常接触到最多的就是Java语言啦，所以我都尽量抽业余时间把自己所学到所会的，通过文章的形式进行输出，希望以这种方式
pnpm简介渔老师 npm 前端 javascript
pnpm简介pnpm是什么和npm，yarn一样，pnpm是一个包管理工具。不一样的是，pnpm解决了npm和yarn一直都没有解决的痛点。在许多方面比npm和yarn更优秀。pnpm对比npm/yarn的优点更快速的依赖下载更高效的利用磁盘空间更优秀的依赖管理更快速的依赖下载根据官方提供的数据从图上我们可以看出，pnpm平均比npm和yarn快上2~3倍。这一点在依赖的下载上额外明显。更高效的利
实战指南：使用Wireshark捕获并解密HTTPS数据包 md_1008 wireshark https 测试工具
在网络安全和数据分析领域，捕获和分析网络数据包是理解网络行为、诊断问题和进行安全审计的重要手段。HTTPS（HyperTextTransferProtocolSecure）作为现代Web通信的主要协议，通过SSL/TLS加密确保了数据的安全传输。然而，在某些情况下，如网络调试、安全测试或故障排除时，我们可能需要解密HTTPS数据包以查看其详细内容。本文将提供一份实战指南，教你如何使用Wiresha
淘宝商品详情获取api接口秘籍前端后端运维数据挖掘api
一、引言在当今数字化的商业世界中，淘宝作为全球知名的电商巨头，承载着海量的商品信息。无论是电商从业者渴望优化店铺运营、精准营销，还是市场分析师致力于洞悉行业趋势、挖掘消费热点，亦或是普通消费者期望在购物时做出明智决策，获取淘宝商品详情都显得尤为关键。对于电商商家而言，掌握自家及竞品的商品详情，如价格动态、销量走势、用户评价等，能够及时调整经营策略，提升店铺竞争力；市场分析师借助大规模的商品详情数据
如何优化亚马逊广告以提高ROI？前端后端数据挖掘运维api
在竞争激烈的亚马逊市场中，优化广告以提高投资回报率（ROI）是卖家的关键任务。以下是一些实用的策略：一、精准的关键词研究与选择深入了解产品特性和目标受众详细分析产品的功能、用途、优势和适用人群。例如，如果你销售一款专业的摄影三脚架，其特点可能包括高度可调节、稳定性强、适合不同类型相机等。目标受众可能是摄影爱好者、专业摄影师等。根据这些特点和受众需求来挖掘关键词。对于摄影三脚架，可以包括“专业摄影三
AI赋能人力资源：效率提升新路径前端
引言人工智能(AI)正以前所未有的速度改变着各行各业，从自动驾驶到医疗诊断，AI的应用日益广泛。而人力资源领域，作为企业运营的核心环节，也正经历着AI带来的深刻变革。传统的人力资源管理面临诸多挑战，例如招聘效率低、候选人筛选精准度不足、员工培训成本高昂以及数据分析能力有限等。这些问题不仅影响企业的招聘速度和效率，也制约了企业的发展。为了应对这些挑战，越来越多的企业开始探索AI技术在人力资源领域的应
ai照片放大python源码_AI新时代-大牛教你使用python+Opencv完成人脸解锁（附源码）... weixin_39639505 ai照片放大python源码
好吧，伙计们，我回来了。说我拖更不写文章的可以过来用你的小拳拳狠命地捶我胸口....那么今天我们来讲关于使用python+opencv+face++来实现人脸验证及人脸解锁。代码量同样不多，你可以将这些代码运用在其它一些智能领域，如智能家居，进门的时候判断你是谁，也可以加入机器学习判断来的人是客人还是熟人。在讲之前我们会先适当的拓扑一下关于人脸识别的知识点。OK废话少说下面开始正是话题。解锁原理：
云原生周刊：K8s 生产环境架构设计及成本分析云计算
开源项目推荐KubeZoneNetKubeZoneNet旨在帮助监控和优化Kubernetes集群中的跨可用区（Cross-Zone）网络流量。这个项目提供了一种简便的方式来跟踪和分析Kubernetes集群中跨不同可用区的通信，帮助用户优化集群的网络架构、提高资源利用效率并减少网络延迟。通过实时监控和数据分析，KubeZoneNet能有效地识别跨可用区的网络瓶颈，并提供改进建议，以支持Kuber
架构验证的时间张友邦架构与设计架构设计 soa 文档
架构设计的各种方法论是为把事情变得更简单易懂而准备的，它们帮我们梳理复杂应用的逻辑头绪，把我们不能一下子掌握的事情通过一种有条不紊的途径消化掉。可以说，把事情变得更简单是架构设计的远景和目标。但这种简单是有条件的，实用就是它的条件。所谓实用就是要满足各种各样外部环境并尽可能的提供更多的指标，这些指标包括可伸缩性、可维护性、学习曲线、稳定性等。所谓的尽可能就意味着需要有一个平衡点，我们需要通过各种努
黑马商城 Spring Cloud 微服务课程笔记 - 分布式事务 Seata（DAY2 - 10）阿贾克斯的黎明 java spring cloud 微服务笔记
目录黑马商城SpringCloud微服务课程笔记-分布式事务Seata（DAY2-10）一、课程内容概述二、原理三、知识点和步骤（一）知识点（二）步骤一、课程内容概述在黑马商城的SpringCloud微服务架构中，DAY2-10主要聚焦于分布式事务的解决方案——Seata。当微服务之间进行协作时，例如在一个业务流程涉及多个微服务的操作时，如何保证这些操作要么全部成功，要么全部失败，以确保数据的一致
架构验证的时间 (转) hyzhx 架构设计 soa 文档
架构设计的各种方法论是为把事情变得更简单易懂而准备的，它们帮我们梳理复杂应用的逻辑头绪，把我们不能一下子掌握的事情通过一种有条不紊的途径消化掉。可以说，把事情变得更简单是架构设计的远景和目标。但这种简单是有条件的，实用就是它的条件。所谓实用就是要满足各种各样外部环境并尽可能的提供更多的指标，这些指标包括可伸缩性、可维护性、学习曲线、稳定性等。所谓的尽可能就意味着需要有一个平衡点，我们需要通过各种努
【蓝桥杯】CB组国二攻略（省赛地点：广东）好心的小明蓝桥杯职场和发展
1.赛事介绍（针对深大）蓝桥杯是深大的二类竞赛，在计软国一二三保研分别加6，4，2分，国一国二能申请双创一等奖学金，国三能申请双创二等还是三等有点忘了（其实在申请的时候直接申请一等就行了，学院会根据你奖项的实际能申请的奖项给你调整的）。蓝桥杯有很多个组别，有软件组和硬件组，其中软件组针对不同编程语言分组，其中C/C++组人最多，竞争相对较大。JAVA组和Python组人相对较少，竞争可能稍微小一点
C#操作Xml节点我曾经是个程序员常用代码片段 xml c#
见过不少人、经过不少事、也吃过不少苦，感悟世事无常、人心多变，靠着回忆将往事串珠成链，聊聊感情、谈谈发展，我慢慢写、你一点一点看......1、增加节点publicstaticboolAppendChild(stringfilePath,stringxPath,XmlNodexmlNode){try{XmlDocumentdoc=newXmlDocument();doc.Load(filePath
Python最难懂的10大知识点，学会就是大牛！忆愿 Python编程的脉动之声 python android 开发语言人工智能机器学习数据结构算法
你好，我是忆愿，全网4w+粉丝，《遂愿盈创》社群主理人。副业启航①|遂愿盈创（对副业感兴趣免费可入，多种赚钱实战项目等你来，一起探寻副业快速变现的途径；以及对接互联网大厂商务合作，一起来搞点小外快，认识更多互联网大咖）目前群里已经带很多小伙伴（大部分大学生）变现几百块啦，程序员搞副业有额外加成~对副业感兴趣可+V:suiyuan2ying拉你进群。文章目录1.装饰器的套路1.1基础装饰器1.2带参
河北大学计算机科学与技术考研,计算机专业考研经验贴（重） gymsummer 河北大学计算机科学与技术考研
该楼层疑似违规已被系统折叠隐藏此楼查看此楼首先，欢迎各路学弟学妹报考河北大学计算机专业研究生。作为学院新培养方案的第一届15级研一新生，我有幸和大家分享下本专业考研历程。其他专业也可参考一下，多少还是有相似之处且在本帖后面会有开学需要注意的事项。欢迎转帖分享。我是大四10月份才开始准备的，没有来得及报辅导班，复习了将近三个月，每天六点起，晚上十点半回寝室。最后以299分通过初试。所以，为了比较轻松
解线性方程组 qiuwanchi
package gaodai.matrix; import java.util.ArrayList; import java.util.List; import java.util.Scanner; public class Test { public static void main(String[] args) { Scanner scanner = new Sc
在mysql内部存储代码 annan211 性能 mysql 存储过程触发器
在mysql内部存储代码在mysql内部存储代码，既有优点也有缺点，而且有人倡导有人反对。先看优点： 1 她在服务器内部执行，离数据最近，另外在服务器上执行还可以节省带宽和网络延迟。 2 这是一种代码重用。可以方便的统一业务规则，保证某些行为的一致性，所以也可以提供一定的安全性。 3 可以简化代码的维护和版本更新。 4 可以帮助提升安全，比如提供更细
Android使用Asynchronous Http Client完成登录保存cookie的问题 hotsunshine android
Asynchronous Http Client是android中非常好的异步请求工具除了异步之外还有很多封装比如json的处理，cookie的处理引用 Persistent Cookie Storage with PersistentCookieStore This library also includes a PersistentCookieStore whi
java面试题 Array_06 java 面试
java面试题第一，谈谈final, finally, finalize的区别。 final-修饰符（关键字）如果一个类被声明为final，意味着它不能再派生出新的子类，不能作为父类被继承。因此一个类不能既被声明为 abstract的，又被声明为final的。将变量或方法声明为final，可以保证它们在使用中不被改变。被声明为final的变量必须在声明时给定初值，而在以后的引用中只能
网站加速 oloz 网站加速
前序:本人菜鸟，此文研究总结来源于互联网上的资料，大牛请勿喷！本人虚心学习，多指教. 1、减小网页体积的大小，尽量采用div+css模式，尽量避免复杂的页面结构，能简约就简约。 2、采用Gzip对网页进行压缩； GZIP最早由Jean-loup Gailly和Mark Adler创建，用于UNⅨ系统的文件压缩。我们在Linux中经常会用到后缀为.gz
正确书写单例模式随意而生 java 设计模式单例
　　单例模式算是设计模式中最容易理解，也是最容易手写代码的模式了吧。但是其中的坑却不少，所以也常作为面试题来考。本文主要对几种单例写法的整理，并分析其优缺点。很多都是一些老生常谈的问题，但如果你不知道如何创建一个线程安全的单例，不知道什么是双检锁，那这篇文章可能会帮助到你。　　懒汉式，线程不安全　　当被问到要实现一个单例模式时，很多人的第一反应是写出如下的代码，包括教科书上也是这样
单例模式香水浓 java
懒汉调用getInstance方法时实例化 public class Singleton { private static Singleton instance; private Singleton() {} public static synchronized Singleton getInstance() { if(null == ins
安装Apache问题：系统找不到指定的文件 No installed service named "Apache2" AdyZhang apache http server
安装Apache问题：系统找不到指定的文件 No installed service named "Apache2" 每次到这一步都很小心防它的端口冲突问题，结果，特意留出来的80端口就是不能用，烦。解决方法确保几处： 1、停止IIS启动 2、把端口80改成其它（譬如90，800，，，什么数字都好） 3、防火墙(关掉试试) 在运行处输入 cmd 回车，转到apa
如何在android 文件选择器中选择多个图片或者视频？ aijuans android
我的android app有这样的需求，在进行照片和视频上传的时候，需要一次性的从照片/视频库选择多条进行上传但是android原生态的sdk中，只能一个一个的进行选择和上传。我想知道是否有其他的android上传库可以解决这个问题，提供一个多选的功能，可以使checkbox之类的，一次选择多个处理方法官方的图片选择器(但是不支持所有版本的androi，只支持API Level
mysql中查询生日提醒的日期相关的sql baalwolf mysql
SELECT sysid,user_name,birthday,listid,userhead_50,CONCAT(YEAR(CURDATE()),DATE_FORMAT(birthday,'-%m-%d')),CURDATE(), dayofyear( CONCAT(YEAR(CURDATE()),DATE_FORMAT(birthday,'-%m-%d')))-dayofyear(
MongoDB索引文件破坏后导致查询错误的问题 BigBird2012 mongodb
问题描述： MongoDB在非正常情况下关闭时，可能会导致索引文件破坏，造成数据在更新时没有反映到索引上。解决方案：使用脚本，重建MongoDB所有表的索引。 var names = db.getCollectionNames(); for( var i in names ){ var name = names[i]; print(name);
Javascript Promise bijian1013 JavaScript Promise
Parse JavaScript SDK现在提供了支持大多数异步方法的兼容jquery的Promises模式，那么这意味着什么呢，读完下文你就了解了。一.认识Promises “Promises”代表着在javascript程序里下一个伟大的范式，但是理解他们为什么如此伟大不是件简
[Zookeeper学习笔记九]Zookeeper源代码分析之Zookeeper构造过程 bit1129 zookeeper
Zookeeper重载了几个构造函数，其中构造者可以提供参数最多，可定制性最多的构造函数是 public ZooKeeper(String connectString, int sessionTimeout, Watcher watcher, long sessionId, byte[] sessionPasswd, boolea
【Java命令三】jstack bit1129 jstack
jstack是用于获得当前运行的Java程序所有的线程的运行情况(thread dump），不同于jmap用于获得memory dump [hadoop@hadoop sbin]$ jstack Usage: jstack [-l] <pid> (to connect to running process) jstack -F
jboss 5.1启停脚本　动静分离部署 ronin47
以前启动jboss，往各种xml配置文件，现只要运行一句脚本即可。start nohup sh /**/run.sh -c servicename -b ip -g clustername -u broatcast jboss.messaging.ServerPeerID=int -Djboss.service.binding.set=p
UI之如何打磨设计能力? brotherlamp UI ui教程 ui自学 ui资料 ui视频
在越来越拥挤的初创企业世界里，视觉设计的重要性往往可以与杀手级用户体验比肩。在许多情况下，尤其对于 Web 初创企业而言，这两者都是不可或缺的。前不久我们在《右脑革命：别学编程了，学艺术吧》中也曾发出过重视设计的呼吁。如何才能提高初创企业的设计能力呢?以下是 9 位创始人的体会。 1.找到自己的方式如果你是设计师，要想提高技能可以去设计博客和展示好设计的网站如D-lists或
三色旗算法 bylijinnan java 算法
import java.util.Arrays; /** 问题：假设有一条绳子，上面有红、白、蓝三种颜色的旗子，起初绳子上的旗子颜色并没有顺序，您希望将之分类，并排列为蓝、白、红的顺序，要如何移动次数才会最少，注意您只能在绳子上进行这个动作，而且一次只能调换两个旗子。网上的解法大多类似：在一条绳子上移动，在程式中也就意味只能使用一个阵列，而不使用其它的阵列来
警告:No configuration found for the specified action: \'s chiangfai configuration
1.index.jsp页面form标签未指定namespace属性。  <%@taglib prefix="s" uri="/struts-tags"%> ... <s:form action="submit" method="post"&g
redis -- hash_max_zipmap_entries设置过大有问题 chenchao051 redis hash
使用redis时为了使用hash追求更高的内存使用率，我们一般都用hash结构，并且有时候会把hash_max_zipmap_entries这个值设置的很大，很多资料也推荐设置到1000，默认设置为了512，但是这里有个坑 #define ZIPMAP_BIGLEN 254 #define ZIPMAP_END 255 /* Return th
select into outfile access deny问题 daizj mysql txt 导出数据到文件
本文转自：http://hatemysql.com/2010/06/29/select-into-outfile-access-deny%E9%97%AE%E9%A2%98/ 为应用建立了rnd的帐号，专门为他们查询线上数据库用的，当然，只有他们上了生产网络以后才能连上数据库，安全方面我们还是很注意的，呵呵。授权的语句如下： grant select on armory.* to rn
phpexcel导出excel表简单入门示例 dcj3sjt126com PHP Excel phpexcel
<?php error_reporting(E_ALL); ini_set('display_errors', TRUE); ini_set('display_startup_errors', TRUE); if (PHP_SAPI == 'cli') die('This example should only be run from a Web Brows
美国电影超短200句 dcj3sjt126com 电影
1. I see．我明白了。2. I quit! 我不干了!3. Let go! 放手!4. Me too．我也是。5. My god! 天哪!6. No way! 不行!7. Come on．来吧(赶快)8. Hold on．等一等。9. I agree。我同意。10. Not bad．还不错。11. Not yet．还没。12. See you．再见。13. Shut up!
Java访问远程服务 dyy_gusi httpclient webservice get post
随着webService的崛起，我们开始中会越来越多的使用到访问远程webService服务。当然对于不同的webService框架一般都有自己的client包供使用，但是如果使用webService框架自己的client包，那么必然需要在自己的代码中引入它的包，如果同时调运了多个不同框架的webService，那么就需要同时引入多个不同的clien
Maven的settings.xml配置 geeksun settings.xml
settings.xml是Maven的配置文件，下面解释一下其中的配置含义： settings.xml存在于两个地方： 1.安装的地方：$M2_HOME/conf/settings.xml 2.用户的目录：${user.home}/.m2/settings.xml 前者又被叫做全局配置，后者被称为用户配置。如果两者都存在，它们的内容将被合并，并且用户范围的settings.xml优先。
ubuntu的init与系统服务设置 hongtoushizi ubuntu
转载自： http://iysm.net/?p=178 init Init是位于/sbin/init的一个程序，它是在linux下，在系统启动过程中，初始化所有的设备驱动程序和数据结构等之后，由内核启动的一个用户级程序，并由此init程序进而完成系统的启动过程。 ubuntu与传统的linux略有不同，使用upstart完成系统的启动，但表面上仍维持init程序的形式。运行
跟我学Nginx+Lua开发目录贴 jinnianshilongnian nginx lua
使用Nginx+Lua开发近一年的时间，学习和实践了一些Nginx+Lua开发的架构，为了让更多人使用Nginx+Lua架构开发，利用春节期间总结了一份基本的学习教程，希望对大家有用。也欢迎谈探讨学习一些经验。目录第一章安装Nginx+Lua开发环境第二章 Nginx+Lua开发入门第三章 Redis/SSDB+Twemproxy安装与使用第四章 L
php位运算符注意事项 home198979 位运算 PHP &
$a = $b = $c = 0; $a & $b = 1; $b | $c = 1 问a,b,c最终为多少? 当看到这题时，我犯了一个低级错误，误以为位运算符会改变变量的值。所以得出结果是1 1 0 但是位运算符是不会改变变量的值的，例如： $a=1;$b=2; $a&$b; 这样a,b的值不会有任何改变
Linux shell数组建立和使用技巧 pda158 linux
1.数组定义　　[chengmo@centos5 ~]$ a=(1 2 3 4 5) 　　[chengmo@centos5 ~]$ echo $a 　　1 　　一对括号表示是数组，数组元素用“空格”符号分割开。　　 2.数组读取与赋值　　得到长度：　　[chengmo@centos5 ~]$ echo ${#a[@]} 　　5 　　用${#数组名[@或
hotspot源码(JDK7) ol_beta java HotSpot jvm
源码结构图，方便理解： ├─agent Serviceab
Oracle基本事务和ForAll执行批量DML练习 vipbooks oracle sql
基本事务的使用：从账户一的余额中转100到账户二的余额中去，如果账户二不存在或账户一中的余额不足100则整笔交易回滚 select * from account; -- 创建一张账户表 create table account( -- 账户ID id number(3) not null, -- 账户名称 nam

聚类分析（七）离群点分析

你可能感兴趣的:(数据分析/挖掘,离群点)