青春是一条不归路

主流的聚类评价指标概览及聚类精度Accuracy的Java实现

本文记录了几种主流的聚类算法的评价指标。主要参考文献：《机器学习》-周志华。
其中，我们重点关注聚类精度（ AC ）这种评价指标的原理及实现。

大体上，聚类算法的评价指标分为两种，
0）外部评价指标
1）内部评价指标

外部评价指标是在真实标签已知的情况下，衡量聚类结果与真实标签之间的吻合程度。常用的有以下几个：
0）Jaccard Coefficient （ JC ）；
1）Fowlkes and Mallows Index （ FMI ）；
2）Rand Index （ RI ）;
3） Purity ；
4）Accuracy （ AC ）；
5）Normalized Mutual Information （ NMI ）；

内部评价指标是在不能获得真实标签的情况下，衡量聚类结果本身的好坏情况（比如簇的内聚性，簇间独立性）。常用的有两个：
6）Davies-Bouldin Index （ DBI ）；
7）Dunn Index （ DI ）；

下面分别介绍：
假设数据集 D={x1,…,xn} ，假设聚类得出的标签为 p=[p1,…,pn] ，真实的标签为 r=[r1,…,rn] ，将样本两两配对考虑，定义

SS={(xi,xj)|pi=pj,ri=rj,i<j} ,
SD={(xi,xj)|pi=pj,ri≠rj,i<j} ,
DS={(xi,xj)|pi≠pj,ri=rj,i<j} ,
DD={(xi,xj)|pi≠pj,ri≠rj,i<j} ,

其中，SS包含了那些预测为相同簇并且真实标签也一致的样本对,
SD包含了那些预测为相同簇但是真实标签不一致的样本对,
DS包含了那些预测为不同簇但是真实标签一致的样本对,
DD包含了那些预测为不同簇并且真实标签也不一致的样本对。
易知，每个样本对出现并只能出现在上述某一个集合中。
基于上述式子，可导出以下外部指标：

0） JC

J C = | S S | | S S | + | S D | + | D S |

1） FMI

F M I = | S S | ( | S S | + | S D | ) ( | S S | + | D S | ) - - - - - - - - - - - - - - - - - - - - - - \sqrt

2） RI

J C = | S S | | S S | + | S D | + | D S |

显然，上述指标的结果值均在[0, 1]区间内，值越大越好。

假设通过聚类给出的簇划分为 C={Ci}ki=1 ，真实簇划分为 C′={C′i}si=1 ，我们构建一个矩阵 W={wij=|Ci∩C′j|}k×s ， W 存储了每一个预测簇和真实簇之间的相同样本数量。

如表一所示：

3） Purity
顾名思义， Purity 指的是纯度，该指标可通过如下优化问题获得：

P u r i t y = s . t . max \sum k i = 1 \sum s j = 1 w i j x i j 1 T W 1 \sum j = 1 s x i j = 1, i = 1, \dots, k x i j = 0 o r 1, i = 1, \dots, k, j = 1, \dots, s

显然，

1TW1=n 为样本个数。
实际上，

Purity 就是每一行的最大值之和除以样本总数
对于表一，

Purity=10+20+8+15102=0.5196 。

4） AC
AC 是目前最流行的聚类评价指标。在很多文献里面，都将 AC 作为聚类结果的评价指标。 AC 定义如下：

A C (p, r) = \sum n i = 1 δ ( r i , m a p ( p i ) ) n,

其中，

δ (a, b) = {1, 0, if a = b; o t h e r w i s e,

map(pi) 是一个排列映射函数，将聚类得到的标签映射到与之等价的真实标签，聚类标签与真实标签之间是1-1映射(不一定是满的)。
很多论文里面说，一个最佳的

map(pi) 函数可以由Kuhn-Munkres算法产生[ Matching Theory]。实际上，

AC 可以由如下最优化问题获得，

A C = s . t . max \sum k i = 1 \sum s j = 1 w i j x i j 1 T W 1 \sum j = 1 s x i j = 1, i = 1, \dots, k \sum i = 1 k x i j = 1, j = 1, \dots, s x i j = 0 o r 1, i = 1, \dots, k, j = 1, \dots, s

可以看到，

AC 的优化问题仅比

Purity 的优化问题多了一个约束条件，

Purity 要求每一行只选择一个数，

AC 不仅要求每一行唯一，而且要求每一列唯一，也就是一个预测簇只能与一个真实簇对应，一个真实簇也只能与一个预测簇对应。也就是得到的最优解

X={xij}k×s 是一个正交阵（当k=s时成立）。上述最优化问题有一个名称叫做 指派问题，解决指派问题有一个专门的算法— 匈牙利算法，也就是说，求解

AC 只需要用到Kuhn-Munkres算法的一部分，匈牙利算法。
关于匈牙利算法的原理和算法流程都在很多最优化书籍中有讲解。在这篇博客里面
http://blog.csdn.net/zhanghaor/article/details/52344766
有给出这个算法的Java实现。实际上我在用这个Java实现的过程中发现，对于有些情况，该算法不能收敛。一怒之下自己实现了一个，还是自己实现的靠谱点，Java代码如下：

import java.util.Arrays;
import org.ujmp.core.Matrix;
import org.ujmp.core.calculation.Calculation.Ret;

/**
 * The Hungary method solving allocating problem.
 * @author Yanxue
 *
 */
public class Hungary {

    Matrix graph;

    int n, m;

    //int minMatchValue;

    Matrix mapMatrix;

    int[] mapIndices;

    public static final int MAX_ITE_NUM = 1000;

    public Hungary(Matrix pGraph) {
        graph = pGraph.plus(Ret.NEW, false, 0);
        n = (int) pGraph.getRowCount();
        m = (int) pGraph.getColumnCount();
        if (n != m) {
            graphSqureChange();
        }
    }

    private void graphSqureChange() {
        if (n < m) {
            graph = graph.appendVertically(Ret.LINK,
                    Matrix.Factory.zeros(m - n, m));
        } else {
            graph = graph.appendHorizontally(Ret.LINK,
                    Matrix.Factory.zeros(n, n - m));
        }
        n = (int) graph.getRowCount();
        m = n;
    }

    public void findMinMatch() {
        // Compute C'
        Matrix rowMinValue = graph.min(Ret.NEW, 1);
        Matrix tC = Matrix.Factory.emptyMatrix();

        for (int i = 0; i < n; i++) {
            tC = tC.appendVertically(Ret.LINK, graph.selectRows(Ret.LINK, i)
                    .minus(rowMinValue.getAsInt(i, 0)));
        }

        Matrix columnMinValue = tC.min(Ret.NEW, 0);
        Matrix _tC = Matrix.Factory.emptyMatrix();
        for (int i = 0; i < m; i++) {
            _tC = _tC.appendHorizontally(
                    Ret.LINK,
                    tC.selectColumns(Ret.LINK, i).minus(
                            columnMinValue.getAsInt(0, i)));
        }
        //System.out.println("C(1) computed");
        Matrix tMapMatrix = constructMapAndUpdate(_tC)[0];
        int tCount = 0;
        while (!isOptimal(tMapMatrix) && tCount++ < MAX_ITE_NUM) {
            Matrix[] tMatrix = constructMapAndUpdate(_tC);
            tMapMatrix = tMatrix[0];
            _tC = tMatrix[1];
        }

        mapMatrix = tMapMatrix;
        mapIndices = new int[n];
        Arrays.fill(mapIndices, -1);
        for (int i = 0; i < n; i++) {
            for (int j = 0; j < m; j++) {
                if(mapMatrix.getAsInt(i, j) == 1) {
                    mapIndices[i] = j;
                    break;
                }
            }
        }
    }

    private Matrix[] constructMapAndUpdate(Matrix c) {
        Matrix tMap = Matrix.Factory.zeros(n, m);
        Matrix updateC = c.plus(Ret.NEW, false, 0);

        int[][] rowZeroIndices = getRowZeroIndices(c);

        int[] indexSequence = findMinToMaxRowZeroCountIndexSequence(rowZeroIndices);
        boolean[] rowComputed = new boolean[n];
        boolean[] columnComputed = new boolean[m];
        for (int i = 0; i < n; i++) {
            int currentRow = indexSequence[i];
            for (int j = 0; j < rowZeroIndices[currentRow].length; j++) {
                if (!columnComputed[rowZeroIndices[currentRow][j]]) {
                    tMap.setAsInt(1, currentRow, rowZeroIndices[currentRow][j]);
                    columnComputed[rowZeroIndices[currentRow][j]] = true;
                    // 1) Flag for having bracket.
                    rowComputed[currentRow] = true;
                    break;
                }
            }
        }
        //System.out.println("C(1)\r\n" + tMap);

        if (isOptimal(tMap)) {
            return new Matrix[] { tMap, updateC };
        }
        // C' --> C''
        boolean[] rowFlag = new boolean[n];
        // 1)
        for (int i = 0; i < n; i++) {
            rowFlag[i] = !rowComputed[i];
        }
        //System.out.println("C(1): " + Arrays.toString(rowFlag));

        boolean[] columnFlag = new boolean[m];

        boolean[] _rowFlag = new boolean[n];
        boolean[] _columnFlag = new boolean[m];

        while (!Arrays.equals(_rowFlag, rowFlag)
                || !Arrays.equals(_columnFlag, columnFlag)) {

            _rowFlag = rowFlag;
            _columnFlag = columnFlag;

            // 2) Flag column indices for all the zero elements in those
            // bracket-flaged row.
            for (int i = 0; i < n; i++) {
                // flaged row
                if (rowFlag[i]) {
                    for (int j = 0; j < rowZeroIndices[i].length; j++) {
                        columnFlag[rowZeroIndices[i][j]] = true;
                    }
                }
            }
            //System.out.println("C(1)" + Arrays.toString(columnFlag));

            // 3) Flag row indices for those bracket-flaged elements in flaged
            // columns.
            for (int i = 0; i < m; i++) {
                if (columnFlag[i]) {
                    for (int j = 0; j < n; j++) {
                        if (tMap.getAsInt(j, i) == 1) {
                            rowFlag[j] = true;
                            break;
                        }
                    }
                }
            }
        }

        // 5) Find minimum element in those locations uncovered by lines.
        int tMinValue = Integer.MAX_VALUE;
        for (int i = 0; i < n; i++) {
            // skip row Lines
            if (!rowFlag[i]) {
                continue;
            }

            for (int j = 0; j < m; j++) {
                if (!columnFlag[j]) {
                    if (c.getAsInt(i, j) < tMinValue) {
                        tMinValue = c.getAsInt(i, j);
                    }
                }
            }
        }

        // 6) Minus the minimum value for those flaged rows.
        for (int i = 0; i < n; i++) {
            if (rowFlag[i]) {
                for (int j = 0; j < m; j++) {
                    updateC.setAsInt(updateC.getAsInt(i, j) - tMinValue, i, j);
                }
            }
        }
        // 6) Plus the minimum value for those flaged columns.
        for (int i = 0; i < m; i++) {
            if (columnFlag[i]) {
                for (int j = 0; j < n; j++) {
                    updateC.setAsInt(updateC.getAsInt(j, i) + tMinValue, j, i);
                }
            }
        }

        return new Matrix[] { tMap, updateC };
    }

    private int[] findMinToMaxRowZeroCountIndexSequence(int[][] rowZeroIndices) {
        int[] tSequence = new int[n];
        int tIndex = 0;
        boolean[] rowComputed = new boolean[n];
        while (tIndex < n) {
            int minZeroCountIndex = 0;
            int minZeroCount = Integer.MAX_VALUE;

            for (int i = 0; i < n; i++) {
                if (rowComputed[i]) {
                    continue;
                }

                if (rowZeroIndices[i].length < minZeroCount) {
                    minZeroCount = rowZeroIndices[i].length;
                    minZeroCountIndex = i;
                }

            }
            tSequence[tIndex++] = minZeroCountIndex;
            rowComputed[minZeroCountIndex] = true;
        }
        return tSequence;
    }

    private int[][] getRowZeroIndices(Matrix c) {

        int[][] tRowZeroIndices = new int[n][];
        int[] tRowZeroCounts = new int[n];

        for (int i = 0; i < n; i++) {
            for (int j = 0; j < m; j++) {
                if (c.getAsInt(i, j) == 0) {
                    tRowZeroCounts[i]++;
                }
            }
        }

        for (int i = 0; i < n; i++) {
            tRowZeroIndices[i] = new int[tRowZeroCounts[i]];
            tRowZeroCounts[i] = 0;
            for (int j = 0; j < m; j++) {
                if (c.getAsInt(i, j) == 0) {
                    tRowZeroIndices[i][tRowZeroCounts[i]++] = j;
                }
            }
        }

        return tRowZeroIndices;
    }

    /**
     * Judge if the map matrix is optimal.
     * 
     * @param mapC
     * @return
     */
    private boolean isOptimal(Matrix mapC) {
        return mapC.sum(Ret.NEW, Matrix.ALL, false).getAsInt(0, 0) == n;
    }

    public int[] getMapIndices() {
        return mapIndices;
    }
    /**
    Testing method.
    **/
    public static void main(String[] args) {
        int[][] m = null;
        m = new int[][]{ 
                { 12, 7, 9, 7, 9 }, 
                { 8, 9, 6, 6, 6 },
                { 7, 17, 12, 14, 9 }, 
                { 15, 14, 6, 6, 10 }, 
                { 4, 10, 7, 10, 9 } 
        };
        m = new int[][]{
                {2, 15, 13, 4}, 
                {10, 4, 14, 15},
                {9, 14, 16, 13},
                {7, 8, 11, 9}, 
        };
        Matrix mMatrix = Matrix.Factory.zeros(m.length, m[0].length);

        for (int i = 0; i < m.length; i++) {
            for (int j = 0; j < m[i].length; j++) {
                mMatrix.setAsInt(m[i][j], i, j);
            }
        }

        Hungary h = new Hungary(mMatrix);
        h.findMinMatch();
        System.out.println(h.mapMatrix);
        System.out.println(Arrays.toString(h.mapIndices));
    }
}

在使用这个算法的时候，需要注意以下2点：
1. UJMP三方库是必不可少的，这里面涉及到矩阵运算，下载链接https://ujmp.org/；
2. 这个算法解决的是极小化的指派问题，如需计算极大化问题的最优解（ AC 就是极大化问题），需要将 W 转化为
W′={w′ij}k×s，w′ij=max(W)−wij ， max(W) 是矩阵 W 中的最大值。这样转化之后的极小化问题的最优解等于原问题的最优解。
计算 AC 的时候，只需要拿到这个匹配， W 矩阵中对应的数相加，再除以样本总数，就可以了。

关于这个算法还有Matlab实现，可参见
http://www.cad.zju.edu.cn/home/dengcai/Data/code/hungarian.m

5） NMI
NMI 为归一化的互信息，给定两个随机变量 P 和 Q ， P,Q 之间的NMI由下式给出：

N M I (P, Q) = I ( P , Q ) H ( P ) H ( Q ) - - - - - - - - - \sqrt,

其中，

I(P,Q) 为

P,Q 的互信息，

H(.) 为信息熵，有的文章将分母设置为

max(H(P),H(Q)) ，没有太大的区别。
根据上式，预测的簇划分

C 和真实的簇划分

C′ 之间的NMI由下式给出

N M I (C, C') = \sum k i = 1 \sum s j = 1 | C i \cap C ' j | log n | C i \cap C ' j | | C i | | C ' j | ( \sum k i = 1 | C i | log | C i | n ) ( \sum s j = 1 | C ' j | log | C ' j | n ) - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - \sqrt

我们再谈一谈两个内部评价指标，内部的评价指标并没有利用到真实的标签，或者说，内部的评价指标反应了预测簇本身的内聚性，或者反应了簇间的独立性。考虑聚类结果的簇划分 C={Ci}ki=1 ，定义

a v g (C i) = 2 | C i | ( | C i | - 1 ) \sum x l, x j \in C i, l < j d i s t (x l, x j), d i a m (C i) = max x l, x j \in C i, l < j d i s t (x l, x j), d m i n (C i, C j) = min x l \in C i, x m \in C j d i s t (x l, x m), d c e n (C i, C j) = d i s t (u i, u j) ，

其中，

dist(.,.) 为两个样本之间的距离。

ui 表示簇

Ci 的中心。基于上述式子，我们可以导出以下内部指标。

6) DBI

D B I = 1 k \sum i = 1 k max j \neq i (a v g ( C i ) + a v g ( C j ) d c e n ( u i , u j ))

注意， DBI 反应了簇间的独立性与簇的内聚性，越小越好。

7) DI

D I = min 1 \leq i \leq k { min j \neq i d m i n ( C i , C j ) } max 1 \leq l \leq k d i a m ( C l )

DI 越大越好。

lanqiaoOJ 4330：欧拉函数模板 hnjzsyjyj 信息学竞赛 #算法数学基础欧拉函数
【题目来源】https://www.lanqiao.cn/problems/4330/learning/【问题描述】这是一道模板题。首先给出欧拉函数的定义：即φ(n)表示的是小于等于n的数中和n互质的数的个数。比如说φ(6)=2，当n是质数的时候，显然有φ(n)=n-1。【题目大意】给定n个正整数，请你求出每个数的欧拉函数。【输入格式】输入共两行。第一行输入一个整数表示n。第二行输入n个整数。【输
lanqiaoOJ 2122：数位排序 ← 排序（自定义比较函数）
【题目来源】https://www.lanqiao.cn/problems/2122/learning/【题目描述】小蓝对一个数的数位之和很感兴趣，今天他要按照数位之和给数排序。当两个数各个数位之和不同时，将数位和较小的排在前面，当数位之和相等时，将数值小的排在前面。例如，2022排在409前面，因为2022的数位之和是6，小于409的数位之和13。又如，6排在2022前面，因为它们的数位之和相同
lanqiaoOJ 2145：求阶乘 ← 二分法 hnjzsyjyj 信息学竞赛 #分治算法与双指针算法二分法
【题目来源】https://www.lanqiao.cn/problems/2145/learning/【题目描述】满足N！的末尾恰好有K个0的最小的N是多少？如果这样的N不存在输出-1。【输入格式】一个整数K。【输出格式】一个整数代表答案。【输入样例】2【输出样例】10【评测用例规模与约定】对于30%的数据，1≤K≤10^6.对于100%的数据，1≤K≤10^18.【算法分析】●二分法的应用条件
OpenCV中常用特征提取算法（SURF、ORB、SIFT和AKAZE）用法示例（C++和Python）点云SLAM 图形图像处理 opencv 算法 ORB算法 SIFT算法 SURF算法 AKAZE算法计算机视觉
OpenCV中提供了多种常用的特征提取算法，广泛应用于图像匹配、拼接、SLAM、物体识别等任务。以下是OpenCV中几个主流特征提取算法的用法总结与代码示例，涵盖C++和Python两个版本。常用特征提取算法列表算法特点是否需额外模块SIFT（尺度不变特征）稳定性强、可旋转缩放xfeatures2d模块SURF（加速稳健特征）快速但专利保护xfeatures2d模块ORB（OrientedFAST
如何调整优化器的参数来优化神经网络性能？ Idividuals 深度学习神经网络机器学习 python scikit-learn
不同优化器有不同的可调整参数，下面以常见的优化器为例，讲解如何调整其参数来优化神经网络性能：Adam优化器Adam优化器有几个关键参数：learning_rate（学习率）、beta_1、beta_2和epsilon。1.学习率(learning_rate)-作用：控制每次参数更新的步长。学习率过大，模型可能无法收敛，在最优解附近振荡甚至发散；学习率过小，训练速度会非常缓慢。-调整方法：通常初始值
解决引入TransXNet模块后显存爆炸问题的全面指南 pk_xz123456 算法大数据 python 机器人数据挖掘深度学习
解决引入TransXNet模块后显存爆炸问题的全面指南前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站。1.问题背景与现状分析1.1MF-PSN和TransXNet项目概述MF-PSN（Multi-FeaturePyramidStereoNetwork）是一个基于金字塔特征的多特征立体匹配网络，它通过构建多层次的特征金字塔来处理不同尺度的立体匹配问题
人工智能入门指南：从基础概念到实际应用
前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站。https://www.captainbed.cn/north文章目录1.**人工智能的基本概念**1.1什么是人工智能？1.2人工智能的分类2.**人工智能的核心技术**2.1机器学习（MachineLearning）2.1.1机器学习的类型2.1.2机器学习流程2.2深度学习（DeepLearni
深度学习模块实践手册（第十二期）加油吧zkf 目标检测目标检测模块解析与实践深度学习人工智能计算机视觉目标检测 python
56、Ghost模块论文《GhostNet:MoreFeaturesfromCheapOperations》1、作用：Ghost模块是一种轻量级的特征提取模块，旨在通过廉价操作生成更多特征图，减少计算量的同时保持模型性能。传统卷积神经网络在生成特征图时存在大量冗余计算，Ghost模块通过将特征图生成过程分解为两个步骤，有效减少了计算复杂度，特别适合移动端和嵌入式设备部署。2、机制Ghost模块的机
基于探路者算法优化的核极限学习机(KELM)分类算法智能算法研学社（Jack旭）智能优化算法应用机器学习 #核极限学习机（KELM）算法分类数据挖掘
基于探路者算法优化的核极限学习机(KELM)分类算法文章目录基于探路者算法优化的核极限学习机(KELM)分类算法1.KELM理论基础2.分类问题3.基于探路者算法优化的KELM4.测试结果5.Matlab代码摘要：本文利用探路者算法对核极限学习机(KELM)进行优化，并用于分类1.KELM理论基础核极限学习机（KernelBasedExtremeLearningMachine，KELM）是基于极限
Git 工作流中，当主分支（假设为 main）更新后，如何使用rebase 命令将这些更新同步到功能分支（如 feature-B） yzpyzp git android
在GitFlow工作流中，当主分支（假设为main）更新后，若要将这些更新同步到功能分支（如feature-B），通常的操作流程如下：具体操作步骤切换到功能分支gitcheckoutfeature-B执行rebase操作gitrebasemain此操作会将feature-B的基址（basecommit）重置到main分支的最新提交相当于将feature-B的所有新提交「重新播放」在main分支的最
在二分类任务中如何处理包含中文的类别特征 Dush32 分类数据挖掘人工智能机器学习数据分析
在机器学习中，处理类别特征（CategoricalFeatures）是常见的任务，特别是在中文数据中，很多类别特征如省份、城市等都是字符串类型。如何将这些类别变量转换为模型可以理解的数值格式，是每个数据科学家都必须面对的挑战。在这篇文章中，我们将探讨两种常见的类别特征编码方法：astype('category')和LabelEncoder，并比较它们在二分类任务中的效果。我们以“省份”这一类别特征
MTK Camera HAL 与 FeaturePipe 架构解析：从硬件抽象到功能管线的工程落地路径
MTKCameraHAL与FeaturePipe架构解析：从硬件抽象到功能管线的工程落地路径关键词MTKCameraHAL、FeaturePipe架构、联发科影像系统、CAM-HAL3、PipelineModel、流控制管理、Node架构、Buffer管理、AndroidCameraFramework摘要MTK的Camera系统在Android平台下采用高度模块化的HAL与FeaturePipe架
【转】【译】How to Handle Very Long Sequences with LSTM（LSTM RNN 超长序列处理）开始奋斗的胖子机器学习 RNN LSTM 序列深度学习
原文地址http://machinelearningmastery.com/handle-long-sequences-long-short-term-memory-recurrent-neural-networks/一个长的输入序列却只对应一个或者一小段输出就是我们经常说的序列标注和序列分类。主要包括下面一些例子：包含上千个词的文件情感分类（NLP）包含上千个时间状态的脑电痕迹分类（Medici
OpenCV特征点提取算法orb、surf、sift对比点云SLAM 图形图像处理 ORB算法 SIFT算法人工智能计算机视觉算法
下面是OpenCV中三种常用特征点提取算法：ORB、SURF和SIFT的详细对比，从算法原理、性能、使用限制和适用场景多维度进行总结，帮助大家在实际项目中合理选择。一览表：ORBvs.SURFvs.SIFT属性/算法ORBSURFSIFT全称OrientedFASTandRotatedBRIEFSpeededUpRobustFeaturesScale-InvariantFeatureTransfo
KAIST：LLM混合递归推理大模型任我行大模型-推理优化人工智能自然语言处理语言模型论文笔记
标题：Mixture-of-Recursions:LearningDynamicRecursiveDepthsforAdaptiveToken-LevelComputation来源：arXiv,2507.10524摘要缩放语言模型解锁了令人印象深刻的能力，但伴随的计算和内存需求使训练和部署都很昂贵。现有的效率工作通常针对参数共享或自适应计算，留下了如何同时实现两者的问题。我们引入了混合递归(MoR
SPARKLE：深度剖析强化学习如何提升语言模型推理能力
摘要：强化学习（ReinforcementLearning，RL）已经成为赋予语言模型高级推理能力的主导范式。尽管基于RL的训练方法（例如GRPO）已经展示了显著的经验性收益，但对其优势的细致理解仍然不足。为了填补这一空白，我们引入了一个细粒度的分析框架，以剖析RL对推理的影响。我们的框架特别研究了被认为可以从RL训练中受益的关键要素：（1）计划遵循和执行，（2）问题分解，以及（3）改进的推理和知
Python机器学习教程
Python机器学习教程(MachineLearningwithPythonTutorial)PDFVersionQuickGuideResourcesJobSearchDiscussionPDF版本快速指南资源资源求职讨论区MachineLearning(ML)isbasicallythatfieldofcomputersciencewiththehelpofwhichcomputersyste
JS 表达式和操作符-解构坚定的小辣鸡在努力前端 javascript 开发语言
JavaScript的解构（Destructuring）语法是一种从数组或对象中快速提取值并赋值给变量的方式。它能让代码更简洁、清晰，常用于函数参数、变量赋值等场景。ThedestructuringsyntaxinJavaScriptisapowerfulfeaturethatmakesitpossibletounpackvaluesfromarraysorpropertiesfromobject
【DW11月-深度学习】Task03前馈神经网络沫2021
参考链接：https://datawhalechina.github.io/unusual-deep-learning/#/4.%E5%89%8D%E9%A6%88%E7%A5%9E%E7%BB%8F%E7%BD%91%E7%BB%9C一、神经元模型2.1神经元1943年，美国神经生理学家沃伦·麦卡洛克(WarrenMcCulloch)和数学家沃尔特·皮茨(WalterPitts)对生物神经元进行
边缘智能革命：嵌入式机器学习如何让万物“思考” 万能小贤哥机器学习人工智能
当智能手表精准识别你的健身动作，工业传感器预测设备故障于毫秒之间，农业传感器自动调节灌溉水量——这些并非科幻场景，而是嵌入式机器学习（EmbeddedMachineLearning,或TinyML）正在悄然重塑的现实。这场发生在设备边缘的智能革命，正将AI从云端的数据中心拉近到我们指尖的每一台设备中。一、嵌入式机器学习：定义与核心价值嵌入式机器学习是指在资源极端受限的微控制器（MCU）、微处理器（
预测导管原位癌浸润性复发的深度学习：利用组织病理学图像和临床特征浪漫的诗人论文深度学习人工智能
文章目录研究内容目的方法数据集模型开发模型训练与评估外部验证统计分析研究结果模型性能风险分层外部验证特征重要性原文链接原文献：Deeplearningforpredictinginvasiverecurrenceofductalcarcinomainsitu:leveraginghistopathologyimagesandclinicalfeatures研究背景【DCIS与IBC的关联】乳腺导管
《How to Take Smart Notes》读书笔记1 LY320
最近在读一本书，题为《HowtoTakeSmartNotes:OneSimpleTechniquetoBoostWriting,LearningandThinking–forStudents,AcademicsandNonfictionBookWriters》1。尚未读完，分享一些读这本书的感想，我的一些心得，和不解。这本书让我觉得最有收获的点是更新了我对记录和整理笔记的认识。通常我们在记录笔记时
2021-03-22 每日打卡来多喜
昨日完成情况：1.完成了3k跑，太久没锻炼体力跟不上，没力气做帕梅拉了。2.MathematicsforMachineLearning:LinearAlgebra学完了week3和week4，week5还剩大概一个小时学完，没有开始做思维导图。早上跑步回来后看《你是我的城池堡垒》看了两个小时，虽然一边看一边洗碗，洗完碗一边看一边吃饭，但是从三点多才开始学习。重要的事情要先做！3.没有时间做Pyth
Opencv学习_2 （opencv结构&显示图像）
opencv结构：1：主要包含：cxcorecvmachinelearninghighguicvcamcvaux2：cxcore:基础结构:CvPoint,CvSize,CvScalar等数组结构:cvCreateImage,cvCreateMat等动态结构:CvMemStorage,CvMemBlock等绘图函数:cvLine,cvRectangle等数据保存和运行时类型信息：CvFileSto
【人脸识别】FROM：提升遮挡状态下的人脸识别效果姚路遥遥人脸识别深度学习计算机视觉人工智能遮挡人脸识别损失
论文题目：《End2EndOccludedFaceRecognitionbyMaskingCorruptedFeatures》论文地址：https://arxiv.org/pdf/2108.09468v3.pdf代码地址：https://github.com/haibo-qiu/from1.前言人脸识别技术已经取得了显著的进展，主要归功于以下三个因素:lossfunctions:Centerlos
pytest-bdd 行为驱动自动化测试东汉末年出bug pytest python pytest-bdd
引言pytest-bdd是一个专为Python设计的行为驱动开发（BDD）测试框架，它允许开发人员使用自然语言（如Gherkin）来编写测试用例，从而使测试用例更易于理解和维护。安装通过pip安装pipinstallpytest-bdd介绍特性文件（FeatureFile）：定义了要测试的系统功能。通常以.feature为扩展名，并使用Gherkin语言编写。特性文件包含特性名称、描述以及一个或多
#Datawhale组队学习#7月-强化学习Task1 fzyz123 Datawhale组队学习强化学习人工智能 AI
这里是Datawhale组织的组队学习《强化学习入门202507》，Datawhale是一个开源的社区。第一章绪论1.1为什么要学习强化学习？强化学习（ReinforcementLearning,RL）是机器学习中专注于智能体（Agent）如何通过与环境交互学习最优决策策略的分支。与监督学习依赖静态数据集、无监督学习聚焦数据内在结构不同，强化学习的核心在于序贯决策：智能体通过试错探索环境，根据行动
图机器学习（13）——图相似性检测
图机器学习（13）——图相似性检测0.前言1.基于图嵌入的方法2.基于图核的方法3.基于GNN的方法4.应用0.前言图机器学习(machinelearning,ML)方法能广泛应用于各类任务，其应用场景涵盖从药物设计到社交网络推荐系统等多个领域。值得注意的是，由于这类方法在设计上具有通用性，同一算法可用于解决不同问题。学习图之间相似性的定量度量是一个关键问题。事实上，这是网络分析的重要步骤，同时也
Gradio全解系列7——Additional Features：补充特性（上）龙焰智能 Gradio全解教程人工智能 gradio 补充特性队列输入输出流提示及进度条批处理函数
Gradio全解7——AdditionalFeatures：补充特性（上）前言第7章AdditionalFeatures：补充特性7.1队列7.1.1使用方法7.1.2配置队列演示7.2输入输出流7.2.1输出流1.生成器yield2.流媒体7.2.2输入流1.流事件2.图像滤镜7.2.3统一的输入输出流7.2.4跟踪过去的输入或输出7.3提示及进度条7.3.1提示7.3.2进度条7.4批处理函数
Git 分支管理规范
一、大公司的分支管理实践1.GitFlow（经典模型）master：主分支，仅用于发布正式版本featureelop：开发分支，集成新功能feature/*：功能分支，从featureelop分支创建，用于开发新功能release/*：发布分支，从featureelop分支创建，用于测试和修复hotfix/*：热修复分支，从master分支创建，用于紧急修复2.GitHubFlow（持续交付型）m
解线性方程组 qiuwanchi
package gaodai.matrix; import java.util.ArrayList; import java.util.List; import java.util.Scanner; public class Test { public static void main(String[] args) { Scanner scanner = new Sc
在mysql内部存储代码 annan211 性能 mysql 存储过程触发器
在mysql内部存储代码在mysql内部存储代码，既有优点也有缺点，而且有人倡导有人反对。先看优点： 1 她在服务器内部执行，离数据最近，另外在服务器上执行还可以节省带宽和网络延迟。 2 这是一种代码重用。可以方便的统一业务规则，保证某些行为的一致性，所以也可以提供一定的安全性。 3 可以简化代码的维护和版本更新。 4 可以帮助提升安全，比如提供更细
Android使用Asynchronous Http Client完成登录保存cookie的问题 hotsunshine android
Asynchronous Http Client是android中非常好的异步请求工具除了异步之外还有很多封装比如json的处理，cookie的处理引用 Persistent Cookie Storage with PersistentCookieStore This library also includes a PersistentCookieStore whi
java面试题 Array_06 java 面试
java面试题第一，谈谈final, finally, finalize的区别。 final-修饰符（关键字）如果一个类被声明为final，意味着它不能再派生出新的子类，不能作为父类被继承。因此一个类不能既被声明为 abstract的，又被声明为final的。将变量或方法声明为final，可以保证它们在使用中不被改变。被声明为final的变量必须在声明时给定初值，而在以后的引用中只能
网站加速 oloz 网站加速
前序:本人菜鸟，此文研究总结来源于互联网上的资料，大牛请勿喷！本人虚心学习，多指教. 1、减小网页体积的大小，尽量采用div+css模式，尽量避免复杂的页面结构，能简约就简约。 2、采用Gzip对网页进行压缩； GZIP最早由Jean-loup Gailly和Mark Adler创建，用于UNⅨ系统的文件压缩。我们在Linux中经常会用到后缀为.gz
正确书写单例模式随意而生 java 设计模式单例
　　单例模式算是设计模式中最容易理解，也是最容易手写代码的模式了吧。但是其中的坑却不少，所以也常作为面试题来考。本文主要对几种单例写法的整理，并分析其优缺点。很多都是一些老生常谈的问题，但如果你不知道如何创建一个线程安全的单例，不知道什么是双检锁，那这篇文章可能会帮助到你。　　懒汉式，线程不安全　　当被问到要实现一个单例模式时，很多人的第一反应是写出如下的代码，包括教科书上也是这样
单例模式香水浓 java
懒汉调用getInstance方法时实例化 public class Singleton { private static Singleton instance; private Singleton() {} public static synchronized Singleton getInstance() { if(null == ins
安装Apache问题：系统找不到指定的文件 No installed service named "Apache2" AdyZhang apache http server
安装Apache问题：系统找不到指定的文件 No installed service named "Apache2" 每次到这一步都很小心防它的端口冲突问题，结果，特意留出来的80端口就是不能用，烦。解决方法确保几处： 1、停止IIS启动 2、把端口80改成其它（譬如90，800，，，什么数字都好） 3、防火墙(关掉试试) 在运行处输入 cmd 回车，转到apa
如何在android 文件选择器中选择多个图片或者视频？ aijuans android
我的android app有这样的需求，在进行照片和视频上传的时候，需要一次性的从照片/视频库选择多条进行上传但是android原生态的sdk中，只能一个一个的进行选择和上传。我想知道是否有其他的android上传库可以解决这个问题，提供一个多选的功能，可以使checkbox之类的，一次选择多个处理方法官方的图片选择器(但是不支持所有版本的androi，只支持API Level
mysql中查询生日提醒的日期相关的sql baalwolf mysql
SELECT sysid,user_name,birthday,listid,userhead_50,CONCAT(YEAR(CURDATE()),DATE_FORMAT(birthday,'-%m-%d')),CURDATE(), dayofyear( CONCAT(YEAR(CURDATE()),DATE_FORMAT(birthday,'-%m-%d')))-dayofyear(
MongoDB索引文件破坏后导致查询错误的问题 BigBird2012 mongodb
问题描述： MongoDB在非正常情况下关闭时，可能会导致索引文件破坏，造成数据在更新时没有反映到索引上。解决方案：使用脚本，重建MongoDB所有表的索引。 var names = db.getCollectionNames(); for( var i in names ){ var name = names[i]; print(name);
Javascript Promise bijian1013 JavaScript Promise
Parse JavaScript SDK现在提供了支持大多数异步方法的兼容jquery的Promises模式，那么这意味着什么呢，读完下文你就了解了。一.认识Promises “Promises”代表着在javascript程序里下一个伟大的范式，但是理解他们为什么如此伟大不是件简
[Zookeeper学习笔记九]Zookeeper源代码分析之Zookeeper构造过程 bit1129 zookeeper
Zookeeper重载了几个构造函数，其中构造者可以提供参数最多，可定制性最多的构造函数是 public ZooKeeper(String connectString, int sessionTimeout, Watcher watcher, long sessionId, byte[] sessionPasswd, boolea
【Java命令三】jstack bit1129 jstack
jstack是用于获得当前运行的Java程序所有的线程的运行情况(thread dump），不同于jmap用于获得memory dump [hadoop@hadoop sbin]$ jstack Usage: jstack [-l] <pid> (to connect to running process) jstack -F
jboss 5.1启停脚本　动静分离部署 ronin47
以前启动jboss，往各种xml配置文件，现只要运行一句脚本即可。start nohup sh /**/run.sh -c servicename -b ip -g clustername -u broatcast jboss.messaging.ServerPeerID=int -Djboss.service.binding.set=p
UI之如何打磨设计能力? brotherlamp UI ui教程 ui自学 ui资料 ui视频
在越来越拥挤的初创企业世界里，视觉设计的重要性往往可以与杀手级用户体验比肩。在许多情况下，尤其对于 Web 初创企业而言，这两者都是不可或缺的。前不久我们在《右脑革命：别学编程了，学艺术吧》中也曾发出过重视设计的呼吁。如何才能提高初创企业的设计能力呢?以下是 9 位创始人的体会。 1.找到自己的方式如果你是设计师，要想提高技能可以去设计博客和展示好设计的网站如D-lists或
三色旗算法 bylijinnan java 算法
import java.util.Arrays; /** 问题：假设有一条绳子，上面有红、白、蓝三种颜色的旗子，起初绳子上的旗子颜色并没有顺序，您希望将之分类，并排列为蓝、白、红的顺序，要如何移动次数才会最少，注意您只能在绳子上进行这个动作，而且一次只能调换两个旗子。网上的解法大多类似：在一条绳子上移动，在程式中也就意味只能使用一个阵列，而不使用其它的阵列来
警告:No configuration found for the specified action: \'s chiangfai configuration
1.index.jsp页面form标签未指定namespace属性。  <%@taglib prefix="s" uri="/struts-tags"%> ... <s:form action="submit" method="post"&g
redis -- hash_max_zipmap_entries设置过大有问题 chenchao051 redis hash
使用redis时为了使用hash追求更高的内存使用率，我们一般都用hash结构，并且有时候会把hash_max_zipmap_entries这个值设置的很大，很多资料也推荐设置到1000，默认设置为了512，但是这里有个坑 #define ZIPMAP_BIGLEN 254 #define ZIPMAP_END 255 /* Return th
select into outfile access deny问题 daizj mysql txt 导出数据到文件
本文转自：http://hatemysql.com/2010/06/29/select-into-outfile-access-deny%E9%97%AE%E9%A2%98/ 为应用建立了rnd的帐号，专门为他们查询线上数据库用的，当然，只有他们上了生产网络以后才能连上数据库，安全方面我们还是很注意的，呵呵。授权的语句如下： grant select on armory.* to rn
phpexcel导出excel表简单入门示例 dcj3sjt126com PHP Excel phpexcel
<?php error_reporting(E_ALL); ini_set('display_errors', TRUE); ini_set('display_startup_errors', TRUE); if (PHP_SAPI == 'cli') die('This example should only be run from a Web Brows
美国电影超短200句 dcj3sjt126com 电影
1. I see．我明白了。2. I quit! 我不干了!3. Let go! 放手!4. Me too．我也是。5. My god! 天哪!6. No way! 不行!7. Come on．来吧(赶快)8. Hold on．等一等。9. I agree。我同意。10. Not bad．还不错。11. Not yet．还没。12. See you．再见。13. Shut up!
Java访问远程服务 dyy_gusi httpclient webservice get post
随着webService的崛起，我们开始中会越来越多的使用到访问远程webService服务。当然对于不同的webService框架一般都有自己的client包供使用，但是如果使用webService框架自己的client包，那么必然需要在自己的代码中引入它的包，如果同时调运了多个不同框架的webService，那么就需要同时引入多个不同的clien
Maven的settings.xml配置 geeksun settings.xml
settings.xml是Maven的配置文件，下面解释一下其中的配置含义： settings.xml存在于两个地方： 1.安装的地方：$M2_HOME/conf/settings.xml 2.用户的目录：${user.home}/.m2/settings.xml 前者又被叫做全局配置，后者被称为用户配置。如果两者都存在，它们的内容将被合并，并且用户范围的settings.xml优先。
ubuntu的init与系统服务设置 hongtoushizi ubuntu
转载自： http://iysm.net/?p=178 init Init是位于/sbin/init的一个程序，它是在linux下，在系统启动过程中，初始化所有的设备驱动程序和数据结构等之后，由内核启动的一个用户级程序，并由此init程序进而完成系统的启动过程。 ubuntu与传统的linux略有不同，使用upstart完成系统的启动，但表面上仍维持init程序的形式。运行
跟我学Nginx+Lua开发目录贴 jinnianshilongnian nginx lua
使用Nginx+Lua开发近一年的时间，学习和实践了一些Nginx+Lua开发的架构，为了让更多人使用Nginx+Lua架构开发，利用春节期间总结了一份基本的学习教程，希望对大家有用。也欢迎谈探讨学习一些经验。目录第一章安装Nginx+Lua开发环境第二章 Nginx+Lua开发入门第三章 Redis/SSDB+Twemproxy安装与使用第四章 L
php位运算符注意事项 home198979 位运算 PHP &
$a = $b = $c = 0; $a & $b = 1; $b | $c = 1 问a,b,c最终为多少? 当看到这题时，我犯了一个低级错误，误以为位运算符会改变变量的值。所以得出结果是1 1 0 但是位运算符是不会改变变量的值的，例如： $a=1;$b=2; $a&$b; 这样a,b的值不会有任何改变
Linux shell数组建立和使用技巧 pda158 linux
1.数组定义　　[chengmo@centos5 ~]$ a=(1 2 3 4 5) 　　[chengmo@centos5 ~]$ echo $a 　　1 　　一对括号表示是数组，数组元素用“空格”符号分割开。　　 2.数组读取与赋值　　得到长度：　　[chengmo@centos5 ~]$ echo ${#a[@]} 　　5 　　用${#数组名[@或
hotspot源码(JDK7) ol_beta java HotSpot jvm
源码结构图，方便理解： ├─agent Serviceab
Oracle基本事务和ForAll执行批量DML练习 vipbooks oracle sql
基本事务的使用：从账户一的余额中转100到账户二的余额中去，如果账户二不存在或账户一中的余额不足100则整笔交易回滚 select * from account; -- 创建一张账户表 create table account( -- 账户ID id number(3) not null, -- 账户名称 nam

主流的聚类评价指标概览及聚类精度Accuracy的Java实现

你可能感兴趣的:(Clustering,Feature,Learning)