Ritannn

读《Learning with Local and Global Consistency》

摘要

我们考虑从标记和未标记数据中学习的一般问题，这通常被称位半监督学习或转导推理。半监督学习的一种原则方法是设计一个分类函数，该函数对于已知的标记点和未标记点所揭示的内在结构具有足够的平滑性。我们提出了一个简单的算法来获得这样一个平滑的解。我们的方法在一些分类问题上产生了令人鼓舞的实验结果，并证明了对未标记数据的有效使用。

1 介绍

我们考虑常规的从标记和未标记数据中学习的问题。给定一组点集 $\large X =\left \{ x_1,...,x_l,x_{l+1},...,x_n \right \}$ 和一组标签集 $\large L=\left \{ 1,...,c \right \}$ ，前 $\large l$ 个点有标签 $\large \left \{ y_1,...,y_l \right \}\in L$ ，剩下的点没有标签。目标是预测未标记点的标签。算法的性能仅由这些未标记的点的错误率来衡量。

这样的学习问题通常被称为半监督或者转导的。由于标记通常需要昂贵的人力，而未标记的数据更容易获得，半监督学习在许多现实世界的问题中非常有用，最近吸引了大量的研究。一个典型的应用就是网页分类，手动分类的网页通常只占整个网页的很小的一部分，而未标记的例子数量很大。

半监督学习问题的关键是先验的一致性假设，即：（1）像零点可能会具有相同的标签；（2）相同结构上的点（通常称为聚类或流形）可能具有相同的标签。通常称为聚类假设。注意，第一个假设是局部的，而第二个假设是全局的。传统的监督学习算法，如k邻近，一般只依赖于第一个局部一致性假设。

为了说明半监督学习中的一致性的先验假设，让我们考虑一个根据图1(a)中的两个交织的月亮模式生成的玩具数据集。每个点都应该与其附近的点相似，而且，一个月了上的点应该比另一个月亮上的点更相似。基于RBF核的支持向量机和k-NN的分类结果分别如图1(b)和图1(c)所示。然而，根据一致性假设，这两个月亮应该按照图1(d)所示进行分类。

谱方法、随机游走、图最小切割和转导支持向量机等各种半监督学习算法的主要区别在于它们实现一致性假设的方式。将假设形式化的一个原则是设计一个分类函数，该函数对于已知的标记点和未标记点所揭示的内在结构足够光滑。这里我们提出了一个简单的迭代算法来构建这样一个光滑函数，其灵感来源于传播激活网络和扩散核，以及最近半监督学习和聚类的工作，更具体地说，来自Zhu等人的工作。该方法的基本思想是让每个点迭代地将其标签信息传递给相邻点，直到全局达到稳定状态。

本文的组织如下：第2节详细介绍了算法，并讨论了可能的变换；第3节介绍了该方法的正则化框架；第4节给出了玩具数据、数字识别和文本分类的实验结果；第5节对本文进行了总结并指出了下一步的研究方向。

2 算法

给定一组点集 $\large X=\left \{ x_1,...,x_l,x_{l+1},...,x_n \right \}\subset \mathbb{R}^m$ 和一组标签集 $\large L=\left \{ 1,...,c \right \}$ ，前 $\large l$ 个点 $\large x_i(i\leq l)$ 被标记为 $\large y_i \in L$ ，剩余的点 $\large x_u(l+1\leq u\leq n)$ 是未标记的。目标就是预测出未标记节点的标签。

令 $\large F$ 表示 $\large n\times c$ 的矩阵的集合。矩阵 $\large F=[F_1^T,...,F_n^T]^T\in F$ 通过将每个点 $\large x_i$ 标记为 $\large y_i=arg max_{j\leq c}F_{ij}$ ，来对应数据集 $\large X$ 上的分类。我们可以把 $\large F$ 理解成一个向量函数 $\large F:X\rightarrow \mathbb{R}^c$ ，它给每个点 $\large x_i$ 赋一个向量 $\large F_i$ 。定义一个 $\large n\times c$ 矩阵 $\large Y\in F$ ，其中 $\large Y_{ij}=1$ 当 $\large x_i$ 被标记为 $\large y_i=j$ ，否则 $\large Y_{ij}=0$ 。显然，根据决策规则， $\large Y$ 与初始标签是一致的。算法如下：

形成亲和矩阵 $\large W$ ，定义 $\large W_{ij}=exp\left ( -\left \| x_i-x_j \right \|^2/2\sigma ^2 \right )$ 当 $\large i\neq j$ 时，且 $\large W_{ii}=0$ 。
构造矩阵 $\large S=D^{-1/2}WD^{-1/2}$ ，其中D是一个对角矩阵，对角元素等于W的第i行之和。
$\large F(t+1)=\alpha SF(t)+(1-\alpha)Y$ 迭代直至收敛，其中α是一个(0,1)上的参数。
令 $\large F^*$ 表示序列 $\large \left \{ F(t) \right \}$ 的极限。将每个点 $\large x_i$ 标记为 $\large y_i=argmax_{j\leq c}F^*_{ij}$ 。

该算法可以从实验心理学（experimental psychology？）的激活网络扩散的角度直观地理解。我们首先在数据集 $\large X$ 上定义一个对角元素为零的成对关系 $\large W$ 。我们可以认为图 $\large G=(V,E)$ 定义在 $\large X$ 上，其中顶点集 $\large V$ 就是 $\large X$ ，边 $\large E$ 的权重就是 $\large W$ 。在第二步中，将 $\large G$ 中的权重矩阵 $\large W$ 对称归一化，这是后续迭代收敛所必需的。前两步与谱聚类完全相同。在第三步的每次迭代中，每个点从它的邻居（第一项）接收信息。值得一提的是，由于在第一步中将亲和矩阵的对角元素设为零，因此避免了自强化（self-reinforcement）。而且，由于 $\large S$ 是对称矩阵，所以信息是对称传播的。最后，将每个未标记点的标签设置为在迭代过程中接受到最多信息的类。

让我们证明序列 $\large \left \{ F(t) \right \}$ 收敛，并且 $\large F^*=(1-\alpha)(I-\alpha S)^{-1}Y$ 。在不损失一般性的前提下，设 $\large F(0)=Y$ 。通过算法中使用的迭代方程 $\large F(t+1)=\alpha SF(t)+(1-\alpha)Y$ ，得到

$\large F(t)=(\alpha S)^{t-1}Y+(1-\alpha)\sum_{i=0}^{t-1}(\alpha S)^iY$ (1)

由于 $\large 0< \alpha < 1$ 以及[-1,1]上 $\large S$ 的特征值（注意 $\large S$ 相似于随机矩阵 $\large P=D^{-1}W=D^{-1/2}SD^{1/2}$ ），

$\large \lim_{t\rightarrow \infty }(\alpha S)^{t-1}=0,\lim_{t\rightarrow \infty}\sum_{i=0}^{t-1}(\alpha S)^i=(I-\alpha S)^{-1}$ (2)（用等比数列的求和公式进行求解）

因此

$\large F^*=\lim_{t\rightarrow \infty}F(t)=(1-\alpha)(I-\alpha S)^{-1}Y$

对于分类来说，上式几乎等价于

$\large F^*=(I-\alpha S)^{-1}Y$ (3)

现在我们可以不用迭代直接计算 $\large F^*$ 。这也表明迭代结果并不依赖于迭代的初始值。另外，值得注意的是 $\large (I-\alpha S)^{-1}$ 实际上是一个图核或者扩散核。

现在我们讨论这种方法的一些可能的变体。最简单的修改就是在收敛后重复迭代，即， $\large F^*=(I-\alpha S)^{-1}...(I-\alpha S)^{-1}Y=(I-\alpha S)^{-p}Y$ 其中 $\large p$ 是任意正实数。此外，由于S与P相似，我们可以考虑在第三步中将 $\large P$ 替换为 $\large S$ ，则对应的闭式解为 $\large F^*=(I-\alpha P)^{-1}Y$ 。用 $\large P$ 的转置 $\large P^T$ 替换 $\large S$ 也很有趣。分类函数就变成了 $\large F^*=(I-\alpha P^T)^{-1}Y$ 。不能得到上式等价于 $\large F^*=(D-\alpha W)^{-1}Y$ 。在实验中，我们将这些变体与原始算法进行比较。

3 正则化框架

在此，我们开发了上述迭代算法的正则化框架。与 $\large F$ 相关的代价函数定义为

$\large Q(F)=\frac{1}{2}\left ( \sum_{i,j=1}^n W_{ij} \left \| \frac{1}{\sqrt{D_{ii}}}F_i-\frac{1}{\sqrt{D_{jj}}} F_j \right \|^2 \right )+\mu\sum_{i=1}^n\left \| F_i-Y_i \right \|^2$ (4)

其中 $\large \mu > 0$ 是正则化参数。则分类函数为

$\large F_*=arg min_{F\in F}Q(F)$ (5)

代价函数右边的第一项是平滑约束，这意味着一个好的分类函数在相邻点之间不应该有太大的变化。第二项是拟合约束，这意味着一个好的分类函数不应该对初始标签赋值有太大的改变。这两个竞争约束之间的权衡被一个正的参数 $\large \mu$ 捕获。注意，拟合约束既包含有标签的数据，也包含无标签的数据。

我们可以将平滑项理解为局部变化量的和，即函数在相邻点之间的局部变化量。正如我们所提到的，涉及成对关系的点可以被认为是一个无向加权图，其权重表示成对关系。然后在每条边测量局部变化。我们不是简单地通过边两端函数值的差来定义边上的局部变化。平滑项本质上是计算局部变化之前将函数值在每个点上的边之间分割，分配给每条边的值与它的权值成比例。

求 $\large Q(F)$ 关于 $\large F$ 的微分，我们得到

$\large \frac{\partial Q}{\partial F}|_{F=F^*}=F^*-SF*+\mu (F^*-Y)=0$

上式可以转换为

$\large F^*-\frac{1}{1+\mu}SF^*-\frac{\mu}{1+\mu}Y=0$

引入两个新的变量

$\large \alpha = \frac{1}{1+\mu},\beta = \frac{\mu}{1+ \mu}$

注意到 $\large \alpha + \beta = 1$ 。得到

$\large (I-\alpha S)F^*=\beta Y$

因为 $\large I-\alpha S$ 是可逆的，我们得到

$\large F^*=\beta(I-\alpha S)^{-1}Y$ (6)

这个式子是上述迭代算法的封闭解。

类似地，我们可以为变体 $\large F^*=(I-\alpha P)^{-1}Y$ 和 $\large F^*=(D-\alpha W)^{-1}Y$ 开发优化框架。由于篇幅有限，我们省略了讨论。

4 实验

我们使用k-NN和one-vs-rest支持向量机作为基线，然后把我们的方法和它的两个变体进行比较：(1) $\large F^*=(I-\alpha P)^{-1}Y$ ；和(2) $\large F^*=(D-\alpha W)^{-1}Y$ 。我们还与Zhu等人的调和高斯场方法与类质量归一化（CMN）相比较，后者与我们的方法密切相关。据我们所知，如果只有很少的标记点可用，就没有可靠的模型选择方法。因此，我们让所有算法使用各自的最优参数，除了在我们方法种使用的参数 $\large \alpha$ 及其变体简单地固定在0.99。

图2：两个月亮的模式分类。从(a)到(d)，我们的迭代算法在t从1增加到400的收敛过程。注意，初始标签信息是沿着月亮扩散的。

图3：随着月亮的增加，实值分类函数相对于两个月亮模式变得越来越平。注意(d)种出现了两个清晰的月亮。

图4：具有全局一致性的监督分类器给出的平滑分类结果：(a)具有RBF核的支持向量机给出的分类结果；(b)使用一致性方法平滑支持向量机的结果。

4.1 玩具问题

在本实验中，我们考虑了第1节种提到的玩具问题（图1）。亲和矩阵由PBF核定义，但对角元素被设为零。我们迭代算法的收敛过程如图2(a)-2(d)所示，t从1增加到400。注意，初始标签信息是沿着月亮扩散的。一致性假设本质上是指一个好的分类函数应该在由大量数据聚合而成的相干结构上缓慢变化。这个玩具问题可以很清楚地说明这一点。我们顶一个函数 $\large f(x_i)=(F^*_{i1}-F^*_{i2})/(F^*_{i1}+F^*_{i2})$ ，因此决策函数为符号 $\large (f(x_i))$ ，这相当于第2节种描述的决策规则。在图3中，我们显示 $\large f(x_i)$ 相对于图3(a)-3(d)中的两个月亮模式，随着t的增加， $\large f(x_i)$ 变得依次平坦。注意，在图3(d)中出现了两个清晰的月亮。

我们方法的基本思想是构造一个光滑函数。很自然地考虑使用这种方法来改进监督分类器，平滑其分类结果。换句话说，我们使用有监督分类器给出的分类结果作为算法的输入。图4中的一个玩具问题演示了这个猜想。图4(a)为基于RBF核的SVM分类结果。然后在我们的方法中将这个结果赋给 $\large Y$ 。我们方法的输出如图4(d)所示。注意，被支持向量机分类错误的点被一致性方法平滑成功。

4.2 数字识别

在本实验中，我们使用USPS手写16x16位数据集进行分类。我们在实验中使用数字1、2、3、4作为四个类。每个类有1269、929、824和852个示例，总共有3874个。

k-NN中的k设为1。支持向量机的RBF核的宽度设置为5，调和高斯场方法的RBF核的宽度设置为1.25。在我们的方法及其变体中，亲和矩阵由与调和高斯方法相同宽度的RBF核构造，但对角线元素设为0。图5的左面板总结了超过100次试验的平均测试误差。选择样本，以便每个类至少包含一个标记点。我们的一致性方法及其变体明显优于传统的监督学习算法k-NN和SVM，也优于调和高斯方法。

注意，我们的方法不要求亲和矩阵 $\large W$ 是正定的。这使我们能够以一种优雅的方式合并关于数字图像不变性的先验知识，例如，使用抖动核（jittered kernel）来计算亲和矩阵。已知其他核方法在此方法中存在问题。在我们的例子中，对于30个标记点，抖动1像素的平移会导致大约0.01的错误率。

图5：左面板：USPS手写16x16数字数据集的数字识别率（包含从1到4的数字子集）。右面板：在8014维空间中，3970个文档向量的文本分类错误率。选择样本，以便每个类至少包含一个标记点。

4.3 文本分类

在本实验中，我们研究了使用20-newsgroups组数据集的文本分类任务。我们从版本20-news-18828中选择了包含汽车、摩托车、棒球和曲棍球的休闲主题。文章使用Rainbow软件包处理的，有以下选项：(1)在技术之前通过Porter stemmer传递所有单词；(2)抛出SMART系统停止列表上的任何令牌；(3)跳过任何标题；(4)忽略出现在5个或更少文档中的单词。没有进行进一步的预处理。在8014维空间中去除空文档，得到3970个文档向量。最后将文档规范化为TFIDF表示。

定义点 $\large x_i$ 和 $\large x_j$ 之间的距离为 $\large d(x_i,x_j)=1-\left \langle x_i,x_j \right \rangle/\left \| x_i \right \|\left \| x_j \right \|$ 。k-NN中的k设为1。支持向量机的RBF核的宽度设置为1.5。调和高斯方法的RBF核的宽度设置为0.15。在我们的方法中，亲和矩阵由与调和高斯方法相同宽度的RBF核构造，但对角元素设为0。在图5的右面板中总结了超过100次试验的平均测试误差。选择样本，以便每个类至少包含一个标记点。

有趣的是，当标记点的数量为4时，即每个类有一个标记点时，调和法非常好。我们认为这是因为数据集中不同类的比例几乎相等，所以有四个标记点时，比例恰好被估计准确。然而，如果使用稍微多一点的标记点，例如10个标记点，调和方法就会变得很糟，这导致了相当糟糕的估计。随着标记点的数量进一步增加，调和方法再次很好地工作，并比我们的方法好，因此类的比例再次估计成功。然而，我们的决策规则要简单得多，它实际上对应于所谓的朴素阈值，即调和方法的基线。

5 总结

半监督学习问题的关键是一致性假设，这本质上要求分类函数对于大量标记点和未标记点所揭示的内在结构足够平滑。我们提出了一种简单的算法来获得这样的解决方案，在玩具数据、数字识别和文本分类等试验中证明了对未标记数据的有效利用。在进一步的研究中，我们将着重于模型的选择和理论分析。

Java三年经验程序员技术栈全景指南：从前端到架构，对标阿里美团全栈要求可曾去过倒悬山 java 前端架构
Java三年经验程序员技术栈全景指南：从前端到架构，对标阿里美团全栈要求三年经验是Java程序员的分水岭，技术栈深度决定你成为“业务码农”还是“架构师候选人”。本文整合阿里、美团、滴滴等大厂招聘要求，为你绘制可落地的进阶路线。一、Java核心：从语法糖到JVM底层三年经验与初级的核心差异在于系统级理解，大厂面试常考以下能力：JVM与性能调优内存模型（堆外内存、元空间）、GC算法（G1/ZGC适用场
被动降噪的概念及编程实现 CodeByte 人工智能算法 javascript 编程
被动降噪是指通过编程技术和算法，对输入的数据进行处理，以减少或消除其中的噪声。噪声可以是各种形式的干扰，例如来自传感器、通信信号或其他外部源的干扰。在本文中，我们将探讨被动降噪的意义以及如何使用编程来实现这一目标。被动降噪的意义：噪声对数据的准确性和可靠性产生负面影响。在许多应用领域，例如图像处理、音频处理和信号处理中，噪声的存在可能导致数据质量下降，使得后续的分析和处理变得困难。因此，被动降噪技
传统检测响应慢？陌讯多模态引擎提速90+FPS实战 2501_92473147 算法计算机视觉目标检测
开篇痛点：实时目标检测在安防监控中的核心挑战在安防监控领域，实时目标检测是保障公共安全的关键技术。然而，传统算法如YOLOv5或开源框架MMDetection常面临两大痛点：误报率高（复杂光照或遮挡场景下检测不稳定）和响应延迟（高分辨率视频流处理FPS低于30）。实测数据显示，城市交通监控系统误报率达15%，导致安保资源浪费；客户反馈表明，延迟超100ms时，目标跟踪可能失效。这些问题源于算法泛化
反光衣识别漏检率 30%？陌讯多尺度模型实测优化
在建筑工地、交通指挥等场景中，反光衣是保障作业人员安全的重要装备，对其进行精准识别是智能监控系统的核心功能之一。但传统视觉算法在实际应用中却屡屡碰壁：强光下反光衣易与背景混淆、远距离小目标漏检率高达30%、复杂场景下模型泛化能力不足[实测数据来源：某智慧工地项目2024年Q1日志]。这些问题直接导致安全监控系统预警滞后，给安全生产埋下隐患。一、技术解析：反光衣识别的核心难点与陌讯算法创新反光衣识别
【GESP】C++三级真题 luogu-B4359 [GESP202506 三级] 分糖果 CoderCodingNo GESP c++java 开发语言
GESPC++三级，2025年6月真题，模拟算法，难度★★☆☆☆。本次三级题目个人感觉比较简单。题目题解详见：【GESP】C++三级真题luogu-B4359[GESP202506三级]分糖果|OneCoder【GESP】C++三级真题luogu-B4359[GESP202506三级]分糖果|OneCoderGESPC++三级，2025年6月真题，模拟算法，难度★★☆☆☆。本次三级题目个人感觉比较
【华为机试】HJ61 放苹果不爱熬夜的Coder 算法华为机试 golang 华为 golang 算法面试
文章目录HJ61放苹果描述输入描述输出描述示例1示例2解题思路算法分析问题本质分析状态定义与转移递推关系详解动态规划表构建算法流程图示例推导过程代码实现思路时间复杂度分析关键优化点边界情况处理递归解法对比实际应用场景测试用例分析算法特点数学原理完整题解代码HJ61放苹果描述我们需要将m个相同的苹果放入n个相同的盘子中，允许有的盘子空着不放。求解有多少种不同的分法。输入描述输入两个整数m,n(0B[
LangChain中的向量数据库接口－Weaviate 洪城叮当 langchain 数据库经验分享笔记交互人工智能知识图谱
文章目录前言一、原型定义二、代码解析1、add_texts方法1.1、应用样例2、from_texts方法2.1、应用样例3、similarity_search方法3.1、应用样例三、项目应用1、安装依赖2、引入依赖3、创建对象4、添加数据5、查询数据总结前言 Weaviate是一个开源的向量数据库，支持存储来自各类机器学习模型的数据对象和向量嵌入，并能无缝扩展至数十亿数据对象。它提供存储文档嵌
.NET中的安全性之数字签名、数字证书、强签名程序集、反编译 hezudao25 NET .net assembly 加密算法 reference header
本文将探讨数字签名、数字证书、强签名程序集、反编译等以及它们在.NET中的运用（一些概念并不局限于.NET在其它技术、平台中也存在）。1.数字签名数字签名又称为公钥数字签名，或者电子签章等，它借助公钥加密技术实现。数字签名技术主要涉及公钥、私钥、非对称加密算法。1.1公钥与私钥公钥是公开的钥匙，私钥则是与公钥匹配的严格保护的私有密钥；私钥加密的信息只有公钥可以解开，反之亦然。在VisualStud
数据结构：导论梁辰兴数据结构学习笔记数据结构导论算法时间复杂度空间复杂度
目录一，数据结构的研究内容二，基本概念与术语（一）数据、数据元素、数据项与数据对象（二）数据结构（三）数据类型与抽象数据类型️三，抽象数据类型的表示与实现⚙️四，算法与算法分析⚖️（一）算法的定义及特性（二）评价算法优劣的基本标准⏱️（三）算法的时间复杂度（四）算法的空间复杂度章结一，数据结构的研究内容数据结构是计算机科学的核心基础，其研究内容可概括为三大维度：数据组织形式：探索如何将现实世界中的
C++ 标准库＜numeric＞
以下对C++标准库中头文件所提供的数值算法与工具做一次系统、深入的梳理，包括算法功能、示例代码、复杂度分析及实践建议。一、概述中定义了一组对数值序列进行累加、内积、差分、扫描等操作的算法，以及部分辅助工具（如std::iota、std::gcd/std::lcm等）。所有算法均作用于迭代器区间，符合STL风格，可与任意容器或原始数组配合使用。从C++17、20起，又陆续加入了并行友好的std::r
具身语义导航算法总揽 Shilong Wang 具身导航算法算法
端到端方法小脑大脑GNMNavDPNaVILAViNTNomadNavidStreamVLNMapNavNavGPTUni-NavidOctoNavNavGPT2模仿学习行为克隆BCDAgger模块化方法GOATVLFMSayPlanLM-NavETPNavVoroNavEmbodiedRAGVL-NavStairwaytoSuccess业内大佬北大王鹤NavidUni-NavidOctoNav吴
android去除gps漂移代码,GPS漂移过滤算法扇贝君
GPS漂移过滤算法基本思想：逐点过滤，再经过基础过滤后，进行判断运动状态，静止状态和运动中。如果静止，则使用电子围栏；如果运动，则先过滤大速度，再过滤加速度，然后过滤距离(包括超大距离，和速度相关距离)。对于要过滤的点，采用之前最近的可靠点，进行替换，同时，无效次数+1，如果后面是有效点，则无效次数-1，如果无效次数归0，认为这个点才是真正可靠点(无效次数为正时，都为要被替换的点)。如果遇到不定点
Python的科学计算库NumPy（一） linlin_1998 python numpy 开发语言
NumPy(NumericalPython)是Python中最基础、最重要的科学计算库之一，提供了高性能的多维数组（ndarray）对象和大量数学函数，是许多数据科学、机器学习库（如Pandas、SciPy、TensorFlow等）的基础依赖。1.创建一个numpy里面的一维数组importnumpyasnp###通过array方法创建一个ndarrayarray1=np.array([1,2,3
项目开发日记
框架整理学习UIMgr：一、数据结构与算法1.1关键数据结构成员变量类型说明m_CtrlsList当前正在显示的所有UI页面m_CachesList已打开过、但现在不显示的页面（缓存池）1.2算法逻辑查找缓存页面：从m_Caches中倒序查找是否已有对应ePageType页面，找到则重用。页面加载：从资源管理器ResMgr加载prefab并绑定控制器/视图组件。页面关闭：从m_Ctrls移除，添加
深度学习图像分类数据集—桃子识别分类 AI街潜水的八角深度学习图像数据集深度学习分类人工智能
该数据集为图像分类数据集，适用于ResNet、VGG等卷积神经网络，SENet、CBAM等注意力机制相关算法，VisionTransformer等Transformer相关算法。数据集信息介绍：桃子识别分类：['B1','M2','R0','S3']训练数据集总共有6637张图片，每个文件夹单独放一种数据各子文件夹图片统计:·B1:1601张图片·M2:1800张图片·R0:1601张图片·S3:
《C++性能优化指南》 linux版代码及原理解读第一章 v俊逸 C++性能优化指南性能优化 C++性能优化性能优化
概述：目录概述：性能优化的必要性：C++代码优化策略总结用好的编译器并用好编译器使用更好的算法使用更好的库减少内存分配和复制移除计算使用更好的数据结构提高并发性优化内存管理性能优化的必要性：按照当今的CPU运行速度来说，执行一条指令所需要的时间是10的-9次方的时间单位，如此快速的执行速度是否就没有性能优化的必要了呢？其实不然，性能优化与CPU的执行速度并无非常大的关系，试想一下，一段代码，如果用
《C++性能优化指南》 linux版代码及原理解读第四章 v俊逸 C++性能优化指南性能优化 C++性能优化指南性能优化
目录概述为什么字符串很麻烦字符串是动态分配的字符串赋值背后的操作如何面对字符串会进行大量复制写时复制COW（copyonwrite）尝试优化字符串避免临时字符串通过预留存储空间减少内存分配通过传递引用减少实参复制使用迭代器操作减少循环中的比较操作减少返回值的复制还没有结束，使用字符数组代替字符串再次优化字符串尝试其他的算法叠加以前的优化方式使用其他的编译器使用其他字符串的库功能丰富的字符串库使用s
rtos内存管理林内克思 java linux 算法
FreeRTOS将内存分配API保留在其可移植层，提供了五种内存管理算法：heap_1：最简单，不允许释放内存。heap_2：允许释放内存，但不会合并相邻的空闲块。heap_3：简单包装了标准malloc()和free()，以保证线程安全。heap_4：合并相邻的空闲块以避免碎片化。包含绝对地址放置选项。heap_5：如同heap_4，能够跨越多个不相邻内存区域的堆。特点缺点heap_1简单、不支
c++中迭代器的本质三月微风 c++开发语言
C++迭代器的本质与实现原理迭代器是C++标准模板库(STL)的核心组件之一，它作为容器与算法之间的桥梁，提供了统一访问容器元素的方式。下面从多个维度深入解析迭代器的本质特性。一、迭代器的基本定义与分类迭代器的本质迭代器是一种行为类似指针的对象，用于遍历和操作容器中的元素。它提供了一种统一的方式来访问不同容器中的元素，而无需关心容器的具体实现细节。标准分类体系C++标准定义了5种迭代器类型，按功能
微算法科技的前沿探索：量子机器学习算法在视觉任务中的革新应用 MicroTech2025 量子计算算法
在信息技术飞速发展的今天，计算机视觉作为人工智能领域的重要分支，正逐步渗透到我们生活的方方面面。从自动驾驶到人脸识别，从医疗影像分析到安防监控，计算机视觉技术展现了巨大的应用潜力。然而，随着视觉任务复杂度的不断提升，传统机器学习算法在处理大规模、高维度数据时遇到了计算瓶颈。在此背景下，量子计算作为一种颠覆性的计算模式，以其独特的并行处理能力和指数级增长的计算空间，为解决这一难题提供了新的思路。微算
目标检测中的NMS算法详解
好的，我们来详细解释一下目标检测中非极大值抑制（Non-MaximumSuppression,NMS）的相关概念和计算过程。1.为什么需要NMS？问题：目标检测模型（如FasterR-CNN,YOLO,SSD等）在推理时，对于同一个目标物体，通常会预测出多个重叠的、不同置信度（confidencescore）的候选边界框（BoundingBoxes）。直接输出所有这些框会导致：结果冗余：同一个物体
AI技术正在深刻重塑A/B测试优化的流程、效率和价值，推动其从传统的“手动实验”向“智能优化引擎”跃迁。 zzywxc787 人工智能
AI技术正在深刻重塑A/B测试优化的流程、效率和价值，推动其从传统的“手动实验”向“智能优化引擎”跃迁。以下是具体变革方向及实际影响：1.实验设计智能化：告别“猜猜看”传统痛点：依赖经验选择测试变量（如按钮颜色、文案），忽略潜在高价值组合。AI解决方案：多臂老虎机算法（MAB）：动态分配流量至表现最优的变体（如：80%流量给当前最优，20%探索新选项），减少流量浪费高达70%（Netflix案例）
分布式选举算法＜一＞ Bully算法
分布式选举算法详解：Bully算法引言在分布式系统中，节点故障是不可避免的。当主节点（Leader）发生故障时，系统需要快速选举出新的主节点来保证服务的连续性。Bully算法是一种经典的分布式选举算法，以其简单高效的特点被广泛应用于各种分布式系统中。什么是Bully算法？Bully算法是一种基于优先级的分布式选举算法。每个节点都有一个唯一的ID，ID值越大的节点优先级越高。当主节点故障时，优先级最
正义的算法迷宫—人工智能重构司法体系的技术悖论与文明试炼
一、法庭的数字化迁徙当美国威斯康星州法院采纳COMPAS算法评估被告再犯风险，当中国"智慧法院"系统年处理1.2亿件案件，司法体系正经历从石柱法典到代码裁判的范式革命。这场转型的核心驱动力是司法效率与公正的永恒张力：美国重罪案件平均审理周期达18个月，中国基层法官年人均结案357件（是德国同行的6倍），而算法能在0.3秒内完成百万份文书比对。人工智能渗透司法引发三重裂变：证据分析从经验推断转向数据
GMSK调制解调算法的仿真与研究(源码+万字报告+讲解) 炳烛之明科技算法
目录GMSK调制解调算法的仿真与研究1摘要1Abstract11绪论51.1研究背景及意义51.2国内外研究现状61.3研究内容102几种数字调制方式112.1GMSK调制112.1.1GMSK简介112.1.2GMSK调制原理122.2QPSK调制152.3二进制相移键控(BPSK)163GMSK调制与解调方案与研究173.1GMSK传统调制方法173.1.1直接产生GMSK信号173.1.2P
LeetCode第317题_离建筑物最近的距离 @蓝莓果粒茶算法 leetcode linux 算法 c#学习 python c++
LeetCode第317题：离建筑物最近的距离文章摘要本文详细解析LeetCode第317题"离建筑物最近的距离"，这是一道图论和广度优先搜索的问题。文章提供了基于多源BFS的解法，包含C#、Python、C++三种语言实现，配有详细的算法分析和性能对比。适合想要提升图论算法能力的程序员。核心知识点：广度优先搜索、图论、矩阵遍历难度等级：困难推荐人群：具有图论基础，想要提升算法能力的程序员题目描述
Matplotlib-图像处理与可视化
Matplotlib-图像处理与可视化一、图像数据的本质：从数组到像素二、基础操作：加载与显示图像1.加载图像数据2.显示单张图像3.显示灰度图像三、进阶可视化：通道分离与色彩调整1.分离RGB通道2.调整亮度与对比度四、实用技巧：色彩映射与像素值分析1.自定义色彩映射（Colormap）2.像素值分布直方图五、多图对比与标注：算法结果可视化1.边缘检测结果对比2.图像标注：突出感兴趣区域六、注意
12. 说一下 https 的加密过程 yqcoder 前端面试-服务协议 https 网络协议 http
总结客户端发送一个http请求，告诉服务器支持哪些hash算法。服务端发送证书（公钥、网址、证书机构等）给客户端。验证证书生成随机密码（RSA签名）：对称密码用公钥加密，服务器用私钥解密。进行传输生成对称加密算法说一下HTTPS的加密过程HTTPS（HyperTextTransferProtocolSecure）是HTTP协议的安全版本，通过SSL/TLS协议实现数据加密传输，确保客户端与服务器之
在mac m1基于llama.cpp运行deepseek
lama.cpp是一个高效的机器学习推理库，目标是在各种硬件上实现LLM推断，保持最小设置和最先进性能。llama.cpp支持1.5位、2位、3位、4位、5位、6位和8位整数量化，通过ARMNEON、Accelerate和Metal支持Apple芯片，使得在MACM1处理器上运行Deepseek大模型成为可能。1下载llama.cppgitclonehttps://github.com/ggerg
资源分享-FPS, 矩阵, 骨骼, 绘制, 自瞄, U3D, UE4逆向辅助实战视频教程小零羊矩阵 3d ue4
文章底部获取资源教程概述本视频教程专为游戏开发者和安全研究人员设计，涵盖FPS游戏设计、矩阵运算、骨骼绘制、自瞄算法、U3D和UE4逆向辅助等实战内容。通过102节详细视频教程，您将掌握从基础到高级的游戏开发与安全防护技能。教程内容1.FPS类型游戏的设计研究和游戏安全,反外挂研究2.二维向量和平面距离3.atan2和tan4.三维向量和空间距离5.补充向量乘法6.矩阵和矩阵的运算7.矩阵的特性8
springmvc 下 freemarker页面枚举的遍历输出杨白白 enum freemarker
spring mvc freemarker 中遍历枚举 1枚举类型有一个本地方法叫values（），这个方法可以直接返回枚举数组。所以可以利用这个遍历。 enum public enum BooleanEnum { TRUE(Boolean.TRUE, "是"), FALSE(Boolean.FALSE, "否");
实习简要总结 byalias 工作
来白虹不知不觉中已经一个多月了，因为项目还在需求分析及项目架构阶段，自己在这段时间都是在学习相关技术知识，现在对这段时间的工作及学习情况做一个总结：（1）工作技能方面大体分为两个阶段，Java Web 基础阶段和Java EE阶段 1）Java Web阶段在这个阶段，自己主要着重学习了 JSP, Servlet, JDBC, MySQL，这些知识的核心点都过了一遍，也
Quartz——DateIntervalTrigger触发器 eksliang quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208559 一.概述 simpleTrigger 内部实现机制是通过计算间隔时间来计算下次的执行时间，这就导致他有不适合调度的定时任务。例如我们想每天的 1：00AM 执行任务，如果使用 SimpleTrigger，间隔时间就是一天。注意这里就会有一个问题，即当有 misfired 的任务并且恢复执行时，该执行时间
Unix快捷键 18289753290 unix Unix；快捷键;
复制，删除，粘贴： dd:删除光标所在的行 &nbs
获取Android设备屏幕的相关参数酷的飞上天空 android
包含屏幕的分辨率以及屏幕宽度的最大dp 高度最大dp TextView text = (TextView)findViewById(R.id.text); DisplayMetrics dm = new DisplayMetrics(); text.append("getResources().ge
要做物联网？先保护好你的数据蓝儿唯美数据
根据Beecham Research的说法，那些在行业中希望利用物联网的关键领域需要提供更好的安全性。在Beecham的物联网安全威胁图谱上，展示了那些可能产生内外部攻击并且需要通过快速发展的物联网行业加以解决的关键领域。 Beecham Research的技术主管Jon Howes说：“之所以我们目前还没有看到与物联网相关的严重安全事件，是因为目前还没有在大型客户和企业应用中进行部署，也就
Java取模（求余）运算随便小屋 java
整数之间的取模求余运算很好求，但几乎没有遇到过对负数进行取模求余，直接看下面代码： /** * * @author Logic * */ public class Test { public static void main(String[] args) { // TODO A
SQL注入介绍 aijuans sql注入
二、SQL注入范例这里我们根据用户登录页面 <form action="" > 用户名：<input type="text" name="username"><br/> 密码：<input type="password" name="passwor
优雅代码风格 aoyouzi 代码
总结了几点关于优雅代码风格的描述：代码简单：不隐藏设计者的意图，抽象干净利落，控制语句直截了当。接口清晰：类型接口表现力直白，字面表达含义，API 相互呼应以增强可测试性。依赖项少：依赖关系越少越好，依赖少证明内聚程度高，低耦合利于自动测试，便于重构。没有重复：重复代码意味着某些概念或想法没有在代码中良好的体现，及时重构消除重复。战术分层：代码分层清晰，隔离明确，
布尔数组百合不是茶 java 布尔数组
androi中提到了布尔数组; 布尔数组默认的是false, 并且只会打印false或者是true 布尔数组的例子; 根据字符数组创建布尔数组 char[] c = {'p','u','b','l','i','c'}; //根据字符数组的长度创建布尔数组的个数 boolean[] b = new bool
web.xml之welcome-file-list、error-page bijian1013 java web.xml servlet error-page
welcome-file-list 1.定义： <welcome-file-list> <welcome-file>login.jsp</welcome> </welcome-file-list> 2.作用：用来指定WEB应用首页名称。 error-page1.定义： <error-page&g
richfaces 4 fileUpload组件删除上传的文件 sunjing clear Richfaces 4 fileupload
页面代码 <h:form id="fileForm"> <rich:
技术文章备忘 bit1129 技术文章
Zookeeper http://wenku.baidu.com/view/bab171ffaef8941ea76e05b8.html http://wenku.baidu.com/link?url=8thAIwFTnPh2KL2b0p1V7XSgmF9ZEFgw4V_MkIpA9j8BX2rDQMPgK5l3wcs9oBTxeekOnm5P3BK8c6K2DWynq9nfUCkRlTt9uV
org.hibernate.hql.ast.QuerySyntaxException: unexpected token: on near line 1解决方案白糖_ Hibernate
文章摘自：http://blog.csdn.net/yangwawa19870921/article/details/7553181 在编写HQL时，可能会出现这种代码： select a.name,b.age from TableA a left join TableB b on a.id=b.id 如果这是HQL，那么这段代码就是错误的，因为HQL不支持
sqlserver按照字段内容进行排序 bozch 按照内容排序
在做项目的时候，遇到了这样的一个需求：从数据库中取出的数据集，首先要将某个数据或者多个数据按照地段内容放到前面显示，例如:从学生表中取出姓李的放到数据集的前面； select * fro
编程珠玑-第一章-位图排序 bylijinnan java 编程珠玑
import java.io.BufferedWriter; import java.io.File; import java.io.FileWriter; import java.io.IOException; import java.io.Writer; import java.util.Random; public class BitMapSearch {
Java关于==和equals chenbowen00 java
关于==和equals概念其实很简单，一个是比较内存地址是否相同，一个比较的是值内容是否相同。虽然理解上不难，但是有时存在一些理解误区，如下情况： 1、 String a = "aaa"; a=="aaa"; ==> true 2、 new String("aaa")==new String("aaa
[IT与资本]软件行业需对外界投资热情保持警惕 comsci it
我还是那个看法,软件行业需要增强内生动力,尽量依靠自有资金和营业收入来进行经营,避免在资本市场上经受各种不同类型的风险,为企业自主研发核心技术和产品提供稳定,温和的外部环境... 如果我们在自己尚未掌握核心技术之前,企图依靠上市来筹集资金,然后使劲往某个领域砸钱,然
oracle 数据块结构 daizj oracle 块数据块块结构行目录
oracle 数据块是数据库存储的最小单位，一般为操作系统块的N倍。其结构为：块头－－〉空行－－〉数据，其实际为纵行结构。块的标准大小由初始化参数DB_BLOCK_SIZE指定。具有标准大小的块称为标准块（Standard Block）。块的大小和标准块的大小不同的块叫非标准块（Nonstandard Block）。同一数据库中，Oracle9i及以上版本支持同一数据库中同时使用标
github上一些觉得对自己工作有用的项目收集 dengkane github
github上一些觉得对自己工作有用的项目收集技能类 markdown语法中文说明回到顶部全文检索 elasticsearch bigdesk elasticsearch管理插件回到顶部 nosql mapdb 支持亿级别map, list, 支持事务. 可考虑做为缓存使用 C
初二上学期难记单词二 dcj3sjt126com english word
dangerous 危险的 panda 熊猫 lion 狮子 elephant 象 monkey 猴子 tiger 老虎 deer 鹿 snake 蛇 rabbit 兔子 duck 鸭 horse 马 forest 森林 fall 跌倒；落下 climb 爬；攀登 finish 完成；结束 cinema 电影院；电影 seafood 海鲜；海产食品 bank 银行
8、mysql外键(FOREIGN KEY)的简单使用 dcj3sjt126com mysql
一、基本概念 1、MySQL中“键”和“索引”的定义相同，所以外键和主键一样也是索引的一种。不同的是MySQL会自动为所有表的主键进行索引，但是外键字段必须由用户进行明确的索引。用于外键关系的字段必须在所有的参照表中进行明确地索引，InnoDB不能自动地创建索引。 2、外键可以是一对一的，一个表的记录只能与另一个表的一条记录连接，或者是一对多的，一个表的记录与另一个表的多条记录连接。 3、如
java循环标签 Foreach shuizhaosi888 标签 java循环 foreach
1. 简单的for循环 public static void main(String[] args) { for (int i = 1, y = i + 10; i < 5 && y < 12; i++, y = i * 2) { System.err.println("i=" + i + " y="
Spring Security（05）——异常信息本地化 234390216 exception Spring Security 异常信息本地化
异常信息本地化 Spring Security支持将展现给终端用户看的异常信息本地化，这些信息包括认证失败、访问被拒绝等。而对于展现给开发者看的异常信息和日志信息（如配置错误）则是不能够进行本地化的，它们是以英文硬编码在Spring Security的代码中的。在Spring-Security-core-x
DUBBO架构服务端告警Failed to send message Response javamingtingzhao 架构 DUBBO
废话不多说，警告日志如下，不知道有哪位遇到过，此异常在服务端抛出(服务器启动第一次运行会有这个警告)，后续运行没问题，找了好久真心不知道哪里错了。 WARN 2015-07-18 22:31:15,272 com.alibaba.dubbo.remoting.transport.dispatcher.ChannelEventRunnable.run(84)
JS中Date对象中几个用法 leeqq JavaScript Date 最后一天
近来工作中遇到这样的两个需求 1. 给个Date对象，找出该时间所在月的第一天和最后一天 2. 给个Date对象，找出该时间所在周的第一天和最后一天需求1中的找月第一天很简单，我记得api中有setDate方法可以使用使用setDate方法前，先看看getDate var date = new Date(); console.log(date); // Sat J
MFC中使用ado技术操作数据库你不认识的休道人 sql mfc
1.在stdafx.h中导入ado动态链接库 #import"C:\Program Files\Common Files\System\ado\msado15.dll" no_namespace rename("EOF","end")2.在CTestApp文件的InitInstance()函数中domodal之前写::CoIniti
Android Studio加速 rensanning android studio
Android Studio慢、吃内存！启动时后会立即通过Gradle来sync & build工程。（1）设置Android Studio a) 禁用插件 File -> Settings... Plugins 去掉一些没有用的插件。比如：Git Integration、GitHub、Google Cloud Testing、Google Cloud
各数据库的批量Update操作 tomcat_oracle java oracle sql mysql sqlite
MyBatis的update元素的用法与insert元素基本相同，因此本篇不打算重复了。本篇仅记录批量update操作的 sql语句，懂得SQL语句，那么MyBatis部分的操作就简单了。　　注意：下列批量更新语句都是作为一个事务整体执行，要不全部成功，要不全部回滚。 MSSQL的SQL语句　WITH R AS（　　SELECT 'John' as name, 18 as
html禁止清除input文本输入缓存 xp9802 input
多数浏览器默认会缓存input的值，只有使用ctl+F5强制刷新的才可以清除缓存记录。如果不想让浏览器缓存input的值，有2种方法：方法一：在不想使用缓存的input中添加 autocomplete="off"; eg: <input type="text" autocomplete="off" name