Whitesad_

机器学习分类问题中性能度量的方法

机器学习分类问题性能度量的方法

–date 2019.8.29
码完F1度量，ROC、AUC待天填坑
–date 2019.9.3
码完ROC、AUC，更换标题，代价曲线待天填坑
–date 2019.9.4
码完代价曲线，本博文完结

性能度量的目的

对于训练出来的学习器，我们最关注的还是它的泛化能力。即在训练样本外的学习能力，性能度量就是为了衡量泛化能力而诞生的。

性能度量的方法

最简单的：我们采用错误率进行统计，那么对于一般的回归问题，我们可以直接采用均方误差来统计
$E(f;D)=\frac{1}{m}\sum_{i=1}^m(f(x_i)-y_i)^2$
对于有概率密度的，均方误差可如此描述
$E(f;D)=\int_{x-D}(f(x)-y)^2p(x)dx$
同时我们定义了精度与错误率。精度是：分类错误的样本数占样本总数的比例，精度则是分类正确的样本数占样本总数的比例，显然有：
$P_错=\frac{n_错}{N_样}\\ P_精=1-P_错$
但是仅仅使用错误率与精度，并不能满足所有的任务需求，因为我们并不仅仅关注于整体的错误与正确率，我们还经常会考虑该分类在所有正例或者反例中的表现情况。所以我们提出了F1度量法

F1度量法

在了解F1度量法前我们首先需要知道的是查准率(precison)与查全率(recall)。我们拿二分类问题来说，那么其两者的定义为。

查准率指的做出了判断后，判断正确的准确率
$P=\frac{TP}{TP+FP}$
查全率指的是做出判断后，有多少正确的被囊括进来了
$R=\frac{TP}{TP+FN}$

查准率与查全率是一对矛盾的度量，虽然我们好像会认为可以通过加强学习器的能力来使得对于每一个样本得到准确的判断从而使得P=T=1，但是实际上当我们想要囊括进更多的正例的时候，R变高，调低阈值必然会使得判断不准确，P减小。

P值与R值在一定程度上都可以反映出该学习器的性能，所以显然的我们可以画出这样的一幅P-R图。

首先我们要注意的是P-R图在大多数情况下并非一条直线，并且不满足P+R=1这一关系。（如果想不明白继续参考定义）

P-R图直观的反映出了学习器在查全率与查准率上的表现，因此在比较不同的学习器的时候，我们可以有这样的直观比较方法：若曲线A完全位于B之上，那么A的查准率与查全率都同时在其之上，那么性能一定更优。比如此处的A、C，而两者有交叉则得视情况而定，如此处A、B。

P-R图还有一点需要注意的地方，我们将其称为平衡点（Break-Event Point），即为PR相等点。我们可以做出BEP直线来得到该学习器的BEP点。在PR图上，我们可以采用BEP度量，一般来说在采用BEP度量时，我们认为平衡点越高越好（因为这意味着PR越大），所以此时我们可以认为A优于B。

但BEP也还是太简单了，所以最常用的是我们真正的主角——F1度量

F1度量的具体形式

F1度量是基于查准率P与查全率R的调和平均值，对于每一组PR值我们都可以得出这样的一个F1的值

F1定义式：
$\frac{1}{F1}=\frac{1}{2}·(\frac{1}{P}+\frac{1}{R})$
F1化简式：
$F1=\frac{2\times P \times R}{P+R}=\frac{2\times TP}{样例总数+TP-TN}$
使用调和平均的原因：与算术平均与几何平均相比，调和平均更注重较小值。由于一般来说，我们都希望precision和recall同时高，所以要使用调和平均，来同时衡量二者的高低和均衡度这两个指标，从而避免在使用算术平均时，出现由于其中一个很高，另一个较低，造成的均值虚高的现象。

再对于具体问题，我们会分别提高P或者R，那么在性能度量时要加强/减弱这方面的度量，所以我们讲调和平均改称为加权调和平均，我们称其为F1度量的一般形式——Fβ。
$F\beta=\frac{(1+\beta^2)\times P \times R}{(\beta^2)\times P+R}$
其中β>0度量了P对R的相对重要性，β=1的时候为标准的F1，β>1的时候更加注重P，β<1更加注重R。

在更多的时候我们会有很多二分类混淆矩阵，当我们希望在n个二分类混淆矩阵上综合考察PR时，我们又有两种做法，第一个是利用n组混淆矩阵算出n个P-R值，然后用平均值得到宏查准率(macro-P),宏查全率(macro-R)然后再计算宏F1(macro-F1)
$macro-P=\frac{1}{n}\sum_{i=1}^nP_i \\macro-R=\frac{1}{n}\sum_{i=1}^nR_i \\macro-F1=\frac{2\times macro-P \times macro-R}{macro-P+macro-R}$
亦或者是对每一个TP FP TN FN计算平均值，再基于这些平均值利用定义算出微查准率(micro-P),微查全率(micro-R)然后再计算微F1(micro-F1)
$micro-P=\frac{\overline{TP}}{\overline{TP}+\overline{FP}} \\micro-R=\frac{\overline{TP}}{\overline{TP}+\overline{FN}} \\micro-F1=\frac{2\times micro-P \times micro-R}{micro-P+micro-R}$

ROC与AUC

讲完了这些我们再来说另外一种度量方法：受试者工作特征(Receiver Operating Characteristiv)。它是用于反应TPR与FPR关系的一种曲线。在最开始的时候是用于雷达敌机检测的一种分析技术（即使是现在也还是会有ROC的压轴题…），在二十世纪六七十年代开始被用于心理学与医学的检测中（惭愧，最开始看AUC是看医学博文看懂的）。而现在被用于最新的机器学习中。

首先我们先来简单分析一下我们分类问题的基本方法，我们通过自己的算法（学习机）对一个样例进行检测得到一个实值或者概率预测，然后再将其与一个分类阈（yu）值进行比较，若大于阈值则分为正类，而小于则分为反类，我们也可以称这个阈值为截断点。

一般来说，神经网络会将这些值映射到**[0,1]**的空间中。简单的例子：我们摘取一个西瓜的特征进行评分，然后将阈值设为0.5，那么高于0.5的西瓜我们就会称其为“好瓜”。当然在不同的任务中，我们可以就P、R的不同侧重方向对阈值进行调整。

那么接下来再说一下TPR（真正例率）与FPR（假正例率）
$TPR=\frac{TP}{TP+FN}=\frac{预测正例中的真正例}{所有正例}\\ FPR=\frac{FP}{TN+FP}=\frac{预测正例中的假正例}{所有反例}$
ROC图像就是描述TPR与FPR关系的图像。

对于每一个阈值，我们都可以得到不同的TPR与FPR，显然，当我们把阈值调的很高的时候，那么将不会有正例被预测为正例，TP=0，此时TPR=0，同理FP=0，FPR=0。而当阈值为0时，此时所有样例都会被预测为正例，所以此时TPR=FPR=1。那么首先我们可以得出ROC图像会经过（0,0），（1,1）两个定点，那么ROC图像究竟该是怎么样的呢？

我们知道ROC图像是由无数的TPR与FPR点对组成的，而实际上每个点还对应了一个阈值。而我们经过分析得到，从(0,0)到(1,1)是一个阈值减小的过程。而随着阈值的减小，TP与FP都必然增加（当超过阈值时判断为正例），所以显然它是一条从坐下到右上的图像，那为什么一般来说是曲线呢？这其实又和AUC有关。

AUC

AUC指的是ROC图像所围成的面积（Area Under Curve）。显然我们知道ROC图像所围成的面积是在[0,1]之间的。

我们先来看看AUC会不会存在为1的情况。显然，当AUC=1时我们有
$AUC=1\\ TPR=1$
这意味着什么呢？意味着我们的模型在任意情况都不会漏掉任何一个正例，准确度为100%，当然显然是不可能的。

那么对于AUC=0的情况
$AUC=0\\ TPR=0$
显然这也不可能，因为没有哪个阈值正常的模型可以100%过滤掉正例，因为这是另外一种意义上的完全精确。

我们再来看看这样的一种判断方法，我们称其为硬币判断法，对于任何一个样例我通过掷硬币来决定它是否为正例。那这样的话我们的ROC图像是不是就为一条从（0,0）到（1,1）的直线呢？此时AUC=0.5

因此我们可以知道，对于ROC图像来说，AUC实际上代表的是这个模型的精确度，只有当AUC>0.5的时候它才配称为一个模型，不然和掷硬币将没有区别。而当AUC>0.5的时候，ROC又得满足单调上升这个特性，这时就使得我们的图像变成一条向上凸的曲线啦！

相交的ROC图像

在这张图中AUC-A=0.85，AUC-B=0.80，但是的话我们可以看出，B在某些时候的表现会优于A，此时就需要额外讨论

拓展：TPR亦被称为灵敏度。

代价曲线

ROC曲线实际上还是有自己的不足，因为在现实生活中，我们在进行判别的时候，不同的错误判断造成的代价是不同的。如将健康的人诊断为有病大不了会增加进步检查，而将有病的诊断为无病可能就会造成生命影响。

我们仍然使用最基本的二分类举例。

接下来的所有都默认0为反例，1为正例

我们将cost_ij记为将i类分成j类的代价

对于我们的ROC图像来说来说我们显然默认了cost₀₁=cost₁₀。因此ROC图像并不能很好地反映出学习器的期望总体代价，即犯错的代价，我们当然希望这个代价它越小越好，这也是反应机器学习性能的指标。

在学习代价曲线之前，我们首先确定我们代价曲线的目的：为了反应一个模型的期望代价的变化情况，从而反映出性能高低。

条件概率

为了方便接下来的描述，在正式走入代价曲线前，我们先来说一说条件概率这一个东西。

Pr[decide Hi|Hj]指的是条件概率，指的是在Hi已经发生的条件下Hj发生的概率。Pr[Hj]指的是先验概率，简单理解成Hj发生的概率。

我们拿**Pr[decide H1|H1]**举例，这里的意思就是在样例本身就是正例的情况下，被学习器判断成正例的概率。那么我们同理可以给出如下四种概率。

期望代价

我们据此给出期望代价的公式
$E[cost]=(cost_{01}\times P\times FNR)+(cost_{10}\times (1-P)\times FPR)$
为了便于对这个公式的理解，我们先在两个括号前分别乘以样例的总数N。

$E[cost]=(cost_{01}\times P\times FNR)\times N+(cost_{10}\times (1-P)\times FPR)\times N$
特地指出：这里的P指的是正例率(positive rate)，而不是查准率(precision)
$P=\frac{TP+FN}{N_总}$

接下来我们对E[cost] 进行分析：所有的误差实际上只来自于两种，就是假正例与假反例，因为这才是认错的情况。

前半个括号：P×N是所有的正例，P×N×FNP就是所有的假反例了，乘以cost₀₁就是所有假反例的cost。

后半个括号：同理，是假正例的cost

在我们E[cost]的式子中，我们对其乘以了N便于理解，但我们发现实际上有无N，对E[cost]大小的反应是没有影响的。或者说：不乘以N，E[cost]反应的是概率代价。

那么我们顺便给出有n类的分类中期望代价的公式
$E[cost]=\sum_{i=1}^{n}\sum_{j=1}^{n}cost_{ij}Pr[decide H_i|H_j]Pr[H_j]$

E[cost]-P图像

对于二分类问题的期望代价来说
$E[cost]=(cost_{01}\times P\times FNR)+(cost_{10}\times (1-P)\times FPR)$
很明显它是一个关于P的函数表达式，我们来看看它的取值：

显然，当P=0的时候，此时没有正例，所以此时E[cost]只会由FPR产生。
$E[cost]=cost_{10}\times FPR$
同理当P=1的时候将会没有反例
$E[cost]=cost_{01}\times FNR$
那么当cost_ij确定的时候，显然E-P图像为一条直线

从代价曲线中，我们可以很容易地看出什么条件下那个分类器更好。以下就是一个例子：在交点的左侧，就是C4.5好，右侧则1R好。

归一化代价与其图像

首先我们来了解以下什么是归一化：归一化是一种简化计算的方式，即将有量纲的表达式，经过变换，化为无量纲的表达式，成为标量。在多种计算中都经常用到这种方法。

意思就是说归一化是一种在不改变表达式相对大小的前提下进行映射的方式。而在这里我们想到：对于E[cost]来说，我们是不是可以找到一个理论上的最大 maxE[cost] 值，然后我们对于每一个E[cost]用其除以maxE[cost]得到我们的归一化E[cost]
$Norm(E[cost])=\frac{E[cost]}{maxE[cost]}$
显然最大的期望在所所有实例都被错误分类（即所有正类都被判别为负，所有负类都被判别为正类，此时FNR=1，FPR=1）的情况下出现，有：
$maxE[cost]=P\times cost_{01}+(1-P)\times cost_{10}$
则有：
$Norm(E[cost])=\frac{E[cost]}{maxE[cost]}=\frac{cost_{01}\times P\times FNR+cost_{10}\times (1-P)\times FPR}{P\times cost_{01}+(1-P)\times cost_{10}}$
显然我们可以通过这种方式将我们的E[cost]全部归一化到 [0,1] 空间内，且相对大小不发生改变。

但是这里有个问题：那就是我们的Norm(E[cost])-P不再是一条直线了，那么该怎么办呢？

其实没事，因为我们一开始说了代价曲线的目的是 为了反应一个模型的期望代价的变化情况，从而反映出性能高低。 所以大不了换呗，换成更方便直观的。

我们选择正例代价，PC。即为正例中所付出的代价。
$PC=P\times C_{01}\\ maxPC=P\times C_{01}+（1-P）\times C_{10}\\ Norm(PC)=\frac {P\times C_{01}}{P\times C_{01}+（1-P）\times C_{10}}$
我们可以得到:
$Norm(E[cost])=FNR\times Norm(PC)+FPR\times (1-Norm(PC))$

因此，以Norm(PC)（归一化正例概率代价）为x轴，Norm(E[cost])(归一化代价)作为y轴得到的仍然是一条直线，并且对应的是一个分类器对应的代价曲线。

最终的曲线与面积的意义

最后的最后，我们再来回顾一下ROC，它反映的仅仅只是TPR与FPR的关系，而它是由无数的TPR-FPR点对组成的，而他们又分别对应了一个阈值。

而对于每一个阈值来说，我们得到的结果都是不一样的，期望代价也都是不一样的，我们可以认为它们彼此是一个个独立的分类器。因此我们将可以在一个Norm(E[cost])-P图像上做出这个学习器的所有Norm(E[cost])线段，而这样的话，它们必然彼此间会有交集，就像这样：

而我们需要的是这个模型的最小期望代价。对于不同的阈值η₁与η_2。在P_G这里，η₁的效果就没有η₂好，因此我们选择η₂。我们有许多许多的η，因此我们将它们全部画出来，面积会越围越小（可以自己想想为什么）。这样的话我们就绘制出了这样一条代价曲线,对应的是所有的可能性中那最小的代价期望。

那么我们的代价曲线所围成的面积是什么呢？其实也很简单，是这个学习器的期望代价，（注意不是分类器，因为一个阈值代表一个分类器），而面积的大小反应的就是该学习器的性能，显然面积越小性能越高，反之则反！

最后以我数学老师的一句话结尾：
不要小瞧了所有执迷不悟的人们，因为他们总有一天会顿悟！

《AI颠覆编码：GPT-4在编译器层面的奇幻漂流》的深度技术解析踢足球的，程序猿人工智能 python c语言
一、传统编译器的黄昏：LLVM面临的AI降维打击1.1经典优化器的性能天花板//LLVM循环优化Pass传统实现（LoopUnroll.cpp）voidLoopUnrollPass::runOnLoop(Loop*L){unsignedTripCount=SE->getSmallConstantTripCount(L);if(!TripCount||TripCount>UnrollThreshol
从零开始理解零样本学习：AI人工智能必学技术 AI天才研究院 Agentic AI 实战 AI人工智能与大数据 AI大模型企业级应用开发实战 ai
从零开始理解零样本学习：AI人工智能必学技术关键词：零样本学习、人工智能、机器学习、知识迁移、语义嵌入摘要：本文旨在全面深入地介绍零样本学习这一在人工智能领域具有重要意义的技术。首先阐述零样本学习的背景和基本概念，通过详细的解释和直观的示意图让读者建立起对零样本学习的初步认识。接着深入剖析其核心算法原理，结合Python代码进行详细说明，同时引入相关数学模型和公式并举例阐释。通过项目实战部分，带领
js递归性能优化啃火龙果的兔子开发DEMO javascript 开发语言 ecmascript
JavaScript递归性能优化递归是编程中强大的技术，但在JavaScript中如果不注意优化可能会导致性能问题甚至栈溢出。以下是几种优化递归性能的方法：1.尾调用优化(TailCallOptimization,TCO)ES6引入了尾调用优化，但只在严格模式下有效：'usestrict';//普通递归functionfactorial(n){if(n===1)return1;returnn*fa
2025 VUE常见面试题 hmildj vue.js 面试前端
前言总结一些VUE面试的基础知识，共同学习1.什么是Vue？答案：Vue.js（通常简称为Vue）是一个用于构建用户界面的‌渐进式JavaScript框架，Vue3是Vue.js框架的最新版本，它引入了许多改进和优化，包括性能提升、更好的类型支持、组合API等。2.MVVM模式是什么？Vue如何体现这一模式？‌答案：MVVM将视图（View）与数据（Model）通过ViewModel层解耦，Vue
深入详解：决策树算法的概念、原理、实现与应用场景猿享天开算法决策树机器学习
深入详解：决策树算法的概念、原理、实现与应用场景决策树（DecisionTree）是机器学习中一种直观且广泛应用的监督学习算法，适用于分类和回归任务。其树形结构易于理解，特别适合初学者。本文将从概念、原理、实现到应用场景，全面讲解决策树，并通过流程图和可视化示例增强理解，通俗易懂，帮助小白快速掌握决策树算法相关知识。1.决策树的概念1.1什么是决策树？决策树通过一系列条件判断（决策节点）将输入数据
ArkTS与仓颉语言的深度解析（鸿蒙操作系统多设备）爱学习的小齐哥哥仓颉华为仓颉 HarmonyOS5
一、引言随着物联网和智能设备的飞速发展，多设备协同开发成为当前软件开发领域的重要课题。鸿蒙操作系统作为面向全场景的分布式操作系统，为开发者提供了ArkTS和仓颉语言两种强大的开发工具，助力实现高效的多设备应用开发。本文将全面剖析这两种语言在鸿蒙多设备开发中的应用，探讨其优势、开发环境、实现一次开发多端部署的方法以及在不同设备上的性能表现和适配策略，并结合智能驾驶应用场景进行实例分析。二、ArkTS
Go Lang Fiber介绍技术的游戏 golang 开发语言后端
利用GoLangFiber进行高性能Web开发在不断发展的Web开发世界中，选择合适的框架至关重要。速度、简洁性和强大的功能集是每个开发者都追求的品质。在使用Go构建Web应用时，“Fiber”作为一个强大且轻量级的框架在众多选择中脱颖而出。在这份全面的指南中，我们将介绍GoLangFiber，涵盖其安装和设置，指导您创建一个基本的Fiber应用，并帮助您了解构成与Fiber进行Web开发旅程基础
Golang高性能并发：Goroutine调度器优化技巧 Golang编程笔记 golang 爬虫网络 ai
Golang高性能并发：Goroutine调度器优化技巧关键词：Golang、高性能并发、Goroutine、调度器、优化技巧摘要：本文深入探讨了Golang中Goroutine调度器的优化技巧，旨在帮助开发者充分发挥Golang在并发编程方面的优势，提升程序的性能。首先介绍了相关背景知识，包括目的范围、预期读者等，接着解释了核心概念，如Goroutine、调度器等，阐述了它们之间的关系。然后详细
Go插件性能优化：如何减少内存占用和提升加载速度 Golang编程笔记 golang 性能优化网络 ai
Go插件性能优化：如何减少内存占用和提升加载速度关键词：Go插件、性能优化、内存占用、加载速度、编译优化、动态链接、插件架构摘要：本文将深入探讨Go语言插件的性能优化策略，从内存管理和加载速度两个核心维度出发，详细分析插件系统的运行机制，并提供一系列实用的优化技巧和最佳实践。通过本文，您将学会如何诊断插件性能瓶颈，应用有效的优化手段，并构建高效可靠的Go插件系统。背景介绍目的和范围本文旨在为Go开
川翔云电脑全新上线：三维行业高效云端算力新选择渲染101专业云渲染电脑 houdini maya blender 3d 云计算
一、核心定位与优势云端虚拟工作站服务依托云端高性能CPU/GPU集群，提供远程桌面服务，支持普通设备运行专业软件。按需付费模式：无需采购高端硬件，大幅降低成本投入。生态协同优势：与渲染101同属母公司，可在云电脑中完成创作后一键提交至渲染101平台进行分布式渲染。二、硬件配置与性能参数CPU机型（侧重计算能力）GPU机型（图形渲染/AI训练）性能亮点支持最高8卡并联，显存叠加提升复杂场景处理能力。
深入研究 Golang 领域的 Fiber 框架架构 Golang编程笔记 golang 架构网络 ai
深入研究Golang领域的Fiber框架架构关键词：Golang、Fiber框架、架构、高性能、Web开发摘要：本文将深入探讨Golang领域的Fiber框架架构。我们会先介绍背景知识，包括目的、预期读者等。接着用通俗易懂的方式解释核心概念，如Fiber框架的各个组成部分，以及它们之间的关系。然后详细阐述核心算法原理、数学模型，通过实际代码案例展示其应用。还会介绍Fiber框架的实际应用场景、推荐
HarmonyOS从入门到精通：WebView开发逻极 harmonyos 华为鸿蒙 webview UI 前端实战
引言WebView是现代移动应用中不可或缺的组件，它使应用能够显示Web内容，实现混合开发。本文将详细介绍鸿蒙系统中WebView的开发技术，包括基本使用、性能优化和最佳实践。WebView基础知识1.WebView类型鸿蒙系统支持多种WebView实现：系统WebView自定义WebViewWeb组件2.WebView权限配置在开发WebView应用前，需要在配置文件中添加相关权限：{"modu
【网络】Linux 内核优化实战 - net.core.rmem_max 锅锅来了 Linux性能优化原理和实战网络 linux 运维
目录参数作用与原理默认值与查看方法调整场景与方法适用场景调整方法与其他参数的协同性能影响与注意事项典型案例总结net.core.rmem_max是Linux内核中控制套接字接收缓冲区（ReceiveBuffer）最大允许值的参数。它与net.core.rmem_default（默认值）共同决定了网络数据接收的性能上限和内存使用策略。以下是详细解析：参数作用与原理核心功能：限制单个套接字接收缓冲区的
Python爬虫实战：爬取知乎问答与用户信息 Python爬虫项目 python 爬虫 php 数据分析开发语言开源
简介随着网络信息量的爆炸，如何有效获取有价值的内容，成为了数据分析、机器学习等领域的基础之一。爬虫作为数据采集的基本工具之一，常常被用来获取互联网上的公开数据。在这篇博客中，我们将结合最新的Python爬虫技术，详细讲解如何爬取知乎问答与用户信息。本文将会介绍：Python爬虫的基础知识知乎问答网页结构分析使用Python进行知乎数据爬取爬取知乎问答内容与用户信息如何处理和存储爬取的数据使用最新的
【机器学习&深度学习】反向传播机制
目录一、一句话定义二、类比理解三、为什重要？四、用生活例子解释：神经网络=烹饪机器人4.1第一步：尝一口（前向传播）4.2第二步：倒着推原因（反向传播）五、换成人工智能流程说一遍六、图示类比：找山顶（最优参数）七、总结一句人话八、PyTorch代码示例：亲眼看到每一层的梯度九、梯度=损失函数对参数的偏导数十、类比总结反向传播（Backpropagation）是神经网络中训练过程的核心机制，它就像“
企业级知识库私有化部署：腾讯混元+云容器服务TKE实战大熊计算机 #腾讯云语言模型
1.背景需求分析在金融、医疗等数据敏感行业，企业需要构建完全自主可控的知识库系统。本文以某证券机构智能投研系统为原型，演示如何基于腾讯混元大模型与TKE容器服务实现：千亿级参数模型的私有化部署金融领域垂直场景微调高并发低延迟推理服务全链路安全合规方案1.1典型技术挑战#性能基准测试数据（单位：QPS）|场景|裸机部署|容器化部署|优化后||--------------------|--------
AWS Lambda与RDS连接优化之旅 t0_54manong 编程问题解决手册 aws 云计算个人开发
在云计算的时代，AWSLambda与RDS的结合为开发者提供了高效且灵活的解决方案。然而，在实际应用中，我们常常会遇到一些性能瓶颈。本文将通过一个真实案例，探讨如何优化AWSLambda与RDS之间的连接，以提高API的响应速度。背景介绍最近，我们在AWS上部署了一个使用Dotnet6开发的API，它通过APIGateway暴露给外部，并连接到同VPC内的MySQLAuroraRDS数据库。部署前
Linux ps 指令 halugin Linux指令 linux 运维
Linuxps指令ps（ProcessStatus）是Linux系统中用于查看进程状态的核心命令行工具。它提供系统当前运行进程的快照，显示进程ID、CPU和内存使用情况、运行状态等信息。作为系统管理员或开发人员，ps是监控系统资源、排查性能问题和管理系统进程的必备工具。其灵活的选项和输出格式使其适用于从简单查询到复杂分析的各种场景。什么是ps指令？概述ps是一个经典的Linux/Unix命令，用于
Linux ss 指令 halugin Linux指令 linux 运维
Linuxss指令ss（SocketStatistics）是Linux系统中用于显示网络套接字（socket）信息的现代命令行工具，是netstat的继任者，性能更高、输出更简洁。它提供详细的网络连接、监听端口和协议统计信息，广泛用于网络监控、故障排查和性能分析。相比传统的netstat，ss直接从内核获取数据显示更快，功能更强大，适合现代Linux系统。什么是ss指令？ss是Linux系统中的一
Redis配置与优化 ?ccc? redis 数据库缓存
目录一：Redis介绍1：关系数据库与非关系型数据库2：Redis基础2.1Redis简介2.2Redis安装部署2.3配置参数3：Redis命令工具3.1redis-cli命令行工具3.2redis-benchmark测试工具4：Redis数据库常用命令4.1key相关命令4.2多数据库常用命令二：Redis持久化1：RDB和AOF的区别2：RDB和AOF的优缺点3：Redis持久化配置三：性能
简单介绍物联网MQTT协议 Zio_Zhou 计算机网络 linux
在学习mqtt应用层协议之前，我们先来介绍一下发布/订阅模型以及请求/响应模型两种模型。请求/响应模型是网络应用系统中最常见的模型。在这种模型中，一个客户端（如一个Web浏览器）向服务器发送一个请求，服务器处理这个请求并返回一个响应。这个过程是同步的，意味着客户端需要等待服务器的响应。这种模型的优点是简单和易于理解，但在处理大量并发请求时可能会导致性能问题。发布/订阅模型。在这种模型中，有一个或多
大数据面试必备：Kafka性能优化 Producer与Consumer配置指南
Kafka面试题-在Kafka中，如何通过配置优化Producer和Consumer的性能?回答重点在Kafka中，通过优化Producer和Consumer的配置，可以显著提高性能。以下是一些关键配置项和策略：1、Producer端优化:batch.size：批处理大小。增大batch.size可以使Producer每次发送更多的消息，但要注意不能无限制增大，否则会导致内存占用过多。linger
Node.js 全局对象 froginwe11 开发语言
Node.js全局对象引言Node.js作为一种流行的JavaScript运行环境，以其高性能、轻量级和跨平台的特点，被广泛应用于服务器端编程、网络应用开发等领域。在Node.js中，全局对象是一个重要的概念，它为开发者提供了一系列内置的全局变量和方法，使得编程变得更加便捷。本文将详细介绍Node.js的全局对象，帮助开发者更好地理解和运用它们。Node.js全局对象概述Node.js的全局对象指
DeepSeek-V3 通俗详解：从诞生到优势，以及与 GPT-4o 的对比码事漫谈 AI ai
前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站1.DeepSeek的前世今生1.1什么是DeepSeek？DeepSeek是一家专注于人工智能技术研发的公司，致力于打造高性能、低成本的AI模型。它的目标是让AI技术更加普惠，让更多人能够用上强大的AI工具。1.2DeepSeek-V3的诞生DeepSeek-V3是DeepSeek公司推出的最新一代A
Python编程：使用Opencv进行图像处理
【参考】https://github.com/opencv/opencv/tree/4.x/samples/pythonPython使用OpenCV进行图像处理OpenCV(OpenSourceComputerVisionLibrary)是一个开源的计算机视觉和机器学习软件库。下面将从基础到高阶介绍如何使用Python中的OpenCV进行图像处理。一、安装首先需要安装OpenCV库：pipinst
ZYNQ无DMA的四路HP总线极限性能探索芯作者 D1：ZYNQ设计 fpga开发硬件工程智能硬件
深入挖掘AXIHP总线的直接传输潜力，突破传统DMA的性能瓶颈一、HP总线：ZYNQ系统的"高速公路"在XilinxZYNQ架构中，HP（HighPerformance）总线是连接PS（处理器系统）和PL（可编程逻辑）的关键通道。传统方案依赖DMA控制器进行数据传输，但当我们需要超低延迟或确定性响应时，无DMA的直接CPU控制成为更优选择。本文将揭示如何通过四路HP总线实现惊人的24GB/s理论带
webpack和vite对比解析（AI）秉承初心 AI创造 webpack 前端 node.js
以下是Webpack和Vite的对比解析，从核心机制、性能、配置扩展性、适用场景等维度进行详细说明：⚙️一、核心机制差异构建模式Webpack：采用打包器模式，启动时需遍历整个模块依赖图，将所有资源打包成Bundle，再启动开发服务器。Vite：基于ESModules原生支持，开发环境跳过打包，按需编译（浏览器请求时实时编译）。生产环境才用Rollup打包。依赖处理Webpack：冷启动时需全量打
JavaScript性能优化 lyh1344 javascript 性能优化开发语言
JavaScript性能优化方法减少重绘和回流频繁操作DOM会导致浏览器反复计算布局，引发性能问题。使用documentFragment进行批量DOM操作，或通过classList一次性修改多个样式属性。缓存DOM查询结果，避免重复访问。事件委托利用事件冒泡机制，将事件监听器绑定到父元素而非多个子元素。减少内存占用，提升动态内容的事件处理效率。节流与防抖高频事件（如滚动、输入）通过节流（Throt
Node.js特训专栏-实战进阶：8. Express RESTful API设计规范与实现爱分享的程序员 Node.js javascript node.js 前端
欢迎来到Node.js实战专栏！在这里，每一行代码都是解锁高性能应用的钥匙，让我们一起开启Node.js的奇妙开发之旅！Node.js特训专栏主页专栏内容规划详情ExpressRESTfulAPI设计规范与实现：构建标准化、可维护的接口服务在前后端分离架构盛行的今天，RESTfulAPI已成为Web服务交互的事实标准。基于Express框架构建RESTfulAPI，既能利用Node.js的高效性能
基于机器学习的智能文本分类技术研究与应用
在当今数字化时代，文本数据的爆炸式增长给信息管理和知识发现带来了巨大的挑战。从新闻文章、社交媒体帖子到企业文档和学术论文，海量的文本数据需要高效地分类和管理，以便用户能够快速找到所需信息。传统的文本分类方法主要依赖于人工规则和关键词匹配，这些方法不仅效率低下，而且难以应对复杂多变的文本内容。近年来，机器学习技术的快速发展为文本分类提供了一种高效、自动化的解决方案。一、机器学习在文本分类中的应用概述
集合框架天子之骄 java 数据结构集合框架
集合框架集合框架可以理解为一个容器，该容器主要指映射(map)、集合(set)、数组(array)和列表(list)等抽象数据结构。从本质上来说，Java集合框架的主要组成是用来操作对象的接口。不同接口描述不同的数据类型。简单介绍： Collection接口是最基本的接口，它定义了List和Set，List又定义了LinkLi
Table Driven（表驱动）方法实例 bijian1013 java enum Table Driven 表驱动
实例一： /** * 驾驶人年龄段 * 保险行业，会对驾驶人的年龄做年龄段的区分判断 * 驾驶人年龄段：01-[18,25);02-[25,30);03-[30-35);04-[35,40);05-[40,45);06-[45,50);07-[50-55);08-[55,+∞) */ public class AgePeriodTest { //if...el
Jquery 总结 cuishikuan java jquery Ajax Web jquery方法
1.$.trim方法用于移除字符串头部和尾部多余的空格。如：$.trim(' Hello ') // Hello2.$.contains方法返回一个布尔值，表示某个DOM元素（第二个参数）是否为另一个DOM元素（第一个参数）的下级元素。如：$.contains(document.documentElement, document.body); 3.$
面向对象概念的提出麦田的设计者 java 面向对象面向过程
面向对象中，一切都是由对象展开的，组织代码，封装数据。在台湾面向对象被翻译为了面向物件编程，这充分说明了，这种编程强调实体。下面就结合编程语言的发展史，聊一聊面向过程和面向对象。 c语言由贝尔实
linux网口绑定被触发 linux
刚在一台IBM Xserver服务器上装了RedHat Linux Enterprise AS 4，为了提高网络的可靠性配置双网卡绑定。一、环境描述我的RedHat Linux Enterprise AS 4安装双口的Intel千兆网卡，通过ifconfig -a命令看到eth0和eth1两张网卡。二、双网卡绑定步骤： 2.1 修改/etc/sysconfig/network
XML基础语法肆无忌惮_ xml
一、什么是XML？ XML全称是Extensible Markup Language，可扩展标记语言。很类似HTML。XML的目的是传输数据而非显示数据。XML的标签没有被预定义，你需要自行定义标签。XML被设计为具有自我描述性。是W3C的推荐标准。二、为什么学习XML？用来解决程序间数据传输的格式问题做配置文件充当小型数据库三、XML与HTM
为网页添加自己喜欢的字体知了ing 字体秒表 css
@font-face { font-family: miaobiao;//定义字体名字 font-style: normal; font-weight: 400; src: url('font/DS-DIGI-e.eot');//字体文件 } 使用： <label style="font-size:18px;font-famil
redis范围查询应用-查找IP所在城市矮蛋蛋 redis
原文地址： http://www.tuicool.com/articles/BrURbqV 需求根据IP找到对应的城市原来的解决方案 oracle表（ip_country）：查询IP对应的城市： 1.把a.b.c.d这样格式的IP转为一个数字，例如为把210.21.224.34转为3524648994 2. select city from ip_
输入两个整数，计算百分比 alleni123 java
public static String getPercent(int x, int total){ double result=(x*1.0)/(total*1.0); System.out.println(result); DecimalFormat df1=new DecimalFormat("0.0000%");
百合——————>怎么学习计算机语言百合不是茶 java 移动开发
对于一个从没有接触过计算机语言的人来说，一上来就学面向对象，就算是心里上面接受的了，灵魂我觉得也应该是跟不上的，学不好是很正常的现象，计算机语言老师讲的再多，你在课堂上面跟着老师听的再多，我觉得你应该还是学不会的，最主要的原因是你根本没有想过该怎么来学习计算机编程语言，记得大一的时候金山网络公司在湖大招聘我们学校一个才来大学几天的被金山网络录取，一个刚到大学的就能够去和
linux下tomcat开机自启动 bijian1013 tomcat
方法一：修改Tomcat/bin/startup.sh 为: export JAVA_HOME=/home/java1.6.0_27 export CLASSPATH=$CLASSPATH:$JAVA_HOME/lib/tools.jar:$JAVA_HOME/lib/dt.jar:. export PATH=$JAVA_HOME/bin:$PATH export CATALINA_H
spring aop实例 bijian1013 java spring AOP
1.AdviceMethods.java package com.bijian.study.spring.aop.schema; public class AdviceMethods { public void preGreeting() { System.out.println("--how are you!--"); } } 2.beans.x
[Gson八]GsonBuilder序列化和反序列化选项enableComplexMapKeySerialization bit1129 serialization
enableComplexMapKeySerialization配置项的含义 Gson在序列化Map时，默认情况下，是调用Key的toString方法得到它的JSON字符串的Key，对于简单类型和字符串类型，这没有问题，但是对于复杂数据对象，如果对象没有覆写toString方法，那么默认的toString方法将得到这个对象的Hash地址。 GsonBuilder用于
【Spark九十一】Spark Streaming整合Kafka一些值得关注的问题 bit1129 Stream
包括Spark Streaming在内的实时计算数据可靠性指的是三种级别： 1. At most once，数据最多只能接受一次，有可能接收不到 2. At least once, 数据至少接受一次，有可能重复接收 3. Exactly once 数据保证被处理并且只被处理一次，具体的多读几遍http://spark.apache.org/docs/lates
shell脚本批量检测端口是否被占用脚本 ronin47
#!/bin/bash cat ports |while read line do#nc -z -w 10 $line nc -z -w 2 $line 58422>/dev/null2>&1if[ $?-eq 0]then echo $line:ok else echo $line:fail fi done 这里的ports 既可以是文件
java-2.设计包含min函数的栈 bylijinnan java
具体思路参见：http://zhedahht.blog.163.com/blog/static/25411174200712895228171/ import java.util.ArrayList; import java.util.List; public class MinStack { //maybe we can use origin array rathe
Netty源码学习-ChannelHandler bylijinnan java netty
一般来说，“有状态”的ChannelHandler不应该是“共享”的，“无状态”的ChannelHandler则可“共享” 例如ObjectEncoder是“共享”的, 但 ObjectDecoder 不是因为每一次调用decode方法时，可能数据未接收完全（incomplete），它与上一次decode时接收到的数据“累计”起来才有可能是完整的数据，是“有状态”的 p
java生成随机数 cngolon java
方法一： /** * 生成随机数 * @author [email protected] * @return */ public synchronized static String getChargeSequenceNum(String pre){ StringBuffer sequenceNum = new StringBuffer(); Date dateTime = new D
POI读写海量数据 ctrain 海量数据
import java.io.FileOutputStream; import java.io.OutputStream; import org.apache.poi.xssf.streaming.SXSSFRow; import org.apache.poi.xssf.streaming.SXSSFSheet; import org.apache.poi.xssf.streaming
mysql 日期格式化date_format详细使用 daizj mysql date_format 日期格式转换日期格式化
日期转换函数的详细使用说明 DATE_FORMAT(date,format) Formats the date value according to the format string. The following specifiers may be used in the format string. The&n
一个程序员分享8年的开发经验 dcj3sjt126com 程序员
在中国有很多人都认为IT行为是吃青春饭的，如果过了30岁就很难有机会再发展下去!其实现实并不是这样子的，在下从事.NET及JAVA方面的开发的也有8年的时间了，在这里在下想凭借自己的亲身经历，与大家一起探讨一下。明确入行的目的很多人干IT这一行都冲着“收入高”这一点的，因为只要学会一点HTML, DIV+CSS，要做一个页面开发人员并不是一件难事，而且做一个页面开发人员更容
android欢迎界面淡入淡出效果 dcj3sjt126com android
很多Android应用一开始都会有一个欢迎界面，淡入淡出效果也是用得非常多的，下面来实现一下。主要代码如下： package com.myaibang.activity; import android.app.Activity;import android.content.Intent;import android.os.Bundle;import android.os.CountDown
linux 复习笔记之常见压缩命令 eksliang tar解压 linux系统常见压缩命令 linux压缩命令 tar压缩
转载请出自出处:http://eksliang.iteye.com/blog/2109693 linux中常见压缩文件的拓展名 *.gz gzip程序压缩的文件 *.bz2 bzip程序压缩的文件 *.tar tar程序打包的数据，没有经过压缩 *.tar.gz tar程序打包后，并经过gzip程序压缩 *.tar.bz2 tar程序打包后，并经过bzip程序压缩 *.zi
Android 应用程序发送shell命令 gqdy365 android
项目中需要直接在APP中通过发送shell指令来控制lcd灯，其实按理说应该是方案公司在调好lcd灯驱动之后直接通过service送接口上来给APP，APP调用就可以控制了，这是正规流程，但我们项目的方案商用的mtk方案，方案公司又没人会改，只调好了驱动，让应用程序自己实现灯的控制，这不蛋疼嘛！！！！发就发吧！一、关于shell指令：我们知道，shell指令是Linux里面带的
java 无损读取文本文件 hw1287789687 读取文件无损读取读取文本文件 charset
java 如何无损读取文本文件呢？以下是有损的 @Deprecated public static String getFullContent(File file, String charset) { BufferedReader reader = null; if (!file.exists()) { System.out.println("getFull
Firebase 相关文章索引 justjavac firebase
Awesome Firebase 最近谷歌收购Firebase的新闻又将Firebase拉入了人们的视野，于是我做了这个 github 项目。 Firebase 是一个数据同步的云服务，不同于 Dropbox 的「文件」，Firebase 同步的是「数据」，服务对象是网站开发者，帮助他们开发具有「实时」（Real-Time）特性的应用。开发者只需引用一个 API 库文件就可以使用标准 RE
C++学习重点 lx.asymmetric C++笔记
1.c++面向对象的三个特性：封装性，继承性以及多态性。 2.标识符的命名规则：由字母和下划线开头，同时由字母、数字或下划线组成；不能与系统关键字重名。 3.c++语言常量包括整型常量、浮点型常量、布尔常量、字符型常量和字符串性常量。 4.运算符按其功能开以分为六类：算术运算符、位运算符、关系运算符、逻辑运算符、赋值运算符和条件运算符。 &n
java bean和xml相互转换 q821424508 java bean xml xml和bean转换 java bean和xml转换
这几天在做微信公众号做的过程中想找个java bean转xml的工具，找了几个用着不知道是配置不好还是怎么回事，都会有一些问题，然后脑子一热谢了一个javabean和xml的转换的工具里，自己用着还行，虽然有一些约束吧，还是贴出来记录一下顺便你提一下下，这个转换工具支持属性为集合、数组和非基本属性的对象。 packag
C 语言初级位运算 1140566087 位运算 c
第十章位运算 1、位运算对象只能是整形或字符型数据，在VC6.0中int型数据占4个字节 2、位运算符：运算符作用 ~ 按位求反 << 左移 >> 右移 & 按位与 ^ 按位异或 | 按位或他们的优先级从高到低； 3、位运算符的运算功能： a、按位取反： ~01001101 = 101
14点睛Spring4.1-脚本编程 wiselyman spring4
14.1 Scripting脚本编程脚本语言和java这类静态的语言的主要区别是:脚本语言无需编译,源码直接可运行; 如果我们经常需要修改的某些代码,每一次我们至少要进行编译,打包,重新部署的操作,步骤相当麻烦; 如果我们的应用不允许重启,这在现实的情况中也是很常见的; 在spring中使用脚本编程给上述的应用场景提供了解决方案,即动态加载bean; spring支持脚本