「已注销」

重点！11个重要的机器学习模型评估指标

全文共8139字，预计学习时长16分钟

构建机器学习模型的想法应基于建设性的反馈原则。你可以构建模型，从指标得到反馈，不断改进，直到达到理想的准确度。评估指标能体现模型的运转情况。评估指标的一个重要作用在于能够区分众多模型的结果。

很多分析师和数据科学家甚至都不愿意去检查其模型的鲁棒性。一旦完成了模型的构建，他们就会急忙将预测值应用到不可见的数据上。这种方法不正确。

我们的目的不能是简单地构建一个预测模型。目的是关于创建和选择一个对样本以外数据也能做到高精度的模型。因此，在计算预测值之前，检查模型的准确性至关重要。

在这个行业中，大家会考虑用不同类型的指标来评估模型。指标的选择完全取决于模型的类型和执行模型的计划。

模型构建完成后，这11个指标将帮助评估模型的准确性。考虑到交叉验证的日益普及和重要性，本文中也提到了它的一些原理。

预测模型的类型

说到预测模型，大家谈论的要么是回归模型（连续输出），要么是分类模型（离散输出或二进制输出）。每种模型中使用的评估指标都不同。

在分类问题中，一般使用两种类型的算法（取决于其创建的输出类型）：

1.类输出：SVM和KNN等算法创建类输出。例如，在二进制分类问题中，输出值将为0或1。但如今，有算法可以将这些类输出转换为概率输出。但是，统计圈并不是很乐意接受这些算法。

2.概率输出：逻辑回归( Logistic Regression )，随机森林( Random Forest )，梯度递增( Gradient Boosting )，Adaboost等算法会产生概率输出。将概率输出转换为类输出只是创建一个阈值概率的问题。

在回归问题中，输出时不会出现这种不一致性。输出本来就是一直连续的，不需要进一步处理。

例证

关于分类模型评估指标的讨论，笔者已在Kaggle平台上对BCI挑战做了预测。问题的解决方案超出了此处讨论的范围。但是，本文引用了训练集的最终预测。通过概率输出预测该问题，假设阈值为0.5的情况下，将概率输出转换为类输出。

1. 混淆矩阵

混淆矩阵是一个N×N矩阵，N是预测的类的数量。针对目前的问题，有N = 2，因此得到一个2×2的矩阵。你需要记住以下这些关于混淆矩阵的定义：

· 准确性：正确预测的结果占总预测值的比重

· 阳性预测值或查准率：预测结果是正例的所有结果中，正确模型预测的比例

· 阴性预测值：预测结果是负例的所有结果中，错误模型预测的比例。

· 敏感度或查全率：在真实值是正例的结果中，正确模型预测的比重。

· 特异度：在真实值是负例的所有结果中，正确模型预测的比重。

目前案例的准确率达到88％。从以上两个表中可以看出，阳性预测值很高，但阴性预测值很低，而敏感度和特异度一样。这主要由选择的阈值所造成，如果降低阈值，两对截然不同的数字将更接近。

通常，大家关注上面定义的指标中的一项。例如，一家制药公司，更关心的是最小错误阳性诊断。因此，他们会更关注高特异度。另一方面，消耗模型会更注重敏感度。混淆矩阵通常仅用于类输出模型。

2. F1分数

在上一节中，讨论了分类问题的查准率和查全率，也强调了在用例中选择查准率和查全率的重要性。如果对于一个用例，想要试图同时获得最佳查准率和查全率呢？F1-Score是分类问题查准率和查全率的调和平均值。其公式如下：

现在，一个显而易见的问题是，为什么采用调和平均值而不是算术平均值呢？这是因为调和平均值可以解决更多极值。通过一个例子来理解这一点。有一个二进制分类模型的结果如下：

查准率：0，查全率：1

这里，如果采用算术平均值，得到的结果是0.5。很明显，上面的结果是一个“傻子”分类器处理的，忽略了输入，仅将其预测的其中一个类作为输出。现在，如果要取调和平均值，得到的结果就会是0，这是准确的，因为这个模型对于所有的目的来说都是无用的。

这看似很简单。然而在有些情况下，数据科学家更关心查准率和查全率的问题。稍稍改变上面的表达式，包含一个可调参数β来实现该目的，得出：

Fbeta衡量模型对用户的有效性，用户对查全率的重视程度是查准率的β倍。

3. 增益图和提升图

增益图和提升图主要用于检查概率的顺序。以下是构建提升图/增益图的步骤：

步骤1：计算每个样本的概率。

步骤2：按降序排列这些概率。

步骤3：每组构建十分位数时都有近10%的样本。

步骤4：计算每个十分位数的响应率，分为Good( Responders )、Bad( Non-responders )和总数。

你会获得下表，需要据此绘制增增益图或提升图：

表格提供了大量信息。累积增益图介于累计 %Right和累计 %Population图之间。下面是对应的案例图：

该图会告诉你的模型responders与non-responders的分离程度。例如，第一个十分位数有10％的数量，和14％的responders。这意味着在第一个十分位数时有140％的升力。

在第一个十分位数可以达到的最大升力是多少？从第一个表中可以知道responders的总数是3,850人，第一个十分位数也包含543个样本。因此，第一个十分位数的最大升力值可能是543/3850约为14.1％。所以该模型近乎完美。

现在绘制升力曲线。升力曲线是总升力和 %population之间的关系曲线。注意：对于随机模型，此值始终稳定在100%处。这是目前案例对应的提升图：

也可以使用十分位数绘制十分位升力：

这个图说明什么？这表示模型运行到第7个十分位数都挺好。每个十分位数都会倾向non-responders。在3分位数和7分位数之间，任何升力在100%以上的模型（@十分位数）都是好模型。否则可能要先考虑采样。

提升图或增益图表广泛应用于目标定位问题。这告诉我们，在特定的活动中，可以锁定客户在哪个十分位数上。此外，它会告诉你对新目标数据期望的响应量。

4. K-S图

K-S或Kolmogorov-Smirnov图表衡量分类模型的性能。更准确地说，K-S是衡量正负例分布分离程度的指标。如果分数将人数划分为单独两组，其中一组含所有正例，另一组含所有负例，则K-S值为100。

另一方面，如果模型不能区分正例和负例，那么就如同模型从总体中随机选择案例一样，K-S为0。在大多数分类模型中，K-S值将从0和100之间产生，并且值越高，模型对正例和负例的区分越好。

对于以上案例，请看表格：

还可以绘制 %Cumulative Good和Bad来查看最大分离。下面是示例图：

到目前为止，所涵盖的指标主要用于分类问题。直到这里，已经了解了混淆矩阵、增益图和提升图以及kolmogorov-smirnov图。接下来继续学习一些更重要的指标。

5. AUC曲线( AUC-ROC )

这又是业内常用的指标之一。使用ROC曲线的最大优点是不受responders比例变化的影响。下文会讲得更清楚。

首先试着去理解什么是ROC（接收器操作特性）曲线。如果看下面的混淆矩阵，就会观察到对于概率模型，每个指标的值不同。

因此，对于每种敏感度，都会有不同的特异度。两者差异如下：

ROC曲线是敏感度和（1-特异度）之间的曲线。（1-特异性）也称为假正率，敏感度也称为真正率。下图本案例的ROC曲线。

以阈值为0.5为例（参考混淆矩阵）。这是混淆矩阵：

如你所见，此时敏感度为99.6％，（1-特异性）大约为60％。该坐标在ROC曲线中成为点。为了将该曲线表达成数值，就要计算该曲线下的面积( AUC )。

注意，整个正方形的面积是1 * 1 = 1。因此，AUC本身就是曲线下的比值和总面积。对于那个案例，得到AUC ROC的值为96.4％。以下是一些拇指规则( thumb rules )：

· 0.90-1=优秀(A）

· 0.80-0.90 =良好(B)

· 0.70-0.80 =一般(C)

· 0.60-0.70 =差(D)

· 0.50-0.60 =失败(F)

可以看出，目前的模型属于优秀范围。但也可能只是过度拟合。这种情况下，验证显得迫在眉睫了。

以下几点需注意：

1.对于作为类输出的模型，将在ROC图中用单个点表示。

2.这些模型无法相互比较，因为需要在单个指标基础上进行判断而不是多个指标。例如，具有参数（0.2,0.8）的模型和具有参数（0.8,0.2）的模型可以来自相同的模型，因此不应直接比较这些指标。

3.在概率模型的情况下，有幸能得到一个AUC-ROC的单个数字。但是，仍然需要查看整个曲线去做最终决定。又可能是一个模型在某些范围中性能更好，其他的在别的范围中更好。

使用ROC的优点

为什么要使用ROC而不是升力曲线等指标？

升力取决于人口的总响应率。因此，如果人口的响应率发生变化，同一模型将带来不同的升力图。解决这种问题的方案可以是真正的升力图（在每个十分位数处找到升力值和完美模型升力值的比率）。但这种比例很少对企业有价值。

另一方面，ROC曲线几乎与响应率无关。这是因为它有两个来自混淆矩阵柱状计算中的轴。在响应率变化的情况下，x轴和y轴的分子和分母也会有相应的改变。

6. 对数损失

确定模型性能时AUC-ROC会考虑预测概率。然而，AUC ROC存在一个问题，就是只考虑概率的顺序，因此忽略了模型对更可能是正样本预测更高概率的能力。这种情况下，可以采取对数损失，它只是每个案例修正预测概率的对数的负平均值。

· p( yi )是正类预测概率

· 1-p( yi )是负类预测概率

· yi = 1表示正类，0表示负类（实际值）

随机计算几个值的对数损失，得出上述数学函数的要点：

Logloss（1,0.1）= 2.303

Logloss（1,0.5）= 0.693

Logloss（1,0.9）= 0.105

如果绘制这种关系，曲线图如下：

从斜率向右下方逐渐平缓可以明显看出，随着预测概率的提高，对数损失值逐渐下降。不过反方向移动时，对数损失快速增加而预测概率趋近于0。

因此，降低对数损失，对模型更好。但是，对于好的对数损失没有绝对的衡量标准，它取决于用例或者应用程序。

虽然AUC是根据具有不同决策阈值的二进制分类计算的，但对数损失实际上考虑了分类的“确定性”。

7. 基尼系数

基尼系数有时用于分类问题。基尼系数可由AUC ROC数直接导出。基尼只是ROC曲线和diagnol线之间的面积与上述三角形的面积之比。下面是使用公式：

Gini = 2*AUC – 1

基尼系数高于60％，模型就很好。对于目前的情况而言，基尼系数的值为92.7％。

8. Concordant – Discordant ratio

对于任何分类预测问题，这也是最重要的指标之一。想要理解这个，先假设有3名学生今年有可能通过。以下是预测：

A – 0.9

B – 0.5

C – 0.3

现在想象一下。如果从这三个学生中挑两对，会有多少对？将有3种组合：AB、BC和CA。现在，年底结束后，A和C通过了，而B没有。不行，选择所有配对，找到一个responder和其他non-responder。这样的配对有多少？

有两对：AB和BC。现在对于2对中的每一对，一致对( concordant pair )是responder的概率高于non-responder的。而不一致的对( discordant pair )虽情况相反但也是如此。如果两个概率相等，就称之为相当的。现在来看看案例中发生了什么：

AB – Concordant

BC – Discordant

因此，在这个例子中50％的一致案例。一致率超过60％会被视为好模型。在决定锁定客户数量时，通常不使用此指标标准。它主要用于测试模型的预测能力。像锁定客户数量的话，就再次采用KS图或者提升图。

9. 均方根误差

RMSE是回归问题中最常用的评估指标。它遵循一个假设，即误差无偏，遵循正态分布。以下是RMSE需要注意的要点：

1.“平方根”使该指标能够显示很多偏差。

2.此指标的“平方”特性有助于提供更强大的结果，从而防止取消正负误差值。换句话说，该指标恰当地显示了错误术语的合理幅度。

3.它避免使用绝对误差值，这在数学计算中是极不希望看到的。

4.有更多样本时，使用RMSE重建误差分布被认为更可靠。

5.RMSE受异常值的影响很大。因此，请确保在使用此指标之前已从数据集中删除了异常值。

6.与平均绝对误差相比，RMSE提供更高的权重并惩罚大错误。

RMSE指标由以下公式给出：

其中，N是样本总数。

10. 均方根对数误差

在均方根对数误差的情况下，采用预测和实际值的对数。基本上，正在测量的方差就是变化。预测值和真值都很庞大时不希望处理预测值和实际值存在的巨大差异话通常采用RMSLE。

1.如果预测值和实际值都很小：RMSE和RMSLE相同。

2.如果预测值或实际值很大：RMSE> RMSLE

3.如果预测值和实际值都很大：RMSE> RMSLE（RMSLE几乎可以忽略不计）

11. R-Squared/Adjusted R-Squared

已经知道RMSE降低时，模型的性能将会提高。但仅凭这些值并不直观。

在分类问题的情况下，如果模型的准确度为0.8，可以衡量模型对随机模型的有效性，哪个准确度为0.5。因此，随机模型可以作为基准。但是在谈论RMSE指标时，却没有比较基准。

这里可以使用R-Squared指标。R-Squared的公式如下：

MSE（模型）：预测值与实际值的平均误差

MSE（基线）：平均预测值与实际值的平均误差

换言之，与一个非常简单的模型相比，回归模型可以说很不错了，一个简单的模型只能预测训练集中目标的平均值作为预测。

Adjusted R-Squared调整后的可决系数（参考）

模型表现与baseline相同时，R-Squared为0。模型越好，R2值越高。最佳模型含所有正确预测值时，R-Squared为1。但是，向模型添加新功能时，R-Squared值会增加或保持不变。R-Squared不会因添加了对模型无任何价值的功能而被判“处罚”。因此，R-Squared的改进版本是经过调整的R-Squared。调整后的R-Squared的公式如下：

k：特征数量

n：样本数量

如你所见，此指标会考虑特征的数量。添加更多特征时，分母项n-（k +1）减小，因此整个表达式在增大。

如果R-Squared没有增大，那意味着添加的功能对模型没有价值。因此总的来说，在1上减去一个更大的值，调整的r2，反而会减少。

除了这11个指标之外，还有另一种检验模型性能。这7种方法在数据科学中具有统计学意义。但是，随着机器学习的到来，我们现在拥有更强大的模型选择方法。没错！现在来谈论一下交叉验证。

虽然交叉验证不是真正的评估指标，会公开用于传达模型的准确性。但交叉验证提供了足够直观的数据来概括模型的性能。

现在来详细了解交叉验证。

12.交叉验证（虽然不是指标！）

首先来了解交叉验证的重要性。由于日程紧张，这些天笔者没有太多时间去参加数据科学竞赛。很久以前，笔者参加了Kaggle的TFI比赛。这里就不相信介绍笔者竞赛情况了，我想向大家展示个人的公共和私人排行榜得分之间的差异。

以下是Kaggle得分的一个例子！

对于TFI比赛，以下是个人的三个解决方案和分数（越小越好）：

可以注意到，公共分数最差的第三个条目成为了私人排行榜上的最佳模型。“submission_all.csv”之前有20多个模型，但笔者仍然选择“submission_all.csv”作为最终条目（实践证明确实很有效）。是什么导致了这种现象？笔者的公共和私人排行榜的差异是过度拟合造成的。

模型变得高度复杂时，过度拟合也会开始捕捉噪音。这种“噪音”对模型没有任何价值，只会让其准确度降低。

下一节中，笔者将讨论在真正了解测试结果之前，如何判断解决方案是否过度拟合。

概念：交叉验证

交叉验证是任何类型数据建模中最重要的概念之一。就是说，试着留下一个样本集，但并不在这个样本集上训练模型，在最终确定模型之前测试依据该样本集建立的模型。

上图显示了如何使用及时样本集验证模型。简单地将人口分成2个样本，在一个样本上建立模型。其余人口用于及时验证。

上述方法会有不好的一面吗？

这种方法一个消极面就是在训练模型时丢失了大量数据。因此，模型的偏差会很大。这不会给系数做出最佳估测。那么下一个最佳选择是什么？

如果，将训练人口按50:50的比例分开，前50用于训练，后50用于验证。然后两组颠倒过来进行实验。通过这种方式，在整个人口基础上训练模型，但一次只借用50％。这样可以减少偏差，因为样品选择在一定程度上可以提供较小的样本来训练模型。这种方法称为2折交叉验证。

k折交叉验证

最后一个例子是从2折交叉验证推断到k折交叉验证。现在，尝试将k折交叉验证的过程可视化。

这是一个7折交叉验证。

真实情况是这样：将整个人口划分为7个相同的样本集。现在在6个样本集（绿色框）上训练模型，在1个样本集（灰色框）上进行验证。然后，在第二次迭代中，使用不同的样本集训练模型作为验证。在7次迭代中，基本上在每个样本集上都构建了模型，同时作为验证。这是一种降低选择偏差、减少预测方差的方法。一旦拥有所有这7个模型，就可以利用平均误差项找到最好的模型。

这是如何帮助找到最佳（非过度拟合）模型的？

k折交叉验证广泛用于检查模型是否是过度拟合。如果k次建模中的每一次的性能指标彼此接近，那么指标的均值最高。在Kaggle比赛中，你可能更多地依赖交叉验证分数而不是Kaggle公共分数。这样就能确保公共分数不单单是偶然出现。

如何使用任何型号实现k折？

R和Python中的k折编码非常相似。以下是在Python中编码k-fold的方法：

from sklearn import cross_validation model = RandomForestClassifier(n_estimators=100) #Simple K-Fold cross validation. 5 folds. #(Note: in older scikit-learn versions the "n_folds" argument is named "k".) cv = cross_validation.KFold(len(train), n_folds=5, indices=False) results = [] # "model" can be replaced by your model object # "Error_function" can be replaced by the error function of your analysis for traincv, testcv in cv: probas = model.fit(train[traincv], target[traincv]).predict_proba(train[testcv]) results.append( Error_function ) #print out the mean of the cross-validated results print "Results: " + str( np.array(results).mean() )

但是如何选择k呢？

这是棘手的部分。需要权衡来选择k。

对于小k，有更高的选择偏差但性能差异很小。

对于大k，有小的选择偏差但性能差异很大。

想想极端情况：

k = 2：只有2个样本，类似于50-50个例子。在这里，每次仅在50％的人口中构建模型。但由于验证会有很多人，所以验证性能的差异是最小的。

k =样本数( n )：这也称为“留一法”。有n次样本，建模重复n次，只留下一个样本集进行交叉验证。因此，选择偏差很小，但验证性能的差异非常大。

通常，针对大多数情况，建议使用k = 10的值。

结语

在训练样本上评估模型毫无意义。留出大量的样本来验证模型也是在浪费数据。k折交叉验证为我们提供了一种使用单个数据点的方法，可以在很大程度上减少选择偏差。同时，K折交叉验证可以与任何建模技术一起使用。

此外，本文中介绍的指标标准是分类和回归问题中评估最常用的指标标准。

留言点赞关注

我们一起分享AI学习与发展的干货
欢迎关注全平台AI垂类自媒体 “读芯术”

（添加小编微信：dxsxbb，加入读者圈，一起讨论最新鲜的人工智能科技哦～）

你可能感兴趣的:(AI,热点文章,人工智能,机器学习,模型)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
android系统selinux中添加新属性property 辉色投像
1.定位/android/system/sepolicy/private/property_contexts声明属性开头：persist.charge声明属性类型：u:object_r:system_prop:s0图12.定位到android/system/sepolicy/public/domain.te删除neverallow{domain-init}default_prop:property
C语言宏函数南林yan C语言 c语言
一、什么是宏函数？通过宏定义的函数是宏函数。如下，编译器在预处理阶段会将Add(x,y)替换为((x)*(y))#defineAdd(x,y)((x)*(y))#defineAdd(x,y)((x)*(y))intmain(){inta=10;intb=20;intd=10;intc=Add(a+d,b)*2;cout<
c++ 的iostream 和 c++的stdio的区别和联系黄卷青灯77 c++算法开发语言 iostream stdio
在C++中，iostream和C语言的stdio.h都是用于处理输入输出的库，但它们在设计、用法和功能上有许多不同。以下是两者的区别和联系：区别1.编程风格iostream（C++风格）：C++标准库中的输入输出流类库，支持面向对象的输入输出操作。典型用法是cin（输入）和cout（输出），使用>操作符来处理数据。更加类型安全，支持用户自定义类型的输入输出。#includeintmain(){in
LocalDateTime 转 String igotyback java 开发语言
importjava.time.LocalDateTime;importjava.time.format.DateTimeFormatter;publicclassMain{publicstaticvoidmain(String[]args){//获取当前时间LocalDateTimenow=LocalDateTime.now();//定义日期格式化器DateTimeFormatterformat
店群合一模式下的社区团购新发展——结合链动 2+1 模式、AI 智能名片与 S2B2C 商城小程序源码说私域人工智能小程序
摘要：本文探讨了店群合一的社区团购平台在当今商业环境中的重要性和优势。通过分析店群合一模式如何将互联网社群与线下终端紧密结合，阐述了链动2+1模式、AI智能名片和S2B2C商城小程序源码在这一模式中的应用价值。这些创新元素的结合为社区团购带来了新的机遇，提升了用户信任感、拓展了营销渠道，并实现了线上线下的完美融合。一、引言随着互联网技术的不断发展，社区团购作为一种新兴的商业模式，在满足消费者日常需
消息中间件有哪些常见类型 xmh-sxh-1314 java
消息中间件根据其设计理念和用途，可以大致分为以下几种常见类型：点对点消息队列（Point-to-PointMessagingQueues）：在这种模型中，消息被发送到特定的队列中，消费者从队列中取出并处理消息。队列中的消息只能被一个消费者消费，消费后即被删除。常见的实现包括IBM的MQSeries、RabbitMQ的部分使用场景等。适用于任务分发、负载均衡等场景。发布/订阅消息模型（Pub/Sub
每日一题——第八十九题互联网打工人no1 C语言程序设计每日一练 c语言
题目：在字符串中找到提取数字，并统计一共找到多少整数，a123xxyu23&8889，那么找到的整数为123，23，8889//思想：#include#include#includeintmain(){charstr[]="a123xxyu23&8889";intcount=0;intnum=0;//用于临时存放当前正在构建的整数。boolinNum=false;//用于标记当前是否正在读取一个整
每日一题——第八十一题互联网打工人no1 C语言程序设计每日一练 c语言
打印如下图案:#includeintmain(){inti,j;charch='A';for(i=1;i<5;i++,ch++){for(j=0;j<5-i;j++){printf("");//控制空格输出}for(j=1;j<2*i;j++)//条件j<2*i{printf("%c",ch);//控制字符输出}printf("\n");}return0;}
每日一题——第八十二题互联网打工人no1 C语言程序设计每日一练 c语言
题目：将一个控制台输入的字符串中的所有元音字母复制到另一字符串中#include#include#include#include#defineMAX_INPUT1024boolisVowel(charp);intmain(){charinput[MAX_INPUT];charoutput[MAX_INPUT];printf("请输入一串字符串：\n");fgets(input,sizeof(inp
每日一题——第八十三题互联网打工人no1 C语言程序设计每日一练 c语言
题目：将输入的整形数字输出,输出1990，输出"1990"#include#defineMAX_INPUT1024intmain(){intarrr_num[MAX_INPUT];intnum,i=0;printf("请输入一个数字：");scanf_s("%d",&num);while(num!=0){arrr_num[i++]=num%10;num/=10;}printf("\"");for(
git常用命令笔记咩酱-小羊 git 笔记
###用习惯了idea总是不记得git的一些常见命令，需要用到的时候总是担心旁边站了人~~~记个笔记@_@，告诉自己看笔记不丢人初始化初始化一个新的Git仓库gitinit配置配置用户信息gitconfig--globaluser.name"YourName"gitconfig--globaluser.email"[email protected]"基本操作克隆远程仓库gitclone查看
LLM 词汇表落难Coder LLMs NLP 大语言模型大模型 llama 人工智能
Contextwindow“上下文窗口”是指语言模型在生成新文本时能够回溯和参考的文本量。这不同于语言模型训练时所使用的大量数据集，而是代表了模型的“工作记忆”。较大的上下文窗口可以让模型理解和响应更复杂和更长的提示，而较小的上下文窗口可能会限制模型处理较长提示或在长时间对话中保持连贯性的能力。Fine-tuning微调是使用额外的数据进一步训练预训练语言模型的过程。这使得模型开始表示和模仿微调数
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
使用Faiss进行高效相似度搜索 llzwxh888 faiss python
在现代AI应用中，快速和高效的相似度搜索是至关重要的。Faiss（FacebookAISimilaritySearch）是一个专门用于快速相似度搜索和聚类的库，特别适用于高维向量。本文将介绍如何使用Faiss来进行相似度搜索，并结合Python代码演示其基本用法。什么是Faiss？Faiss是一个由FacebookAIResearch团队开发的开源库，主要用于高维向量的相似性搜索和聚类。Faiss
使用Apify加载Twitter消息以进行微调的完整指南 nseejrukjhad twitter easyui 前端 python
#使用Apify加载Twitter消息以进行微调的完整指南##引言在自然语言处理领域，微调模型以适应特定任务是提升模型性能的常见方法。本文将介绍如何使用Apify从Twitter导出聊天信息，以便进一步进行微调。##主要内容###使用Apify导出推文首先，我们需要从Twitter导出推文。Apify可以帮助我们做到这一点。通过Apify的强大功能，我们可以批量抓取和导出数据，适用于各类应用场景。
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
利用LangChain的StackExchange组件实现智能问答系统 nseejrukjhad langchain microsoft 数据库 python
利用LangChain的StackExchange组件实现智能问答系统引言在当今的软件开发世界中，StackOverflow已经成为程序员解决问题的首选平台之一。而LangChain作为一个强大的AI应用开发框架，提供了StackExchange组件，使我们能够轻松地将StackOverflow的海量知识库集成到我们的应用中。本文将详细介绍如何使用LangChain的StackExchange组件
如何部分格式化提示模板:LangChain中的高级技巧 nseejrukjhad langchain java 服务器 python
标题:如何部分格式化提示模板:LangChain中的高级技巧内容:如何部分格式化提示模板:LangChain中的高级技巧引言在使用大型语言模型(LLM)时,提示工程是一个关键环节。LangChain提供了强大的提示模板功能,让我们能更灵活地构建和管理提示。本文将介绍LangChain中一个高级特性-部分格式化提示模板,这个技巧可以让你的提示管理更加高效和灵活。什么是部分格式化提示模板?部分格式化提
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
Faiss Tips：高效向量搜索与聚类的利器焦习娜Samantha
FaissTips：高效向量搜索与聚类的利器faiss_tipsSomeusefultipsforfaiss项目地址:https://gitcode.com/gh_mirrors/fa/faiss_tips项目介绍Faiss是由FacebookAIResearch开发的一个用于高效相似性搜索和密集向量聚类的库。它支持多种硬件平台，包括CPU和GPU，能够在海量数据集上实现快速的近似最近邻搜索（AN
数据仓库——维度表一致性墨染丶eye 背诵数据仓库
数据仓库基础笔记思维导图已经整理完毕，完整连接为：数据仓库基础知识笔记思维导图维度一致性问题从逻辑层面来看，当一系列星型模型共享一组公共维度时，所涉及的维度称为一致性维度。当维度表存在不一致时，短期的成功难以弥补长期的错误。维度时确保不同过程中信息集成起来实现横向钻取货活动的关键。造成横向钻取失败的原因维度结构的差别，因为维度的差别，分析工作涉及的领域从简单到复杂，但是都是通过复杂的报表来弥补设计
【PG】常见数据库、表属性设置江无羡数据库
PG的常见属性配置方法数据库复制、备份相关表的复制标识单表操作批量表操作链接数据库复制、备份相关表的复制标识单表操作通过ALTER语句单独更改一张表的复制标识。ALTERTABLE[tablename]REPLICAIDENTITYFULL;批量表操作通过代码块的方式，对某个schema中的所有表一起更新其复制标识。SELECTtablename,CASErelreplidentWHEN'd'TH
Faiss：高效相似性搜索与聚类的利器网络·魚大数据 faiss
Faiss是一个针对大规模向量集合的相似性搜索库，由FacebookAIResearch开发。它提供了一系列高效的算法和数据结构，用于加速向量之间的相似性搜索，特别是在大规模数据集上。本文将介绍Faiss的原理、核心功能以及如何在实际项目中使用它。Faiss原理：近似最近邻搜索：Faiss的核心功能之一是近似最近邻搜索，它能够高效地在大规模数据集中找到与给定查询向量最相似的向量。这种搜索是近似的，
每日一题——第八十八题互联网打工人no1 C语言程序设计每日一练 c语言
题目：输入一个9位的无符号整数，判断其是否有重复数字#include#include#includeintmain(){charnum_str[10];printf("请输入一个9位数的无符号数：");scanf_s("%9d",&num_str);if(strlen(num_str)!=9){printf("输入的不是一个9位无符号整数，请重新输入");}else{if(hasDuplicate
mac电脑命令行获取电量小米人er 我的博客 macos 命令行
在macOS上，有几个命令行工具可以用来获取电量信息，最常用的是pmset命令。你可以通过以下方式来查看电池状态和电量信息：查看电池状态：pmset-gbatt这个命令会返回类似下面的输出：Nowdrawingfrom'BatteryPower'-InternalBattery-0(id=1234567)95%;discharging;4:02remainingpresent:true输出中包括电
【Git】常见命令(仅笔记) 好想有猫猫 Git Linux学习笔记 git 笔记 elasticsearch linux c++
文章目录创建/初始化本地仓库添加本地仓库配置项提交文件查看仓库状态回退仓库查看日志分支删除文件暂存工作区代码远程仓库使用`.gitigore`文件让git不追踪一些文件标签创建/初始化本地仓库gitinit添加本地仓库配置项gitconfig-l#以列表形式显示配置项gitconfiguser.name"ljh"#配置user.namegitconfiguser.email"[email protected]
【华为OD技术面试真题 - 技术面】- python八股文真题题库（1）算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.数据预处理流程数据预处理的主要步骤工具和库2.介绍线性回归、逻辑回归模型线性回归（LinearRegression）模型形式：关键点：逻辑回归（LogisticRegression）模型形式：关键点：参数估计与评估：3.python浅拷贝及深拷贝浅拷贝（Shal
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
java解析APK 3213213333332132 java apk linux 解析APK
解析apk有两种方法 1、结合安卓提供apktool工具，用java执行cmd解析命令获取apk信息 2、利用相关jar包里的集成方法解析apk 这里只给出第二种方法，因为第一种方法在linux服务器下会出现不在控制范围之内的结果。 public class ApkUtil { /** * 日志对象 */ private static Logger
nginx自定义ip访问N种方法 ronin47 nginx 禁止ip访问
　　　因业务需要，禁止一部分内网访问接口，　由于前端架了F5，直接用deny或allow是不行的，这是因为直接获取的前端Ｆ５的地址。　　　所以开始思考有哪些主案可以实现这样的需求，目前可实施的是三种：　　　一：把ip段放在redis里，写一段lua 二：利用geo传递变量，写一段
mysql timestamp类型字段的CURRENT_TIMESTAMP与ON UPDATE CURRENT_TIMESTAMP属性 dcj3sjt126com mysql
timestamp有两个属性，分别是CURRENT_TIMESTAMP 和ON UPDATE CURRENT_TIMESTAMP两种，使用情况分别如下： 1. CURRENT_TIMESTAMP 当要向数据库执行insert操作时，如果有个timestamp字段属性设为 CURRENT_TIMESTAMP，则无论这
struts2+spring+hibernate分页显示 171815164 Hibernate
分页显示一直是web开发中一大烦琐的难题，传统的网页设计只在一个JSP或者ASP页面中书写所有关于数据库操作的代码，那样做分页可能简单一点，但当把网站分层开发后，分页就比较困难了，下面是我做Spring+Hibernate+Struts2项目时设计的分页代码，与大家分享交流。　　1、DAO层接口的设计，在MemberDao接口中定义了如下两个方法： public in
构建自己的Wrapper应用 g21121 rap
我们已经了解Wrapper的目录结构，下面可是正式利用Wrapper来包装我们自己的应用，这里假设Wrapper的安装目录为:/usr/local/wrapper。首先，创建项目应用 &nb
[简单]工作记录_多线程相关 53873039oycg 多线程
最近遇到多线程的问题,原来使用异步请求多个接口(n*3次请求) 方案一使用多线程一次返回数据,最开始是使用5个线程,一个线程顺序请求3个接口,超时终止返回缺点测试发现必须3个接
调试jdk中的源码，查看jdk局部变量程序员是怎么炼成的 jdk 源码
转自：http://www.douban.com/note/211369821/ 学习jdk源码时使用-- 学习java最好的办法就是看jdk源代码，面对浩瀚的jdk（光源码就有40M多，比一个大型网站的源码都多）从何入手呢，要是能单步调试跟进到jdk源码里并且能查看其中的局部变量最好了。可惜的是sun提供的jdk并不能查看运行中的局部变量
Oracle RAC Failover 详解 aijuans oracle
Oracle RAC 同时具备HA(High Availiablity) 和LB(LoadBalance). 而其高可用性的基础就是Failover(故障转移). 它指集群中任何一个节点的故障都不会影响用户的使用，连接到故障节点的用户会被自动转移到健康节点，从用户感受而言，是感觉不到这种切换。 Oracle 10g RAC 的Failover 可以分为3种： 1. Client-Si
form表单提交数据编码方式及tomcat的接受编码方式 antonyup_2006 JavaScript tomcat 浏览器互联网 servlet
原帖地址：http://www.iteye.com/topic/266705 form有2中方法把数据提交给服务器，get和post,分别说下吧。（一）get提交 1.首先说下客户端（浏览器）的form表单用get方法是如何将数据编码后提交给服务器端的吧。对于get方法来说，都是把数据串联在请求的url后面作为参数，如：http://localhost:
JS初学者必知的基础百合不是茶 js函数 js入门基础
JavaScript是网页的交互语言,实现网页的各种效果, JavaScript 是世界上最流行的脚本语言。 JavaScript 是属于 web 的语言，它适用于 PC、笔记本电脑、平板电脑和移动电话。 JavaScript 被设计为向 HTML 页面增加交互性。许多 HTML 开发者都不是程序员，但是 JavaScript 却拥有非常简单的语法。几乎每个人都有能力将小的
iBatis的分页分析与详解 bijian1013 java ibatis
分页是操作数据库型系统常遇到的问题。分页实现方法很多，但效率的差异就很大了。iBatis是通过什么方式来实现这个分页的了。查看它的实现部分，发现返回的PaginatedList实际上是个接口，实现这个接口的是PaginatedDataList类的对象，查看PaginatedDataList类发现，每次翻页的时候最
精通Oracle10编程SQL(15)使用对象类型 bijian1013 oracle 数据库 plsql
/* *使用对象类型 */ --建立和使用简单对象类型 --对象类型包括对象类型规范和对象类型体两部分。 --建立和使用不包含任何方法的对象类型 CREATE OR REPLACE TYPE person_typ1 as OBJECT( name varchar2(10),gender varchar2(4),birthdate date ); drop type p
【Linux命令二】文本处理命令awk bit1129 linux命令
awk是Linux用来进行文本处理的命令，在日常工作中，广泛应用于日志分析。awk是一门解释型编程语言，包含变量，数组，循环控制结构，条件控制结构等。它的语法采用类C语言的语法。 awk命令用来做什么？ 1.awk适用于具有一定结构的文本行，对其中的列进行提取信息 2.awk可以把当前正在处理的文本行提交给Linux的其它命令处理，然后把直接结构返回给awk 3.awk实际工
JAVA(ssh2框架)+Flex实现权限控制方案分析白糖_ java
目前项目使用的是Struts2+Hibernate+Spring的架构模式，目前已经有一套针对SSH2的权限系统，运行良好。但是项目有了新需求：在目前系统的基础上使用Flex逐步取代JSP，在取代JSP过程中可能存在Flex与JSP并存的情况，所以权限系统需要进行修改。【SSH2权限系统的实现机制】权限控制分为页面和后台两块：不同类型用户的帐号分配的访问权限是不同的，用户使
angular.forEach boyitech AngularJS AngularJS API angular.forEach
angular.forEach 描述: 循环对obj对象的每个元素调用iterator, obj对象可以是一个Object或一个Array. Iterator函数调用方法: iterator(value, key, obj), 其中obj是被迭代对象，key是obj的property key或者是数组的index，value就是相应的值啦. (此函数不能够迭代继承的属性.)
java-谷歌面试题-给定一个排序数组，如何构造一个二叉排序树 bylijinnan 二叉排序树
import java.util.LinkedList; public class CreateBSTfromSortedArray { /** * 题目:给定一个排序数组，如何构造一个二叉排序树 * 递归 */ public static void main(String[] args) { int[] data = { 1, 2, 3, 4,
action执行2次 Chen.H JavaScript jsp XHTML css Webwork
xwork 写道 <action name="userTypeAction" class="com.ekangcount.website.system.view.action.UserTypeAction"> <result name="ssss" type="dispatcher">
[时空与能量]逆转时空需要消耗大量能源 comsci 能源
无论如何,人类始终都想摆脱时间和空间的限制....但是受到质量与能量关系的限制,我们人类在目前和今后很长一段时间内,都无法获得大量廉价的能源来进行时空跨越..... 在进行时空穿梭的实验中,消耗超大规模的能源是必然
oracle的正则表达式(regular expression)详细介绍 daizj oracle 正则表达式
正则表达式是很多编程语言中都有的。可惜oracle8i、oracle9i中一直迟迟不肯加入，好在oracle10g中终于增加了期盼已久的正则表达式功能。你可以在oracle10g中使用正则表达式肆意地匹配你想匹配的任何字符串了。正则表达式中常用到的元数据(metacharacter)如下： ^ 匹配字符串的开头位置。 $ 匹配支付传的结尾位置。 *
报表工具与报表性能的关系 datamachine 报表工具 birt 报表性能润乾报表
在选择报表工具时，性能一直是用户关心的指标，但是，报表工具的性能和整个报表系统的性能有多大关系呢？要回答这个问题，首先要分析一下报表的处理过程包含哪些环节，哪些环节容易出现性能瓶颈，如何优化这些环节。一、报表处理的一般过程分析 1、用户选择报表输入参数后，报表引擎会根据报表模板和输入参数来解析报表，并将数据计算和读取请求以SQL的方式发送给数据库。 2、
初一上学期难记忆单词背诵第一课 dcj3sjt126com word english
what 什么 your 你 name 名字 my 我的 am 是 one 一 two 二 three 三 four 四 five 五 class 班级，课 six 六 seven 七 eight 八 nince 九 ten 十 zero 零 how 怎样 old 老的 eleven 十一 twelve 十二 thirteen
我学过和准备学的各种技术 dcj3sjt126com 技术
语言VB https://msdn.microsoft.com/zh-cn/library/2x7h1hfk.aspxJava http://docs.oracle.com/javase/8/C# https://msdn.microsoft.com/library/vstudioPHP http://php.net/manual/en/Html
struts2中token防止重复提交表单蕃薯耀重复提交表单 struts2中token
struts2中token防止重复提交表单 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月12日 11:52:32 星期日 ht
线性查找二维数组 hao3100590 二维数组
1.算法描述有序（行有序，列有序，且每行从左至右递增，列从上至下递增）二维数组查找，要求复杂度O(n) 2.使用到的相关知识：结构体定义和使用，二维数组传递（http://blog.csdn.net/yzhhmhm/article/details/2045816） 3.使用数组名传递这个的不便之处很明显，一旦确定就是不能设置列值 //使
spring security 3中推荐使用BCrypt算法加密密码 jackyrong Spring Security
spring security 3中推荐使用BCrypt算法加密密码了，以前使用的是md5， Md5PasswordEncoder 和 ShaPasswordEncoder，现在不推荐了，推荐用bcrpt Bcrpt中的salt可以是随机的，比如： int i = 0; while (i < 10) { String password = "1234
学习编程并不难,做到以下几点即可! lampcy java html 编程语言
不论你是想自己设计游戏，还是开发iPhone或安卓手机上的应用，还是仅仅为了娱乐，学习编程语言都是一条必经之路。编程语言种类繁多，用途各异，然而一旦掌握其中之一，其他的也就迎刃而解。作为初学者，你可能要先从Java或HTML开始学，一旦掌握了一门编程语言，你就发挥无穷的想象，开发各种神奇的软件啦。 1、确定目标学习编程语言既充满乐趣，又充满挑战。有些花费多年时间学习一门编程语言的大学生到
架构师之mysql----------------用group+inner join,left join ,right join 查重复数据（替代in) nannan408 right join
1.前言。如题。 2.代码 (1)单表查重复数据,根据a分组 SELECT m.a,m.b, INNER JOIN （select a,b,COUNT(*) AS rank FROM test.`A` A GROUP BY a HAVING rank>1 )k ON m.a=k.a （2）多表查询，使用改为le
jQuery选择器小结 VS 节点查找（附css的一些东西） Everyday都不同 jquery css name选择器追加元素查找节点
最近做前端页面，频繁用到一些jQuery的选择器，所以特意来总结一下：测试页面： <html> <head> <script src="jquery-1.7.2.min.js"></script> <script> /*$(function() { $(documen
关于EXT tntxia ext
ExtJS是一个很不错的Ajax框架，可以用来开发带有华丽外观的富客户端应用，使得我们的b/s应用更加具有活力及生命力。ExtJS是一个用 javascript编写，与后台技术无关的前端ajax框架。因此，可以把ExtJS用在.Net、Java、Php等各种开发语言开发的应用中。 ExtJs最开始基于YUI技术，由开发人员Jack
一个MIT计算机博士对数学的思考 xjnine Math
在过去的一年中，我一直在数学的海洋中游荡，research进展不多，对于数学世界的阅历算是有了一些长进。为什么要深入数学的世界？作为计算机的学生，我没有任何企图要成为一个数学家。我学习数学的目的，是要想爬上巨人的肩膀，希望站在更高的高度，能把我自己研究的东西看得更深广一些。说起来，我在刚来这个学校的时候，并没有预料到我将会有一个深入数学的旅程。我的导师最初希望我去做的题目，是对appe