风度78

【机器学习】模型又线上线下不一致怎么办？

作者：杰少

本文对于推荐系统中的采样评估指标进行了讨论，内容略多, 还有一些数学推导, 有兴趣的可以去阅读原文, 此处直接列出核心观点：

在评估推荐算法的效果时,能不采样就不采样！
除了AUC,Precision@K,Recall@K,Average Precision,NDCG都是不一致的,采样计算得到的结果和真实结果可能差很大!
现在随机采样计算得到的评估指标的分数具有高偏差，低方差的问题，很多情况和真实情况不符合，结论可能也都错了！
如果一定要进行采样计算评估指标的值，建议采用本文提出的纠正的方案，虽然可能会有较大的方差，但是偏差大大降低，更加接近真实情况；

因为本文实在是有些干，所以不想读文章的朋友直接记住下面两张PPT的内容就可以了。

文章的框架是：

先介绍目前我们采样的评估指标的计算方法；
介绍我们目前常用的一些评估指标，包括AUC,Precision,Recall,AP,NDCG;
然后讨论怎么样才算是好的采样评估指标(一致性),之后开始举例讨论现有的诸多指标例如Recall,Precision,AP等存在不一致性,也就是说采样之后计算的指标是不能反映真实情况的;
为了能弥补现有的采样策略的问题,作者提出了三种不同的修正策略,并验证了其在采样评估的时候相较于原始采样策略的优势(更加接近于真实情况);
最后作者给出了一些实践建议&小结。

Item推荐的评估

对于推荐最常用的评估机制如下：假设我们有个商品需要推荐,给定一个(一般是某个用户或者搜索中的query),我们设计了一个推荐算法, 会返回给我们一个个商品的排序列表, , 表示预测的排序。例如表示算法会给推荐两个相关的商品,并且推荐的位置为3和5.然后我们使用某个评估指标对我们的推荐进行评估,一般我们会对一个集合(例如用户集合)求个均值：

这么做也就意味着我们对于某个用户所有的商品都是同等受欢迎的，当然在一些复杂的场景下，有些用户是重点用户，会有不同的权重，本篇文章重点讨论简化的情况。

评估指标

此处我们介绍在推荐系统中常见的几种评估指标。以及它们对应的计算方法。

AUC

Area under ROC curve(AUC):

其中：表示为真的, 否则为0

Precision & Recall

在位置的Precision：衡量top的预测商品的相关商品的比例。

在位置的Recall：衡量top预测商品的recovered的比例。

Average Precision

在位置的Average Precision用来衡量一个相关商品在所有ranks的精度。

402 Payment Required

Normalized discounted cumulative gain(NDCG)

402 Payment Required

简化指标(的情况下)

我们假设, 也就是说我们只有一个相关的商品并且被排序模型排在第个位置上,那么上面的指标可以重新计算得到：

402 Payment Required
402 Payment Required

随着的增长，各个指标的变化：

我们可以发现：

AP是下降最快的；rank1的AP相较于rank2是2倍重要；rank1的NDCG是1.58倍重要与rank2;
AUC几乎是线性下降的, 也就是说我们将商品从102位排到第101位和把商品从第2位排到第1位是类似的；

采样指标

采样的必要性 & 一致性

在实践中，尤其是很多大型的平台，用户和商品都是亿级别的，对这种级别的数据进行排序不仅会耗费大量的计算资源，而且还要等很久的时间，所以大家都会选择采样观察指标。很多时候大家会选择采样个无关的商品然后加上相关的商品再去计算指标，其实只需要保证采样之后计算得到的指标和我们的全量数据计算得到的指标是保证相对大小的，那么一般是没有任何问题的，

一致性：令评估数据是固定的,如果任意两个推荐算法和在期望下能保证相对顺序，那么我们说在采样下指标是保持一致的, 也就是说，对于和，我们有:

402 Payment Required

其中: 表示在所有相关商品和个随机采样的不相关商品中的相关商品的排序。

而如果是不一致的,那么评估并不是一个真实表现的好的indicator。

不一致性

上面我们知道了一致性的重要性,那么我们常用的那些指标AUC, Precision, Recall等等是否满足一致性呢？下面我们来看一些例子。

1. 全量情况下：

假设我们有三个推荐系统,以及个商品,每个推荐系统将会在5个特殊实例上(例如五个用户)上面进行评估, 这些实例每个只对应一个相关的商品。而这三个推荐系统的结果为：

: 对五个实例, 将所有商品的推荐位置都排在了100；
: 将两个实例, 将商品的推荐位置排在了40；
: 将某个商品在某个评估实例中的排名在第2位，除此之外，其他四个实例的排名都不好；

最终我们的得分计算如下Table1,可以按照评估指标的公式直接进行计算。

2. 采样情况下：

现在假设我们随机采样了个不相关的商品,然后我们重新计算在采样的集合下的新的位置。上图中的Table2展示了采样1000次的重新采样的均值和标准差。通过观察Table1和Table2,我们发现：

在Table1中,的AP是和的10倍,但是在Table2中,的AP是最低的；
Recall, NDCG在Table1和Table2中的相对顺序是没有保持一致的;
AUC在两个Table中是唯一一个保持一致的指标。

我们修改实验的采样个数重新实验,从Figure2中我们发现：随着我们采样的样本越来越多,我们发现三个推荐系统的相对大小都发生了很大的变化，例如：

AP指标：当样本个数少于50的时候，系统,当样本个数约为200的时候, ,当样本的个数约为500的时候,对于更多的样本,.

NDCG指标：变化和AP指标类似;

Recall指标:更加敏感;(变化最快)

AUC维持不变;

采样下的rank分布

此处我们还是假设：

只有一个相关的商品，;
表示相关商品的真实rank,表示采样情况下的rank.
所有不相关商品是均匀采样的,可能排的更高也有可能会更低;
为所有商品的个数;

那么采样的样本排序比更高的概率为：;

如果我们重复采样次, 并且计算一个商品排序更高的次数，这个就会对应一个Bonomial的分布，的rank服从：,此时,我们的metric的期望值为：

402 Payment Required

当我们调整的值的时候,期望的变化如Figure3所示：

AP和NDCG(不同的采样的次数m),在不同的下开始时变化最大;(越大越接近于真实的情况)
AUC是不变的;

期望的Metrics

上面主要都是从试验的方面来验证采样之后重新计算的Metric和真实的Metric除了AUC之外基本都是不大置信的,此处我们计算每个Metric的期望。

AUC的期望

所以最终的期望为：

402 Payment Required

采样计算得到的AUC是真实AUC的无偏估计,所以AUC在采样下是能保证一致的。

Recall的期望

402 Payment Required

402 Payment Required

AP的期望

402 Payment Required

我们发现：当m比较大的时候, ,最终我们的结果为和的真实结果是差不大的。

小的采样比例

假设我们的，那么,对于任意的评估指标以及任意的采样分布,我们有：

402 Payment Required

而对于商品的均匀采样, 就是采样的商品排在之后的概率,也就是,现在就是：

402 Payment Required

因为和,都是固定的,所以上面又可以表示为：

也就是说是的线性函数,如果我们比较两个不同算法,就需要重点观察的符号,如果Metric在位置1和位置2的影响不大,无法区分,例如Precision和Recall（当）,那么采样的Metric就一直是常数,没有任何用处。

对于,所有的metric在期望上都给出相同的定性度量,没有必要选择不同的评估指标;

纠正的评估指标

从上面的各种推导以及特例中,我们可以发现：采样计算得到的Metric和我们真实的Metric是不一样的。采样计算得到的Metric很多时候是不能反映真实的情况。情况十分糟糕，那么我们能不能设计一种方法，使得我们采样计算得到的结果和真实的结果相似呢？

Rank的无偏估计

采样的评估指标通常通过对采样后观测到的rank通过真实的评估计算得到,也就是说：

但很多时候是对于的一个很差的近似, 实际上经常低估,那么我们这个时候尽可能不基于进行估计,我们可以对的无偏估计, 在前面我们知道：，如果我们令，那么关于的无偏估计就是, 则, 所以 , 于是我们得到如下的纠正的指标：

最小Bias估计器

上面我们使用了对于rank的无偏估计，但是如果是非线性的, 那么其实其实就是有偏的, 我们平时经常会尝试去优化平均偏差，

其中为我们的rank的先验。

因为是从到的函数, 所以可以看作为是一个的向量,所以我们的目标就是寻找一个向量来最小化下面的式子：

402 Payment Required
402 Payment Required

上面这个等价于一个最小平方问题,它的解为：,其中：

, , , 。

当时,上面的问题时欠定的(under-determined),也就是说我们无法获得一个无偏的估计对于所有的.

Bias-Variance Trade-off

最小偏差估计器的一个潜在问题在于它可能会带来较大的方差,这个在实验阶段可以观测到，那么如何降低方差呢？和很多传统机器学习问题类似，加正则。于是此处我们加入一个方差项,得到：

402 Payment Required

其中是一个正数,这就是一个正则化的最小二乘问题，于是我们的解为：

其中, , 当时候,我们的解为：

402 Payment Required

在实际研究中,最终的评估指标是通过多个评估点上聚合得到,这也会降低整体的方差,一般一个更低的值会更好些。

实验验证

那么纠正之后的指标会不会更好呢？作者做了一个实验,作者使用uniform的先验,采样的样本,所有的商品的个数为,也就是说采样的比例为,从Figure4中我们发现，越小的会带来更大的波动,所以合适的是可以很好地降低方差的, 纠正之后的评估指标和真实的指标也更为接近。

样本大小和数据集大小的影响

此处列出作者的一些核心观点：

增加样本的大小可以减少采样的评估指标的bias;同时也可以降低纠正之后的评估指标；
增加数据集的大小，会带来负向的效果;
增加评估点的个数,可以降低平均估计的方差,而这对于纠正之后的评估指标是更加友好的。因为没有进行纠正的指标即使最终拿到了0方差,但是会存在非常大的偏差；

实验

实验主要验证三个问题：

不同的推荐算法是否构建不同的排序分布；(例如有些推荐算法在顶部表现好,有些是整体好)
采样计算得到的指标的结果和真实的结果是否存在不一致？
纠正的评估指标是否可以帮助我们缓解2中的问题？

排序分布

从上面的实验看出,

Z算法在Top10中的表现是最好的；但是最终将超过1600个用户放到了最坏的bucket;
X算法相对平衡,最坏的bucket中的商品最少;(低于300)
Y算法在Top10中的表现优于X,但是整体看,会趋向于将相关的商品放到更差的rank.

采样指标

从上表中我们发现,

Z算法在真实情况下载指标Recall,NDCG以及AP上都是最好的,但是采样之后的结果却和真实情况不一致;在采样指标计算得到的指标有时可能是效果最差的算法,例如X在采样上计算得到的分是最高的,但是实际情况是最低的。
这些指标的方差很小,所以不是方差的问题,而是采样带来的偏差。
在AUC指标上,所有的算法是保持一致的；
所以如果实验中最终的评估指标是采样的Recall,AP,NDCG等,那么很可能结论是错误的.

纠正的指标

此处作者对比了之前提出的三种不同的纠正方案，同样的从Table3中,我们发现：

纠正之后计算得到的指标和真实指标的Bias降低了.

那么纠正之后的指标和未纠正在样本下的影响是什么样的呢？

从上图中,我们发现,未进行纠正的采样指标需要超过1000的样本(1/3的样本),才能得到推荐算法Y比X好的结论,但是纠正之后的指标(BV的trade off + )只需要60个样本即可达到同样的效果;

我们发现确实纠正之后的指标得到的Bias下降了,那么方差呢？

从上面的实验中,我们发现：

BV 0.1看上去是最好,基本在100次比较中都有90次是对的；
几乎所有的纠正方案都可以获得比未进行纠正的指标更为合理的效果;

小结 & 建议

小结

本文的研究显示之前大多数论文采用采样计算最终指标的方案其实是错误的，大概率会和真实的情况存在偏差，得到错误的结论。所以如果可以的话，我们应该尽量避免在最终评估时对样本进行采样，如果无法避免的话，那么纠正之后的方案可以拿到更为合理的结果（但是会增加方差）。

建议

从上面的分析以及实验中，我们发现采样之后计算的指标会带来较大的偏差，使用纠正的策略，可以降低偏差，但是也会引入更高的方差。所以如果采样时不可避免，那么有下面几条建议：

使用本文中提出的纠正之后的指标并且使用不同的样本重新运行试验多次；
重复试验N此(不同数据集,N-fold的交叉验证),方差会由数据集的切分不同而被引入，也有可能会被推荐算法的初始化引入,对负样本采样的过程中,随机种子也会带来另外一种方差, 所以我们很难找到两个不同的推荐算法"statistically significant"差异;但即便如此,我们计算得到的评估指标仍然是一个非常强的indicator，显示我们算法在真实情况下的表现；偏差越小,indication就越强。
偏差只有在不采样的情况下才可以较好地消除。

参考文献

On Sampled Metrics for Item Recommendation:https://dl.acm.org/doi/pdf/10.1145/3394486.3403226
https://crossminds.ai/video/5f3375ac3a683f9107fc6bb8/
KDD2020最佳论文: 关于个性化排序任务评价指标的大讨论:https://zhuanlan.zhihu.com/p/20682351

往期精彩回顾




适合初学者入门人工智能的路线及资料下载(图文+视频)机器学习入门系列下载中国大学慕课《机器学习》（黄海广主讲）机器学习及深度学习笔记等资料打印《统计学习方法》的代码复现专辑
AI基础下载机器学习交流qq群955171419，加入微信群请扫码：

OPPO未来科技大会，科技感满满！你最爱哪些黑科技呢？冬天不冷了
#OPPO未来科技大会#OPPO携手IHSMarkit发布《智能互融：借助5G、人工智能和云技术，释放机遇》白皮书，表明人工智能、云技术和边缘设备、互联和物联网的协同努力，将为企业和消费者带来价值。看了一下早上的，是说明年绿厂要发不少好玩的产品，比如智能手表AR眼镜之类的，有些可能跟Reno3一块发，对外是说构建生态万物互联，其实就是多卖几样多赚钱，然后用这钱砸了搞技术赚更大的钱，毕竟现场说了未来
【AI论文】CLiFT：面向计算高效与自适应神经渲染的压缩光场标记
摘要：本文提出了一种神经渲染方法，该方法将场景表示为“压缩光场标记（CLiFTs）”，以保留场景丰富的外观和几何信息。CLiFT通过压缩标记实现计算高效的渲染，同时能够通过调整标记数量来表征场景，或利用单个训练好的网络渲染新视角。具体而言，给定一组图像，多视图编码器会根据相机位姿对图像进行标记化处理。潜在空间K均值聚类算法利用这些标记选取一组精简的光线作为聚类中心。随后，多视图“压缩器”将所有标记
sgg大数据全套技术链接[plus] 原来是大华啊~ 资源大数据
写在开头：感谢尚硅谷，尚硅谷万岁，我爱尚硅谷111个技术栈+43个项目，兄弟们，冲！最近小米又又又火了一把，致敬所有造福人民的企业和伟大的企业家，致敬雷军，小米，致敬马云，致敬尚硅谷，致敬所有为人民谋福的英雄人物和企业，再次献上我诚挚的敬意，致敬！尚硅谷大数据全套111个技术1.Java从入门到精通JDK版链接：https://pan.baidu.com/s/1GAc610SYSMmZBuOX4D
手绘电路图的节点和端点检测一个简化版的算法实现框架 zhangfeng1133 算法
于论文描述，我将提供一个简化版的算法实现框架，用于手绘电路图的节点和端点检测，并整合生成电路原理图。以下代码结合了YOLOv5目标检测和传统图像处理技术，符合论文中提到的98.2%mAP和92%节点识别准确率的关键指标。核心算法实现（Python+OpenCV+YOLOv5）importcv2importnumpyasnpimporttorchfromyolov5importYOLOv5#需要安装
Python实现神经网络算法指南代码编织匠人 python 神经网络算法
Python实现神经网络算法指南神经网络是一种模拟人脑神经元结构进行信息处理的机器学习算法。在深度学习领域中，神经网络是最为强大的算法之一。Python作为一门简单易学的编程语言，也成为了许多人选择实现神经网络算法的首选语言。在本篇文章中，我们将通过Python代码来实现神经网络算法。导入必要的库为了实现神经网络算法，我们需要导入一些必要的Python库，包括numpy和matplotlib。其中
大规模图计算引擎的分区与通信优化：负载均衡与网络延迟的解决方案 LCG元系统服务架构负载均衡网络运维
目录一、系统架构设计与核心流程1.1原创架构图解析1.2双流程对比分析二、分区策略优化实践2.1动态权重分区算法实现（Python）三、通信优化机制实现3.1基于RDMA的通信层实现（TypeScript）四、性能对比与调优4.1分区策略基准测试五、生产级部署方案5.1Kubernetes部署配置（YAML）5.2安全审计配置六、技术前瞻与演进附录：完整技术图谱一、系统架构设计与核心流程1.1原创
2025年最流行跑分最高的图片理解大模型调研报告
2025年最流行跑分最高的图片理解大模型调研报告引言当前，图片理解大模型正处于快速演进阶段，其技术发展呈现多维度深化与融合的特征。从技术演进方向来看，多模态融合已成为核心趋势之一，文本、图像、视频等不同模态的交互与协同能力显著提升。大型视觉-语言模型（LVLMs）作为人工智能领域的重要突破，标志着多模态理解与交互进入变革性发展阶段，尽管当前模型在各类任务中表现出色，但在细粒度视觉任务等基础能力层面
基于DTLC-AEC与DTLN的轻量级实时语音增强系统设计与实现神经网络15044 仿真模型神经网络机器学习图像处理 cnn 人工智能机器人
基于DTLC-AEC与DTLN的轻量级实时语音增强系统设计与实现前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站。1.引言在当今的互联网通信时代，实时语音通信已成为人们日常生活中不可或缺的一部分。然而，语音通信质量常常受到回声、背景噪声等因素的严重影响。为了解决这些问题，我们需要高效的语音增强技术。本文将详细介绍如何将DTLC-AEC（深度学习回声消
第 20 课时：GPU 管理和 Device Plugin 工作机制（车漾）阿里云云原生 CNCF X 阿里巴巴云原生技术公开课阿里云 Kubernetes CNCF 专家团队 CNCF 专家团队 CNCF 专家团队 Kubernetes
本文将主要分享以下几个方面的内容：需求来源GPU的容器化Kubernetes的GPU管理工作原理课后思考与实践需求来源2016年，随着AlphaGo的走红和TensorFlow项目的异军突起，一场名为AI的技术革命迅速从学术圈蔓延到了工业界，所谓AI革命从此拉开了帷幕。经过三年的发展，AI有了许许多多的落地场景，包括智能客服、人脸识别、机器翻译、以图搜图等功能。其实机器学习或者说是人工智能，并不是
疫情下，我的健康码首次变成了黄码唯我一心
3月中旬，老公在广州白云区接了一单生意，要很久才回来，就在那里租了一间房，带我和孩子一起住。房子在七楼，步梯，因孩子小，自己就很少下楼，都是他买菜回来，4月8号，订单完成，返程回了佛山。过了两天突然接到短信通知，白云区要大规模核酸筛查，又过一天收到短信:通过大数据分析，您近期行程涉及疫情防控重点区域，您的健康码将被赋予2次黄码并需开展2次核酸检测，请注意健康码状态，尽快凭码到附近黄码核酸检测点进行
在python程序中调用java代码 Meryoufdd java jvm 开发语言
在python程序中调用java代码Python是一门“胶水”语言，非常灵活多变，但是在一些特殊的时候，也需要调用其它语言来协助实现更多的功能；在公司使用python进行接口测试的时候，会遇到有些接口数据是由公司的开发人员进行自定义的加密算法进行加密的，此时，要开发告诉加密代码是不太可能的。跟开发小哥沟通时，很多时候都是由他给一个jar包，然后剩下的就由测试人员来发挥了。那python该如何使用这
到底应该怎么抓语文成绩山东董纯
上学期期末考试，全区统一采用网上阅卷的形式。在这个大数据时代，在这个极为透明的数据时代，一旦采用这样网络统一阅卷的形式。那丑媳妇就要真的见公婆了。再这样一个要生源没生源。要学习积极性没有学习积极性的氛围里。想取得好的成绩是真的难上加难。尽管已经预料到跟其他兄弟学校有一定的差距。但是没有想到差距如此之大。领导们坐不住了，反复约谈备课组长。理由是其他科目差距不大，甚至有优势。为什么语文学科会有如此大的
智慧后厨检测算法构建智能厨房防护网智驱力人工智能人工智能算法高温预警行为识别口罩识别食品安全手套识别
智慧后厨检测：构建安全洁净厨房的智能解决方案背景：传统后厨管理的痛点与智慧化需求餐饮行业后厨管理长期面临操作规范难落实、安全隐患难察觉、卫生状况难追溯等痛点。传统人工巡检效率低、覆盖面有限，难以实现24小时无死角监管。例如，厨师未佩戴口罩或手套、违规使用手机、动火离人等行为，可能引发食品安全事故或火灾风险。随着人工智能技术的成熟，智慧后厨检测系统通过集成多种算法，实现了对后厨人员行为、环境卫生、设
【算法训练营Day11】二叉树part1 十八岁讨厌编程算法训练营算法
文章目录理论基础二叉树的递归遍历前序遍历中序遍历后序遍历总结二叉树的层序遍历基础层序遍历二叉树的右视图理论基础二叉树在结构上的两个常用类型：满二叉树完全二叉树在功能应用上的比较常用的有：二叉搜索树：节点有权值、遵循”左小右大“平衡二叉搜索树（AVL树）：在二叉树的基础上增添了一个特性，左右子树高度差不超过1二叉树的存储方式：顺序存储：使用数组，在内存中连续分布链式存储：使用指针，在内存中离散分布二
【算法训练营Day13】二叉树part3 十八岁讨厌编程算法训练营算法
文章目录平衡二叉树二叉树的所有路径左叶子之和完全二叉树的节点个数平衡二叉树题目链接：110.平衡二叉树平衡二叉树的定义：该二叉树的所有节点的左右子树高度差不大于1解题逻辑：这个题和我们前一篇文章说的二叉树的高度是有关的，那么我们是否可以考虑复用求二叉树高度的代码？一个最主要的问题就是求高度的方法返回值是int类型的，而我们判断二叉树是否平衡肯定是想返回boolean，那么我们可以考虑使用-1当作信
《Python Web 框架深度剖析：Django、Flask 与 FastAPI 的选择之道》清水白石008 课程教程学习笔记开发语言 python 前端 django
《PythonWeb框架深度剖析：Django、Flask与FastAPI的选择之道》开篇引入：从“胶水语言”到Web架构核心Python，自1991年由GuidovanRossum发布以来，凭借其简洁优雅的语法和强大的生态系统，逐渐成为全球最受欢迎的编程语言之一。它不仅在数据科学、人工智能、自动化脚本等领域大放异彩，更在Web开发领域构建起一套成熟的技术体系。作为一位长期从事Python开发与教
算法训练营Day12 二叉树part01
一、二叉树的递归遍历每次写递归，都按照这三要素来写，可以保证大家写出正确的递归算法！确定递归函数的参数和返回值：确定哪些参数是递归的过程中需要处理的，那么就在递归函数里加上这个参数，并且还要明确每次递归的返回值是什么进而确定递归函数的返回类型。确定终止条件：写完了递归算法,运行的时候，经常会遇到栈溢出的错误，就是没写终止条件或者终止条件写的不对，操作系统也是用一个栈的结构来保存每一层递归的信息，如
深入解析Zstandard压缩格式规范石顺垒Dora
深入解析Zstandard压缩格式规范前言Zstandard（简称zstd）是Facebook开发的一种高效无损压缩算法，在现代数据压缩领域占据重要地位。本文将从技术实现角度深入剖析Zstandard压缩格式规范，帮助开发者全面理解其设计原理和实现细节。格式概述Zstandard压缩数据由一或多个帧(frame)组成，每个帧都是独立的压缩单元。帧分为两种类型：标准帧：包含实际压缩数据可跳过帧：包含
Python-Zstandard 使用教程
Python-Zstandard使用教程项目介绍Python-Zstandard是一个为Zstandard（zstd）压缩库提供Python绑定的开源项目。Zstandard是一种由Facebook开发的高性能数据压缩算法，旨在提供高压缩比和快速压缩解压速度。Python-Zstandard项目的目标是通过一个Pythonic的接口，提供对底层CAPI的丰富访问，同时不牺牲性能。项目地址：GitH
减肥真的有那么难吗？卡塔老爸
我之前没有认真的研究过减肥这件事，不过也有过几次减肥失败的经历，在减肥大军中也听到看到很多失败或者放弃的例子，原以为减肥不容易，但是最近由于自己身体问题，减肥提上必须完成的重要级，我比较全面的研究和实践后发现，减肥其实soeasy。首先明确一下减肥的概念，减肥是减脂不是减重，很多人存在这样一个误区，看着体重秤来衡量自己是胖是瘦，还有一些体重标准，什么体重应该是身高乘以多少多少的算法，好像人体重量全
【DeepSeek实战】10、模型上下文协议（MCP）全解析：从核心架构到实战应用，揭秘AI协作的“凤雏”之力无心水人工智能架构 DeepSeek实战模型上下文协议MCP CSDN技术干货 DeepSeek AI大模型
在人工智能技术飞速发展的今天，大型语言模型（LLM）的能力不断突破，但跨模型协作、上下文一致性维护等问题却成为制约AI系统向更智能、更协同方向发展的瓶颈。模型上下文协议（ModelContextProtocol，MCP）作为专为大模型设计的标准化通信框架，如同“凤雏”之于“卧龙”，为解决这些核心问题提供了关键方案。本文将全面解析MCP的核心概念、架构设计、实操代码、应用案例及未来趋势，通过5000
postman请求接口时自动生成sign签名小牛_6666
当我们使用postman测试接口时，经常会遇到接口签名，由于签名随参数而变化，导致测试起来很头疼。通过查postman的使用文档，发现可以用Pre-requestScript来生成sign。Pre-requestScript的语法和js类似，可以在发起请求之前，对参数进行处理。下边以微信H5支付签名算法为例来自动生成sign签名1，签名规则第一步设所有发送或者接收到的数据为集合M，将集合M内非空参
AI交互的初期魅力与后期维护挑战
AI交互的初期魅力与后期维护挑战引言在当今数字化时代，人工智能（AI）技术正迅速渗透到各个领域，特别是人机交互方面。许多开发者、设计师和用户在初次与AI交互时，往往感受到一种“一时爽”的快感。这种交互方式看似高效、智能，能够快速响应需求，提供即时反馈。然而，随着时间的推移，这种初期魅力往往会转化为高昂的后期维护成本。本文将深入讨论AI交互的这一双面性，重点分析细节沟通不足以及UI设计中AI难以处理
主流编程语言全景图：从Python到Rust的深度解析万能小贤哥 python rust 开发语言
2024年编程语言生态报告显示，全球开发者使用的语言数量已达260+，但真正主导行业的不到20种。本文带你穿透技术迷雾，掌握8大核心语言的本质差异。一、选择编程语言的黄金标准图表代码二、八大主流语言对比解析1.Python-通用胶水语言特性：动态类型+缩进语法丰富的库生态（20万+包）GIL全局锁限制并发适用场景：python#机器学习示例（TensorFlow）importtensorflowa
DAOS系统架构-JumpMap 付兄 daos DAOS 分布式存储
1.概述JumpPlacementMap是使用跳跃一致性哈希算法，以便在不同的故障域之间伪随机地分布对象。这样做是为了尽可能将他们分散到相互距离较远地故障域中，从而避免在当某个故障影响了整个故障域的情况下造成数据丢失。2.跳跃一致性哈希算法（JumpConsistentHashing）跳跃一致性哈希算法是一种一致性哈希算法，它能将keys均匀的分布在一定数量的buckets中。即使buckets的
DAOS系统架构-Placement
1.概述DAOS使用poolmap来创建一系列placementmaps，这些maps被用于计算对象布局的算法中。该算法是基于一致性哈希算法，使用对象的ID、对象的概要、以及其中一个placementmap来生成对象的布局。DAOS使用一种模块化方法，允许不同的对象使用不同的placementmap来获得应用程序所需的性能特征。2.PoolMap在DAOS中，poolmap被组织为一种树形结构，维
PTA数据结构与算法-第一章——褚论 ?Suki PTA习题算法数据结构 c++
文章目录第一章——褚论第二章——线性表第三章——栈与队列第四章——字符串第五章——树与二叉树第六章——图第七章——排序第八章——检索判断题单选题程序填空题第一章——褚论第二章——线性表第三章——栈与队列第四章——字符串第五章——树与二叉树第六章——图第七章——排序第八章——检索判断题(neuDS)数据的物理结构是指数据在计算机中的实际存储形式。T(neuDS)数据的物理结构是指数据在计算机中的实际
排序算法之【归并排序】丶小鱼丶算法排序算法 java
目录实现归并排序【MergeSort】并提供升序和降序方法归并排序方法测试LeetCode-215题实现归并排序【MergeSort】并提供升序和降序方法/***归并排序*/publicclassMergeSort{//升序排列privatestaticfinalintUP_SORT_TYPE=1;//降序排列privatestaticfinalintDOWN_SORT_TYPE=-1;/***升
【云原生】Helm来管理Kubernetes集群的详细使用方法与综合应用实战景天科技苑云原生K8S 零基础到进阶实战云原生 kubernetes 容器 Helm k8s k8s集群
✨✨欢迎大家来到景天科技苑✨✨养成好习惯，先赞后看哦~作者简介：景天科技苑《头衔》：大厂架构师，华为云开发者社区专家博主，阿里云开发者社区专家博主，CSDN全栈领域优质创作者，掘金优秀博主，51CTO博客专家等。《博客》：Python全栈，前后端开发，小程序开发，人工智能，js逆向，App逆向，网络系统安全，数据分析，Django，fastapi，flask等框架，云原生k8s，linux，she
什么是java IT界小新学姐
Java属于一种计算机语言，计算机语言的种类非常多，总的来说可以分成机器语言、汇编语言、高级语言三大类。Java是一种高级计算机语言。Java是由SunMicrosystems在1995年首先发布的编程语言和计算平台。有许多应用程序和Web站点只有在安装Java后才能正常工作，而且这样的应用程序和Web站点日益增多。Java快速、安全、可靠。从笔记本电脑到数据中心，从游戏控制台到科学超级计算机，从
继之前的线程循环加到窗口中运行 3213213333332132 java thread JFrame JPanel
之前写了有关java线程的循环执行和结束，因为想制作成exe文件，想把执行的效果加到窗口上，所以就结合了JFrame和JPanel写了这个程序，这里直接贴出代码，在窗口上运行的效果下面有附图。 package thread; import java.awt.Graphics; import java.text.SimpleDateFormat; import java.util
linux 常用命令 BlueSkator linux 命令
1.grep 相信这个命令可以说是大家最常用的命令之一了。尤其是查询生产环境的日志，这个命令绝对是必不可少的。但之前总是习惯于使用（grep -n 关键字文件名）查出关键字以及该关键字所在的行数，然后再用（sed -n '100,200p' 文件名），去查出该关键字之后的日志内容。但其实还有更简便的办法，就是用（grep -B n、-A n、-C n 关键
php heredoc原文档和nowdoc语法 dcj3sjt126com PHP heredoc nowdoc
<!doctype html> <html lang="en"> <head> <meta charset="utf-8"> <title>Current To-Do List</title> </head> <body> <?
overflow的属性周华华 JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
《我所了解的Java》——总体目录 g21121 java
准备用一年左右时间写一个系列的文章《我所了解的Java》，目录及内容会不断完善及调整。在编写相关内容时难免出现笔误、代码无法执行、名词理解错误等，请大家及时指出，我会第一时间更正。 &n
[简单]docx4j常用方法小结 53873039oycg docx
本代码基于docx4j-3.2.0，在office word 2007上测试通过。代码如下: import java.io.File; import java.io.FileInputStream; import ja
Spring配置学习云端月影 spring配置
首先来看一个标准的Spring配置文件 applicationContext.xml <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi=&q
Java新手入门的30个基本概念三 aijuans java 新手 java 入门
17.Java中的每一个类都是从Object类扩展而来的。　　18.object类中的equal和toString方法。　　equal用于测试一个对象是否同另一个对象相等。　　toString返回一个代表该对象的字符串,几乎每一个类都会重载该方法,以便返回当前状态的正确表示.(toString 方法是一个很重要的方法)　　 19.通用编程:任何类类型的所有值都可以同object类性的变量来代替。　
《2008 IBM Rational 软件开发高峰论坛会议》小记 antonyup_2006 软件测试敏捷开发项目管理 IBM 活动
我一直想写些总结,用于交流和备忘,然都没提笔,今以一篇参加活动的感受小记开个头,呵呵! 其实参加《2008 IBM Rational 软件开发高峰论坛会议》是9月4号,那天刚好调休.但接着项目颇为忙,所以今天在中秋佳节的假期里整理了下. 参加这次活动是一个朋友给的一个邀请书,才知道有这样的一个活动,虽然现在项目暂时没用到IBM的解决方案,但觉的参与这样一个活动可以拓宽下视野和相关知识.
PL/SQL的过程编程,异常,声明变量,PL/SQL块百合不是茶 PL/SQL的过程编程异常 PL/SQL块声明变量
PL/SQL; 过程; 符号; 变量; PL/SQL块; 输出; 异常; PL/SQL 是过程语言(Procedural Language)与结构化查询语言(SQL)结合而成的编程语言PL/SQL 是对 SQL 的扩展,sql的执行时每次都要写操作
Mockito(三)--完整功能介绍 bijian1013 持续集成 mockito 单元测试
mockito官网：http://code.google.com/p/mockito/，打开documentation可以看到官方最新的文档资料。一.使用mockito验证行为 //首先要import Mockito import static org.mockito.Mockito.*; //mo
精通Oracle10编程SQL(8)使用复合数据类型 bijian1013 oracle 数据库 plsql
/* *使用复合数据类型 */ --PL/SQL记录 --定义PL/SQL记录 --自定义PL/SQL记录 DECLARE TYPE emp_record_type IS RECORD( name emp.ename%TYPE, salary emp.sal%TYPE, dno emp.deptno%TYPE ); emp_
【Linux常用命令一】grep命令 bit1129 Linux常用命令
grep命令格式 grep [option] pattern [file-list] grep命令用于在指定的文件(一个或者多个,file-list)中查找包含模式串(pattern)的行,[option]用于控制grep命令的查找方式。 pattern可以是普通字符串，也可以是正则表达式，当查找的字符串包含正则表达式字符或者特
mybatis3入门学习笔记白糖_ sql ibatis qq jdbc 配置管理
MyBatis 的前身就是iBatis，是一个数据持久层(ORM)框架。 MyBatis 是支持普通 SQL 查询，存储过程和高级映射的优秀持久层框架。MyBatis对JDBC进行了一次很浅的封装。以前也学过iBatis，因为MyBatis是iBatis的升级版本，最初以为改动应该不大，实际结果是MyBatis对配置文件进行了一些大的改动，使整个框架更加方便人性化。
Linux 命令神器：lsof 入门 ronin47 lsof
lsof是系统管理/安全的尤伯工具。我大多数时候用它来从系统获得与网络连接相关的信息，但那只是这个强大而又鲜为人知的应用的第一步。将这个工具称之为lsof真实名副其实，因为它是指“列出打开文件（lists openfiles）”。而有一点要切记，在Unix中一切（包括网络套接口）都是文件。有趣的是，lsof也是有着最多
java实现两个大数相加，可能存在溢出。 bylijinnan java实现
import java.math.BigInteger; import java.util.regex.Matcher; import java.util.regex.Pattern; public class BigIntegerAddition { /** * 题目：java实现两个大数相加，可能存在溢出。 * 如123456789 + 987654321
Kettle学习资料分享，附大神用Kettle的一套流程完成对整个数据库迁移方法 Kai_Ge Kettle
Kettle学习资料分享 Kettle 3.2 使用说明书目录概述..........................................................................................................................................7 1.Kettle 资源库管
[货币与金融]钢之炼金术士 comsci 金融
自古以来,都有一些人在从事炼金术的工作.........但是很少有成功的那么随着人类在理论物理和工程物理上面取得的一些突破性进展...... 炼金术这个古老
Toast原来也可以多样化 dai_lm android toast
Style 1：默认 Toast def = Toast.makeText(this, "default", Toast.LENGTH_SHORT); def.show(); Style 2：顶部显示 Toast top = Toast.makeText(this, "top", Toast.LENGTH_SHORT); t
java数据计算的几种解决方法3 datamachine java hadoop ibatis r-langue r
4、iBatis 简单敏捷因此强大的数据计算层。和Hibernate不同，它鼓励写SQL，所以学习成本最低。同时它用最小的代价实现了计算脚本和JAVA代码的解耦，只用20%的代价就实现了hibernate 80%的功能,没实现的20%是计算脚本和数据库的解耦。复杂计算环境是它的弱项，比如：分布式计算、复杂计算、非数据
向网页中插入透明Flash的方法和技巧 dcj3sjt126com html Web Flash
将 Flash 作品插入网页的时候，我们有时候会需要将它设为透明，有时候我们需要在Flash的背面插入一些漂亮的图片，搭配出漂亮的效果……下面我们介绍一些将Flash插入网页中的一些透明的设置技巧。　　一、Swf透明、无坐标控制　　首先教大家最简单的插入Flash的代码，透明，无坐标控制：　　注意wmode="transparent"是控制Flash是否透明
ios UICollectionView的使用 dcj3sjt126com
UICollectionView的使用有两种方法，一种是继承UICollectionViewController，这个Controller会自带一个UICollectionView；另外一种是作为一个视图放在普通的UIViewController里面。个人更喜欢第二种。下面采用第二种方式简单介绍一下UICollectionView的使用。 1.UIViewController实现委托，代码如
Eos平台java公共逻辑蕃薯耀 Eos平台java公共逻辑 Eos平台 java公共逻辑
Eos平台java公共逻辑 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月1日 17:20:4
SpringMVC4零配置--Web上下文配置【MvcConfig】 hanqunfeng springmvc4
与SpringSecurity的配置类似，spring同样为我们提供了一个实现类WebMvcConfigurationSupport和一个注解@EnableWebMvc以帮助我们减少bean的声明。 applicationContext-MvcConfig.xml  <
解决ie和其他浏览器poi下载excel文件名乱码 jackyrong Excel
使用poi,做传统的excel导出，然后想在浏览器中，让用户选择另存为，保存用户下载的xls文件，这个时候，可能的是在ie下出现乱码（ie,9,10,11),但在firefox,chrome下没乱码，因此必须综合判断，编写一个工具类： /** * * @Title: pro
挥洒泪水的青春 lampcy 编程生活程序员
2015年2月28日，我辞职了，离开了相处一年的触控，转过身--挥洒掉泪水，毅然来到了兄弟连，背负着许多的不解、质疑——”你一个零基础、脑子又不聪明的人，还敢跨行业，选择Unity3D？“，”真是不自量力••••••“，”真是初生牛犊不怕虎•••••“，••••••我只是淡淡一笑，拎着行李----坐上了通向挥洒泪水的青春之地——兄弟连！这就是我青春的分割线，不后悔，只会去用泪水浇灌——已经来到
稳增长之中国股市两点意见-----严控做空，建立涨跌停版停牌重组机制 nannan408
对于股市，我们国家的监管还是有点拼的，但始终拼不过飞流直下的恐慌，为什么呢？笔者首先支持股市的监管。对于股市越管越荡的现象，笔者认为首先是做空力量超过了股市自身的升力，并且对于跌停停牌重组的快速反应还没建立好，上市公司对于股价下跌没有很好的利好支撑。我们来看美国和香港是怎么应对股灾的。美国是靠禁止重要股票做空，在
动态设置iframe高度(iframe高度自适应) Rainbow702 JavaScript iframe contentDocument 高度自适应局部刷新
如果需要对画面中的部分区域作局部刷新，大家可能都会想到使用ajax。但有些情况下，须使用在页面中嵌入一个iframe来作局部刷新。对于使用iframe的情况，发现有一个问题，就是iframe中的页面的高度可能会很高，但是外面页面并不会被iframe内部页面给撑开，如下面的结构： <div id="content"> <div id=&quo
用Rapael做图表 tntxia rap
function drawReport(paper,attr,data){ var width = attr.width; var height = attr.height; var max = 0; &nbs
HTML5 bootstrap2网页兼容（支持IE10以下） xiaoluode html5 bootstrap
<!DOCTYPE html> <html> <head lang="zh-CN"> <meta charset="UTF-8"> <meta http-equiv="X-UA-Compatible" content="IE=edge">

【机器学习】模型又线上线下不一致怎么办？

AUC

Precision & Recall

Average Precision

402 Payment Required

Normalized discounted cumulative gain(NDCG)

402 Payment Required

简化指标(的情况下)

402 Payment Required

402 Payment Required

402 Payment Required

402 Payment Required

AUC的期望

402 Payment Required

Recall的期望

402 Payment Required

402 Payment Required

AP的期望

402 Payment Required

402 Payment Required

402 Payment Required

402 Payment Required

402 Payment Required

402 Payment Required

402 Payment Required

你可能感兴趣的:(人工智能,算法,大数据,数据挖掘,编程语言)