littlemichelle

【推荐系统】ESMM实践应用

友情链接

MMoE 算法在淘宝躺平推荐系统中的应用实践 - AIQ (MMoE 算法在淘宝躺平推荐系统中的应用实践)

论文链接：https://arxiv.org/pdf/1804.07931.pdf

1、理论

多任务学习（Multitask learning）是基于共享表示（shared representation），把多个相关的任务放在一起学习的一种机器学习方法。

多任务学习的两个关键点：1、多个任务必须具有相关性；2、多个任务之间拥有可以共享的底层表示。

多任务模型通过学习不同任务的联系和差异，可提高每个任务的学习效率和质量。多任务学习的的框架广泛采用shared-bottom的结构，不同任务间共用底部的隐层。这种结构本质上可以减少过拟合的风险，但是效果上可能受到任务差异和数据分布带来的影响。

MMOE模型刻画了任务相关性，基于共享表示来学习特定任务的函数，避免了明显增加参数的缺点。

共享模式的总结部分摘自邱锡鹏的《神经网络与深度学习》，十分全面：

1）参数的硬共享模式：不同任务的神经网络模型共同使用底层的共享模块（Shared Layers）来提取一些通用特征，然后再针对每个不同的任务设置高层的私有模块（Task-specific layers）。

2）参数的软共享模式：无显式共享模块，但每个任务都可以从其他任务中窃取信息，来提高自己的能力。窃取的方式包括直接复制使用其他任务的隐含状态，或使用注意力机制来主动选取有用信息。比如谷歌的MMOE，就是典型的软共享模式。

3）层次共享模式：神经网络中不同层抽取的特征类型不同，尤其对于图像任务而言。底层一般抽取一些低级的局部特征，高层抽取一些高级的抽象语义特征。因此，如果多任务学习中，不同任务也有级别高级之分，那么一个合理的共享模式就是让低级任务在底层输出，高级任务在高层输出。

4）共享-私有模式：这种模式的分工更加明确，将共享模块和任务特定（私有）模块的责任分开，共享模块捕捉一些跨任务的共享特征，而私有模块只捕捉和特定任务相关的特征。最终的表示由共享特征和私有特征共同构成。

ESMM模型回顾

用户的行为遵循一种序列化的模式，即曝光->点击->转化。因此，CVR模型预估的是点击后的转化概率，即 pcvr=p(conversion|click, impression)。

不同于ctr预估问题，cvr预估面临着两个重要问题：1）sample selection bias (SSB) problem：传统CVR模型通常以点击数据作为训练集，点击并转化为正样本，点击未转化为负样本，但我们在线inference预测时，面对的却是整个曝光样本空间。SSB问题会降低模型的泛化性能。2）data sparsity (DS) problem：cvr模型使用的点击训练样本量远小于ctr任务使用的曝光训练样本量。

某些策略可以缓解上述两个问题，比如从曝光集中对未点击样本抽样做负例缓解SSB（导致对cvr预估概率的低估），对转化样本过采样缓解DS（对采样率敏感）等。这些方法无法从本质上解决问题。

CVR预估模型的本质，不是预测“商品被点击，然后被转化”的概率（CTCVR），而是“假设商品被点击，那么它被转化”的概率（CVR）。这就是不能直接使用全部样本训练CVR模型的原因，因为我们不知道这个信息：那些未被点击的商品，假设它们被用户点击了，它们是否会被转化。如果直接使用0作为它们的label，会很大程度上误导CVR模型的学习。

ESMM可以从本质上同时解决SSB和DS的问题。

ESMM引入了两个辅助task：预估曝光后的点击概率以及预估曝光后点击且转化的概率。pCTCVR=pCTR*pCVR，模型目标是学习绿色的任务。

在ESMM中，通过 pctcvr=pctr*pcvr间接地学习中间变量 pCvr，pCTCVR 和 pctr都是在全样本空间中进行预估的，因此得到的也属于全样本空间，由此消除了SSB问题。
同时，CVR与CTR网络的底层特征表达的参数是共享的，显然CTR训练所能利用的样本量更多，从而辅助CVR的学习，使CVR任务可以隐式地从大量未点击的曝光样本中学习，这种类似于迁移学习的参数共享机制可以极大缓解DS问题。

在此公式中， pctcvr是曝光后点击且转化的概率， pCTR是曝光后的点击概率， pcvr是当前商品被用户点击的条件下，被转化的概率。

CTR对应的label是click，CTCVR对应的label是conversion & click。其中，click表示点击，conversion表示转化。

这两个任务可以使用全局曝光样本。论文里通过学习这两个任务，再根据该公式，隐式地学习CVR任务。

隐式学习pCVR 指的是，pCVR仅仅是网络结构中的一个变量，我们并不会将其当作我们的目标，也不会将pCVR加入到目标函数中。

目标函数如下：

即利用CTCVR和CTR的监督信息来训练网络，隐式地学习CVR，这就是ESMM的精髓。

优缺点

这篇论文可以是Multi-Task Model和预估cvr服务场景相结合的经典之作了。

1、通过CVR task和CTR task共享这个embedding table，这种共享机制比传统的CVR task多学习未点击的曝光的数据，缓解了训练数据稀疏问题。

2、通过设计multi-task loss，解决样本选择偏差的问题。

缺点

在实际应用中，往往点击、转化的样本非常稀疏，通常曝光到点击率可能只有1%，而且点击到转化可能也只有1%。这样就会造成损失函数的第二部分常常为0。按照点击到转化可能也只有1%算的话，大概和第一部分差100倍。这样损失函数的值的大小可能就由第一部分决定了。

Entire Space Multi-Task Model（ESMM）阅读体会 - 千寻的文章 - 知乎

如何优化

多目标分别优化解决方案

多目标学习--多目标分别优化解决方案 - 千寻的文章 - 知乎

主要核心思想：增加优化器，实际上隔离ctr、cvr值之间的影响，增加两个任务之间的独立性能。

原来线上使用 ESMM 模型进行点击率（ctr）和转化率（cvr）的多目标预估。该模型将点击率和转化率任务的 loss 简单求和后用于更新网络参数。

通过线下的实验发现在一个 batch(约几万条样本) 中点击率和转化率任务的 loss 数值相差30-50倍，会造成点击率任务的 loss 主导所有参数的更新，从而导致转化率任务学习效果较差。

方案：将网络分成ctr网络参数、cvr网络参数、底层共享网络参数三部分。ctr网络参数用ctr的loss优化，cvr网络参数用cvr的loss优化，共享网络参数用ctr的loss+cvr的loss优化。三个优化器，每个优化器对使用不同的loss对负责的网络参数进行优化，并每个优化器设置不同学习率。这样就缓解转化率（cvr）任务loss的数值远远小于点击率（ctr）任务loss的问题，并获得转化率任务效果的提升。使用LazyAdam。

原来是

线下实验发现，多组实验：ctr的auc基本保持不变或者略有提升，cvr的auc提升千分之一志千分之二，并且提升置信，线上预估服务，模型输出的ctr、cvr都使用。

线上：cost提升2%，cpm提升4%

基于ESMM模型的多目标优化实践——蘑菇街商城篇 - 琦琦的文章 - 知乎

基于ESMM模型的MTL多目标优化实践——用户活跃度影响排序机制——蘑菇街首页信息流推荐 - 琦琦的文章 - 知乎

引入点击行为序列，点击序列会同时作为ctr和cvr任务attention模块的输入，attention结构中的参数共享。

基于ESMM的多目标实践

ESMM 模型是通过ctr + ctcvr loss来进行梯度下降的，ctr和ctcvr都会用click=0的样本，也就是全局样本。cvr网络可以从有曝光无点击的样本中间接学习。

ESMM模型可以同时输出 pctr,pcvr,pctcvr。在实际应用中，若将多任务网络输出的 pCTCVR直接替换ctr单目标模型产出的 pctr ，并接入线上排序时，会出现点击率大幅度下跌的现象。

用 pCTCVR 代替原来的 pCTR 进行排序，以同时提高点击&转化的概率。真实cvr=pay/clk=0.18左右

也可以使用，

- 存在的问题，利用CTCVR直接代替DIN的CTR出现了点击率大幅下跌的问题。——》怎么解决的呢？

ESMM中的ctr和cvr任务是共享底层embedding参数的。电商场景仅仅共享底层embedding是不够的，cvr任务需要通过ctr任务学习到的其他参数来进一步辅助cvr的训练。
1）+attention 
2）+对序列类特征进行了拓展，deep结构中加入成交相关的统计类特征。（其实就是side information对原始信息进行补充）
为了进一步增强cvr侧的能力，我们对序列类特征进行了拓展，加入了包含销量、价格、喜欢数在内的泛化统计类特征。一般而言，泛化类特征（商品的一般性特征）包括：店铺、品牌、类目、销量、价格、喜欢数等。
加入了商品类目、商品价格、商品销量、商品喜欢数共四种特征。

如何将连续类特征巧妙地加入到deep模型中，从而提高模型的泛化能力呢？

对销量／喜欢数／价格等连续类特征进行分桶。首先需要统计样本中，商品各属性的最大值／最小值／分位数等，确定分桶的边界。将每个连续统计类特征分成8桶。

分桶后，我们会对每种连续类特征进行编码，构建其专属的embedding矩阵。

训练时，会使用这些连续类特征对用户的历史点击序列进行信息补充。需要说明的是，这些统计类特征也是以序列的方式呈现的，且与历史点击序列中的每个商品id一一对应，也就是说，序列中的每个商品，都有销量／喜欢数／价格等特征对其进行补充。

具体的做法就是将这些编码后的统计类序列特征与原始点击序列的embedding表达在最后一个维度进行拼接。

在点击序列的基础上，增加喜欢数／销量／价格等side info类特征，可以同步明显提升ctr侧以及cvr侧的能力。增加side info的点击序列的attention参数在两个任务之间仍是共享的，这类信息的加入可以同步提高两侧任务的AUC。

其实就是side information对原始信息进行补充，具体操作，

比如商品embd映射后是none,m,k，side_info也是none,m,k，二者在axis=-1处做拼接后生成none,m,2*k（就是concat），之后再和target_item做attention pooling。

但一般商品embedding维度较大，比如64，side info的embedding维度较小（因为本身较少，无需这么多维），比如16或者8。拼接以后，最后一维变成64+16或者64+8。然后这个整体结果再做attention。

额外学习

cvr中的item远比ctr中的少，并且cvr中高热item的样本占比很高，（多个模型单独训练然后再融合）然后我们通过融合公式来决定最终的排序，但是这样目前出现一个问题，推出的是一些高热，如果降低cvr的权重，用户留存及时长（我们关心的一个核心指标）会明显降低，一般这种会有哪些解决方案或者思路呢？

这种问题的原因是，你们对于新品的处理不够。也就是说，新商品的embedding，你们是如何处理的呢？是否只给了个默认值呢？这个默认值位于全局的什么位置呢？
有两个建议：
1、高热占比高的一个可能原因是，模型对于新品的处理不友善，高热商品不可能都是cvr非常高的商品，肯定也存在cvr很低，销量远低于整体均值的商品，模型推断出的新品的默认cvr分数，应该介于高热商品和差商品之间，应该处于一个中间中等生的水平；你们需要看下你们对于新品embedding的处理，一个新品进入模型后，模型预估出的cvr大概是多少，分布是怎样的。
2、尽量多加一些side info，用于缓解新品预估不准的问题。多加一些其他维度的信息，比如商品price、店铺、类目、甚至新品封面图的美观度等。这些都是很有用的信息，可以避免模型学偏。

CTR = 0 的样本也会用来 CVR 网络吗？

ctr=0的样本，也就是click=0的样本，包括有曝光无点击的，也包括有成交无点击的，前者是ctr网络的负样本，也会作为cvr网络训练的信息补充。后者是有问题的label，一般我们在实践中会将其剔除掉，避免其影响模型训练效果。

模型是通过ctr + ctcvr loss来进行梯度下降的，ctr和ctcvr都会用click=0的样本，也就是全局样本。cvr网络可以从有曝光无点击的样本中间接学习。

直接用ESMM输出的ctr，对比用DeepFM预测的ctr，应该差异不大吧？差异不是特别大。都可以的。

也可以使用esmm输出的ctr和cvr，再利用ctr*sigmoidCVR公式，作为最终排序。

train auc本身就比test auc偏高些，不过也可能存在轻微过拟合。

优化后的多任务模型里有self-attention，也有traditional-attention。

target attention参照阿里的DIN论文。基本是参照那篇论文实现的。

核心——排序机制

若我们直接使用多目标模型预估出的ctcvr替代deepFM点击率单目标模型预估出的ctr，线上点击率指标是有明显下跌的，跌幅可能在20%+。

最终选择，沿用deepFM模型预估出的ctr分数，乘以使用MTL（多目标模型）预估出的cvr分数，多目标结构的cvr分数通过ctr间接计算得到，充分利用了已曝光未点击的样本信息，因此准确率相较于纯cvr模型，有较明显的优势。

直接相乘也有问题

这个现象的深层次原因是，成交存在巨大随机性，cvr预估结果极其不置信，即便是再高大上的模型，cvr预估的稀疏性和不确定性只能得到缓解，无法得到根除。因此，我们对MTL模型产出的cvr预估分数进行了值域约束，在ctr和cvr之间，选择更相信ctr预估结果，降低cvr分数对整体值域的影响。

传统attention

target attention

与self-attention相比，输入序列的两两元素之间无任何交互。

self-attention

点积缩放结构，

为什么要点积缩放？

点积模型的方差会较大，从而导致softmax函数的梯度较小（softmax后非0即1，无信息量）。缩放点积模型就可以很好地解决这个问题，使内积不至于太大。

softmax函数值域[0,1]。

基于ESMM模型的多目标优化实践——蘑菇街商城篇 - 琦琦的文章 - 知乎基于ESMM模型的多目标优化实践——蘑菇街商城篇 - 知乎

这份「零基础」机器学习实战课程，帮你彻底搞懂AI不再迷茫！——深度解析ML-For-Beginners wylee 人工智能机器学习
引言：告别迷茫，拥抱AI未来在当今科技浪潮之巅，人工智能（AI）无疑是最璀璨的明星。机器学习（MachineLearning），作为AI的核心驱动力，正以前所未有的速度渗透到我们生活的方方面面：从智能推荐系统到自动驾驶，从疾病诊断到金融风控，其应用场景几乎无处不在。然而，对于无数渴望投身AI领域的学习者而言，机器学习的门槛似乎一直高不可攀。你是否也曾有过这样的困惑：面对海量的在线课程和资料，眼花缭
基于AFM注意因子分解机的推荐算法深度学习乐园深度学习实战项目深度学习科研项目推荐算法算法机器学习
关于深度实战社区我们是一个深度学习领域的独立工作室。团队成员有：中科大硕士、纽约大学硕士、浙江大学硕士、华东理工博士等，曾在腾讯、百度、德勤等担任算法工程师/产品经理。全网20多万+粉丝，拥有2篇国家级人工智能发明专利。社区特色：深度实战算法创新获取全部完整项目数据集、代码、视频教程，请进入官网：zzgcz.com。竞赛/论文/毕设项目辅导答疑，v：zzgcz_com1.项目简介项目A033基于A
embedding模型有哪些？如何选择合适的embedding模型？行云流水AI笔记 embedding
embedding模型是一种将数据映射到低维空间的模型，常用于自然语言处理、推荐系统、图像识别等领域。以下是一些常见的embedding模型：Word2Vec：CBOW（ContinuousBag-of-Words）：通过上下文预测中心词。Skip-Gram：通过中心词预测上下文。GloVe（GlobalVectorsforWordRepresentation）：结合了词频统计和Word2Vec的
【重构推荐系统】国产大模型驱动的电商个性化推荐完整实战：架构设计、推理优化与在线部署闭环观熵国产大模型部署实战全流程指南重构人工智能 Agent 智能体落地方案
个人简介作者简介：全栈研发，具备端到端系统落地能力，专注大模型的压缩部署、多模态理解与Agent架构设计。热爱“结构”与“秩序”，相信复杂系统背后总有简洁可控的可能。我叫观熵。不是在控熵，就是在观测熵的流动个人主页：观熵个人邮箱：[email protected]座右铭：愿科技之光，不止照亮智能，也照亮人心！专栏导航观熵系列专栏导航：AI前沿探索：从大模型进化、多模态交互、AIGC内容生成，到
Python爬虫实战：全方位爬取知乎学习板块问答数据 Python爬虫项目 2025年爬虫实战项目 python 爬虫学习开发语言 scrapy 游戏
1.项目背景与爬取目标知乎是中国最大的知识问答社区，聚集了大量高质量的学习资源和经验分享。爬取知乎“学习”板块的问答数据，可以为学习资料整理、舆情分析、推荐系统开发等提供数据支持。本项目目标：爬取“学习”话题下的热门问答列表抓取每个问答的标题、作者、回答内容、点赞数、评论数等详细信息实现动态加载内容的抓取，包含图片和富文本避免被反爬机制限制，保证数据采集稳定结合数据分析，为后续应用打基础2.知乎“
End-To-End 之于推荐-kuaishou OneRec 笔记 ASKED_2019 RecSys 笔记
核心思想OneRec提出了一种统一的生成式推荐系统架构，打破了传统“召回-粗排-精排”级联式推荐流程，使用单一生成模型同时完成召回与排序任务。该系统由快手团队研发，并成功部署于短视频主场景。OnlineA/BTest表现：模型总观看时长平均观看时长OneRec-1B+IPA+1.68%+6.56%一Input处理Userpositiveactionsequence，将短视频的多模态表征，通过量化的
计算机毕业设计项目、管理系统、可视化大屏、大数据分析、协同过滤、推荐系统、SSM、SpringBoot、Spring、Mybatis、小程序项目编号1000-1499 lonzgzhouzhou spring 课程设计 spring boot
大家好，我是DeBug，很高兴你能来阅读！作为一名热爱编程的程序员，我希望通过这些教学笔记与大家分享我的编程经验和知识。在这里，我将会结合实际项目经验，分享编程技巧、最佳实践以及解决问题的方法。无论你是初学者还是有一定经验的程序员，我都希望能够为你提供有价值的内容，帮助你更好地理解编程世界。让我们一起探索编程的乐趣，一起成长，一起学习，谢谢你们的支持与关注！【源码咨询】可接Java程序设计，Bug
腾讯混元API调用优化实战：用API网关实现流量控制+缓存+监控
1大模型API的调用挑战在接入腾讯混元大模型API的电商推荐系统项目中，我们面临三个核心挑战：突发流量冲击：促销活动期间API调用量激增300%，触发腾讯云限流策略（429错误）响应延迟波动：文本生成长内容时P99延迟高达2.8秒，影响用户体验异常诊断困难：错误日志分散在多台服务器，故障定位平均耗时47分钟传统解决方案如Nginx限流和Redis缓存存在配置分散、维护成本高等问题。API网关作为流
Python爬取TMDB电影数据：从登录到数据存储的全过程 Eqwaak00 爬虫 Python python 开发语言人工智能自动化
在当今数据驱动的时代，获取电影数据对于推荐系统、市场分析和个人项目都至关重要。本文将详细介绍如何使用Python构建一个完整的TMDB（TheMovieDatabase）爬虫，从登录认证到数据解析和存储的全过程。（本来博主也想在CSDN里面上白嫖结果没有一篇文章，然后......）1.项目概述TMDB是一个广受欢迎的电影数据库网站，包含了丰富的电影信息、演员数据和用户评分。我们的目标是构建一个爬虫
拷贝漫画网页版网址，Copymanga漫画官方网站入口及APP下载
拷贝漫画是一个专为漫画爱好者打造的在线阅读平台，提供海量漫画资源，涵盖日漫、韩漫、美漫、国漫及轻小说等多种类型，满足不同读者的口味需求。平台界面简洁友好，支持多设备同步阅读（如手机、电脑、平板），并提供高清画质与个性化设置，如亮度调节、字体大小、夜间模式等，确保阅读体验舒适。此外，平台具备智能推荐系统，根据用户浏览历史、收藏记录和偏好推荐漫画，帮助用户发现新内容。社区互动功能也十分活跃，用户可分享
60天python训练营打卡day20 tan90�= python60天打卡 python 开发语言
学习目标：60天python训练营打卡学习内容：DAY20奇异值SVD分解奇异值分解这个理论，对于你未来无论是做图像处理、信号处理、特征提取、推荐系统等都非常重要，所以需要单独抽出来说一下这个思想。—甚至我在非常多文章中都看到单独用它来做特征提取（伪造的很高大上），学会这个思想并不复杂没学过线代的不必在意，推导可以不掌握，关注输入输出即可。今天这期有点类似于帮助大家形成闭环—考研数学不是白考的知识
贝叶斯算法：从概率推断到智能决策的基石 weixin_47233946 算法算法
##引言在人工智能与机器学习的蓬勃发展中，贝叶斯算法以其独特的概率推理方式和动态更新的特性，在垃圾邮件过滤、疾病诊断、推荐系统等关键领域展现出强大的应用价值。本文将从概率论基础出发，深入解析贝叶斯算法的核心思想及其实现方式，揭示这一统计学方法如何演变为现代智能系统的决策利器。---##一、贝叶斯定理：概率之门的钥匙###1.1基本公式表述贝叶斯定理的数学表达式揭示事件间的关联关系：$$P(A|B)
用 DeepSeek 打造智能高考志愿填报推荐系统摆烂大大王 deepseek 高考 deepseek 人工智能数据库 AIGC
告别选择困难！基于大模型的精准志愿推荐方案一、背景痛点：高考志愿填报的困境每年高考结束后，数百万考生面临共同难题：如何用有限的分数选择最优的院校和专业？传统方式依赖手册翻阅、经验咨询，存在三大痛点：信息过载：全国近3000所高校、上万个专业组合动态复杂：历年分数线波动、招生计划变化匹配低效：个人兴趣与院校资源难以精准对接二、解决方案：DeepSeek-R1智能推荐系统架构系统核心流程
Milvus 向量数据库详解与实践指南 JJJ@666 基础知识(人工智能AI)milvus 向量数据库图像检索推荐系统
一、Milvus核心介绍1.什么是Milvus？Milvus是一款开源、高性能、可扩展的向量数据库，专门为海量向量数据的存储、索引和检索而设计。它支持近似最近邻搜索（ANN），适用于图像检索、自然语言处理（NLP）、推荐系统、语义搜索、智能问答、多模态数据处理等AI应用场景。它能够高效处理：嵌入向量（Embeddings）特征向量（FeatureVectors）任何高维数值向量2.核心特性特性说明
【AI大模型学习路线】第二阶段之RAG基础与架构——第十一章（【项目实战】基于RAG的新闻推荐）传统推荐算法与基于LLM的推荐算法？ 985小水博一枚呀人工智能学习架构推荐算法算法
【AI大模型学习路线】第二阶段之RAG基础与架构——第十一章（【项目实战】基于RAG的新闻推荐）传统推荐算法与基于LLM的推荐算法？【AI大模型学习路线】第二阶段之RAG基础与架构——第十一章（【项目实战】基于RAG的新闻推荐）传统推荐算法与基于LLM的推荐算法？文章目录【AI大模型学习路线】第二阶段之RAG基础与架构——第十一章（【项目实战】基于RAG的新闻推荐）传统推荐算法与基于LLM的推荐算
用Python爬取Goodreads书评与推荐系统数据 Python爬虫项目 python 开发语言爬虫 php 数据分析
一、项目背景与目标Goodreads是全球最大的图书社交网络，用户可以对读过的图书进行评分、撰写书评并获取推荐。本文目标是：自动化爬取Goodreads某本书的热门短评（reviews）；抓取Goodreads自动推荐的相似图书列表（relatedbooks）；获取每条评论的：评分、评论者昵称、评论内容；获取推荐图书的：书名、评分、作者、链接等信息；使用现代Python异步技术高效爬取并保存为CS
从“信息茧房”到“内容生态”：一个算法解救了我的推荐系统（3085. 成为 K 特殊字符串需要删除的最少字符数）满分观察网友z 算法解构与应用算法数据库
从“信息茧房”到“内容生态”：一个算法解救了我的推荐系统大家好，我是你们的老朋友，一个在代码世界里摸爬滚打多年的开发者。今天想和大家聊聊一个我最近在项目中遇到的“甜蜜的烦恼”，以及我是如何从一个看似不相关的LeetCode算法题中找到灵感，并最终完美解决问题的。我遇到了什么问题？故事得从我们团队正在迭代的一个核心功能——“个性化内容推荐”说起。最初的版本很简单粗暴：基于用户的历史点击、收藏等行为，
【Python使用】嘿马推荐系统全知识和项目开发教程第2篇：1.4 案例--基于协同过滤的电影推荐,1.5 推荐系统评估 python后端
教程总体简介：1.1推荐系统简介学习目标1推荐系统概念及产生背景2推荐系统的工作原理及作用3推荐系统和Web项目的区别1.3推荐算法1推荐模型构建流程2最经典的推荐算法：协同过滤推荐算法（CollaborativeFiltering）3相似度计算(SimilarityCalculation)4协同过滤推荐算法代码实现：二根据用户行为数据创建ALS模型并召回商品2.0用户行为数据拆分2.1预处理be
Atomgit 客户端实战（十六）：元服务开发 —— 构建无界交互的全场景服务网络逻极鸿蒙 harmonyos automgit 交互 harmonyos 华为缓存 typescript 开放原子鸿蒙
Atomgit客户端实战（十六）：元服务开发——构建无界交互的全场景服务网络在完成AI推荐系统开发后，Atomgit客户端已具备智能内容分发能力。随着鸿蒙生态的不断演进，**元服务（MetaService）**成为构建全场景服务网络的关键技术。它通过统一的服务描述语言，实现跨设备、跨应用的服务无缝调用，真正践行“服务即入口”的设计理念。本篇将深入元服务开发，讲解如何将客户端核心功能转化为可共享、可
彻底告别迷茫，探索机器学习的终极指南 wylee 机器学习人工智能
引言：信息洪流中的灯塔，你是否曾迷失方向？在这个AI技术日新月异的时代，机器学习（MachineLearning,ML）无疑是科技领域最耀眼、最具颠覆性的力量之一。从AlphaGo战胜人类围棋冠军，到智能推荐系统精准预测你的喜好，再到自动驾驶技术悄然改变出行方式，机器学习的力量无处不在。然而，对于无数渴望投身机器学习、或者希望在现有领域深耕的开发者而言，这股信息洪流也带来了前所未有的挑战：知识体系
AI转型指南 HeartException 人工智能学习机器学习
以下是为计算机学生/在职人员撰写《AI转型指南》的目录框架设计，兼顾系统性与实操性，采用模块化结构便于读者按需学习，前些天发现了一个巨牛的人工智能免费学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站一、AI行业全景扫描（认知篇）技术图谱解构机器学习/深度学习/强化学习的技术边界NLP/CV/语音/推荐系统等细分赛道的就业热度对比传统计算机技能与AI能力的交叉点（如分布式计算、系统
使用 Qdrant 实现高效的向量相似性搜索 antja_ 算法人工智能机器学习
Qdrant是一个功能强大的向量相似性搜索引擎，为您提供生产就绪的服务以及方便的API，用于存储、搜索和管理点——带有附加有效载荷的向量。Qdrant专注于支持扩展过滤，以满足复杂的搜索需求。技术背景介绍在现代应用中，向量相似性搜索是处理大规模数据的重要工具。例如，在推荐系统中，我们需要根据用户行为找到相似的产品，在搜索引擎中，我们需要根据查询找到相关的内容。Qdrant提供了一种高效且可扩展的解
【推荐系统】多任务学习之ESMM模型山顶夕景推荐算法深度学习推荐算法深度学习
学习总结ESMM首创了利用用户行为序列数据在完整样本空间建模，并提出利用学习CTR和CTCVR的辅助任务，迂回学习CVR，避免了传统CVR模型经常遭遇的样本选择偏差和训练数据稀疏的问题，取得了显著的效果。ESMM解决了真实场景中CVR中的SSB和DS问题。CVR（Conversionrate）转化率：衡量CPA广告效果的指标，用户点击广告到成为一个有效的激活（如注册额或者成为付费用户）的转化率，所
Datawhale 2025年2月组队学习- 推荐系统教程FunRec #Task3 dxnb22 Datawhale学习笔记人工智能推荐算法
第二章基于向量的召回1.item2vec未完待续……2.youtubeDnn3.经典双塔模型
Python打卡训练营day20-奇异值SVD分解 sak77 python打卡训练营 python 机器学习奇异值分解 SVD
知识点回顾：线性代数概念回顾（可不掌握）奇异值推导（可不掌握）奇异值的应用特征降维：对高维数据减小计算量、可视化数据重构：比如重构信号、重构图像（可以实现有损压缩，k越小压缩率越高，但图像质量损失越大）降噪：通常噪声对应较小的奇异值。通过丢弃这些小奇异值并重构矩阵，可以达到一定程度的降噪效果。推荐系统：在协同过滤算法中，用户-物品评分矩阵通常是稀疏且高维的。SVD(或其变种如FunkSVD,SVD
第11章：Neo4j实际应用案例
理论知识和技术细节固然重要，但真正理解Neo4j的价值在于了解它如何解决实际业务问题。本章将探讨Neo4j在各个领域的实际应用案例，包括社交网络分析、推荐系统、知识图谱以及欺诈检测与安全分析。通过这些案例，读者可以了解如何将前面章节学到的知识应用到实际项目中，以及如何解决特定领域的挑战。11.1社交网络分析社交网络是图数据库最自然的应用场景之一，因为社交关系本质上就是一个图结构。Neo4j在社交网
Dify文档喂不饱模型？别慌！Embedding 微调就是你的救星！大模型玩家 embedding ai 自然语言处理人工智能语言模型学习程序员
在AI时代，Embedding是NLP任务的基石，直接决定了你的模型是「聪明绝顶」还是「笨拙不堪」。你是否遇到过这些让人头疼的问题：做智能问答时，模型总是答非所问，用户一脸懵圈？做推荐系统时，用户翻遍推荐内容，还是觉得「没一个对味」？做语义搜索时，搜索结果五花八门，相关性差到让人抓狂？这些问题的罪魁祸首，往往就是你的Embedding不够精准！通用Embedding在特定领域常常「水土不服」：在电
SHAP（夏普利加性解释，Shapley Additive Explanations）阳光明媚大男孩人工智能机器学习深度学习
揭秘机器学习模型的“黑盒”：什么是SHAP？在人工智能（AI）时代，机器学习模型被广泛应用于医疗、金融、推荐系统等众多领域。然而，这些模型往往像一个“黑盒”，让人难以理解它们是如何做出预测的。SHAP（夏普利加性解释，ShapleyAdditiveExplanations为我们提供了一把钥匙，帮助揭开模型决策的神秘面纱！这篇科普博文将带你走进SHAP的世界，了解它是什么、如何工作，以及为什么它如此
Qdrant：从连接到查询的实战指南 Mr_Chenph AI乱炖向量数据库 qdrant 1.14.2
Qdrant是近年来非常热门的向量数据库，广泛用于文本搜索、推荐系统、图像相似度匹配等场景。本文将带你从最实用的三个层面入手，快速上手并用好Qdrant的核心能力：✅远程连接配置详解️集合创建参数全面解释查询参数高级用法本例为Qdrant1.14.2（注意！）✅一、远程连接配置详解（QdrantClient）在本地你可以用host和port来连接Qdrant服务，而在生产中，通常使用QdrantC
Agent 在AI里是什么意思？薇远镖局 AI 人工智能人工智能
Agent的核心特点自主性无需外部指令即可独立运行，根据环境信息调整行为（例如自动驾驶汽车根据路况变道）。感知与反馈通过传感器、数据输入等方式感知环境（如摄像头、文本输入、数据库），并实时更新决策。目标导向围绕明确目标行动（例如推荐系统的目标是最大化用户点击率）。适应性能应对环境变化（如聊天机器人根据用户情绪调整回复）。Agent的常见类型类型特点与例子反应式Agent基于当前环境直接响应（如自动
算法单链的创建与删除换个号韩国红果果 c 算法
先创建结构体 struct student { int data; //int tag;//标记这是第几个 struct student *next; }; // addone 用于将一个数插入已从小到大排好序的链中 struct student *addone(struct student *h,int x){ if(h==NULL) //??????
《大型网站系统与Java中间件实践》第2章读后感白糖_ java中间件
断断续续花了两天时间试读了《大型网站系统与Java中间件实践》的第2章，这章总述了从一个小型单机构建的网站发展到大型网站的演化过程---整个过程会遇到很多困难，但每一个屏障都会有解决方案，最终就是依靠这些个解决方案汇聚到一起组成了一个健壮稳定高效的大型系统。看完整章内容，
zeus持久层spring事务单元测试 deng520159 java DAO spring jdbc
今天把zeus事务单元测试放出来,让大家指出他的毛病, 1.ZeusTransactionTest.java 单元测试 package com.dengliang.zeus.webdemo.test; import java.util.ArrayList; import java.util.List; import org.junit.Test; import
Rss 订阅开发周凡杨 html xml 订阅 rss 规范
RSS是 Really Simple Syndication的缩写（对rss2.0而言，是这三个词的缩写，对rss1.0而言则是RDF Site Summary的缩写，1.0与2.0走的是两个体系）。 RSS
分页查询实现 g21121 分页查询
在查询列表时我们常常会用到分页，分页的好处就是减少数据交换，每次查询一定数量减少数据库压力等等。按实现形式分前台分页和服务器分页：前台分页就是一次查询出所有记录，在页面中用js进行虚拟分页，这种形式在数据量较小时优势比较明显，一次加载就不必再访问服务器了，但当数据量较大时会对页面造成压力，传输速度也会大幅下降。服务器分页就是每次请求相同数量记录，按一定规则排序，每次取一定序号直接的数据
spring jms异步消息处理 510888780 jms
spring JMS对于异步消息处理基本上只需配置下就能进行高效的处理。其核心就是消息侦听器容器，常用的类就是DefaultMessageListenerContainer。该容器可配置侦听器的并发数量，以及配合MessageListenerAdapter使用消息驱动POJO进行消息处理。且消息驱动POJO是放入TaskExecutor中进行处理，进一步提高性能，减少侦听器的阻塞。具体配置如下：
highCharts柱状图布衣凌宇 hightCharts 柱图
第一步：导入 exporting.js,grid.js,highcharts.js;第二步：写controller @Controller@RequestMapping(value="${adminPath}/statistick")public class StatistickController { private UserServi
我的spring学习笔记2-IoC（反向控制依赖注入） aijuans spring mvc Spring 教程 spring3 教程 Spring 入门
IoC（反向控制依赖注入）这是Spring提出来了，这也是Spring一大特色。这里我不用多说，我们看Spring教程就可以了解。当然我们不用Spring也可以用IoC，下面我将介绍不用Spring的IoC。 IoC不是框架，她是java的技术，如今大多数轻量级的容器都会用到IoC技术。这里我就用一个例子来说明：如：程序中有 Mysql.calss 、Oracle.class 、SqlSe
TLS java简单实现 antlove java ssl keystore tls secure
1. SSLServer.java package ssl; import java.io.FileInputStream; import java.io.InputStream; import java.net.ServerSocket; import java.net.Socket; import java.security.KeyStore; import
Zip解压压缩文件百合不是茶 Zip格式解压 Zip流的使用文件解压
ZIP文件的解压缩实质上就是从输入流中读取数据。Java.util.zip包提供了类ZipInputStream来读取ZIP文件,下面的代码段创建了一个输入流来读取ZIP格式的文件; ZipInputStream in = new ZipInputStream(new FileInputStream(zipFileName)); &n
underscore.js 学习（一） bijian1013 JavaScript underscore
工作中需要用到underscore.js，发现这是一个包括了很多基本功能函数的js库，里面有很多实用的函数。而且它没有扩展 javascript的原生对象。主要涉及对Collection、Object、Array、Function的操作。学
java jvm常用命令工具——jstatd命令(Java Statistics Monitoring Daemon) bijian1013 java jvm jstatd
1.介绍 jstatd是一个基于RMI（Remove Method Invocation）的服务程序，它用于监控基于HotSpot的JVM中资源的创建及销毁，并且提供了一个远程接口允许远程的监控工具连接到本地的JVM执行命令。 jstatd是基于RMI的，所以在运行jstatd的服务
【Spring框架三】Spring常用注解之Transactional bit1129 transactional
Spring可以通过注解@Transactional来为业务逻辑层的方法(调用DAO完成持久化动作)添加事务能力，如下是@Transactional注解的定义： /* * Copyright 2002-2010 the original author or authors. * * Licensed under the Apache License, Version
我(程序员)的前进方向 bitray 程序员
作为一个普通的程序员,我一直游走在java语言中,java也确实让我有了很多的体会.不过随着学习的深入,java语言的新技术产生的越来越多,从最初期的javase,我逐渐开始转变到ssh,ssi,这种主流的码农,.过了几天为了解决新问题,webservice的大旗也被我祭出来了,又过了些日子jms架构的activemq也开始必须学习了.再后来开始了一系列技术学习,osgi,restful.....
nginx lua开发经验总结 ronin47
使用nginx lua已经两三个月了，项目接开发完毕了，这几天准备上线并且跟高德地图对接。回顾下来lua在项目中占得必中还是比较大的，跟PHP的占比差不多持平了，因此在开发中遇到一些问题备忘一下 1：content_by_lua中代码容量有限制，一般不要写太多代码，正常编写代码一般在100行左右（具体容量没有细心测哈哈，在4kb左右），如果超出了则重启nginx的时候会报 too long pa
java-66-用递归颠倒一个栈。例如输入栈{1,2,3,4,5}，1在栈顶。颠倒之后的栈为{5,4,3,2,1}，5处在栈顶 bylijinnan java
import java.util.Stack; public class ReverseStackRecursive { /** * Q 66.颠倒栈。 * 题目：用递归颠倒一个栈。例如输入栈{1,2,3,4,5}，1在栈顶。 * 颠倒之后的栈为{5,4,3,2,1}，5处在栈顶。 *1. Pop the top element *2. Revers
正确理解Linux内存占用过高的问题 cfyme linux
Linux开机后，使用top命令查看，4G物理内存发现已使用的多大3.2G，占用率高达80%以上： Mem: 3889836k total, 3341868k used, 547968k free, 286044k buffers Swap: 6127608k total,&nb
[JWFD开源工作流]当前流程引擎设计的一个急需解决的问题 comsci 工作流
当我们的流程引擎进入IRC阶段的时候，当循环反馈模型出现之后，每次循环都会导致一大堆节点内存数据残留在系统内存中，循环的次数越多，这些残留数据将导致系统内存溢出，并使得引擎崩溃。。。。。。而解决办法就是利用汇编语言或者其它系统编程语言，在引擎运行时，把这些残留数据清除掉。
自定义类的equals函数 dai_lm equals
仅作笔记使用 public class VectorQueue { private final Vector<VectorItem> queue; private class VectorItem { private final Object item; private final int quantity; public VectorI
Linux下安装R语言 datageek R语言 linux
命令如下：sudo gedit /etc/apt/sources.list1、deb http://mirrors.ustc.edu.cn/CRAN/bin/linux/ubuntu/ precise/ 2、deb http://dk.archive.ubuntu.com/ubuntu hardy universesudo apt-key adv --keyserver ke
如何修改mysql 并发数(连接数)最大值 dcj3sjt126com mysql
MySQL的连接数最大值跟MySQL没关系，主要看系统和业务逻辑了方法一：进入MYSQL安装目录打开MYSQL配置文件 my.ini 或 my.cnf查找 max_connections=100 修改为 max_connections=1000 服务里重起MYSQL即可　　方法二：MySQL的最大连接数默认是100客户端登录：mysql -uusername -ppass
单一功能原则 dcj3sjt126com 面向对象的程序设计软件设计编程原则
单一功能原则[ 编辑] SOLID 原则单一功能原则开闭原则 Liskov代换原则接口隔离原则依赖反转原则查论编在面向对象编程领域中，单一功能原则（Single responsibility principle）规定每个类都应该有
POJO、VO和JavaBean区别和联系 fanmingxing VO POJO javabean
POJO和JavaBean是我们常见的两个关键字，一般容易混淆，POJO全称是Plain Ordinary Java Object / Plain Old Java Object，中文可以翻译成：普通Java类，具有一部分getter/setter方法的那种类就可以称作POJO，但是JavaBean则比POJO复杂很多，JavaBean是一种组件技术，就好像你做了一个扳子，而这个扳子会在很多地方被
SpringSecurity3.X--LDAP：AD配置 hanqunfeng SpringSecurity
前面介绍过基于本地数据库验证的方式，参考http://hanqunfeng.iteye.com/blog/1155226，这里说一下如何修改为使用AD进行身份验证【只对用户名和密码进行验证，权限依旧存储在本地数据库中】。将配置文件中的如下部分删除：
mac mysql 修改密码 IXHONG mysql
$ sudo /usr/local/mysql/bin/mysqld_safe –user=root & //启动MySQL(也可以通过偏好设置面板来启动)$ sudo /usr/local/mysql/bin/mysqladmin -uroot password yourpassword //设置MySQL密码（注意，这是第一次MySQL密码为空的时候的设置命令，如果是修改密码，还需在-
设计模式--抽象工厂模式 kerryg 设计模式
抽象工厂模式：工厂模式有一个问题就是，类的创建依赖于工厂类，也就是说，如果想要拓展程序，必须对工厂类进行修改，这违背了闭包原则。我们采用抽象工厂模式，创建多个工厂类，这样一旦需要增加新的功能，直接增加新的工厂类就可以了，不需要修改之前的代码。总结：这个模式的好处就是，如果想增加一个功能，就需要做一个实现类，
评"高中女生军训期跳楼” nannan408
首先，先抛出我的观点，各位看官少点砖头。那就是，中国的差异化教育必须做起来。孔圣人有云：有教无类。不同类型的人，都应该有对应的教育方法。目前中国的一体化教育，不知道已经扼杀了多少创造性人才。我们出不了爱迪生，出不了爱因斯坦，很大原因，是我们的培养思路错了，我们是第一要“顺从”。如果不顺从，我们的学校，就会用各种方法，罚站，罚写作业，各种罚。军
scala如何读取和写入文件内容？ qindongliang1922 java jvm scala
直接看如下代码： package file import java.io.RandomAccessFile import java.nio.charset.Charset import scala.io.Source import scala.reflect.io.{File, Path} /** * Created by qindongliang on 2015/
C语言算法之百元买百鸡 qiufeihu c 算法
中国古代数学家张丘建在他的《算经》中提出了一个著名的“百钱买百鸡问题”，鸡翁一，值钱五，鸡母一，值钱三，鸡雏三，值钱一，百钱买百鸡，问翁，母，雏各几何？代码如下： #include <stdio.h> int main() { int cock,hen,chick; /*定义变量为基本整型*/ for(coc
Hadoop集群安全性：Hadoop中Namenode单点故障的解决方案及详细介绍AvatarNode wyz2009107220 NameNode
正如大家所知，NameNode在Hadoop系统中存在单点故障问题，这个对于标榜高可用性的Hadoop来说一直是个软肋。本文讨论一下为了解决这个问题而存在的几个solution。 1. Secondary NameNode 原理：Secondary NN会定期的从NN中读取editlog，与自己存储的Image进行合并形成新的metadata image 优点：Hadoop较早的版本都自带，