PaperWeekly

何向南教授团队最新综述：对话推荐系统中的进展与未来挑战

©作者｜高崇铭、雷文强等

来源｜社媒派SMP

背景介绍

推荐系统为工业界带来了巨大的收益。大多数推荐系统都是以静态的方式工作，即从用户历史的交互中来推测用户的兴趣爱好从而做出推荐。然而，这样的方式有缺陷，具体来说，两个较重要的问题无法被解答：1）用户目前具体喜欢什么？2）用户为什么喜欢一个商品？

对话推荐系统（Conversational Recommender Systems，CRSs）的出现，从根本上解决这个问题。其打破了传统静态的工作方式，动态地和用户进行交互，获得用户的实时反馈，进而向用户做出心仪的推荐。此外，借助自然语言的这一工具，CRSs 还可以灵活地实现一系列任务，满足用户的各种需求。

本文将总结 CRSs 中的五个任务梳理其难点。最后本文对 CRSs 未来的科研方向进行了探讨和展望。

论文标题：

Advances and Challenges in Conversational Recommender Systems: A Survey

论文链接：

https://arxiv.org/abs/2101.09459

论文作者：

高崇铭（中国科学技术大学），雷文强（新加坡国立大学），何向南（中国科学技术大学），Maarten de Rijke（荷兰阿姆斯特丹大学），Tat-Seng Chua（新加坡国立大学）

注：本文根据 tutorial [1] 深度扩展。

CRSs的定义与架构

▲ 图1. CRSs的架构

目前，CRSs 还没有主流、统一的定义。本文将 CRS 定义为：能通过实时的多轮对话，探出用户的动态喜好，并采取相应措施的推荐系统（“A recommendation system that can elicit the dynamic preferences of users and take actions based on their current needs through real-time multiturn interactions using natural language.”）。

其架构可以用三个模块来组成，其中一个用户接口模块（User Interface）负责直接与用户进行交互；一个推荐引擎（Recommender Engine）负责推荐工作；还有一个最为核心的对话策略模块（Conversation Strategy Module）负责统筹整个系统的任务、决定交互的逻辑。本文总结了五个具有挑战的任务和研究方向，分别对应到这三个模块中。

CRSs的定位与作用

3.1 CRSs与传统推荐系统的区别

传统推荐系统是静态的：其从用户的历史交互信息中来估计用户偏好。而 CRSs 是动态地与用户进行交互，在模型有不确定的地方，可以主动咨询用户。故 CRSs 能解决传统推荐系统做不到的一些事儿。

一方面，传统推荐系统不能准确的估计用户目前具体喜欢什么东西（What exactly does a user like?）这是由于用户的历史记录通常很稀疏，而且充满噪声。举例来说，用户可能做出错误决策，从而购买过一个不喜欢的东西。且用户的喜好是会随着时间改变的。

另一方面，传统推荐系统不能得知为什么用户喜欢一个东西（Why does a user like an item?）举例来说，用户可能由于好奇购买一个东西，可能由于受朋友影响购买一个东西。不同理由下的购买，其喜好动机和程度都是不一样的。

受益于 CRSs 的交互能力，CRSs 能解决传统推荐系统做不到的以上两点内容。系统在不确定用户具体偏好，以及为什么产生该偏好时，直接向用户询问即可。

3.2 CRSs与交互式推荐系统的区别

交互式推荐系统可以视为 CRSs 的一种早期雏形，目前仍然有交互式推荐系统的研究。大多数交互式推荐系统，都遵循两个步骤：1）推荐一个列表；2）收集用户对于该推荐的反馈。然后往复循环这两个步骤。

然而这并不是一种好的交互模式。首先，这种交互太单调了，每轮都在循环推荐和收集反馈，很容易让用户失去耐心；其次，一个好的推荐系统应该只在其置信度比较高、信心比较充足的情况下进行推荐；最后，由于商品的数量巨大，用推荐商品的方式来了解用户的兴趣喜好，是低效的。

而 CRSs 引入了更多的交互模式。例如，其可以主动问用户问题，例如问关于商品属性的问题：“你喜欢什么样颜色的手机？”“你喜欢关于摇滚类乐曲吗？”丰富的交互模式克服了交互式推荐系统的三个问题，用更高效的方式来进行交互，从而快速获得用户的兴趣爱好，在信心比较充足的情况下，才作出推荐。

3.3 CRSs与任务型对话系统的区别

两者没有本质上的区别，然而两者在目前的实现方式和侧重点上有差异。目前，大多数任务型的对话系统，主要关注点还是自然语言处理的任务，而非检索、推荐任务。任务型对话系统也有一个对话策略（Dialog Policy）模块作为核心模块来进行任务的统筹和规划，但由于其侧重对话本身，其训练和工作方式还是以从人类的文本（训练集）中拟合特定模式为主，同时加入知识图谱等信息作为辅助，来进行监督学习式训练，最终使得系统能生成流畅合理的自然语言以回复用户以完成某一特定任务。

有学者在实验探究中发现，用基于任务型对话系统实现的对话推荐，存在一些问题 [2]。首先系统“生成”的对话，并不是真正意义上的生成，所有词汇、句子都在之前的训练文本中出现过。而且，这种方式产生的推荐，质量并不令人满意。

相比较任务型对话系统，CRSs 关注的重点并不在于语言，而是推荐的质量。CRSs 的核心任务，还是利用其交互的能力去想方设法获得用户喜好，做出高质量体检。与此同时，CRSs 的输入输出可以用基于规则的文本模版来实现。当然，这并不代表语言不重要。随着技术的的发展迭代以及学者们研究方向的重合，不同领域的差距将越来越小。

重要的研究方向

4.1 基于问题的用户偏好刺探

CRSs 的一项重要功能，是实时地向用户进行提问，以获得用户的动态偏好。这其中，各式方法可以分为两个类。一是询问商品，即收集用户对推荐商品本身的喜好；二是询问用户对商品属性的偏好，例如“你喜欢摇滚类的音乐吗？”一个基于路径推理的 CRS 示意图如下。原文表 1 总结了各种 CRSs 的工作原理。更多细节请看原文。

▲ 图2. 一个基于路径推理的CRS工作示意图（来源[3]）

4.2 多轮对话推荐策略

CRSs 的一个核心任务是关注如何问问题，即什么时候问问题，什么时候做推荐。本文总结了集中模式，包括“问一轮推一轮”、“问 X 轮推一轮”，“问 X 轮推 Y 轮”几种方式。其中 X 和 Y 可固定或由模型决定。图 3 给出了一个“问 X 轮推 Y 轮”的 CRS 模型示意图。

除了提问以外，CRSs 也可考虑其他多轮对话策略，如加入闲聊以增加趣味，或者加入说服，协商等多样化的功能以进一步引导对话。原文表 2 总结了 CRSs 的多轮对话策略。

▲ 图3. CRS中的多轮对话策略示意图（来源[4]）

4.3 自然语言理解及生成

处理用户多样化的输入以及灵活的输出，也是 CRSs 中的一大挑战。目前的 CRSs 多数还是以基于提前标注的输入以及基于模版的输出为主，少数 CRSs 以对话系统的模式出发来考虑直接处理自然语言和生成自然语言。这是因为 CRSs 的主要目标还是保证推荐的质量，而非语言处理能力。原文表三总结了两个分类下的部分工作。

4.4 探索与深究之间的权衡

探索与深究是推荐系统中一个重要的研究方向，也是处理冷启动用户的一个有效手段。探索意味着去让用户尝试以往没有选择过的商品，而深究则是利用用户之前的喜好继续推荐。前者冒着用户可能不喜欢的风险，但能探索到用户一些额外的喜好；后者则安全保险，但一直陷入在已知的局部偏好中，不去改变。

这就如同经典的多臂老虎机问题（Multi-armed Bandit, MAB），如图 4，一个赌徒可以选择多个老虎机的摇杆进行下拉。每个摇杆下拉后的收益期望 μ 是可以根据多次实验估计出来的，但由于实验次数有限，对收益的估计存在不确定性。若要追求全局最优点，便需要从尝试新摇杆（Exploration）与选择目前已知的高收益摇杆（Exploitation）这两者中不断交替权衡，从而达到长期的高收益。

由于 CRSs 和交互式推荐系统一样，都可以实时地获得用户的反馈，于是 MAB 问题以及一系列解决方法都可以应用在 CRSs 与交互式推荐中。此外，除了经典的 MAB 算法，Meta learning 的方法也可以应用在 CRSs 中来解决冷启动或者 EE 问题。原文表 4 中列举了一些工作。

▲ 图4. 多臂老虎机问题

4.5 模型评测和用户模拟

算法评测是个很重要的问题，在 CRSs 中，由于有些算法要求文本数据，有些算法要求实时交互数据，故有工作从众包平台采集实时交互的对话数据。而有些工作则另辟蹊径，从已有的推荐数据集中造出用户模拟器（User simulators）来与 CRS 模型进行实时的交互。原文表 5 列举了目前 CRSs 中常用的数据集。

关于 CRSs 的评测指标。本文将其分为两个层级，第一个层级是每一轮级别的评测，其中值得评测的量包括推荐的质量，指标用推荐中常用的Rating-based指标，如 RMSE 或者 Ranking-based 指标，如 MAP，NDCG。另一个值得评测的量是文本生成的质量，指标包括 BLEU 与 ROUGE 等。第二个层级是对话级别的评测，主要关心的量是对话的平均轮次（Average Turns, AT），在 CRS 任务中，越早推中用户喜欢的商品越好，故对话的轮次越短越好。另外一个指标是对话在特定轮次的成功率（Success Rate@t, SR@t），该指标越高越好。

由于用户参与的交互通常很慢且难以获取，CRSs 的评测依赖用户模拟器。常用的用户模拟策略包括：

1. 从历史交互中直接模拟出用户在线的偏好，然而这种方式存在问题：历史交互通常非常稀疏，模拟出的用户无法回答那些空缺值处的喜好；

2. 先补齐用户历史交互中的空缺值，用补齐后的交互来模拟用户在线偏好。这种方式潜在的风险是补齐算法难免引入额外偏差；

3. 利用用户对商品的在线评论进行模拟。由于用户对商品的评论中包含很多可以反映用户偏好的属性信息，这种模拟方式将带来更全量的信息；

4. 从历史的人类对话文本库中模拟出用户，其适用于让 CRS 系统来模拟训练数据中的模式及语言的模型。

展望未来的可做方向

5.1 对CRSs的三个模块进行协同优化

CRSs 包含三个模块，用户界面、对话策略模块以及推荐引擎。很多 CRSs 的工作将它们分开进行优化。然而这三个模块在任务上是有交叉的地方，需要考虑对它们考虑协同优化。

5.2 关注CRSs中的偏差并进行去偏差

推荐偏差近年来受到研究者们很大关注，原因是观测到的数据中通常存在各式各样的偏差，例如选择性偏差，即用户倾向于选择自己更喜欢的东西进行交互，这就使得没有观测到的东西与观测到的东西有着不一样的喜好分布。因此不能简单地用观测到的东西的分布来估计空缺值。除此之外，观测数据中其他偏差，可参考另外一篇综述 [5]。虽然 CRSs 的实时交互可以部分缓解这些偏差问题，然而偏差依然会影响推荐结果。故去除 CRSs 中的偏差是一个有意义的研究方向。

5.3 设计更智能的对话策略

CRSs 最核心的部件是对话策略模块。目前已有工作考虑的策略还比较基础简单。我们可以考虑更加智能的策略，例如将强化学习的最新研究成果应用到 CRSs 的对话策略中。例如，逆强化学习可以自动的学习回报项，元强化学习可以考虑交互非常稀疏场景。

5.4 融入额外信息

让 CRSs 更加智能的一种直接的方法，便是融入更多信息。这些信息可以是商品知识图谱，也可以是多模态的信息，例如声音信息，视觉信息等。处理这些信息的相应算法已经被研究了多年，例如图卷积网络等方法，也可利用起来造福 CRSs。

5.5. 开发更好的评测方式以及模拟用户的方法

仅开发算法还不够，好的评测方法如同好的指导老师，能指引 CRSs 正确的前进方向。故研究 CRSs 的评测也意义重大。此外，由于 CRSs 的训练和评测都很依赖模拟用户，研究更加全面更加靠谱的模拟用户也是亟待解决的问题。

参考文献

[1] Wenqiang Lei, Xiangnan He, Maarten de Rijke, Tat-Seng Chua. 2020. Conversational Recommendation: Formulation, Methods, and Evaluation. SIGIR‘20 Tutorial.

[2] Dietmar Jannach and Ahtsham Manzoor. 2020. End-to-End Learning for Conversational Recommendation: A Long Way to Go? Proceedings of the 7th Joint Workshop on Interfaces and Human Decision Making for Recommender Systems co-located with 14th ACM Conference on Recommender Systems (RecSys 2020) (2020).

[3] Wenqiang Lei, Gangyi Zhang, Xiangnan He, Yisong Miao, Xiang Wang, Liang Chen, and Tat-Seng Chua. 2020. Interactive Path Reasoning on Graph for Conversational Recommendation. In Proceedings of the 26th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining (KDD ’20). 2073–2083.

[4] Wenqiang Lei, Xiangnan He, Yisong Miao, Qingyun Wu, Richang Hong, Min-Yen Kan, and Tat-Seng Chua. 2020. Estimation-Action-Reﬂection: Towards Deep Interaction Between Conversational and Recommender Systems. In Proceedings of the 13th International Conference on Web Search and Data Mining (WSDM’20). ACM, 304–312.

[5] Jiawei Chen, Hande Dong, Xiang Wang, Fuli Feng, Meng Wang, and Xiangnan He. 2020. Bias and Debias in Recommender System: A Survey and Future Directions. arXiv preprint arXiv:2010.03240 (2020).

关于作者

高崇铭，中国科学技术大学博士研究生。本科与硕士毕业于电子科技大学计算机专业，致力于信息检索、数据挖掘以及推荐系统的前沿研究。曾获得 DASFAA’19（CCF B）最佳论文奖。

雷文强，新加坡国立大学博士后。博士毕业于新加坡国立大学，本科毕业于华东师大，是华东师大极少数三年半拿到学士学位的毕业生。研究兴趣在于自然语言处理以及信息检索，特别是篇章语义，对话系统以及 human-in-the-loop 技术。在各大顶级会议和期刊发表 20 余篇，包括国际顶级会议 KDD，ACL，MM，EMNLP，AAAI，IJCAI 和顶级期刊 TOIS 等。其中担任通讯作者的论文获得 CCF A 类会议 ACM MM 2020 最佳论文奖。他担任 2020 届新加坡全国自然语言处理会议 SSNLP 2020 的程序委员会共同主席，并长期担任各大 CCF A 类会议会议的（高级）程序会员会委员以及 CCF A 类期刊的审稿人。最近，他与信息检索领域几位活跃的学者一起在 SIGIR 2020，CCL 2020，CCIR 2020 作了关于题为 Conversational Recommendation: Formulation 的 tutorial。

何向南，中国科学技术大学教授，大数据学院副院长。博士毕业于新加坡国立大学计算机科学专业，致力于信息检索、数据挖掘和机器学习等人工智能领域前沿研究，取得了丰硕的研究成果。在 CCF A 类会议和期刊发表论文 90 余篇，谷歌学术引用近 9000 次，包括国际顶级会议 SIGIR、WWW、KDD 和顶级期刊 TKDE、TOIS、TNNLS 等。长期担任这些会议和期刊的审稿人，以及 CCIS 2019（云计算与智能系统IEEE国际会议）的程序委员会主席，AI Open 期刊编委。研究成果曾获 SIGIR 2016 最佳论文提名奖、WWW 2018 最佳论文提名奖、WWW 2018 最佳海报论文奖等，并在多个商业公司的线上系统获得应用，取得积极效果。

Maarten de Rijke，荷兰皇家艺术与科学院院士，荷兰国家人工智能创新中心主任、荷兰阿姆斯特丹大学教授。发表论文 900 余篇，h 因子 77，谷歌学术引用近 28000 次。主要研究领域包括自然语言处理、信息检索、知识挖掘等。多次担任信息检索领域重要会议的程序委员会主席，包括 SIGIR, WSDM, WWW, CIKM, ECIR, ICTIR 等，同时担任人工智能领域顶级期刊的主编。并于 2017 年获得代表国际信息检索领域终身成就的 Tony Kent Strix 等奖项。

Tat-Seng Chua，新加坡国立大学计算机学院创始院长，清华大学访问教授，新加坡国立大学与清华大学联合研究中心（NExT）主任。h 因子 90，谷歌学术引用超过 33000 次。研究方向包括非结构化数据分析，多媒体信息检索，推荐系统与对话系统等。其担任多个国际顶级会议会议的联合主席，包括 MM 2005, CIVR 2005, SIGIR 2008 以及 WebSci 2015 等，同时是多个期刊的编委会成员。

更多阅读

#投稿通道#

让你的论文被更多人看到

如何才能让更多的优质内容以更短路径到达读者群体，缩短读者寻找优质内容的成本呢？答案就是：你不认识的人。

总有一些你不认识的人，知道你想知道的东西。PaperWeekly 或许可以成为一座桥梁，促使不同背景、不同方向的学者和学术灵感相互碰撞，迸发出更多的可能性。

PaperWeekly 鼓励高校实验室或个人，在我们的平台上分享各类优质内容，可以是最新论文解读，也可以是学习心得或技术干货。我们的目的只有一个，让知识真正流动起来。

???? 来稿标准：

• 稿件确系个人原创作品，来稿需注明作者个人信息（姓名+学校/工作单位+学历/职位+研究方向）

• 如果文章并非首发，请在投稿时提醒并附上所有已发布链接

• PaperWeekly 默认每篇文章都是首发，均会添加“原创”标志

???? 投稿邮箱：

• 投稿邮箱：hr@paperweekly.site

• 所有文章配图，请单独在附件中发送

• 请留下即时联系方式（微信或手机），以便我们在编辑发布时和作者沟通

????

现在，在「知乎」也能找到我们了

进入知乎首页搜索「PaperWeekly」

点击「关注」订阅我们的专栏吧

关于PaperWeekly

PaperWeekly 是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台。如果你研究或从事 AI 领域，欢迎在公众号后台点击「交流群」，小助手将把你带入 PaperWeekly 的交流群里。

造价算量审图多元化融合软件开发实战：技术架构与核心代码解析夏末之花架构
——从BIM模型解析到AI智能审图的完整实现路径1.技术架构设计该软件需融合以下模块：BIM/CAD模型解析引擎（支持Revit/DWG文件一键导入）智能算量核心算法（基于规则引擎与机器学习）协同审图平台（多人实时标注与版本控制）AI辅助决策系统（材料价格预测、工程量误差检测）技术栈推荐：前端：Three.js（3D模型渲染）+React（协同界面）后端：Python（算量算法）+Java（业务逻
基于大模型的Text2SQL微调的实战教程(二) herosunly AIGC Text2SQL 微调实战教程
大家好，我是herosunly。985院校硕士毕业，现担任算法研究员一职，热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名，CCF比赛第二名，科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法行业就业。希望和大家一起成长进步。本文主要介绍了基于大模型的Text2SQL微调的实战教程(二)，希望对学习大语言模型的
开启AI开发新时代——全解析Dify开源LLM应用开发平台 gs80140 AI 人工智能开源
开启AI开发新时代——全解析Dify开源LLM应用开发平台在人工智能迅速发展的今天，如何快速将创意转化为高效可用的应用成为开发者亟待解决的问题。Dify作为一款开源的LLM应用开发平台，以其直观的界面和强大的功能组合（包括agenticAI工作流、RAG流水线、agent能力、模型管理、可观测性等），让从原型设计到生产部署的过程变得简单而高效。本文将带你全面了解Dify的优势、核心功能、快速上手指
Lambda表达式：Java编程的简洁与强大小涛砸开发语言 java
引言随着Java8的发布，Lambda表达式成为了Java编程语言中一个引人注目的新特性。Lambda表达式不仅简化了代码，还使得Java更加贴近于函数式编程的范式。本文将深入探讨Lambda表达式的概念、语法、应用场景以及它如何改变我们的编程方式。什么是Lambda表达式？Lambda表达式是一种匿名函数，它允许你以更简洁的方式表示只有一个抽象方法（即函数式接口）的接口的实例。简单来说，Lamb
通过 ElasticSearch的Python API和`curl` 命令获取Elasticsearch 所有索引名称 BigBookX elasticsearch jenkins 大数据
导言在大数据管理和实时搜索场景中，Elasticsearch是一款不可或缺的工具。无论是开发调试、数据维护，还是系统监控，快速列出所有索引名称都是一个高频需求。本文将手把手教你如何通过Python客户端连接Elasticsearch，并用两种方法获取索引列表，同时提供代码示例和实战技巧，助你高效掌控Elasticsearch的索引管理。一、为什么需要列出索引名称？在Elasticsearch中，索
建议收藏！华为HCIE考试内容全攻略，助你备考一臂之力！新盟IT教育网络网络工程师网络工程师培训 HCIE培训华为认证 HCIE考试
在ICT领域，华为HCIE认证的含金量不言而喻，它是众多技术从业者梦寐以求的目标。然而，想要顺利通过华为HCIE考试，深入了解考试内容是关键。今天，就来和大家详细聊聊华为HCIE考试内容，为大家的备考之路提供一些方向。新盟教育专注华为认证培训十余年为你提供认证一线资讯！华为HCIE有多个领域方向，如数据通信、云计算、安全、人工智能等，不同方向的考试内容各有侧重，但都对考生的技术能力和综合素养提出了
一文看懂web组态 2501_90680076 物联网 web 数学建模前端后端
web可视化编辑器，又称WEB组态可视化软件，即用户可以在web页面编辑器上直接搭建出一个行业应用系统出来。web组态可视化编辑器能够运用在哪些场景中呢？web组态可视化编辑器为工程用户提供了二次开发的可能，不用编程、不用写代码，通过可视化界面即可生成web页面，开发出一个应用系统来，在电力、物联网、大数据平台有广泛的应用。一个好的应用系统，应该给用户提供业务自定义的工具。一个好的应用系统，应该采
整理：开启新征程！四篇文章助力 AI，告别 “3D理解困难户” mslion 人工智能 3d 大语言模型计算机视觉目标识别
近年来，人工智能的发展让大语言模型（MLLM）变得越来越强大，它们可以理解和处理文字、图片、视频等多种信息，在很多领域都有很好的应用。然而，当这些模型需要理解3D（立体）场景时，仍然面临一些困难。目前的MLLM主要是用2D图片训练出来的，也就是说，它们更擅长识别平面的信息，比如照片中的人和物体。但是，现实世界是三维的（3D），仅靠2D图片训练的模型很难准确理解物体的立体关系。例如，如果只给一个普通
RAG(检索增强生成)系统实践与调优 python_知世 android 金融自然语言处理大模型技术人工智能 RAG 大模型
在人工智能领域，检索增强生成（RetrievalAugmentedGeneration,RAG）是一种结合信息检索和生成式人工智能的技术，它通过从外部数据源中检索相关信息，来辅助大语言模型（LargeLanguageModel,LLM）生成更为准确、上下文相关的答案。1什么是RAG检索增强生成（RetrievalAugmentedGeneration,RAG）是一种结合信息检索和生成式人工智能的技
不同用户群体设计的Manus试用申请理由模板 xinxiyinhe 人工智能人工智能
注：仅供参考。以下是为不同用户群体设计的Manus试用申请理由模板，结合其核心功能与官方审核偏好撰写，可根据自身需求调整使用：模板1：学术研究场景申请理由：我目前从事人工智能与产业经济交叉领域的博士后研究，亟需通过AI技术快速处理大量非结构化数据（如政策文件、企业年报、行业研报）。Manus的「多智能体调度」与「跨平台工具调用」功能能显著提升研究效率，例如：自动化筛选并分析1000+份上市公司ES
DeepSeek对于普通打工人来说有什么帮助呢？人工智能
在当今快速变化的社会中，普通打工人面临着越来越多的挑战：职场竞争加剧、技能更新换代加快、工作与生活的平衡难以掌控等。在这样的背景下，如何提升自身竞争力、找到适合自己的职业发展路径，成为了每个打工人都需要思考的问题。而DeepSeek，作为一款基于人工智能和大数据分析的职业发展工具，正在为普通打工人提供全新的解决方案。本文将从多个角度探讨DeepSeek对于普通打工人的帮助，分析它如何通过职业规划、
训练大模型LLM选择哪种开发语言最好大0马浓人工智能训练 python
训练大型语言模型（LLM）时，选择合适的编程语言主要取决于效率、生态支持、开发便利性以及特定需求（如性能优化或硬件适配）。以下是常见语言的分析和推荐：---1.Python（首选语言）优势：-生态系统丰富：主流深度学习框架（PyTorch、TensorFlow、JAX）均以Python为主要接口，提供完整的工具链（数据处理、模型训练、评估部署）。-开发效率高：语法简洁，适合快速实验和原型开发，社区
豆包AI：打破智能边界，开启“人人可编程”的AI普惠时代 Herbig AI 人工智能
在人工智能技术狂飙突进的2024年，全球AI工具用户已突破12亿，但企业AI落地率仍不足35%——高昂的开发成本、复杂的技术门槛与碎片化的场景需求，如同三重枷锁禁锢着智能革命的红利释放。当大多数AI平台还在比拼模型参数时，豆包AI以“零代码交互+多模态引擎+垂直场景精调”的创新架构，正在重塑人机协作的范式。这款由字节跳动火山引擎团队打造的智能平台，不仅让AI开发效率提升400%，更在医疗、教育、工
论文学习：基于机器学习的光声图像分析1 superace7911 基于机器学习的光声图像处理机器学习人工智能图像处理
3/25——3/31期间论文学习笔记，关于基于机器学习的光声图像分析的6篇1区论文血管结构模拟&分割：Quantificationofvascularnetworksinphotoacousticmesoscopy链接数据集链接摘要这篇论文提出了一种新的方法，利用中观光声成像（MesoscopicPhotoacousticImaging,PAI）技术和高级图像分析技术，来非侵入性地定量化和分析活体
使用 Python 爬虫抓取 Wikipedia 页面内容——完整实战教程 Python爬虫项目 2025年爬虫实战项目 python 爬虫开发语言 json java
引言随着互联网的普及和信息化时代的到来，获取知识变得异常方便。Wikipedia作为全球最大的开放式百科全书，几乎涵盖了所有领域的知识。每年都有数十亿次的访问量，成为全球获取信息的一个重要来源。对于数据分析、自然语言处理、学术研究等领域，Wikipedia页面内容往往是研究者和开发者的重要数据来源之一。本篇博客将带您通过Python爬虫，学习如何抓取Wikipedia页面中的内容，并处理提取的文本
详细解释交叉熵损失函数（面试题200合集）快撑死的鱼人工智能机器学习
非常抱歉，我在之前的回答中确实没有严格遵循您指定的公式格式要求。感谢您的提醒！以下是修正后的版本，我将确保：内联公式使用$...$表示，例如a+b=ca+b=ca+b=c，嵌入在文本中。块级公式使用$$...$$表示，例如：E=mc2E=mc^2E=mc2我将重新整理并严格按照要求格式化之前的回答，同时保持内容清晰简洁。交叉熵损失函数的详细解释交叉熵（Cross-Entropy）损失函数是机器学习
深入大数据世界：Kontext.TECH的Hadoop之旅钱桦实Emery
深入大数据世界：Kontext.TECH的Hadoop之旅winutils项目地址:https://gitcode.com/gh_mirrors/winut/winutils在大数据的浩瀚宇宙中，Hadoop作为一颗璀璨的星辰，一直扮演着至关重要的角色。对于渴望探索这一领域的开发者和学习者而言，Kontext.TECH提供了一扇独特而便捷的大门，让你的学习之旅更加顺畅。项目介绍Kontext.Ha
JavaScript基础-顺序流程控制難釋懷 javascript 开发语言
在学习任何编程语言时，理解如何控制程序的执行流程是至关重要的。JavaScript中的顺序流程控制指的是按照代码书写的顺序依次执行语句的过程。虽然它看起来非常直接和简单，但正是这种基本的控制流构成了所有复杂逻辑的基础。本文将详细介绍JavaScript中的顺序流程控制，并通过示例展示其应用。一、什么是顺序流程控制？顺序流程控制是最简单的程序控制形式，指的是代码从上到下、从左到右逐行执行。除非受到特
solidity高阶 -- Eth支付第十六年盛夏. Solidity 智能合约区块链智能合约
在区块链的世界里，智能合约是实现去中心化应用（DApp）的核心技术之一。Solidity是一种专门用于编写以太坊智能合约的编程语言，它可以帮助开发者构建各种功能，包括支付功能。今天，我们就来探讨如何使用Solidity实现以太坊主币的支付功能，以及如何通过智能合约接收和管理这些资金。注意：使用继承时请确保代码的正确性，以防丢失个人财产，在这里友情提示您，不要复制来源不明的solidity代码并进行
Solana合约的错误处理 GTokenTool发币平台区块链
错误处理Solana合约开发中错误处理是一个重要的部分，它帮助开发者和用户理解合约执行过程中发生的问题。Solana使用Rust编程语言开发智能合约（称为程序），并提供了一套丰富的错误处理机制，其中包括定义和使用错误类型。在合约开发中，我们需要返回ProgramResult类型，其定义为：rustuse{std::{result::ResultasResultGeneric,},};pubtype
NLP常见任务专题介绍（3）-垂直领域的聊天机器人搭建详细教程 AI专题精讲大模型专题系列自然语言处理机器人人工智能
一、整体流程构建垂直领域的聊天机器人需要结合特定行业的需求，采用自然语言处理和机器学习等技术。以下是一个典型的构建流程及相关技术实现：需求分析：明确机器人需要解决的问题范围和功能，例如客户服务、信息查询等。数据收集与预处理：数据收集：从行业相关的网站、论坛、数据库等渠道获取大量专业领域的文本数据。数据清洗：去除广告、无意义回复等噪声数据，确保数据质量。数据标注：对文本进行意图识别和实体识别的标注，
iOS 18 系统功能解析目录蓝鲸忘了海 IOS 1-18系统功能解析 ios cocoa macos
iOS18系统功能解析目录iOS18系统功能解析引言第一部分：iOS18系统架构全解析1.1全新系统设计理念1.2核心架构与硬件协同1.3安全架构与隐私保护1.4跨平台生态协同第二部分：用户界面与交互体验的革新2.1全新视觉设计2.2自定义UI与多任务切换2.3通知中心与交互体验2.4动态交互动画与手势识别第三部分：人工智能与机器学习的深度整合3.1新一代智能助手3.2CoreML与机器学习框架进
基于 DeepSeek 的自动化运维（适合企业降本增效） Real Man★ 运维自动化
基于DeepSeek的自动化运维解决方案DeepSeek凭借其强大的AI能力（如自然语言处理、时序预测、异常检测），可显著提升运维效率，实现从监控告警到故障自愈的全流程自动化。以下是结合企业级场景的实战方案：一、核心应用场景与实现路径智能监控与告警日志分析：使用DeepSeek-NLP模型自动解析日志，提取关键错误模式（如OutOfMemory、Timeout）。python复制fromdeeps
Chebykan wx 文章阅读やっはろ深度学习
文献筛选[1]神经网络：全面基础[2]通过sigmoid函数的超层叠近似[3]多层前馈网络是通用近似器[5]注意力是你所需要的[6]深度残差学习用于图像识别[7]视觉化神经网络的损失景观[8]牙齿模具点云补全通过数据增强和混合RL-GAN[9]强化学习：一项调查[10]使用PySR和SymbolicRegression.jl的科学可解释机器学习[11]Z.Liu,Y.Wang,S.Vaidya,F
人工智能AI通用分级标准方法魔王阿卡纳兹 IT杂谈人工智能通用分级分类标准
人工智能（AI）的通用分级标准在近年来得到了广泛关注和研究，不同的机构和组织提出了多种分级框架，以帮助理解和评估AI的发展水平。以下是对人工智能通用分级标准的详细分析：1.OpenAI的五级分级标准OpenAI于2024年7月发布了通用人工智能（AGI）的五级分级标准，旨在追踪大型语言模型在AGI方面的进展。具体分级如下：第一级：聊天机器人具备语言对话能力的人工智能，如ChatGPT，能够进行基本
【Python】构建智能语音助手：使用Python实现语音识别与合成的全面指南蒙娜丽宁 Python杂谈 python 语音识别开发语言
随着人工智能技术的迅猛发展，语音助手已成为人们日常生活中不可或缺的一部分。从智能手机到智能家居设备，语音交互提供了便捷高效的人机交互方式。本文旨在全面介绍如何利用Python编程语言及其强大的库——SpeechRecognition和gTTS，构建一个基础但功能完备的语音助手。文章首先概述了语音识别与合成的基本原理和关键技术，随后详细讲解了如何安装和配置必要的开发环境。通过丰富的代码示例和详细的中
机器学习专栏博文汇总 python游乐园机器学习机器学习人工智能合集
本篇汇集了Python游乐园中机器学习专栏博文，会持续更新，需要的小伙伴可以收藏一下Python机器学习实战：基于不同机器学习算法的鸢尾花数据集分析机器学习常见问题：过拟合及其处理方式结构化数据和非结构化数据的区别是什么如何选择合适的机器学习算法来处理非结构化数据可用于文本分析的机器学习算法都有哪些Python机器学习实战：遗传算法机器学习基础：什么是启发式算法机器学习中常用的调节参数的方法（附P
智慧农业平台与 DeepSeek 大模型的深度融合 jingwang-cs 人工智能后端
在数字化浪潮席卷全球的今天，农业领域正迎来一场深刻的变革。智慧农业，作为农业现代化的重要发展方向，正借助人工智能、大数据等前沿技术，实现从传统到现代的跨越。本文将为您详细介绍智慧农业领域的新趋势，以及智慧农业平台如何携手DeepSeek大模型，赋能农业数字化转型，引领农业迈向新时代。智慧农业的新趋势：拥抱DeepSeek大模型智慧农业的发展离不开技术创新的推动。近期，DeepSeek大模型在农业领
EasyExcel 使用详解与示例 clownAdam Java easyExcel easyexcel java java操作EasyExcel
EasyExcel详解1.简介EasyExcel是阿里巴巴开源的一款基于Java的Excel操作工具，专注于高性能、低内存占用的Excel读写。相比ApachePOI，EasyExcel在处理大数据量时表现更优，尤其适合处理百万行级别的Excel文件。2.主要特性高性能：采用流式读写模型，内存占用低，适合大数据量处理。易用性：API设计简洁，支持链式调用。功能丰富：支持Excel的读写、样式设置、
医院DEEPSEEK辅助应用 cainiaojunshi 智慧城市
一、背景介绍1.1国家政策支持《卫生健康行业人工智能应用场景参考指引》《“十四五”全民健康信息化规划》《关于进一步完善医疗卫生服务体系的意见》的发布。明确了84个AI在医疗健康领域的应用场景，涵盖了预防、诊断、治疗、康复等全流程。涉及医疗服务管理、基层公卫服务、健康产业发展以及医学教学科研等多个关键领域‌。国家层面明确将人工智能作为医疗领域新质生产力的核心驱动力，推动AI与临床诊疗、医院管理深度融
解读Servlet原理篇二---GenericServlet与HttpServlet 周凡杨 java HttpServlet 源理 GenericService 源码
在上一篇《解读Servlet原理篇一》中提到，要实现javax.servlet.Servlet接口（即写自己的Servlet应用），你可以写一个继承自javax.servlet.GenericServletr的generic Servlet ，也可以写一个继承自java.servlet.http.HttpServlet的HTTP Servlet（这就是为什么我们自定义的Servlet通常是exte
MySQL性能优化 bijian1013 数据库 mysql
性能优化是通过某些有效的方法来提高MySQL的运行速度，减少占用的磁盘空间。性能优化包含很多方面，例如优化查询速度，优化更新速度和优化MySQL服务器等。本文介绍方法的主要有： a.优化查询 b.优化数据库结构
ThreadPool定时重试 dai_lm java ThreadPool thread timer timertask
项目需要当某事件触发时，执行http请求任务，失败时需要有重试机制，并根据失败次数的增加，重试间隔也相应增加，任务可能并发。由于是耗时任务，首先考虑的就是用线程来实现，并且为了节约资源，因而选择线程池。为了解决不定间隔的重试，选择Timer和TimerTask来完成 package threadpool; public class ThreadPoolTest {
Oracle 查看数据库的连接情况周凡杨 sql oracle 连接
首先要说的是，不同版本数据库提供的系统表会有不同，你可以根据数据字典查看该版本数据库所提供的表。 select * from dict where table_name like '%SESSION%'; 就可以查出一些表，然后根据这些表就可以获得会话信息 select sid,serial#,status,username,schemaname,osuser,terminal,ma
类的继承朱辉辉33 java
类的继承可以提高代码的重用行，减少冗余代码；还能提高代码的扩展性。Java继承的关键字是extends 格式:public class 类名（子类）extends 类名（父类）{ } 子类可以继承到父类所有的属性和普通方法，但不能继承构造方法。且子类可以直接使用父类的public和 protected属性，但要使用private属性仍需通过调用。子类的方法可以重写，但必须和父类的返回值类
android 悬浮窗特效肆无忌惮_ android
最近在开发项目的时候需要做一个悬浮层的动画，类似于支付宝掉钱动画。但是区别在于，需求是浮出一个窗口，之后边缩放边位移至屏幕右下角标签处。效果图如下：一开始考虑用自定义View来做。后来发现开线程让其移动很卡，ListView+动画也没法精确定位到目标点。后来想利用Dialog的dismiss动画来完成。自定义一个Dialog后，在styl
hadoop伪分布式搭建林鹤霄 hadoop
要修改4个文件 1: vim hadoop-env.sh 第九行 2: vim core-site.xml <configuration> &n
gdb调试命令 aigo gdb
原文：http://blog.csdn.net/hanchaoman/article/details/5517362 一、GDB常用命令简介 r run 运行.程序还没有运行前使用 c cuntinue
Socket编程的HelloWorld实例 alleni123 socket
public class Client { public static void main(String[] args) { Client c=new Client(); c.receiveMessage(); } public void receiveMessage(){ Socket s=null; BufferedRea
线程同步和异步百合不是茶线程同步异步
多线程和同步 : 如进程、线程同步，可理解为进程或线程A和B一块配合，A执行到一定程度时要依靠B的某个结果，于是停下来，示意B运行；B依言执行，再将结果给A；A再继续操作。所谓同步，就是在发出一个功能调用时，在没有得到结果之前，该调用就不返回，同时其它线程也不能调用这个方法多线程和异步:多线程可以做不同的事情,涉及到线程通知 &
JSP中文乱码分析 bijian1013 java jsp 中文乱码
在JSP的开发过程中，经常出现中文乱码的问题。首先了解一下Java中文问题的由来： Java的内核和class文件是基于unicode的，这使Java程序具有良好的跨平台性，但也带来了一些中文乱码问题的麻烦。原因主要有两方面，
js实现页面跳转重定向的几种方式 bijian1013 JavaScript 重定向
js实现页面跳转重定向有如下几种方式：一.window.location.href <script language="javascript"type="text/javascript"> window.location.href="http://www.baidu.c
【Struts2三】Struts2 Action转发类型 bit1129 struts2
在【Struts2一】 Struts Hello World http://bit1129.iteye.com/blog/2109365中配置了一个简单的Action，配置如下 <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts Configurat
【HBase十一】Java API操作HBase bit1129 hbase
Admin类的主要方法注释： 1. 创建表 /** * Creates a new table. Synchronous operation. * * @param desc table descriptor for table * @throws IllegalArgumentException if the table name is res
nginx gzip ronin47 nginx gzip
Nginx GZip 压缩 Nginx GZip 模块文档详见：http://wiki.nginx.org/HttpGzipModule 常用配置片段如下： gzip on; gzip_comp_level 2; # 压缩比例，比例越大，压缩时间越长。默认是1 gzip_types text/css text/javascript; # 哪些文件可以被压缩 gzip_disable &q
java-7.微软亚院之编程判断俩个链表是否相交给出俩个单向链表的头指针，比如 h1 ， h2 ，判断这俩个链表是否相交 bylijinnan java
public class LinkListTest { /** * we deal with two main missions: * * A. * 1.we create two joined-List(both have no loop) * 2.whether list1 and list2 join * 3.print the join
Spring源码学习-JdbcTemplate batchUpdate批量操作 bylijinnan java spring
Spring JdbcTemplate的batch操作最后还是利用了JDBC提供的方法，Spring只是做了一下改造和封装 JDBC的batch操作： String sql = "INSERT INTO CUSTOMER " + "(CUST_ID, NAME, AGE) VALUES (?, ?, ?)";
[JWFD开源工作流]大规模拓扑矩阵存储结构最新进展 comsci 工作流
生成和创建类已经完成,构造一个100万个元素的矩阵模型,存储空间只有11M大,请大家参考我在博客园上面的文档"构造下一代工作流存储结构的尝试",更加相信的设计和代码将陆续推出......... 竞争对手的能力也很强.......,我相信..你们一定能够先于我们推出大规模拓扑扫描和分析系统的....
base64编码和url编码 cuityang base64 url
import java.io.BufferedReader; import java.io.IOException; import java.io.InputStreamReader; import java.io.PrintWriter; import java.io.StringWriter; import java.io.UnsupportedEncodingException;
web应用集群Session保持 dalan_123 session
关于使用 memcached 或redis 存储 session ，以及使用 terracotta 服务器共享。建议使用 redis，不仅仅因为它可以将缓存的内容持久化，还因为它支持的单个对象比较大，而且数据类型丰富，不只是缓存 session，还可以做其他用途，一举几得啊。1、使用 filter 方法存储这种方法比较推荐，因为它的服务器使用范围比较多，不仅限于tomcat ，而且实现的原理比较简
Yii 框架里数据库操作详解-[增加、查询、更新、删除的方法 'AR模式'] dcj3sjt126com 数据库
public function getMinLimit () { $sql = "..."; $result = yii::app()->db->createCo
solr StatsComponent（聚合统计） eksliang solr聚合查询 solr stats
StatsComponent 转载请出自出处：http://eksliang.iteye.com/blog/2169134 http://eksliang.iteye.com/ 一、概述 Solr可以利用StatsComponent 实现数据库的聚合统计查询，也就是min、max、avg、count、sum的功能二、参数
百度一道面试题 greemranqq 位运算百度面试寻找奇数算法 bitmap 算法
那天看朋友提了一个百度面试的题目：怎么找出{1,1,2,3,3,4,4,4,5,5,5,5} 找出出现次数为奇数的数字. 我这里复制的是原话，当然顺序是不一定的，很多拿到题目第一反应就是用map,当然可以解决，但是效率不高。还有人觉得应该用算法xxx,我是没想到用啥算法好...！还有觉得应该先排序... 还有觉
Spring之在开发中使用SpringJDBC ihuning spring
在实际开发中使用SpringJDBC有两种方式： 1. 在Dao中添加属性JdbcTemplate并用Spring注入； JdbcTemplate类被设计成为线程安全的，所以可以在IOC 容器中声明它的单个实例，并将这个实例注入到所有的 DAO 实例中。JdbcTemplate也利用了Java 1.5 的特定(自动装箱，泛型，可变长度
JSON API 1.0 核心开发者自述 | 你所不知道的那些技术细节 justjavac json
2013年5月，Yehuda Katz 完成了JSON API(英文，中文) 技术规范的初稿。事情就发生在 RailsConf 之后，在那次会议上他和 Steve Klabnik 就 JSON 雏形的技术细节相聊甚欢。在沟通单一 Rails 服务器库—— ActiveModel::Serializers 和单一 JavaScript 客户端库——&
网站项目建设流程概述 macroli 工作
一.概念网站项目管理就是根据特定的规范、在预算范围内、按时完成的网站开发任务。二.需求分析项目立项　　我们接到客户的业务咨询，经过双方不断的接洽和了解，并通过基本的可行性讨论够，初步达成制作协议，这时就需要将项目立项。较好的做法是成立一个专门的项目小组，小组成员包括：项目经理，网页设计，程序员，测试员，编辑/文档等必须人员。项目实行项目经理制。客户的需求说明书　　第一步是需
AngularJs 三目运算表达式判断 qiaolevip 每天进步一点点学习永无止境众观千象 AngularJS
事件回顾：由于需要修改同一个模板，里面包含2个不同的内容，第一个里面使用的时间差和第二个里面名称不一样，其他过滤器，内容都大同小异。希望杜绝If这样比较傻的来判断if-show or not，继续追究其源码。 var b = "{{", a = "}}"; this.startSymbol = function(a) {
Spark算子：统计RDD分区中的元素及数量 superlxw1234 spark spark算子 Spark RDD分区元素
关键字：Spark算子、Spark RDD分区、Spark RDD分区元素数量 Spark RDD是被分区的，在生成RDD时候，一般可以指定分区的数量，如果不指定分区数量，当RDD从集合创建时候，则默认为该程序所分配到的资源的CPU核数，如果是从HDFS文件创建，默认为文件的Block数。可以利用RDD的mapPartitionsWithInd
Spring 3.2.x将于2016年12月31日停止支持 wiselyman Spring 3
Spring 团队公布在2016年12月31日停止对Spring Framework 3.2.x（包含tomcat 6.x）的支持。在此之前spring团队将持续发布3.2.x的维护版本。请大家及时准备及时升级到Spring
fis纯前端解决方案fis-pure zccst JavaScript
作者：zccst FIS通过插件扩展可以完美的支持模块化的前端开发方案，我们通过FIS的二次封装能力，封装了一个功能完备的纯前端模块化方案pure。 1，fis-pure的安装 $ fis install -g fis-pure $ pure -v 0.1.4 2，下载demo到本地 git clone https://github.com/hefangshi/f