HyperAI超神经

信息检索、路径规划、电子商务，KDD 的战场有哪些？

By 超神经

内容提要：数据挖掘领域顶级国际会议 KDD 2020 即将在下周拉开序幕。今年提交的 2035 篇论文中，共 338 篇被接受。其中，国内科技大厂 BAT、滴滴、华为等表现亮眼。

关键词：KDD 2020 上榜论文

一年一度的国际数据挖掘与知识发现大会 ACM SIGKDD 2020（Conference on Knowledge Discovery and Data Mining，简称 KDD），于 8 月 23 日至 27 日在线上举办。

原定于美国圣地亚哥举办，但因疫情改为线上

随着数据库技术的发展、数据的不断积累，数据挖掘领域也得到越来越多的关注。

KDD 近年来的投稿量，也以肉眼可见的速度在增长，从 2016 年的 1115 篇，增长到今年的 2035 篇。在这些论文中，华人的贡献也越来越大，成绩十分亮眼。

KDD 第 26 载，华人科研实力逐年上升

KDD 始于 1995 年，每年一届，由 ACM 的数据挖掘及知识发现专委会（SIGKDD）主办，被 CCF（中国计算机协会）推荐为 A 类国际会议，有着数据挖掘领域「世界杯」之称。

作为世界数据挖掘领域最高级别的国际会议，KDD 的论文接收率出了名的严格，每年的接受率不超过 20%，今年也不例外。

5 月 25 日，KDD 2020 官方发布了接收论文，今年一共有 1279 篇论文提交至 research track（面向研究界的学术论文），共 216 篇被接受，因此接受率为 16.8%。

提交至 Applied Data Science track（应用数据科学方向，即面向工业界的实践赛道）的论文有 756 篇，接受 121 篇，接受率为 16%。

今年已是 KDD 的第 26 届，根据论文发表数、获奖情况等方面的统计数据，华人近年来在 KDD 的参与度逐年上升，表现越来越强劲，入选论文越来越多，而且摘走不少奖项。

过去几年，KDD 领域最有影响力的 21 位代表人物

其中，华人共有 13 位（数据统计于 2017 年）

国内科技大厂近年来在 KDD 上的成就也越来越亮眼。

据统计，2018 年 BAT 三家大厂一共发表了 12 篇文章，而今年，仅阿里巴巴一家就发表了 25 篇论文，腾讯共发表 10 篇，百度发表 9 篇，此外还有滴滴、华为、京东各发表 6 篇。

投稿排名前十的机构排名

阿里、腾讯、百度分别为第一、第七和第八名

KDD 2020：大厂的战场在哪里？

我们将国内大厂被接受的论文，按应用场景分类整理，供大家学习与参考。其中部分论文已经发表至 arXiv，可以先睹为快了。

信息检索 《淘宝推荐的特权特征提炼》

单位：阿里巴巴

摘要：特征在电子商务预测任务中起着重要作用。为了保证离线训练和在线发球的一致性，我们通常利用两者相同的特征。然而，这种一致性又忽略了一些区别性特征。例如，在估算转化率(CVR)(即用户点击该商品后购买该商品的可能性)时，诸如商品详细页面上的停留时间等特性提供了信息。然而，CVR 预测应在点击发生之前进行在线排名。我们将区别性的但只能在训练中使用的特征定义为特权特征。基于连接训练和推理之间差距的精馏技术，本文提出了特征精馏(PFD)算法。我们对淘宝推荐的两个基本预测任务进行了实验，即粗粒度排名的点进率和细粒度排名的 CVR。通过提取 CTR 服务期间被禁止的互动特性和 CVR 的事后特性，我们在它们强大的基线上取得了显著的改进。在联机 A/B 测试期间，点击度量在点击率任务中提高了 + 5.0% 。在 CVR 任务中，转换度量提高了2.3% 。此外，通过解决 PFD 训练的几个问题，我们获得了可比的训练速度作为基线，没有任何蒸馏。

论文地址：

https://arxiv.org/abs/1907.05171

信息检索 《可控多兴趣推荐框架》

单位：阿里巴巴

摘要：近年来，随着深度学习技术的飞速发展，神经网络在电子商务推荐系统中得到了广泛的应用。我们将推荐系统推荐问题形式化为一个顺序推荐问题，旨在预测用户可能与之交互的下一个项目。最近的工作通常从用户的行为序列给出一个整体嵌入。然而，一个统一的用户嵌入不能反映用户在一段时间内的多重兴趣。在本文中，我们提出了一种新的可控多兴趣框架，称为 ComiRec 的顺序推荐。我们的多兴趣模块从用户行为序列中获取多种兴趣，可以用于从大规模的项目池中检索候选项。然后将这些项目输入一个聚合模块，以获得总体推荐信息。聚合模块利用可控因子来平衡推荐的准确性和多样性。我们对亚马逊和淘宝这两个真实世界的数据集进行了序贯推荐实验。实验结果表明，我们的框架比最先进的模型获得了显著的改进。我们的框架也已经成功部署在阿里巴巴的离线分布式云平台上。

论文地址：

https://arxiv.org/abs/2005.09347

信息检索 《一种基于贝叶斯图

卷积神经网络的精确多样推荐框架》

单位：华为

摘要：在推荐系统中，准确学习用户和物品的表达是非常重要的课题。随着图卷积网络的广泛研究和应用，将图卷积网络应用于推荐系统越来越受到关注。现有基于图的推荐模型都将观测到的用户-物品交互图当做用户和物品之间的 ground-truth。但是，在推荐系统场景中，这种设置并不总是合理。例如，这种设置会将交互图中没有连边的交互当做负例，而这种未被观测到的交互可能是未来的潜在交互；另一方面，有一些观测到的连边也可能是不真实的或者是噪声带来的。为了解决这个问题，我们在这个工作里用贝叶斯图卷积网络 BGCN 去建模用户-物品交互图中的不确定性。

我们为训练过程提出了一个详细的 BPR 损失函数，也详细讨论了如何在我们的模型下做预测。我们在四个公开数据上进行验证，我们的 BGCN 模型在各个评价指标上均好于现有基于图的推荐模型。我们在产品数据集上也进行了验证，发现 BGCN 模型精度同样有所提升。此外我们还发现，我们的 BGCN 模型的推荐结果同时兼顾了准确性和多样性，而在「冷启动」用户的推荐效果会更加显著。

链接地址：

https://zhuanlan.zhihu.com/p/142812078

路径规划 《Polestar：一个智能、

高效、全国性的公共交通路径引擎》

单位：百度

摘要：公共交通在人们的日常生活中扮演着重要的角色。事实证明，公共交通比其他任何形式的交通都更环保，更有效率，更经济。然而，由于交通网络日益扩大和出行情况更加复杂，人们很难通过公共交通系统有效地找到从一个地方到另一个地方的最佳路线。为此，在本文中，我们提出了北极星，一个智能和有效的公共交通路线的数据驱动引擎。具体来说，我们首先提出了一种新的公共交通图(PTG)模型的公共交通系统的各种出行费用，如时间或距离。然后，我们引入了一种通用的路由搜索算法和一种有效的站点绑定方法来有效生成候选路由。在此基础上，我们提出了一个双路径候选路径排序模型来捕获动态旅行情境下的用户偏好。最后，在两个实际数据集上的实验证明了北极星在效率和有效性方面的优势。事实上，在2019年初，北极星已经部署在百度地图上，百度地图是世界上最大的地图服务之一。到目前为止，北极星已经为超过330个城市提供服务，每天回答超过1亿个查询，并且实现了用户点击率的显著提高。

论文地址：

https://arxiv.org/abs/2007.07195

路径规划 《混合时空图卷积网络：

利用导航数据改进流量预测》

单位：阿里巴巴

摘要：由于在线导航服务，拼车和智慧城市项目的普及，交通预测最近引起了越来越多的兴趣。由于道路交通的非平稳性，缺乏上下文信息会从根本上限制预测的准确性。为了解决此问题，我们提出了混合时空图卷积网络（H-STGCN），该网络能够通过利用即将到来的交通量数据来“推断”未来的旅行时间。具体来说，我们提出了一种从在线导航引擎获取即将到来的流量的算法。利用分段线性流量-密度关系，一种新颖的变压器结构将即将到来的体积转换为等效的行进时间。我们将此信号与常用的旅行时间信号相结合，然后应用图卷积来捕获空间依赖性。特别是，我们构造了一个复合邻接矩阵，该矩阵反映了先天交通的接近程度。我们对现实世界的数据集进行了广泛的实验。结果表明，H-STGCN在各种指标上均明显优于最新方法，特别是在预测非重复性拥塞方面。

论文地址：

https://arxiv.org/abs/2006.12715

路径规划 《共享单车经济下：

大规模团队竞赛的个体处理效果预测》

单位：滴滴

摘要：为了最大限度地提高顺序推荐中的累积用户参与度（例如，累积点击次数），通常需要权衡两个潜在冲突的目标，即追求更高的即时用户参与度（例如，点击率）并鼓励用户浏览（即，更多项目）。现有的作品经常单独研究这两个任务，因此往往导致次优的结果。在本文中，我们从在线优化角度研究了此问题，并提出了一个灵活实用的框架来明确权衡较长的用户浏览时间和较高的即时用户参与度。具体来说，通过将项目视为行动，将用户的请求视为状态，将用户的离开视为吸收状态，我们将每个用户的行为公式化为个性化的马尔可夫决策过程（MDP），从而将最大化累积用户参与度的问题简化为随机的最短路径（SSP）问题。同时，通过立即的用户参与和退出概率估计，表明可以通过动态编程有效地解决 SSP 问题。在现实世界数据集上的实验证明了该方法的有效性。此外，此方法已部署在大型电子商务平台上，累计点击次数提高了 7％以上。

论文地址：

https://aiwei.me/files/kdd2020-ye.pdf

消费服务 《连续推荐中最大化

累积用户参与度：在线优化视角》

单位：阿里巴巴

摘要：为了最大化顺序推荐中的累积用户参与度（比如累积点击次数），通常需要权衡两个潜在冲突的目标，即追求更高的即时用户参与度（比如点击率）和鼓励用户浏览（即更多的项目暴露）。现有研究经常将这两项任务分开研究，因此往往会导致次优结果。

在本文中，我们从在线优化角度研究了此问题，并提出了一种灵活实用的框架，来明确权衡较长的用户浏览时间和较高的即时用户参与度。具体来说，通过将项目视为动作，将用户的请求视为状态，将用户的离开视为吸收状态，我们将每个用户的行为公式化为个性化的马尔可夫决策过程（MDP），并且将用户累计参与最大化问题简化为一个随机最短路径(SSP)问题。同时，通过估计即时用户参与和退出概率，证明了动态规划可以有效地解决SSP问题。我们在真实数据集上的实验证明了该方法的有效性。此外，此方法已部署在大型电子商务平台上，累计点击次数提高了 7％以上。

论文地址：

https://arxiv.org/pdf/2006.04520.pdf

消费服务 《打造面向客户服务的

智能聊天机器人：学会适时响应》

单位：滴滴

摘要：

近年来，智能聊天机器人已广泛应用于客户服务领域。聊天机器人与客户保持流畅对话的主要挑战之一，是如何在适当的时间做出回应。然而，大多数先进的聊天机器人都遵循逐个交互的方案。此类聊天机器人在每次客户发出语音之后都会做出响应，这在某些情况下会导致不适当的响应并误导对话过程。

在本文中，我们提出了一种多轮响应触发模型（MRTM）来解决此问题。MRTM 通过自我监督的学习方案，从客户与代理之间的大规模人机对话中学习。它利用语境与应答之间的语义匹配关系，训练语义匹配模型，通过非对称的自我注意机制获得语境中共现话语的权重。然后使用权重确定是否应响应给定的上下文。

我们对从现实世界的在线客户服务系统收集了两个对话数据集，并在此基础上进行了大量实验。结果表明，MRTM 大大优于基线。此外，我们将 MRTM 整合到滴滴的客户服务聊天机器人中。基于识别适当响应时间的能力，聊天机器人可以跨多轮对话增量地聚合信息，并在适当时间做出更智能的响应。

论文地址：

https://dl.acm.org/doi/10.1145/3394486.3403390

电子商务 《双异构图注意力网络，

提高电子商务中商店搜索的长尾性能》

单位：阿里巴巴

摘要：

《双异构图注意力网络，提高电子商务中商店搜索的长尾性能》

随着淘宝用户和店铺的巨大增长，店铺搜索面临几个特有的挑战：

1）许多商店名称不能完全表达他们所销售的商品，即用户查询和商店名称之间的语义鸿沟；

2）由于缺少用户交互，因此很难为长尾查询提供良好的搜索结果，并且很难检索与查询高度相关的长尾商店。为了解决这两个关键挑战，我们求助于图神经网络（GNN）。具体来说，我们使用商店搜索和产品搜索中的用户交互数据，提出了与两塔体系结构集成的双重异构图注意力网络（DHGAT）。首先，我们通过从用户搜索行为，用户点击行为和用户购买记录中，利用一阶和二阶接近度，在商店搜索的上下文中构建异构图。然后，将 DHGAT 设计为专注于采用查询和商店的异构邻居和同类邻居来增强自身的表示形式，从而有助于缓解长尾现象。此外，DHGAT 通过组合相关项目的标题来减轻语义鸿沟，从而丰富了查询文本和商店名称的语义。

论文地址：

https://dl.acm.org/doi/10.1145/3394486.3403393

电子商务 一种请求级保证交付的广告规划：

预测与分配

单位：腾讯

摘要：现有的广告在线投放研究，通常将服务建模为一个群体级或用户级别的供应分配问题，并假设搜索结果可用且合同已签订，因此将重点放在搜索最佳分配以进行在线服务。而这些技术不足以满足当今行业趋势的需求：

1）广告商追求更精确的定位，这不仅需要用户级属性，还需要请求级属性；

2）用户喜欢更友好的广告服务，这会带来更多的投放限制；

3）发行商收入增长的瓶颈不仅在于广告服务，还在于预测准确性和销售策略。

由于请求级模型的规模比群体级或用户级模型的规模大几个数量级，因此解决这些问题并非易事。

面对挑战，我们提出了一个整体设计的请求级，保证交付广告计划系统，并对包括印象预测、销售和服务在内的三个关键要素进行了精心优化。我们的系统已部署在腾讯在线保证交付广告系统中，为数十亿用户提供了将近一年的服务。对大规模真实数据的评估和已部署系统的性能均表明，我们的设计可以显著提高请求级展示预测的准确性和投放速度。

论文地址：暂未公开

医疗预测 《INPREM：一个可解释

且可信的医疗保健预测模型》

单位：腾讯

摘要：

基于历史电子健康记录建立个性化医疗的预测模型已成为一个活跃的研究领域。得益于强大的特征提取能力，深度学习方法在许多临床预测任务中取得了很好的效果。然而，由于缺乏可解释性和可信性，使其难以应用于实际的临床决策案例中。

为了解决这一问题，在本文中，我们提出了一个可解释且可信的医疗保健预测模型(interpretable and trustworthy predictive model，INPREM)。首先，INPREM 被设计为可解释性的线性模型，以实现可解释性。同时将非线性关系编码到学习权值中，用于对每次访问之间和访问内部的依赖关系进行建模。这使我们可以得到输入变量的贡献矩阵，作为预测结果的证据，并帮助医生理解模型为什么会给出这样的预测，从而使模型更具有可解释性。其次，为了可靠性，我们在模型的每个权重上放置一个随机门(遵循伯努利分布来开启或关闭)，以及一个附加分支来估计数据噪声。该模型利用蒙托卡罗采样和考虑数据噪声的目标函数，可以捕获每次预测的不确定性。反过来，捕捉到的不确定性进而让医生知道模型的置信度，从而使模型更可信。我们的经验证明，提出的 INPREM 比现有的方法有显著的优势。

论文地址：

https://dl.acm.org/doi/abs/10.1145/3394486.3403087

KDD 2020 线上大会持续报名中

KDD 2020 进行中，大会报名注册通道已开放：

https://www.kdd.org/kdd2020/#!

目前完整议程已公布，感兴趣的同学可以通过 Zoom 远程参会，学生票 50 美金。最受关注的环节之一，开幕式与颁奖典礼，将于当地时间 8 月 25 日 8:00-10:00 进行，敬请关注。

完整日程安排详见：

https://www.kdd.org/kdd2020/schedule

资料来源：

https://www.kdd.org/kdd2020/accepted-papers#ads-papers

https://www.aminer.cn/conf/kdd2020/papers

—— 完 ——

扫描二维码，加入讨论群

获得更多优质数据集

了解人工智能落地应用

关注顶会&论文

回复「读者」了解详情

更多精彩内容（点击图片阅读）

vLLM快速入门：开启高效推理与部署之旅
在如今这个人工智能飞速发展的时代，语言模型的应用已经深入到我们生活的方方面面，从智能聊天机器人到文本生成工具，都离不开强大的语言模型技术支持。而vLLM作为一个专注于高效推理和部署的开源项目，正在为研究人员和开发人员提供一种全新的解决方案，让语言模型的使用变得更加便捷、高效。初识vLLM：背景与意义vLLM（VeryLargeLanguageModelInference）是一个专注于大型语言模型推
深入解析 vLLM 分布式推理与部署策略
在当今人工智能快速发展的时代，大型语言模型（LLM）的推理和部署面临着诸多挑战，尤其是当模型规模日益庞大时，如何高效地利用硬件资源成为关键问题。vLLM作为一种强大的工具，为分布式推理和部署提供了多种策略，本文将详细探讨其相关技术和应用场景，希望能对您提供有价值的参考。分布式推理策略的选择在开始分布式推理和部署之前，明确何时采用分布式推理以及可选的策略至关重要。1.单GPU推理：如果模型能够在单个
斗鱼大数据面试题及参考答案大模型大数据攻城狮大数据大数据面试 hadoop面试 spark面试 flink面试手撕SQL 手撕代码
GC（垃圾回收）相关知识一、常见的GC收集器SerialGCSerialGC是最基本的垃圾收集器，它是单线程的。在进行垃圾收集时，会暂停所有的用户线程，直到垃圾收集完成。它的工作过程比较简单，首先标记出所有的垃圾对象，然后将它们清除。例如，在一个小型的、对响应时间要求不高的Java应用程序中，如简单的命令行工具，SerialGC可以满足垃圾收集的需求。因为这种应用程序通常没有很高的并发要求，暂停用
英伟达Triton 推理服务详解 leo0308 基础知识机器人 Triton 人工智能
1.TritonInferenceServer简介TritonInferenceServer（简称Triton，原名NVIDIATensorRTInferenceServer）是英伟达推出的一个开源、高性能的推理服务器，专为AI模型的部署和推理服务而设计。它支持多种深度学习框架和硬件平台，能够帮助开发者和企业高效地将AI模型部署到生产环境中。Triton主要用于模型推理服务化，即将训练好的模型通过
Java 大视界 -- Java 大数据机器学习模型在金融市场情绪指数构建与投资决策支持中的应用（339）青云交大数据新视界 Java 大视界 java 大数据机器学习金融情绪指数投资决策量化策略情绪分析
Java大视界--Java大数据机器学习模型在金融市场情绪指数构建与投资决策支持中的应用（339）引言：正文：一、Java构建的金融市场情绪数据采集与预处理体系1.1多源异构数据接入引擎1.2数据采集延迟测试报告1.3情绪数据预处理管道二、Java驱动的金融市场情绪指数构建模型2.1多维度情绪指数计算框架2.2情绪指数与投资决策的映射模型三、Java在金融投资决策支持中的实战应用3.1量化私募情绪
Java NLP炼金术：从词袋到深度学习，构建AI时代的语言魔方墨夶 Java学习资料人工智能 java 自然语言处理
一、JavaNLP的“三剑客”：框架与工具链1.1ApacheOpenNLP：传统NLP的“瑞士军刀”目标：用词袋模型实现文本分类与实体识别代码实战：文档分类器的“炼成术”//OpenNLP文档分类器（基于词袋模型）importopennlp.tools.doccat.*;importopennlp.tools.util.*;publicclassDocumentClassifier{//训练模型
PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
数字孪生技术为UI前端注入新活力：实现产品设计的沉浸式体验 ui设计前端开发老司机 ui
hello宝子们...我们是艾斯视觉擅长ui设计、前端开发、数字孪生、大数据、三维建模、三维动画10年+经验!希望我的分享能帮助到您!如需帮助可以评论关注私信我们一起探讨!致敬感谢感恩!一、引言：从“平面交互”到“沉浸体验”的UI革命当用户在电商APP中翻看3D家具模型却无法感知其与自家客厅的匹配度，当设计师在2D屏幕上绘制汽车内饰却难以预判实际乘坐体验——传统UI设计的“平面化、静态化、割裂感”
AI音乐模拟器：AIGC时代的智能音乐创作革命 lauo 人工智能 AIGC 开源前端机器人
AI音乐模拟器：AIGC时代的智能音乐创作革命引言：AIGC浪潮下的音乐创作新范式在数字化转型的浪潮中，人工智能生成内容（AIGC）正在重塑各个创意领域。音乐产业作为创意经济的重要组成部分，正经历着前所未有的变革。据最新市场研究数据显示，全球AI音乐市场规模预计将从2023年的5.8亿美元增长到2030年的26.8亿美元，年复合增长率高达24.3%。这一快速增长的市场背后，是AI音乐技术正在打破传
LangChain中的向量数据库接口－Weaviate 洪城叮当 langchain 数据库经验分享笔记交互人工智能知识图谱
文章目录前言一、原型定义二、代码解析1、add_texts方法1.1、应用样例2、from_texts方法2.1、应用样例3、similarity_search方法3.1、应用样例三、项目应用1、安装依赖2、引入依赖3、创建对象4、添加数据5、查询数据总结前言 Weaviate是一个开源的向量数据库，支持存储来自各类机器学习模型的数据对象和向量嵌入，并能无缝扩展至数十亿数据对象。它提供存储文档嵌
深度学习模型表征提取全解析 ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 深度学习人工智能 python embedding 语言模型
模型内部进行表征提取的方法在自然语言处理（NLP）中，“表征（Representation）”指将文本（词、短语、句子、文档等）转化为计算机可理解的数值形式（如向量、矩阵），核心目标是捕捉语言的语义、语法、上下文依赖等信息。自然语言表征技术可按“静态/动态”“有无上下文”“是否融入知识”等维度划分一、传统静态表征（无上下文，词级为主）这类方法为每个词分配固定向量，不考虑其在具体语境中的含义（无法解
提升企业级数据处理效率！TDengine 四个集群优化点详解 TDengine （老段） TDengine 运维大数据数据库物联网时序数据库服务器运维 tdengine
为了帮助企业更好地进行大数据处理，我们在此前TDengine3.x系列版本中进行了几项与集群相关的优化和新功能开发，以提升集群的稳定性和在异常情况下的恢复能力。这些优化包括clusterID隔离、leaderrebalance、raftlearner和restorednode。本文将对这几项重要优化进行详细阐述，以解答企业在此领域的疑问，并帮助大家更好地应对相关挑战。clusterID隔离问题fi
视频分析：让AI看懂动态画面随机森林404 计算机视觉音视频人工智能 microsoft
引言：动态视觉理解的革命在数字信息爆炸的时代，视频已成为最主要的媒介形式。据统计，每分钟有超过500小时的视频内容被上传到YouTube平台，而全球互联网流量的82%来自视频数据传输。面对如此海量的视频内容，传统的人工处理方式已无法满足需求，这正是人工智能视频分析技术大显身手的舞台。视频分析技术赋予机器"看懂"动态画面的能力，使其能够自动理解、解释甚至预测视频中的内容，这一突破正在彻底改变我们与视
【Qualcomm】高通SNPE框架简介、下载与使用 Jackilina_Stone 人工智能 Qualcomm SNPE
目录一高通SNPE框架1SNPE简介2QNN与SNPE3Capabilities4工作流程二SNPE的安装与使用1下载2Setup3SNPE的使用概述一高通SNPE框架1SNPE简介SNPE（SnapdragonNeuralProcessingEngine），是高通公司推出的面向移动端和物联网设备的深度学习推理框架。SNPE提供了一套完整的深度学习推理框架，能够支持多种深度学习模型，包括Pytor
Python的科学计算库NumPy（一） linlin_1998 python numpy 开发语言
NumPy(NumericalPython)是Python中最基础、最重要的科学计算库之一，提供了高性能的多维数组（ndarray）对象和大量数学函数，是许多数据科学、机器学习库（如Pandas、SciPy、TensorFlow等）的基础依赖。1.创建一个numpy里面的一维数组importnumpyasnp###通过array方法创建一个ndarrayarray1=np.array([1,2,3
深度学习篇---昇腾NPU&CANN 工具包 Atticus-Orion 上位机知识篇图像处理篇深度学习篇深度学习人工智能 NPU 昇腾 CANN
介绍昇腾NPU是华为推出的神经网络处理器，具有强大的AI计算能力，而CANN工具包则是面向AI场景的异构计算架构，用于发挥昇腾NPU的性能优势。以下是详细介绍：昇腾NPU架构设计：采用达芬奇架构，是一个片上系统，主要由特制的计算单元、大容量的存储单元和相应的控制单元组成。集成了多个CPU核心，包括控制CPU和AICPU，前者用于控制处理器整体运行，后者承担非矩阵类复杂计算。此外，还拥有AICore
深度学习图像分类数据集—桃子识别分类 AI街潜水的八角深度学习图像数据集深度学习分类人工智能
该数据集为图像分类数据集，适用于ResNet、VGG等卷积神经网络，SENet、CBAM等注意力机制相关算法，VisionTransformer等Transformer相关算法。数据集信息介绍：桃子识别分类：['B1','M2','R0','S3']训练数据集总共有6637张图片，每个文件夹单独放一种数据各子文件夹图片统计:·B1:1601张图片·M2:1800张图片·R0:1601张图片·S3:
法律科技领域人工智能代理构建的十个经验教训，一位人工智能工程师通过构建、部署和维护智能代理的经验教训来优化法律工作流程的历程。知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 ai
目录介绍什么是代理人？为什么它对法律如此重要？法律技术中代理用例示例-合同审查代理-法律研究代理在LegalTech中使用代理的十个教训-教训1：即使代理很酷，它们也不能解决所有问题-教训2：选择最适合您用例的框架-教训3：能够快速迭代不同的模型-教训4：从简单开始，必要时扩展-教训5：使用跟踪解决方案；您将需要它-教训6：确保跟踪成本，代理循环可能很昂贵-教训7：将控制权交给最终用户（人在环路中
Llama-Omni会说话的人工智能“语音到语音LLM” 利用低延迟、高质量语音转语音 AI 彻底改变对话方式（教程含源码）知识大胖 NVIDIA GPU和大语言模型开发教程 llama 人工智能 nvidia llm
介绍“单靠技术是不够的——技术与文科、人文学科的结合，才能产生让我们心花怒放的成果。”——史蒂夫·乔布斯近年来，人机交互领域发生了重大变化，尤其是随着ChatGPT、GPT-4等大型语言模型(LLM)的出现。虽然这些模型主要基于文本，但人们对语音交互的兴趣日益浓厚，以使人机对话更加无缝和自然。然而，实现语音交互而不受语音转文本处理中常见的延迟和错误的影响仍然是一个挑战。关键字：Llama-Omni
什么是热力学计算？它如何帮助人工智能发展？知识大胖 NVIDIA GPU和大语言模型开发教程人工智能量子计算
现代计算的基础是晶体管，这是一种微型电子开关，可以用它构建逻辑门，从而创建CPU或GPU等复杂的数字电路。随着技术的进步，晶体管变得越来越小。根据摩尔定律，集成电路中晶体管的数量大约每两年增加一倍。这种指数级增长使得计算技术呈指数级发展。然而，晶体管尺寸的缩小是有限度的。我们很快就会达到晶体管无法工作的阈值。此外，人工智能的进步使得对计算能力的需求比以往任何时候都更加迫切。根本问题是自然是随机的（
上海交大：工具增强推理agent
标题：SciMaster:TowardsGeneral-PurposeScientificAIAgentsPartI.X-MasterasFoundation-CanWeLeadonHumanity’sLastExam?来源：arXiv,2507.05241摘要人工智能代理的快速发展激发了利用它们加速科学发现的长期雄心。实现这一目标需要深入了解人类知识的前沿。因此，人类的最后一次考试（HLE）为评
微算法科技的前沿探索：量子机器学习算法在视觉任务中的革新应用 MicroTech2025 量子计算算法
在信息技术飞速发展的今天，计算机视觉作为人工智能领域的重要分支，正逐步渗透到我们生活的方方面面。从自动驾驶到人脸识别，从医疗影像分析到安防监控，计算机视觉技术展现了巨大的应用潜力。然而，随着视觉任务复杂度的不断提升，传统机器学习算法在处理大规模、高维度数据时遇到了计算瓶颈。在此背景下，量子计算作为一种颠覆性的计算模式，以其独特的并行处理能力和指数级增长的计算空间，为解决这一难题提供了新的思路。微算
中国银联豪掷1亿采购海光C86架构服务器信创新态势海光芯片 C86 国产芯片海光信息
近日，中国银联国产服务器采购大单正式敲定，基于海光C86架构的服务器产品中标，项目金额超过1亿元。接下来，C86服务器将用于支撑中国银联的虚拟化、大数据、人工智能、研发测试等技术场景，进一步提升其业务处理能力、用户服务效率和信息安全水平。作为我国重要的银行卡组织和金融基础设施，中国银联在全球183个国家和地区设有银联受理网络，境内外成员机构超过2600家，是世界三大银行卡品牌之一。此次中国银联发力
AI人工智能浪潮中文心一言的独特优势
AI人工智能浪潮中文心一言的独特优势：为什么它是中国市场的“AI主力军”？关键词：文心一言,AI大模型,中文处理,多模态融合,产业落地,安全可控,百度ERNIE摘要：在全球AI大模型浪潮中，百度文心一言（ERNIEBot）凭借“懂中文、会多模态、能落地、守规矩”的四大核心优势，成为中国市场最具竞争力的AI产品之一。本文将用“超级大脑”的比喻，从中文理解、多模态能力、产业生态融合、安全可控性四个维度
全面探索Kafka：架构、应用与流处理
Kafka：企业级消息系统与流处理平台的深度解析ApacheKafka作为分布式流处理平台，广泛应用于大数据处理和实时分析领域。本文将基于其官方文档，详细探讨Kafka的核心功能、应用场景以及如何进行有效管理。背景简介Kafka作为高吞吐量的消息系统，支持企业级的发布-订阅模式。它能够处理大量实时数据，并支持高并发读写操作。本文将依据Kafka官方文档的内容，逐层深入，从入门到高级应用，帮助读者全
Flink时间窗口详解 bxlj_jcj Flink flink 大数据
一、引言在大数据流处理的领域中，Flink的时间窗口是一项极为关键的技术，想象一下，你要统计一个电商网站每小时的订单数量。由于订单数据是持续不断产生的，这就形成了一个无界数据流。如果没有时间窗口的概念，你就需要处理无穷无尽的数据，难以进行有效的统计分析。而时间窗口的作用，就是将这无界的数据流按照时间维度切割成一个个有限的“数据块”，方便我们对这些数据进行处理和分析。比如，我们可以定义一个1小时的时
正义的算法迷宫—人工智能重构司法体系的技术悖论与文明试炼
一、法庭的数字化迁徙当美国威斯康星州法院采纳COMPAS算法评估被告再犯风险，当中国"智慧法院"系统年处理1.2亿件案件，司法体系正经历从石柱法典到代码裁判的范式革命。这场转型的核心驱动力是司法效率与公正的永恒张力：美国重罪案件平均审理周期达18个月，中国基层法官年人均结案357件（是德国同行的6倍），而算法能在0.3秒内完成百万份文书比对。人工智能渗透司法引发三重裂变：证据分析从经验推断转向数据
探索实时流处理的未来：Kafka Streams 深度指南秋或依
探索实时流处理的未来：KafkaStreams深度指南项目介绍欢迎进入KafkaStreams：实时流处理的世界！这不仅仅是一本书，更是一个通往流处理领域深层奥秘的门户。由PrashantPandey编著，这本书以ApacheKafka2.1中的KafkaStreams库为核心，为读者铺就了一条从理解基础概念到熟练掌握KafkaStreams编程的路径。无论是软件工程师、数据架构师，还是对大数据处
Elasticsearch搜索引擎存储：从原理到实践的全景解析 Python×CATIA工业智造搜索引擎 elasticsearch 大数据
引言在大数据时代，数据规模呈指数级增长，传统数据库的模糊查询、实时分析能力逐渐成为瓶颈。Elasticsearch（简称ES）凭借其分布式架构、实时搜索和灵活的数据分析能力，成为企业级搜索与存储的核心引擎。截至2025年，ES在全球日志分析、电商搜索、实时监控等场景的市场占有率超过60%。本文将从存储架构、核心技术、应用场景及优化策略四个维度，深入解析Elasticsearch的设计哲学与实践价值
JAVA基础灵静志远位运算加载 Date 字符串池覆盖
一、类的初始化顺序 1 （静态变量，静态代码块）-->（变量，初始化块）--> 构造器同一括号里的，根据它们在程序中的顺序来决定。上面所述是同一类中。如果是继承的情况，那就在父类到子类交替初始化。二、String 1 String a = "abc"; JAVA虚拟机首先在字符串池中查找是否已经存在了值为"abc"的对象，根
keepalived实现redis主从高可用 bylijinnan redis
方案说明两台机器（称为A和B），以统一的VIP对外提供服务 1.正常情况下，A和B都启动，B会把A的数据同步过来（B is slave of A） 2.当A挂了后，VIP漂移到B；B的keepalived 通知redis 执行：slaveof no one，由B提供服务 3.当A起来后，VIP不切换，仍在B上面；而A的keepalived 通知redis 执行slaveof B，开始
java文件操作大全 0624chenhong java
最近在博客园看到一篇比较全面的文件操作文章，转过来留着。 http://www.cnblogs.com/zhuocheng/archive/2011/12/12/2285290.html 转自http://blog.sina.com.cn/s/blog_4a9f789a0100ik3p.html 一.获得控制台用户输入的信息 &nbs
android学习任务不懂事的小屁孩工作
任务完成情况搞清楚带箭头的pupupwindows和不带的使用已完成熟练使用pupupwindows和alertdialog，并搞清楚两者的区别已完成熟练使用android的线程handler,并敲示例代码进行中了解游戏2048的流程，并完成其代码工作进行中-差几个actionbar 研究一下android的动画效果，写一个实例已完成复习fragem
zoom.js 换个号韩国红果果 oom
它的基于bootstrap 的 https://raw.github.com/twbs/bootstrap/master/js/transition.js transition.js模块引用顺序 <link rel="stylesheet" href="style/zoom.css"> <script src=&q
详解Oracle云操作系统Solaris 11.2 蓝儿唯美 Solaris
当Oracle发布Solaris 11时，它将自己的操作系统称为第一个面向云的操作系统。Oracle在发布Solaris 11.2时继续它以云为中心的基调。但是，这些说法没有告诉我们为什么Solaris是配得上云的。幸好，我们不需要等太久。Solaris11.2有4个重要的技术可以在一个有效的云实现中发挥重要作用：OpenStack、内核域、统一存档（UA）和弹性虚拟交换（EVS）。
spring学习——springmvc（一） a-john springMVC
Spring MVC基于模型-视图-控制器（Model-View-Controller，MVC）实现，能够帮助我们构建像Spring框架那样灵活和松耦合的Web应用程序。 1，跟踪Spring MVC的请求请求的第一站是Spring的DispatcherServlet。与大多数基于Java的Web框架一样，Spring MVC所有的请求都会通过一个前端控制器Servlet。前
hdu4342 History repeat itself-------多校联合五 aijuans 数论
水题就不多说什么了。 #include<iostream>#include<cstdlib>#include<stdio.h>#define ll __int64using namespace std;int main(){ int t; ll n; scanf("%d",&t); while(t--)
EJB和javabean的区别 asia007 bean ejb
EJB不是一般的JavaBean,EJB是企业级JavaBean,EJB一共分为3种,实体Bean,消息Bean,会话Bean,书写EJB是需要遵循一定的规范的,具体规范你可以参考相关的资料.另外,要运行EJB,你需要相应的EJB容器,比如Weblogic,Jboss等,而JavaBean不需要,只需要安装Tomcat就可以了 1.EJB用于服务端应用开发, 而JavaBeans
Struts的action和Result总结百合不是茶 struts Action配置 Result配置
一:Action的配置详解: 下面是一个Struts中一个空的Struts.xml的配置文件 <?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE struts PUBLIC &quo
如何带好自已的团队 bijian1013 项目管理团队管理团队
在网上看到博客" 怎么才能让团队成员好好干活"的评论，觉得写的比较好。原文如下：我做团队管理有几年了吧，我和你分享一下我认为带好团队的几点： 1.诚信对团队内成员，无论是技术研究、交流、问题探讨，要尽可能的保持一种诚信的态度，用心去做好，你的团队会感觉得到。 2.努力提
Java代码混淆工具 sunjing ProGuard
Open Source Obfuscators ProGuard http://java-source.net/open-source/obfuscators/proguardProGuard is a free Java class file shrinker and obfuscator. It can detect and remove unused classes, fields, m
【Redis三】基于Redis sentinel的自动failover主从复制 bit1129 redis
在第二篇中使用2.8.17搭建了主从复制，但是它存在Master单点问题，为了解决这个问题，Redis从2.6开始引入sentinel，用于监控和管理Redis的主从复制环境，进行自动failover，即Master挂了后，sentinel自动从从服务器选出一个Master使主从复制集群仍然可以工作，如果Master醒来再次加入集群，只能以从服务器的形式工作。什么是Sentine
使用代理实现Hibernate Dao层自动事务白糖_ DAO spring AOP 框架 Hibernate
都说spring利用AOP实现自动事务处理机制非常好，但在只有hibernate这个框架情况下，我们开启session、管理事务就往往很麻烦。 public void save(Object obj){ Session session = this.getSession(); Transaction tran = session.beginTransaction(); try
maven3实战读书笔记 braveCS maven3
Maven简介是什么？ Is a software project management and comprehension tool.项目管理工具是基于POM概念(工程对象模型) [设计重复、编码重复、文档重复、构建重复，maven最大化消除了构建的重复] [与XP：简单、交流与反馈；测试驱动开发、十分钟构建、持续集成、富有信息的工作区] 功能：
编程之美-子数组的最大乘积 bylijinnan 编程之美
public class MaxProduct { /** * 编程之美子数组的最大乘积 * 题目: 给定一个长度为N的整数数组，只允许使用乘法，不能用除法，计算任意N-1个数的组合中乘积中最大的一组，并写出算法的时间复杂度。 * 以下程序对应书上两种方法，求得“乘积中最大的一组”的乘积——都是有溢出的可能的。 * 但按题目的意思，是要求得这个子数组，而不
读书笔记-2 chengxuyuancsdn 读书笔记
1、反射 2、oracle年-月-日时-分-秒 3、oracle创建有参、无参函数 4、oracle行转列 5、Struts2拦截器 6、Filter过滤器(web.xml) 1、反射 (1)检查类的结构在java.lang.reflect包里有3个类Field,Method,Constructor分别用于描述类的域、方法和构造器。 2、oracle年月日时分秒 s
[求学与房地产]慎重选择IT培训学校 comsci it
关于培训学校的教学和教师的问题,我们就不讨论了,我主要关心的是这个问题培训学校的教学楼和宿舍的环境和稳定性问题我们大家都知道，房子是一个比较昂贵的东西，特别是那种能够当教室的房子... &nb
RMAN配置中通道(CHANNEL)相关参数 PARALLELISM 、FILESPERSET的关系 daizj oracle rman filesperset PARALLELISM
RMAN配置中通道(CHANNEL)相关参数 PARALLELISM 、FILESPERSET的关系转 PARALLELISM --- 我们还可以通过parallelism参数来指定同时"自动"创建多少个通道： RMAN > configure device type disk parallelism 3 ; 表示启动三个通道，可以加快备份恢复的速度。
简单排序:冒泡排序 dieslrae 冒泡排序
public void bubbleSort(int[] array){ for(int i=1;i<array.length;i++){ for(int k=0;k<array.length-i;k++){ if(array[k] > array[k+1]){
初二上学期难记单词三 dcj3sjt126com sciet
concert 音乐会 tonight 今晚 famous 有名的；著名的 song 歌曲 thousand 千 accident 事故；灾难 careless 粗心的，大意的 break 折断；断裂；破碎 heart 心（脏） happen 偶尔发生，碰巧 tourist 旅游者；观光者 science （自然）科学 marry 结婚 subject 题目；
I.安装Memcahce 1. 安装依赖包libevent Memcache需要安装libevent,所以安装前可能需要执行 Shell代码收藏代码 dcj3sjt126com redis
wget http://download.redis.io/redis-stable.tar.gz tar xvzf redis-stable.tar.gz cd redis-stable make 前面3步应该没有问题，主要的问题是执行make的时候，出现了异常。异常一： make[2]: cc: Command not found 异常原因：没有安装g
并发容器 shuizhaosi888 并发容器
通过并发容器来改善同步容器的性能，同步容器将所有对容器状态的访问都串行化，来实现线程安全，这种方式严重降低并发性，当多个线程访问时，吞吐量严重降低。并发容器ConcurrentHashMap 替代同步基于散列的Map，通过Lock控制。 &nb
Spring Security（12）——Remember-Me功能 234390216 Spring Security Remember Me 记住我
Remember-Me功能目录 1.1 概述 1.2 基于简单加密token的方法 1.3 基于持久化token的方法 1.4 Remember-Me相关接口和实现
位运算焦志广位运算
一、位运算符Ｃ语言提供了六种位运算符： & 按位与 | 按位或 ^ 按位异或 ~ 取反 << 左移 >> 右移 1. 按位与运算按位与运算符"&"是双目运算符。其功能是参与运算的两数各对应的二进位相与。只有对应的两个二进位均为1时，结果位才为1 ，否则为0。参与运算的数以补码方式出现。例如：9&am
nodejs 数据库连接 mongodb mysql liguangsong mongodb mysql node 数据库连接
1.mysql 连接 package.json中dependencies加入 "mysql":"~2.7.0" 执行 npm install 在config 下创建文件 database.js
java动态编译 olive6615 java HotSpot jvm 动态编译
在HotSpot虚拟机中，有两个技术是至关重要的，即动态编译(Dynamic compilation)和Profiling。 HotSpot是如何动态编译Javad的bytecode呢？Java bytecode是以解释方式被load到虚拟机的。HotSpot里有一个运行监视器，即Profile Monitor,专门监视
Storm0.9.5的集群部署配置优化 roadrunners 优化 storm.yaml
nimbus结点配置（storm.yaml）信息： # Licensed to the Apache Software Foundation (ASF) under one # or more contributor license agreements. See the NOTICE file # distributed with this work for additional inf
101个MySQL 的调节和优化的提示 tomcat_oracle mysql
　1. 拥有足够的物理内存来把整个InnoDB文件加载到内存中——在内存中访问文件时的速度要比在硬盘中访问时快的多。　　2. 不惜一切代价避免使用Swap交换分区 – 交换时是从硬盘读取的，它的速度很慢。　　3. 使用电池供电的RAM（注：RAM即随机存储器）。　　4. 使用高级的RAID（注：Redundant Arrays of Inexpensive Disks，即磁盘阵列
zoj 3829 Known Notation(贪心) 阿尔萨斯 ZOJ
题目链接：zoj 3829 Known Notation 题目大意：给定一个不完整的后缀表达式，要求有2种不同操作，用尽量少的操作使得表达式完整。解题思路：贪心，数字的个数要要保证比∗的个数多1，不够的话优先补在开头是最优的。然后遍历一遍字符串，碰到数字+1，碰到∗-1,保证数字的个数大于等1，如果不够减的话，可以和最后面的一个数字交换位置（用栈维护十分方便），因为添加和交换代价都是1

信息检索、路径规划、电子商务，KDD 的战场有哪些？

你可能感兴趣的:(电子商务,大数据,机器学习,人工智能,深度学习)