阿里巴巴淘系技术团队官网博客

分钟级在线深度学习在手淘信息流排序模型中的探索与实践

天下武功，无坚不摧，唯快不破。近些年，深度学习如玄铁重剑在推荐系统中无坚不摧，给搜索/推荐/广告等业务场景带来巨大的收益，而在线学习则如唯快不破的独孤九剑，也在推荐算法中以快制胜，创建巨大的业务价值。

前些年流行的FTRL等在线学习算法在深度学习中已不太适用，为此信息流推荐算法团队从2019年开始探索在线学习的下一式——在线深度学习（Online Deep Learning, ODL），在首页商品信息流全量小时级在线深度学习，使得在线排序模型可以学习到1小时前平台上的用户和商家最新流行的数据模式。2020年团队又继续探索分钟级在线深度学习，把排序模型发现平台用户和商家最新流行的数据模式的延迟降低到分钟级。

图1 在线学习应用场景：首页商品信息流（左图）, 视频信息流（右图）

在线学习的重要性

图2 首页商品信息流CTR模型时效性效果分析(日常)

图3 双十一期间首页商品信息流CTR（左图）和CVR（右图）的label mean随时间变化

图2展示了首页商品信息流CTR模型效果随着时效性的变化趋势图，其中横轴代表模型训练结束到模型在线打分的时间间隔，纵轴是AUC提升的绝对值（相对于模型训练结束到模型在线打分的时间间隔为2天的批模型）。从图中可以看着，模型的效果与模型的时效性成正相关，模型更新得越频繁，实时性越好，AUC越高，效果越好。图3展示了双十一前后用户和商品行为发生了剧烈的变化，尤其是CVR在双十一当天是预热期的5倍，同一天内不同时间段CTR和CVR也不同，传统离线批训练天级更新的模型不能技术捕获到用户和商品行为的实时变化。

从用户体验角度来讲，用户在手淘流量商品时，用户的期望是更快地找到与自己兴趣符合的商品，只要推荐系统能感知用户反馈、实时的满足用户的期望，就能提升推荐的效果。

从算法技术角度来讲，推荐系统更实时意味着推荐系统能更快更准确的表达用户最新的习惯和兴趣，以及从全局角度更快发现人群的偏好和最新的流行趋势，这两个方面分别对应了推荐系统样本特征的实时性和模型的实时性。

样本特征的实时性

样本特征的实时性包括在线系统实时计算和更新模型的输入特征，使得模型总能使用最新的特征进行预测和推荐，以及日志采集和样本构建系统实时采集用户行为并生成实时流式训练样本。其中我们把在线系统实时特征（实时行为序列、实时交叉统计特征等等）的计算和更新归类为模型结构优化的工作，不在本文介绍的工作范畴；本文着重介绍我们在实时流式样本构建和利用实时流式样本就是流式训练上的探索。

▐ 实时流式样本生成

图4 实时流式样本生成

图4展示了实时流式训练样本的生成过程，样本生成平台通过统一的Event解析对应的用户行为数据流，包括曝光曝光（PV）、点击（Click）、预售付定金（subPay）、加购（Cart）、成交（Trade）等行为；通过blink与埋点特征流以及存储在Holo上的非埋点特征等Entity进行实时join，从而生成实时样本，最后实时样本通过Swift消息队列进行存储。

▐ 延迟反馈建模

图5 CTR和CVR延迟反馈

图6 窗口Join和Retraction机制

在实时流式样本中，通常正例会延迟于负例到达，如图5所示，在首页商品信息流推荐中，CTR模型有4%的点击会在曝光10min后到达，甚至还有2%的点击会在曝光20min后到达；CVR模型中正样本延迟的问题更加严重，该问题我们称之为延迟反馈问题。

对该问题有不少研究工作，一些工作倾向于保证label的准确性而让负例长时间等待正例来解决，另一些工作倾向于保障数据的新鲜性而在负例到达时先让模型消费，然后在之后正例到来时在进行修正。

我们采用的是一种在等待更准确label与使用新鲜数据之间的折中方案，如图6所示，我们在平台上设置了一个等到窗口T，让每一个到达的负例都等待T时间，如果T时间窗口内有正例到达，则下发一条正样本，否则下发一条负样本；此外我们进一步引入Retraction机制来对T窗口之外到达的正例补发正样本，同时打上Retraction的标。

对于打上Retraction的标的补发正样本，我们采用PU Loss对其训练进行修正，核心思想就是对于这部分Retraction的样本，除了使用正样本进行梯度下降，还会对相应的负样本进行一个反向的梯度下降，抵消之前观察到为负样本对loss的影响。其中等待时间窗口T的设定对模型效果有一定的影响，通过实验来选择合适的窗口。

▐ 特征独立同分布

机器学习算法有一个独立同分布的基本假设，即模型训练的数据分布要与预测时的数据分布独立同分布。一些时间特征比如week和hour，在离线批样本中由于被充分shuffle过，使用这些特征训练出来的模型依然能保障训练和预测独立同分布，但是在实时流式训练中，样本实时顺序到达的，这类特征无法被充分shuffle，使得模型训练一直在训练同一个时刻的特征值，而预测时可能切换到下一个时刻的特征值，导致模型泛化能力差。

图6是我们实验的对同一批样本修改hour的特征值对CTR批模型和流模型预估值的影响，可以看到在流模型中使用不同的hour特征值，模型预估值波动非常大，模型对hour特征过拟合，对下一个时刻没有泛化能力。在我们的实践中，我们在流模型中统一将这类特征的值和梯度置0（批模型不改），以保障模型的稳定性。

图7 同一批样本hour特征不同取值对模型预估值的影响

模型训练更新的实时性

模型训练时流模型首先通过restore离线批训练最新的模型版本作为实时流式训练的初始化模型，读取消费Swift消息队列的训练样本流式训练模型。训练平台上的模型会定时生成模型版本（checkpoint）到HDFS上，然后发布至在线打分平台，在线打分平台上接收到模型版本之后会先通过BuildService转换成在线打分的模型表，并load到在线机器的内存中进行在线打分服务。

▐ 批流结合训练

实时流式训练的在线学习模型具有时效性强，能捕捉数据分布的实时变化，更快发现人群的偏好和最新的流行趋势；然而由于上一章节介绍的延迟反馈问题以及特征独立同分布问题，流模型的训练样本label存在一定比例的错误，并且丢失了类似week和clock等时间特征，模型相比于离线批训练模型处于欠拟合状态。

而离线批训练模型由于样本是天级组织，label准度高，而且数据被重复shuffle过，可以弥补流模型存在的问题。因此我们结合批模型和流模型的有点，设计了批流结合的在线学习方案：定期从最新的批模型恢复重新流式训练流模型。

图8展示了每周从批模型重启一次的批流结合模型和持续流式训练的流模型在一个月的效果对比，可以看到批流结合的训练方式效果要优于持续流式训练的方式，持续流式训练的方式由于延迟反馈问题以及特征独立同分布问题会损失一定的效果，但是损失的该部分效果会趋向于稳定。

图8 批流结合效果对比

▐ 小时级模型更新

由于大规模深度排序模型的规模非常大（checkpoint大小 > 500G），按照传统模型更新的方式：生成checkpoint->推送到在线打分平台->BuildService生成模型表->在线打分平台加载模型表到内存，这整个过程需要1个多小时，因此最多只能做到小时级别的模型更新。2019年我们在深度排序模型做在线学习时，采用的就是这种更新方式，训练平台小时级定时的生成checkpoint和自动推送到在线打分平台来完成流式训练模型的在线更新。

▐ PS直发分钟级模型更新

2020年信息流算法团队通过与算法工程团队同学合作，构建了PS直发的分钟级在线学习方案。深度排序的规模大主要是模型中包含一些大规模的Sparse参数，比如UserId、ItemID、PID等的embedding。与Dense参数不同，Sparse参数虽然总体规模庞大，但是不是每一次的训练迭代都会更新所有的Sparse参数，比如ItemID的embedding参数，每个训练的batch中涉及的到ItemID就只有几万个，占整个参数空间的一小部分。

在首猜的CTR大模型中，checkpoint大小>500G，但是每15min被更新的参数只有30多G的Sparse参数被更新（不包括梯度等在线推理不需要的参数），在线模型只需要在每15min更新这个窗口内更新的特征，就可以大大减少每次更新的参数规模，提升在线模型更新的效率，从而提高模型的时效性。

模型参数的增量更新有通过Diff Checkpoint的参数Diff收集更新的参数、在PS中维护HashMap记录更新的参数并通过PS直发等多套技术方案，最终我们采样更新效率最高的PS直发技术。

PS直发的具体实现是：对于SparseTensor会在每个PS上分别维护一个HashMap记录更新的ID和频次，每隔一定的时间间隔，由每个PS各种收集在这个时间间隔内更新的ID对应的参数，并行的写入到Swift Topic中；而对应非SparseTensor的参数，比如MLP权重和非Sparse的特征，由于其基本都是全部更新，由Chief Worker统一从各个PS上拉取这些参数并拼装成完整的参数再写入到Swift Topic中。

虽然SpareTensor是在PS上直发，但是Chief Worker在整个发送过程中起了协调和触发的作用，Chief 每次发送之前都会向Swift发送一个开始写的信号，在PS和Chief都完成参数发送后再发送一个写结束的信号。Swift会将这个写信号开始（startTime）和结束（endTime）之间的参数当作一个整体来看待，从而保证了参数的一致性。首猜商品CTR模型的分钟级更新采用了15min的时间间隔，每15min进行一次PS参数直发，发送参数规模在30G左右，在半分钟左右就能完成全部参数的发送。

在线打分平台上的Processor会读取Swift Topic上的参数，并将参数直接发送到Searcher，在Searcher上开辟一段实时内存来让参数实时生效；与此同时还会进一步将参数发送到BuildServer，构建出一个增量的索引，再次发送到Searcher上，Searcher收到这个索引之后会清掉实时内存中的这部分参数，以降低实时内存的消耗。

图8 PS直发分钟级模型更新

在线学习质量保障

图9 首页信息流在线学习全貌

▐ 样本质量

样本数据作为机器学习的基石，其质量的好坏直接决定了模型效果的上限，特征对于在线学习系统模型不断在利用最新的流式样本数据，做好样本数据质量保障，对于在线学习效果提升和系统稳定性保障至关重要。在样本质量保障方面，我们主要从特征监控体系、样本产出监控和样本特征在离线一致性校验来保障在线学习的样本质量。

特征监控体系

特征监控包括从样本特征源头获取特征的监控和产出样本后特征质量的监控。特征源头获取特征的监控主要包括从TT日志流、Holo等查询和解析特征的RT、成功率等，样本后特征质量的监控主要包含序列特征的平均长度、连续特征的均值和方差、字符特征的空值率等。

样本产出质量

样本产出质量保障包括样本产出监控和样本产出速率动态调整。样本产出监控主要监控样本产出的速率、样本均值、Retraction比例等指标。首页商品商品信息流CTR样本规模较大，日常QPS 十万/s+，峰值数十万/s，日均产出样本百亿规模，为了保障样本的稳定性和时效性，在大促一些资源较为紧张而样本QPS又较大的关键时间点，样本产出能根据资源保障的情况和样本的延迟情况，进行适当的采样。

样本特征在离线一致性校验

样本特征的在离线一致性指在线学习的实时样本和离线ODPS产出的批样本在样本和特征上的一致性。星云平台上产出的在线学习实时样本除了写到Swift Topic之外，还会采样比较小的比例落盘到离线ODPS，以跟离线ODPS产出的样本进行双向比对，以及时发现实时样本和离线ODPS样本的不一致问题。

▐ 训练质量

训练质量主要目标是保证模型训练的稳定性和正确性，主要包括异常样本拦截和模型离线效果监控。

异常样本拦截

在Swift Topic和Worker读数据的接口之间，我们设计了一个样本缓冲池，又样本缓冲池来读取Swift Topic的数据，累积一定的数据之后进行正负样本比监控，如果正负样本比符合我们制定的标准，则将缓冲池内的样本shuffle后交给Worker读取训练，否则对该样本进行拦截丢弃，主要来对系统故障或大促红包雨等活动所带来的异常比例样本。

模型监控

模型监控指标包括AUC、predict_mean和label_mean等，模型在往RTP推送参数之前会校验AUC、predict_mean是否符合我们制定的标准，如果符合再往RTP推送参数，否则则进行拦截。

▐ 预估质量

预估质量监控是在线学习监控链路的最后一个环节，改环节主要包括冒烟发布和异常回滚。

冒烟发布

小流量灰度集群效果验证是保证模型预估质量最为稳妥的方式，先将模型推送到小流量集群进行效果观察，效果正常后进行全机房推全。这种方式能有效预防各种模型稳定引发的故障，但是这种方式更新周期长，切换效率低，有损在线学习模型的时效性。为了保证预估模型的质量和时效性，我们采用小样本在离线打分一致性评估的方式进行模型质量保证，其中离线评估通过AUC和predict mean确保离线模型的正确性，小样本在离线模型打分一致性对比为了确保在离线模型的一致性。小样本在离线打分一致性评估基本能达到小流量灰度集群验证的效果，而且校验数据快，不破坏在线学习模型的时效性。

异常回滚

异常回滚主要是在发现模型异常时，可以及时快速地回滚到上一个正常的版本。在线打分系统上的模型通常不仅仅存储当前在服务的版本，还会存储上一个模型版本，当当前版本异常时可以款式切换到上一个版本的模型参数。

总结

本文介绍了我们在在线深度学习（ODL）实时流式样本构建、模型实时训练和在线实时更新，以及在线深度学习质量保障工作上的探索与实践。大规模深度学习模型小时级在线学习最早在首页商品信息流CTR模型上全量，日常CTR +2.2%，成交金额 +1.7%；2020年双十一期间（11.01~11.11）CTR +5.2%，成交金额 +2.9%。2020年我们升级到分钟级在线深度学习，在小时级在线深度学习的基础上，CTR +1.1%，成交金额 +0.4%。

在视频信息流推荐场景，在线深度学习带来日常 CTR +3%，PV +0.7%；7天内新视频 PV +22%，CTR +10%。

关于我们

我们负责阿里电商的核心推荐算法，包括淘宝/天猫首页、购物链路等多个核心场景的信息流推荐业务。我们致力于每天为上亿用户提供数十亿精准个性化的信息推送服务，打造极致的购物体验。团队在人工智能多个领域深耕多年，研究领域包括大规模在线深度学习、深度强化学习、图嵌入学习、边缘计算、智能交互、自然语言理解、因果推断、商业化机制等。欢迎加入我们，一起探索人工智能在电商领域的无限可能。

欢迎投递简历：[email protected]‍

‍

✿ 拓展阅读

作者|陈启伟（陆轺）、葛均锋（北黎）

编辑|橙子君

出品|阿里巴巴新零售淘系技术

从0到1构建AI深度学习视频分析系统--基于YOLO 目标检测的动作序列检查系统：（2）消息队列与消息中间件 shiter 人工智能系统解决方案与技术架构人工智能深度学习音视频
文章大纲原始视频队列Python内存视频缓存优化方案（4GB以内）一、核心参数设计二、内存管理实现三、性能优化策略四、内存占用验证五、高级优化技巧六、部署建议检测结果队列YOLO检测结果队列技术方案一、技术选型矩阵二、核心实现代码三、性能优化策略四、可视化方案对比五、部署建议逻辑判定队列时间片图论时间序列大模型引入参考文献原始视频队列想要在单机内存中缓存1-5分钟的视频片段，python技术栈的话
k8s系统学习路径 LCY133 kubernetes 学习容器
学习Kubernetes（K8s）需要循序渐进，结合理论知识和实践操作。以下是学习Kubernetes的推荐步骤：1.先决条件•掌握容器基础：先学习Docker，理解容器化概念（镜像、容器、仓库）、Dockerfile编写和容器生命周期管理。•熟悉Linux基础：了解Linux命令行操作、网络、文件系统等。•了解云计算概念：如虚拟化、负载均衡、服务发现、分布式系统等。2.Kubernetes核心概
【人工智能】Model Context Protocol (MCP) 是一个开放协议，标准化了应用程序向大型语言模型（LLMs）提供上下文的方式本本本添哥 013 -AIGC 人工智能大模型人工智能语言模型 php
一、ModelContextProtocol(MCP)概述MCP，ModelContextProtocolMCP，是一个开放协议。MCP，标准化了应用程序向大型语言模型（LLMs）提供上下文的方式。‌MCP，旨在标准化应用程序如何为大型语言模型（LLM）提供上下文信息。MCP，提供了一个标准的接口，使得LLM可以无缝集成各种外部数据源和工具，从而扩展其能力和应用场景。二、MCP的定义和作用MCP定
selenium 等待ajax,如何等待Selenium IDE中的所有ajax请求完成？华西怀 selenium 等待ajax
我有一阵子没用过IDE。这是我用于WebDriver的。但算法翻译;JavaScript是JavaScript。这就是说，这取决于你的框架。对于角度，我用这个：publicbooleanwaitForAngularToLoad(WebDriverdriver,intwaitTimeInSeconds){WebDriverWaitwait=newWebDriverWait(driver,waitTi
从零开始大模型开发与微调：PyCharm的下载与安装 AI天才研究院 AI大模型企业级应用开发实战 AI大模型应用入门实战与进阶 DeepSeek R1 &大数据AI人工智能大模型计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
从零开始大模型开发与微调：PyCharm的下载与安装1.背景介绍随着人工智能和深度学习技术的不断发展,大型语言模型(LargeLanguageModels,LLMs)已经成为当前最引人注目的研究热点之一。LLMs能够在各种自然语言处理任务上展现出惊人的性能,例如机器翻译、文本生成、问答系统等。PyTorch和TensorFlow等深度学习框架为训练和微调大型语言模型提供了强大的支持。PyCharm
【从零开始学习计算机科学】数字逻辑（四）数字系统设计贫苦游商学习数字逻辑 verilog 数字系统 HDL 数字电路 FPGA
【从零开始学习计算机科学】数字逻辑（四）数字系统设计数字系统设计硬件描述语言HDL（HardwareDescriptionLanguage）VerilogHDL的起源与发展HDL软核、固核和硬核的重用HDL的应用数字系统设计实现数字系统设计一个数字集成电路的可以从不同的层次（系统级、算法级、寄存器传输级、门级、开关级）以及不同的领域（行为领域、结构领域、物理领域）进行描述。三个领域主要含义如下：行
新手村：数据预处理-特征缩放嘉羽很烦机器学习线性回归算法机器学习
新手村：数据预处理-特征缩放特征缩放（FeatureScaling）是数据预处理中的一个重要步骤，特别是在应用某些机器学习算法时。特征缩放可以使不同尺度的特征具有相同的量级，从而提高模型训练的效率和性能。常见的特征缩放方法包括标准化（Standardization）和归一化（Normalization）。常见的特征缩放方法标准化（Standardization）将特征转换为均值为0，标准差为1的标
遗传算法与深度学习实战（2）——生命模拟及其应用盼小辉丶遗传算法与深度学习实战深度学习人工智能遗传算法
遗传算法与深度学习实战（2）——生命模拟及其应用0.前言1.康威生命游戏1.1康威生命游戏的规则1.2实现康威生命游戏1.3空间生命和智能体模拟2.实现生命模拟3.生命模拟应用小结系列链接0.前言生命模拟是进化计算的一个特定子集，模拟了自然界中所观察到的自然过程，例如粒子或鸟群的聚集方式。生命模拟只是用来探索和优化问题的模拟形式之一，还有很多其他形式的模拟，可以更好地建模各种过程，但它们都源于康威
支持向量机 (SVM) 算法详解 sssugarr 机器学习算法详解 python svm 支持向量机算法 sklearn
支持向量机(SVM)算法详解支持向量机（SupportVectorMachine,SVM）是一种监督学习模型，广泛应用于分类和回归分析。SVM特别适合高维数据，并且在处理复杂非线性数据时表现出色。本文将详细讲解SVM的原理、数学公式、应用场景及其在Python中的实现。什么是支持向量机？支持向量机的目标是找到一个最佳的决策边界（或称超平面）来最大限度地分隔不同类别的数据点。对于线性可分的数据，SV
京准电钟：关于NTP网络时间同步系统应用方案北京华人开创公司北斗卫星授时 NTP时间同步卫星同步时钟网络大数据时间同步 NTP 网络授时授时服务卫星授时服务
京准电钟：关于NTP网络时间同步系统应用方案京准电钟：关于NTP网络时间同步系统应用方案一、背景与需求分析在现代信息化系统中，网络设备、服务器、终端设备的时间同步是保障业务连续性、数据一致性和安全审计的核心基础。时间不同步可能导致以下问题：日志记录时间混乱，影响故障排查；分布式系统事务冲突或数据不一致；安全证书验证失败或攻击行为难以追溯；工业控制、金融交易等高精度场景的时间敏感操作异常。需求目标：
京准电钟分享：医院网络内NTP时间同步服务器作用是什么？北京华人开创公司北斗卫星授时 NTP时间同步 GPS对时装置 NTP 时间同步服务器网络时间服务器 NTP时间服务器网络系统时钟同步
京准电钟分享：医院网络内NTP时间同步服务器作用是什么？京准电钟分享：医院网络内NTP时间同步服务器作用是什么？时间同步技术必定将是整个大数据处理系统的重要支撑和保障。时间同步技术使数据产生与处理系统的所有节点具有全局的、统一的标准时间，从而使系统中的所有各种消息、事件、节点、数据等具备正确的逻辑性、协调性以及可追溯性。大数据产生与处理系统是各种计算设备集群的，计算设备将统一、同步的标准时间用于记
【商城实战(38)】Spring Boot：从本地事务到分布式事务，商城数据一致性的守护之旅奔跑吧邓邓子商城实战 spring boot 分布式本地事务分布式事务商城实战
【商城实战】专栏重磅来袭！这是一份专为开发者与电商从业者打造的超详细指南。从项目基础搭建，运用uniapp、ElementPlus、SpringBoot搭建商城框架，到用户、商品、订单等核心模块开发，再到性能优化、安全加固、多端适配，乃至运营推广策略，102章内容层层递进。无论是想深入钻研技术细节，还是探寻商城运营之道，本专栏都能提供从0到1的系统讲解，助力你打造独具竞争力的电商平台，开启电商实战
PyTorch从入门到精通：探索深度学习新境界 lmtealily 深度学习 pytorch 人工智能
引言PyTorch作为当前最受欢迎的深度学习框架之一，凭借其动态计算图的独特设计和与Python生态的无缝集成，正重塑着人工智能开发的新范式1。从NVIDIA的研究实践到Meta的产业应用，PyTorch的价值已渗透至学术研究、工业部署的每个角落。本文将带领您从张量操作基础开始，逐步探索GPU加速、动态图机制、框架生态集成等高级主题，最终实现理论与实战的双重突破。一、PyTorch核心基础构建1.
【算法手记04】回溯算法 Xeno Li 算法 java
回溯是递归的副产品，只要有递归，就会有对应的回溯过程。回溯实际上就是“撤销上一次递归操作”的一个过程。回溯法是由递归+循环组成的，其中每次循环执行的次数应该是可知的。每一次完成递归都会收集一次可能的结果，因此结果集的大小是不确定的，需要使用递归去找，我们称之为纵向搜索；而每次循环会从待找集合中依次遍历，是一个横向搜索的过程。模板voidbacktracking(参数){if(终止条件){收集结果r
RSA加密算法详解：从基础原理到实际应用冬停算法
RSA加密算法详解：从基础原理到实际应用在现代信息安全领域，RSA加密算法因其坚实的数学基础和广泛的应用而备受关注。本文将全面介绍RSA算法的原理、密钥生成、加密解密过程以及数字签名的实现，并通过Python示例代码帮助您深入理解和掌握RSA的实际应用。目录什么是RSA？RSA的基本原理RSA密钥生成RSA加密与解密RSA签名与验证RSA的安全性Python实现RSA7.1RSA密钥生成示例7.2
【Python】已解决：pip安装第三方模块（库）与PyCharm中不同步的问题（PyCharm添加本地python解释器）屿小夏 python pip pycharm
个人简介：某不知名博主，致力于全栈领域的优质博客分享|用最优质的内容带来最舒适的阅读体验！文末获取免费IT学习资料！文末获取更多信息精彩专栏推荐订阅收藏专栏系列直达链接相关介绍书籍分享点我跳转书籍作为获取知识的重要途径，对于IT从业者来说更是不可或缺的资源。不定期更新IT图书，并在评论区抽取随机粉丝，书籍免费包邮到家AI前沿点我跳转探讨人工智能技术领域的最新发展和创新，涵盖机器学习、深度学习、自然
204页数字化转型：集团企业信息化规划方案公众号：智慧方案文库精选解决方案（附下载）大数据 database
建立统一共享的信息平台，集团总部能实时监控下属单位的库存、产量、成本、资金流等关键信息，有效利用大数据技术平台为管理层提供全面、及时、准确的决策信息支持。n推动生产、销售、新业务领域的自动化、数字化、网络化、信息化、集成化，为今后打造智能制造、智慧农业奠定坚实基础；n推进IT基础设施建设与提升，采用全新的架构设计理念，建成组件化、集中化、服务化、协同化的统一云平台，提供高质量、可重用的平台服务，营
使用Python实现无人机路径规划的灰狼优化算法闲人编程 python python 无人机算法灰狼优化路径规划
目录使用Python实现无人机路径规划的灰狼优化算法引言1.灰狼优化算法概述1.1定义1.2算法原理1.3灰狼的狩猎策略1.4算法步骤2.Python中的灰狼优化算法实现2.1安装必要的库2.2定义类2.2.1灰狼类2.2.2群体类2.2.3路径规划类2.3示例程序3.灰狼优化算法的优缺点3.1优点3.2缺点4.改进方向5.应用场景结论使用Python实现无人机路径规划的灰狼优化算法引言无人机的路
算法题刷题方法记录（蓝桥杯、Leetcode)
Algorithmexercises尘封已久的算法，又要重新开始刷题了，不知道题量能不能达到预期研一寒假期间，断断续续的，平均下来大概每天一题，懒懒散散的，开学来了继续刷。记录下让人眼前一新的算法题喜欢就要勇敢去爱，对一件事，对一个人，如何付出，如何去追求，如何去爱，在付出的的过程中又如何去确定自己的内心？在追求一个目标或者一个人的时候，如何确保自己在付出的时候也是开心的？^_^加油<(￣︶￣)↗
【AI大模型智能应用】Deepseek生成测试用例柳柳的博客 AI大模型测试用例
在软件开发过程中，测试用例的设计和编写是确保软件质量的关键。然而，软件系统的复杂性不断增加，手动编写测试用例的工作量变得异常庞大，且容易出错。DeepSeek基于人工智能和机器学习，它能够依据软件的需求和设计文档，自动生成高质量的测试用例，显著减轻人工编写测试用例的负担。体验一把用DeepSeek编写测试用例，还生成清晰直观的思维导图，整个流程十分顺畅。这篇文章讲解如何使用deepseek生成功能
人工智能之数学基础:线性代数中矩阵的初印象每天五分钟玩转人工智能机器学习深度学习之数学基础线性代数人工智能矩阵机器学习深度学习
本文重点从本篇文章开始，我们将开始学习矩阵的概念，矩阵，作为线性代数的核心概念之一，就像是一个个精心编织的网格，将复杂的数据和关系以一种简洁而直观的方式呈现出来。矩阵矩阵的初印象想象一下，你手里有一张空白的表格，上面布满了等待填充的格子。这些格子按照行和列整齐排列，形成了一个二维的平面结构。如果我们把数字、符号或者更复杂的元素填入这些格子中，那么这个表格就变成了一个“矩阵”。简单来说，矩阵就是一个
双指针算法六七_Shmily 数据结构与算法分析算法
双指针算法是一种通过使用两个指针（索引或引用）在数据结构中有序移动来高效解决问题的技巧。它常用于数组、链表等线性结构的问题，能显著优化时间和空间复杂度。以下是其核心应用场景及使用方法：核心应用场景有序数组的两数之和左右指针从两端向中间移动，根据当前和调整指针位置。合并有序数组/链表从后向前填充避免覆盖，或直接比较节点合并。快慢指针检测链表环快指针每次走两步，慢指针走一步，相遇则有环。滑动窗口（子数
最短路算法 Emplace 算法图论最短路
算法介绍最短路是一种在一个有权图中求任意两点间的最短路径。算法描述最短路有很多的形式：单源最短路：就是固定起点的最短路。多源最短路：就是不固定起点的最短路。其中Floyd就是求多源最短路的。Floyd算法流程首先我们可以先枚举中间节点kkk,然后再枚举经过这个中间节点的起点和终点。最后对于每对起点和终点我们假设它们为(i,j)，那么从i到j的距离就应该是a(i,k)+a(k,j)与a(i,j)的最
数据结构与算法-图（绪论图论基本概念）可爱的野指针数据结构图论算法数据结构有向图欧拉回路
昨天我的的树就分享完了，树的概念很多吧，二叉树，满二叉树，完全二叉树，赫夫曼树，孩子，双亲……多不？哈哈哈，这算不了什么，我们接下来要看到的图的概念才叫多，没关系，勤奋和时间会让你记住他们，内心只需要告诉自己，加油，我能行，就一定能学会图。不知道有没有看过或者学过离散数学，如果学过，那么恭喜啦，离散数学里的图论就是这一章的基础，图论学的还不错的话，压力就小了。先介绍的是图的定义，图-V个顶点和E条
算法篇——二分查找古月方源1.0版算法算法
二分查找：从理论到实践前言今天无聊，决定在CSDN上发布我的第一篇文章，与大家分享一下二分查找算法。二分查找是一种高效的在有序数组中查找特定元素的算法，其核心思想是通过反复将查找范围减半来快速定位目标元素。二分查找的基本原理二分查找的基本思想非常简单。每次查找时，将数组的中间元素与目标值进行比较：如果中间元素等于目标值，则查找成功。如果中间元素小于目标值，则目标值只可能在右半部分，查找范围缩小为右
人工智能第五次笔记（python运算符）吴小白！笔记 python 开发语言
一.运算符运算符用于执行某种操作并返回一个结果，Python中的运算符可以分为：算数运算符，比较运算符，逻辑运算符，赋值运算符，位运算符，身份运算符，成员运算符，三目运算符八种1.1算数运算符用于执行基本的数学运算1.1.1常见的算数运算符+：加法-：减法*：乘法/：除法%：取模（取余数）**：幂运算//：整除（取整数部分）x1=5x2=2x3=(1,2)#元组x4=(3,4)x5=[1,2]x6
【算法每日一练]-图论篇14 欧拉路径，欧拉回路希望你变强啊图论算法图论 java 数据结构 c++深度优先
目录判断有向图有欧拉回路判断有向图有欧拉路径如果图G中的一个路径包括每个边恰好一次，则该路径称为欧拉路径(Eulerpath)。（每个点都经过一次就是旅行商问题）预备知识：有向图有欧拉路径：等价于：非0度节点连通，且所有节点入度等于出度(欧拉回路)或有n-2个节点入度等于出度，另外两个节点一个多1一个少1无向图有欧拉路径：等价于：连通图，且没有度为奇数的节点(欧拉回路)或只有两个2个度为奇数的节点
YOLOv5+UI界面在车辆检测中的应用与实现深度学习&目标检测实战项目 YOLOv5实战项目 YOLO ui 分类数据挖掘目标跟踪人工智能
1.引言随着智能交通系统（ITS）的快速发展，车辆检测已成为计算机视觉领域的重要研究方向。车辆检测技术广泛应用于交通流量监控、车辆违章抓拍、无人驾驶等场景中。近年来，深度学习技术的突破，特别是卷积神经网络（CNN）的崛起，使得目标检测技术取得了显著进展。其中，YOLO（YouOnlyLookOnce）系列模型以其高效的实时检测能力和出色的性能成为车辆检测领域的首选方法之一。在本文中，我们将基于YO
在连通无向图中寻找欧拉回路（Eulerian Circuit）醉心编码 c/c++技术类编程基础算法欧拉回路
在连通无向图中寻找欧拉回路（EulerianCircuit）问题描述解决方案概述算法步骤伪代码C代码示例如何在迷宫中找出一条路示例：在简单迷宫中应用欧拉回路结论问题描述给定一个连通无向图$G=(V,E)$，我们需要找到一条路径，该路径正向和反向通过$E$中的每条边恰好一次，即该路径通过每条边两次，但方向相反。这样的路径被称为欧拉回路（EulerianCircuit）。解决方案概述欧拉回路存在的充分
DeepSeek：技术教育领域的AI变革者——从理论到实践的全面解析量子纠缠BUG DeepSeek DeepSeek部署 AI 人工智能 python
一、技术教育为何需要DeepSeek？在数字化转型的浪潮下，技术教育面临着知识更新快、实践门槛高、个性化需求强三大核心挑战。传统的教学模式难以满足开发者快速掌握前沿技术、构建复杂系统能力的需求。DeepSeek作为国产开源大模型的代表，凭借其推理能力、多模态支持与低成本部署的特性，正在为技术教育带来突破性解决方案。二、DeepSeek赋能技术教育的核心技术优势1.推理能力驱动深度学习思维链（CoT
Spring的注解积累 yijiesuifeng spring 注解
用注解来向Spring容器注册Bean。需要在applicationContext.xml中注册： <context:component-scan base-package=”pagkage1[,pagkage2,…,pagkageN]”/>。如：在base-package指明一个包 <context:component-sc
传感器百合不是茶 android 传感器
android传感器的作用主要就是来获取数据,根据得到的数据来触发某种事件下面就以重力传感器为例; 1,在onCreate中获得传感器服务 private SensorManager sm;// 获得系统的服务 private Sensor sensor;// 创建传感器实例 @Override protected void
[光磁与探测]金吕玉衣的意义 comsci
这是一个古代人的秘密:现在告诉大家信不信由你们: 穿上金律玉衣的人,如果处于灵魂出窍的状态,可以飞到宇宙中去看星星这就是为什么古代
精简的反序打印某个数沐刃青蛟打印
以前看到一些让求反序打印某个数的程序。比如：输入123，输出321。记得以前是告诉你是几位数的，当时就抓耳挠腮，完全没有思路。似乎最后是用到%和/方法解决的。而今突然想到一个简短的方法，就可以实现任意位数的反序打印（但是如果是首位数或者尾位数为0时就没有打印出来了）代码如下： long num, num1=0;
PHP：6种方法获取文件的扩展名 IT独行者 PHP 扩展名
PHP：6种方法获取文件的扩展名 1、字符串查找和截取的方法 1 $extension = substr ( strrchr ( $file , '.' ), 1); 2、字符串查找和截取的方法二 1 $extension = substr
面试111 文强chu 面试
1事务隔离级别有那些，事务特性是什么（问到一次） 2 spring aop 如何管理事务的，如何实现的。动态代理如何实现，jdk怎么实现动态代理的，ioc是怎么实现的，spring是单例还是多例，有那些初始化bean的方式，各有什么区别（经常问） 3 struts默认提供了那些拦截器（一次） 4 过滤器和拦截器的区别（频率也挺高） 5 final，finally final
XML的四种解析方式小桔子 dom jdom dom4j sax
在平时工作中，难免会遇到把 XML 作为数据存储格式。面对目前种类繁多的解决方案，哪个最适合我们呢？在这篇文章中，我对这四种主流方案做一个不完全评测，仅仅针对遍历 XML 这块来测试，因为遍历 XML 是工作中使用最多的（至少我认为）。　　预备　　测试环境：　　AMD 毒龙1.4G OC 1.5G、256M DDR333、Windows2000 Server
wordpress中常见的操作 aichenglong 中文注册 wordpress 移除菜单
1 wordpress中使用中文名注册解决办法 1)使用插件 2)修改wp源代码进入到wp-include/formatting.php文件中找到 function sanitize_user( $username, $strict = false
小飞飞学管理-1 alafqq 管理
项目管理的下午题，其实就在提出问题（挑刺），分析问题，解决问题。今天我随意看下10年上半年的第一题。主要就是项目经理的提拨和培养。结合我自己经历写下心得对于公司选拔和培养项目经理的制度有什么毛病呢？ 1，公司考察，选拔项目经理，只关注技术能力，而很少或没有关注管理方面的经验，能力。 2，公司对项目经理缺乏必要的项目管理知识和技能方面的培训。 3，公司对项目经理的工作缺乏进行指
IO输入输出部分探讨百合不是茶 IO
//文件处理在处理文件输入输出时要引入java.IO这个包； /* 1，运用File类对文件目录和属性进行操作 2，理解流，理解输入输出流的概念 3，使用字节/符流对文件进行读/写操作 4，了解标准的I/O 5，了解对象序列化 */ //1，运用File类对文件目录和属性进行操作 //在工程中线创建一个text.txt
getElementById的用法 bijian1013 element
getElementById是通过Id来设置/返回HTML标签的属性及调用其事件与方法。用这个方法基本上可以控制页面所有标签，条件很简单，就是给每个标签分配一个ID号。返回具有指定ID属性值的第一个对象的一个引用。语法： &n
励志经典语录 bijian1013 励志人生
经典语录1: 哈佛有一个著名的理论：人的差别在于业余时间，而一个人的命运决定于晚上8点到10点之间。每晚抽出2个小时的时间用来阅读、进修、思考或参加有意的演讲、讨论，你会发现，你的人生正在发生改变，坚持数年之后，成功会向你招手。不要每天抱着QQ/MSN/游戏/电影/肥皂剧……奋斗到12点都舍不得休息，看就看一些励志的影视或者文章，不要当作消遣；学会思考人生，学会感悟人生
[MongoDB学习笔记三]MongoDB分片 bit1129 mongodb
MongoDB的副本集(Replica Set)一方面解决了数据的备份和数据的可靠性问题，另一方面也提升了数据的读写性能。MongoDB分片(Sharding)则解决了数据的扩容问题，MongoDB作为云计算时代的分布式数据库，大容量数据存储，高效并发的数据存取，自动容错等是MongoDB的关键指标。本篇介绍MongoDB的切片(Sharding) 1.何时需要分片 &nbs
【Spark八十三】BlockManager在Spark中的使用场景 bit1129 manager
1. Broadcast变量的存储，在HttpBroadcast类中可以知道 2. RDD通过CacheManager存储RDD中的数据，CacheManager也是通过BlockManager进行存储的 3. ShuffleMapTask得到的结果数据，是通过FileShuffleBlockManager进行管理的，而FileShuffleBlockManager最终也是使用BlockMan
yum方式部署zabbix ronin47 yum方式部署zabbix
安装网络yum库#rpm -ivh http://repo.zabbix.com/zabbix/2.4/rhel/6/x86_64/zabbix-release-2.4-1.el6.noarch.rpm 通过yum装mysql和zabbix调用的插件还有agent代理#yum install zabbix-server-mysql zabbix-web-mysql mysql-
Hibernate4和MySQL5.5自动创建表失败问题解决方法 byalias J2EE Hibernate4
今天初学Hibernate4，了解了使用Hibernate的过程。大体分为4个步骤： ①创建hibernate.cfg.xml文件 ②创建持久化对象 ③创建*.hbm.xml映射文件 ④编写hibernate相应代码在第四步中，进行了单元测试，测试预期结果是hibernate自动帮助在数据库中创建数据表，结果JUnit单元测试没有问题，在控制台打印了创建数据表的SQL语句，但在数据库中
Netty源码学习-FrameDecoder bylijinnan java netty
Netty 3.x的user guide里FrameDecoder的例子，有几个疑问： 1.文档说：FrameDecoder calls decode method with an internally maintained cumulative buffer whenever new data is received. 为什么每次有新数据到达时，都会调用decode方法？ 2.Dec
SQL行列转换方法 chicony 行列转换
create table tb(终端名称 varchar(10) , CEI分值 varchar(10) , 终端数量 int) insert into tb values('三星' , '0-5' , 74) insert into tb values('三星' , '10-15' , 83) insert into tb values('苹果' , '0-5' , 93)
中文编码测试 ctrain 编码
循环打印转换编码 String[] codes = { "iso-8859-1", "utf-8", "gbk", "unicode" }; for (int i = 0; i < codes.length; i++) { for (int j
hive 客户端查询报堆内存溢出解决方法 daizj hive 堆内存溢出
hive> select * from t_test where ds=20150323 limit 2; OK Exception in thread "main" java.lang.OutOfMemoryError: Java heap space 问题原因： hive堆内存默认为256M 这个问题的解决方法为：修改/us
人有多大懒，才有多大闲 (评论『卓有成效的程序员』) dcj3sjt126com 程序员
卓有成效的程序员给我的震撼很大，程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可以那么勤奋，每天都孜孜不倦得做着重复单调的工作。在看这本书之前，我属于勤奋的人，而看完这本书以后，我要努力变成懒惰的人。不要在去庞大的开始菜单里面一项一项搜索自己的应用程序，也不要在自己的桌面上放置眼花缭乱的快捷图标
Eclipse简单有用的配置 dcj3sjt126com eclipse
1、显示行号 Window -- Prefences -- General -- Editors -- Text Editors -- show line numbers 2、代码提示字符 Window ->Perferences，并依次展开 Java -> Editor -> Content Assist，最下面一栏 auto-Activation
在tomcat上面安装solr4.8.0全过程 eksliang Solr solr4.0后的版本安装 solr4.8.0安装
转载请出自出处： http://eksliang.iteye.com/blog/2096478 首先solr是一个基于java的web的应用，所以安装solr之前必须先安装JDK和tomcat，我这里就先省略安装tomcat和jdk了第一步：当然是下载去官网上下载最新的solr版本，下载地址
Android APP通用型拒绝服务、漏洞分析报告 gg163 漏洞 android APP 分析
点评：记得曾经有段时间很多SRC平台被刷了大量APP本地拒绝服务漏洞，移动安全团队爱内测（ineice.com）发现了一个安卓客户端的通用型拒绝服务漏洞，来看看他们的详细分析吧。 0xr0ot和Xbalien交流所有可能导致应用拒绝服务的异常类型时，发现了一处通用的本地拒绝服务漏洞。该通用型本地拒绝服务可以造成大面积的app拒绝服务。针对序列化对象而出现的拒绝服务主要
HoverTree项目已经实现分层 hvt 编程 .net Web C#ASP.ENT
HoverTree项目已经初步实现分层，源代码已经上传到 http://hovertree.codeplex.com请到SOURCE CODE查看。在本地用SQL Server 2008 数据库测试成功。数据库和表请参考：http://keleyi.com/a/bjae/ue6stb42.htmHoverTree是一个ASP.NET 开源项目，希望对你学习ASP.NET或者C#语言有帮助，如果你对
Google Maps API v3: Remove Markers 移除标记天梯梦 google maps api
Simply do the following: I. Declare a global variable: var markersArray = []; II. Define a function: function clearOverlays() { for (var i = 0; i < markersArray.length; i++ )
jQuery选择器总结 lq38366 jquery 选择器
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40
基础数据结构和算法六：Quick sort sunwinner Algorithm Quicksort
Quick sort is probably used more widely than any other. It is popular because it is not difficult to implement, works well for a variety of different kinds of input data, and is substantially faster t
如何让Flash不遮挡HTML div元素的技巧_HTML/Xhtml_网页制作刘星宇 html Web
今天在写一个flash广告代码的时候，因为flash自带的链接，容易被当成弹出广告，所以做了一个div层放到flash上面，这样链接都是a触发的不会被拦截，但发现flash一直处于div层上面，原来flash需要加个参数才可以。让flash置于DIV层之下的方法，让flash不挡住飘浮层或下拉菜单，让Flash不档住浮动对象或层的关键参数：wmode=opaque。方法如下：
Mybatis实用Mapper SQL汇总示例 wdmcygah sql mysql mybatis 实用
Mybatis作为一个非常好用的持久层框架，相关资料真的是少得可怜，所幸的是官方文档还算详细。本博文主要列举一些个人感觉比较常用的场景及相应的Mapper SQL写法，希望能够对大家有所帮助。不少持久层框架对动态SQL的支持不足，在SQL需要动态拼接时非常苦恼，而Mybatis很好地解决了这个问题，算是框架的一大亮点。对于常见的场景，例如：批量插入/更新/删除，模糊查询，多条件查询，联表查询，