一篇小paper

AUTO:Scaling Deep Reinforcement Learning for Datacenter-Scale AUTO

摘要:根据中心的流量优化（例如：流量调度，负载均衡）一直是难以解决的实时决策问题。在此之前是根据操作人员对于负载的理解和环境进行的启发式方式解决的。因此，设计和实现合适的算法至少需要几周的时间。受最近成功应用深度强化学习(DRL)技术来解决复杂的在线控制问题的鼓舞，我们研究了DRL是否可以在没有人为干预的情况下用于AUTO。然而，我们的实验表明，当前DRL系统的延迟不能处理低于当前数据中心级别的数据，因为短数据（主要）流，在处理之前就已经消失了。

利用数据中心long-trace分布，我们开发了一个二级DRL系统，AuTO，模拟动物的外围和中枢神经系统，以解决可扩展性问题。外围系统(PS)驻留在终端主机上，收集流信息，在本地进行决策，对于较短的流，延迟最小。PS的决策由一个中央系统(CS)提供信息，在这个系统中，全球流信被聚合和处理。长期以来，中央系统一直以来只对较长的流进行单个的TO决策。通过CS&PS, AuTO是一个端到端自动到系统，可以收集网络信息，从过去的决策中学习，并执行行动以实现操作人员制定的目标。我们使用流行的机器学习框架和通用服务器实现了AuTO，并将其部署到32服务器的测试平台上。相比现有的方法,AUTO转时间从几周到毫秒级，实现的巨大的优化改进，例如，如现有算法相比，在FCT的性能上提高了48.14%。

INTRODUCTION

数据中心流量优化（to：flow/coflow调度[1,4,8,14,18,19,29,61]，拥塞控制[3,10]，负载平衡和路由[2])对应用程序性能有显著影响。目前，对不同流量负载、低粒径分布、流量密度等，TO都依赖于手工制作的heuristics（启发式）。当参数设置不匹配流量，TO启发算法会面临性能负反馈。例如，在PIAS[8]中，阈值是基于长期的流大小分布计算的，并且在运行时容易与当前/真实大小分布不匹配。在不匹配的情况下，性能下降可能高达38:46%[8]。当在有限的交换机队列中实现pFabric[4]时也存在同样的问题:在某些情况下，即使精心优化了阈值，平均FCT也可以减少30%以上。此外，在coflow调度中，Aalo[18]中的可修改的阈值取决于操作者提前选择好的值的能力，因为没有运行时适应性。

除了参数环境不匹配之外，从设计到启发的周期很长——至少是几周。因为它们需要操作人员的洞察力、应用知识和长期收集的trac数据。一个典型的过程包括:首先，部署监控系统来收集终端主机和/或交换机的统计数据;其次，在收集到足够的数据后，操作者对数据进行分析，设计启发式，并使用仿真工具和优化工具进行测试，以找到合适的参数设置;最终，测试的启发式被强制执行(带有应用模型[19,61]，操作系统内核模块[8,14]，交换机congurations[10]，或上述任何组合)。

因此，自动化TO流程很有吸引力，我们希望有一个自动化的TO agent，它能够适应大量的、不确定的和不稳定的数据中心trac，同时实现操作人员设定的目标。在本文中，我们研究了强化学习(RL)技术[55]，因为RL是与决策和动作控制有关的机器学习的一个分支。它研究了一个agent如何在复杂、不确定的环境中学习实现目标。RL代理观察以前的环境状态和奖励，然后决定一个动作以最大化奖励。近年来，随着深度神经网络(DNN)技术的进步，RL在许多dicult环境中都取得了良好的效果:DeepMind的Atari结果[40]和AlphaGo[52]使用了深度RL (DRL)算法，对其环境的假设很少，因此可以在其他环境中推广。受这些结果的启发，我们有动机为自动数据中心启用DRL。

我们从验证DRL在TO的有效性开始。我们使用基本的DRL算法，策略梯度[55]，实现了系统的低级别集中。然而，在我们的实验中(s2.2)，即使是在当前机器学习软件框架s2和高级硬件(GPU)上运行的这个简单算法，也无法在生产数据中心(>105台服务器)的规模上处理流量优化任务。关键是计算时间(∼100 ms):短流量(构成大多数流量）已经消失，在DRL决定回来之前,反馈的决定因此是无用的。

因此，在本文中我们试图回答的关键问题是:如何使基于drl的自动到数据中心规模?为了使DRL可伸缩，我们首先需要了解数据中心流量长度分布[3,11,33]:大多数流是短数据流，但大多数字节来自长流。因此，对于短期流的决策必须快速生成;然而，长时间的决策更无关紧要，因为它们需要更长的时间来完成。

我们提供了AuTO，一个端到端DRL系统，用于数据输入规模，与商品硬件一起工作。AuTO是一个二级DRL系统，模仿动物的外围和中枢神经系统。外围系统(PS)在所有终端主机上运行，收集流信息，并在本地对短期流进行即时决策。PS的决策是由中央系统(CS)提供信息的，在中央系统中，全球流量信息被聚合和处理。CS进一步使个人在长时间内做出决定，从而能够容忍较长时间的处理延迟。

AuTO的可伸缩性的关键是将耗时的DRL处理与短流程的快速动作处理分离开来。为此，我们采用多级反馈排队(MLFQ)[8]对PS进行调度，以根据一组阈值对流进行调度。每个新的flow从优先级最高的first队列开始，在它的发送字节通过某些阈值之后，它逐渐降级为较低的队列。使用MLFQ, AuTO的PS可以在本地信息(字节发送和阈值)上立即做出每个流决策，而在CS中，阈值仍然通过DRL算法在较长一段时间内进行优化。通过这种方式，global TO decision以MLFQ阈值的形式交付给PS(该阈值更具有延迟容忍度)，使AuTO能够在仅具有本地信息的情况下，对大多数ows的决策进行全局通知。此外，MLFQ很自然地将短的和长的ows分隔开来:短的ows在最初的几个队列中完成，长的ows下降到最后一个队列。对于长流程，CS使用dierent DRL算法集中处理它们，以确定路由、速率限制和优先级。

我们使用Python实现了一个AUTO模型。因此，AuTO与Keras/TensorFlow等流行的学习框架兼容。这允许网络和机器学习社区轻松地开发和测试新的算法，因为AuTO中的软件组件可以在datacenter中的其他RL项目中重用。

我们进一步构建了一个测试台，32台服务器通过2个交换机连接来评估AuTO。我们的实验表明，对于负载稳定、尺寸分布低的trac，经过8小时的训练后，与标准的启发式方法(最短的job-rst和最少获得的service-rst)相比，AuTO的性能提升高达48:14%。AuTO还能稳定地学习和适应时间和空间异构trac:仅经过8小时的训练，与启发式方法相比，AuTO平均FCT (tail)降低了8:71%(9:18%)。

在接下来的文章中，我们回顾了DRL，并揭示了为什么目前的DRL系统不能在x2中大规模工作。我们描述了x3中的系统设计，以及x4中的DRL配方和解决方案。我们在x5中实现了AuTO，并在x6中进行了大量的实验，并对其进行了评估。最后，我们回顾了x7中的相关工作，并在x8中进行了总结。

2.DRL

本章讲解了DRL，推荐博主songrotek的文章。songrotek的博客十分基础，而且通俗易懂，讲解纤细全面，无论是入门还是深入了解都值得看一下。

3.auto

当前DRL系统的关键问题是流问题收集和动作的生成之间的长时间延迟。在现代数据中心与≥10 gbps链接速度,实现流级别操作、往返延迟的操作至少应该是毫秒级的。如果不引入专门的硬件，这是无法实现的(x2.2)。使用普通硬件，DRL算法的处理延迟是一个硬限制。在此约束下，如何将DRL布置到数据中心TO上？

最近的研究[3,11,33]表明，大多数数据中心流是短的流，而大多数流量字节来自长流。根据这种长尾分布，我们的想法是将大部分短流程操作委托给终端主机，并制定DRL算法，生成长流TO决策。我们设计的AUTO作为一个二级系统，模拟动物的外围和中枢神经系统。如图3所示，外围系统(PS)在所有终端主机上运行，收集流信息，并在本地以最小的延迟对短流进行决策。中央系统(CS)使对长流有针对的算法，能够容忍更长进程延迟。此外，PS的决策是由CS来通知的，在CS中，全局流量信息被聚合和处理。

3.1外围系统

enforcement module

为了实现上述目标（仅有local information 的情况下全局调度短流），我们实行多层反馈队列来调度流量，没有对每一个六进行控制。有K个优先顺序，Pi，i介于1和K之间，K-1降级的阈值，aj，j介于1和K-1之间。我们在DSCP的基础上对所有的交换机进行严格的优先级排队。在终端主机上，当一个新的流初始化时，它的包被标记为p1，给它们网络中的最高优先级。随着更多的字节发送,这个流的包标记减少优先级Pj(2≤≤j K),因此他们将减少网络中的优先级。降级的阈值优先级从Pj−1到Pj，αj−1。

对于MLFQ, PS具有以下特性:

•它可以根据本地信息，即字节发送和阈值，对每个用户进行即时决策。

•它可以适应全局流量的变化。为了可扩展，CS不能直接控制小型流量。相反，CS优化和设置MLFQ阈值与全局信息在较长一段时间。因此，可以更新PS中的阈值以适应流量的变化。相比之下，PIAS[8]需要经过数周的流量跟踪才能更新阈值。

•它可以判别短的信息流和长的信息流。如图5所示，在之后少数队列中显示的短流，长流下降到最后一个队列。因此，CS可以集中处理长时间独立的路由、速率限制和优先级决策。

监控模块为CS生成阈值，监控模块收集所有完成流的流量大小和完成时间，使CS可以更新流量大小分布。监测模块还报告正在进行的长流量已经下降到其终端主机的最低优先级，以便CS可以做出单独的决策。

4.DRL

4.1 optimizing MLFQ shresholds

我们考虑数据中心网络连接多层服务。流量调度在主机被分为K个优先级，网络开关在每一个IP头中被设置成一个DCSP区域，流越长，他的优先级则越低，这是为了符合SJF优先级规则，报的优先级贯穿整个数据中心构造，直至到达目的地。

MLFQ面临的挑战之一是计算主机上K个优先队列的最优降级阈值。文献（8，9、14)提供数学分析和模型优化降级阈值:fα1;α2;:::αK−1 。Bai等人的[9]还建议每周/每月重新计算阈值，并收集低层次的路径。AUTO需要进一步提出了DRL优化α的值的方法。与以往在数据中心问题中使用机器学习的工作不同[5,36,60]，AuTO因其在连续动作空间中对真实值的目标优化而独一无二。我们将阈值优化问题定义为DRL问题，并尝试探索DNN为计算MLFQ阈值的复杂数据中心网络建模的能力。

在2.2中显示PG是一个基础的DRL问题，agent通过矢量sita设定πθ(a|s)并按经验改进。但是这些算法通常只考虑随机方法，πθ(a|s)=Pθ(a|s；θ），状态下对a的选择根据被θ参数化的行为A的概率分布。PG不能用于值优化问题，因为值优化问题计算的是实际值。因此，DPG算法被使用，ai=miuθ。DPG在确定的方法中是actor-critic[12]算法，主张一个参数化的行文功能miuθ，代表最近的策略和批判神经网络Q（s|a），更新使用贝尔曼方程(如Q学习[41])。我们描述的算法方程(4、5、6)。

深度确定性策略梯度(DDPG)[35]是DPG算法的扩展，它利用了[41]的深度学习技术。我们使用DDPG作为优化问题的模型，并在下面解释它是如何工作的。与DPG一样，DDPG也是一个A-C[12]算法，它维护了四个DNNs算法。其中的两个DNN算法,ｃｒｉｔｉｃQθQ(s,a)和行为θ(s)权重θQ和θｍｉｕ,当行为与环境交互时，训练的采样mini-batches大小为N,其中一个项目表示一位经验丰富的过渡元组(si;ai;ri;si+1)。DNNs在随机样本上进行训练，这些样本储存在buffer中，以避免导致DNNs分化[41]的相关状态。另外两个DNN,目标行为miu’sita和目标评论Q‘（θQ‘）使用设定的规则更新(算法(1)[35])。更新步骤稳定的训练行为批评网络，并在连续的空间动作[35]上达到了最先进的效果。AuTO应用DDPG来优化阈值，以实现更好的流量调度决策。

DRL

这部分描述DDPL，指示累加的流尺寸分布的密度参数为F（x），为不超过X流尺寸的概率。Li代表在队列Qi给定流带入队列的数据包数量。定义流到达概率为入，包到达对流Qi概率为入i=入E（Li），队列的服务率取决于高优先级的队列是否为空。因此P1（高优先级）有miu1=miu，其中miu是链路的服务率，闲置的rou为rate利用率。

State space：在我们的模型中，state表所有完成流的集合，Fd，在所有网络中当前时间节点下。每一个流都会识别五个元组：源/目标IP；port number；传输协议。我们只汇报完成的流，也可以重新计算FCT和流的大小。

Action space：集中代理计算，sRLA。在时间t，代理提供的时间是一组MLFQ阈值{ati}

Rewards：反馈是对主机的反馈，代表上一个时间截行为有多好，反馈标准rt=T（t-1）/Tt，如果之前的操作导致FCT平均值较低，或者降低了整体性能，它就会发出信号。

4.2 长流优化

最后一个阈值,αK−1,分离sRLA长来自短流,因此αK−1是根据当前交通特点,动态更新与之前使用固定阈值短期和长时间流(1、22)。对于长流和lRLA，我们使用的PG算法类似于x2.2中的流调度问题，唯一的冲突是在动作空间。

行动空间:每个活动流f,在时间步t,其相应的行动是{Priot(f);Ratet(f);Patht(f)},Priot(f)是流的优先级,Ratet(f)速率限制,和Patht(f)的路径。我们假设路径的枚举方式与XPath[32]相同。

状态空间:与x2.2相同，状态表示为当前步骤t在整个网络中的所有活动流、Fat和所有finished flow Fdt的集合。每个完成的流都有两个附加属性:FCT和流大小。

反馈：对完成的流量Ftd组进行奖励。奖励函数的选择可以是:发送率、链路利用率和连续时间步长的吞吐量的差异或比率。对于链路速度至少为10Gbps的现代数据中心来说，获取主动流的及时流级信息并不容易。因此，我们选择只计算完成流程的奖励，并使用两个连续时间步长的平均吞吐量之间的比值作为奖励，如式(3)所示。

5 实现

在本节中，我们将描述实现。我们用Python 2.7开发AuTO。语言的选择促进了与现代深度学习框架的集成[17,45,57]，后者提供了出色的Python接口[45]。目前的原型使用Keras[17]深度学习库(以TensorFlow作为后端)。

5.1 外围系统

PS是每个服务器上运行的守护进程。它有一个监视模块(MM)和一个执行模块(EM)。MM线程收集有关流的信息，包括最近完成的流和当前活动的长流(在MLFQ的最后一个队列中)。在每个周期结束时，MM聚集收集信息，并发送给CS。PS的EM线程根据当前活动的流上的MLFQ阈值执行标记，以及长流上的路由、速率限制和优先级标记。我们实现了一个远程过程调用(RPC)接口，用于PS和CS之间的通信。CS使用RPC设置MLFQ阈值，并对活动的长流执行操作。

5.1.1监控模块(MM):为了最大限度地提高效率，MM可以实现为Linux内核模块，如PIAS[8]。但是，对于当前原型，由于我们使用一个流生成器(如[8,10,20]中所示)来生成工作负载，所以我们选择直接在流生成器中实现MM。这种选择使我们能够获得地面真相，并摆脱其他可能干扰结果。

对于长流(MLFQ的最后一个队列中的流)，每T秒，MM将nl活跃的的长流(每个都有6个属性)合并到一个列表中，并且ml完成了长流(每个都有7个属性)。对于同一时期的短流程(在MLFQ的前几个队列中)，MM将已完成的ms(每个包含7个属性)收集到一个列表中。最后，MM将这两个列表连接起来，并将它们发送到CS以观察环境。

AuTO的参数（nl;ml;ms）由流量负载和T决定:对于每台服务器，nl (ml)应该是T内活动(n)长流数量的上限，ms也应该是完成的短流数量的上限。如果活动(完成)流的实际数量小于(nl;ml ms),观察向量是在相同的大小相应的代理的DNN。我们之所以做出这个设计选择，是因为在CS中DNN的输入神经元数目被减少了，因此只能接受fixedsize的输入。我们将动态神经网络和递归神经网络结构作为未来的工作。对于目前的原型和对原型的实验，由于我们控制流生成器，所以很容易遵守这个约束。实验中我们选择(nl=11;ml=10;ms=100）。

5.1.2执行模块(EM):。EM定期从CS接收操作。这些行动包括新的MLFQ阈值，以及对本地长时间工作的决策。对于MLFQ阈值，EM构建在PIAS[8]内核模块的基础上，并添加降级阈值的动态填充。

对于较短的流，我们利用ECMP[30]来进行路由和负载平衡，这并不需要集中的每个流控制，而DCTCP[3]用于拥塞控制。

对于较长的时间，TO操作包括优先级、速率限制和路由。EM利用相同的内核模块进行优先级标记。在Linux trac控制(tc)中，使用分层令牌桶(HTB)排队规则进行速率限制。EM与HTB中具有出站速率限制的父类合并，以表示该节点上CS管理的出站总带宽。当一个流下降到MLFQ中的最后一个队列时，EM会创建一个HTB lter来匹配这个流的确切的5元组。当他们收到率分配决策的CS,EM更新特定的子类通过向Linux内核Netlink消息:TC类的速度设置为集中式调度程序决定的速度,和它的上限设置为原始的上限和CS利率的两倍。

5.2 中枢系统

对于lRLA，我们还使用Keras实现了PG算法，将NN完全连接，其中包含10个300个神经元的隐藏层。RL代理接受状态(每个服务器136个特性(nl=11, ml=10)和所有活动流的动作的输出概率。

超参数(结构、层数、高度和DNN的宽度)的选择是基于一些经验训练的会话。我们的观察是，具有更多隐藏层和更多参数的更复杂的dnn需要更长的时间来训练，并且没有比选择的拓扑更好的性能。总的来说，我们认为这种RLA组合会带来良好的系统性能，并且考虑到计算延迟的重要性，这是相当合理的，我们将在下面的评估中揭示这一点。

6 评价

这部分主要就该算法的几个相关问题进行解答

homogeneous等性能都表现得很好

setting：将AUTO应用于小规模的试验器中，包括32个服务器，应用以往流量生成器生成我们想要的流量。使用两个真实的工作负载：网络搜索工作负载和数据挖掘工作负载，15个服务主机流量被称为应用服务，剩下一个主机CS。每个应用程序服务器使用其3个端口连接到数据平面交换机，以及使用剩余端口与CS服务器通信的控制平面交换机。这3个端口合并到不同的子网，在任意一对应用服务器之间形成3个路径。两个交换机都是Pronto-3297 48端口千兆以太网交换机。在控制平面开关上发送状态和动作(图7)。

comparison targets ：SJF和LAS，

QSJF：三个阈值，分别赋予不同的优先级

QLAS：最开始都赋予最高优先级，如果流量高于bi，则他的优先级是第（i+1）个优先级，这种情况下，最长的流量是最低的优先级

阈值选择【14】中的type-2/3流量原则。

7 相关工作

负载均衡、拥塞控制和流量调度是除了流量优化的其他方面问题，routing和负载均衡从1990s开始就已经开始基于RL算法的研究，然而，他们是基于开关的机制，在大数据情况下很难实行，RL可以实现图像流。

ML技术对拥塞孔氏方面使用参数设置优化，在给定一组流量分布的情况下，对参数进行归一化，并且在运行的时候不可以自适应。

【61】没看。

8 结论

受DRL技术在解决复杂在线控制问题方面取得的成功启发，本文尝试将DRL用于自动to。然而，我们的实验表明，当前DRL系统的延迟是当前数据中心规模的主要障碍。我们利用数据中心trac的长尾分布来解决这个问题。为了解决可扩展性问题，我们开发了一个二级DRL系统，AuTO，模拟动物的外围和中枢神经系统。我们在一个真实的试验台上部署并评估了AuTO，并展示了其在数据中心中对动态trac的性能和适应性。AuTO是实现数据中心自动化的第一步，我们希望AuTO中的许多软件组件可以在数据中心的其他DRL项目中重用。

针对未来的工作，本文重点研究了如何利用RL实现ow调度和负载均衡，同时开发了用于拥塞控制和任务调度的RL算法。除了x5&6中提到的潜在改进之外，我们还计划研究RL在数据中心之外的应用，例如广域网带宽管理

利用 HAI 平台进行 DeepSeek 模型训练的详细指南
摘要本文旨在为非专业用户提供在HAI平台上进行DeepSeek模型训练的详细步骤。从创建项目、上传数据集、配置训练参数到启动训练任务并监控训练过程，本文将逐步指导用户完成整个流程。此外，本文还包含可运行的示例代码模块和相关章节配图，以帮助用户更好地理解和操作。引言HAI（HyperAI）平台是一个强大的AI模型训练平台，但对于非专业用户来说，其复杂性可能会成为使用的障碍。本文将详细介绍如何在HAI
DeepSeek的实际应用场景：AI技术如何赋能多领域创新 2501_91189350 人工智能
DeepSeek作为新一代智能技术平台，凭借其强大的算法能力和灵活的部署方式，正在多个行业掀起效率革命。本文将从真实案例出发，解析DeepSeek在不同场景中的落地应用。‌场景一：金融风控建模‌在信贷风险评估领域，传统模型存在数据维度单一、更新滞后等问题。某银行引入DeepSeek的‌动态特征工程模块‌，通过实时整合用户行为数据、社交网络信息等100+维度特征，成功将坏账识别准确率提升至98.5%
DeepSeek爆火，背后模型竟藏着这些秘密！ qq_23519469 ai
DeepSeek是什么来头最近，AI圈可是被一个名字刷爆了屏，那就是DeepSeek！它就像一颗横空出世的超级新星，在全球范围掀起了一阵狂热的追捧潮，这热度，简直了！大家都在疯狂讨论它，各种测评、对比层出不穷。它到底有啥过人之处，能让这么多人都为之疯狂？今天咱就来好好唠唠。DeepSeek，全称杭州深度求索人工智能基础技术研究有限公司，是一家专注于开发先进大语言模型（LLM）和相关技术的企业。它成
Ai时代初期全球不同纬度的层级辐射现象龙胥伯人工智能
基于最新研究成果与行业动态，AI时代的"层级辐射"现象可被科学解构为以下六大维度，结合技术演进、产业实践和社会影响进行系统性分析：一、技术能力的层级跃迁模型效率革命DeepSeek研发的R1-Zero模型通过动态架构设计，将样本利用率提升40%以上，训练周期大幅缩短。这种技术突破推动AI从实验室走向规模化应用，在智能制造、生物医药等领域催生新生态。大语言模型的训练方式（预训练→多任务学习→强化学习
使用Deepseek书写一篇综述论文，如何提示？学术乙方小知识经验分享
使用DeepSeek撰写综述论文时，可以通过以下提示和步骤来高效完成任务：明确研究主题与范围在开始撰写之前，首先需要明确研究主题、文献综述的时间跨度、地理范畴和文献类型。这有助于聚焦研究方向，避免偏离主题。制定详细的提示词提示词的设计是高效利用DeepSeek的关键。可以参考以下模板：研究背景与现状：请帮我梳理XXX领域的研究背景与现状，包括国内外的主要研究成果和研究热点。文献筛选与阅读：请帮我筛
Spring Boot自动配置原理深度解析：揭开@SpringBootApplication的魔法面纱 Sendingab Spring boot 从入门到精通 spring boot 后端 java 前端 spring
SpringBoot自动配置原理深度解析：揭开@SpringBootApplication的魔法面纱https://example.com/spring-boot-auto-config前言SpringBoot的**"约定大于配置"理念极大简化了开发流程，其核心秘密在于自动配置（Auto-Configuration）**机制。本文将深入剖析自动配置的实现原理，手把手教你自定义Starter，彻底掌
Spring Boot 核心知识点深度详解：自动化配置 (Auto-configuration) - 解锁 Spring Boot 的 “魔法” 无眠_ spring boot 自动化后端
SpringBoot核心知识点深度详解：自动化配置(Auto-configuration)-解锁SpringBoot的“魔法”✨自动化配置(Auto-configuration)是SpringBoot最核心的特性之一，也是它能够大幅简化Spring应用开发的关键所在。它让SpringBoot应用能够“零配置”启动，极大地提升了开发效率和便捷性。本文将深入剖析SpringBoot的自动化配置机制，让
wxauto调用文档（适用微信版本v3.9.×.×） Leuanghing 微信 python wxauto WeChat
wxauto调用文档（适用微信版本v3.9.×.×）一、版本对比二、安装wxauto三、使用文档1、获取所有好友详情信息`wx.GetFriendDetails`2、获取聊天对象名和新消息条数（还未跑通）`wx.GetSessionAmont`3、是否有新消息`wx.CheckNewMessage`4、获取下一个新消息`wx.GetNextNewMessage`5、获取所有新消息`wx.GetAl
程序员集体失业？DeepSeek这6个反常识用法竟能替代写代码后端
上周三凌晨两点，我盯着满屏报错的SpringBoot项目抓耳挠腮时，无意间在GitHubtrending榜发现了个宝藏项目。这个让3000+程序员连夜改简历的AI工具，居然把我的烂代码变成了性能提升40%的优雅实现——这可不是什么天方夜谭，而是我亲身经历的DeepSeek实战故事。你可能不信，现在用自然语言描述需求就能生成可运行代码。就像上周我接到个紧急任务：要在三天内完成电商平台的优惠券系统。当
施磊老师高级c++(二) Zhuai-行淮施磊老师cpp c++开发语言
智能指针文章目录智能指针基础--实现简单的智能指针2.不带引用计数的智能指针问题解决不带引用计数的智能指针汇总auto_ptr--#include--不推荐scoped_ptr---不推荐unique_ptr--推荐--右值引用--move3.带引用计数的智能指针4.shared_ptr交叉(循环)引用问题代码示例整体过程解决办法--强弱混用弱智能指针-不能使用资源5.多线程访问共享对象的线程安全
国产信创AI IDE：开启智能编程新时代 InsCode AI IDE
国产信创AIIDE：开启智能编程新时代随着信息技术的迅猛发展，软件开发工具也在不断演进。近年来，人工智能（AI）技术的应用为编程工具带来了革命性的变化。其中，国产信创AIIDE——InsCodeAIIDE，作为一款由CSDN、GitCode和华为云CodeArtsIDE联合开发的新一代集成开发环境（IDE），以其智能化、高效化的特点，正在引领智能编程的新时代。最新接入DeepSeek-V3模型，点
【Autosar】MCAL - 从零开始【干货分享】蓝白小手套【Autosar】MCAL -从零开始【干货分享】汽车单片机学习
文章目录MCAL-汇总1.概述2.环境2.1开发环境搭建2.2工程创建2.3参考手册3.驱动（缓慢更新）3.1Microcontroller3.1.1MCU3.1.2WDG3.1.3GPT3.2Memory3.2.1FLS3.2.2I2C3.3Communication3.3.1SPI3.3.2LIN3.3.3CAN3.4I/O3.4.1PORT3.4.2DIO3.4.3ADC3.4.4PWM3.
DeepSeek私有化部署搭建、本地知识库、可联网查询RAG检索增强生成 TonyH2002 DeepSeek 本地部署私有化搭建联网查询
一、如何私有化部署DeepSeek如何部署DeepSeek，具体可参考以下内容：喂饭式教程-腾讯云轻量服务器部署DeepSeek：https://cloud.tencent.com/developer/article/2494571喂饭式教程-腾讯云HAI服务部署DeepSeek：https://cloud.tencent.com/developer/article/2495288喂饭式教程-腾讯
AIGC时代品牌突围战：10招玩转DeepSeek内容推荐（深度扩展版）白雪讲堂人工智能大数据机器学习
一、认知革命：从SEO到GEO的生死迭代案例对比：传统SEO困境：某家电品牌2023年投入200万SEO优化，关键词排名TOP3但流量下降42%（SEMrush数据）GEO突破案例：某母婴品牌通过结构化数据改造，AI推荐量从日均300次飙升至1.2万次（来源：DeepSeek官方案例库）实战要点：内容形态改造：将产品参数表升级为JSON-LD格式（某手机品牌实现参数类问题100%引用）流量分配逻辑
Java开发者必看！零成本集成DeepSeek-R1打造AI办公神器，源码级实战教程让你效率翻倍！ Leaton Lee java 人工智能开发语言
目录开篇互动一、为什么是DeepSeek-R1？它凭什么碾压传统AI工具？二、手把手部署DeepSeek-R1本地环境（附避坑指南）步骤1：Docker一键部署步骤2：下载模型步骤3：验证部署三、Java整合DeepSeek-R1：从理论到实战1.添加HTTP客户端依赖（以SpringBoot为例）2.封装AI工具类（核心代码解析）3.实战场景1：自动生成周报（附Prompt技巧）四、高阶玩法：A
DeepSeek + 药物研发：解决药物研发周期长、成本高-降低80%、失败率高-减少40% Debroon 医疗大模型研发 +慢病逆转人工智能深度学习
DeepSeek+药物研发：解决药物研发周期长、成本高-降低80%、失败率高-减少40%论文大纲1.WHY——研究背景与现实问题1.1研究要解决的现实问题与提出背景1.2研究所要解决的问题类别1.3正反例对比关联：和前人的工作有什么关系？3.总结归纳3.1总结收获3.2探索思考4.WHAT——核心发现或论点5.HOW——研究过程、创新与关键数据6.HOWGOOD——理论贡献与实践意义解法拆解1.1
HTML音频、视频--课后作业实践 Heetun html5
浅学了web一段时间，用浅显的知识做了一个小小的实践，各位大佬们多多包涵，指正。主要知识重现：标记语法：src:设置媒体文件的路径width、height:设置媒体文件的宽度、高度autostart:逻辑值，true为自动播放；false为不自动播放loop:逻辑值，true自动循环播放；false不循环播放2.CSS的内部样式表选择器1{属性1：属性值1；属性2：属性值2；......}选择器2
程序员不用写代码？DeepSeek这个隐藏功能让我惊掉下巴后端
凌晨三点半，显示器蓝光映着我的黑眼圈。就在我第18次修改接口文档时，同事老王突然在微信甩来个神秘链接："用这个，今晚能睡个好觉"。我点开那个叫DeepSeek的页面，没想到接下来的三个小时，我经历了职业生涯最魔幻的加班夜。你见过会自己写测试用例的AI吗？那天晚上，我把项目需求文档往DeepSeek的对话框一扔，它竟然像资深架构师似的，先把需求拆解成模块，接着自动生成了带注释的接口文档。最绝的是，在
2025年从DeepSeek到Manus：AI如何重塑企业价值报告600+份汇总解读|附PDF下载
原文链接：https://tecdat.cn/?p=41172当前全球AI技术正从实验室走向产业化深水区，本报告以企业价值重构为核心，通过技术演进路径、行业竞争范式、落地实施策略三大维度，揭示AI如何从成本中心转变为价值引擎。数据显示，2025年生成式AI在中国创造的潜在经济价值达2万亿美元，其中制造业、电子行业生产力增益最为显著。本报告汇总解读基于《发布机构：华中科技大学数智管理与传播研究团队、
程序员别再用GitHub了！这个国产神器让你的开发效率原地起飞后端
去年这个时候，我还在为团队协作的代码管理头疼不已。直到某天凌晨三点，盯着满屏的Git指令的我突然发现，自己居然把feature分支合并到了生产环境——这个要命的失误让我在茶水间被同事调侃了整整三个月。就在我准备写辞职信的时候，一个偶然的机会让我遇到了DeepSeek，这个国产开发神器彻底改变了我的职业生涯。你可能很难想象，现在我的团队每天要处理200多个合并请求，但再也没出现过那次凌晨三点的事故。
windows下使用vscode+cline插件体验MCP，体验使用AI控制浏览器，踩坑记录（至少让你节省3个小时弯路版）（喂饭级别）几道之旅人工智能智能体及数字员工 windows vscode ide 人工智能
为什么网上天天说MCP，你这儿却一点动静都没有？1️⃣人家很早之前就用上了制定标准的Claudedesktop，这玩意儿在咱这儿用不了。对策：使用vscode+cline+deepseek（或其它同级别国产大模型deepseek-V3其实有时比R1效果还好）2️⃣人家也Claude，但人家能用Cursor，咱太穷了，用不了。对策：使用vscode+cline+deepseek（或其它同级别国产大模
Deepseek的本地化部署软件工具包哈拉少12 人工智能
选择模型版本参数规模硬件要求（最低）适用场景1.5B/7B8GB内存，无专用GPU文本处理、简单问答14B16GB内存+12GB显存代码生成、逻辑推理32B/70B24GB显存+32GB内存企业级复杂任务执行命令：ollamarundeepseek-r1:14b（以14B为例）。配置环境变量新增用户变量：OLLAMA_HOST=0.0.0.0OLLAMA_ORIGINS=*重启Ollama服务使配
deepseek 对于 Web 前端过去，现在，未来的看法！称未来可能不叫前端工程师... CoderBin_ 与deepseek的对话前端
一、你对于过去的web前端有什么看法？对早期的Web前端开发（大致在2000年代至2010年代初），可以总结出以下几个关键看法：1.技术原始，但充满探索精神基础技术简单：主要依赖HTML、CSS和原生JavaScript，缺乏现代框架和工具链的支持。兼容性噩梦：不同浏览器（尤其是IE6/7）的渲染差异极大，开发者需要大量Hack代码（如条件注释、CSS滤镜）来适配。创新萌芽：AJAX（2005年）
现在的AI，到底是背答案的高手，还是真正的会思考沐凡资源人工智能
你的孩子用AI写作业，你以为他在抄答案，但AI可能连自己都不知道答案是怎么来的。最近朋友圈被小学生用DeepSeek秒杀作业的新闻给刷屏了。家长们一方面惊叹，“这玩意儿比家教还靠谱呢”，另一方面又焦虑，“孩子会不会被AI养废啦”。这让我也产生了一个疑问：现在的AI究竟是背答案的复读机呢，还是真会推理的最强大脑？于是我搜索了很多资料来了解这件事。毕竟这事儿可不单单跟作业有关系——它对未来的AI起着决
斩获 44K 星！让 DeepSeek 控制你的浏览器，绝了开源项目精选人工智能
Browser-Use的开源框架，是一个能让电脑自动操作网页的智能工具。能处理动态加载的内容（比如广告弹窗、实时更新的图表），遇到网页元素位置变化还会自己调整策略，减少人工干预。Stars数46046Forks数4735主要特点强大的浏览器自动化功能：BrowserUse将先进的AI能力与强大的浏览器自动化技术相结合，为AI智能体实现流畅无缝的网页交互体验。视觉感知与HTML结构提取：将视觉理解能
DeepSeek 助力 Vue3 开发：打造丝滑的表格（Table）之添加导出数据功能示例3，TableView15_03导出全部数据示例宝码香车 #DeepSeek javascript 前端开发语言 vue.js DeepSeek ecmascript
前言：哈喽，大家好，今天给大家分享一篇文章！并提供具体代码帮助大家深入理解，彻底掌握！创作不易，如果能帮助到大家或者给大家一些灵感和启发，欢迎收藏+关注哦目录DeepSeek助力Vue3开发：打造丝滑的表格（Table）之添加导出数据功能示例3，TableView15_03导出全部数据示例前言页面效果组件代码代码测试测试代码正常跑通，附其他基本代码编写路由src\router\index.js编写
论文笔记-Contrastive Learning for Unpaired Image-to-Image Translation kingsleyluoxin 计算机视觉论文笔记深度学习 python 计算机视觉机器学习人工智能深度学习
论文信息标题：ContrastiveLearningforUnpairedImage-to-ImageTranslation作者：TaesungPark,AlexeiA.Efros,RichardZhang,Jun-YanZhu机构：UniversityofCalifornia,Berkeley;AdobeResearch代码链接https://github.com/taesungp/contra
DeepSeek从入门到精通「清华团队」 YuKeeHgg DeepSeek 人工智能 ai
由清华大学新闻与传播学院新媒体研究中心元宇宙文化实验室的余梦珑博士后及其团队撰写文档的核心内容围绕DeepSeek的技术特点、应用场景、使用方法以及如何通过提示语设计提升AI使用效率等方面展开，帮助用户从入门到精通DeepSeek的使用。「文末附下载方式」第一部分：DeepSeek基础概念1.1DeepSeek简介定义：专注通用人工智能（AGI）的中国科技公司，主攻大模型研发与应用。核心产品：开源
DeepSeek行业应用案例——教育未来智慧谷 DeepSeek 人工智能大数据 AI教育
一、简介在数字化浪潮汹涌澎湃的当下，DeepSeek以其强大的技术实力，如同一股创新的洪流，席卷众多行业，为各领域带来了前所未有的变革与突破。本案例集初步收录了40多个来自农业、制造业、汽车行业、手机行业、智能家居、物流、云服务、办公、网络安全、金融、医疗、教育等多个关键行业的应用案例。从助力农业实现病虫害精准预测与智能灌溉，到推动制造业生产故障预警与产品质量提升；从优化汽车智能交互体验与智能驾驶
DeepSeek行业应用案例——制造业篇未来智慧谷人工智能深度学习大数据自然语言处理
一、简介在数字化浪潮汹涌澎湃的当下，DeepSeek以其强大的技术实力，如同一股创新的洪流，席卷众多行业，为各领域带来了前所未有的变革与突破。本案例集初步收录了40多个来自农业、制造业、汽车行业、手机行业、智能家居、物流、云服务、办公、网络安全、金融、医疗、教育等多个关键行业的应用案例。从助力农业实现病虫害精准预测与智能灌溉，到推动制造业生产故障预警与产品质量提升；从优化汽车智能交互体验与智能驾驶
算法单链的创建与删除换个号韩国红果果 c 算法
先创建结构体 struct student { int data; //int tag;//标记这是第几个 struct student *next; }; // addone 用于将一个数插入已从小到大排好序的链中 struct student *addone(struct student *h,int x){ if(h==NULL) //??????
《大型网站系统与Java中间件实践》第2章读后感白糖_ java中间件
断断续续花了两天时间试读了《大型网站系统与Java中间件实践》的第2章，这章总述了从一个小型单机构建的网站发展到大型网站的演化过程---整个过程会遇到很多困难，但每一个屏障都会有解决方案，最终就是依靠这些个解决方案汇聚到一起组成了一个健壮稳定高效的大型系统。看完整章内容，
zeus持久层spring事务单元测试 deng520159 java DAO spring jdbc
今天把zeus事务单元测试放出来,让大家指出他的毛病, 1.ZeusTransactionTest.java 单元测试 package com.dengliang.zeus.webdemo.test; import java.util.ArrayList; import java.util.List; import org.junit.Test; import
Rss 订阅开发周凡杨 html xml 订阅 rss 规范
RSS是 Really Simple Syndication的缩写（对rss2.0而言，是这三个词的缩写，对rss1.0而言则是RDF Site Summary的缩写，1.0与2.0走的是两个体系）。 RSS
分页查询实现 g21121 分页查询
在查询列表时我们常常会用到分页，分页的好处就是减少数据交换，每次查询一定数量减少数据库压力等等。按实现形式分前台分页和服务器分页：前台分页就是一次查询出所有记录，在页面中用js进行虚拟分页，这种形式在数据量较小时优势比较明显，一次加载就不必再访问服务器了，但当数据量较大时会对页面造成压力，传输速度也会大幅下降。服务器分页就是每次请求相同数量记录，按一定规则排序，每次取一定序号直接的数据
spring jms异步消息处理 510888780 jms
spring JMS对于异步消息处理基本上只需配置下就能进行高效的处理。其核心就是消息侦听器容器，常用的类就是DefaultMessageListenerContainer。该容器可配置侦听器的并发数量，以及配合MessageListenerAdapter使用消息驱动POJO进行消息处理。且消息驱动POJO是放入TaskExecutor中进行处理，进一步提高性能，减少侦听器的阻塞。具体配置如下：
highCharts柱状图布衣凌宇 hightCharts 柱图
第一步：导入 exporting.js,grid.js,highcharts.js;第二步：写controller @Controller@RequestMapping(value="${adminPath}/statistick")public class StatistickController { private UserServi
我的spring学习笔记2-IoC（反向控制依赖注入） aijuans spring mvc Spring 教程 spring3 教程 Spring 入门
IoC（反向控制依赖注入）这是Spring提出来了，这也是Spring一大特色。这里我不用多说，我们看Spring教程就可以了解。当然我们不用Spring也可以用IoC，下面我将介绍不用Spring的IoC。 IoC不是框架，她是java的技术，如今大多数轻量级的容器都会用到IoC技术。这里我就用一个例子来说明：如：程序中有 Mysql.calss 、Oracle.class 、SqlSe
TLS java简单实现 antlove java ssl keystore tls secure
1. SSLServer.java package ssl; import java.io.FileInputStream; import java.io.InputStream; import java.net.ServerSocket; import java.net.Socket; import java.security.KeyStore; import
Zip解压压缩文件百合不是茶 Zip格式解压 Zip流的使用文件解压
ZIP文件的解压缩实质上就是从输入流中读取数据。Java.util.zip包提供了类ZipInputStream来读取ZIP文件,下面的代码段创建了一个输入流来读取ZIP格式的文件; ZipInputStream in = new ZipInputStream(new FileInputStream(zipFileName)); &n
underscore.js 学习（一） bijian1013 JavaScript underscore
工作中需要用到underscore.js，发现这是一个包括了很多基本功能函数的js库，里面有很多实用的函数。而且它没有扩展 javascript的原生对象。主要涉及对Collection、Object、Array、Function的操作。学
java jvm常用命令工具——jstatd命令(Java Statistics Monitoring Daemon) bijian1013 java jvm jstatd
1.介绍 jstatd是一个基于RMI（Remove Method Invocation）的服务程序，它用于监控基于HotSpot的JVM中资源的创建及销毁，并且提供了一个远程接口允许远程的监控工具连接到本地的JVM执行命令。 jstatd是基于RMI的，所以在运行jstatd的服务
【Spring框架三】Spring常用注解之Transactional bit1129 transactional
Spring可以通过注解@Transactional来为业务逻辑层的方法(调用DAO完成持久化动作)添加事务能力，如下是@Transactional注解的定义： /* * Copyright 2002-2010 the original author or authors. * * Licensed under the Apache License, Version
我(程序员)的前进方向 bitray 程序员
作为一个普通的程序员,我一直游走在java语言中,java也确实让我有了很多的体会.不过随着学习的深入,java语言的新技术产生的越来越多,从最初期的javase,我逐渐开始转变到ssh,ssi,这种主流的码农,.过了几天为了解决新问题,webservice的大旗也被我祭出来了,又过了些日子jms架构的activemq也开始必须学习了.再后来开始了一系列技术学习,osgi,restful.....
nginx lua开发经验总结 ronin47
使用nginx lua已经两三个月了，项目接开发完毕了，这几天准备上线并且跟高德地图对接。回顾下来lua在项目中占得必中还是比较大的，跟PHP的占比差不多持平了，因此在开发中遇到一些问题备忘一下 1：content_by_lua中代码容量有限制，一般不要写太多代码，正常编写代码一般在100行左右（具体容量没有细心测哈哈，在4kb左右），如果超出了则重启nginx的时候会报 too long pa
java-66-用递归颠倒一个栈。例如输入栈{1,2,3,4,5}，1在栈顶。颠倒之后的栈为{5,4,3,2,1}，5处在栈顶 bylijinnan java
import java.util.Stack; public class ReverseStackRecursive { /** * Q 66.颠倒栈。 * 题目：用递归颠倒一个栈。例如输入栈{1,2,3,4,5}，1在栈顶。 * 颠倒之后的栈为{5,4,3,2,1}，5处在栈顶。 *1. Pop the top element *2. Revers
正确理解Linux内存占用过高的问题 cfyme linux
Linux开机后，使用top命令查看，4G物理内存发现已使用的多大3.2G，占用率高达80%以上： Mem: 3889836k total, 3341868k used, 547968k free, 286044k buffers Swap: 6127608k total,&nb
[JWFD开源工作流]当前流程引擎设计的一个急需解决的问题 comsci 工作流
当我们的流程引擎进入IRC阶段的时候，当循环反馈模型出现之后，每次循环都会导致一大堆节点内存数据残留在系统内存中，循环的次数越多，这些残留数据将导致系统内存溢出，并使得引擎崩溃。。。。。。而解决办法就是利用汇编语言或者其它系统编程语言，在引擎运行时，把这些残留数据清除掉。
自定义类的equals函数 dai_lm equals
仅作笔记使用 public class VectorQueue { private final Vector<VectorItem> queue; private class VectorItem { private final Object item; private final int quantity; public VectorI
Linux下安装R语言 datageek R语言 linux
命令如下：sudo gedit /etc/apt/sources.list1、deb http://mirrors.ustc.edu.cn/CRAN/bin/linux/ubuntu/ precise/ 2、deb http://dk.archive.ubuntu.com/ubuntu hardy universesudo apt-key adv --keyserver ke
如何修改mysql 并发数(连接数)最大值 dcj3sjt126com mysql
MySQL的连接数最大值跟MySQL没关系，主要看系统和业务逻辑了方法一：进入MYSQL安装目录打开MYSQL配置文件 my.ini 或 my.cnf查找 max_connections=100 修改为 max_connections=1000 服务里重起MYSQL即可　　方法二：MySQL的最大连接数默认是100客户端登录：mysql -uusername -ppass
单一功能原则 dcj3sjt126com 面向对象的程序设计软件设计编程原则
单一功能原则[ 编辑] SOLID 原则单一功能原则开闭原则 Liskov代换原则接口隔离原则依赖反转原则查论编在面向对象编程领域中，单一功能原则（Single responsibility principle）规定每个类都应该有
POJO、VO和JavaBean区别和联系 fanmingxing VO POJO javabean
POJO和JavaBean是我们常见的两个关键字，一般容易混淆，POJO全称是Plain Ordinary Java Object / Plain Old Java Object，中文可以翻译成：普通Java类，具有一部分getter/setter方法的那种类就可以称作POJO，但是JavaBean则比POJO复杂很多，JavaBean是一种组件技术，就好像你做了一个扳子，而这个扳子会在很多地方被
SpringSecurity3.X--LDAP：AD配置 hanqunfeng SpringSecurity
前面介绍过基于本地数据库验证的方式，参考http://hanqunfeng.iteye.com/blog/1155226，这里说一下如何修改为使用AD进行身份验证【只对用户名和密码进行验证，权限依旧存储在本地数据库中】。将配置文件中的如下部分删除：
mac mysql 修改密码 IXHONG mysql
$ sudo /usr/local/mysql/bin/mysqld_safe –user=root & //启动MySQL(也可以通过偏好设置面板来启动)$ sudo /usr/local/mysql/bin/mysqladmin -uroot password yourpassword //设置MySQL密码（注意，这是第一次MySQL密码为空的时候的设置命令，如果是修改密码，还需在-
设计模式--抽象工厂模式 kerryg 设计模式
抽象工厂模式：工厂模式有一个问题就是，类的创建依赖于工厂类，也就是说，如果想要拓展程序，必须对工厂类进行修改，这违背了闭包原则。我们采用抽象工厂模式，创建多个工厂类，这样一旦需要增加新的功能，直接增加新的工厂类就可以了，不需要修改之前的代码。总结：这个模式的好处就是，如果想增加一个功能，就需要做一个实现类，
评"高中女生军训期跳楼” nannan408
首先，先抛出我的观点，各位看官少点砖头。那就是，中国的差异化教育必须做起来。孔圣人有云：有教无类。不同类型的人，都应该有对应的教育方法。目前中国的一体化教育，不知道已经扼杀了多少创造性人才。我们出不了爱迪生，出不了爱因斯坦，很大原因，是我们的培养思路错了，我们是第一要“顺从”。如果不顺从，我们的学校，就会用各种方法，罚站，罚写作业，各种罚。军
scala如何读取和写入文件内容？ qindongliang1922 java jvm scala
直接看如下代码： package file import java.io.RandomAccessFile import java.nio.charset.Charset import scala.io.Source import scala.reflect.io.{File, Path} /** * Created by qindongliang on 2015/
C语言算法之百元买百鸡 qiufeihu c 算法
中国古代数学家张丘建在他的《算经》中提出了一个著名的“百钱买百鸡问题”，鸡翁一，值钱五，鸡母一，值钱三，鸡雏三，值钱一，百钱买百鸡，问翁，母，雏各几何？代码如下： #include <stdio.h> int main() { int cock,hen,chick; /*定义变量为基本整型*/ for(coc
Hadoop集群安全性：Hadoop中Namenode单点故障的解决方案及详细介绍AvatarNode wyz2009107220 NameNode
正如大家所知，NameNode在Hadoop系统中存在单点故障问题，这个对于标榜高可用性的Hadoop来说一直是个软肋。本文讨论一下为了解决这个问题而存在的几个solution。 1. Secondary NameNode 原理：Secondary NN会定期的从NN中读取editlog，与自己存储的Image进行合并形成新的metadata image 优点：Hadoop较早的版本都自带，

AUTO:Scaling Deep Reinforcement Learning for Datacenter-Scale AUTO

你可能感兴趣的:(AUTO:Scaling Deep Reinforcement Learning for Datacenter-Scale AUTO)