AI科技大本营

被追捧为“圣杯”的深度强化学习已走进死胡同

作者 | 朱仲光

编译 | 夕颜

出品 | AI科技大本营（ID:rgznai1100）

【导读】近年来，深度强化学习成为一个被业界和学术界追捧的热门技术，社区甚至将它视为金光闪闪的通向 AGI 的圣杯，大多数人都看好它未来发展的巨大潜力。但是，深度强化学习的本质是什么？人们对它的期望是否理智呢？现在，在一片追捧声中，终于有人开始质疑深度强化学习的真实作用。

2019年过去了，仍然无法迁移到现实世界

2019 年过去了，我想看看 AI 进展到哪一步了。特别是深度强化学习这个被人追捧为人工智能（AGI）具有变革性的关键一步，它的算法可以让机器用一种通用性的方式像人类一样学习做任何事。

几年来，研究人员一直在进行深度强化学习研究，并不断取得进步。围绕深度强化学习的想法和预期是，理论上你可以轻松地训练代理做任何事情，例如开车、洗衣服、玩视频游戏、打扫房屋、解魔方等等，而所有这些都不需要掌握学习过程。其中一些实验取得了一定的成功，比如人们已经教会深度强化学习代理播放一些游戏和棋盘游戏视频，但问题是，一旦迁移到现实世界或生产系统，所有的尝试都以失败告终。到目前为止，我仍然没有看到深度强化学习成功应用到生产系统中的案例。

深度强化学习系统存在很多问题，我不再赘述，有很多博客文章已经在讨论这些问题。

问题究竟出在哪？

哪怕这些存在的问题中只有一点点得到改善或解决，例如找到更抽象的方法来表示神经网络内部的信息，我也不会感到如此震惊。但是，如果你不能解决我认为的核心问题也没关系：人工奖励工程。我要说的是，在深度强化学习中，人们大多数时间都花在了设计奖励功能上，来让代理完成设定的任务。用一个更传统的机器学习术语来说，奖励函数是一个目标函数，该算法使用此函数来了解其是否朝着正确的方向前进，获得的奖励越多，模型就越“好”。

例如，如果要教一个机械臂叠衣物，假设是一堆裤子，你要做的是编写奖励功能，让机械臂正确地把这些裤子叠好。向人类描述这个任务听起来很容易，就是“把裤子叠整齐”，但是计算机并不知道这些规则的含义。对于每个实验，你都必须以某种方式对奖励进行编程，让计算机可以自己衡量进度，而它其实并不了解自己在干什么。因此，你可能在机械臂在开始触摸裤子时给点奖励，抓住裤子再给几分，或者移动裤子也给分。那如何为折叠部分设置奖励呢？折三下要给分吗？折得一点褶子都没有给几分？你花了大量时间在引导代理遵循正确的道路上，最后这基本上变成了一个完全监督的问题。

从理论上讲，你可以让一个人来监视训练的整个过程，然后这个人可以为系统执行的每个动作分打分，但这并不能规模化。这些深度强化学习系统需要进行数万次迭代，尝试各种动作以及随之发生的变化，以找出实现目标的正确顺序，而人类无法监视计算机所采取的所有步骤。目前很多研究正在积极尝试通过模仿学习来进行规模化，但是在我看来，这只是好像在原本就支离破碎的地基上修修补补。

在尝试训练叠衣服机器人的过程中，你可能需要不断调整奖励功能，因为它可能会不小心撕裂裤子，掉落部件，叠反了，或者用奇怪而没有意义的方式叠衣服。奖励工程变成了反复试验来探索有效方法的过程。深度强化学习模型进行各种意外动作的报告不计其数。强化学习通常与有监督和无监督机器学习放在一起被归为第三类，但在我看来，它实际上就是有监督学习。

深度强化学习当前的处理过程是：开始训练模型，然后看着模型挂掉，然后在很长一段时间内反复调整奖励功能，直到可能得到你所需的输出。哪一部分没有提供训练数据？你已经让整个过程更复杂了，而且因为不得不以非直接的方式把答案反馈给代理，一切变得更加困难。如果计算机要从其环境中学习，则必须在 100％无人监督的环境中进行。

为什么深度强化学习被如此追捧？

如果从抽象的角度看待深度强化学习，它会被描述为是一个随着时间的推移从其环境中学习的代理。这看起来是绝对正确的，并且确实模仿了现实世界，所有生物体都是从出生就开始学习如何在其环境中生存和探索。我们之所以知道这一点，是因为我们进行了许多实验，这些实验凭经验向我们表明，如果我们改变和限制新生儿有机体的环境，它们就会学到不同的知识并表现出不同的行为。

深度强化学习与传统的机器学习方法（如监督分类）有很大的不同，后者是一种静态模型，该模型可以获取原始数据，进行回答并构建要在生产中使用的模型。传统深度强化学习框架中存在问题的是信号源。这些人工代理必须直接从自身及其环境中学习，而不是我们提供给他们的某些人为奖励功能。

当 DeepMind 提出用单一的深度强化学习代理学习如何在几乎没有干预的情况下玩 Atari 视频游戏时，人们认为这可以扩展到其他领域甚至 AGI 的各种问题。而我们知道，不能将有机体和人类所做的大多数事情简单地建模为视频游戏中代理不断优化以获取尽可能多的回报。

而且，不要被没有人工干预的深度强化学习赢得了游戏这个噱头唬住了，和 40 年前视频游戏制造商雇用了整个团队来制作这些游戏一样，这个实验中奖励功能设置仍然存在。

许多人误以为深度强化学习是 AGI 的下一步，甚至谷歌也表现出了极大的热情，并斥资 500 多万美元购买了 DeepMind，希望将 AI 提升到一个新的高度。社区似乎也将深度强化学习当作了圣杯，因为这是模仿人类现实行为最接近的机器学习形式，尽管实际上它还差得很远。最终，我们看到的只是一些雕虫小技，这样的 AI 玩具可以玩各种视频游戏、棋盘游戏，但是在其他地方就不灵了。

从更传统的机器学习方法转向深度学习的最大好处是，解放了人力劳动工程。从理论上讲，你可以为模型提供大量数据，让优化算法跑起来，而无需手动编写特征提取代码就可以学习。因此，深度学习已被应用于强化学习的一部分，主要是在代理层面以像素形式获取感知数据，但是如果你仍将大部分时间花在手工设计系统上，那么在我看来它仍然没有发挥应有的作用。这还不算其他深度强化学习面临的问题，例如，如果需要微调，就得做好重新训练整个系统的准备，或者环境中的细微变化通常最终会导致前功尽弃...不得不说，AGI 还任重而道远...

所以，现在我们拥有顶级的机器学习研究机构 DeepMind 和 OpenAI 仍将大部分时间和资源用于深度强化学习。他们不断用公关资源轰炸互联网，展示他们正在取得的巨大进步：深度强化学习可以玩围棋、星际争霸、Dota 2、解魔方等等。

我对他们为何继续花大量时间来构建深度强化学习系统感到困惑，这些系统只不过是以明确定义的规则和积分系统赢了游戏而已。我认为，如果有足够的时间、金钱和计算力，每个人都能暴力破解每个动作，深度强化学习几乎可以击败任何游戏。在我看来，他们的策略很大一部分就是用 PR 稿件放烟雾弹，来展示他们最新的深度强化学习系统是如何击败下一款最棒的游戏，从而忽悠那些并不了解情况的人投资，比如微软最近向 OpenAI 投资 10 亿美元，还有 Google 的银库大门向 DeepMind 敞开。DeepMind 最近的一次高亮时刻（被 Google 收购约 5 年后）是他们训练了一个深度强化学习代理来玩围棋、象棋、将棋和 Atari 游戏。是的，更多视频游戏！我并不是要打击他们，而是真的很高兴他们没有放弃，还在努力解决 AGI 问题。

别玩游戏了，干点实事！

问题在于，他们正在创造大量错误的观念，最终浪费了大量的人力，走进死胡同。首先，他们发布的所有 PR 稿件几乎都是一个模子，比如“我们的文本生成模型（GPT-2）因为太危险而无法发布”，这使得公众认为我们与 AGI 的距离越来越近，而业界中谁都知道这绝对不是真的。其次，更重要的是，他们向 AI 研究人员发送了错误的信号，希望他们将更多时间花在深度强化学习上。许多研究人员和黑客都关注这些公司，看到公关稿泛滥成灾，他们被引导花费大量时间来解决这些相同的问题，而他们本应该把精力集中在更大、更根本的问题上。如果 AI 和 AGI 能够向前发展，我认为是时候停止玩电子游戏，专注于更棘手的问题了。

幸运的是，DeepMind 和 OpenAI 确实在其他问题上费了心思，但是正如我所说的，似乎深度强化学习仍然是他们的主要重点。

当前的深度强化学习系统似乎很适合已接受基础训练的系统。如果代理已经对其环境和自身有基本的了解，考虑一下进行迁移学习。

我们可以观察到，人类婴儿出生后，首先要学会观察形状和颜色、移动手指、触摸物体、控制自己的身体、辨别声音、了解重力、物理学、跌倒、压扁、弹跳、学习物体通透性等。所有这一切都在每个活着的人类和有机体中发生着不同程度的变化。通常，在人类婴儿获得了非常丰富的知识之后，比如走路、抓住物体、使用洗手间、进行基本的交谈等，然后会被送进学校，通过作业、评分和测验等接受更正式、更加结构化的训练。

当前的深度强化学习系统似乎可以很好地用于这种形式化的训练，在这种形式的训练中，可以清楚地达到期望的目标，并且在代理已经对环境有了基本了解之后，大多数情况下会自动进行评分。如果孩子不能背诵 ABC，则失败，如果可以背诵所有字母表，则通过。目前，虽然深度强化学习处于领先地位，但我们正尝试从头训练计算机来完成有时可以奏效的复杂任务，但是由于这些模型是针对特定任务而不是一般性任务进行训练的，因此对它们的环境和内容并没有广义的了解。这最终会导致系统过于脆弱且无法很好地工作。只要奖励功能不固定，就不会有诸如反向传播、DQN、PPO、DDPG、TRPO 之类的较新的学习算法来修复深度强化学习。

可以肯定的是，深度强化学习一定会逐步改进，并可能从星际争霸游戏中获得更多的信息，但是如果不进行架构上的根本转变（允许代理在其环境中在无人监督的情况下学习），它就不会为通用人工智能的圣杯做出巨大的贡献。

我个人的设想是，生物体的奖励功能实际上是由维持体内平衡和最大程度地减少意外驱动的。稳态是生物维持生存所需的稳定条件的过程。每个生物都必须生存并保持其身体与外部环境分开。饥饿时它会进食，疲倦时会睡觉，渴了会喝水，受伤时会休息，被狩猎时会躲开，过热时会降温，等等。这些先天和原始的信号告诉生物体该如何以及在环境中探索时应关注的重点。如果不这样做会导致无法维持体内平衡，最终导致过早死亡。

当生物在四处游荡时，它会建立自己的感觉运动相互作用模型以及与环境相互作用的环境。这个模型开始把所有东西聚合在一起：天黑了，气温会下降，当我打嗝时，我应该听到声音，当我向左移动时，我的视线会移动 X，当动物在我的面前走过时，我预测它还会继续向前，等等。当发生某些事情，使其偏离模型时，模型会重新调整其预测，直到获得期望的结果，这可能会导致更多变化。如果失效，生物体会震惊，并将那些神经元标记为“需要模型更新”，其中重新学习和重新优化可能会实时发生，也可能在生物体处于睡眠状态时发生。在代理的内部环境模型与实际环境之间会进行优化，并持续运行以最大程度地减少意外。

在神经科学和哲学领域，很多人已经在讨论这些想法，比如安迪·克拉克（Andy Clark）的前处理理论，卡尔·弗里斯顿（Karl Friston）的自由能原理。据我所知，我还没有看到这些想法在机器学习环境中得到成功部署。我认为这其中存在许多技术问题：如何在计算机中模拟动态平衡，如何存储模型的内部表示，代理的感知设备与环境之间的分辨率较低以及保真度较低的环境等。

我并不是要写一篇引战的文章，但我想不出向人们解释当前的深度强化学习体系结构存在根本缺陷的办法。我们并不需要更多可以玩更多视频游戏的模型，而是需要实现一个模型，该模型可以学习在完全无监督的环境下学习代理与其环境之间的广义表示。这种新架构可以称为深度强化学习 3.0，或者主动推理、预测处理或完全不同的东西，但请不要在这个死胡同上浪费时间。

深度强化学习研究提出了一些很酷且有趣的工作，但是时候继续赶路了。那个能找到一种方法来构建下一个可以一用无人监督从环境中学习 AI 一般结构的人，将会让这一领域发生巨变，推动整个领域向前发展。

原文链接：

http://www.jtoy.net/blog/deep-reinforcement-learning-is-a-waste-of-time.html

（*本文为AI科技大本营编译文章，转载请微信联系1092722531）

◆

精彩推荐

◆

推荐阅读

阿里达摩院2020趋势第一弹：感知智能的“天花板”和认知智能的“野望”
基于强化学习的自动交易系统研究与发展综述
如何写出让同事膜拜的漂亮代码？
AMD或推出64核128线程HEDT平台；地平线即将推出新一代自动计算平台；阿里达摩院公布2020十大科技趋势……
2019最烂密码榜单出炉，教你设置神级密码！
腾讯回应“暴力裁员”；小米否认常程与联想签有竞业禁止条款；NumPy 1.16.6 发布 | 极客头条
GitHub Action 有风险？！
骗了马云 10 亿被骂 4 年后，院士王坚留下 4 条人生启示
万字长文回望2019：影响区块链行业发展的9大事件

你点的每个“在看”，我都认真当成了AI

AGI的学习与适应能力 AGI大模型与大数据研究院计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
“AGI的学习与适应能力”1.背景介绍1.1人工通用智能(AGI)的定义人工通用智能(ArtificialGeneralIntelligence,AGI)是指能够像人类一样具有广泛的理解和学习能力、可以完成多种复杂任务的人工智能系统。与狭义人工智能(NarrowAI)专注于特定领域和特定任务不同,AGI旨在模拟人类整体认知能力,包括感知、推理、学习、计划、创造力和自我意识等。1.2AGI的重要性和
WinSW-x64(2.12.0)将nginx注册为服务可能有bug 星火91314 nginx bug github
使用的环境是：windowsserver2008R2，WinSW-x64(2.12.0)，nginx1.24.0项目中碰到个需求，配置nginx代理，实现一个端口代理多个端口和地址。本来很轻松的事，结果耗费了一天的功夫，把人都整不自信了。我先修改nginx配置，然后在服务列表中重启nginx服务，这个服务是使用WinSW-64（2.12.0）版注册的，选了最新版的，想着bug会少一些。然后神奇的事
windows python opencv imshow图片报错解决热爱生活热爱你 python3 opencv 人工智能计算机视觉
importcv2#检查版本print(cv2.__version__)#加载一张图片（确保你有一个名为'test.jpg'的文件在当前目录）image=cv2.imread('C:\\test1.jpg')#显示图片cv2.imshow('image',image)cv2.waitKey(0)cv2.destroyAllWindows()cv2意思是opencvc++o(*￣︶￣*)o建议使用A
Dubbo请求调用本地服务 Lorin 洛林 Java 后端经典面试题 dubbo
文章目录前言配置Dubbo本地调用方法一：application.yml中配置方法二：@DubboReference注解中指定注意个人简介前言在微服务架构中，ApacheDubbo作为一款高性能、轻量级的RPC框架，被广泛应用于分布式系统。通常，Dubbo服务是跨进程调用的，但在开发和测试过程中，有时需要在本地调用Dubbo服务，以方便调试和验证。配置Dubbo本地调用默认情况下，Dubbo通过注
Linux 找回 Root 密码（多发行版本）可问可问春风 Linux从新手到入门 linux chrome 运维
适用于大多数Linux发行版（Ubuntu、CentOS、Debian等），无需第三方工具，需物理接触服务器或系统启动权限。步骤1：重启系统并进入GRUB引导菜单重启系统，看到启动画面时，快速按下Esc、Shift或E（不同系统按键不同，可多试几次）。进入GRUB菜单后，选择要修改的系统内核选项（通常第一个），按e进入编辑模式。步骤2：修改内核启动参数找到以linux或linux16或linuxe
多线程到底重不重要？ Vic2334 JAVA java 开发语言
我们先说一下为什么要讲多线程和高并发？原因是，你想拿到一个更高的薪水，在面试的时候呈现出了两个方向的现象：第一个是上天项目经验高并发缓存大流量大数据量的架构设计第二个是入地各种基础算法，各种基础的数据结构JVMOS线程IO等内容多线程和高并发，就是入地里面的内容。基本概念我们先从线程的基本概念开始，给大家复习一下，不知道有多少同学是基础不太好，说什么是线程都不知道的，如果这样的话，花时间去补初级内
R语言高效数据处理-自定义EXCEL数据排版 LEEBELOVED r语言 R语言高效处理数据 excel批处理
注：以下代码均为实际数据处理中的笔记摘录，所以很零散1、自定义excel表数据输出格式、布局在实际数据处理中为了提升效率，将Excel报表交付给需求方时减少手动调整的环节很有必要#1.1设置表头格式header_style=0', style=sheet_style)#数据写入writeData(data_deal_main01,'data_deal_test1',data_de
关于将平板作为副屏的使用 sbuds 平板
我的需求我现在拥有一个联想小新平板(联想小新pad2022),还有一个联想小新电脑(联想小新pro13),原本买联想平板就图个便宜这是真的,但是还有一层就是联想的生态,但是这他喵的,联想的超级互联的生态实在是拉跨,我几乎看了所有的解决方案,还是解决不了连不上的问题.为什么要生态理由应该也很简单,无非就是传输文件比较方便等等,但是作为一个程序员来说,更重要的是我看中的副屏功能,但是联想的生态让我很失
【Python机器学习】2.2. 聚类分析算法理论：K均值聚类(KMeans Analysis)、KNN(K近邻分类)、均值漂移聚类(MeanShift) SomeB1oody Python机器学习机器学习算法 python 聚类分类算法
喜欢的话别忘了点赞、收藏加关注哦（关注即可查看全文），对接下来的教程有兴趣的可以关注专栏。谢谢喵！(=･ω･=)2.2.1.K均值聚类(KMeansAnalysis)K均值算法是以空间中K个点为中心进行聚类，对最靠近他们的对象归类，是聚类算法中最为基础但也最为重要的算法。数学原理计算数据点与各簇中心点的距离：dist(xi,ujt){dist}(x_i,u_j^t)dist(xi,ujt)然后根据
每天10道Java基础面试题，涵盖核心知识点，附简洁代码示例，掌握快速记忆的方法小小鸭程序员 spring boot java 后端开发语言 spring cloud
1.JDK、JRE、JVM区别JDK：开发工具包（含JRE+编译器）JRE：运行环境（含JVM+类库）JVM：执行字节码的虚拟机2.==与equals()区别Stringa="abc",b=newString("abc");System.out.println(a==b);//false（地址不同）System.out.println(a.equals(b));//true（内容相同）3.Stri
你的AI客服为何总抓不住客户核心诉求？（附特征优化方案）人工智能
1特征工程的意义nlp任务中，原始文本经数值映射后形成的词向量序列，难充分表达语言深层语义特征。就需引入文本特征增强技术：语义信息补全：突破单词语义局限，捕获词序关联特征模型适配优化：构建符合算法输入规范的矩阵结构评估指标提升：通过特征增强直接影响模型准确率、召回率等核心KPI如电商评论情感分析场景，单纯用词频特征可能导致"这个手机质量差得惊人"和"这个手机质量惊人地差"被判定为相同语义，此时bi
canvas绘制和数字签名前端
关键是要把存放绘制的信息放到一个二维数组中：绘制时最好不要用定时器进行定时绘制，因为会卡顿，最好使用requestAnimationFrame这个原生js的api方法，因为是以帧的间隔绘制，所以会看起来流畅Documenthtml,body{height:100%;margin:0;padding:0;}.container{width:100%;padding:20px0;display:fle
C语言：数据的存储 c++编程语言
本文重点：数据类型详细介绍整形在内存中的存储：原码、反码、补码大小端字节序介绍及判断浮点型在内存中的存储解析数据类型结构的介绍：类型的基本归类：整型家族浮点家族构造类型：指针类型：空类型：整形在内存中的存储：F10开始逐句调试，再打开窗口中的内存，在搜索栏查看a的地址如下图所示。可以看到在将20存入a的地址中，在内存窗口的表示形式是14000000，再看下图变量b中-10的表示形式。可以看到再内存
LLaMA-Factory 训练数据默认使用 instruction、input、output 三个 key 背太阳的牧羊人模型微调 llama 人工智能大模型微调
在LLaMA-Factory进行SFT（Directivesupervisionfine-tuning指令监督微调）时，训练数据的格式非常重要，因为大模型依赖标准化的数据结构来学习指令-响应模式。identity.json文件的数据采用了“instruction”、“input”、“output”这三个key，它们的作用如下：Key作用示例“instruction”代表用户给AI的指令（问题或任务
Deepseek 使用攻略隔窗听雨眠人工智能
人工智能飞速发展的时代，新的技术和工具不断涌现，Deepseek便是其中备受瞩目的存在。它以强大的功能和出色的表现，吸引了众多用户的关注。今天，就让我们一起来深入了解一下Deepseek究竟是什么，以及如何使用它。一、什么是DeepseekDeepseek（深度求索）是一家位于杭州的人工智能公司，同时也是一系列大语言模型的统称。它由中国对冲基金高毅资产创立并提供支持，其模型均以开源形式发布。Dee
【Node.js】模块分类与 `require` 用法详解 Peter-Lu #NodeJS node.js javascript 前端
文章目录一、Node.js模块概述1.模块的定义2.模块的作用二、Node.js模块的分类1.核心模块2.文件模块3.第三方模块4.全局模块三、`require`的用法详解1.`require`的基本用法2.模块导出机制3.模块的缓存机制4.`require`的动态引入四、模块的实际应用场景1.项目结构优化2.复用代码五、总结Node.js是一个强大的JavaScript运行环境，广泛应用于服务器
推荐文章：探索Devbox —— 打造统一且高效的开发环境薛烈珑Una
推荐文章：探索Devbox——打造统一且高效的开发环境项目地址:https://gitcode.com/gh_mirrors/de/devbox项目介绍在快节奏的软件开发世界中，保持团队成员间开发环境的一致性至关重要。Devbox正是为解决这一痛点而生，它是一个强大的命令行工具，允许开发者快速建立隔离的开发环境。通过简洁的配置文件，团队可以轻松定义所需的所有依赖包，确保无论在哪都能拥有一个一致且纯
Umi-OCR 使用与安装教程平依佩Ula
Umi-OCR使用与安装教程项目地址:https://gitcode.com/gh_mirrors/um/Umi-OCR1.项目目录结构及介绍Umi-OCR的项目结构精心组织，以支持其多方面功能。以下是主要组成部分的概览：Umi-OCR├──Umi-OCR.exe#主执行文件，Windows平台上直接运行的程序├──umi-ocr.sh#Linux上的启动脚本└──UmiOCR-data├──ma
Express.js 是一个轻量级、灵活且功能强大的 Node.js Web 应用框架 getapi 前端 express javascript
Express.js是一个轻量级、灵活且功能强大的Node.jsWeb应用框架，广泛用于构建Web应用程序和API。它以其简洁的语法和模块化设计而闻名，非常适合快速开发后端服务。以下是关于Express.js的详细介绍以及如何高效使用它的指南。1.Express.js的核心特点Express.js提供了一系列强大的功能，使其成为全栈开发中的首选后端框架之一：(1)路由管理支持定义URL路径与处理函
Web三要素：CSS之Flex/Grid布局(4) 双囍菜菜前端随记前端 css
CSS布局革命：Flex与Grid的双子星战法文章目录CSS布局革命：Flex与Grid的双子星战法一、布局进化史：从洪荒时代到现代文明二、Flex布局：一维空间的舞蹈家2.1核心概念深度解析容器属性详解：2.2典型应用场景实战导航栏布局（React示例）垂直居中（Vue示例）三、Grid布局：二维空间的指挥官3.1网格系统深度解析核心概念图解：3.2高级布局技巧实战响应式网格（React示例）复
CMake Error at myplugins_generated_yololayer.cu.o.Debug，tensorrtx编译失败解决雪可问春风 BUG 人工智能
system:ubuntu1804gpu:3060cuda:cuda11.4tensorrt:8.4使用项目tensorrtx进行yolov5的engine生成，之前在编译成功的配置为system:ubuntu1804gpu:2060cuda:cuda10.2tensorrt:7.2.3.4换到3060后，make失败，报错错误：/home/yfzx/work/vs-work/tensorrt-y
如何选择显卡（202408） =PNZ=BeijingL 操作系统经验分享 1024程序员节
（图片来自网络）显卡，也被称为视频卡、图形适配器或GPU（图形处理单元），是电脑中负责渲染图形输出到显示器的关键硬件组件一显卡的基本作用1.图形渲染显卡的主要任务是处理和渲染图形。无论是浏览网页、观看视频还是使用图形设计软件，所有这些操作都需要显卡来计算图形信息，并将其转化为可在屏幕上显示的图像。显卡包含专门设计用于图形处理的芯片，可以快速执行这些操作，从而提供流畅和高质量的视觉体验。2.加速图形
Node.js 模块化概念详细介绍还是鼠鼠 node.js node.js web javascript vscode 前端
目录模块化的概念模块化的好处：实现模块化代码实现1.创建计算器模块2.使用计算器模块3.运行结果总结常见的Node.js核心模块模块化的应用场景Node.js采用了模块化的设计，使得开发者能够将代码拆分成多个独立的模块，便于维护和复用。在Node.js中，每个文件都可以视为一个模块，并且可以通过require()函数引入其他模块的功能。模块化提高了代码的可维护性，减少了冗余代码，并提高了开发效率。
UI自动化测试之CSS Selector 定位秘籍：解锁 WEB UI 自动化测试的高效之道做测试的小薄测试进阶 css selenium UI自动化测试元素定位方式
在WebUI自动化测试中，元素定位是实现自动化操作的核心步骤。SeleniumWebDriver提供了多种元素定位方式，其中CSSSelector是一种功能强大且灵活的定位方法。它基于CSS选择器语法，能够快速、精准地定位目标元素，尤其适用于复杂的DOM结构。本文将深入解析CSSSelector的工作原理、使用技巧以及需要注意的事项，帮助你在自动化测试中更高效地运用这一工具。一、CSSSelect
罗丹明RB/四甲基罗丹明标记酰胺化果胶Amidated Pectin, Rhodamine B/TRITC labeled；Rhodamine B/TRITC-Amidated Pectin 齐岳hao java 数据库 jvm
果胶是一种多糖，其组成有同质多糖和杂多糖两种类型。它们多存在于植物细胞壁和细胞内层，大量存在于柑橘、柠檬、柚子等果皮中。呈白色至黄色粉状，相对分子质量约20000～400000，无味。在酸性溶液中较在碱性溶液中稳定，通常按其酯化度分为高酯果胶及低酯果胶。高酯果胶在可溶性糖含量≥60%、pH=2.6～3.4的范围内形成非可逆性凝胶。低酯果胶一部分甲酯转变为伯酰胺，不受糖、酸的影响，但需与钙、镁等二价
JVM GC四大算法 coding_-_半生 jvm 算法 java
JVMGC四大算法文章目录JVMGC四大算法GC四大算法一、引用计数法二、复制算法（COPY）三、标记清除算法（MARK-SWEEP）四、标记整理算法（MARK-COMPACT）五、总结GC四大算法一、引用计数法描述：给每一个对象分配一个计数器，用于记录对象是否被引用，被引用一次，计数进行+1优点：方便直接判断对象是否能够回收缺点：使用计数器需要消耗一定的内存，且每一次计数的修改同样需要消耗内存致
通信之PDH准同步数字系列玖Yee 信息与通信
PDH-准同步数字系列（PlesiochronousDigitalHierarchy）：是数字通信系统中的一种数字传输系列，采用在数字通信网的每个节点上都分别设置高精度时钟的方式，这些时钟信号有统一标准速率，但各时钟间存在微小差别，并非真正的同步，所以叫“准同步”。速率等级两大体系三个标准：国际上PDH有两大系列三个标准。以欧洲系列为例，各次群容纳的E1数量呈4倍关系，比如可将4个2Mbit/s复
php后端分页_thinkphp5框架前后端分离项目实现分页功能的方法分析淡定男 php后端分页
本文实例讲述了thinkphp5框架前后端分离项目实现分页功能的方法。分享给大家供大家参考，具体如下：方法一利用tp5提供的paginate方法实现自动分页参数page第几页，paginate分页方法会自动获取size每页数量代码/***Notes:消费记录*Date:2019/6/25*Time:15:43*@paramRequest$request*@return\think\response
python flask 分页_Python的Flask框架中实现分页功能的教程 weixin_39959126 python flask 分页
BlogPosts的提交让我们从简单的开始。首页上必须有一张用户提交新的post的表单。首先我们定义一个单域表单对象(fileapp/forms.py)：classPostForm(Form):post=TextField('post',validators=[Required()])下面，我们把这个表单添加到template中(fileapp/templates/index.html)：{%ex
linux jvm gc日志分析,JVM GC 日志详解一只小小的IOS linux jvm gc日志分析
本文采用的JDK版本：javaversion"1.8.0_144"Java(TM)SERuntimeEnvironment(build1.8.0_144-b01)JavaHotSpot(TM)64-BitServerVM(build25.144-b01,mixedmode)一、GC日志参数设置JVMGC格式日志的主要参数包括如下8个：-XX:+PrintGC输出简要GC日志-XX:+PrintGC
jquery实现的jsonp掉java后台知了ing java jsonp jquery
什么是JSONP？先说说JSONP是怎么产生的：其实网上关于JSONP的讲解有很多，但却千篇一律，而且云里雾里，对于很多刚接触的人来讲理解起来有些困难，小可不才，试着用自己的方式来阐释一下这个问题，看看是否有帮助。 1、一个众所周知的问题，Ajax直接请求普通文件存在跨域无权限访问的问题，甭管你是静态页面、动态网页、web服务、WCF，只要是跨域请求，一律不准； 2、
Struts2学习笔记 caoyong struts2
SSH : Spring + Struts2 + Hibernate 三层架构(表示层,业务逻辑层,数据访问层) MVC模式 (Model View Controller) 分层原则:单向依赖，接口耦合 1、Struts2 = Struts + Webwork 2、搭建struts2开发环境 a>、到www.apac
SpringMVC学习之后台往前台传值方法满城风雨近重阳 springMVC
springMVC控制器往前台传值的方法有以下几种： 1.ModelAndView 通过往ModelAndView中存放viewName：目标地址和attribute参数来实现传参： ModelAndView mv=new ModelAndView(); mv.setViewName="success
WebService存在的必要性？一炮送你回车库 webservice
做Java的经常在选择Webservice框架上徘徊很久，Axis Xfire Axis2 CXF ，他们只有一个功能，发布HTTP服务然后用XML做数据传输。是的，他们就做了两个功能，发布一个http服务让客户端或者浏览器连接，接收xml参数并发送xml结果。当在不同的平台间传输数据时，就需要一个都能解析的数据格式。但是为什么要使用xml呢？不能使json或者其他通用数据
js年份下拉框 3213213333332132 java web ee
<div id="divValue">test...</div>测试 //年份 <select id="year"></select> <script type="text/javascript"> window.onload =
简单链式调用的实现技术归来朝歌方法调用链式反应编程思想
在编程中，我们可以经常遇到这样一种场景：一个实例不断调用它自身的方法，像一条链条一样进行调用这样的调用你可能在Ajax中，在页面中添加标签： $("<p>").append($("<span>").text(list[i].name)).appendTo("#result"); 也可能在HQ
JAVA调用.net 发布的webservice 接口 darkranger webservice
/** * @Title: callInvoke * @Description: TODO(调用接口公共方法) * @param @param url 地址 * @param @param method 方法 * @param @param pama 参数 * @param @return * @param @throws BusinessException
Javascript模糊查找 | 第一章循环不能不重视。 aijuans Way
最近受我的朋友委托用js+HTML做一个像手册一样的程序，里面要有可展开的大纲，模糊查找等功能。我这个人说实在的懒，本来是不愿意的，但想起了父亲以前教我要给朋友搞好关系，再加上这也可以巩固自己的js技术，于是就开始开发这个程序，没想到却出了点小问题，我做的查找只能绝对查找。具体的js代码如下： function search(){ var arr=new Array("my
狼和羊，该怎么抉择 atongyeye 工作
狼和羊，该怎么抉择在做一个链家的小项目，只有我和另外一个同事两个人负责，各负责一部分接口，我的接口写完，并全部测联调试通过。所以工作就剩下一下细枝末节的，工作就轻松很多。每天会帮另一个同事测试一些功能点，协助他完成一些业务型不强的工作。今天早上到公司没多久，领导就在QQ上给我发信息，让我多协助同事测试，让我积极主动些，有点责任心等等，我听了这话，心里面立马凉半截，首先一个领导轻易说
读取android系统的联系人拨号百合不是茶 android sqlite数据库内容提供者系统服务的使用
联系人的姓名和号码是保存在不同的表中,不要一下子把号码查询来,我开始就是把姓名和电话同时查询出来的,导致系统非常的慢关键代码: 1, 使用javabean操作存储读取到的数据 package com.example.bean; /** * * @author Admini
ORACLE自定义异常 bijian1013 数据库自定义异常
实例： CREATE OR REPLACE PROCEDURE test_Exception ( ParameterA IN varchar2, ParameterB IN varchar2, ErrorCode OUT varchar2 --返回值,错误编码 ) AS /*以下是一些变量的定义*/ V1 NUMBER; V2 nvarc
查看端号使用情况征客丶 windows
一、查看端口在windows命令行窗口下执行： >netstat -aon|findstr "8080" 显示结果： TCP 127.0.0.1:80 0.0.0.0:0 &
【Spark二十】运行Spark Streaming的NetworkWordCount实例 bit1129 wordcount
Spark Streaming简介 NetworkWordCount代码 /* * Licensed to the Apache Software Foundation (ASF) under one or more * contributor license agreements. See the NOTICE file distributed with
Struts2 与 SpringMVC的比较 BlueSkator struts2 spring mvc
1. 机制：spring mvc的入口是servlet，而struts2是filter，这样就导致了二者的机制不同。 2. 性能：spring会稍微比struts快。spring mvc是基于方法的设计，而sturts是基于类，每次发一次请求都会实例一个action，每个action都会被注入属性，而spring基于方法，粒度更细，但要小心把握像在servlet控制数据一样。spring
Hibernate在更新时，是可以不用session的update方法的(转帖） BreakingBad Hibernate update
地址：http://blog.csdn.net/plpblue/article/details/9304459 public void synDevNameWithItil() {Session session = null;Transaction tr = null;try{session = HibernateUtil.getSession();tr = session.beginTran
读《研磨设计模式》-代码笔记-观察者模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; import java.util.Observable; import java.util.Observer; /** * “观
重置MySQL密码 chenhbc mysql 重置密码忘记密码
如果你也像我这么健忘，把MySQL的密码搞忘记了，经过下面几个步骤就可以重置了（以Windows为例，Linux/Unix类似）： 1、关闭MySQL服务 2、打开CMD，进入MySQL安装目录的bin目录下，以跳过权限检查的方式启动MySQL mysqld --skip-grant-tables 3、新开一个CMD窗口，进入MySQL mysql -uroot
再谈系统论，控制论和信息论 comsci 设计模式生物能源企业应用领域模型
再谈系统论，控制论和信息论偶然看
oracle moving window size与 AWR retention period关系 daizj oracle
转自： http://tomszrp.itpub.net/post/11835/494147 晚上在做11gR1的一个awrrpt报告时,顺便想调整一下AWR snapshot的保留时间,结果遇到了ORA-13541这样的错误.下面是这个问题的发生和解决过程. SQL> select * from v$version; BANNER -------------------
Python版B树 dieslrae python
话说以前的树都用java写的,最近发现python有点生疏了,于是用python写了个B树实现,B树在索引领域用得还是蛮多了,如果没记错mysql的默认索引好像就是B树... 首先是数据实体对象,很简单,只存放key,value class Entity(object): '''数据实体''' def __init__(self,key,value)
C语言冒泡排序 dcj3sjt126com 算法
代码示例： # include <stdio.h> //冒泡排序 void sort(int * a, int len) { int i, j, t; for (i=0; i<len-1; i++) { for (j=0; j<len-1-i; j++) { if (a[j] > a[j+1]) // >表示升序
自定义导航栏样式 dcj3sjt126com 自定义
-(void)setupAppAppearance { [[UILabel appearance] setFont:[UIFont fontWithName:@"FZLTHK—GBK1-0" size:20]]; [UIButton appearance].titleLabel.font =[UIFont fontWithName:@"FZLTH
11.性能优化-优化-JVM参数总结 frank1234 jvm参数性能优化
1.堆 -Xms --初始堆大小 -Xmx --最大堆大小 -Xmn --新生代大小 -Xss --线程栈大小 -XX:PermSize --永久代初始大小 -XX:MaxPermSize --永久代最大值 -XX:SurvivorRatio --新生代和suvivor比例,默认为8 -XX:TargetSurvivorRatio --survivor可使用
nginx日志分割 for linux HarborChung nginx linux 脚本
nginx日志分割 for linux 默认情况下，nginx是不分割访问日志的，久而久之，网站的日志文件将会越来越大，占用空间不说，如果有问题要查看网站的日志的话，庞大的文件也将很难打开，于是便有了下面的脚本使用方法，先将以下脚本保存为 cutlog.sh，放在/root 目录下，然后给予此脚本执行的权限复制代码代码如下: chmo
Spring4新特性——泛型限定式依赖注入 jinnianshilongnian spring spring4 泛型式依赖注入
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
centOS安装GCC和G++ liuxihope centos gcc
Centos支持yum安装，安装软件一般格式为yum install .......，注意安装时要先成为root用户。按照这个思路，我想安装过程如下：安装gcc：yum install gcc 安装g++： yum install g++ 实际操作过程发现，只能有gcc安装成功，而g++安装失败，提示g++ command not found。上网查了一下，正确安装应该
第13章 Ajax进阶（上） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
How to determine BusinessObjects service pack and fix pack blueoxygen BO
http://bukhantsov.org/2011/08/how-to-determine-businessobjects-service-pack-and-fix-pack/ The table below is helpful. Reference BOE XI 3.x 12.0.0. y BOE XI 3.0 12.0. x. y BO
Oracle里的自增字段设置 tomcat_oracle oracle
　大家都知道吧，这很坑，尤其是用惯了mysql里的自增字段设置，结果oracle里面没有的。oh，no 　　我用的是12c版本的，它有一个新特性，可以这样设置自增序列，在创建表是，把id设置为自增序列 create table t ( id 　　　　 number generated by default as identity (start with 1 increment b
Spring Security（01）——初体验 yang_winnie spring Security
Spring Security（01）——初体验博客分类： spring Security Spring Security入门安全认证首先我们为Spring Security专门建立一个Spring的配置文件，该文件就专门用来作为Spring Security的配置

被追捧为“圣杯”的深度强化学习已走进死胡同

2019年过去了，仍然无法迁移到现实世界

问题究竟出在哪？

为什么深度强化学习被如此追捧？

别玩游戏了，干点实事！

阿里达摩院2020趋势第一弹：感知智能的“天花板”和认知智能的“野望”

基于强化学习的自动交易系统研究与发展综述

如何写出让同事膜拜的漂亮代码？

AMD或推出64核128线程HEDT平台；地平线即将推出新一代自动计算平台；阿里达摩院公布2020十大科技趋势……

2019最烂密码榜单出炉，教你设置神级密码！

腾讯回应“暴力裁员”；小米否认常程与联想签有竞业禁止条款；NumPy 1.16.6 发布 | 极客头条

GitHub Action 有风险？！

骗了马云 10 亿被骂 4 年后，院士王坚留下 4 条人生启示

万字长文回望2019：影响区块链行业发展的9大事件

你可能感兴趣的:(被追捧为“圣杯”的深度强化学习已走进死胡同)