AITIME论道

当强化学习遇上循环神经网络：从System 1到System 2 Deep Learning

点击蓝字 • 关注我们

AI TIME欢迎每一位AI爱好者的加入！

在复杂多变的环境中，如何去学习具有高度适应性和认知性的策略，是认知科学和人工智能的核心问题。本报告会介绍讲者最近在强化学习（RL）中利用循环神经网络（RNN）来实现更具有认知性（cognitive），更高效的控制策略的两篇工作：

（1）讲者会介绍用于部分可观测环境（POMDP）中强化学习的一种变分循环神经网络（variational RNN）模型。此模型可以通过预测环境中的状态转变，将环境中的不可观测信息编码在RNN的internal states中。并提出了一种相应的算法，可以高效地实现在部分可观测环境中的强化学习。

（2）提出一种新颖的，多层级的循环神经网络（multiple-levels RNN）模型，用于通过端对端（end-to-end）的无模型强化学习（model-free RL）来解决分层控制（hierarchical control）的任务。通过实验我们可以观察到，在一个具有挑战性的控制任务中，此RNN会在强化学习中逐步自组织出动作层次结构（self-organization of action hierarchy）。该层次结构在高层的RNN中对应子目标（sub-goal）的抽象表示，而在低层的RNN中对应底层动作控制。另外这个自组织的动作层次结构可以帮助智能体，在由已经学习过的子目标重新组成的新任务中更快地进行重新学习。

韩东起：本科毕业于中国科学技术大学物理系，现为Cognitive Neurorobotics Research Unit, Okinawa Institute of Science and Technology (OIST) 的PhD Candidate，导师为 Jun Tani和 Kenji Doya。他的主要研究兴趣是所有和神经网络有关系的课题，包括人工神经网络的应用（主要是深度强化学习），生物神经回路的建模（脉冲神经网络）以及利用人工神经网络模型研究认知神经科学。

一、背景知识

图灵奖得主Yoshua Bengio在NeurIPS 2019带来了一场题为《From System 1 Deep Learning To System 2 Deep Learing》的报告。

Yoshua的第一个观点，是指人的认知系统包含两个子系统（这是认知理论中大家共识的观点）：

①System 1直觉系统，主要负责快速、无意识、非语言的认知，这是目前深度学习主要做的事情；

②System 2是逻辑分析系统，是有意识的、带逻辑、规划、推理以及可以语言表达的系统，这是未来深度学习需要着重考虑的；

强化学习（Reinforcement Learning）：

强化学习是机器学习的范式和方法论之一，用于描述和解决智能体（agent）在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题，强化学习的常见模型是马尔可夫决策过程。近些年来热门的深度强化学习(deep RL)，其实就是用神经网络作函数近似的强化学习。

1、马尔可夫决策过程（Markov Decision Processes, MDPs）

MDPs 简单说就是一个智能体（Agent）采取行动（Action）从而改变自己的状态（State）获得奖励（Reward）与环境（Environment）发生交互的循环过程。

MDP 的策略完全取决于当前状态（Only present matters），这也是它马尔可夫性质的体现。

其可以简单表示为：

强化学习算法按照策略更新方式的不同，可以分为基于价值的（value-based）和基于策略的（policy-based）两类方法。有一种算法合并了Value-based和 Policy-based 两类强化学习算法，就是Actor-Critic方法。

2、Actor-Critic Algorithm

构造一个agent，既能直接输出策略policy function，又能通过价值函数value function 来实时评价当前策略的好坏。所以我们需要两个输出，一个负责生成策略的 Actor 和一个负责评价策略的 Critic，而且两者都还在不断更新，这种互补式的训练方式有时会比单独的策略网络或者值函数网络更有效。

3、RL&RNN

① RL（Reinforcement Learning）

强化学习算法是在探索环境的过程中学习在特定的情境下选择哪种行动可以得到最大的回报。

特点：

1、习惯性的系统：agents是具有明确的目标的，所有的 agents 都能感知自己的环境，并根据目标来指导自己的行为（做能获得更多rewards的事情）

2、通过算法设计来更高效地实现；

3、无意识的系统：输入观测量，输出指导行为；

4、自我探索：不需要大量data，弱监督任务也可以自我学习；

② RNN（Recurrent Neural Networks）

循环神经网络是一种能有效的处理序列数据的神经网络结构。它可以描述动态时间行为，因为和前馈神经网络（feedforward neural network，FNN）接受较特定结构的输入不同，RNN将状态在自身网络中循环传递，因此可以接受更广泛的时间序列结构输入。[Ref 1]

特点：

1、前后文相关：处理序列data；

2、信号在神经网络里传播的路径长；

3、元学习（meta-learning）的功能[Ref 2]；

4、有包含信息的hidden state，不是单纯的输入输出工具；

Deep RL：输入是观测量，输出是价值函数和观测函数

RL with RNN：RNN 比前馈神经网络多了一个承载前后文信息的 hidden state，扮演一个“心灵”的角色。

hidden state：可以通过一些方法可以让它表示丰富的信息，比如历史信息，阶层式的控制的子目标/抽象动作、关于当前任务集的meta-knowledge。

二、用变分循环神经网络来解决部分可观测的控制任务

论文链接：https://openreview.net/forum?id=r1lL4a4tDB

1、简介

在部分可观测环境中，深度强化学习经常会达不到令人满意的性能。这是因为我们需要同时解决两个问题：如何从原始观测中提取信息来解决任务，以及如何改进策略。在本研究中，我们提出了一种求解部分可观测任务的强化学习算法。

我们的方法包括两个部分：用于建模环境的变分RNN模型(VRM)，和一个以环境中可观测信息以及VRM的隐藏状态为输入的的强化学习控制器。

该算法在两种部分可观测的机器人控制任务中进行了测试——坐标或速度不可观测的任务和需要长期记忆的任务。我们的实验表明，在不能以简单的方式从原始观测中推断环境中隐藏信息的任务中，与其他算法相比，该算法达到了更好的样本效率和/或学习了更优的策略。

2、motivation

●在解决需要考虑历史观测量的时候，直接把RNN作为函数近似器(function approximator)很可能会导致训练不稳定，因为本身RNN就相比FNN难训练，而且RL函数的target依赖于本身函数的近似(“bootstrap”)。

●而如果用一个RNN去做自监督学习(输入:当前观测:输出:未来观测) ,可以让RNN更容易地去理解环境的状态转换。

●这时RNN的hidden state可以看作环境中的隐变量的一种表示。再用其来作为RL的附加输入可以显著提升学习效率。

3、实验

横坐标：和环境接触的步数纵坐标：平均的performance

第一列是控制任务示意图；

第二列完全可观测（包括机器人的坐标&速度和各关节的角度&角速度）；

第三列部分可观测（只包括机器人的速度和各关节的角速度）；

第四列部分可观测（不包括机器人的速度和各关节的角速度）；

我们注意到，在需要用较长序列的原始观测来推断环境信息的任务中（比如第三列，需要用速度/角速度推断坐标/角度），我们的算法比其他算法具有明显的优势。这和我们的motivation相符合。

三、基于递归神经网络和强化学习的动作层级自组织

论文链接：https://doi.org/10.1016/j.neunet.2020.06.002

1、引言：关于动作层级

在一个复杂的强化学习问题中，一个任务可以包含若干个并列的子目标，每个子目标又可以通过执行一系列更详细的动作（抽象动作/动作组）来达成。

比如在资源的调度分配问题中，资源的调度分配策略随着环境的观测值（若干待分配资源的个体，资源配置策略不同，获得的收益不同），希望通过调整资源配置策略，获得最大的全局收益。

这时动作包含以下几部分（几个层次）

（1）给哪些个体配置资源（直接给全部个体配置资源的收益不一定高于只给部分个体配置）

（2）给每个个体配置多少资源

（3）具体给每个个体配置哪些资源（资源之间也有差异，同一资源配置给不同个体收益不同）

又比如如图所示的泡茶问题，可以分成几个步骤，每个步骤都需要控制手脚去做对应的事情。而人类是很擅长自主地去把一个任务分成不同层级的，而且是在学习过程中可以自发地去理解、发现任务的动作层级。

思考：既然人类这么擅长自主地把任务按照子目标分层级，那AI如何达到类似的学习能力呢？

不妨来看看人脑有什么特点：

●神经科学家在大脑皮层区域发现了一个时间尺度的上升层次，被认为是处理更高级的认知功能的区域对应更慢的时间尺度。[Ref 3]

●此外，大脑皮层的神经元具有高度随机的神经活动。

基于以上三点，我们将使用一个具有随机性的、多时间尺度的循环神经网络(RNN)作为我们的模型。

2、ReMASTER框架（Recurrent Multi-level Actor-critic with STochastic Experience Replay）

其中RNN模型称为Multiple Timescales Stochastic RNN (MTSRNN)，由两层组成：

① 低层：慢时间尺度（hidden state随时间变化慢），输出相对短期的价值函数，低层接收观测量，输出策略。

② 高层：快时间尺度（hidden state随时间变化快），输出相对长期的价值函数，高层和低层相连。

两个关键要素：

① 内禀的时间尺度层次性：体现在RNN的hidden state的变化速率上和价值函数的估计上面。

② 在RNN的hidden state更新中的noise：随机性。

大致算法流程如下：

3、顺序目标达成任务（Sequential target-reaching Task）

此任务中，一个两轮机器小车agent需要依次到达红-绿-蓝3个目标点，从而获得奖励。难点没有外部信号指示当前目标给agent，而是需要agent通过行动历史去判断当前目标。这可以认为是一个现实世界中更复杂的序列任务的抽象，包括将整个任务分解成子任务和以特定的顺序执行每个子任务。

两个行动层次：

① 学会通过传感器的输入来控制双轮到达特定目标(较低层次)。

② 学会利用历史观察的记忆来识别要达到的目标(子目标)(更高层次)。

观测量是到每个目标的距离和角度等传感器数据。

4、实验结果

在使用ReMASTER进行足量训练后，agent可以成功地学会完成顺序目标达成任务。但是agent是否理解了这个任务中的动作层级呢？我们来看看下面的结果

① Agent行为分析

下面的三列图展示了同一个agent在不同的三次任务中的行为：

第一行和第二行显示高层和低层的RNN output，其中垂直虚线表示agent到达目标。为了清晰起见，我们只绘制了每层的前7个神经元，不同的颜色表示不同的神经元。X轴是时间，y轴是RNN output（可以理解为神经元激活程度）。

第三行是轮子的动作，即两个车轮的速度。

第四行是机器人的行动轨迹，其中黑色方块表示其起始位置，彩色圆点是3个目标位置，可以看到agent在目标位置都不一样的情况下都能很好地完成任务。

我们可以看到，在这三次任务中，高层的RNN output显示出了相似的行为，即使在这三次任务中轮子的动作完全不一样。这个结果一定程度上表明了高层的RNN可以表示高层的子目标，而这是在强化学习后自组织起来的。

② PCA主成分分析

我们可以用更具有统计学可信度的证据来展示agent在强化学习中发展起来的动作层级。通过PCA主成分分析高层和低层的hidden state，可以明显的观测到agent的行动分层。

High level：表现出序列化一致性，对应于子目标；

Low level：对应具体的动作控制。

③ 连续再学习任务

在这个任务中，agent需要再学习适应改变了的目标顺序，连续的再学习任务由3个不同的阶段组成。

●第1阶段对应于原来的红-绿-蓝顺序目标达成任务。

●第2阶段将子目标重新排序，agent需要按绿-蓝-红的新顺序来完成。

●第3阶段又变了顺序，变成蓝-绿-红。

注：ReMASTER-single V 是高层RNN不输出较长期价值函数的ReMASTER；ReMASTER-det. 是RNN中没有随机噪声的ReMASTER；LSTM是用单层LSTM来替换双层RNN的ReMASTER。

由于我们先前的分析表明，底层的RNN已经学习了如何去完成各个子目标。那么，让agent再去学习第2,3阶段的任务，应该会更为快速。因为agent不需要再重新学习底层的控制，而只需要将高层的子目标重组（re-composition）。实验结果也表明，相对于其他的baselines，ReMASTER在再学习的阶段（上图中c和d）能做得更快更好。

另外一个有趣的结果是，我们可以让agent在第2阶段后将底层RNN的权重都冻结，只让高层RNN再学习。如上图e所示，agent依然可以在第3阶段较快地适应新的目标顺序。

④ 显式地去运用已经学会的子目标

我们看到用ReMASTER的agent可以学习完成顺序目标达成任务，而且在RNN中自主地形成了动作层级——高层RNN可以表示子目标。如果我们希望它仅完成一个子目标，例如达到蓝色目标，该怎么办？

其实这很容易做到！我们只要固定高层RNN的hidden state（比如固定到agent在RL时前往蓝色目标过程中高层RNN的hidden state），而让低层的RNN照常运算，就可以了！下图展示了一个学习好了的agent在固定了高层hidden state后的运动轨迹。每行的图中使用了同样的高层hidden state，而每列的图中目标位置保持一致。黑色方块依然是agent的初始位置，而彩色圆点对应了目标位置。

5、总结

①在此研究中，我们仔细研究了在“顺序目标达成任务”中，如何通过端对端的强化学习和RNN来自主发展出一个可解释的动作层级。

②我们提出了ReMASTER算法框架，它具有两个受神经生物学启发的特征。一个是RNN里内禀的时间尺度层级，另一个是网络中的随机性。

③实验结果表明，ReMASTER的agent在强化学习后可以成功解决顺序目标达成任务，并且一个可解释的动作层级在双层网络中自发组织起来。此动作层级可以帮助agent在再学习由已掌握子目标重新排序组成的新任务时学得更快。

作者寄语

●神经网络本身就是很神奇的东西，Hierarchical RL其实也不一定需要精心设计的算法，而靠RNN里内禀的时间尺度层级和随机性(噪声)就能做到。

●机器学习的路走了这么远，我们有时候可以回过头来看一下神经科学/脑科学的研究能给我们一些什么启发。毕竟只人类来说，在地球这么复杂多变的环境下，是数以亿计的人口经过数万代的进化得到的结果，必然有其优越性。如果要模拟这么大规模的演化计算的话，现在计算机能达到的算力还差得远。

参考文献

[Ref 1] Recurrent neural network, Wikipedia, https://en.wikipedia.org/wiki/Recurrent_neural_network

[Ref 2] Wang J X, Kurth-Nelson Z, Tirumala D, et al. Learning to reinforcement learn[J]. arXiv preprint arXiv:1611.05763, 2016.

[Ref 3] Murray J D, Bernacchia A, Freedman D J, et al. A hierarchy of intrinsic timescales across primate cortex[J]. Nature neuroscience, 2014, 17(12): 1661-1663.

e m t

往期精彩

AI i

整理：唐家欣

审稿：韩东起

排版：岳白雪

AI TIME欢迎AI领域学者投稿，期待大家剖析学科历史发展和前沿技术。针对热门话题，我们将邀请专家一起论道。同时，我们也长期招募优质的撰稿人，顶级的平台需要顶级的你！

请将简历等信息发至[email protected]！

微信联系:AITIME_HY

AI TIME是清华大学计算机系一群关注人工智能发展，并有思想情怀的青年学者们创办的圈子,旨在发扬科学思辨精神，邀请各界人士对人工智能理论、算法、场景、应用的本质问题进行探索，加强思想碰撞，打造一个知识分享的聚集地。

更多资讯请扫码关注

（直播回放：https://b23.tv/9xQMXZ）

（点击“阅读原文”下载本次报告ppt）

python里class转换_python实现class对象转换成json/字典的方法八决子 python里class转换
python实现class对象转换成json/字典的方法发布于2016-03-2808:05:44|153次阅读|评论:0|来源:网友投递Python编程语言Python是一种面向对象、解释型计算机程序设计语言，由GuidovanRossum于1989年底发明，第一个公开发行版发行于1991年。Python语法简洁而清晰，具有丰富和强大的类库。它常被昵称为胶水语言，它能够把用其他语言制作的各种模块
快速排序Java代码简洁实现 SKY技术修炼指南算法
学习过数据结构的同学们都知道，快速排序算法是一种时间复杂度为O(nlogn)的排序算法，在各种排序算法中算是较为高效的方法，企业面试中也经常有手撕快排的环节。本文将阐述算法的基本思想，并用Java代码的形式实现快速排序代码。算法思想快速排序主要采用分治的基本思想，每次将一个位置上的数据归位，此时该数左边的所有数据都比该数小，右边所有的数据都比该数大，然后递归将已归位的数据左右两边再次进行快排，从而
解密 Python 的 MRO：C3 线性化如何优雅解决多重继承的菱形难题》
《解密Python的MRO：C3线性化如何优雅解决多重继承的菱形难题》引言：继承的优雅与复杂在Python的面向对象编程中，继承是一种强大的机制，它让我们能够复用代码、构建抽象层次、实现多态行为。然而，当我们引入多重继承时，继承体系的复杂性也随之而来，尤其是著名的“菱形继承问题”。Python通过一种称为C3线性化（C3Linearization）的算法来解决方法解析顺序（MethodResolu
《深入理解 Python 的对象构造机制：__new__ 与 __init__ 的本质区别与实战应用》清水白石008 开发语言学习笔记课程教程 python 开发语言
《深入理解Python的对象构造机制：new与init的本质区别与实战应用》引言：对象的诞生之谜在Python的面向对象编程中，我们习惯于使用__init__方法来初始化对象。但你是否曾注意到，还有一个鲜为人知却至关重要的魔法方法——__new__？它是对象构造过程的起点，掌控着类实例的真正创建。理解__new__与__init__的区别，不仅能帮助你掌握Python的对象模型，还能在构建不可变类
Zookeeper 在 Kafka 中的作用详解：分布式协调服务的核心价值 lxb_不卑不亢消息队列 MQ 进阶实战分布式 zookeeper kafka rocketmq
摘要ApacheKafka是一个高吞吐、分布式的流处理平台，广泛应用于大数据和实时系统中。而ApacheZookeeper，则是Kafka背后不可或缺的“隐形英雄”。本文将深入剖析Zookeeper在Kafka架构中的核心作用，帮助开发者全面理解其在分布式协调、元数据管理、故障恢复等方面的关键地位。一、Zookeeper简介Zookeeper是一个开源的分布式协调服务，最初由Hadoop生态发展而
系统学习图像算法Day.9——OpenCV学习——形态学滤波敏而好学无止境 OpenCV学习图像算法
形态学滤波定义：在我们图像处理中的形态学，往往指的时数学形态学——是一门建立在格论和拓扑学基础上的图像分析学科。形态学基本操作：膨胀、腐蚀膨胀dilate介绍：膨胀就是求局部最大值的操作。从数学角度讲，膨胀就是讲图像与核进行卷积。核与图像卷积，即计算核覆盖的区域的像素点的最大值，并把这个最大值赋值给参考点指定的像素。这样会使图像中的高亮区域逐渐增长。函数调用举例：Matimage=imread("
2023-08-19 余則徐
2023.8.19.达视津气象2023.8.19.达视津气象阴晴不定朋友们早上好！今天是2023.8.19.星期六，农历七月初四的6:41；这个时间的干支历法是癸卯年庚申月己酉日丁卯时。气象预报不准，是常态；以前不准，现在有了超级计算机进行大数据运算了，还是不准：超级计算机运算，不如老农民抬头看天。而老农民却说，我不但要抬头看天，还要低头看河滩哪里有王八蛋。原来王八是可以预测每年有没有水患的！如果
Day9: OpenCV学习（一）—— 图像基础
系列文章目录上一篇：Day8：Python工程化——模块、包文章目录系列文章目录前言一、安装和导入1.安装二、图像认识1.图像2.图像分类三、基础图像操作1.图像读取2.图像显示3.图像裁剪4.图形尺寸修改5.图像保存6.图像绘制7.视频捕获即显示总结前言OpenCV（OpenSourceComputerVisionLibrary）是一个开源的计算机视觉和机器学习软件库。由一系列C++类和函数构成
python基础语法复习04——函数洛华363 python python
python基础语法目录python基础语法01——基本类型python基础语法02——复合类型python基础语法03——语句构成文章目录python基础语法目录一、初识函数1.定义2.调用二、函数的传参1.位置传参2.关键词传参3.参数默认值4.可变位置参数5.可变关键词参数6.参数解包7.值传递与引用传递总结一、初识函数函数是Python中可重复使用的代码块，用于执行特定任务。通过将代码封装
ubuntu18.04安装geemap 阿西是有梦想的咸鱼 python编程之路遥感影像处理可视化可视化 python ubuntu
文章目录安装测试GEE提供了JavaScript和PythonAPI，可以向EarthEngine服务器发出计算请求。与GEEJavaScriptAPI相比，PythonAPI缺乏易于理解的操作文档和交互式可视化结果的功能。由此，geemap诞生并填补了这一空白[1]。这里给大家介绍下我折腾了一晚上才搞定的geemap的安装及测试过程。这里是geemap的GitHub参考链接。安装如Github中
python进行geeMap环境安装箭梭_ python
近期需要利用geemap搭建一个界面，试了一下相应环境的配置，踏了挺多坑，下面我给大家具体介绍一下geemap的环境搭建：（1）geemap是基于googleearthengine的接口进行开发的，在安装geemap之前，需要先进行earthengie包的安装，参考链接如下：https://zhuanlan.zhihu.com/p/29186942#comment-549701602?notifi
API开发全攻略：从入门到精通的企业级API架构与实战 Android洋芋架构 API设计 RESTful API 微服务架构实战案例
简介API开发已成为现代软件架构的核心能力，掌握API设计与实现技术能显著提升开发效率和系统可扩展性。本文将从零开始，全面解析API的基础概念、架构设计、安全认证、性能优化等关键技术点，并提供完整的Python和Go语言代码实战示例，帮助开发者构建高性能、可扩展的企业级API系统。本文旨在为初学者和进阶开发者提供一份全面的API开发指南。内容涵盖API的基础概念、类型分类、架构设计、安全认证、性能
2023年NOC大赛创客智慧编程赛项Python 复赛模拟题（二）青少儿编程课堂少儿编程资料大全付费专栏 python numpy 开发语言 noc大赛真题 noc试题
题目来自：NOC大赛创客智慧编程赛项Python复赛模拟题(二)NOC大赛创客智慧编程赛项Python复赛模拟题（二）第一题：编写一个成绩评价系统，当输入语文、数学和英语三门课程成绩时，输出三门课程总成绩及其等级。(1)程序提示用户输入三个数字，数字分别表示语文、数学、英语分数，对应的变量名称是Chinese、Math、English,并计算三个分数的和(score)进行输出。注：input()函
【RS】GEE(Python)：大规模分析与导出数据
在前面的章节中，我们探讨了如何在GoogleEarthEngine(GEE)上进行数据加载、处理、分析和可视化。现在，我们将进一步扩展，探索如何处理大规模的数据集和执行复杂的分析任务。通过GEE的云计算能力，用户可以在全球范围内执行大规模的时空分析，并高效地将处理结果导出为所需的格式。大规模分析的基本原则在GEE中，大规模分析是通过ImageCollection和FeatureCollection
【Python篇】Python基础——08day.面向对象编程中类和对象的基本概念及属性和方法的常见分类和使用场景 WXX_s python基础篇 python 分类开发语言学习
目录前言一、类和对象1.类→Class1.1概念1.2创建2.对象→Object2.1概念2.2创建二、属性和方法1.实例属性2.实例方法3.类属性4.类方法5.静态方法5.1综合应用6.构造方法7.初始化方法8.魔术方法8.1常用方法8.2案例参考总结前言这章讲的面向对象编程（Object-OrientedProgramming，简称OOP）是一种通过组织对象来设计程序的编程方法。为什么需要类和
【Python篇】Python基础——04day.Python中运算（简单部分，如果会的可以直接跳过）
文章目录前言一.运算符1.1算术运算符1.2比较运算符1.3逻辑运算符1.4赋值运算符1.5位运算符1.6身份运算符1.7成员运算符1.8三目运算符1.9优先级二.表达式2.1算术表达式2.2比较表达式2.3逻辑表达式2.4赋值表达式2.5成员表达式2.6身份表达式2.7三元表达式2.8函数调用表达式三.推导式3.1列表推导式3.2字典推导式3.3集合推导式总结前言这一章写的是在python中会用
Swift 初见（一） bearIT
Swift是一种安全，快速和互动的编程语言。它是第一个既满足工业标准又像脚本语言一样充满表现力和趣味的系统编程语言。它支持代码预览（playgrounds）Swift通过采用现代编程模式来避免大量常见编程错误：变量始终在使用前初始化。检查数组索引超出范围的错误。检查整数是否溢出。可选值确保明确处理nil值。内存被自动管理。错误处理允许从意外故障控制恢复。使用let来声明常量，使用var来声明变量。
Python 现代时间序列预测第二版（五）绝不原创的飞龙默认分类默认分类
原文：annas-archive.org/md5/22eab741fce9c15dfad894ecf37bdd51译者：飞龙协议：CCBY-NC-SA4.0第十七章：概率预测及更多在整本书中，我们学习了生成预测的不同技术，包括一些经典方法，使用机器学习以及一些深度学习架构。但我们一直在关注一种典型的预测问题——为连续时间序列生成点预测，并且没有层级关系且历史数据足够丰富。我们之所以这样做，是因为这
自动化测试中，测试数据如何管理？鱼鱼说测试 java linux 服务器
今晚在某个测试群，看到有人问了一个问题：把测试数据放配置文件读取和放文件通过函数调用读取有什么区别？Python接口自动化测试零基础入门到精通（2025最新版）当时我下意识的这么回答：数据量越大，配置文件越臃肿，放在专门的数据文件（比如excel，csv），方便针对性的维护。乍看没毛病，但回头和人讨论这个问题的时候，就认真思考了一下这个问题，下面是我的一些思考和讨论的一些结果，仅供参考。。。自动化
基于selenium的pyse自动化测试框架鱼鱼说测试 selenium 测试工具
Python接口自动化测试零基础入门到精通（2025最新版）介绍：pyse基于selenium（webdriver）进行了简单的二次封装，比selenium所提供的方法操作更简洁。特点：默认使用CSS定位，同时支持多种定位方法（id\name\class\link_text\xpath\css）。本框架只是对selenium（webdriver）原生方法进行了简单的封装，精简为大约30个方法，这些
自动化测试准备鱼鱼说测试自动化测试
什么是自动化测？Python接口自动化测试零基础入门到精通（2025最新版）首先理清自动化测试的概念，广义上来讲，自动化包括一切通过工具（程序）的方式来代替或辅助手工测试的行为都可以看做自动化，包括性能测试工具（loadrunner、jmeter）,或自己所写的一段程序，用于生成1到100个测试数据。狭义上来讲，通工具记录或编写脚本的方式模拟手工测试的过程，通过回放或运行脚本来执行测试用例，从而代
重塑未来：AI如何重新定义全栈开发熊猫钓鱼>_> 人工智能
在传统认知中，全栈开发者被誉为技术界的“全能选手”。——他们需要精通前端界面构建（HTML/CSS/JavaScript）、后端业务逻辑实现（Python/Java/Node.js）、数据库设计优化（MySQL/MongoDB）以及服务器部署运维（Linux/Docker）。这种“一人包打天下”的能力模型长期被视为高效开发的黄金标准，尤其受到创业公司和小型团队的青睐，因为它能大幅减少沟通成本，加速
QCC系列显示交互层的自研技术突破与实践 TengTaiTech QCC308X/QCC518X QCC3091 /QCC3095 qcc304x 蓝牙 QCC ldac
在音频设备智能化进程中，显示交互的流畅度与兼容性已成为用户体验的核心指标。传统方案中，TFT彩屏与多语言适配常面临硬件驱动冲突、功耗失控、字符显示错乱等问题。作为高通平台十年级方案商，腾泰技术在QCC系列中聚焦显示交互层的自研技术突破，形成了一套完整的软硬件协同方案。自研屏显驱动框架：从硬件适配到算法创新腾泰QCC系列的核心竞争力集中在显示交互层的全栈自研技术，其架构可通过「屏显驱动技术栈架构图」
深入理解设计模式：策略模式的艺术与实践 vvilkin的学习备忘设计模式设计模式策略模式
在软件开发中，我们经常会遇到需要根据不同情况选择不同算法或行为的场景。传统的做法可能是使用大量的条件语句（if-else或switch-case），但随着需求的增加和变化，这种硬编码的方式会导致代码难以维护和扩展。策略模式（StrategyPattern）正是为了解决这类问题而诞生的一种优雅的设计模式。策略模式属于行为型设计模式，它定义了一系列算法，并将每个算法封装起来，使它们可以相互替换。这种模
嵌入式开发王明列 zynq fpga开发
逻辑开发与软件开发，皆为高度专业化的技术领域，能在两者之间自由穿梭、解决复杂问题的工程师，凤毛麟角。然而，“精通”本身并无边界。在实际工程中，无论是算法实现、高速接口，还是雷达系统、电机控制，每一个方向都深邃如海，足以让人终身钻研。真正重要的，从来不是“掌握一切”，而是在关键问题域中，构建起可闭环的解决路径，持续迭代，稳步积累。因为：再庞大的系统，也由一个个“可掌握的知识点”组成；再高的门槛，也能
OpenCV直线段检测算法类cv::line_descriptor::LSDDetector 村北头的码农 OpenCV opencv 算法人工智能
操作系统：ubuntu22.04OpenCV版本：OpenCV4.9IDE:VisualStudioCode编程语言：C++11算法描述该类用于实现LSD(LineSegmentDetector)直线段检测算法。LSD是一种快速、准确的直线检测方法，能够在不依赖边缘检测的前提下直接从图像中提取出直线段。它是OpenCV的line_descriptor模块的一部分，常用于计算机视觉任务如图像拼接、S
OpenCV稠密光流法可直接运行的例程（python） indrrra opencv python 人工智能
#dense_optical_flow.pyimportcv2importnumpyasnpimportargparsedefdense_optical_flow(method,video_path,params=[],to_gray=False):#读取视频cap=cv2.VideoCapture(video_path)#读取第一帧ret,old_frame=cap.read()#创建HSV并使
分布式锁特点、以及用python3实现redis分布式锁数据知道 python3案例和总结分布式 redis 数据库 python
更多内容请见：python3案例和总结-专栏介绍和目录文章目录一、Redis分布式锁核心原理1.1Redis锁机制1.2锁释放二、基础实现代码2.1使用`redis-py`客户端2.2分布式锁类三、使用示例3.1基础锁操作3.2装饰器模式四、高级特性实现4.1Redlock算法（高可用方案）五、生产环境最佳实践5.1锁粒度控制5.2异常处理5.3监控与调试5.4重试机制六、测试代码6.1并发测试6
OpenCV-光流估计
文章目录一、光流估计介绍1.光流估计的基本概念2.光流估计的原理3.光流估计的前提4.OpenCV中的光流估计算法5.参数设置与调整二、代码实现三、注意事项OpenCV中的光流估计是计算机视觉领域中的一项重要技术，它通过分析图像序列中像素点的运动，来估计物体的运动信息。以下是对OpenCV中光流估计的详细解析：一、光流估计介绍1.光流估计的基本概念光流是空间运动物体在观测成像平面上的像素运动的“瞬
php、go、python后端接口签名实现奇华智能后台开发 linux 签名接口安全
1.php实现/**生成签名，$args为请求参数，$key为私钥*/functionmakeSignature($args,$key){if(isset($args['sign'])){$oldSign=$args['sign'];unset($args['sign']);}else{$oldSign='';}ksort($args);$requestString='';foreach($arg
异常的核心类Throwable 无量 java 源码异常处理 exception
java异常的核心是Throwable，其他的如Error和Exception都是继承的这个类里面有个核心参数是detailMessage，记录异常信息，getMessage核心方法，获取这个参数的值，我们可以自己定义自己的异常类，去继承这个Exception就可以了，方法基本上，用父类的构造方法就OK，所以这么看异常是不是很easy package com.natsu;
mongoDB 游标（cursor）实现分页迭代开窍的石头 mongodb
上篇中我们讲了mongoDB 中的查询函数，现在我们讲mongo中如何做分页查询如何声明一个游标 var mycursor = db.user.find({_id:{$lte:5}}); 迭代显示游标数
MySQL数据库INNODB 表损坏修复处理过程 0624chenhong tomcat mysql
最近mysql数据库经常死掉，用命令net stop mysql命令也无法停掉，关闭Tomcat的时候，出现Waiting for N instance(s) to be deallocated 信息。查了下，大概就是程序没有对数据库连接释放，导致Connection泄露了。因为用的是开元集成的平台，内部程序也不可能一下子给改掉的，就验证一下咯。启动Tomcat,用户登录系统，用netstat -
剖析如何与设计人员沟通不懂事的小屁孩工作
最近做图烦死了，不停的改图，改图……。烦，倒不是因为改，而是反反复复的改，人都会死。很多需求人员不知该如何与设计人员沟通，不明白如何使设计人员知道他所要的效果，结果只能是沟通变成了扯淡，改图变成了应付。那应该如何与设计人员沟通呢？我认为设计人员与需求人员先天就存在语言障碍。对一个合格的设计人员来说，整天玩的都是点、线、面、配色，哪种构图看起来协调；哪种配色看起来合理心里跟明镜似的，
qq空间刷评论工具换个号韩国红果果 JavaScript
var a=document.getElementsByClassName('textinput'); var b=[]; for(var m=0;m<a.length;m++){ if(a[m].getAttribute('placeholder')!=null) b.push(a[m]) } var l
S2SH整合之session 灵静志远 spring AOP struts session
错误信息： Caused by: org.springframework.beans.factory.BeanCreationException: Error creating bean with name 'cartService': Scope 'session' is not active for the current thread; consider defining a scoped
xmp标签 a-john 标签
今天在处理数据的显示上遇到一个问题： var html = '<li><div class="pl-nr"><span class="user-name">' + user + '</span>' + text + '</div></li>'; ulComme
Ajax的常用技巧（2）---实现Web页面中的级联菜单 aijuans Ajax
在网络上显示数据，往往只显示数据中的一部分信息，如文章标题，产品名称等。如果浏览器要查看所有信息，只需点击相关链接即可。在web技术中，可以采用级联菜单完成上述操作。根据用户的选择，动态展开，并显示出对应选项子菜单的内容。在传统的web实现方式中，一般是在页面初始化时动态获取到服务端数据库中对应的所有子菜单中的信息，放置到页面中对应的位置，然后再结合CSS层叠样式表动态控制对应子菜单的显示或者隐
天-安-门，好高 atongyeye 情感
我是85后，北漂一族，之前房租1100，因为租房合同到期，再续，房租就要涨150。最近网上新闻，地铁也要涨价。算了一下，涨价之后，每次坐地铁由原来2块变成6块。仅坐地铁费用，一个月就要涨200。内心苦痛。晚上躺在床上一个人想了很久，很久。我生在农
android 动画百合不是茶 android 透明度平移缩放旋转
android的动画有两种 tween动画和Frame动画 tween动画;,透明度,缩放,旋转,平移效果 Animation 动画 AlphaAnimation 渐变透明度 RotateAnimation 画面旋转 ScaleAnimation 渐变尺寸缩放 TranslateAnimation 位置移动 Animation
查看本机网络信息的cmd脚本 bijian1013 cmd
@echo 您的用户名是：%USERDOMAIN%\%username%>"%userprofile%\网络参数.txt" @echo 您的机器名是：%COMPUTERNAME%>>"%userprofile%\网络参数.txt" @echo ___________________>>"%userprofile%\
plsql 清除登录过的用户征客丶 plsql
tools---preferences----logon history---history 把你想要删除的删除 -------------------------------------------------------------------- 若有其他凝问或文中有错误，请及时向我指出，我好及时改正，同时也让我们一起进步。 email ： binary_spac
【Pig一】Pig入门 bit1129 pig
Pig安装 1.下载pig wget http://mirror.bit.edu.cn/apache/pig/pig-0.14.0/pig-0.14.0.tar.gz 2. 解压配置环境变量如果Pig使用Map/Reduce模式，那么需要在环境变量中，配置HADOOP_HOME环境变量 expor
Java 线程同步几种方式 BlueSkator volatile synchronized ThredLocal ReenTranLock Concurrent
为何要使用同步？ java允许多线程并发控制，当多个线程同时操作一个可共享的资源变量时（如数据的增删改查），将会导致数据不准确，相互之间产生冲突，因此加入同步锁以避免在该线程没有完成操作之前，被其他线程的调用，从而保证了该变量的唯一性和准确性。 1.同步方法&
StringUtils判断字符串是否为空的方法（转帖） BreakingBad null StringUtils “”
转帖地址：http://www.cnblogs.com/shangxiaofei/p/4313111.html public static boolean isEmpty(String str) 　　判断某字符串是否为空，为空的标准是 str== null 或 str.length()== 0
编程之美-分层遍历二叉树 bylijinnan java 数据结构算法编程之美
import java.util.ArrayList; import java.util.LinkedList; import java.util.List; public class LevelTraverseBinaryTree { /** * 编程之美分层遍历二叉树 * 之前已经用队列实现过二叉树的层次遍历，但这次要求输出换行，因此要
jquery取值和ajax提交复习记录 chengxuyuancsdn jquery取值 ajax提交
// 取值 // alert($("input[name='username']").val()); // alert($("input[name='password']").val()); // alert($("input[name='sex']:checked").val()); // alert($("
推荐国产工作流引擎嵌入式公式语法解析器-IK Expression comsci java 应用服务器工作 Excel 嵌入式
这个开源软件包是国内的一位高手自行研制开发的，正如他所说的一样，我觉得它可以使一个工作流引擎上一个台阶。。。。。。欢迎大家使用，并提出意见和建议。。。 ----------转帖--------------------------------------------------- IK Expression是一个开源的（OpenSource），可扩展的（Extensible），基于java语言
关于系统中使用多个PropertyPlaceholderConfigurer的配置及PropertyOverrideConfigurer daizj spring
1、PropertyPlaceholderConfigurer Spring中PropertyPlaceholderConfigurer这个类，它是用来解析Java Properties属性文件值，并提供在spring配置期间替换使用属性值。接下来让我们逐渐的深入其配置。基本的使用方法是：(1) <bean id="propertyConfigurerForWZ&q
二叉树:二叉搜索树 dieslrae 二叉树
所谓二叉树,就是一个节点最多只能有两个子节点,而二叉搜索树就是一个经典并简单的二叉树.规则是一个节点的左子节点一定比自己小,右子节点一定大于等于自己(当然也可以反过来).在树基本平衡的时候插入,搜索和删除速度都很快,时间复杂度为O(logN).但是,如果插入的是有序的数据,那效率就会变成O(N),在这个时候,树其实变成了一个链表. tree代码:
C语言字符串函数大全 dcj3sjt126com c function
C语言字符串函数大全函数名: stpcpy 功能: 拷贝一个字符串到另一个用法: char *stpcpy(char *destin, char *source); 程序例: #include <stdio.h> #include <string.h> int main
友盟统计页面技巧 dcj3sjt126com 技巧
在基类调用就可以了, 基类ViewController示例代码 -(void)viewWillAppear:(BOOL)animated { [super viewWillAppear:animated]; [MobClick beginLogPageView:[NSString stringWithFormat:@"%@",self.class]];
window下在同一台机器上安装多个版本jdk，修改环境变量不生效问题处理办法 flyvszhb java jdk
window下在同一台机器上安装多个版本jdk，修改环境变量不生效问题处理办法本机已经安装了jdk1.7，而比较早期的项目需要依赖jdk1.6，于是同时在本机安装了jdk1.6和jdk1.7. 安装jdk1.6前，执行java -version得到 C:\Users\liuxiang2>java -version java version "1.7.0_21&quo
Java在创建子类对象的同时会不会创建父类对象 happyqing java 创建子类对象父类对象
1.在thingking in java 的第四版第六章中明确的说了，子类对象中封装了父类对象， 2."When you create an object of the derived class, it contains within it a subobject of the base class. This subobject is the sam
跟我学spring3 目录贴及电子书下载 jinnianshilongnian spring
一、《跟我学spring3》电子书下载地址：《跟我学spring3》（1-7 和 8-13） http://jinnianshilongnian.iteye.com/blog/pdf 跟我学spring3系列 word原版下载二、源代码下载最新依
第12章 Ajax（上） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
BI and EIM 4.0 at a glance blueoxygen BO
http://www.sap.com/corporate-en/press.epx?PressID=14787 有机会研究下EIM家族的两个新产品~~~~ New features of the 4.0 releases of BI and EIM solutions include: Real-time in-memory computing –
Java线程中yield与join方法的区别 tomcat_oracle java
长期以来，多线程问题颇为受到面试官的青睐。虽然我个人认为我们当中很少有人能真正获得机会开发复杂的多线程应用(在过去的七年中，我得到了一个机会)，但是理解多线程对增加你的信心很有用。之前，我讨论了一个wait()和sleep()方法区别的问题，这一次，我将会讨论join()和yield()方法的区别。坦白的说，实际上我并没有用过其中任何一个方法，所以，如果你感觉有不恰当的地方，请提出讨论。 &nb
android Manifest.xml选项阿尔萨斯 Manifest
结构继承关系 public final class Manifest extends Objectjava.lang.Objectandroid.Manifest 内部类 class Manifest.permission权限 class Manifest.permission_group权限组构造函数 public Manifest () 详细 androi
Oracle实现类split函数的方 zhaoshijie oracle
关键字：Oracle实现类split函数的方项目里需要保存结构数据，批量传到后他进行保存，为了减小数据量，子集拼装的格式，使用存储过程进行保存。保存的过程中需要对数据解析。但是oracle没有Java中split类似的函数。从网上找了一个，也补全了一下。 CREATE OR REPLACE TYPE t_split_100 IS TABLE OF VARCHAR2(100); cr

当强化学习遇上循环神经网络：从System 1到System 2 Deep Learning

你可能感兴趣的:(算法,神经网络,大数据,编程语言,python)