Reinforcement 第14页

《Deep Reinforcement Learning framework for Autonomous Driving》翻译

《DeepReinforcementLearningframeworkforAutonomousDriving》翻译摘要强化学习被认为是一种强大的人工智能范式，可以通过与环境的互动和从错误中学习来教机器

菜鸟小菇凉·2022-12-20 08:49

论文理解【RL经典】—— 【SQL】Reinforcement Learning with Deep Energy-Based Policies

标题：ReinforcementLearningwithDeepEnergy-BasedPolicies文章链接：ReinforcementLearningwithDeepEnergy-BasedPolicies

云端FFF·2022-12-19 16:25

强化学习实践 | DQN和OpenAI Gym中的CartPole

FixedQ-targets3.伪代码4.PyTorch实现4.1CartPole介绍4.2DummyPolicy4.3DQN4.4完整代码(附注释)：原论文：PlayingAtariwithDeepReinforcementLearning

SuperFeHanHan·2022-12-19 14:37

浅尝深度强化学习(一)---Deep Q-Learning with Keras and Gym-CartPole-v0

1.前言1.1一直都觉得深度强化学习(DRLDeepeinReinforcementLearning)是一个很神奇的技术,利用奖励去(Reward)诱导神经网络(Neuralnetwork)学习参数,调整策略

零壹博弈·2022-12-19 14:37

Reinforement Learning-chapter1

ReinforementLearningReinforcementLearning[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-sG1oATCa-1603206541533

韩绘锦·2022-12-19 08:46

初探强化学习(7)基于模型的强化学习的应用综述

原文名字为：SurveyofModel-BasedReinforcementLearning:ApplicationsonRobotics这是一个2017年的论文1.Introduction强化学习（RegulationLearning

难受啊！马飞...·2022-12-18 16:49

Combinatorial Optimization by Graph Pointer Networks and Hierarchical Reinforcement Learning翻译

摘要在这项工作中，我们介绍使用强化学习（RL）进行训练的图形指针网络（GPN），以解决旅行商问题（TSP）。GPN通过在输入上引入图嵌入层来构建PointerNetworks，该图嵌入层捕获节点之间的关系。此外，为了近似求解带有时间窗的约束组合优化问题（例如TSP），我们使用RL训练了分层GPN（HGPN），该学习了分层策略以在约束下找到最佳城市置换。层次结构的每一层都设计有单独的奖励功能，从而可

zzzzz忠杰·2022-12-18 13:35

论文笔记：Offline Reinforcement Learning for Mobile Notifications

一、本文要解决的问题及模型选择逻辑业务问题：time-insensitivenotificationstodeterminethebestdeliverytimestowardslong-termengagement(oneweek)解决这个问题面临的挑战：userengagementmaynotbeattributedtoasinglenotification,butratherasequenc

foreverbeginnerz·2022-12-18 12:01

【神经网络】人工神经网络学习方法

目前，神经网络的学习方法有多种，按有无导师来分，可分为有教师学习（SperrisedLearning）、无教师学习（UnsperrisedLearning）和再励学习（ReinforcementLearning

Borter的博客·2022-12-18 09:26

神经架构搜索(Neural Architecture Search,NAS)介绍

SearchSpaceSearchStrategyPerformanceEstimationStrategyReinforcementLearnin

虎大猫猫·2022-12-18 07:46

【文献阅读】RL经典：Benchmarking Deep Reinforcement Learning for Continuous Control

BenchmarkingDeepReinforcementLearningforContinuousControlBriefpaper链接paper开源代码code引用量300++作者PieterAbbeel

wxmcp3·2022-12-16 23:11

上榜ICML2022，网易伏羲研究成果助力优化游戏AI训练流程

网易伏羲投稿的论文《基于个体奖励协助的多智能体强化学习（IndividualRewardAssistedMulti-AgentReinforcementLearning）》顺利入选，意味着网易伏羲的AI

网易伏羲·2022-12-16 14:47

2021-arXiv-Multi-UAV Path Planning for Wireless Data Harvesting with Deep Reinforcement Learning

一、主要内容提出一种多智能体强化学习MARL方法，该方法适用定义数据收集任务的场景参数的深刻变化，而不需要执行高昂的重新计算或重新学习控制策略场景参数：部署的UAV数量、物联设备的数量、位置和数据量，或最大飞行时间等无人机团队特点：合作的、非通信的、同质的无人机团队任务：max从分布式物联网传感器节点收集的数据路径规划问题→部分可观察马尔科夫决策过程该方法旨在直接在大场景参数空间上进行训练和泛化，

疑惑的兔子·2022-12-16 13:13

Crowd-aware Robot Navigation with Attention-based Deep Reinforcement Learning 论文解析

Crowd-RobotInteraction:Crowd-awareRobotNavigationwithAttention-basedDeepReinforcementLearning论文解析Crowd-RobotInteraction

mawonly·2022-12-16 13:13

吴恩达机器学习打卡day1

图1 图2介绍了机器学习的分类，主要有：Superivedlearning和Unsupervisedlearning,其他的还有Reinforcementlearning等等

学吧学无止境·2022-12-16 06:10

[吴恩达机器学习课程笔记] week four强化学习

强化学习定义强化学习（ReinforcementLearning,RL），又称再励学习、评价学习或增强学习，是机器学习的范式和方法论之一，用于描述和解决智能体（agent）在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题

mossfan·2022-12-16 04:35

简介：Unity机器学习代理工具包

OurtwopreviousblogentriesimpliedthatthereisarolegamescanplayindrivingthedevelopmentofReinforcementLearningalgorithms.Astheworld

culiao6493·2022-12-16 03:14

Unity机器学习2 ML-Agents第一个例子

机器学习的过程MLAgents机器强化学习的过程（reinforcementlearning）observation-监视，观察decision

Thinbug·2022-12-16 03:42

DeepMind:星际争霸2：强化学习新挑战（论文翻译）

sc2le.pdf整个论文分为：摘要（Abstract）1.介绍（Introduction）2.相关工作（Relatedwork）3.sc2le环境（TheSC2LEEnvironment）4.强化学习：基线代理（ReinforcementLearning

BBlue-Sky·2022-12-16 00:55

python模型预测控制_模型预测控制

AboutThisworkaimsatimplementingsimpleMPCcontrollerforgym'sMujocomodelsasdescribedinNeuralNetworkDynamicsforModel-BasedDeepReinforcementLearningwithModel-FreeFine-TuningandbuildonitbyaddingLQRbas

weixin_39922749·2022-12-15 08:44

实时障碍更新局部路径寻优算法矢量地图数据局部路径规划解集_自动驾驶近期行为预测和规划的一些文章介绍（下）...

“DrivingwithStyle:InverseReinforcementLearninginGeneral-PurposePlanningforAutomatedDriving”由于城市环境的场景复杂性高

weixin_39750410·2022-12-14 14:44

机器学习基础学习笔记（七）机器学习算法的类型（监督，无监督，强化学习）

这里写目录标题监督、无监督、强化学习监督学习（SupervisedLearning）无监督学习（UnsupervisedLearning，UL）强化学习（ReinforcementLearning，RL

Giao哥不瘦到100不改名·2022-12-13 15:02

三篇强化学习用于多智能体路径规划的论文

Multi-RobotPathPlanningMethodUsingReinforcementLearning期刊：appliedscienceMDPI总结：使用VGG进行特征提取，再使用DQN进行决策

strawberry47·2022-12-13 14:56

【论文笔记】MIT-基于DRL的行人环境移动机器人导航

MIT_papers_readingNumtitleauthortime1DecentralizedNon-communicatingMultiagentCollisionAvoidancewithDeepReinforcementLearningYuFanChen

209SPiriT·2022-12-13 14:54

深度强化学习

参考1.引言—动手学深度学习2.0.0documentation深度强化学习（deepreinforcementlearning）将深度学习应用于强化学习的问题，是非常热门的研究领域。

流萤数点·2022-12-13 09:55

吴恩达Coursera, 机器学习专项课程, Machine Learning：Unsupervised Learning, Recommenders, Reinforcement Learning第.

Practicequiz:CollaborativeFiltering第1个问题：Youhavethefollowingtableofmovieratings:Refertothetableaboveforquestion1and2；Assumenumberingstartsat1forthisquiz,sotheratingforFootballForeverbyElissaisat(1,1)，

ZhemgLee·2022-12-13 07:59

【强化学习论文合集】二十一.2019神经信息处理系统大会论文(NIPS2019)

强化学习（ReinforcementLearning,RL），又称再励学习、评价学习或增强学习，是机器学习的范式和方法论之一，用于描述和解决智能体（agent）在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题

山野庸才熏悟空·2022-12-12 21:39

吴恩达Coursera, 机器学习专项课程, Machine Learning：Unsupervised Learning, Recommenders, Reinforcement Learning第.

吴恩达Coursera,机器学习专项课程,MachineLearning：UnsupervisedLearning,Recommenders,ReinforcementLearning第一周所有jupyternotebook

ZhemgLee·2022-12-12 18:41

交通流优化：一种强化学习方法

1.文章信息《Trafficflowoptimization:Areinforcementlearningapproach》是2016年发表在EngineeringApplicationsofArtificialIntelligence

当交通遇上机器学习·2022-12-11 21:27

深度学习介绍与DQN

文章目录一、ReinforcementLearning简介二、强化学习方法分类1.理解环境（modelbased）/不理解环境（modelfree）2.基于概率（policy-based）/基于价值（value-based

Late May·2022-12-11 18:26

机器学习之强化学习概览

a6683691974433702408/2019-04-2512:58:24本文翻译自VishalMaini在Medium平台上发布的《MachineLearningforHumans》的教程的《Part5:ReinforcementLearning

喜欢打酱油的老鸟·2022-12-11 18:20

Advantage Actor-Critic优势演员-评论员（A2C）

评论员算法是结合策略梯度和时序差分学习的强化学习方法AdvantageActor-Critic（A2C）AsynchronousAdvantageActor-Critic（A3C）（多进程）AsynchronousMethodsforDeepReinforcementLearningPolicyGradient

bujbujbiu·2022-12-11 16:47

方博机器人_【深度】中科院自动化所徐德研究员等：机器人操作技能模型综述...

技能学习的类型主要包括示教学习(learningfromdemonstration)，强化学习(reinforcementlearning)，以及二者的结合。

哦哦了·2022-12-11 11:10

【强化学习论文合集】二十.2019机器人与自动化国际会议论文(ICRA2019)

强化学习（ReinforcementLearning,RL），又称再励学习、评价学习或增强学习，是机器学习的范式和方法论之一，用于描述和解决智能体（agent）在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题

山野庸才熏悟空·2022-12-11 09:58

【强化学习论文合集】十九.2019国际人工智能联合会议论文(IJCAI2019)

强化学习（ReinforcementLearning,RL），又称再励学习、评价学习或增强学习，是机器学习的范式和方法论之一，用于描述和解决智能体（agent）在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题

山野庸才熏悟空·2022-12-11 09:57

【论文阅读-强化学习】基于深度强化学习的多区域MEC网络中支持缓存的计算卸载

Caching-EnabledComputationOffloadinginMulti-RegionMECNetworkviaDeepReinforcementLearning文章目录I.IntroductionII.RelatedWorksIII.SystemModelA.ComputationModelLocalComputationModelOffloadingComputationMode

sc0024·2022-12-11 05:14

深度强化学习：入门(Deep Reinforcement Learning: Scratching the surface)

原文链接：https://blog.csdn.net/qq_32690999/article/details/78594220本博客是对学习李宏毅教授在youtube上传的课程视频《DeepReinforcementLearning

旭旭_哥·2022-12-10 20:31

强化学习 (Reinforcement Learning)

强化学习：强化学习是机器学习中的一个领域，强调如何基于环境而行动，以取得最大化的预期利益。其灵感来源于心理学中的行为主义理论，即有机体如何在环境给予的奖励或惩罚的刺激下，逐步形成对刺激的预期，产生能获得最大利益的习惯性行为。是为了让机器从一开始什么都不会什么都不懂，通过不断的从错误中学习，不断的去尝试，然后找到规律，学习到达到目标的方法，这就是完整的强化学习的过程。例如：强化学习所解决的问题的特点

AI-孟菜菜·2022-12-10 20:30

深度学习之：强化学习 Reinforcement Learning

文章目录认识强化学习SparseRewardSupervisedLearningv.s.RLRL玩游戏Policy-based&Value-basedPolicy-based训练模型的三步骤定义目标函数衡量目标函数的好坏RL的目标函数的好坏（reward总和的期望）如何求得Rθˉ\bar{R_{\theta}}Rθˉ优化目标函数Policy-basedRL的一点补充Version0Version1

暖仔会飞·2022-12-10 20:58

MARLlib 强化学习新的Benchmark

论文名称为：MARLlib:ExtendingRLlibforMulti-agentReinforcementLearning。

为你，千千万万遍·2022-12-10 13:32

OpenAI Gym基础教程

openaigym是一个增强学习（reinforcementlearning,RL）算法的测试床（testb

VictorLeeLk·2022-12-10 08:17

Briefings in Bioinformatics2021 | DLGN+：基于GAN和强化学习的分子从头双目标性质生成

论文标题：Denovogenerationofdual-targetligandsusingadversarialtrainingandreinforcementlearning论文地址：https:/

羊飘·2022-12-10 06:17

Torch中的Reinforcement Learning的底层实现

原理篇实现篇nnReinforceCategoricalnnReinforce强化学习已经成为大家关注的点，至少据我了解世界顶级名校CV的实验室都在做这方面的工作。最近也在做相关的Research，正好遇到了在Torch中的RL实现，发现没有什么可以参考的中文资料，只能试着来解释一下Torch中的RL实现。原理篇在Torch中的RL【2】实现参考的是论文【1】的方法实现。实现的也是比较简单的imm

Snail_Walker·2022-12-09 17:51

强化学习实验环境 I (MuJoCo, OpenAI Gym, rllab, DeepMind Lab, TORCS, PySC2)

和其它的机器学习方向一样，强化学习（ReinforcementLearning）也有一些经典的实验场景，像Mountain-Car，Cart-Pole等。

Alvin Jiao·2022-12-09 16:04

Reinforcement Learning for UAV Attitude Control-强化学习的无人机姿态控制

系列文章目录ReinforcementLearningforUAVAttitudeControl-强化学习的无人机姿态控制文献链接代码链接作者：WILLIAMKOCH,RENATOMANCUSO,RICHARDWEST

D_JQ·2022-12-09 16:01

【论文随笔】Model-based Reinforcement Learning from Signal Temporal Logic Specifications

参考文献：P.Kapoor,A.Balakrishnan,andJ.V.Deshmukh,“Model-basedReinforcementLearningfromSignalTemporalLogicSpecifications

ALL 2 WELL·2022-12-08 12:09

论文阅读——HEVC中用于动态视频序列基于强化学习的速率控制方法

一、文章出处本文题为《RateControlMethodBasedonDeepReinforcementLearningforDynamicVideoSequencesinHEVC》，文章链接：原文链接

liaojq2020·2022-12-08 09:58

【强化学习论文】Decision Transformer：通过序列建模进行强化学习

Article文献题目：DecisionTransformer:ReinforcementLearningviaSequenceModeling文献时间：2021摘要我们引入了一个将强化学习（RL）抽象为序列建模问题的框架

Wwwilling·2022-12-08 09:27

基于多智能体强化学习的迭代细化的交互式三维医学图像分割

论文笔记：Iteratively-RefinedInteractive3DMedicalImageSegmentationwithMulti-AgentReinforcementLearningAbstract1

wowowoj·2022-12-08 09:56

【强化学习论文】多智能体强化学习是一个序列建模问题

文献题目：Multi-AgentReinforcementLearningisASequenceModelingProblem时间：2022代码：https://github.com/PKU-MARL/

Wwwilling·2022-12-08 09:50

推荐频道

Reinforcement

《Deep Reinforcement Learning framework for Autonomous Driving》翻译

论文理解【RL经典】—— 【SQL】Reinforcement Learning with Deep Energy-Based Policies

强化学习实践 | DQN和OpenAI Gym中的CartPole

浅尝深度强化学习(一)---Deep Q-Learning with Keras and Gym-CartPole-v0

Reinforement Learning-chapter1

初探强化学习(7)基于模型的强化学习的应用综述

Combinatorial Optimization by Graph Pointer Networks and Hierarchical Reinforcement Learning翻译

论文笔记：Offline Reinforcement Learning for Mobile Notifications

【神经网络】人工神经网络学习方法

神经架构搜索(Neural Architecture Search,NAS)介绍

【文献阅读】RL经典：Benchmarking Deep Reinforcement Learning for Continuous Control

上榜ICML2022， 网易伏羲研究成果助力优化游戏AI训练流程

2021-arXiv-Multi-UAV Path Planning for Wireless Data Harvesting with Deep Reinforcement Learning

Crowd-aware Robot Navigation with Attention-based Deep Reinforcement Learning 论文解析

吴恩达机器学习打卡day1

[吴恩达机器学习课程笔记] week four强化学习

简介：Unity机器学习代理工具包

Unity机器学习2 ML-Agents第一个例子

DeepMind:星际争霸2：强化学习新挑战（论文翻译）

python模型预测控制_模型预测控制

实时障碍更新 局部路径寻优算法 矢量地图数据 局部路径规划解集_自动驾驶近期行为预测和规划的一些文章介绍（下）...

机器学习基础学习笔记（七）机器学习算法的类型（监督，无监督，强化学习）

三篇强化学习用于多智能体路径规划的论文

【论文笔记】MIT-基于DRL的行人环境移动机器人导航

深度强化学习

吴恩达Coursera, 机器学习专项课程, Machine Learning：Unsupervised Learning, Recommenders, Reinforcement Learning第.

【强化学习论文合集】二十一.2019神经信息处理系统大会论文(NIPS2019)

吴恩达Coursera, 机器学习专项课程, Machine Learning：Unsupervised Learning, Recommenders, Reinforcement Learning第.

交通流优化：一种强化学习方法

深度学习介绍与DQN

机器学习之强化学习概览

Advantage Actor-Critic优势演员-评论员（A2C）

方博机器人_【深度】中科院自动化所徐德研究员等：机器人操作技能模型综述...

【强化学习论文合集】二十.2019机器人与自动化国际会议论文(ICRA2019)

【强化学习论文合集】十九.2019国际人工智能联合会议论文(IJCAI2019)

【论文阅读-强化学习】基于深度强化学习的多区域MEC网络中支持缓存的计算卸载

深度强化学习：入门(Deep Reinforcement Learning: Scratching the surface)

强化学习 (Reinforcement Learning)

深度学习之：强化学习 Reinforcement Learning

MARLlib 强化学习新的Benchmark

OpenAI Gym基础教程

Briefings in Bioinformatics2021 | DLGN+：基于GAN和强化学习的分子从头双目标性质生成

Torch中的Reinforcement Learning的底层实现

强化学习实验环境 I (MuJoCo, OpenAI Gym, rllab, DeepMind Lab, TORCS, PySC2)

Reinforcement Learning for UAV Attitude Control-强化学习的无人机姿态控制

【论文随笔】Model-based Reinforcement Learning from Signal Temporal Logic Specifications

论文阅读——HEVC中用于动态视频序列基于强化学习的速率控制方法

【强化学习论文】Decision Transformer：通过序列建模进行强化学习

基于多智能体强化学习的迭代细化的交互式三维医学图像分割

【强化学习论文】多智能体强化学习是一个序列建模问题

上榜ICML2022，网易伏羲研究成果助力优化游戏AI训练流程

实时障碍更新局部路径寻优算法矢量地图数据局部路径规划解集_自动驾驶近期行为预测和规划的一些文章介绍（下）...