E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
多智能体深度强化学习
5.4 优化算法与利益最大化
我研究生的研究论文为
多智能体
差分进化算法。智能体是模拟人类智能,它能感知周围的环境,对环境做出反应,也能影响周围的环境。而多个智能体集合在一起用来模拟人类社会的智能。模拟人类智能,多智能
可以量化的管理学
·
2017-08-24 16:37
2015年到2017年 国家自然基金有关深度学习和计算机视觉的部分项目
以下是文字版本方便查找项目名称项目负责人依托单位视觉数据描述自动生成的关键技术研究徐常胜中国科学院自动化研究所面向机器人视觉的深度学习与拟人记忆机制特征提取融合方法研究赵晓光中国科学院自动化研究所基于深度学习与迁移学习的图像自动语义标注方法研究赵鹏安徽大学基于时空特征深度学习的无约束场景视觉目标跟踪研究张辉北京工业大学共融机器人的视觉注意模型及其
深度强化学习
方法袁泽剑西安交通大学基于深度学习的城市
devil_08
·
2017-08-23 08:08
综合
CNTK与
深度强化学习
笔记之二: Cart Pole游戏示例
前言前面一篇文章,CNTK与
深度强化学习
笔记之一:环境搭建和基本概念,非常概要的介绍了CNTK,
深度强化学习
和DQN的一些基本概念。
cuiwader
·
2017-08-22 17:24
深度学习
人工智能
技术
深度强化学习
CNTK
揭秘
深度强化学习
神经网络(DQN)
文中使用的词汇及含义agent:在人工智能领域,一般用Agent来表示一个具备行为能力的物体,比如机器人,无人车,人等等。reward:反馈值,做出一个动作得到相应的回报,比如超级马里奥,跳一下吃到dollar,不错,得分,那么这一下操作得到的反馈就可以是正的,相反跳一下碰到蘑菇怪了,gameover,那这一下操作的反馈就可以是负的action:操作,行为,比如上面reward中提到的跳跃操作强化
明月几时有__
·
2017-08-20 16:20
进击的
深度强化学习
——写在 Dota2 5v5 被AI攻克之前
NeilZhu,IDNot_GOD,UniversityAI创始人&ChiefScientist,致力于推进世界人工智能化进程。制定并实施UAI中长期增长战略和目标,带领团队快速成长为人工智能领域最专业的力量。作为行业领导者,他和UAI一起在2014年创建了TASA(中国最早的人工智能社团),DLCenter(深度学习知识中心全球价值网络),AIgrowth(行业智库培训)等,为中国的人工智能人才
朱小虎XiaohuZhu
·
2017-08-13 23:16
【总结】淘宝搜索/推荐系统背后
深度强化学习
与自适应在线学习的实践之路
搜索算法研究与实践1.1背景淘宝的搜索引擎涉及对上亿商品的毫秒级处理响应,而淘宝的用户不仅数量巨大,其行为特点以及对商品的偏好也具有丰富性和多样性。因此,要让搜索引擎对不同特点的用户作出针对性的排序,并以此带动搜索引导的成交提升,是一个极具挑战性的问题。传统的LearningtoRank(LTR)方法主要是在商品维度进行学习,根据商品的点击、成交数据构造学习样本,回归出排序权重。LTR学习的是当前
一寒惊鸿
·
2017-08-01 15:07
广告/推荐
tensorflow4:创建一个简单的强化学习游戏
DeepQNetwork是DeepMind最早(2013年)提出来的,是
深度强化学习
方法。最开始AI什么也不会,通过给它提供游戏界面像素和分数,慢慢把它训练成游戏高手。
风之清扬
·
2017-07-31 10:18
tensorflow学习笔记
深度强化学习
Deep Reinforcement Learning 学习整理
这学期的一门机器学习课程中突发奇想,既然卷积神经网络可以识别一副图片,解决分类问题,那如果用神经网络去控制‘自动驾驶’,在一个虚拟的环境中不停的给网络输入车周围环境的图片,让它去选择前后左右中的一个操作,并给予适当的反馈,是否能够把‘驾驶问题’,转化为分类的问题,用神经网络解决呢。和经典的强化学习ReinforcementLearning最大的区别是,它将直接处理像素级的超高维度rawimages
算法学习者
·
2017-07-14 00:04
RL
Alphago原理浅析
1、
深度强化学习
强化学习是受到生物能够有适应环境的启发,以试错的机制与环境进行交互,通过最大化累积奖赏的方式来学习最优策略。
ccj_zj
·
2017-06-30 19:06
Machine
Learning
『干货』
深度强化学习
与自适应在线学习的阿里实践
原文链接1搜索算法研究与实践1.1背景淘宝的搜索引擎涉及对上亿商品的毫秒级处理响应,而淘宝的用户不仅数量巨大,其行为特点以及对商品的偏好也具有丰富性和多样性。因此,要让搜索引擎对不同特点的用户作出针对性的排序,并以此带动搜索引导的成交提升,是一个极具挑战性的问题。传统的LearningtoRank(LTR)方法主要是在商品维度进行学习,根据商品的点击、成交数据构造学习样本,回归出排序权重。LTR学
小万君
·
2017-06-23 10:51
Ian Goodfellow,Yoshua Bengio合著《深度学习》教材,2017年最新中文版下载
还有更多关于
深度强化学习
,斯坦福2017年最新Tensorflow视频教程,生成对抗网络GAN视频教程。
lqfarmer
·
2017-06-14 15:00
深度强化学习
——A3C
联系方式:
[email protected]
异步的优势行动者评论家算法(AsynchronousAdvantageActor-Critic,A3C)是Mnih等人根据异步强化学习(AsynchronousReinforcementLearning,ARL)的思想,提出的一种轻量级的DRL框架,该框架可以使用异步的梯度下降法来优化网络控制器的参数,并可以结合多种RL算法。一、问题与贡献存在的问题不同类
草帽B-O-Y
·
2017-06-13 20:33
深度强化学习
深度强化学习
控制移动机器人
联系方式:
[email protected]
一、实验目的使用
深度强化学习
控制移动机器人在复杂环境中避障、收集物品到指定点。所用到的算法包括DQN、Deuling-DDQN、A3C、DDPG、NAF。
草帽B-O-Y
·
2017-06-10 17:31
深度强化学习
深度学习
强化学习
机器人控制算法
深度强化学习
深度强化学习
——DQN
联系方式:
[email protected]
(DeepQ-Learning)可谓是
深度强化学习
(DeepReinforcementLearning,DRL)的开山之作,是将深度学习与强化学习结合起来从而实现从感知
草帽B-O-Y
·
2017-06-05 21:24
深度强化学习
<纯干货-5>Deep Reinforcement Learning
深度强化学习
_论文大集合
本文罗列了最近放出来的关于
深度强化学习
(DeepReinforcementLearning,DRL)的一些论文。文章采用人工定义的方式来进行组织,按照时间的先后进行排序,越新的论文,排在越前面。
lqfarmer
·
2017-06-05 16:00
深度学习
DRL
深度强化学习论文
<纯干货-4> 加州大学伯克利分校2017年最新
深度强化学习
视频课程_part3
上次跟大家分享了加州大学伯克利分校在今年1月份发布的
深度强化学习
的基本课程第三次和第四次课程内容,今天继续给大家分享第五次和第六次课程的内容。包括在线视频、视频教程和ppt的百度云下载地址。
lqfarmer
·
2017-06-03 10:00
视频教程
深度学习
深度强化学习
DRL
DQN_tensorflow 源码解读
也就是DeepMind的最原始的算法,该论文对应的开源代码很多,这里以github上的一个开源代码[https://github.com/gliese581gg/DQN_tensorflow]为例,理解
深度强化学习
的具体训练学习过程
Charel_CHEN
·
2017-05-28 14:55
深度学习与计算机视觉
加州伯克利大学2017年最新
深度强化学习
视频课程_part1
分享一套关于
深度强化学习
(DeepReinforcementLearning,DRL)一套视频课程,这套课程是加州伯克利大学从2017年初,陆续放出的一套关于DeepReinforcementLearning
lqfarmer
·
2017-05-26 13:17
深度学习
深度学习视频教程及资料下载
深度强化学习DRL
<纯干货-4> 加州伯克利大学2017年最新
深度强化学习
视频课程_part1
分享一套关于
深度强化学习
(DeepReinforcementLearning,DRL)一套视频课程,这套课程是加州伯克利大学从2017年初,陆续放出的一套关于DeepReinforcementLearning
lqfarmer
·
2017-05-26 13:00
深度学习
视频课程
深度强化学习
DRL
加州伯克利大学
Deep Mind Reinforcement learning course Lecture 1_2
今天给大家送上DeepMind放出来的Reinforcementlearningcourse视频课程,接下来一段时间也会陆续和大家分享
深度强化学习
DeepReinforcementLearning的相关知识
lqfarmer
·
2017-05-22 10:04
深度学习
深度学习视频教程及资料下载
深度强化学习DRL
深度强化学习
( DQN ) 初探
1.Google的DQN论文2015年2月,Google在Nature上发表了一篇论文(见附件):Human-levelcontrolthroughdeepreinforcementlearning。文章描述了如何让电脑自己学会打Atari2600电子游戏。Atari2600是80年代风靡美国的游戏机,总共包括49个独立的游戏,其中不乏我们熟悉的Breakout(打砖块),GalaxyInvade
Qcloud_KID
·
2017-05-04 17:55
linux
强化学习进阶 第八讲 确定性策略方法
若不熟的话可以看
深度强化学习
系列第一讲DQN-知乎专栏。图8.1策略搜索方法分类我们还是从图8.1策略搜索方法的分类讲起。
Bixiwen_liu
·
2017-04-20 19:05
深度学习
机器学习
漫谈
深度强化学习
之手写Deep Q-Network解决迷宫问题
1.Q-Learning回顾上一期我们讲了Q-Learning以及Sarsa的算法流程,同时我们还手写了基于Q-Learning以及Sarsa来解决OpenAIgym中的FrozenLake问题。今天,我们将借助神经网络来重新解决这个问题。(FrozenLake问题简单来说就是走迷宫,走错了将不会有任何奖励,走到了目标位置就会获得1的奖励。关于FrozenLake问题的更多描述,请参阅https:
算法学习者
·
2017-04-19 11:40
RL
tensorflow41《TensorFlow实战》笔记-08-02 TensorFlow实现
深度强化学习
-估值网络 code
01强化学习简介
深度强化学习
(DeepReinforcementLearning)环境状态(EnvironmentState)行动(Action)奖励(Reward)通过连续决策、采用最好的行动,获得最高的奖励延迟奖励和未来利益不像无监督学习那样完全没有学习目标
longji
·
2017-04-16 18:00
tensorflow
tensorflow40《TensorFlow实战》笔记-08-01 TensorFlow实现
深度强化学习
-策略网络 code
#《TensorFlow实战》08TensorFlow实现
深度强化学习
#win10Tensorflow1.0.1python3.5.3 #CUDAv8.0cudnn-8.0-windows10-x64
longji
·
2017-04-16 18:00
tensorflow
使用TensorFlow创建可自动玩游戏的DQN模型-CSDN公开课-专题视频课程
使用TensorFlow创建可自动玩游戏的DQN模型—2771人已学习课程介绍
深度强化学习
(DQN)是人工智能领域热门的方向之一,吸引众多AI领域的优秀科学家去发掘,其通用性在各领域备推崇,本次课程集中讲解
CSDN学院官方账号
·
2017-03-22 09:28
视频教程
强化学习
前言
深度强化学习
可以说是人工智能领域现在最热门的方向,吸引了众多该领域优秀的科学家去发掘其能力极限。
generalAI
·
2017-03-20 16:32
机器学习
人工智能
深度学习
对
深度强化学习
的理解
DeepMind第一个正式提出DQN的概念并能够做出比较有效果的实验。一直以来,强化学习都面临对人工提取特征的依赖的问题,深度神经网络的发展给问题的解决带来了希望,卷积神经网络可以从像素矩阵中直接提取出可以和人工提取值相媲美的特征值。就是,把一张游戏的图片传进去,卷积神经网络就可以辨识出图片中任务所处的状态,例如:在什么地方、周围是什么环境。DeepMind在他们的DQN模型中使用了经验回放机制,
NSDL
·
2017-03-19 10:48
强化学习
十分钟梳理《概率统治世界》丨数据工匠简报(Mar. 06)
十分钟梳理《概率统治世界》丨数据工匠简报(Mar.06)摘要:本期介绍一篇梳理《概率统治世界》的好文;接着介绍狗熊会推出的“机器学习论导”;最后介绍最近日本研究者提出新算法:让机器人通过多模态
深度强化学习
获得社会智能
Datartisan数据工匠
·
2017-03-06 11:19
写作和翻译
翻译词汇benefits...惠及写作学习小贤哥2017学写作讲堂往期目录个人翻译【机器人学家】公众号:马尔科夫决策过程及其性质-CMU
深度强化学习
第二讲【七月在线】公众号:译文|GAN之父在NIPS2016
NNNNNNNNNNNNY
·
2017-01-25 08:00
强化学习导论(Reinforcement Learning: An Introduction)读书笔记(一):强化学习介绍
因为课题转到
深度强化学习
方面,因此开始研究强化学习的内容,同时在读这方面的书,并将ReinforcementLearning:AnIntroduction(RichardS.SuttonandAndrewG.Barto
蓝色骨头零号
·
2017-01-14 12:47
强化学习
CS294--
深度强化学习
加州伯克利计算机教程2017年春季CS294
深度强化学习
官方网站【包括教学大纲、视频讲义、阅读材料】中文连载翻译地址感谢杜客大神~
忧郁一休
·
2017-01-09 20:54
强化学习
CS294--
深度强化学习
加州伯克利计算机教程2017年春季CS294
深度强化学习
官方网站【包括教学大纲、视频讲义、阅读材料】中文连载翻译地址感谢杜客大神~
youyuyixiu
·
2017-01-09 20:00
RL
深度强化学习
增强学习
深度增强学习
DRL
深度强化学习
系列(三)Value iteration Network
TensorFlow代码实现:https://github.com/TheAbhiKumar/tensorflow-value-iteration-networks原创文章,转载请标明出处:http://blog.csdn.net/ikerpeng/article/details/53784021知乎同步发布:https://zhuanlan.zhihu.com/p/24478944交流请加群:5
xiaoiker
·
2016-12-21 19:49
深度强化学习
GAIC 全球人工智能大会预热之四——
深度强化学习
的来头
NeilZhu,IDNot_GOD,UniversityAI创始人&ChiefScientist,致力于推进世界人工智能化进程。制定并实施UAI中长期增长战略和目标,带领团队快速成长为人工智能领域最专业的力量。作为行业领导者,他和UAI一起在2014年创建了TASA(中国最早的人工智能社团),DLCenter(深度学习知识中心全球价值网络),AIgrowth(行业智库培训)等,为中国的人工智能人才
朱小虎XiaohuZhu
·
2016-11-03 00:41
深度强化学习
初窥之DQN
最近对强化学习特别是
深度强化学习
做了一番了解,不像以前只是大概模模糊糊有个影子,为了加深印象,决定把相关内容记到这里。
mijiaoxiaosan
·
2016-10-26 11:40
机器学习
深度学习
算法
机器学习
强化学习
深度学习
深度强化学习
(机器之心)
深度强化学习
1.增强学习的主要挑战是什么?信用分配问题(creditassignmentproblem)与探索-开发困境(exploration-exploitationdilemma)。
jim_cainiaoxiaolang
·
2016-09-19 23:10
机器学习和深度学习
深度强化学习
探索
2016年年初备受瞩目的围棋“人机大战”,以人类围棋冠军被血虐落下帷幕。这只谷歌DeepMind团队开发的围棋机器人阿法狗不仅赚足了眼球,更是掀起了一波关于人工智能的讨论狂潮。现在好像作报告还是写文章都要把阿法狗提一下才能紧跟时代潮流啊(好像也自黑了一下)。其实人家DeepMind不光是下围棋的,在他们的主页上写着大大的“SolveIntelligence”。要“SolveIntelligence
凌风探梅
·
2016-08-23 15:23
DeepLearning
微软邓力:
深度强化学习
在聊天机器人领域的应用
微软人工智能首席科学家邓力在此前接受CSDN的采访时曾表示
深度强化学习
是A.I.Bots的关键技术,在这篇发表于venturebeat的文章中,他详细解析了为什么需要A.I.Bots,A.I.Bots的实现
周建丁
·
2016-08-04 10:08
揭秘
深度强化学习
文/TambetMatiisen译/赵屹华,刘翔宇原作者TambetMatiisen在文章结尾列出了对本文内容给出意见和建议的读者,以及深入了解这些技术的在线文档和视频链接,受篇幅所限,译文不再赘述。感谢TambetMatiisen授权《程序员》翻译和刊载。原文链接:http://neuro.cs.ut.ee/demystifying-deep-reinforcement-learning/本文为
csdn_csdn__AI
·
2016-07-27 18:12
论文笔记之:Asynchronous Methods for Deep Reinforcement Learning
AsynchronousMethodsforDeepReinforcementLearningICML2016
深度强化学习
最近被人发现貌似不太稳定,有人提出很多改善的方法,这些方法有很多共同的idea:
AHU-WangXiao
·
2016-07-18 15:00
深度强化学习
导引
NeilZhu,IDNot_GOD,UniversityAI创始人&ChiefScientist,致力于推进世界人工智能化进程。制定并实施UAI中长期增长战略和目标,带领团队快速成长为人工智能领域最专业的力量。作为行业领导者,他和UAI一起在2014年创建了TASA(中国最早的人工智能社团),DLCenter(深度学习知识中心全球价值网络),AIgrowth(行业智库培训)等,为中国的人工智能人才
朱小虎XiaohuZhu
·
2016-06-12 20:54
MZ test17# NOIP模拟题 #T3 第3 题 登山机器人(robot.pas/cpp)
第3题 登山机器人(robot.pas/cpp) 【问题描述】登山机器人是一个极富挑战性的高技术密集型科学研究项目,它为研究发展
多智能体
系统和多机器人之间的合作与对抗提供了生动的研究模型。
qq_33583069
·
2016-05-17 17:00
OpenAI
深度强化学习
教程 存档
NeilZhu,IDNot_GOD,UniversityAI创始人&ChiefScientist,致力于推进世界人工智能化进程。制定并实施UAI中长期增长战略和目标,带领团队快速成长为人工智能领域最专业的力量。作为行业领导者,他和UAI一起在2014年创建了TASA(中国最早的人工智能社团),DLCenter(深度学习知识中心全球价值网络),AIgrowth(行业智库培训)等,为中国的人工智能人才
朱小虎XiaohuZhu
·
2016-05-13 10:42
贝叶斯规划学习BPL
深度强化学习
: 机器学习的分支:深度学习和强化学习。 深度学习是一种机器学习中建模数据的隐含分布的多层表达的算法。换句话来说,深度学习算法自动提取分类中所需要的低层次或者高层次特征。
ge_gewu
·
2016-03-28 10:00
bpl
【深度学习介绍系列之二】——
深度强化学习
:卷积神经网络
介绍深度学习强化学习中的卷积神经网络卷积神经网络的大致介绍我们在前一篇文章
深度强化学习
(一)中已经说过了。本篇文章会详细介绍卷积神经网络的起源,发展和应用。
荪荪
·
2016-02-25 22:56
深度学习
【深度学习介绍系列之二】——
深度强化学习
:卷积神经网络
介绍深度学习强化学习中的卷积神经网络卷积神经网络的大致介绍我们在前一篇文章
深度强化学习
(一)中已经说过了。本篇文章会详细介绍卷积神经网络的起源,发展和应用。
SMF0504
·
2016-02-25 22:00
【深度学习介绍系列之一】——
深度强化学习
本节乘热打铁先说说
深度强化学习
吧。说到机器学习最酷的分支,非Deeplearning和Reinforcementlearning莫属(以下分别简称DL和RL)。
荪荪
·
2016-02-25 18:03
深度学习
【深度学习介绍系列之一】——
深度强化学习
本节乘热打铁先说说
深度强化学习
吧。说到机器学习最酷的分支,非Deeplearning和Reinforcementlearning莫属(以下分别简称DL和RL)。
SMF0504
·
2016-02-25 18:00
【深度学习介绍系列】——前言
主要介绍机器学习的基础知识(线性回归,逻辑回归,贝叶斯,支持向量机,马尔科夫等),自编码网络,深度置信网络,卷积神经网络,递归神经网络,
深度强化学习
。这些基本覆盖了机器学习和深度学习的主要算法。
SMF0504
·
2016-02-25 17:00
上一页
33
34
35
36
37
38
39
40
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他