whale52hertz

伯克利人工智能研究：基于模型的强化学习与神经网络动力学

来源：ATYUN AI平台

让机器人在现实世界中自主行动是很困难的。即使拥有昂贵的机器人和世界级的研究人员，机器人在复杂的、非结构化的环境中仍然难以自主导航和交互。

图1：一个学习的神经网络动态模型使一个六足机器人能够学习运行和跟踪所需的轨迹，只用了17分钟

能够处理所有复杂问题的工程系统是很难的。从非线性动力学和局部观测到不可预测的地形和传感器故障，机器人特别容易受到墨菲定律的影响:会出错的事总会出错。我们不是通过编码机器人可能遇到的每一个可能的场景来对抗墨菲定律，相反，我们可以选择接受失败的可能性，并让我们的机器人从中学习。从经验中学习控制策略是很有利的，因为与手工设计的控制器不同，学习控制器可以通过更多的数据来适应和改进。因此，当出现了一个场景，在这个场景中，所有事情都出错了，尽管机器人仍然会失败，但是，当下一次遇到类似的情况时，学习的控制器很有希望改正它之前犯过的错误。为了解决现实世界中任务的复杂性，目前基于学习的方法经常使用深度神经网络，这些神经网络强大但不数据有效:这些基于尝试和犯错（trial-and-error）的学习者通常会经历第二次，第三次，甚至是成千上万次失败。在现实世界中，现代深度强化学习方法的低效率是利用以学习为基础的方法的主要瓶颈之一。

我们一直在研究用神经网络进行机器人控制的简单并高效的学习方法。对于复杂的模拟机器人，以及现实世界的机器人(图1)，我们的方法能够学习机器人的运动技能，只使用从机器人在环境中随机采集的几分钟数据。在这篇博客文章中，我们将概述我们的方法和结果。更多的细节可以在本文底部的研究论文中找到。

样本效率:无模型的VS基于模型的
从经验中学习机器人技能通常基于强化学习。强化学习算法一般可分为两类:学习策略或价值函数的无模型，以及学习一种动态模型的基于模型。虽然无模型的深度强化学习算法能够学习大量的机器人技能，但它们通常会承受非常高的样本复杂度，通常需要数百万个样本才能获得良好的性能，而且通常只能一次学习一项任务。尽管之前的一些工作已经为实际操作任务部署了这些无模型的算法，但是这些算法的高复杂性和不灵活性阻碍了它们在现实世界中被广泛用于学习移动技能。

基于模型的强化学习算法通常被认为是更有效率的。然而,为了实现好的效率样本,这些传统的基于模型的算法使用相对简单的函数近似器（function approximator）,它不能很好地概括复杂的任务,或概率性的动力学模型,如高斯过程（Gaussian Process）,但它能很好地概括，但会对复杂性和高维域产生分歧,如能够诱导不连续的动态摩擦接触系统。相反，我们使用中等规模的神经网络作为函数近似器，它们可以达到极好的样本效率，同时还能表达出对各种复杂和高维度运动任务的泛化和应用的表达能力。

基于模型的深度强化学习的神经网络动力学
在我们的工作中，我们的目标是将深度神经网络模型在其他领域的成功扩展到基于模型的强化学习中。近年来，在将神经网络与基于模型的强化学习结合起来之前，还没有实现与更简单模型相竞争的结果，比如高斯过程。例如，在一篇名为“连续深度Q学习与基于模型的加速度”的论文1中，作者发现即使是线性模型在合成经验生成方面也取得了较好的成绩，而在论文2“通过随机值梯度学习连续控制策略”中，作者看到了将神经网络模型引入到无模型的学习系统中能够得到相对适度的成绩。我们的方法依赖于一些关键的决策。首先，我们在一个模型预测控制框架中使用学习的神经网络模型，在这个模型中，系统可以迭代地重新规划和修正它的错误。其次，我们使用的是相对短期的预测，这样我们就不必依赖模型来对未来做出非常准确的预测。这两个相对简单的设计决策使我们的方法能够执行各种各样的运动任务，而这些任务以前没有通过通用的基于模型的强化学习方法来演示，这些方法直接在原始状态观察中运行。

论文1：https://arxiv.org/pdf/1603.00748.pdf
论文2：https://arxiv.org/pdf/1510.09142.pdf

图2显示了我们基于模型的增强学习方法的图表。我们维护一个反复添加的轨迹数据集，我们使用这个数据集来训练我们的动态模型。数据集用随机轨迹初始化。然后，我们通过使用数据集训练一个神经网络动态模型，并使用学习的动态模型预测控制器(MPC)收集额外的轨迹来聚集到数据集上，从而执行强化学习。

图2：基于模型的强化学习算法的概述

动态模型
我们将学习的动态函数参数化为一个深神经网络，它是由一些需要学习的权重参数化的。我们的动态函数将作为输入当前状态（state）站立行为at和输出预测的状态差异st+1−st。动态模型本身可以在一个受监督的学习环境中进行训练，收集的训练数据来自于成对的输入(st，at)和相应的输出标签(st+1，st)。

请注意，我们所提到的“状态”可以随着agent的变化而变化，它可以包括诸如质量位置的中心、质量速度的中心、关节位置和其他可测量的数量等要素。

控制器
为了使用学习的动态模型来完成一个任务，我们需要定义一个对任务进行编码的回报函数。例如，一个标准的“x_vel”回报可以编码一个前进的任务。对于轨迹跟踪的任务，我们制定了一个回报函数，它能激励我们沿着轨迹运动，并沿着轨迹向前推进。

利用学习的动态模型和任务回报函数，我们建立了一个基于模型的控制器。在每个时间步长中,agent计划H步长通过随机生成K候选动作序列,使用学到的动态模型来预测这些动作序列的结果,并选择相对应的最高累积回报的序列(图3)。然后我们仅仅执行动作序列的第一个行动,然后重复下一个时间步长的规划过程。这种重新规划使方法在学习动态模型中变得不准确。

图3：利用学习的动态模型模拟多个候选动作序列的过程，预测其结果，并根据回报函数选择最佳的结果

结果
首先，我们在强化学习平台MuJoCo上评估了我们的方法，agent包括游泳运动员、蚂蚁和猎豹。图4显示，使用我们的学习的动态模型和MPC控制器，这些agent能够遵循一组稀疏的路标所定义的路径。此外，我们的方法只用了几分钟的随机数据来训练学习的动态模型，显示了它的样本效率。

注意，使用这种方法，我们只对模型进行了一次训练，但是仅仅通过更改回报函数，我们就可以在运行时应用模型到各种不同的期望轨迹，而不需要单独的特定于任务的训练。

图4:跟随游泳者、蚂蚁和猎豹移动的轨迹。为了执行这些不同的轨迹，每个agent使用的动态模型只训练一次，只使用随机收集的训练数据

我们的方法的哪些方面对实现良好的性能很重要? 首先，我们研究了变化的MPC的规划范围地平线（Horizon）H的影响。图5显示，如果地平线太短，可能是因为无法恢复的贪婪（greedy）行为，表现会受到影响。对于猎豹来说，由于学习的动态模型的不准确，它的表现也会受到影响。图6展示了一个单一的100步长预测的学习的动态模型，显示开环（open-loop）对某些状态要素的预测最终与真实值偏离。因此，一个中期规划的地平线最好是避免贪婪的行为，同时最小化不准确模型的有害影响。

图5:由控制器使用不同的地平线值进行规划的任务性能图。太低的地平线是不好的，太高也不行

图6:动态模型的100步长前向模拟(开环)，表明对某些状态元素的开环预测最终会偏离真实值

我们还改变了用于训练动态模型的初始随机轨迹的数量。图7显示，虽然较高的初始训练数据会导致更高的初始性能，但数据聚合使得即使是低数据初始化实验也能达到较高的最终性能水平。这就突出了强化学习的on-policy数据如何提高样本效率。

图7:使用不同数量的初始随机数据进行训练的动态模型的任务表现图

值得注意的是，基于模型的控制器的最终性能仍然远远低于一个非常优秀的无模型的学习者(当无模型的学习者接受了数千次的训练时)。这种次优性能有时被称为“模型偏差”，在基于模型的强化中是一个已知的问题。为了解决这个问题，我们还提出了一种混合的方法，它结合了基于模型的和无模型的学习，消除了收敛的渐近偏差。这种混合方法，以及额外的分析，都可以在我们的论文中找到。

学习在现实世界中运行

图8:这个机器人长约10厘米，重量约为30克，每秒钟可移动27个身长，并使用两个马达来控制6条腿

由于我们的基于模型的强化学习算法可以使用比无模型的算法更少的经验来学习移动步态，因此可以直接在一个现实世界的机器人平台上进行评估。在其他的工作中，我们研究了这个方法如何完全从现实世界的经验中学习。

对于许多应用来说，Millirobot（图8）是一种很有前途的机器人类型，因为它们的体积小，制造成本低。然而，控制这些Millirobot机器人是很困难的，因为它们动力不足、功率受限制并且体积太小。虽然手动控制的控制器有时可以控制这些Millirobot机器人，但它们通常在动态机动和复杂地形上遇到困难。因此，我们利用上面的基于模型的学习技术，使这种机器人能够实现轨迹跟踪。图9显示，我们的基于模型的控制器在经过了17分钟的随机数据训练后，可以精确地跟踪轨迹。

图9:使用基于模型的学习方法，遵循各种期望轨迹的速度

文章：https://arxiv.org/pdf/1708.02596.pdf
代码：https://github.com/nagaban2/nn_dynamics

本文转自ATYUN人工智能媒体平台，原文链接：伯克利人工智能研究：基于模型的强化学习与神经网络动力学

更多推荐

吴恩达等四位大咖对2019年AI的预测和见解

腾讯云 | 巧用机器学习定位云服务器故障

据传腾讯AI Lab主任张潼已离职，或将重返学术界

阿里达摩院 | 阿里有一群高智商员工全年无休从不领工资

欢迎关注ATYUN官方公众号,商务合作及内容投稿请联系邮箱:[email protected]

cv/dl/cl领域的实验室官网/牛人主页/技术论坛/比赛数据库/好玩的东西武溪嵌人计算机视觉
＃技术论坛１／ｍｉｔ的关于关于机器人的技术ｒｅｖｉｅｗhttps://www.technologyreview.com/c/robotics/２／valse视觉与学习青年学者讨论会http://valser.org/３／人工智能资讯平台／机器人／机器视觉http://www.ailab.cn/robot/Machine_vision/＃比赛１／ｐａｓｃａｌｖｏｃ含各种代码和数据库http://ww
cv/dl/cl领域的实验室官网/牛人主页/技术论坛/比赛数据库/好玩的东西默一鸣 CV ML
一（自己整理的）＃技术论坛１／ｍｉｔ的关于关于机器人的技术ｒｅｖｉｅｗhttps://www.technologyreview.com/c/robotics/２／valse视觉与学习青年学者讨论会http://valser.org/３／人工智能资讯平台／机器人／机器视觉http://www.ailab.cn/robot/Machine_vision/＃比赛１／ｐａｓｃａｌｖｏｃ含各种代码和数据库h
解决人工智能PCA算法输出不稳定的方案湾区人工智能 AI
微信公众号：湾区人工智能作者：Cottbuser会多国语言的海归一线人工智能工程师独立兼职运营关注可了解更多人工智能资讯。问题或建议，请公众号留言如果你觉得本文对你有帮助，欢迎点赞，转发，赞赏内容目录PCA算法不稳定的原因代码举例分析：解决方案：PCA算法不稳定的原因神经网络算法利用了随机性，比如初始化随机权重，因此用同样的数据训练同一个网络会得到不同的结果。神经网络特意用随机性来保证，能通过有效
人工智能会伤害人类吗？怎样控制他们？ weixin_34387468
欢迎大家前往腾讯云+社区，获取更多腾讯海量技术实践干货哦~本文由人工智能资讯小编发表于云+社区专栏长文预警：在本文中，我们将训练一个在训练期间完全加密的神经网络（在未加密的数据上进行训练）。这将为神经网络带来两个有益的特性：首先，神经网络的智能可以受到更好的保护以免被他人盗取，消除了在不安全环境下训练的有价值的AI被其他智能盗取的风险；其次，网络可以只作加密的预测（这意味着在没有密钥的情况下，外界
【深度学习】亚马逊机器学习总监Alex Smola：深度学习触手可及，架构Gluon高中生就能用产业智能官
中国人工智能资讯智库社交主平台新智元主办的AIWORLD2017世界人工智能大会11月8日在北京国家会议中心举行，大会以“AI新万象，中国智能+”为主题，上百位AI领袖作了覆盖技术、学术和产业最前沿的报告和讨论，2000多名业内人士参会。新智元创始人兼CEO杨静在会上发布全球首个AI专家互动资讯平台“新智元V享圈”。全程回顾新智元AIWorld2017世界人工智能大会盛况：新华网图文回顾：http
【独家】智能产业学会携手天使实战学院举办“AI+医疗”产业私董会智能产业学会
图1：智能产业学会“AI+医疗”产业私董会现场2017年11月26日下午，智能产业学会携手天使实战学院、青年创造家社群、京北金融、三和系资本联合举办“AI+医疗产业私董会暨天使母基金座谈会”。步长制药董事长赵涛先生、人工智能资讯社交平台新智元创始人杨静女士、酷我音乐创始人雷鸣先生、英诺天使基金创始合伙人李竹先生、大三生创始人徐远重先生、智能产业学会执行总裁吴昊先生、京北投资合伙人桂曙光先生、副总裁
【一点想法】人工智能，是帮手还是魔鬼？花里胡哨的CC
昨晚参加樊登读书会线下聚会，我们看的是樊登老师和李开复博士一起聊李博士的新书《AI·未来》。听完之后，我们几个开始聊起了人工智能，有些朋友觉得人工智能是人类帮手，有些朋友，比如说我就陷入了对被AI支配、替代的恐慌当中。我本人坚信，人工智能在未来将会占据越来越重要的地位，因此最近几年我一直在尝试进入这个领域。在此撰文讲讲我了解的一些人工智能资讯，希望对大家有帮助。一、人工智能=人工智障？那些担心人类
人工智能会伤害人类吗？怎样控制他们？腾讯云加社区云计算加密机器学习深度学习人工智能
欢迎大家前往腾讯云+社区，获取更多腾讯海量技术实践干货哦~本文由人工智能资讯小编发表于云+社区专栏长文预警：在本文中，我们将训练一个在训练期间完全加密的神经网络（在未加密的数据上进行训练）。这将为神经网络带来两个有益的特性：首先，神经网络的智能可以受到更好的保护以免被他人盗取，消除了在不安全环境下训练的有价值的AI被其他智能盗取的风险；其次，网络可以只作加密的预测（这意味着在没有密钥的情况下，外界
人工智能会伤害人类吗？怎样控制他们？ qcloudcommunity 腾讯云机器学习深度学习云计算安全神经网络
欢迎大家前往腾讯云+社区，获取更多腾讯海量技术实践干货哦~本文由人工智能资讯小编发表于云+社区专栏长文预警：在本文中，我们将训练一个在训练期间完全加密的神经网络（在未加密的数据上进行训练）。这将为神经网络带来两个有益的特性：首先，神经网络的智能可以受到更好的保护以免被他人盗取，消除了在不安全环境下训练的有价值的AI被其他智能盗取的风险；其次，网络可以只作加密的预测（这意味着在没有密钥的情况下，外界
cv/dl/cl领域的实验室官网/牛人主页/技术论坛/比赛数据库/好玩的东西 yimingsilence
一（自己整理的）＃技术论坛１／ｍｉｔ的关于关于机器人的技术ｒｅｖｉｅｗhttps://www.technologyreview.com/c/robotics/２／valse视觉与学习青年学者讨论会http://valser.org/３／人工智能资讯平台／机器人／机器视觉http://www.ailab.cn/robot/Machine_vision/＃比赛１／ｐａｓｃａｌｖｏｃ含各种代码和数据库h
ASM系列六利用TreeApi 添加和移除类成员 lijingyao8206 jvm 动态代理 ASM 字节码技术 TreeAPI
同生成的做法一样，添加和移除类成员只要去修改fields和methods中的元素即可。这里我们拿一个简单的类做例子，下面这个Task类，我们来移除isNeedRemove方法，并且添加一个int 类型的addedField属性。 package asm.core; /** * Created by yunshen.ljy on 2015/6/
Springmvc-权限设计 bee1314 spring Web jsp
万丈高楼平地起。权限管理对于管理系统而言已经是标配中的标配了吧，对于我等俗人更是不能免俗。同时就目前的项目状况而言，我们还不需要那么高大上的开源的解决方案，如Spring Security，Shiro。小伙伴一致决定我们还是从基本的功能迭代起来吧。目标： 1.实现权限的管理（CRUD） 2.实现部门管理（CRUD) 3.实现人员的管理（CRUD） 4.实现部门和权限
算法竞赛入门经典（第二版）第2章习题 CrazyMizzz c 算法
2.4.1 输出技巧 #include <stdio.h> int main() { int i, n; scanf("%d", &n); for (i = 1; i <= n; i++) printf("%d\n", i); return 0; } 习题2-2 水仙花数(daffodil
struts2中jsp自动跳转到Action 麦田的设计者 jsp webxml struts2 自动跳转
1、在struts2的开发中，经常需要用户点击网页后就直接跳转到一个Action，执行Action里面的方法，利用mvc分层思想执行相应操作在界面上得到动态数据。毕竟用户不可能在地址栏里输入一个Action（不是专业人士） 2、＜jsp:forward page="xxx.action" /＞，这个标签可以实现跳转，page的路径是相对地址,不同与jsp和j
php 操作webservice实例 IT独行者 PHP webservice
首先大家要简单了解了何谓webservice，接下来就做两个非常简单的例子，webservice还是逃不开server端与client端。我测试的环境为：apache2.2.11 php5.2.10做这个测试之前，要确认你的php配置文件中已经将soap扩展打开，即extension=php_soap.dll; OK 现在我们来体验webservice //server端 serve
Windows下使用Vagrant安装linux系统 _wy_ windows vagrant
准备工作：下载安装 VirtualBox ：https://www.virtualbox.org/ 下载安装 Vagrant ：http://www.vagrantup.com/ 下载需要使用的 box ：官方提供的范例：http://files.vagrantup.com/precise32.box 还可以在 http://www.vagrantbox.es/
更改linux的文件拥有者及用户组(chown和chgrp) 无量 c linux chgrp chown
本文（转） http://blog.163.com/yanenshun@126/blog/static/128388169201203011157308/ http://ydlmlh.iteye.com/blog/1435157 一、基本使用：使用chown命令可以修改文件或目录所属的用户：命令
linux下抓包工具矮蛋蛋 linux
原文地址： http://blog.chinaunix.net/uid-23670869-id-2610683.html tcpdump -nn -vv -X udp port 8888 上面命令是抓取udp包、端口为8888 netstat -tln 命令是用来查看linux的端口使用情况 13 . 列出所有的网络连接 lsof -i 14. 列出所有tcp 网络连接信息 l
我觉得mybatis是垃圾！：“每一个用mybatis的男纸，你伤不起” alafqq mybatis
最近看了每一个用mybatis的男纸，你伤不起原文地址：http://www.iteye.com/topic/1073938 发表一下个人看法。欢迎大神拍砖；个人一直使用的是Ibatis框架，公司对其进行过小小的改良；最近换了公司，要使用新的框架。听说mybatis不错；就对其进行了部分的研究；发现多了一个mapper层；个人感觉就是个dao；
解决java数据交换之谜百合不是茶数据交换
交换两个数字的方法有以下三种，其中第一种最常用 /* 输出最小的一个数 */ public class jiaohuan1 { public static void main(String[] args) { int a =4; int b = 3; if(a<b){ // 第一种交换方式 int tmep =
渐变显示 bijian1013 JavaScript
<style type="text/css"> #wxf { FILTER: progid:DXImageTransform.Microsoft.Gradient(GradientType=0, StartColorStr=#ffffff, EndColorStr=#97FF98); height: 25px; } </style>
探索JUnit4扩展：断言语法assertThat bijian1013 java 单元测试 assertThat
一.概述 JUnit 设计的目的就是有效地抓住编程人员写代码的意图，然后快速检查他们的代码是否与他们的意图相匹配。 JUnit 发展至今，版本不停的翻新，但是所有版本都一致致力于解决一个问题，那就是如何发现编程人员的代码意图，并且如何使得编程人员更加容易地表达他们的代码意图。JUnit 4.4 也是为了如何能够
【Gson三】Gson解析{"data":{"IM":["MSN","QQ","Gtalk"]}} bit1129 gson
如何把如下简单的JSON字符串反序列化为Java的POJO对象? {"data":{"IM":["MSN","QQ","Gtalk"]}} 下面的POJO类Model无法完成正确的解析： import com.google.gson.Gson;
【Kafka九】Kafka High Level API vs. Low Level API bit1129 kafka
1. Kafka提供了两种Consumer API High Level Consumer API Low Level Consumer API(Kafka诡异的称之为Simple Consumer API，实际上非常复杂) 在选用哪种Consumer API时，首先要弄清楚这两种API的工作原理，能做什么不能做什么，能做的话怎么做的以及用的时候，有哪些可能的问题
在nginx中集成lua脚本：添加自定义Http头，封IP等 ronin47 nginx lua
Lua是一个可以嵌入到Nginx配置文件中的动态脚本语言，从而可以在Nginx请求处理的任何阶段执行各种Lua代码。刚开始我们只是用Lua 把请求路由到后端服务器，但是它对我们架构的作用超出了我们的预期。下面就讲讲我们所做的工作。强制搜索引擎只索引mixlr.com Google把子域名当作完全独立的网站，我们不希望爬虫抓取子域名的页面，降低我们的Page rank。 location /{
java-归并排序 bylijinnan java
import java.util.Arrays; public class MergeSort { public static void main(String[] args) { int[] a={20,1,3,8,5,9,4,25}; mergeSort(a,0,a.length-1); System.out.println(Arrays.to
Netty源码学习-CompositeChannelBuffer bylijinnan java netty
CompositeChannelBuffer体现了Netty的“Transparent Zero Copy” 查看API（ http://docs.jboss.org/netty/3.2/api/org/jboss/netty/buffer/package-summary.html#package_description）可以看到，所谓“Transparent Zero Copy”是通
Android中给Activity添加返回键 hotsunshine Activity
// this need android:minSdkVersion="11" getActionBar().setDisplayHomeAsUpEnabled(true); @Override public boolean onOptionsItemSelected(MenuItem item) {
静态页面传参 ctrain 静态
$(document).ready(function () { var request = { QueryString : function (val) { var uri = window.location.search; var re = new RegExp("" + val + "=([^&?]*)", &
Windows中查找某个目录下的所有文件中包含某个字符串的命令 daizj windows 查找某个目录下的所有文件包含某个字符串
findstr可以完成这个工作。 [html] view plain copy >findstr /s /i "string" *.* 上面的命令表示，当前目录以及当前目录的所有子目录下的所有文件中查找"string&qu
改善程序代码质量的一些技巧 dcj3sjt126com 编程 PHP 重构
有很多理由都能说明为什么我们应该写出清晰、可读性好的程序。最重要的一点，程序你只写一次，但以后会无数次的阅读。当你第二天回头来看你的代码时，你就要开始阅读它了。当你把代码拿给其他人看时，他必须阅读你的代码。因此，在编写时多花一点时间，你会在阅读它时节省大量的时间。让我们看一些基本的编程技巧：尽量保持方法简短尽管很多人都遵
SharedPreferences对数据的存储 dcj3sjt126com
SharedPreferences简介： &nbs
linux复习笔记之bash shell (2) bash基础 eksliang bash bash shell
转载请出自出处： http://eksliang.iteye.com/blog/2104329 1.影响显示结果的语系变量（locale） 1.1locale这个命令就是查看当前系统支持多少种语系，命令使用如下： [root@localhost shell]# locale LANG=en_US.UTF-8 LC_CTYPE="en_US.UTF-8"
Android零碎知识总结 gqdy365 android
1、CopyOnWriteArrayList add(E) 和remove(int index)都是对新的数组进行修改和新增。所以在多线程操作时不会出现java.util.ConcurrentModificationException错误。所以最后得出结论：CopyOnWriteArrayList适合使用在读操作远远大于写操作的场景里，比如缓存。发生修改时候做copy，新老版本分离，保证读的高
HoverTree.Model.ArticleSelect类的作用 hvt Web .net C#hovertree asp.net
ArticleSelect类在命名空间HoverTree.Model中可以认为是文章查询条件类，用于存放查询文章时的条件，例如HvtId就是文章的id。HvtIsShow就是文章的显示属性，当为-1是，该条件不产生作用，当为0时，查询不公开显示的文章，当为1时查询公开显示的文章。HvtIsHome则为是否在首页显示。HoverTree系统源码完全开放，开发环境为Visual Studio 2013
PHP 判断是否使用代理 PHP Proxy Detector 天梯梦 proxy
1. php 类 I found this class looking for something else actually but I remembered I needed some while ago something similar and I never found one. I'm sure it will help a lot of developers who try to
apache的math库中的回归——regression（翻译） lvdccyb Math apache
这个Math库，虽然不向weka那样专业的ML库，但是用户友好，易用。多元线性回归，协方差和相关性（皮尔逊和斯皮尔曼），分布测试（假设检验，t，卡方，G），统计。数学库中还包含，Cholesky，LU，SVD，QR，特征根分解，真不错。基本覆盖了：线代，统计，矩阵，最优化理论曲线拟合常微分方程遗传算法（GA），还有3维的运算。。。
基础数据结构和算法十三：Undirected Graphs (2) sunwinner Algorithm
Design pattern for graph processing. Since we consider a large number of graph-processing algorithms, our initial design goal is to decouple our implementations from the graph representation
云计算平台最重要的五项技术 sumapp 云计算云平台智城云
云计算平台最重要的五项技术 1、云服务器云服务器提供简单高效，处理能力可弹性伸缩的计算服务，支持国内领先的云计算技术和大规模分布存储技术，使您的系统更稳定、数据更安全、传输更快速、部署更灵活。特性机型丰富通过高性能服务器虚拟化为云服务器，提供丰富配置类型虚拟机，极大简化数据存储、数据库搭建、web服务器搭建等工作；仅需要几分钟，根据CP
《京东技术解密》有奖试读获奖名单公布 ITeye管理员活动
ITeye携手博文视点举办的12月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 12月试读活动回顾： http://webmaster.iteye.com/blog/2164754 本次技术图书试读活动获奖名单及相应作品如下：一等奖（两名） Microhardest：http://microhardest.ite

伯克利人工智能研究：基于模型的强化学习与神经网络动力学

更多推荐

你可能感兴趣的:(人工智能资讯)