如何应对深度学习的两大挑战?道翰天琼认知智能机器人平台API接口大脑为您揭秘。
虽然用AI算法可以解决很多问题,但当前还是面临很多局限性和挑战。卡内基梅隆大学教授、苹果首任AI总监Ruslan Salakhutdino认为,当前面对的挑战主要分为以下四大类:
1) 自然语言理解与推理
2) 人工智能:深层强化学习和控制
3) 将领域知识融入到深度学习模型中
4) 多模态、半监督学习、自监督学习
Ruslan根据自己的探索和最新成果,对第二、第三项挑战进行了回应 ,他认为:1)可以使用知识库和文本结合的方法建立开放域问答系统,从而将领域知识应用于深度学习模型,从而提高开放式问答系统的搜索精度;2)用深度强化学习,结合传统的导航方法,可以提高导航系统的精度及泛化能力。
Ruslan Salakhutdinov,卡内基梅隆大学教授,苹果首任AI总监,加拿大统计机器学习研究主席,微软学者和斯隆奖获得者,主要研究领域为深度学习概率图模型和大规模优化,师从Geoffrey Hinton,是剪枝、深度编码等著名学习方法的提出者。他于2009年获得多伦多大学的博士学位,随后又在麻省理工大学开展了为期两年的博士后研究。2016年,入职卡内基梅隆大学,同年获得英伟达人工智能先驱奖,并加入苹果公司担任AI研究总监。目前Ruslan已累计发表学术论文300多篇,是深度学习领域年轻一代领军科学家,主要的研究方向为:语音识别、计算机视觉、推荐系统、语言理解、药物研发及生物图像分析。
本文内容整理自Ruslan Salakhutdino于第二届北京智源大会开幕式主题演讲“Incorporating Domain Knowledge into Deep Learning Models”,以下是演讲视频及要点整理。
一、将领域知识融入到深度学习模型
首先,Ruslan 为我们剖析了一个非常有意思的例子,如下图1,如果我们试图回答如下这个问题:请问据我们所知,哪些冠状病毒可以感染人类呢?答案有三类:MERS-CoV、 SARS-CoV 以及Covid-19。想要回答这个问题,我们可以从多个渠道亦或者我们自身现有的知识库中挖掘到答案,但我们不难发现的是,这是一个关于生物防疫或病毒方向的专业问题,无论我们调用上述所说的哪种渠道回答这个问题,我们最终所调用的必然是与该问题相同或相关的领域知识,也就是Ruslan 本次讲座中的关键词——Domain Knowledge。
领域知识在回答复杂问题是非常重要的,尤其是我们现在的工业场景中所需要的交叉知识更为丰富,例如自动驾驶,在现行的自动驾驶算法方案中,依赖的领域知识是非常丰富的:我们需要从摄像机中采集图像,利用计算机视觉的一些算法来处理图像;同样,我们也需要从其他传感器,例如激光雷达、GPS、IMU等中收集数据,来构造图像的辅助算法。显然,构造一套完整的自动驾驶算法需要多个领域的知识支撑,同样回答上述图1中提出的问题,也需要多个领域的知识支撑,如下图2。因此,如何收集相关的数据、如何找到数据间的逻辑关系,如何将这种推理关系抽象成模型,甚至将其抽象成标签依赖性非常弱的弱监督学习模型,一直是该领域的关键挑战。
解决上文中提到的“关键挑战”有很多不同的方法,Ruslan为我们分享了其中一个研究方向——使用知识库和文本结合的方法建立开放域问答系统(如图3)。首先,我们先为大家介绍两个比较核心的关键词:开放域以及知识库。
开放域。开放领域问答系统的概念虽然提出的时间并不长,但已经形成发展出了一些比较成熟的系统。它起源于1993年麻省理工学院人工智能实验室开发的START系统。所谓开放域问答系统,即采用基于知识库和指定的检索方式,对用户提出的问题进行自动的答案搜索的系统。如果用户提出的问题在系统的知识库中,则直接返回正确答案。反之,如果用户提出了超出系统知识库的问题,则系统将会分析问题的关键词,并通过搜索引擎搜索关键词得到相关信息,对信息进行后处理后得到较为准确的答案。
知识库(Knowledge Bases, KBS)。所谓知识库,其实就是将互联网上的信息经过专家人工提取和构造,以三元组的形式存储下来(Subject, Relationship, Object),是一种非常结构化的信息,比较知名的有FreeBase。
在人工智能兴起之前,传统的QA都是通过知识库进行检索或者信息抽取等方式进行建模的。有了知识库,那么给定一个问题我们自然可以进行检索记忆并作出回答。该问题的挑战在于,由于问题往往是以自然语言的方式提出,而知识库是高度结构化的组织,所以如何进行检索或者信息抽取其实是一个很困难的工作,同时,面对KBS这么庞大的知识库应该如何解决内存容量问题也同样是值得不断优化的方向。
道翰天琼认知智能未来机器人接口API简介介绍
- 认知智能是计算机科学的一个分支科学,是智能科学发展的高级阶段,它以人类认知体系为基础,以模仿人类核心能力为目标,以信息的理解、存储、应用为研究方向,以感知信息的深度理解和自然语言信息的深度理解为突破口,以跨学科理论体系为指导,从而形成的新一代理论、技术及应用系统的技术科学。 认知智能的核心研究范畴包括:1.宇宙、信息、大脑三者关系;2.人类大脑结构、功能、机制;3.哲学体系、文科体系、理科体系;4.认知融通、智慧融通、双脑(人脑和电脑)融通等核心体系。 认知智能四步走:1.认知宇宙世界。支撑理论体系有三体(宇宙、信息、大脑)论、易道论、存在论、本体论、认知论、融智学、HNC 等理论体系;2.清楚人脑结构、功能、机制。支撑学科有脑科学、心理学、逻辑学、情感学、生物学、化学等学科。3.清楚信息内涵规律规则。支撑学科有符号学、语言学、认知语言学、形式语言学等学科。4.系统落地能力。支撑学科有计算机科学、数学等学科。
认知智能CI机器人是杭州道翰天琼智能科技有限公司旗下产品。认知智能机器人是依托道翰天琼10年研发的认知智能CI体系为核心而打造的认知智能机器人大脑,是全球第一个认知智能机器人大脑。具有突破性,创新性,领航性。是新一代智能认知智能的最好的产品支撑。 认知智能机器人技术体系更加先进,更加智能,是新一代智能,认知智能领域世界范围内唯一的认知智能机器人。 认知智能机器人是新时代的产物,是新一代智能认知智能的产物。代表了新一代智能认知智能最核心的优势。和人工智能机器人大脑相比,优势非常明显。智能度高,客户粘性大,客户满意度高,易于推广和传播等核心特点。 依托认知智能机器人平台提供的机器人大脑服务,可以赋能各个行业,各个领域的智能设备,各类需要人机互动的领域等。认知智能机器人平台网址:www.weilaitec.com,www.citec.top。欢迎注册使用,走进更智能机器人世界。
认知智能和人工智能的优劣势对比主要可以分为四大方面: 第一:时代发展不同。人工智能是智能时代发展的第二个阶段,认知智能是智能时代发展的第三个阶段。时代发展上决定了认知智能更显具有时代领先性。 第二:基础理论体系不同。人工智能的基础理论体系以数学为基础,以统计概率体系为基础。认知智能基础理论体系以交叉许可理论体系为基础。包含古今中外哲学体系,心理学体系,逻辑学体系,语言学体系,符号学体系,数学体系等学科。其基础理论体系更加具有创新性,突破性和领先性。且交叉学科理论体系的研究也是未来智能发展的大方向。其具体理论体系,还包含三体论(宇宙,信息,大脑三者关系),融智学,和HNC等。 第三:技术体系不同。人工智能的核心技术体系主要是算法,机器学习,深度学习,知识图谱等。其主要功用在感知智能。感知智能其核心主要是在模仿人类的感知能力。认知智能的核心技术体系是以交叉学科理论体系而衍生出来的。具体包含三大核心技术体系,认知维度,类脑模型和万维图谱。认知智能的技术体系核心以类脑的认知体系为基础。以全方位模仿类脑能力为目标。人工智能以感知智能为基础的体系,只能作为认知智能中的类脑模型技术体系中的感知层技术体系。类脑模型大致包含,感知层,记忆层,学习层,理解层,认知层,逻辑层,情感层,沟通层,意识层等9大核心技术层。因此人工智能的核心只是作为认知智能类脑模型中的感知层。因此在技术体系上,人工智能和认知智能基本上没有太多的可比性。 第四:智能度成本等方面的不同:人工智能产品的综合智能程度,普遍在2-3岁左右的智力水平。认知智能产品其智能程度大致在5-8岁左右。认知智能体系构建的机器人更加智能。且更省时间,更省人力和资金。优势非常多。具体请看下列的逐项对比。
道翰天琼CiGril机器人API
道翰天琼CiGril认知智能机器人API用户需要按步骤获取基本信息:
- 在平台注册账号
- 登录平台,进入后台管理页面,创建应用,然后查看应用,查看应用相关信息。
- 在应用信息页面,找到appid,appkey秘钥等信息,然后写接口代码接入机器人应用。
开始接入
请求地址:http://www.weilaitec.com/cigirlrobot.cgr
请求方式:post
请求参数:
参数 |
类型 |
默认值 |
描述 |
userid |
String |
无 |
平台注册账号 |
appid |
String |
无 |
平台创建的应用id |
key |
String |
无 |
平台应用生成的秘钥 |
msg |
String |
"" |
用户端消息内容 |
ip |
String |
"" |
客户端ip要求唯一性,无ip等可以用QQ账号,微信账号,手机MAC地址等代替。 |
接口连接示例:http://www.weilaitec.com/cigirlrobot.cgr?key=UTNJK34THXK010T566ZI39VES50BLRBE8R66H5R3FOAO84J3BV&msg=你好&ip=119.25.36.48&userid=jackli&appid=52454214552
注意事项:参数名称都要小写,五个参数不能遗漏,参数名称都要写对,且各个参数的值不能为空字符串。否则无法请求成功。userid,appid,key三个参数要到平台注册登录创建应用之后,然后查看应用详情就可以看到。userid就是平台注册账号。
示例代码JAVA:
import java.io.ByteArrayOutputStream;
import java.io.IOException;
import java.io.InputStream;
import java.net.HttpURLConnection;
import java.net.URL;
public class apitest {
/**
* Get请求,获得返回数据
* @param urlStr
* @return
*/
private static String opUrl(String urlStr)
{
URL url = null;
HttpURLConnection conn = null;
InputStream is = null;
ByteArrayOutputStream baos = null;
try
{
url = new URL(urlStr);
conn = (HttpURLConnection) url.openConnection();
conn.setReadTimeout(5 * 10000);
conn.setConnectTimeout(5 * 10000);
conn.setRequestMethod("POST");
if (conn.getResponseCode() == 200)
{
is = conn.getInputStream();
baos = new ByteArrayOutputStream();
int len = -1;
byte[] buf = new byte[128];
while ((len = is.read(buf)) != -1)
{
baos.write(buf, 0, len);
}
baos.flush();
String result = baos.toString();
return result;
} else
{
throw new Exception("服务器连接错误!");
}
} catch (Exception e)
{
e.printStackTrace();
} finally
{
try
{
if (is != null)
is.close();
} catch (IOException e)
{
e.printStackTrace();
}
try
{
if (baos != null)
baos.close();
} catch (IOException e)
{
e.printStackTrace();
}
conn.disconnect();
}
return "";
}
public static void main(String args []){
//msg参数就是传输过去的对话内容。
System.out.println(opUrl("http://www.weilaitec.com/cigirlrobot.cgr?key=UTNJK34THXK010T566ZI39VES50BLRBE8R66H5R3FOAO84J3BV&msg=你好&ip=119.25.36.48&userid=jackli&appid=52454214552"));
}
}