传送门
概念
研究内容
技术方法和研究现状
1)检索式问答;
这类方法是以检索和答案抽取为基本过程的问答系统,具体过程包括问题分析、篇章检索和答案抽取。
抽取方法分为基于模式匹配的问答方法和基于统计文本信息抽取的问答方法。
在运行阶段,系统首先判断当前提问属于哪一类,然后使用这类提问的模式来对抽取的候选答案进行验证。同时为了提高问答系统的性能,人们也引入自然语言处理技术。由于自然语言处理的技术还未成熟,现有大多数系统都基于浅层句子分析。
在一个限定问题类型、限定答案类型的知识比赛表现还行,面对开放式的场景和环境,已有检索式问答系统还有很长的路要走。
2)社区问答
社区问答系统应运而生,例如 知乎、百度知道等
社区问答系统有大量的用户参与,存在丰富的用户行为信息,例如用户投票信息、用户评价信息、回答者的问题采纳率、用户推荐次数、页面点击次数以及用户、问题、答案之间的相互关联信息等等,这些用户行为信息对于社区中问题和答案的文本内容分析具有重要的价值。
最好的检索系统在 Top 10 的准确率可以达到 40%。尽管社区问答系统相对于检索式问答和知识库问答技术简单,但是目前已经商业化
3)知识库问答。
检索式问答和社区问答尽管在某些特定领域或者商业领域有所应用,但是其核心还是关键词匹配和浅层语义分析技术,难以实现知识的深层逻辑推理,无法达到人工智能的高级目标。
其目标是把互联网文本内容组织成为以实体为基本语义单元(节点)的图结构,其中图上的边表示实体之间语义关系基于这样的结构化知识,问答系统的任务就是要根据用户问题的语义直接在知识库上查找、推理出相匹配的答案,这一任务称为面向知识库的问答系统或知识库问答。
评测主要针对于一些限定领域的知识库进行问答。已有方法也取得了不错的结果
未来方向
自动问答技术的效果怎么样?以后会用到什么算法:
概念:
原理
图像识别技术的过程分以下几步:
模式识别是
图像识别在哪些方面的应用
图像识别技术可能是以图像的主要特征为基础的,每个图像都有它的特征。在人类图像识别系统中,对复杂图像的识别往往要通过不同层次的信息加工才能实现。图像识别技术是立体视觉、运动分析、数据融合等实用技术的基础,在导航、地图与地形配准、自然资源分析、天气预报、环境监测、生理病变研究等许多领域可广泛应用。
遥感图像识别
航空遥感和卫星遥感图像通常用图像识别技术进行加工以便提取有用的信息。该技术目前主要用于地形地质探查,森林、水利、海洋、农业等资源调查,灾害预测,环境污染监测,气象卫星云图处理以及地面军事目标识别等。
军事刑侦
图像识别技术在军事、公安刑侦方面的应用很广泛,例如军事目标的侦察、制导和警戒系统;自动灭火器的控制及反伪装;公安部门的现场照片、指纹、手迹、印章、人像等的处理和辨识;历史文字和图片档案的修复和管理等等。
生物医学
图像识别在现代医学中的应用非常广泛,它具有直观、无创伤、安全方便等特点。在临床诊断和病理研究中广泛借助图像识别技术,例如CT(ComputedTomography)技术等。
机器视觉
作为智能机器人的重要感觉器官,机器视觉主要进行3D图像的理解和识别,该技术也是目前研究的热门课题之一。
机器视觉的应用领域也十分广泛,例如用于军事侦察、危险环境的自主机器人,邮政、医院和家庭服务的智能机器人。此外机器视觉还可用于工业生产中的工件识别和定位,太空机器人的自动操作等。
数字图像处理:
传送门
无人驾驶使用的技术有哪些
通俗理解
概念
举例:挑橘子
传送门
机器学习一般分为:监督学习、非监督学习、半监督学习、增强学习。监督学习,就是人们常说的分类,通过已有的训练样本去训练得到一个最优模型,再利用这个模型将所有的输入映射为相应的输出,对输出进行简单的判断从而实现分类的目的,也就具有了对未知数据进行分类的能力,监督学习里典型的例子就是KNN、SVM(拉普拉斯核,sigmoid核)。无监督学习:机器自己学习(聚类算法是无监督学习的一种),事先没有任何训练样本,而需要直接对数据进行建模。增强学习:特征就是从现有的状态出发,不断的优化自己的策略。
机器学习算法中的过拟合(使用正则化可以减小过拟合的程度)、欠拟合:过拟合指的是模型对于训练数据拟合程度过当的情况。当某个模型过度的学习训练数据中的细节和噪音,以至于模型在新的数据上表现很差,我们称过拟合发生了。这意味着训练数据中的噪音或者随机波动也被当做概念被模型学习了。而问题就在于这些概念不适用于新的数据,从而导致模型泛化性能的变差。过拟合更可能在无参数非线性模型中发生,因为学习目标函数的过程是易变的具有弹性的。决策树(属于监督学习)就是一种无参数机器学习算法。过拟合:在训练数据上表现良好,在未知数据上表现差。欠拟合:在训练数据和未知数据上表现都很差。
迁移学习:通俗来讲,就是运用已有的知识来学习新的知识,核心是找到已有知识和新知识之间的相似性,用成语来说就是举一反三。由于直接对目标域从头开始学习成本太高,我们故而转向运用已有的相关知识来辅助尽快地学习新知识。迁移学习就是在一个数据集上训练卷积神经网络时,去掉最后一层,在不同的数据集上重新训练模型的最后一层。直观来讲,就是重新训练模型以识别不同的高级特征。因此,训练时间会减少很多,所以在没有足够的数据或者需要太多的资源时,迁移学习是一个很有用的工具。
广义来说,有三种机器学习算法
监督式学习
非监督式学习
强化学习
**数据挖掘:**数据挖掘是从大量的数据中通过算法搜索得到其中信息的过程,侧重数据的清洗和梳理。说白了,数据挖掘就是一种利用大数据进行分析问题的手段,问题一直会有,解决问题的手段也就一直有存在的必要。数据挖掘的任何一个研究点都可能会遇到“大数据”问题
数据挖掘应用
数据挖掘的一般过程包括以下这几个方面:
1、 数据预处理
2、 数据挖掘
3、 后处理
模式
聚类分析
数据挖掘应用:
大数据的应用:医疗领域:
大数据应用:疫情预测、疫情路径追踪、物资分配
在这次疫情中,大数据可对新冠肺炎追踪传播路径,专家利用大数据技术梳理感染者的生活轨迹,追踪人群接触史,成功锁定感染源及密切接触人群,为疫情防控提供宝贵信息。例如某位患者曾表示自己并无重点疫区接触史,但经过大数据排查,发现其曾经至少接触过三位来自重点疫区的潜在患病人士。可见大数据技术通过追踪移动轨迹、建立个体关系图谱等,在精准定位疫情传播路径,防控疫情扩散方面的重要作用。
人工智能其实很早就有了,神经网络从人脑的原理得到了一些启发,但其原理还是有本质不同的。这些神经网络呢也引起了一阵轰动,但由于当时缺乏大量的标注数据以及足够的计算资源,很难进行深层次的神经网络的训练,大部分网络离解决具体的实际问题十分遥远
人工智能分化出的主要学科
人工智能是计算机科学的重要分支之一。它企图了解智能实质, 并生产出一种新的能以人类智能相似的方式做出反应的智能机器, 机器人、自然语言识别处理、专家系统、图像识别等技术均属于人工智能范畴。
人工智能的能力阶段
现代人工智能的研究方法
应用领域
传送门
这篇文章讲得太好了,生动易懂
深度学习首先是一种机器学习。深度学习的基础,叫做神经网络,这本身就是一种机器学习算法。近年来,随着深度学习的火热和深入人心,人们渐渐将这一概念独立出来,由此有了深度学习和传统机器学习的区分。其实,都只是算法,一种解决问题的办法,而已
用专业的术语来说,计算机用来学习的、反复看的图片叫“训练数据集”;“训练数据集”中,一类数据区别于另一类数据的不同方面的属性或特质,叫做“特征”;计算机在“大脑”中总结规律的过程,叫“建模”;计算机在“大脑”中总结出的规律,就是我们常说的“模型”;而计算机通过反复看图,总结出规律,然后学会认字的过程,就叫“机器学习”。
如何让计算机识字
决策树的机器学习方法,大概就是if else类型,但是这种算法太简单,很难适应现实世界的不同情况
进阶,人们想出字其实就是空间中的一大堆点。只要我们对每个字的特征提取得足够好,空间中的一大堆点就会大致分布在三个不同的范围里。这时,让计算机观察这些点的规律,看能不能用一种简明的分割方法(比如在空间中画直线),把空间分割成几个相互独立的区域,尽量使得训练数据集中每个字对应的点都位于同一个区域内。如果这种分割是可行的,就说明计算机“学”到了这些字在空间中的分布规律,为这些字建立了模型
但是这种方法很难适应各种问题,后面很多年里,数学家和计算机科学家就是被类似的问题所困扰。但这个世界实在是复杂多样、变化万千,无论人们为计算机选择了多么优雅的建模方法,都很难真正模拟世界万物的特征规律。
由此引出深度学习
深度学习
深度学习就是把计算机要学习的东西看成一大堆数据,把这些数据丢进一个复杂的、包含多个层级的数据处理网络(深度神经网络),然后检查经过这个网络处理得到的结果数据是不是符合要求——如果符合,就保留这个网络作为目标模型,如果不符合,就一次次地、锲而不舍地调整网络的参数设置,直到输出满足要求为止。
通俗讲:计算机就是不断调节 闸门 使得输出结果符合要求,至于水管网络内部,每个阀门为什么要如此调节,为什么要调节到如此程度,人们并不知道。相当于黑箱子,人们通常只知道深度学习模型是否工作,却很难说出,模型中某个参数的取值与最终模型的感知能力之间,到底有怎样的因果关系。
深度学习大致就是这么一个用人类的数学知识与计算机算法构建起整体架构,再结合尽可能多的训练数据,以及计算机的大规模运算能力去调节内部参数,尽可能逼近问题目标的半理论、半经验的建模方式。
原理
其实每一种算法,究其根本,都是一种数学表达。无论是机器学习,还是深度学习,都是试图找到一个函数,这个函数可以简单,可以复杂,函数的表达并不重要,只是一个工具,重要的是这个函数能够尽可能准确的拟合出输入数据和输出结果间的关系。
深度学习的强大是有数学原理支撑的,这个原理叫做“万能近似定理”(Universal approximation theorem)。这个定理的道理很简单 —— 神经网络可以拟合任何函数,不管这个函数的表达是多么的复杂。
这样一种“万能近似”,很多时候是输入和输出在数值上的一种耦合,而不是真的找到了一种代数上的表达式。
一些问题:
深度学习是什么:
深度学习的深度是什么:
深度学习是不是越深越好:
理论上来说网络越深表达能力越强,能处理的训练数据也更多,但是训练算法未必支持。
深度学习算法?架构?著名期刊? 算法:yolo v3、bp、knn 架构:卷积神经网络(CNN),长短期记忆网络(LSTM)。
期刊:IJCV(国际计算机视觉期刊)、PR(模式识别)。
什么是CNN(卷积神经网络),它与传统感知机的区别?
卷积神经网络中感受野:卷积神经网络每一层输出的特征图上的像素点在原始图像上映射的区域大小。神经网络参数共享:用一个卷积核去卷积一张图,这张图每个位置是被同样数值的卷积核操作的,权重是一样的,也就是参数共享。神经网络中使用的损失函数:L1(L1正则化是指权值向量中各个元素的绝对值之和)
L2(L2正则化是指权值向量中各个元素的平方和然后再求平方根) cross entropy softmax loss
focal loss。
曲线拟合和曲线插值:插值是拟合的一种方法。插值方法求出的插值多项式要求所有的数据点都在曲线上,而拟合求出的插值多项式只要反应数据的基本趋势就可以了,并不要求所有的数据点都在拟合曲线上。
解释NP难,NP完全:需要在指数时间内求解的问题。将所有可以在多项式时间内验证的问题称为NP问题。
多目标优化:本质在于,大多数情况下,某目标的改善可能引起其他目标性能的降低,同时使多个目标均达到最优是不可能的,只能在各目标之间进行协调权衡和折中处理,使所有目标函数尽可能达到最优。
MapReduce和Spark的区别:一个 MapReduce 任务只能包含一次 Map (形成key-value)和一次
Reduce(聚合),计算完成之后,MapReduce
会将运算结果写回到磁盘中供下次计算使用。如果所做的运算涉及大量循环,那么整个计算过程会不断重复地往磁盘里读写中间结果。这样读写数据会引起大量的网络传输以及磁盘读写,极其耗时。一个Spark
任务并不止包含一个Map
和一个Reduce,而是由一系列的Map、Reduce构成。这样,计算的中间结果可以高效地转给下一个计算步骤,提高算法性能。最大的不同:spark是可以将某个特定的且反复使用的数据集的迭代算法高效运行,mapreduce处理数据需要与其他节点的或是框架保持高度并行,无法实现这样的效果。
交叉验证:将原始数据进行分组,一部分做为训练集来训练模型,另一部分做为测试集来评价模型。K折交叉验证。
K-近邻分类算法(简称KNN)的定义:通过计算每个训练数据到待分类元组的距离,取和待分类元组距离最近的K个训练数据,K个数据中哪个类别的训练数据占多数,则待分类元组就属于哪个类别。
SGD:随机梯度下降。梯度下降算法是应用于神经网络反向传播过程的计算梯度,然后更新参数,最终找到最优的位置。
IOU:用于测量真实和预测之间的相关度,相关度越高,该值越高。 对称加密算法和非对称加密算法:
偏序关系:R是集合A上的一个关系,若R满足自反性、反对称性、传递性,称R为A上的偏序关系。
图像分类五大方法:KNN(K-邻近算法)、SVM(支持向量机)、BP神经网络、CNN和迁移学习。
常见对的激活函数:sigmoi、relu(相对于sigmoi,具有:防止梯度消失、输出具有稀疏性、简单计算等优势)、tanh。作用是:非线性化。输出0,1。
贝叶斯算法的公式,应用,举例子说明。
**概念:**人工智能就是使得机器能够胜任一些通常需要人类智能才能完成的复杂工作。
**前景:**人工智能具有很好的前景,构建智慧城市,让AI进入生活,充分利用城市资源,去减少环境污染、解决交通拥堵等问题具有科研性
https://www.cnblogs.com/Towerb/articles/12823181.html
传送门
云计算核心技术:
分布式存储:
云计算有哪三种服务方式
IaaS:
PaaS:
SaaS:
云计算优点
虚拟环境和云计算的区别
总结
中心
去中心化
在去中心化以后,整个系统中没有了权威的中心化代理,信息的可信度和准确性便会面临问题。
区块链技术的诞生
如何防伪
记账奖励
谁说的
为什么自然语言理解很难?
自然语言的处理策略。
智能感知不仅包括通过各类传感器获取外部信息的能力,也包括通过记忆、学习、判断、推理等信息处理过程,认知现实环境和对象类别与属性的能力。在机器视觉、目标识别、态势感知、智能搜索等诸多领域中,基于智能感知的解决方案已呈现出具有架构灵活、可拓展、可配置等无可比拟的技术优势。
随着5G网络的落地延伸,数据的几何级递增,人工智能新方法不断出现,计算设备处理能力与集成度的提升,智能感知的需求和能力正进一步向纵深领域拓展,创新性应用持续涌现,并对智能感知与信息处理从速率、精度、安全性等方面提出了更高的要求。本实验室时刻关注该领域前沿技术的最新进展,顺应学科发展潮流,以现实世界的智能感知与信息处理为核心,面向实际应用领域,践行“将研究扎根于现实需求中,论文写在产品系统里,成果转化在市场上,在实践中锻炼人才培养人才”的理念,开展相关基础性研究以及应用研究。
5G十大应用场景
脑机接口(brain-computer interface, BCI),是在人脑与计算机或其它电子设备之间建立的直接的交流和控制通道 。通过这种通道 ,人就可以直接通过脑来表达想法或操纵设备 ,而不需要语言或动作
这篇文章是关于基于脑电脑机接口系统的情绪识别研究综述与分类。首先是回顾已经发表的论文,来对脑机接口在不通过环境下的情绪识别的各种应用概念有一定理解。然后发现基于脑电图的情绪检测器干的发表数量呈爆炸式增长。预计该研究将呈指数型增长。(脑机接口(brain-computer interface, BCI)技术的发展和研究促进了情绪的检测和分类)
挑战。
预测:
应用
利用基于脑电图的情绪检测为帕金森病患者提供帮助、监测、评估和诊断的想法
在游戏研究中,有一些文章试图检测玩家的情感状态,以适应特定的游戏特点,如难度等级,惩罚,和鼓励
神经营销学。这个新领域的目标是通过成像技术和生理参数识别来了解消费者对市场刺激的反应。由于顾客在销售区域的感受强烈地受到环境感知的影响,对情绪反应的识别可以揭示真实的消费者偏好,并改善和帮助(购买)过程
基于脑电图的实验研究[144]也用于确定吸烟者对健康警告的反应开始不同的时间点.他们的目标是通过评估选择性注意取向和测量情绪处理来确定图形化的香烟包装健康警告的效果
索了脑电图情绪检测系统作为监测注意力水平和测量工作量的手段[176,188]。一个重要的用途是在安全关键任务中监控警惕性水平,如驾驶和监视