目录
1.1 人工智能导论
1.2 人工智能应用
1.3 人工智能产业发展
1.4 人工智能发展的成功因素
1.5 人工智能迅速发展的技术领域
1.6人工智能的基础知识
人工智能的三个层面:
计算智能:能算能存
感知智能:能听会说,能看会认
认知智能:能理解,会思考
常见术语解释:
从业者AI学习地图:
指纹识别:
指纹采集-----指纹评估-----提取特征-----指纹匹配
刷脸解锁屏幕:
样本采样-----图片识别-----样本比对
真人核身验证
人工智能技术渗透各产业
健康码背后的AI技术--人脸活体检测技术
核心算法能力:活体检测是针对高安全性要求的人脸核身验证而研发的一种技术,防止人脸识别过程中照片,视频,静态3D模型等各种不同类型的攻击。
算法1:动作活体
随机产生动作系列(摇头、张嘴、眨眼、点头),用户根据提示进行交互,整个过程2-3秒完成,并选择最佳的人脸照片进行二次防翻拍判断
算法2:唇语活体
基于随机验证码的唇语活体检测方法,是一种基于唇动+语音+翻拍检测的多为活体监测方案。该方案首次实现了实用化水平,已经应用于微众银行app,联通等多个远程核身业务,能够减少97%以上的现有人工审核投入
算法3:静默活体
屏幕发出随机光信号同时采集图像,可以验证是否为人脸的三维形状和质感,并且验证采集的时效性,再与防范拍进行结合,安全性大大提升,已经通过Webank SaaS服务对外发布
算法4:光线活体
将人脸动作交互与投射光线序列编解码活体技术相结合。结合动作活体,引入环境判断,室外场景通过率高。
转型需求,场景丰富,抗疫加速
技术:从实验实走向大规模商业应用
数据:数据正式成为国家生产要素
市场:供需互促的正向循环基本建立
资本:走出炒作泡沫聚价值领域
平台:大厂普遍开放平台促进生态
AI走向泛在智能
算法+数据+硬件 -----> 人工智能
现代AI发展的核心要素:不断优化的人工智能算法
卷积网络、循环网络、生成对抗网络、强化学习
计算机视觉:图像分类、目标检测
语音技术:语音识别、机器翻译
自然语言处理:推荐系统,文本情感分析
计算机视觉:指用摄影机和计算机代替人眼对目标进行识别、跟踪和测量等,并进一步做图像处理,用计算机处理成为更适合人眼观察或传送给仪器检测的图像。
主要应用场景:图像分类、图像重建、目标检测、图像搜索、图像分割、目标跟踪
图像分类:使用图像作为输入,并将其分类为规定的类,图像分类模型通常使用深度学习和神经网络进行训练。应用场景非常广泛,比如动物保护、医疗诊断、路标跟踪等
目标检测:旨在从图像中定位感兴趣的目标准确判断每个目标的类别,并给出每个目标的边界框。其关键问题在于如何实现小目标物体的高精度检测和多类别物体检测。目标检测广泛应用于:机器人导航、自动驾驶、智能视频监控、工业检测
图像分割:指的是将数字图像细分为多个图像子区域(像素的集合)(也被称作超像素)的过程,其目的是简化或改变图像的表示形式,使得图像更容易理解和分析。图像分割总体上可以分为三类。
语义分割:预测出输入图像的每一个像素点属于哪一类的标签。
实例分割:再语义分割的基础上,还需要区分出同一类不同的个体
全景分割:在实例分割的基础上,对背景的每个像素点实现分类
语音技术:让智能设备能够听懂人类语音,也可以让机器说话的一种技术
主要应用场景:语音识别、语音合成、声纹识别
语音识别:其目标是电脑能自动将人类的语音内容转换为相应的文字。典型应用包括:语音拨号、语音导航、室内智能设备控制、语音文档检索、简单的听写数据录入等。
语音合成:通过机械的、电子的方法产生人造语音的技术。TTS技术,又称为文语转换技术,隶属于语音合成,他是将计算机自己产生的、或外部输入的文字信息转变为可以听得懂的、流利的汉语口语输出的技术。广泛应用在人机交互、智能客服、虚拟偶像上。
声纹识别:作为声纹识别,作为生物认证技术的一种,是根据语音波形中反映说话人生理和行为特征的语音参数自动鉴别说话人身份的一项技术。声纹识别是交叉运用心理学、生理学、语音信号处理、模式识别、统计学习理论和人工智能的综合性研究领域。声纹识别技术是一种依据人类的语音特征进行的身份识别技术,其在很多领域已经有了非常重要的应用,比如移动互联网、军事安全、远程控制、通信系统、门禁系统等等。
自然语言处理:自然语言处理( Natural Language Processing, NLP)是人工智能和语言学领域的分支学科作为人工智能技术的分支,其使用机器学习来处理和解释文本和数据。自然语言识别和自然语言生成是NLP的类型。自然语言处理的用途是用于从非结构化文本数据中发掘洞见,并让您能够访问所提取出的信息,以生成有关这些数据的新的理解。
主要应用场景:文本分类、机器翻译、知识图谱、对话系统、信息检索、文本生成
文本分类:是指对文本集按照一定的分类体系或标准进行自动地分类打标签。通过使用自然语言处理技术,文本分类器可以自动分析文本然后根据其内容分配一组预定义标签或类别。其广泛应用于新闻分类、邮件自动回复、客服聊天情感分析、内容审核之广告检测、内容审核涉政涉黄言论分析
机器翻译:属于计算语言学的范畴,其研究借由计算机程序将文字或演说从一种自然语言翻译成另一种自然语言。能够优先解决对自然语言的正确认知与辨识,被视为机器翻译是否能够成功的最主要关键。机器翻译主要应用场景有在线多语言翻译、会议中的语音同专、翻译机、跨语言检索等。
对话系统:也称会话代理,一种模拟人类与人交谈的计算机系统,旨在可以与人类形成连贯通顺的对话,通信方式主要有语音/文本/图片,当然也可以手势/触觉等其他方式。对话系统大致可分为两种:任务导向型对话系统(如问答系统)、非任务导向型对话系统(也称为聊天机器人)
人工智能--->继器学习----->深度学习
机器学习定义:机器学习是实现人工智能的途径之一,即以机器学习为手段解决人工智能中的问题
“机器学习是对能通过经验自动改进的计算机算法的研究。”
“机器学习是用数据或以往的经验,以此优化计算机程序的性能标准”
机器学习的过程
机器学习就是找到特征于标签之间的关系,利用算法从一类训练数据或信息中自动分析并获得该类数据或信息的规律,并利用获取的规律对未知数据进行预测。上述寻找关系和规律的过程,称为训练。训练完成后的结果,是得到一个机器学习模型。
机器学习的常见类型
监督学习、无监督学习、强化学习
监督学习:提前给训练数据打好标签
无监督学习:待学习的训练数据没有标签,算法通过某种方式在数据中寻找共同特征,并将有共同特征的数据聚合在一起。无监督学习的过程和人类的归纳学习过程相似。
深度学习
深度学习是机器学习中一种基于对数据进行表征学习的算法。观测值可以使用多种方式来表示,如每个像素强度值的向量,或者更抽象的表示成一系列边、特定形状的区域。深度学习的最主要特征是使用神经网络作为计算机模型。
深度学习VS机器学习