神经网络、自然语言处理将如何赋能人工智能+的发展

摘要 在信息网络高速发展的时代,神经网络已经成为人工智能领域不可缺少的部分,神经网络的推广使得更多的人了解到人工智能,推动了控制理论的不断前进。以深度神经网络算法为例,推动识别技术新业务的功能突破,人脸识别率达到99.5%,助力人工智能的应用和发展。与此同时,在自然语言的处理研究过程中,多义词的辨识以及短文本的情感分析等方面的研究使得人工智能具有更强大脑。随着深度神经网络和自然语言处理等基础技术的进步,人工智能具有了更广的应用领域,将逐步进入到各行各业中,最终革新人们的生产和生活方式。

关键字 神经网络、自然语言处理、人脸识别、多义词辨识、短文本情感分析、人工智能

一、 神经网络在人工智能中的应用
1、 典型的神经网络
1.1感知机
感知机可以称为第一代的神经网络,主要包括输入的多个特征单元(人工定义或程序寻找),中间由学习权重连接,最后由决策单元输出。典型的感知机单元遵循前馈模型,输入通过权重处理后直接连接到输出单元上。

图表 1感知机
感知机可以使用的前提是感知机已经训练完毕,训练是为了调整它的权值。
1.2卷积神经网络
在感知机和多层感知机的基础上,人们提出了一种新的网络结构——卷积神经网络。利用卷积神经网络可以对一些特征的检测进行共享,并在尺度和位置和方向上具有一定的不变性。1998年Yann LeCun提出的一个称为LeNet的网络进行手写字符识别获得了巨大的成功。下图是LeNet的主要结构:一个包括卷积、池化和全连接的六层网络结构。

图表 2LeNet网络
它利用反向传播算法来对隐藏层的单元权重进行训练,并在每个卷积层中实现了卷积操作的(卷积核)权值共享,并引入池化层实现了特征的缩聚,最后通过全连接层来实现输出。

2012年ILSVRC比赛,由ImageNet提供了120万张的高清训练数据,目的是训练一个可以分类出图像属于一千类中每一类的概率的模型,并以此来进行图像的识别。Hinton的学生Alex Krizhevsky,在LeNet的基础上改进了神经网络,训练出了一个具有7个隐藏层深度网络,更深更强大的AlexNet,并引入了GPU进行并行训练,极大的提高了深度学习模型的训练效率。

图表 3AlexNet网络
1.3循环神经网络
循环神经网络主要用于处理序列数据。在机器学习领域,序列模型一般利用序列数据作为输入,来训练序列模型用于预测序列数据的下一项。在循环神经网络之前主要使用无记忆模型处理这类任务。

图表 4循环神经网络

循环神经网络包含了两个重要的特点。首先拥有一系列隐含状态的分布可以高效的存储过去的信息;其次它具有非线性动力学可以允许它以复杂的方式更新隐藏状态。在足够的时间和神经元数量下,RNN甚至可以计算出计算机能计算的任何东西。它们甚至会表现出振动、牵引和混沌的行为。
目前主要有四种有效的方式实现循环神经网络,主要包括长短时记忆(Long Short Term Memory),海森自由优化方法(Hessian Free Optimization),回声状态网络(Echo State Networks)以及利用动量的初始化(Good initialization with momentum)
2、 深度神经网络在人工智能应用中的识别过程
深度神经网络广泛应用与语音识别,大数据分析,图像识别,行为识别等领域。在各自的领域中,如果一个深度神经网络识别过程示意图如下,那么我们称之为一个较好的深度神经网络

图表 5一个好的深度神经网络识别过程
在识别领域,深度神经网络发挥这极其重要的作用,它可以解决某些我们人类很难解决的识别问题,比如对于狗和狼大多数人都无法将他们正确辨认,但是深度神经网络可以通过训练机器,用标记好的图片训练它,让它学会分类。.对于给定的一张图神经网络做出基本型反应,进一步计算神经网络做复杂结构反应,近而神经网络做抽象概念反应,最终输出预测结果。识别狗和狼的过程如下图所示;

图表 6神经网络识别狗
3、 神经网络算法
基于多层神经网络的新的深度学习算法。是一种新的算法和结构,新的网络结构中最著名的就是CNN,它解决了传统较深的网络参数太多,很难训练的问题,使用了“局部感受野”和“权植共享”的概念,大大减少了网络参数的数量。这种结构很符合视觉类任务在人脑上的工作原理。为了解决传统的多层神经网络的一些不足:梯度消失,过拟合等。产生了一些新的方法:新的激活函数:ReLU,新的权重初始化方法(逐层初始化,XAVIER等),新的损失函数,新的防止过拟合方法(Dropout, BN等)。
神经网络解决了早期人工智能的一些遗留问题,在大数据和大算力的加持下,使得人工智能重新进入到大众的视野。广泛应用与视觉识别,图像识别,语音识别,棋类AI中,提升了人工智能的深度和广度

二、 自然语言处理中的人工智能
1、 自然语言处理的多义词辨识
造成语言模糊性的一个重要原因是词的多义性,词义辨识不准确,使语法、语义的分析存在偏差。运用神经网络模型根据词的搭配关系、句内语法、语义约束、前后文的语义逻辑关系确定词义,实现机器翻译中多义词的正确辨识。例如我们通过网络模型根据文中关键词创建语义场,然后根据当前语义场对多义词进行解释,实现汉英翻译中多义词语义的正确辨识。
正确辨识汉英翻译中的多义词语义的处理方法:我们只有词形信息的书面汉语文本提供给机器,这些词形信息隐含了语法关系、逻辑关系、修辞关系以及文本的主题和作者的写作风格等,算法的核心是如何利用这些信息。在机器翻译系统中,记录词到词义项映射关系的是双语语义词典知识库。在双语语义词典中一词形X有m个语义项,具体选择哪一个语义项由所处的语言环境决定。根据上下文很容易获取多义词的具体意义。从我们人脑处理语言的过程中可以总结出机器翻译的多义词辨识分为两个阶段:第一阶段是当前语义场的建立,假设语义场是由相继出现的一系列关键词共同创建。第二阶段是利用当前语义场决定词的词义。由此可见机器翻译过程是一个约束满足问题。在此基础上可建立约束满足的神经网络模型。
模型学习的例句为
1)汤挺热乎。
2)他待人总是很热乎。
在双语词典中热乎有两个词义,一个词义在“温度”场中解释为warm,另一个在“情感”场中解释为warm and friendly。在例子1中创建“温度”场的关键字是具有温度属性的汤,在例子2中创建“情感”场的是与情感有关的他、待人关键字。
多义词识别不仅应用于机器翻译,还广泛应用与人机交互的语音识别系统,以及智能机器人。在一定成都上多义词识别问题的解决推动的人工智能在智能机器人的发展

2、 自然语言处理的短文本情感分析
在自然语言处理中的又一重要难题是能否正确表达出句子的情感,是自然语言处理关键性任务的前提基础。
2.1情感分析
情感分析(SA)又称为倾向性分析和意见挖掘,它是对带有情感色彩的主观性文本进行分析、处理、归纳和推理的过程,其中情感分析还可以细分为情感极性(倾向)分析,情感程度分析,主客观分析等。情感极性分析的目的是对文本进行褒义、贬义、中性的进行判断。情感程度分析主要是对同一情感极性中再进行划分或者细分,以描述该极性的强度。例如“喜爱”和“敬爱”都是褒义词,但是“敬爱”相对来说褒义的程度更加强烈一些。
主客观分析主要目的是识别文本中哪些部分是客观称述而不带情感色彩,哪些是带有情感的主管描述。在对于微博,或者商品评论时,这个分析步骤一般都忽略,因为微博和商品评论本身就一定存在强烈的情感色彩,而且客观描述的情感值理论上是为零,不影响最终的情感分析结果。

2.2情感分析的主要方法:
现阶段主要的情感分析方法主要有两类:基于词典的方法和基于机器学习的方法
基于词典的方法主要通过制定一系列的情感词典和规则,对文本进行段落拆借、句法分析,计算情感值,最后通过情感值来作为文本的情感倾向依据。
基于机器学习的方法大多将这个问题转化为一个分类问题来看待,对于情感极性的判断,将目标情感分类2类:正、负;对情感程度的分析则转化为回归问题看待。对训练文本进行人工标标注,然后进行有监督的机器学习过程。
在还没有获得大量文本的情况下,使用基于词典的方法或者简单的机器学习方法是一个不错的选择。获得大量文本后,可以尝试使用一些复杂的机器学习方法甚至使用深度学习来进一步提升分析效果。

2.2.1基于词典的情感分析:
情感分析对象的粒度最小是词汇,但是表达一个情感的最基本的单位则是句子,词汇虽然能描述情感的基本信息,但是单一的词汇缺少对象,缺少关联程度,并且不同的词汇组合在一起所得到的情感程度不同甚至情感倾向都相反。所以以句子为最基本的情感分析粒度是较为合理的。篇章或者段落的情感可以通过句子的情感来计算。
基于词典的情感分析大致步骤如下:
分解文章段落:
分解段落中的句子:
分解句子中的词汇:
探索情感并标注和计数:
搜索情感词前的程度词,根据程度大小,赋予不同权值:
搜索情感词前的否定词,赋予反转权值(-1):
计算句子情感得分:
计算段落情感得分:
计算文章情感得分:

考虑到语句中的褒贬并非稳定分布,以上步骤对于积极和消极的情感词分开执行,最终的到两个分值,分别表示文本的正向情感值和负向情感值。
进过以上的步骤,每篇文章的每个段落的每个句子都会有相应的情感分值,之后针对需求,可以针对句子的分值作统计计算,也可以针对段落的分值作统计计算,得到最后的文本的正向情感值和负向情感值。

2.3基于情感分析的系统和应用
总体来看,基于情感分析的系统和应用在商品/服务评论分析、社交网络分析、情感机器人这三方面被广泛应用。
传统的情感分析应用聚焦于来自消费产品和服务的评论。基于产品评论的代表性平台有Google Shopping ,它还可以为用户提供在线购物平台的商品检索和比价服务;OpinionEQ 允许商业组织和个人按需定制产品分析服务。
微博、Twitter等社交网络服务的爆炸式发展也为研究人员带来了极大的机遇,研究人员能够通过分析大量富情感的数据来分析公众的情绪变化,并对政府管理、经济、娱乐领域产生影响。从政府和管理者角度出发,联合国开发了针对全球情感波动监测的应用Global Pulse ,北航的研究小组推出了第一个针对中文微博的在线情感系统MoodLens ;2012年美国大选时罗姆尼和奥巴马在Twitter上展开了激烈宣传,借此影响普通民众及新闻从业者,成为互联网参与总统竞选典型案例。在金融应用方面,许多研究机构将情感分析技术应用于股票分析及预测系统,例如Stock Sonar 在每只股票的价格旁边展示了每天针对该股的积极和消极的情感信息,为投资者提供即时的参考,UIC开发的Twitter情感分析进行为股市的涨跌进行预测和追踪 。在娱乐领域,阿里云的人工智能系统“小Ai” 在《我是歌手》节目中成功预测李玟夺冠,也是依靠现场数据以及社交网络上的点评数据进行分析预测,这其中都运用了对海量文本情感分析技术。可以看到,对社交媒体的情感大数据的监测和分析预测,不断影响着政府决策和大众选择。
除了在电商平台和社交网络得到广泛应用,情感分析技术还被引入到对话机器人领域。例如,微软的“小冰”机器人 可以通过分析用户的文本输入和表情贴图,理解用户当前的情绪状况,并据此回复文本或者语音等情感回应。部分研究机构还将情感分析技术融入实体机器人中。日本软银公司的Pepper机器人 依据常见的情感认知(喜怒哀惊)及对用户的面部表情、肢体语言和措辞的分析,了解用户的情绪并选择恰当的方式与用户交流。而香港Hanson Robotics公司开发的Han机器人 不仅可以理解用户的情感,它还可以将情感反馈以模拟的面部表情展现出来。国内的Gowild公司也推出了可以提供生活助理和年轻人强社交情感交流服务的“公子小白”机器人 。这些工作实际上并不是从认知机理出发,而是通过外在的形式(词语,表情,肢体)判断人类情感。
3、 中国的自然语言处理领域的人工智能公司
近年来,自然语言处理在工业界与学术界被广泛应用与人工智能领域从学术界来说,中国大陆地区除了微软亚洲研究院,越来越多的研究机构设立了自然语言处理实验室。据《互联网周刊》了解,清华大学自然语言处理与社会人文计算实验室、北京大学计算机科学研究所语言计算与互联网挖掘研究室、哈工大机器智能技术与自然语言处理实验室、中科院自然语言处理研究组、复旦大学自然语言处理研究组等都对自然语言处理有深入的研究。
与此同时,随着自然语言处理领域的兴起,越来越多的自然语言处理领域的公司相继出现。《互联网周刊》整理了自然语言处理领域的代表性公司:

图表 7自然语言处理领域的代表性公司

三、总结
随着神经网络算法的不断优化,将加速人工智能产业的发展,尤其是推动人机交互、万物相连的发展。物联网服务更加智能化。基础电信企业能快速的拓展新业务领域,搜寻到其他有价值的业务增长点。与此同时,各行业运营商积极人工智能领域的应用,通过神经网络建立合作开发的智能应用平台,联合创新,推动人工智能在居民的日常生活、交通、物流、家居、教育、医疗等行业的不断成长。将来随着情感分析研究不断突破,自然语言处理技术越来越成熟,其应用前途广大,尤其是和实体机器人结合,将多媒体技术融为一体,结合语音、图像处理技术,可以从语言、表情和行为方面理解人类情感并给出相应的情感回复,打造一个具有情感的机器人时代已经不远了!

参考文献
【1】《神经网络在人工智能中的应用》刘肖楠 信息技术与信息化
【2】《神经网络算法在人工智能识别中的应用研究》张庆、刘中儒、郭华 江苏通信
【3】《密集连接卷积神经网络:让人工智能拥有更强大脑》黄高 上海信息化
【4】《基于卷积神经网络的自然语言处理相关技术研究》于彦秋 国防科学技术大学
【5】《神经网络理论应用于自然语言处理》贺前华、徐秉铮 中文信息
【6】《中国的自然语言处理领域的人工智能公司》轩中 互联网周刊
【7】《人工智能在自然语言处理中的应用》李彦峰 襄阳职业技术学院学报
【8】《面向自然语言处理的人工智能框架》蔡艳婧、程显毅、潘燕 微电子学与计算机
【9】《文本情感分析:让机器读懂人类情感》黄高

你可能感兴趣的:(人工智能)