白话新科技之人工智能培训感悟(三)

在本篇中,将介绍我们将介绍运用广泛的智能客服,以及非常有用的时间序列预测的相关项目内容。

(一)人工智能+语音识别

1、项目原理

我们常见的语音识别有两种,一种是单轮对话,这种一般用在搜索或者知识库查询上。比如智能机器人小爱,你对小爱说:“播放音乐《青花瓷》。”小爱就开始播放青花瓷这首歌,这就是单轮对话。另一种是多轮对话,比如Siri,还有微软小冰等,都属于聊天机器人,进行多轮对话的。

语音识别的核心就是两步。第一步,将语音转化为文本。第二步,分析文字内容,也就是文本分析。如果是多轮对话,还要分析对话意图,将意图进行分类,以便更好的进行回答。目前语音识别的重点是建立“问题域”。这个问题域指专业领域的相关词汇。比如,医疗上的词汇和金融上的词汇一定是不一样的。中华文化博大精深,同样的词不同领域下表达的含义也不同,所以,建立问题域是关键。并且,由于技术限制,目前语音识别只支持普通话,所以说方言的小伙伴们想要用好语音识别还是要多多练习普通话。

目前语音识别应用的领域还是非常广泛的。常见的有利用语音转文本的技术,做客服自检,看客服是否做好了服务,有没有高效处理问题,有没有用词不专业等等。还有一些电商网站或者金融行业的语音问答,甚至是语音营销等等。

语音识别本质上还是为了更好的服务人类,缓解人类客服的压力。为了提高语音识别的效率,我们需要建立相关的知识库。

首先要给知识库进行分类,可以按行业渠道划分,按知识类型划分等等。构建了知识库之后,还要建立主体库,也就是需要识别一句话的主体。例如,在银行语音客服输入“信用卡怎么办?”,那么就首先识别这句话的主体是“信用卡”,然后在知识库中找出与信用卡相关的知识,进行结果返回。这里返回的结果需要排序,优先返回关联度最高的,这样无论是直接给到顾客,还是返回给到人工客服做参考,都更加方便快捷。

最后,也是需要对智能客服进行评价检测,这里主要对单轮会话,也就是一问一答,回答可以简单用一句话来描述,不依赖上下文的会话进行评价。同样也是用“召回率”,也就是机器人能回答的问题数与总问题数之比,“准确率”,也就是机器人正确回答的问题数与总问题数之比,以及“问题解决率”,也就是机器人成功解决的问题数与总问题数之比来进行人工智能客服的评估。

2、项目设计技术及工具

       在语音识别项目中,最难的一步便是将语音转化为文本。比如我们常用的科大讯飞,就是因为此技术而建立了自己的“护城河”。语音转文本需要用到的技术就是将语音矩阵转化为文本,这里常用的是隐马尔可夫模型,具体原理就不加以介绍了,太过专业,了解即可。然后,便是单轮会话中的文本与知识库比对时用到的相似度检验了,文本的相似度检验总体较简单,主要用余弦相似性、简单共有词以及编辑距离等进行相似度检验。而多轮会话中,则主要用到chatterbot这个开源组件进行代码撰写。

       总的来说,人工智能客服是目前为止所有AI领域最容易落地的项目,目前很多行业和公司也已经开始使用这门技术减少人工客服的工作量。


(二)人工智能+预测

人工智能进行预测这个技术应用领域也非常广泛。比如,电力公司通过季节预测及用电高峰预测,控制不同时间段或不同季节放电的多少,在节约成本的同时也可以最大程度的满足用户需求。此外,还有金融领域运用的也比较多,比如大火的比特币价格预测,以及股票走势预测。当然,并不是说预测的结果就一定准确,我们应该始终牢记一个概念,那就是人工智能永远只是辅助人类进行决策的工具。

时间序列预测主要运用到了数学和统计学上的回归方程原理,利用开源工具Keras,进行时间序列预测。当然有一个前提,就是海量和高质量的数据,这样才能提高预测的准确度。


以上便是培训的全部内容,在培训过程中收获了很多,同时老师也非常年轻,但却有很多项目的经验。因此,在人工智能的时代,年龄和经验都不再是问题,一切皆有可能,希望大家能够不断学习,拥抱新的时代!

你可能感兴趣的:(白话新科技之人工智能培训感悟(三))