自然语言就是人类所了解到的语言,与计算机语言相比本质上两者是同义的。
(1)横跨了计算机科学、语言学、以及人工智能学科;
(2)简单的来说就是让计算机能像人一样进行表述(因此它也是属于人工智能的一部分);
让计算机能够处理或者理解人类语言,以此来完成一些有意义的任务;
过程:形式化描述->数学模型算法化->程序化->实用化;
例:拼写检查以及手机上的自动填写功能,以及网页搜索,以及更高级的语言理解功能的实现。
①如何让计算机去自动学习而不是用手工写代码来告诉计算机你想要做什么;
②深度学习是表征学习的一个分支(表征学习的理念就是我们只向计算机提供来自世界的原
始的信号,无论是视觉信号还是语言信号,然后电脑可以得出好的中介表征来很好的完成任务),
所以从某种意义上来说,它是在自己定义特征,就像之前机器学习的人一样自己定义特征;
机器学习的本质是我们以一个人类的角度来仔细的审视某个或者某类特定的问题,然后找出
解决这个问题的关键要素,之后设计出和这个问题相关的重要特征要素,然后写一些代码来识别这
些特征。
你将得到多层的习得表征,可以打败其他的学习方法,很多时候深度学习就是指神经网络
(也称为人工神经网络 (ANN) 或模拟神经网络 (SNN),是机器学习的子集,并且是深度学习算法
的核心。其名称和结构是受人类大脑的启发,模仿了生物神经元信号相互传递的方式)。
人类语言的多义性:人类的语言通常是模棱两可的,编程语言是非常明确的,最大的一个问
题可能就是人类语言由于是为了高效的沟通,所以很多时候都有很多的省略,人会根据自己的常
识、或者语言环境来补全整句话的语义,但是自然语言就很难做到,而且人类语言在说话的时机都
蕴含了丰富的信息、语境、以及言外之意;所以这就是为什么自然语言很难的原因之一。
利用一些深度学习、神经网络的思想以及表征学习的思想,将它们运用到语言理解、以及自
然语言处理等问题上。
用一套非常小的核心技术工具箱,在各个领域广泛应用,以非常高的准确性解决各种问题。
(1)二者都是以词义作为起点;
(2)例如对单词进行深度学习:把一个词用向量表示,就相当于把这个词放在了高维向量空
间中,这些空间就成为了非常棒的语义空间,具有相似含义的词汇将在矢量空间中形成聚集快;而
且向量空间存在方向,它们会透露关于成分和意义的信息。
注:在高维向量空间中的那些数轴并没有什么实际意义;