Applied Natural Language Processing —— 读书笔记 第一章

第一章 人们理解的NLP

语言理解作为一种认知的过程,需要world knowledge。光这一点我就非常赞同,像我现在在美国留学半年,对于计算机相关的对话很明显能听懂的部分更多,参与的部分也更多,但是对于日常生活方面的就要差很多。




world knowledge对于语言理解的影响可以分作三个部分:参考性inference,期望性expectation和模糊性ambiguity。

1.参考性可以理解为根据已有的文字内容和背景知识,对文字背后含义的推测。就像class在编程语言里面都会理解为类,而不是课程。

2.期望性可以理解为还是根据文字内容和背景知识,对接下来文字内容的预期。比如你看到一个人躺在地上,会立即expect他是否出现了什么身体状况。

3.模糊性是当某些字有多重含义的时候,选取哪一个意思。




理解语言有几个过程


首先是语法Syntax、语意Semantics和语用Pragmatics。

1.根据语法,我们大概能知道某些词是名词、动词、形容词。

2.根据语意,我们能推断某些词是那种类型的名词,比如有个人说吃X,那么X多半是某种食物。

3.而根据语用,我们可以推测,某人吃X,那么X多半是人吃的食物,而不是动物吃的食物。而如果这个人是素食主义者,那么X多半也是素食。


其次是很多信息可以结合上下文得出。比如根据有服务员waiter的信息,可以推断出当前这个人在餐厅吃饭。因为相比于在家吃饭、在办公室吃饭,在餐厅吃饭的这个可能性更大。BORIS系统也能做如上这些理解人类语言的事情,这会在下一个章节提到。

我们理解自然语言的能力是受到信息的质量和数量影响的,这些信息可以是上下文相关的信息,也可以是根据已知信息的推测。


然后是学会思考。

以前人们都认为小孩子的思考过程和大人一样,但是瑞典心理学家Jean Piaget发现了(也是现在达成共识的)一项事实,儿童的思考过程在数量和质量上都喝成人不一样,并且可以将其分为四个过程。

1. 感觉运动阶段sensorimotor,在小孩子1岁半之前。这一阶段的小孩对象征性的想法过程没有明显表现。

2. 预操作阶段preoperational,大约从2到6岁,小孩能够运用象征性的认知过程,但是想法是非常肤浅、初级和自我的。

3. 具体操作阶段concrete operational,大约从7到11岁,小孩开始能够运用逻辑认知的方式,比如排序、分类和理解子类关系。这里提到了一个conversation operation,结合后面给出的例子,我的理解是某种认知能力,能够识别对话中的某些逻辑。

4. 正是操作阶段,formal operational,大约从12岁开始,小孩子开始有了类似成人思考问题时的认知方式,比如抽象思考、假设推理、考虑各种结构、系统查找解决方案、甚至对未来的思考。


最后一点是学会理解。

儿童可能可以理解某几个单词,但是无法像成人一样理解句子,词汇量和语法会成为比较大的障碍。




综上,语言的学习,是一个将个人关于这个世界的信息以及信息获取方式的获取、提升和组织的过程。

你可能感兴趣的:(Machine,Learning,-,NLP)