读《数学之美》part1

第一章 文字和语言VS数字和信息

1.翻译这件事之所以能达成,仅仅是因为不同文字系统在记录信息的能力上是等价的

2.罗塞塔石碑(三种语言:埃及象形文字,埃及拼音文字,古希腊文)

3.罗塞塔石碑的指导意义:1.信息的冗余是信息安全的保障 2.对照语料对翻译至关重要

4.阿拉伯数字(其实是印度人发明的)的革命性在于数字与文字的分离,在客观上让自然语言的研究和数学在几千年内没有重合

5.词可以被认为是有限且封闭的集合,而语言则是无限和开放的集合

第二章 自然语言处理-从规则到统计

1.任何一种语言都是一种编码的方式,而语言的语法规则则是编解码的算法

2. 图灵测试:验证机器是否有智能的一种方法

背景知识
图灵测试
图灵完备

3.达特茅斯会议(麦卡锡,香农啥的)

4.误区:要让计算机完成翻译或者语音识别等只有人类才能完成的事情,就必须先让计算机理解自然语言,而做到这一点就必须让计算机拥有类似人类的这样的智能(鸟飞派)

5.理解自然语言的误区:当时普遍的认识是要做好两件事:分析语句和获取语义,这种惯性思维其实是受了传统语言学研究的影响

背景知识
贝叶斯公式

你可能感兴趣的:(读《数学之美》part1)