数学之美笔记(二)

  1. 字母(或者中文的笔画)、文字和数字实际上都是信息编码的不同单位。

  2. 任何一种语言都是编码的一种方式,而语言的编码规则则是编解码的算法。

  3. 鸟飞派对自然语言的处理是基于规则的:

    数学之美笔记(二)

    他们认为看看鸟是怎样飞的,就能模仿鸟造出飞机,而不需要了解空气动力学。事实上我们知道,怀特兄弟发明飞机靠的是空气动力学而不是仿生学。要让机器完成翻译或者语音识别这样只有人类才能做的事情,就必须先让计算机理解自然语言,当时普遍的认识是首先要做好两件事,即分析语句和获取语义。句法分析会分析出一个复杂的语法分析树,而自然语言的文法是上下文有关文法,算法复杂度非常高。

  4. 基于统计的方法的核心模型=通信系统+隐含马尔可夫模型(第五章)。

  5. 基于统计的自然语言处理方法,在数学模型上和通信是相通的,甚至就是相同的。

本文涉及到的人物及其著作:

约翰 · 麦卡锡、马文 · 明斯基、罗切斯特、香农、图灵、弗里德里克 · 贾里尼克、高德纳、阿尔弗雷德 · 斯伯格特、彼得 · 布朗、米奇 · 马库斯

《围城》——钱钟书


你可能感兴趣的:(自然语言处理,数学之美)