随笔-机器如何学习我们的知识?

1、 人类语言的语法知识。

不同的人类语言有不同的语言表达形式,包括语言符号,语言符号的组合和应用规则。阿拉伯文字、斯拉夫文字、罗马文字、拉丁文字、象形文字等代表着不同语言背景、语言文化。

2、 机器可用的词典知识库有哪些?

1) 类别词库。特定实体词、功能词、非功能词。
2) 组合词库。组合词库包括搭配词库,共现词库。
a) 搭配词库:
i. 位置共现:窗口共现、互信息、卡方
ii. 句法共现:成份共现(VP/NP)、依存共现(SBV,VOB,ATT,POB等)
iii. 语义共现:语义角色共现(工具,结果,趋向)
iv. 概念共现:同义词标准化、上位词、反义词等替换标准化
3) 替换词库。同义词库,兄弟节点词库,父亲节点词库,儿子节点词库

3、 语言模板的自我习得?

借助句子非主要成分移除,成份位置规则。
1) 手工枚举下的语言模板
2) 基于事实实例自举方式的语言模板生成
3) 基于类型符号替换的语言模板生成

4、 推理规则的自我习得?

1) 基于关系事实的推理规则反推
2) 基于类概念的推理规则生成
3) 基于类属性或描述的推理规则生成

5、 语料的自我扩充?

语料的自我扩充分成两个,一个是从无到有,另一个是从少到多。
1) 基于回标的方式。确定标准句,对回标候选句进行置信度评分。
2) 基于回译的方式。翻译成中间语言,再反向翻译回来,形成另一种表述形式。
3) 基于句式迁移的方式。陈述句,否定句,祈使句、被字句、把字句。定语后置、状语前置等变换句法。
4) 基于同义词替换的方式。扩展问的常用方式。
5) 基于概念体系替换的方式。
6) 基于非功能词插入和删除的方式。
7) 基于搭配与语言模型的生成方式。基于给定词,结合搭配信息和语言成立性模型进行语言实例生成。
8) 基于生成对抗网络的语言实例生成。

6、 人类的语言能力体现在能够在不同句式上来回变通

1) 缩句:把结构比较复杂的句子中的修饰、限制和补充说明的成分去掉保留主要成分的意思。简单地说:缩句就像把一棵树的树枝、枝叶都去掉,只留下树的主干一样。
纵横交错的河道里穿行着行动轻快灵活的小艇(缩句)河道里穿行着小艇。
运动健儿的脸上露出了胜利的喜悦。 (缩句)脸上露出了喜悦。
我们要把时间当成生命一样爱惜。(缩句)我们要把时间爱惜。
六岁的弟弟津津有味地吃着又香又甜的苹果。(缩句)弟弟吃着苹果。
一只从树上掉下来的小麻雀无可奈何的拍打着小翅膀。麻雀拍打着翅膀。
2)去“枝”留“干”法;凡是用来进行修饰或限制的词都尽量去掉,包括 :形容词、数量词、表示程度、时间、地点的词。

7、 如何更好地将语言学家的工作计算机化,句子转写器。

1)底层的语言实例是千变万化的,往上走,词性组合模式回少一些,再往上走,句法组合模式会少一些,再往上走,语义模式会更少一些。语言是遵从一定的模式和组合规则形成的。语言的生成是一种抽象语言模式的实例化过程。

8、语言规则与分布式表示的对抗,规则的形式化、数值化。

你可能感兴趣的:(自然语言处理,语言资源,知识图谱,知识学习,知识图谱,语言资源,语言习得)