非主流自然语言处理——遗忘算法系列(六):语义模型


【前言】
1、语义体系的建立对人工智能的意义,相信不用多说。
2、公开此文的目的,是因为此文所设计的语义模型包含的待解决任务量很大,寻求同好共同讨论交流。
3、版权说明
   3.1、本文的版权归作者所有。
   3.2、本文中所提及的问题的解决方案,归研究者所有。


【正文】
==============================
【原理】
词的语义可以通过与其相关联的词表征

【定义】
词的语义:用该词的词翼及其概率的集合来表示
词翼:该词与其窗口尺寸中互信息大于一定阈值的共现词共同构成

【统计可知】
1、每个词发生的概率
2、任意词对,可知左词发生时右词发生的概率
3、任意词,可知该词的所有词翼及其概率

【公理假设】

1、
问:句子是由词按什么规则构成的?
答:
    1.1、包含算子
        1.1.1、算子指示集合运算的类型
        1.1.2、集合运算包括以下类型等:
            1、等价
            2、交、并、补
            3、属于、包含
    1.2、不含算子
        1.2.1、并联、串联、嵌套


2、
问:段落是由句子按什么规则构成的?
答:
    2.1、段落中的句子可视为相互独立,相关的部分会重复
    2.2、重复的部分可能会有缺省、使用代词等变体形式
    2.3、缺省、指代可以通过上下文推断获得


3、
问:标题与正文是怎样的关系?
答:
    3.1、标题与正文的语义尽可能相似
    3.2、标题受字数限制


4、
问:对话过程中,问句与答句是什么关系?
答:答句是当问句发生时,可能发生概率最大的句子。

5、
问:祈使句有什么不同?
答:祈使句的应答是行为动作,可以将此类行为动作视为特殊的句子,对标机器人的动作API的函数调用。

【任务目标】
1、句子解析:
    1.1、串、并、嵌套以及算子的识别解析
    1.2、缺省及指代的处理
    1.3、上下文模型


2、已知构成句子各词的语义(词翼及其概率的集合)时,求整个句子的语义。

3、已知语义时,求该语义对应的句子。
    3.1、给文章拟标题

4、已知问句时,求答句。

5、计算两个句子的语义相似度。

6、推理
    6.1、三段论推理


【技术交流】

1、技术QQ群: 217947873

2、联系方式:

  2.1、QQ:老憨  244589712

  2.2、邮箱:[email protected]

你可能感兴趣的:(遗忘算法)