基于语义依存关系的相似度算法简述

一、基本思路

1.依据语义依存关系提取关键信息(修饰关系、疑问关系)
2.依照关键信息打分
3.计算分值,计算公式(待补充)


二、例子说明

1.例子1

句子:仲裁申请的资料需要哪些
语义依存关系:
语义依存关系图
关键信息提取:
仲裁==>资料(疑问)

句子:申请仲裁需要提供什么资料
语义依存关系:
语义依存关系图
关键信息提取:
仲裁==>资料(疑问)

2.例子2

句子:你的名字是啥?
语义依存关系:
语义依存关系图
关键信息提取:
你==>名字(疑问)

句子:你叫什么?
语义依存关系:
语义依存关系图
关键信息提取:
你==>名字(疑问)

句子:请问一下你的姓名是什么
语义依存关系:
语义依存关系图
关键信息提取:
你==>姓名(疑问)

句子:你的猫叫什么名字?
语义依存关系:
基于语义依存关系的相似度算法简述_第1张图片
关键信息提取:
猫==>名字(疑问)

3.关键信息抽取信息规则

待补充

4.相似度评分标准

1.主语、宾语设为第1档
2.状语设为第2档(时间、地点、原因、介宾等)
3.谓语设为第3档
4.主语、宾语的修饰关系设为第4档


三、上下文的相似度

上下文关联:
例子:
1.什么是仲裁
关键信息提取:仲裁

2.申请仲裁需要提供哪些资料
关键信息提取:仲裁、资料(疑问)

若是问题变为:
问1:什么是仲裁?
答1:仲裁是xx
问2:需要提供哪些资料

简要过程:
“问2”抽取:资料(疑问)
查找关键信息时找到了“申请仲裁需要提供哪些资料”,但缺少“仲裁”
正好可以从“问1”中补齐关键信息
这样就能算出“需要提供哪些资料”与“申请仲裁需要提供哪些资料”的相似度非常高


四、说明

语义依存关系标注方法采用哈工大的语法依存关系,网址:http://www.ltp-cloud.com/intro/#dp_how
词义为哈工大的同义词林(扩展版)

你可能感兴趣的:(自然语言处理,相似度算法)