知识图谱实战(四)

知识图谱实战(四)_第1张图片
知识图谱实战(四)_第2张图片
交叉确认集是从训练集中抽取一部分用来调整模型参数
知识图谱实战(四)_第3张图片
知识图谱实战(四)_第4张图片
模型构建的时候一定要选用跟模型相匹配的数据
知识图谱实战(四)_第5张图片
知识图谱实战(四)_第6张图片
其中,未登录词是指当下出现的新词,未纳入词典中的词
知识图谱实战(四)_第7张图片
知识图谱实战(四)_第8张图片
例如:X为电影 ,Y为院,通过公式计算X与Y的凝聚程度,较大则为一个词,反之不是
知识图谱实战(四)_第9张图片
知识图谱实战(四)_第10张图片
知识图谱实战(四)_第11张图片
一般采用默认模式(精确模式),不采用全模式,
精确模式:会将这句话中的词进行切割,
全模式:只要是单词就会显示
知识图谱实战(四)_第12张图片
知识图谱实战(四)_第13张图片
知识图谱实战(四)_第14张图片
知识图谱实战(四)_第15张图片
IDF的作用就是为了凸显出在文章当中出现的在其他文章当中出现频率较小的词的重要性
知识图谱实战(四)_第16张图片
知识图谱实战(四)_第17张图片
运行结果:
知识图谱实战(四)_第18张图片
知识图谱实战(四)_第19张图片
知识图谱实战(四)_第20张图片
在这里插入图片描述
知识图谱实战(四)_第21张图片
知识图谱实战(四)_第22张图片
词向量的优势就是把离散表示转化成了连续表示
知识图谱实战(四)_第23张图片
知识图谱实战(四)_第24张图片
知识图谱实战(四)_第25张图片
知识图谱实战(四)_第26张图片
知识图谱实战(四)_第27张图片
知识图谱实战(四)_第28张图片
知识图谱实战(四)_第29张图片
在这里插入图片描述
![在这里插入图片描述](https://img-blog.csdnimg.cn/20200715230815414.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80NTgxMTcxMw==,size_16,color_FFFFFF,t
知识图谱实战(四)_第30张图片
知识图谱实战(四)_第31张图片
RNN属于强分裂器,经常会过拟合。
知识图谱实战(四)_第32张图片
知识图谱实战(四)_第33张图片
知识图谱实战(四)_第34张图片
知识图谱实战(四)_第35张图片
知识图谱实战(四)_第36张图片
注意力机制能够让翻译的关键词语对应起来,权重较高,翻译的更加精准。通常名词的注意力机制权重较高。

你可能感兴趣的:(知识图谱实战)