word2vec 中的数学原理详解:基于 Negative Sampling 的CBOW和Skip-gram模型

     
    word2vec 是 Google 于 2013 年开源推出的一个用于获取 word vector 的工具包,它简单、高效,因此引起了很多人的关注。由于 word2vec 的作者 Tomas Mikolov 在两篇相关的论文 [3,4] 中并没有谈及太多算法细节,因而在一定程度上增加了这个工具包的神秘感。一些按捺不住的人于是选择了通过解剖源代码的方式来一窥究竟,出于好奇,我也成为了他们中的一员。读完代码后,觉得收获颇多,整理成文,给有需要的朋友参考。

 
  


相关链接


(一)目录和前言

(二)预备知识

(三)背景知识

(四)基于 Hierarchical Softmax 的模型

(五)基于 Negative Sampling 的模型

(六)若干源码细节

word2vec 中的数学原理详解:基于 Negative Sampling 的CBOW和Skip-gram模型_第1张图片word2vec 中的数学原理详解:基于 Negative Sampling 的CBOW和Skip-gram模型_第2张图片word2vec 中的数学原理详解:基于 Negative Sampling 的CBOW和Skip-gram模型_第3张图片word2vec 中的数学原理详解:基于 Negative Sampling 的CBOW和Skip-gram模型_第4张图片word2vec 中的数学原理详解:基于 Negative Sampling 的CBOW和Skip-gram模型_第5张图片word2vec 中的数学原理详解:基于 Negative Sampling 的CBOW和Skip-gram模型_第6张图片word2vec 中的数学原理详解:基于 Negative Sampling 的CBOW和Skip-gram模型_第7张图片word2vec 中的数学原理详解:基于 Negative Sampling 的CBOW和Skip-gram模型_第8张图片word2vec 中的数学原理详解:基于 Negative Sampling 的CBOW和Skip-gram模型_第9张图片


word2vec 中的数学原理详解:基于 Negative Sampling 的CBOW和Skip-gram模型_第10张图片word2vec 中的数学原理详解:基于 Negative Sampling 的CBOW和Skip-gram模型_第11张图片


原文作者: peghoty 

原文出处出处: http://blog.csdn.net/itplus/article/details/37998797

欢迎关注公众号学习自然语言处理技术

word2vec 中的数学原理详解:基于 Negative Sampling 的CBOW和Skip-gram模型_第12张图片


你可能感兴趣的:(自然语言处理,自然语言处理技术)