word2vec

Corpus

zh_cn

搜狗语料库:ftp://ftp.labs.sogou.com/Data/SogouCS/SogouCS.tar.gz
中文维基百科语料库:https://dumps.wikimedia.org/zhwiki/latest/zhwiki-latest-pages-articles.xml.bz2

en

英文维基百科语料库:https://dumps.wikimedia.org/enwiki/latest/enwiki-latest-pages-articles.xml.bz2(历史版本)

参考文献

中英文维基百科语料上的Word2Vec实验
利用中文数据跑Google开源项目word2vec - hebin

你可能感兴趣的:(深度学习)