deeplearn学习笔记 cs224n lecture2

WordNet

单词用不相关的符号组成

Word2Vec 概述

L(θ)J(θ) L ( θ ) 和 J ( θ ) 的定义

L(θ) L ( θ ) likelihood

J(θ) J ( θ ) loss function

Center word

Context word

Prediction function

Train the model

Word2vec更多细节

为什么用两个变量 更容易优化 可以取平均

两个模型变型

Skip-grams(SG)

Continuous Bag of Words(CBOW)

梯度下降

随机梯度下降算法

你可能感兴趣的:(deeolearning学习)