镰刀韭菜

【AI理论学习】理解词向量、CBOW与Skip-Gram模型

理解词向量、CBOW与Skip-Gram

词向量基础知识
- One-hot表示
- Distributed表示
word2vec基础知识
- CBOW和Skip-gram
霍夫曼树
基于Hierarchical Softmax的 CBOW 模型和 Skip-gram 模型
- CBOW 模型
- - 基本结构
  - 目标函数
  - 梯度计算
- Skip-gram 模型
- - 基本结构
  - 梯度计算
- 小结
基于Negative Sampling 的 CBOW 模型和 Skip-gram 模型
- 负采样算法
- CBOW模型
- Skip-gram模型
参考资料

由于计算机不能直接对各种字符进行运算，为此需要将词的表示进行一些转换。因此，在自然语言处理中，通常需要对输入的语料进行一些预处理：

其中，如何对词汇进行表示是很关键的问题，糟糕的表示方法容易导致所谓的 “Garbage in, garbage out”。

词向量基础知识

对词汇的表示，常见的有One-hot represention 和 Distributed Representation 两种形式。

One-hot表示

One-hot represention 将词汇用二进制向量表示，这个向量表示的词汇，仅仅在词汇表中的索引位置处为1，其他地方都为0。例子如下图所示：

这样的方式表示词汇虽然简单，但是也有如下缺点：

单词的上下文丢失了。
没有考虑频率信息。
词汇量大的情况下，向量维度高且稀疏，占用内存。

Distributed表示

Distributed Representation 也可以理解为Word Embedding，具体形式为：

注意到，使用Word Embedding得到的向量维度远小于词汇表的个数。如果将上面的向量在空间中表示，可以得到：

上图告诉我们，通过词向量之间的距离可以度量他们之间的关系，意思相近的词在空间中的距离比较近。出现这种现象的原因是最后得到的词向量在训练过程中学习到了词的上下文。

那么，Distributed Representation 要如何得到？

使用神经网络语言模型可以得到；
使用word2vec。

word2vec基础知识

word2vec是google在2013年推出的一个NLP工具，它的特点是将所有的词向量化，这样词与词之间就可以定量的去度量他们之间的关系，挖掘词之间的联系。在正式讲解 word2vec 前，还需要对一些基本概念有所了解。

CBOW和Skip-gram

CBOW模型（Continuous Bag-of-Words Model）和Skip-gram模型（Continuous Skip-gram Model）。如下图所示：

由图可见，两个模型都包含三层：输入层、投影层和输出层。前者是在已知当前词 $w_t$ 的上下文 $w_{t-2},w_{t-1},w_{t+1},w_{t+2}$ 的前提下预测当前词 $w_t$ （CBOW模型）；而Skip-gram模型则恰恰相反，是在已知当前词 $w_t$ 的前提下，预测其上下文 $w_{t-2},w_{t-1},w_{t+1},w_{t+2}$ 。

霍夫曼树

一般情况下，词汇表中词汇的数量是非常多的，如果用传统的DNN+Softmax的方式来训练词向量，计算量太大了。于是，word2vec 使用的数据结构是用霍夫曼树来代替隐藏层和输出层的神经元。霍夫曼树的叶子节点起到输出层神经元的作用，叶子节点的个数即为词汇表的小大，而内部节点则起到隐藏层神经元的作用。这里首先需要了解下霍夫曼树。
从实际的例子出发，看看如何构造霍夫曼树：
假设有(a,b,c,d,e,f)共6个词汇，词汇的权值用词频表示： $w_a=16,w_b=4,w_c=8,w_d=6,w_e=20,w_f=3$ ，假设这6个词汇是6棵只要根节点的森林集合。于是构造步骤如下：
首先是权值最小的b和f合并，得到的新树，根节点权重是7。将b于f这两个树从列表中删除，并且添加刚刚得到的合并的树。此时森林里共有5棵树，根节点权重分别是16,8,6,20,7。此时根节点权重最小的6,7对应的树合并，得到新子树，依次类推，最终得到下面的霍夫曼树：

如何编码呢？一般对于一个霍夫曼树的节点（根节点除外），可以约定左子树编码为0，右子树编码为1。如上图，则可以得到c的编码是00。
注意，在word2vec中，约定编码方式和上面的例子相反，即约定左子树编码为1，右子树编码为0，同时约定左子树的权重不小于右子树的权重。
那么霍夫曼树有什么好处呢？一般得到霍夫曼树后我们会对叶子节点进行霍夫曼编码，由于权重高的叶子节点越靠近根节点，而权重低的叶子节点会远离根节点。这样我们的高权重节点编码值较短，而低权重值编码值较长。这保证的树的带权路径最短，即我们希望越常用的词拥有更短的编码。

有了上面的基础知识，就可以对word2vec进行讲解了。相比于用传统的神经网络的方法来训练词向量，于word2vec提出了有两种改进方法：一种是基于 Hierarchical Softmax 算法的，另一种是基于 Negative Sampling 算法的。

基于Hierarchical Softmax的 CBOW 模型和 Skip-gram 模型

CBOW 模型

基本结构

CBOW 模型是在已知当前词 $w_t$ 的上下文 $w_{t-2},w_{t-1},w_{t+1},w_{t+2}$ 的前提下预测当前词 $w_t$ 。后面我们用 $co n t e x t (w)$ 来表示词w的上下文中的词，通常，我们取词w前后2c个单词来组成 $co n t e x t (w)$ 。下图给出了CBOW模型的网络结构：

它包括三层：输入层、投影层、输出层。

输入层：包含 $co n t e x t (w)$ 中的 $2 c$ 个词向量 $\mathbf v(context(w)_1),\mathbf v(context(w)_2),\ldots,\mathbf v(context(w)_{2c}) \in \mathbf R^m$ ，每个词向量的长度是 $m$ 。
投影层：将输入层的2c个词向量累加求和，即 $\mathbf x_w = \sum_{i=1}^{2c}\mathbf v(context(w)_i)$ 。
输出层：输出层是用哈夫曼算法以各词在语料中出现的次数作为权值生成的一颗二叉树，其叶子结点是语料库中的所有词，叶子个数N=|D|，分别对应词典D中的词。

神经网络语言模型(NNLM)中大部分计算集中在隐藏层和输出层之间的矩阵向量运算，以及输出层上的softmax归一化运算，CBOW模型对此进行了改进。与传统的神经网络语言模型相比：

NNLM是简单的讲输入的向量进行拼接，而CBOW模型将上下文的词累加求和作为输入；
NNLM是线性结构，而CBOW是树形结构
NNLM具有隐藏层，而CBOW没有隐藏层

目标函数

假设对于给定的文本，“我”、“喜欢”、“观看”、“巴西”、“足球”、“世界杯”这六个词出现的次数分别为15, 8, 6, 5, 3, 1。于是可以用这些语料构建霍夫曼树，并将其作为CBOW模型的输出层。如下图所示：

注意：与常规的霍夫曼树不同，左子树用1编码，右子树用0编码。

接下来，用 $p^w$ 表示从根结点出发到达 $w$ 对应叶子结点的路径， $l^w$ 表示这个路径中包含结点的个数， $p_{l}^w$ 表示路径 $p^w$ 中的第 $l$ 个结点， $d_j^w$ 表示路径 $p^w$ 中第 $j$ 个结点对应的编码（0或1）， $\theta^w_j$ 表示路径 $p^w$ 中第 $j$ 个非叶子结点对应向量。

我们的目标是利用输入向量 $X_w$ 和霍夫曼树来定义函数 $p (w ∣ co n t e x t (w))$ 。

以图中的词 $w = " 足球 "$ 为例，从霍夫曼树的根结点出发到“足球”，中间经历了4个分支，每一次分支，都可以看成进行了一次二分类。那么从二分类的角度来看，对于每个非叶子结点，就需要为其左右孩子指定类别。我们规定：编码为1的结点定义为负类，编码为0的结点定义为正类。也就是说，将一个结点进行二分类，分到左边是负类，分到右边是正类。所以有：
$Label(p_i^w) = 1- d_i^w, \quad i=1,2,\ldots,l^w$
我们用逻辑斯蒂回归进行二分类，一个结点被分为正类的概率是：
$\sigma(\mathbf x_w^T\theta) = \frac{1}{1+e^{-\mathbf x_w^T\theta}}$
被分成负类的概率为：
$1-\sigma(\mathbf x_w^T\theta)$
这里的 $\theta$ 就是非叶子节点对应的向量，是个待定参数。
所以，从霍夫曼树的根结点出发到“足球”，中间经历了4个二分类，每个分类的结果如下：
第一次： $p(d_2^w|\mathbf x_w,\theta_1^w) = 1- \sigma(\mathbf x_w^T\theta_1^w)$
第二次： $p(d_3^w|\mathbf x_w,\theta_2^w) = \sigma(\mathbf x_w^T\theta_2^w)$
第三次： $p(d_4^w|\mathbf x_w,\theta_3^w) = \sigma(\mathbf x_w^T\theta_3^w)$
第四次： $p(d_5^w|\mathbf x_w,\theta_4^w) = 1- \sigma(\mathbf x_w^T\theta_4^w)$

这四个概率的乘积就是 $p (足球 ∣ co n t e x t (足球))$ ，即：
$\prod_{j=2}^5 p(d_j^w|\mathbf x_w,\theta_{j-1}^w)$

总结：对于词典D中的任意词w, 霍夫曼树中必存在一条从根结点到词w对应结点的路径 $p^w$ (且这条路径是唯一的)。路径 $p^w$ 上存在 $l^w -1l$ 个分支，将每个分支看做一次二分类，每一次分类就产生一个概率，将这些概率乘起来，就是所需的 $p (w ∣ C o n t e x t (w))$ 。

所以条件概率的定义如下：
$\prod_{j=2}^{l^w} p(d_j^w|\mathbf x_w,\theta_{j-1}^w)$

其中：
$p(\mathrm{d}_j^w|\mathrm{x}_w, \theta_{j-1}^w)=\begin{cases}\sigma (\mathrm{x}_w^T\theta_{j-1}^w) & d_j^w=0 \\ 1-\sigma(\mathrm{x}_w^T\theta_{j-1}^w ) & d_j^w=1\end{cases}$

于是整体表达式如下：
$p(d_j^w|\mathbf x_w,\theta_{j-1}^w) = [\sigma(\mathbf x_w^T\theta_{j-1}^w)]^{1-d_j^w}\cdot[1-\sigma(\mathbf x_w^T\theta_{j-1}^w)]^{d_j^w}$

所以我们的优化目标是：

其中： $({1-d_j^w})\log[\sigma(\mathbf x_w^T\theta_{j-1}^w)]+d_j^w\log[1-\sigma(\mathbf x_w^T\theta_{j-1}^w)]$
这就是CBOW的目标函数。

梯度计算

采用随机梯度上升法将这个函数最大化。
注意：随机梯度上升法：随机取一个样本 $(co n t e x t (w), w)$ ，对目标函数中的所有的参数行一次更新。
（1）更新 $\theta_{j-1}^w$

（2）更新 $\mathrm{x}_w$
因为 $\mathcal L(w,j)$ 关于变量 $\mathbf x_w$ 和 $\theta_{j-1}^w$ 是对称的。所以：
$\frac{\partial \mathcal{L}(w,j)}{\partial \mathrm{x}_w}=[1-d_j^w-\sigma (\mathrm{x}_w^T\theta_{j-1}^w)]\theta_{j-1}^w$
这里存在一个问题：我们的最终目的是要求词典D中每个词的词向量，而这里的 $\mathbf x_w$ 表示的是 $co n t e x t (w)$ 各词词向量的累加。那么，如何利用 $\frac{\partial \mathcal L(w,j)}{\partial \mathbf x_w}$ 来对 $\mathbf v(w),w \in D$ 进行更新呢? word2vec中的做法很简单，直接取
$\mathbf v(w) := \mathbf v(w) + \eta \sum_{j=2}^{l^w} \frac{\partial \mathcal L(w,j)}{\partial \mathbf x_w},\quad w \in context(w)$

注：既然 $\mathbf x_w$ 本身就是 $co n t e x t (w)$ 中各个词向量的累加，求完梯度后也应该将其贡献到每个分量上。

下面是CBOW模型中采用的随机梯度上升法伪代码：

Skip-gram 模型

基本结构

Skip-gram 模型的结构也是三层，下面以样本 $(w, co n t e x t (w))$ 为例说明。如下图所示

它也包括三层：输入层、投影层、输出层。

输入层：只包含当前样本中心词 $w$ 词向量 $\mathbf v(w) \in \mathbf R^m$ ，每个词向量的长度是 $m$ 。
投影层：恒等投影，即和输入层一样，保留是为了与CBOW对比。
输出层：与CBOW类似

对于Skip-gram模型，已知的是当前词 $w$ ，需要对其上下文 $co n t e x t (w)$ 中的词进行预测，所以：
$\prod_{u \in context(w)} p(u|w)$
类似于CBOW，所以：
$\prod_{j=2}^{l^u}p(d_j^u|\mathbf v(w),\theta_{j-1}^u)$
其中：
$p(d_j^u|\mathbf v(w),\theta_{j-1}^u) = [\sigma(\mathbf v(w)^T\theta_{j-1}^u)]^{1-d_j^u}\cdot[1-\sigma(\mathbf v(w)^T\theta_{j-1}^u)]^{d_j^u}$
所以我们的优化目标是：

采用随机梯度上升法将这个函数最大化。

梯度计算

（1）更新 $\theta_{j-1}^w$

（2）更新 $\mathrm{v}(w)$
因为 $\mathcal L(w,u,j)$ 关于变量 $\mathbf v(w)$ 和 $\theta_{j-1}^w$ 是对称的。所以：
$\frac{\partial \mathcal{L}(w,u,j)}{\partial \mathrm{v}(w)}=[1-d_j^u-\sigma (\mathrm{v}(w)^T\theta_{j-1}^u)]\theta_{j-1}^u$
所以， $\mathbf v(w)$ 更新公式为：
$\mathbf v(w) := \mathbf v(w) + \eta \sum_{u \in context(w)} \sum_{j=2}^{l^w} \frac{\partial \mathcal L(w,u,j)}{\partial \mathbf v(w)},\quad w \in context(w)$
具体伪代码如下：

与 CBOW 相比，最大的区别是多个了外层循环。

小结

使用霍夫曼树来代替传统的神经网络，避免了从隐藏层到输出的softmax层这里的计算，也避免计算所有词的softmax概率。但是如果我们的训练样本里的中心词w是一个很生僻的词，那么就得在霍夫曼树中辛苦的向下走很久了。解决这个问题则是采用基于Negative Sampling的模型。

基于Negative Sampling 的 CBOW 模型和 Skip-gram 模型

Negative Sampling是这么一种求解word2vec模型的方法，它摒弃了霍夫曼树，采用了Negative Sampling（负采样）的方法来求解。

负采样算法

在CBOW模型中，已知词w的上下文 $co n t e x t (w)$ 需要预测w。因此，对于给定的 $co n t e x t (w)$ ，词w就是一个正样本，其它词就是负样本了。在Skip-gram中同样也存在正负样本问题。负样本那么多，该如何选取呢？这就是Negative Sampling（负采样，简称NEG）问题。也就是对于给定的词，如何生成其负样本子集 $NEG (w)$ ？

采用的基本要求是：词典D中的词在语料C中出现的次数有高有低，对于那些高频词，被选为负样本的概率就应该比较大，反之，对于那些低频词，其被选中的概率就应该比较小。本质上就是一个带权采样问题。
先用一段通俗的描述来帮助理解带权采样的机理：

word2vec中的具体做法。记 $l_0=0,l_k=\sum_{j=1}^k len(w_j), k=1,2,...,N$ ，这里 $w_j$ 表示词典 $D$ 中的第 $j$ 个词，则以 ${l_j\}_{j=0}^N$ 为剖分节点可以得到区间[0,1]上的一个非等距剖分， $I_i=(l_{i-1},l_i], i=1,2,...,N$ 为其N个剖分区间。进一步引入区间[0,1]上的等距剖分，剖分节点为 ${m_j\}_{j=0}^M$ ，其中 $M >> N$ ，具体如下图所示：

将内部剖分节点 ${m_j\}_{j=1}^{M-1}$ 投影到非等距剖分上，如上图中红色虚线所示，则可建立 ${m_i\}_{j=1}^{M-1}$ 与区间 ${I_j\}_{j=1}^N$ （或者说 ${w_j\}_{j=1}^N$ ）的映射关系
$Table(i)=w_k, \text{ where } m_i\in I_k, i=1,2,...,M-1$
有了这个映射，采样就简单了：每次生成一个 $[1, M - 1]$ 间的随机整数 $r$ ，Table®就是一个样本。当然，还有一个细节，当对 $w_i$ 进行负采样时，如果碰巧选到了 $w_i$ 自己怎么办？那就跳过。
注意，word2vec源码中为词典 $D$ 中的词设置权值时，不是直接用counter(w)，而是对其作了 $\alpha$ 次幂，其中 $\alpha = \frac{3}{4}$ ，即上述公式变为 $len(w)=\frac{[counter(w)]^{\frac{3}{4}}}{\sum_{u\in D}[counter(u)]^{\frac{3}{4}}}$
此外，代码中取 $M=10^8$ ，而映射则是通过一个名为InitUnigramTable函数完成的。

CBOW模型

假定现在已经选好了一个关于w的负采样子集 $NEG(w)\ne \oslash$ 。且对 $\forall \tilde{w}\in D$ ，定义
$L^w(\tilde w)\begin{cases} 1 & \tilde{w} = w\\ 0 & \tilde{w} \ne w \end{cases}$
表示词 $\tilde{w}$ 的标签，即正样本的标签为1，负样本的标签为0.
对于一个给定的正样本 $(co n t e x t (w), w)$ ，希望最大化：
$\prod_{u \in {w} \cup NEG(w) }P(u|context(w))$
其中：
$p(u|context(w))=\begin{cases}\sigma(\mathrm{x}_w^T\theta^u) & L^w(x)=1 \\1-\sigma(\mathrm{x}_w^T\theta^u) & L^w(x)=0 \end{cases}$
写成整体表达式：
$[\sigma(\mathbf x_w^T\theta^u)]^{L^w( u )} \cdot [1-\sigma(\mathbf x_w^T\theta^u)]^{1- L^w( u )}$
这里的 $\mathbf x_w$ 是各词向量之和。 $\theta^u$ 表示词对应的一个(辅助)向量，是个待训练参数。
所以，最终 $g (w)$ 的表达式如下：
$\sigma(\mathbf x_w^T\theta^w) \prod_{u \in NEG(w) } [1-\sigma(\mathbf x_w^T\theta^u) ]$
其中 $\sigma(\mathbf x_w^T\theta^w)$ 表示当上下文为 $co n t ec x t (w)$ 时，预测中心词为w的概率；而 $\sigma(\mathbf x_w^T\theta^u)$ ，预测中心词为 $u$ 的概率。

从形式上看，最大化 $g (w)$ , 相当于：增大正样本的概率同时降低负样本的概率。所以，给定预料库C，函数：
$\prod_{w \in C} g(w)$
可以作为整体的优化目标。为了计算方便可以对G取对数。

接下来利用随机梯度上升对参数进行优化。关键是要给出 $\mathcal{L}$ 的两类梯度。
（1）更新 $\theta^u$ ：

（2）更新 $\mathrm{x}_w$

下面以样本 $(co n t e x t (w), w)$ 为例，给出基于Negative Sampling的CBOW模型中采用随机梯度上升法更新各参数的伪代码：

Skip-gram模型

Skip-gram模型与CBOW模型的负采样模型推到过程相似。
对Skip-gram模型而言，正常来说，应该是要使用词 $w$ 来预测上下文中的词汇 $co n t e x t (w)$ ，但是在word2vec 的源码中，本质上还是用了CBOW的思想，将上下文 $co n t e x t (w)$ 拆成一个个词来考虑，也就是说期望最大化的式子为：
$\prod_{\tilde w \in Contex(w)}\;\prod_{u \in \{w\} \cup NEG^{\;\tilde w}(w) }P(u| \tilde w)$
其中， $NEG^{\;\tilde w}(w)$ 表示对上下文中词 $\tilde w$ 的采样。基于上面的目标，用上文类似的推导过程，可以得到下面的算法。

下面简单的给出随机梯度上升更新参数的伪代码：

参考资料

[1] word2vec 中的数学原理详解
[2] word2vec模型
[3] 基于Hierarchical Softmax的 CBOW 模型和 Skip-gram 模型

2021-09-12 姗姗_52f9
《对来访者对咨询师真的重要起来》刘姗姗中原焦点团队坚持分享第1504天第167次咨询约练观察员不管是心理咨询还是心理治疗，终究是围绕“人”进行工作的，与来访者建立良好的关系，不是简单几句空话就能成立的，咨询师需要展现出人情味，真正地与来访者站在一起。一个懂很多技术的咨询师，并不一定能切实地帮到来访者。如果咨询师永远与对面的人保持距离，能够完全地隔离自己的情绪感受，不受来访者的分毫影响，我觉得这不叫
专属私有云满足密评要求啥意思？密评是什么？为什么专有云需要进行密评？到底那些系统需要密评？文章永久免费只为良心数据库
“专属私有云满足密评要求”指该私有云平台的设计、技术实现及运维管理，全面符合国家《信息安全技术信息系统密码应用基本要求》（GB/T39786-2021）等法规的密码安全标准，通过权威机构评测（如等保三级、密评三级），确保数据全链路安全可控。以下是具体解析：一、密评的核心要求与专属私有云的适配性密评（商用密码应用安全性评估）是国家密码管理局对信息系统密码应用合规性的强制性检测，重点评估以下方面：密码
推荐一个免费高速图床imgos.cn 爱睡觉的猪猪网络
imgos.cn图床推荐：重新定义高效图片托管体验在数字化内容创作中，图片管理的高效性直接影响创作体验。作为深耕行业多年的技术团队，我们推出的imgos.cn图床，以极致的稳定性、便捷性和功能性，成为内容创作的最佳拍档。以下从核心优势、场景适配、用户权益等维度展开解析，助您快速了解为何imgos.cn值得成为首选图床。一、核心优势：重新定义图片托管体验1.极速稳定，全球畅享CDN加速网络：采用分布
【软考速通笔记】系统架构设计师⑱——大数据架构设计理论与实践小康师兄系统架构设计师笔记系统架构大数据 Lanbda Kappa 数据湖批处理
文章目录一、前言二、传统数据库遇到的问题2.1问题的根源2.2传统解决方法三、大数据基础3.1大数据处理技术3.2大数据利用过程3.3大数据处理系统面临的挑战3.4大数据具有的属性和特征四、Lanbda架构4.1批处理层4.2加速层4.3服务层五、Kappa架构5.1实时层5.2服务层六、Lambda和Kappa对比七、其他一、前言笔记目录大纲请查阅：【软考速通笔记】系统架构设计师——导读关注【小
Here-Document的`＜＜` 与 `＜＜-` 与 `＜＜＜` 多解说笔记250722 kfepiza #Linux #控制台命令行 Shell bash cmd 等笔记 linux bash
Here-Document的poem.txt静夜思床前明月光疑是地上霜FORMATTED#2.空格敏感的配置catconfig.ymlindentation:level:4#必须4空格SPACE何时用tabs.txt重要制表符:→这里Tab会被保留但行首Tab会被移除TABS#2.空格缩进的环境#（如Python脚本）技术原理图解HereDocumentquery.sqlSELECT*FROM${
如何选择数据库？从真实案例看 PostgreSQL 与 MySQL 的优劣权衡
关系型数据库是几乎所有互联网应用的基础。在众多开源选项中，PostgreSQL和MySQL是最常被拿来对比的一对“老对手”。虽然它们都讲SQL，但在设计哲学、性能表现和功能特性上差异明显。本篇文章结合了包括Uber在内的实际案例、AI辅助建模的开发经验，并推荐一些实际工具，帮助开发者更清晰地做出技术选型。为什么数据库选型至关重要？数据库并不是“越强越好”，关键在于是否匹配你项目的业务模型、数据访问
数字人系统：AI界的超级巨星，你准备好了吗？优秘智能UMI 数字人人工智能深度学习计算机视觉机器学习自然语言处理语言模型图像处理
在这个日新月异的科技时代，每一个创新的火花都可能点燃一场变革的燎原之火。今天，我们要聊的，正是那颗在AI领域熠熠生辉的璀璨新星——优秘数字人系统。它不仅仅是技术的飞跃，更是对未来生活方式的深刻重塑，一场关于人机交互、智能共生的美好预演。技术原理：深度解析与智能构建的奥秘1.深度学习：智能的基石数字人系统的核心技术之一在于深度学习。深度学习是一种模仿人脑神经网络结构和功能的机器学习技术，通过构建多层
从技术原理到应用场景：优秘AI数字人如何重构虚拟交互逻辑
在数字化浪潮的推动下，虚拟交互已经成为我们生活中不可或缺的一部分。无论是与智能音箱对话、通过虚拟助手处理日常事务，还是在元宇宙中与虚拟角色互动，人类对更自然、更高效的交互体验的需求日益增长。然而，现有的交互方式仍然存在诸多痛点：效率低下、理解能力有限、情感表达缺失……如何突破这些技术瓶颈？优秘AI数字人凭借其领先的技术和创新的应用场景，正在重构虚拟交互的逻辑。本文将从技术原理到应用场景，全面解析优
普通人想利用AI变现，这5个赛道不能错过！浮沉导师
随着人工智能技术的迅猛发展，越来越多的普通人开始关注如何利用AI实现变现。AI不仅改变了我们的工作方式，也创造了众多赚钱的机会。本文将介绍五个值得关注的AI赛道，帮助你抓住这些机会，实现收入增长。【高省】APP网购优惠券免费领，分享还能赚钱。【高省】是一个自用省钱佣金高，分享推广赚钱多的平台。佣金更高，模式更好，终端用户不流失。0投资，稳定可靠，百度有几百万篇报道，期待你的加入。应用市场下载【高省
Python爬虫教程：抓取地方政府网站的公开文件与政策信息 Python爬虫项目 python 爬虫开发语言数据分析 mysql
1.引言在信息化时代，政府网站已成为信息公开的重要渠道。各级地方政府网站上发布的政策、公告和公开文件，通常包含了政府决策、法律法规等关键信息。爬取这些公开数据，可以为研究人员、政策分析师、企业决策者等提供有价值的数据支持。本文将通过Python爬虫技术，展示如何抓取地方政府网站上的公开文件、政策等信息。我们将使用最新的爬虫技术，如requests、BeautifulSoup、Selenium等工具
AI人工智能 Agent：金融投资中智能体的应用 AI天才研究院 AI大模型企业级应用开发实战 AI大模型应用入门实战与进阶 AI人工智能与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
AI人工智能Agent：金融投资中智能体的应用1.背景介绍在金融投资领域，人工智能（AI）技术的应用已经成为一种趋势。随着数据量的爆炸性增长和计算能力的提升，AI技术在金融市场中的应用变得越来越广泛和深入。智能体（Agent）作为AI技术的重要组成部分，能够在金融投资中发挥重要作用。智能体可以通过学习和适应市场环境，自动执行交易策略，优化投资组合，甚至预测市场趋势。2.核心概念与联系2.1智能体（
AES加密算法简要介绍 ° 安如少年初如梦662 Java学习记录后端前端
前言项目中需要在接口中添加加密，简单了解关于AES的有关知识，低质低创见谅。什么是AESAES（AdvancedEncryptionStandard，高级加密标准）是一种对称加密算法，被广泛应用于数据加密领域。它是由美国国家标准与技术研究院（NIST）于2001年发布，作为一种公开标准，用于保护电子数据的安全。值得一提的是微信小程序的加密传输就是用这个加密算法基本原理和加解密过程由于站内有很详细，
59、代码漂移与突变：技术与社会的交织 potato 代码漂移：数字时代的批判性思考代码漂移代码突变技术变革
代码漂移与突变：技术与社会的交织1.引言在当今快速发展的数字时代，技术的进步不仅改变了我们的生活方式，还深刻影响了社会结构和文化形态。代码漂移（CodeDrift）作为一种技术和社会现象，揭示了数字世界中随机性和不可预测的变化。本文将探讨代码漂移与突变之间的关系，分析其对技术和社会的影响，并通过具体案例研究，展示代码突变如何在实际应用中产生重大变化。2.代码漂移的定义代码漂移是指在软件开发和数字文
诗意与技术交织的奇妙世界酒城译痴无心剑酒城译痴诗词乐园无心剑技术诗意
诗意与技术交织的奇妙世界在CSDN的浩瀚星空中，有这样一座独特的岛屿，它属于酒城译痴无心剑。这是一个充满诗意与智慧的世界，是无心剑用文字精心构筑的精神家园。无心剑是酒城泸州人，毕业于南京大学，基础数学专业，拥有国家三级笔译证书。他在高职院校任教，讲授数学与编程课程，却在诗词翻译的道路上一往情深。过去二十余年，他翻译了两三千首诗词，形成了独特的译诗风格。他的部分译作在《新东方英语》、《九月诗刊》、《
对话谷歌前 CEO Eric Schmidt：数字超智能将在十年内到来，AI 将创造更多更高薪的工作 AI科技大本营人工智能
责编|王启隆出品|CSDN（ID：CSDNnews）投稿或寻求报道|[email protected]科技巨擘、谷歌前CEOEricSchmidt最近做客PeterDiamandis的Moonshots播客，与主持人PeterDiamandis及DaveLondon展开了一场关于人工智能未来的深度对话。全世界都在为AI的飞速发展感到兴奋又焦虑时，这位曾经执掌谷歌帝国长达十年、亲眼见证并推动了这场技术
AI周报：技术面试卷出新高度，Agent落地开启“工具觉醒”时代哪小吒圈子人工智能语言模型
一句话暴论：当面试官要求手搓FP16精度时，真正的考题是“你能否在硅基文明觉醒前跟上进化速度”。一、面试地狱难度实录（开发者生存指南）百度二面手搓FP16精度：考的不是浮点数，而是对硬件底层的敬畏（原文）腾讯夺命11连问：混元大模型面试暴露行业真相——懂原理已不够，得会调参、训推、修故障的“全栈炼丹师”（解析)NVIDIA四轮拷打实录：GPU厂面试竟考Attention优化！LightingAtt
聚焦基础研究突破，北电数智联合复旦大学等团队提出“AI安全”DDPA方法入选ICML CSDN资讯人工智能安全数据要素大数据
近日，由北电数智首席科学家窦德景教授牵头，联合复旦大学和美国奥本大学等科研团队共同研发，提出一种DDPA（DynamicDelayedPoisoningAttack）新型对抗性攻击方法，为机器学习领域的安全研究提供新视角与工具，相关论文已被国际机器学习大会（ICML2025）收录。ICML由国际机器学习学会（IMLS）主办，聚焦深度学习、强化学习、自然语言处理等机器学习前沿方向，是机器学习与人工智
不想打工日收入超1000元，这两个生意小本经营，在小县城也能开展氧惠好项目
当然，那些拥有学历或技术才能的人通常会选择在大城市寻求发展，其中一些人能够在大城市中实现年薪数十万甚至百万。然而，对于每个人而言，对生活的追求是多样的，特别是对于那些普通人来说，他们可能没有高学历或特殊技能，所以对于收入的期望并不高，只希望有一份比打工轻松且收入略高的工作就足够了。那么在小城市，尤其是一些小县城中，现在还有没有适合我们普通人的赚钱商机呢？答案是肯定的，但这些商机通常不属于高收入行业
Docker原理 Namespace
Docker是一个开源的容器化平台，使用了多种Linux内核特性来实现隔离和资源管理。其中，Namespace（命名空间）是Docker实现进程隔离的核心技术之一。Namespace提供了对操作系统资源的视图隔离，使得容器内的进程以为它们独占了系统资源。本文将详细介绍Docker的Namespace机制。一、Namespace概述Namespace是Linux内核的一项关键技术，用于隔离不同进程的
商汤科技视觉算法面试30问全景精解
商汤科技视觉算法面试30问全景精解——AI赋能×智能视觉×产业创新：商汤科技视觉算法面试核心考点全览前言商汤科技（SenseTime）作为全球领先的人工智能平台公司，专注于计算机视觉、深度学习和智慧城市、智能汽车、智能医疗等领域，推动人脸识别、目标检测、视频分析、自动驾驶等前沿技术的产业化落地。商汤视觉算法岗位面试不仅考察候选人对视觉基础理论的扎实掌握，更关注其在大规模安防、自动驾驶、智慧医疗等复
旷视科技视觉算法面试30问全景精解机＿长科技算法面试深度学习 YOLO
旷视科技视觉算法面试30问全景精解——AI赋能×智能安防×视觉创新：旷视科技视觉算法面试核心考点全览前言旷视科技（Megvii）作为全球领先的人工智能公司，专注于计算机视觉、深度学习和智能安防等领域，推动人脸识别、目标检测、视频分析、工业视觉等前沿技术的产业化落地。旷视视觉算法岗位面试不仅考察候选人对视觉基础理论的扎实掌握，更关注其在大规模安防、工业检测、智慧城市等复杂场景下的创新与工程能力。本文
Netty技术全解析：MessageToMessageDecoder类深度解析码到三十五 netty解析 java go 微服务
❃博主首页：「码到三十五」，同名公众号:「码到三十五」，wx号:「liwu0213」☠博主专栏：♝博主的话：搬的每块砖，皆为峰峦之基；公众号搜索「码到三十五」关注这个爱发技术干货的coder，一起筑基在Netty这个高性能的网络编程框架中，MessageToMessageDecoder类是一个关键的组件，它主要用于处理基于消息的解码。与直接处理字节流的解码器不同，MessageToMessageD
BI工具多数据源融合：跨系统分析解决方案大数据洞察大数据与AI人工智能大数据AI应用 ai
BI工具多数据源融合：跨系统分析解决方案关键词：BI工具,多数据源融合,数据集成,ETL/ELT,数据治理,跨系统分析,数据模型摘要：在企业数字化转型的浪潮中，业务数据往往分散在CRM、ERP、Excel表格、API接口等数十个甚至上百个独立系统中，形成"数据孤岛"。这些"孤岛"就像一个个互不连通的池塘，单独看只能看到局部的鱼群，却无法知道整片水域的生态。BI工具多数据源融合技术，正是搭建连接这些
蔚来汽车视觉算法面试30问全景精解
蔚来汽车视觉算法面试30问全景精解——智能电动×高阶辅助驾驶×视觉创新：蔚来汽车视觉算法面试核心考点全览前言蔚来汽车作为全球领先的智能电动汽车品牌，致力于通过AI与高阶辅助驾驶技术推动智能出行的未来。蔚来视觉算法团队专注于自动驾驶感知、智能座舱、车路协同、3D重建等领域，强调算法的工程落地、系统安全与创新突破。蔚来视觉算法岗位面试不仅考察候选人对视觉基础理论的扎实掌握，更关注其在自动驾驶、智能感知
深入解析Hadoop中的推测执行：原理、算法与策略码字的字节 hadoop布道师 hadoop 算法推测执行
Hadoop推测执行概述在分布式计算环境中，任务执行速度的不均衡是一个普遍存在的挑战。Hadoop作为主流的大数据处理框架，通过引入推测执行（SpeculativeExecution）机制有效缓解了这一问题。该技术本质上是一种乐观的容错策略，当系统检测到某些任务执行明显落后于预期进度时，会自动在其它计算节点上启动相同任务的冗余副本，最终选择最先完成的任务结果作为输出。核心设计动机推测执行的诞生源于
分布式光伏后期添加群调群控装置方案
对于当下，光伏发电项目也是很多，这样直接对电网造成了一些不利影响，为此，很多时候电力公司要求对电站进行控制，包括有功和无功。对于大的集中电站，需要AGC/AVC设备。但是对于小的分布式光伏发电来讲，需要满足技术要求的同时，还要控制好成本。为此引入了群调群控装置，也成为多合一终端。在分布式光伏电站安装部署一台多合一并网通信装置，并通过有线网络与站内智能设备连接。多合一并网通信装置接收到站内智能设备数
Spring AI核心技术面试指南：从大模型集成到生产级部署，9轮深度技术拷问（含架构解析）
面试官：cc程序员，聊聊SpringAI的那些事儿？场景背景互联网大厂AI平台部面试官老周，与自称"SpringAI源码贡献者"的cc程序员展开深度技术探讨。面试过程第一轮：基础架构面试官：SpringAI的架构分层是怎样的？cc：（推眼镜）顶层是Model接口！中间层适配OpenAI/Ollama等实现，底层整合SpringBoot自动配置！@ConfigurationpublicclassOl
Spring Boot 3企业级架构设计：从模块化到高并发实战，9轮技术博弈（含架构演进解析）会写代码的斯皮尔伯格 Java场景面试宝典 Spring Boot 3 企业架构高并发微服务大厂面试
面试官：cc程序员，谈谈SpringBoot3企业级架构设计？场景背景互联网大厂架构委员会面试官老赵，与自称"SpringBoot架构师"的cc程序员展开技术博弈。面试过程第一轮：模块化设计面试官：SpringBoot3的模块化架构有什么改进？cc：（推眼镜）依赖管理更灵活！Starter模块解耦！不过具体模块划分原则我得看官方文档...面试官：如何设计企业级Starter？cc：（自信）通过sp
第二章从管理自我到管理他人（七） LiangL
六种一线经理管理很多从事产品生产的计时工人的工厂领班管理八九个分散工作的销售人员的销售经理管理四名经过严格训练的下属的财务经理管理30名直接下属的呼叫中心经理实验室中负责一个博士研究团队的经理管理几名熟练技术工人的工程部经理，包括电工、水暖工、转配工、木匠。这些管理者都需要：计划工作、分配任务、监督进度、给予反馈、教练辅导、绩效考核、招聘和解雇等。——————————新任一线经理转型不成功，初期迹
时光负了晨夕苏家小妹_6291
回忆大二开学已是秋天，太阳丝毫没有疲惫的样子，依然是夏天时的炎热。林夕坐在阶梯教室里，讲台上民法齐老师枯燥无味的讲着，台下的林夕左手支着脸，右手持着笔在桌子上有一下没一下的敲着，思绪早已飞出教室。。。。。林夕不是一个死板的人，可以享受每天背枯燥无味的法条；她更不是一个什么胸怀祖国法治建设，愿意为此奉献自己美好年华的爱国者。但尽管如此，当初固执如她，高考志愿仍然选择了法学。连自己都想不到理由说服自己
TOMCAT在POST方法提交参数丢失问题 357029540 java tomcat jsp
摘自http://my.oschina.net/luckyi/blog/213209 昨天在解决一个BUG时发现一个奇怪的问题，一个AJAX提交数据在之前都是木有问题的，突然提交出错影响其他处理流程。检查时发现页面处理数据较多，起初以为是提交顺序不正确修改后发现不是由此问题引起。于是删除掉一部分数据进行提交，较少数据能够提交成功。恢复较多数据后跟踪提交FORM DATA ，发现数
在MyEclipse中增加JSP模板删除-2008-08-18 ljy325 jsp xml MyEclipse
在D:\Program Files\MyEclipse 6.0\myeclipse\eclipse\plugins\com.genuitec.eclipse.wizards_6.0.1.zmyeclipse601200710\templates\jsp 目录下找到Jsp.vtl，复制一份，重命名为jsp2.vtl,然后把里面的内容修改为自己想要的格式，保存。然后在 D:\Progr
JavaScript常用验证脚本总结 eksliang JavaScript javaScript表单验证
转载请出自出处：http://eksliang.iteye.com/blog/2098985 下面这些验证脚本，是我在这几年开发中的总结，今天把他放出来，也算是一种分享吧，现在在我的项目中也在用！包括日期验证、比较，非空验证、身份证验证、数值验证、Email验证、电话验证等等...! &nb
微软BI（4） 18289753290 微软BI SSIS
1） Q:查看ssis里面某个控件输出的结果： A MessageBox.Show(Dts.Variables["v_lastTimestamp"].Value.ToString()); 这是我们在包里面定义的变量 2):在关联目的端表的时候如果是一对多的关系，一定要选择唯一的那个键作为关联字段。 3) Q：ssis里面如果将多个数据源的数据插入目的端一
定时对大数据量的表进行分表对数据备份酷的飞上天空大数据量
工作中遇到数据库中一个表的数据量比较大，属于日志表。正常情况下是不会有查询操作的，但如果不进行分表数据太多，执行一条简单sql语句要等好几分钟。。分表工具：linux的shell + mysql自身提供的管理命令原理：使用一个和原表数据结构一样的表，替换原表。 linux shell内容如下： =======================开始
本质的描述与因材施教永夜-极光感想随笔
不管碰到什么事,我都下意识的想去探索本质,找寻一个最形象的描述方式。我坚信,世界上对一件事物的描述和解释,肯定有一种最形象,最贴近本质,最容易让人理解 &
很迷茫。。。随便小屋随笔
小弟我今年研一，也是从事的咱们现在最流行的专业（计算机）。本科三流学校，为了能有个更好的跳板，进入了考研大军，非常有幸能进入研究生的行业（具体学校就不说了，怕把学校的名誉给损了）。先说一下自身的条件，本科专业软件工程。主要学习就是软件开发，几乎和计算机没有什么区别。因为学校本身三流，也就是让老师带着学生学点东西，然后让学生毕业就行了。对专业性的东西了解的非常浅。就那学的语言来说
23种设计模式的意图和适用范围 aijuans 设计模式
Factory Method 意图定义一个用于创建对象的接口，让子类决定实例化哪一个类。Factory Method 使一个类的实例化延迟到其子类。　　适用性当一个类不知道它所必须创建的对象的类的时候。　　当一个类希望由它的子类来指定它所创建的对象的时候。　　当类将创建对象的职责委托给多个帮助子类中的某一个，并且你希望将哪一个帮助子类是代理者这一信息局部化的时候。 Abstr
Java中的synchronized和volatile aoyouzi java volatile synchronized
说到Java的线程同步问题肯定要说到两个关键字synchronized和volatile。说到这两个关键字，又要说道JVM的内存模型。JVM里内存分为main memory和working memory。 Main memory是所有线程共享的，working memory则是线程的工作内存，它保存有部分main memory变量的拷贝，对这些变量的更新直接发生在working memo
js数组的操作和this关键字百合不是茶 js 数组操作 this关键字
js数组的操作; 一:数组的创建: 1、数组的创建 var array = new Array();　//创建一个数组 var array = new Array([size]);　//创建一个数组并指定长度，注意不是上限，是长度 var arrayObj = new Array([element0[, element1[, ...[, elementN]]]
别人的阿里面试感悟 bijian1013 面试分享工作感悟阿里面试
原文如下：http://greemranqq.iteye.com/blog/2007170 一直做企业系统，虽然也自己一直学习技术，但是感觉还是有所欠缺，准备花几个月的时间，把互联网的东西，以及一些基础更加的深入透析，结果这次比较意外，有点突然，下面分享一下感受吧！ &nb
淘宝的测试框架Itest Bill_chen spring maven 框架单元测试 JUnit
Itest测试框架是TaoBao测试部门开发的一套单元测试框架，以Junit4为核心，集合DbUnit、Unitils等主流测试框架，应该算是比较好用的了。近期项目中用了下，有关itest的具体使用如下： 1.在Maven中引入itest框架： <dependency> <groupId>com.taobao.test</groupId&g
【Java多线程二】多路条件解决生产者消费者问题 bit1129 java多线程
package com.tom; import java.util.LinkedList; import java.util.Queue; import java.util.concurrent.ThreadLocalRandom; import java.util.concurrent.locks.Condition; import java.util.concurrent.loc
汉字转拼音pinyin4j 白糖_ pinyin4j
以前在项目中遇到汉字转拼音的情况，于是在网上找到了pinyin4j这个工具包，非常有用，别的不说了，直接下代码： import java.util.HashSet; import java.util.Set; import net.sourceforge.pinyin4j.PinyinHelper; import net.sourceforge.pinyin
org.hibernate.TransactionException: JDBC begin failed解决方案 bozch ssh 数据库异常 DBCP
org.hibernate.TransactionException: JDBC begin failed: at org.hibernate.transaction.JDBCTransaction.begin(JDBCTransaction.java:68) at org.hibernate.impl.SessionImp
java-并查集（Disjoint-set）-将多个集合合并成没有交集的集合 bylijinnan java
import java.util.ArrayList; import java.util.Arrays; import java.util.HashMap; import java.util.HashSet; import java.util.Iterator; import java.util.List; import java.util.Map; import java.ut
Java PrintWriter打印乱码 chenbowen00 java
一个小程序读写文件，发现PrintWriter输出后文件存在乱码，解决办法主要统一输入输出流编码格式。读文件： BufferedReader 从字符输入流中读取文本，缓冲各个字符，从而提供字符、数组和行的高效读取。可以指定缓冲区的大小，或者可使用默认的大小。大多数情况下，默认值就足够大了。通常，Reader 所作的每个读取请求都会导致对基础字符或字节流进行相应的读取请求。因
[天气与气候]极端气候环境 comsci 环境
如果空间环境出现异变...外星文明并未出现,而只是用某种气象武器对地球的气候系统进行攻击,并挑唆地球国家间的战争,经过一段时间的准备...最大限度的削弱地球文明的整体力量,然后再进行入侵...... 那么地球上的国家应该做什么样的防备工作呢? &n
oracle order by与union一起使用的用法 daizj UNION oracle order by
当使用union操作时，排序语句必须放在最后面才正确，如下：只能在union的最后一个子查询中使用order by，而这个order by是针对整个unioning后的结果集的。So：如果unoin的几个子查询列名不同，如 Sql代码 select supplier_id, supplier_name from suppliers UNI
zeus持久层读写分离单元测试 deng520159 单元测试
本文是zeus读写分离单元测试,距离分库分表,只有一步了.上代码: 1.ZeusMasterSlaveTest.java package com.dengliang.zeus.webdemo.test; import java.util.ArrayList; import java.util.List; import org.junit.Assert; import org.j
Yii 截取字符串(UTF-8) 使用组件 dcj3sjt126com yii
1.将Helper.php放进protected\components文件夹下。 2.调用方法： Helper::truncate_utf8_string($content,20,false); //不显示省略号 Helper::truncate_utf8_string($content,20); //显示省略号 &n
安装memcache及php扩展 dcj3sjt126com PHP
安装memcache tar zxvf memcache-2.2.5.tgz cd memcache-2.2.5/ /usr/local/php/bin/phpize (?) ./configure --with-php-confi
JsonObject 处理日期 feifeilinlin521 java json JsonOjbect JsonArray JSONException
写这边文章的初衷就是遇到了json在转换日期格式出现了异常 net.sf.json.JSONException: java.lang.reflect.InvocationTargetException 原因是当你用Map接收数据库返回了java.sql.Date 日期的数据进行json转换出的问题话不多说直接上代码 &n
Ehcache（06）——监听器 234390216 监听器 listener ehcache
监听器 Ehcache中监听器有两种，监听CacheManager的CacheManagerEventListener和监听Cache的CacheEventListener。在Ehcache中，Listener是通过对应的监听器工厂来生产和发生作用的。下面我们将来介绍一下这两种类型的监听器。
activiti 自带设计器中chrome 34版本不能打开bug的解决 jackyrong Activiti
在acitivti modeler中，如果是chrome 34，则不能打开该设计器，其他浏览器可以，经证实为bug，参考 http://forums.activiti.org/content/activiti-modeler-doesnt-work-chrome-v34 修改为，找到 oryx.debug.js 在最头部增加 if (!Document.
微信收货地址共享接口-终极解决 laotu5i0 微信开发
最近要接入微信的收货地址共享接口，总是不成功，折腾了好几天，实在没办法网上搜到的帖子也是骂声一片。我把我碰到并解决问题的过程分享出来，希望能给微信的接口文档起到一个辅助作用，让后面进来的开发者能快速的接入，而不需要像我们一样苦逼的浪费好几天，甚至一周的青春。各种羞辱、谩骂的话就不说了，本人还算文明。如果你能搜到本贴，说明你已经碰到了各种 ed
关于人才 netkiller.github.com 工作面试招聘 netkiller 人才
关于人才每个月我都会接到许多猎头的电话，有些猎头比较专业，但绝大多数在我看来与猎头二字还是有很大差距的。与猎头接触多了，自然也了解了他们的工作，包括操作手法，总体上国内的猎头行业还处在初级阶段。总结就是“盲目推荐，以量取胜”。目前现状许多从事人力资源工作的人，根本不懂得怎么找人才。处在人才找不到企业，企业找不到人才的尴尬处境。企业招聘，通常是需要用人的部门提出招聘条件，由人
搭建 CentOS 6 服务器 - 目录 rensanning centos
(1) 安装CentOS ISO（desktop/minimal）、Cloud（AWS/阿里云）、Virtualization（VMWare、VirtualBox）详细内容 (2) Linux常用命令 cd、ls、rm、chmod...... 详细内容 (3) 初始环境设置用户管理、网络设置、安全设置...... 详细内容 (4) 常驻服务Daemon
【求助】mongoDB无法更新主键 toknowme mongodb
Query query = new Query(); query.addCriteria(new Criteria("_id").is(o.getId())); &n
jquery 页面滚动到底部自动加载插件集合 xp9802 jquery
很多社交网站都使用无限滚动的翻页技术来提高用户体验，当你页面滑到列表底部时候无需点击就自动加载更多的内容。下面为你推荐 10 个 jQuery 的无限滚动的插件： 1. jQuery ScrollPagination jQuery ScrollPagination plugin 是一个 jQuery 实现的支持无限滚动加载数据的插件。 2. jQuery Screw S

【AI理论学习】理解词向量、CBOW与Skip-Gram模型

理解词向量、CBOW与Skip-Gram

词向量基础知识

One-hot表示

Distributed表示

word2vec基础知识

CBOW和Skip-gram

霍夫曼树

基于Hierarchical Softmax的 CBOW 模型和 Skip-gram 模型

CBOW 模型

基本结构

目标函数

梯度计算

Skip-gram 模型

基本结构

梯度计算

小结

基于Negative Sampling 的 CBOW 模型和 Skip-gram 模型

负采样算法

CBOW模型

Skip-gram模型

参考资料

你可能感兴趣的:(NLP,自然语言处理,word2vec,CBOW,Skip-gram,负采样技术)