ShowMeAI

斯坦福NLP名课带学详解 | CS224n 第6讲 - 循环神经网络与语言模型（NLP通关指南·完结）

作者：韩信子@ShowMeAI，路遥@ShowMeAI，奇异果@ShowMeAI
教程地址：http://www.showmeai.tech/tutorials/36
本文地址：http://www.showmeai.tech/article-detail/240
声明：版权所有，转载请联系平台与作者并注明出处
收藏ShowMeAI查看更多精彩内容

ShowMeAI为斯坦福CS224n《自然语言处理与深度学习(Natural Language Processing with Deep Learning)》课程的全部课件，做了中文翻译和注释，并制作成了GIF动图！

本讲内容的深度总结教程可以在这里查看。视频和课件等资料的获取方式见文末。

引言

（本篇内容也可以参考ShowMeAI的对吴恩达老师课程的总结文章深度学习教程 | 序列模型与RNN网络）

本篇内容覆盖

介绍一个新的NLP任务
- Language Modeling 语言模型
介绍一个新的神经网络家族
- Recurrent Neural Networks (RNNs)

1.语言模型

1.1 语言模型

语言建模的任务是预测下一个单词是什么

更正式的说法是：给定一个单词序列 $\boldsymbol{x}^{(1)}, \boldsymbol{x}^{(2)}, \ldots, \boldsymbol{x}^{(t)}$ ，计算下一个单词 $x^{(t+1)}$ 的概率分布：

$P\left(\boldsymbol{x}^{(t+1)} \mid \boldsymbol{x}^{(t)}, \ldots, \boldsymbol{x}^{(1)}\right)$

其中， $x^{(t+1)}$ 可以是词表中的任意单词 $V=\left\{\boldsymbol{w}_{1}, \ldots, \boldsymbol{w}_{|V|}\right\}$
这样做的系统称为 Language Model 语言模型

1.2 语言模型

还可以将语言模型看作评估一段文本是自然句子（通顺度）的概率
例如，如果我们有一段文本 $x^{(1)},\dots,x^{(T)}$ ，则这段文本的概率(根据语言模型)为

$\begin{aligned} P\left(\boldsymbol{x}^{(1)}, \ldots, \boldsymbol{x}^{(T)}\right) &=P\left(\boldsymbol{x}^{(1)}\right) \times P\left(\boldsymbol{x}^{(2)} \mid \boldsymbol{x}^{(1)}\right) \times \cdots \times P\left(\boldsymbol{x}^{(T)} \mid \boldsymbol{x}^{(T-1)}, \ldots, \boldsymbol{x}^{(1)}\right) \\ &=\prod_{t=1}^{T} P\left(\boldsymbol{x}^{(t)} \mid \boldsymbol{x}^{(t-1)}, \ldots, \boldsymbol{x}^{(1)}\right) \end{aligned}$

语言模型提供的是 $\prod_{t=1}^{T} P\left(\boldsymbol{x}^{(t)} \mid \boldsymbol{x}^{(t-1)}, \ldots, \boldsymbol{x}^{(1)}\right)$

1.3 随处可见的语言模型

1.4 随处可见的语言模型

1.5 n-gram 语言模型

the students opened their __

问题：如何学习一个语言模型？
回答(深度学习之前的时期)：学习一个 n-gram 语言模型
定义：n-gram是一个由 $n$ 个连续单词组成的块
- unigrams: the, students, opened, their
- bigrams: the students, students opened, opened their
- trigrams: the students opened, students opened their
- 4-grams: the students opened their
想法：收集关于不同 n-gram 出现频率的统计数据，并使用这些数据预测下一个单词

1.6 n-gram 语言模型

首先，我们做一个简化假设： $x^{(t+1)}$ 只依赖于前面的 $n - 1$ 个单词

$\begin{aligned} P\left(\boldsymbol{x}^{(t+1)} \mid \boldsymbol{x}^{(t)}, \ldots, \boldsymbol{x}^{(1)}\right) & =P\left(\boldsymbol{x}^{(t+1)} \mid \boldsymbol{x}^{(t)}, \ldots, \boldsymbol{x}^{(t-n+2)}\right)\\ &=\frac{P\left(\boldsymbol{x}^{(t+1)}, \boldsymbol{x}^{(t)}, \ldots, \boldsymbol{x}^{(t-n+2)}\right)}{P\left(\boldsymbol{x}^{(t)}, \ldots, \boldsymbol{x}^{(t-n+2)}\right)} \end{aligned}$

问题：如何得到n-gram和(n-1)-gram的概率？
回答：通过在一些大型文本语料库中计算它们(统计近似)

$\approx \frac{\operatorname{count}\left(\boldsymbol{x}^{(t+1)}, \boldsymbol{x}^{(t)}, \ldots, \boldsymbol{x}^{(t-n+2)}\right)}{\operatorname{count}\left(\boldsymbol{x}^{(t)}, \ldots, \boldsymbol{x}^{(t-n+2)}\right)}$

1.7 n-gram 语言模型：示例

假设我们正在学习一个 4-gram 的语言模型

例如，假设在语料库中：
- students opened their 出现了 $1000$ 次
- students opened their books 出现了 $400$ 次

$P(\text{books} \mid \text{students opened their})=0.4$

students opened their exams 出现了 $100$ 次

$\text{exams} \mid \text{students opened their})=0.1$

我们应该忽视上下文中的 proctor 吗？
- 在本例中，上下文里出现了 proctor，所以 exams 在这里的上下文中应该是比 books 概率更大的。

1.8 n-gram语言模型的稀疏性问题

问题1：如果students open their ww 从未出现在数据中，那么概率值为 $0$
(Partial)解决方案：为每个 $\in V$ 添加极小数 $\delta$ ，这叫做平滑。这使得词表中的每个单词都至少有很小的概率。
问题2：如果students open their 从未出现在数据中，那么我们将无法计算任何单词 $w$ 的概率值
(Partial)解决方案：将条件改为open their，也叫做后退处理。
Note/注意: $n$ 的增加使稀疏性问题变得更糟。一般情况下 $n$ 不能大于 $5$ 。

1.9 n-gram语言模型的存储问题

问题：需要存储你在语料库中看到的所有 n-grams 的计数

增加 $n$ 或增加语料库都会增加模型大小

1.10 n-gram 语言模型在实践中的应用

Try for yourself: https://nlpforhackers.io/language-models/

你可以在你的笔记本电脑上，在几秒钟内建立一个超过170万个单词库(Reuters)的简单的三元组语言模型
- Reuters 是商业和金融新闻的数据集

稀疏性问题：

概率分布的粒度不大。today the company和today he bank都是4/26，都只出现过四次

1.11 n-gram语言模型的生成文本

可以使用语言模型来生成文本
使用trigram运行以上生成过程时，会得到上图左侧的文本
令人惊讶的是其具有语法但是是不连贯的。如果我们想要很好地模拟语言，我们需要同时考虑三个以上的单词。但增加 $n$ 使模型的稀疏性问题恶化，模型尺寸增大

1.12 如何搭建一个神经语言模型？

回忆一下语言模型任务
- 输入：单词序列 $\boldsymbol{x}^{(1)}, \boldsymbol{x}^{(2)}, \ldots, \boldsymbol{x}^{(t)}$
- 输出：下一个单词的概 $P\left(\boldsymbol{x}^{(t+1)} \mid \boldsymbol{x}^{(t)}, \ldots, \boldsymbol{x}^{(1)}\right)$ 率分布
window-based neural model 在第三讲中被用于NER问题

1.13 固定窗口的神经语言模型

使用和NER问题中同样网络结构

1.14 固定窗口的神经语言模型

1.15 固定窗口的神经语言模型

超越 n-gram 语言模型的改进

没有稀疏性问题
不需要观察到所有的n-grams

NNLM存在的问题

固定窗口太小
扩大窗口就需要扩大权重矩阵 $W$
窗口再大也不够用
$x^{(1)}$ 和 $x^{(2)}$ 乘以完全不同的权重。输入的处理不对称

我们需要一个神经结构，可以处理任何长度的输入

2.循环神经网络(RNN)

2.1 循环神经网络(RNN)

核心想法：重复使用相同的权重矩阵 $W$

2.2 RNN语言模型

2.3 RNN语言模型

RNN的优点
- 可以处理任意长度的输入
- 步骤 $t$ 的计算(理论上)可以使用许多步骤前的信息
- 模型大小不会随着输入的增加而增加
- 在每个时间步上应用相同的权重，因此在处理输入时具有对称性
RNN的缺点
- 循环串行计算速度慢
- 在实践中，很难从许多步骤前返回信息

2.4 训练一个RNN语言模型

获取一个较大的文本语料库，该语料库是一个单词序列
输入RNN-LM；计算每个步骤 $t$ 的输出分布
- 即预测到目前为止给定的每个单词的概率分布
步骤 $t$ 上的损失函数为预测概率分布 $\hat{\boldsymbol{y}}^{(t)}$ 与真实下一个单词 ${\boldsymbol{y}}^{(t)}$ ( $x^{(t+1)}$ 的独热向量)之间的交叉熵

$J^{(t)}(\theta)=C E\left(\boldsymbol{y}^{(t)}, \hat{\boldsymbol{y}}^{(t)}\right)=-\sum_{w \in V} \boldsymbol{y}_{w}^{(t)} \log \hat{\boldsymbol{y}}_{w}^{(t)}=-\log \hat{\boldsymbol{y}}_{\boldsymbol{x}_{t+1}}^{(t)}$

将其平均，得到整个训练集的总体损失

$J(\theta)=\frac{1}{T} \sum_{t=1}^{T} J^{(t)}(\theta)=\frac{1}{T} \sum_{t=1}^{T}-\log \hat{\boldsymbol{y}}_{\boldsymbol{x}_{t+1}}^{(t)}$

2.5 训练一个RNN语言模型

$J^{(1)}(\theta)+J^{(2)}(\theta)+J^{(3)}(\theta)+J^{(4)}(\theta)+\cdots=J(\theta)=\frac{1}{T} \sum_{t=1}^{T} J^{(t)}(\theta)$

2.6 训练一个RNN语言模型

然而：计算整个语料库 $\boldsymbol{x}^{(1)}, \ldots, \boldsymbol{x}^{(T)}$ 的损失和梯度太昂贵了

$J(\theta)=\frac{1}{T} \sum_{t=1}^{T} J^{(t)}(\theta)$

在实践中，我们通常将 $\boldsymbol{x}^{(1)}, \ldots, \boldsymbol{x}^{(T)}$ 看做一个句子或是文档
回忆：随机梯度下降允许我们计算小块数据的损失和梯度，并进行更新
计算一个句子的损失 $J(\theta)$ (实际上是一批句子)，计算梯度和更新权重。重复上述操作。

2.7 RNN的反向传播

问题：关于重复的权重矩阵 $W_h$ 的偏导数 $J^{(t)}(\theta)$
回答：重复权重的梯度是每次其出现时的梯度的总和

$\frac{\partial J^{(t)}}{\partial \boldsymbol{W}_{\boldsymbol{h}}}=\sum_{i=1}^{t}\left.\frac{\partial J^{(t)}}{\partial \boldsymbol{W}_{\boldsymbol{h}}}\right|_{(i)}$

2.8 多变量链式法则

Source: https://www.khanacademy.org/math/multivariable-calculus/multivariable-derivatives/differentiating-vector-valued-functions/a/multivariable-chain-rule-simple-version

对于一个多变量函数 $f (x, y)$ 和两个单变量函数 $x (t)$ 和 $y (t)$ ，其链式法则如下：

$\frac{d}{d t} f(x(t), y(t))=\frac{\partial f}{\partial x} \frac{d x}{d t}+\frac{\partial f}{\partial y} \frac{d y}{d t}$

2.9 RNN的反向传播：简单证明

对于一个多变量函数 $f (x, y)$ 和两个单变量函数 $x (t)$ 和 $y (t)$ ，其链式法则如下：

$\frac{d}{d t} f(x(t), y(t))=\frac{\partial f}{\partial x} \frac{d x}{d t}+\frac{\partial f}{\partial y} \frac{d y}{d t}$

2.10 RNN的反向传播

问题：如何计算？
回答：反向传播的时间步长 $i=t,\dots,0$ 。累加梯度。这个算法叫做 “backpropagation through time”

2.11 RNN语言模型的生成文本

就像n-gram语言模型一样，你可以使用RNN语言模型通过重复采样来生成文本。采样输出是下一步的输入。

2.12 RNN语言模型的生成文本

Source: https://medium.com/@samim/obama-rnn-machine-generated-political-speeches-c8abd18a2ea0

Source: https://medium.com/deep-writing/harry-potter-written-by-artificial-intelligence-8a9431803da6

Source: https://gist.github.com/nylki/1efbaa36635956d35bcc

Source: http://aiweirdness.com/post/160776374467/new-paint-colors-invented-by-neural-network

补充讲解

相比n-gram更流畅，语法正确，但总体上仍然很不连贯
食谱的例子中，生成的文本并没有记住文本的主题是什么
哈利波特的例子中，甚至有体现出了人物的特点，并且引号的开闭也没有出现问题
- 也许某些神经元或者隐藏状态在跟踪模型的输出是否在引号中
RNN是否可以和手工规则结合？
- 例如Beam Serach，但是可能很难做到

3.评估语言模型

3.1 评估语言模型

标准语言模型评估指标是 perplexity 困惑度
这等于交叉熵损失 $J(\theta)$ 的指数

$=\prod_{t=1}^{T}\left(\frac{1}{\hat{y}_{x_{t+1}}^{(t)}}\right)^{1 / T}=\exp \left(\frac{1}{T} \sum_{t=1}^{T}-\log \hat{\boldsymbol{y}}_{\boldsymbol{x}_{t+1}}^{(t)}\right)=\exp (J(\theta))$

困惑度越低效果越好

3.2 RNN极大地改善了困惑度

Source: https://research.fb.com/building-an-efficient-neural-language-model-over-a-billion-words/

3.3 为什么我们要关心语言模型？

语言模型是一项基准测试任务，它帮助我们衡量我们在理解语言方面的进展
- 生成下一个单词，需要语法，句法，逻辑，推理，现实世界的知识等
语言建模是许多NLP任务的子组件，尤其是那些涉及生成文本或估计文本概率的任务
- 预测性打字、语音识别、手写识别、拼写/语法纠正、作者识别、机器翻译、摘要、对话等等

3.4 要点回顾

语言模型：预测下一个单词的系统
循环神经网络：一系列神经网络
- 采用任意长度的顺序输入
- 在每一步上应用相同的权重
- 可以选择在每一步上生成输出
循环神经网络 $\ne$ 语言模型
我们已经证明，RNNs是构建LM的一个很好的方法。
但RNNs的用处要大得多!

3.5 RNN可用于句子分类

如何计算句子编码
基础方式：使用最终隐层状态
通常更好的方式：使用所有隐层状态的逐元素最值或均值
Encoder的结构在NLP中非常常见

3.6 RNN语言模型可用于生成文本

这是一个条件语言模型的示例。我们使用语言模型组件，并且最关键的是，我们根据条件来调整它

4.视频教程

可以点击 B站查看视频的【双语字幕】版本

【双语字幕+资料下载】斯坦福CS224n | 深度学习与自然语言处理(2019·全20讲)

5.参考资料

《斯坦福NLP名课带学详解 | CS224n》本讲带学的动态翻页PPT在线阅翻页-Lecture6
《斯坦福CS224n深度学习与自然语言处理》课程学习指南
《斯坦福CS224n深度学习与自然语言处理》课程大作业解析
【双语字幕视频】斯坦福CS224n | 深度学习与自然语言处理(2019·全20讲)
Stanford官网 | CS224n: Natural Language Processing with Deep Learning

ShowMeAI 深度学习与自然语言处理教程（完整版）

ShowMeAI 深度学习与自然语言处理教程(1) - 词向量、SVD分解与Word2vec
ShowMeAI 深度学习与自然语言处理教程(2) - GloVe及词向量的训练与评估
ShowMeAI 深度学习与自然语言处理教程(3) - 神经网络与反向传播
ShowMeAI 深度学习与自然语言处理教程(4) - 句法分析与依存解析
ShowMeAI 深度学习与自然语言处理教程(5) - 语言模型、RNN、GRU与LSTM
ShowMeAI 深度学习与自然语言处理教程(6) - 神经机器翻译、seq2seq与注意力机制
ShowMeAI 深度学习与自然语言处理教程(7) - 问答系统
ShowMeAI 深度学习与自然语言处理教程(8) - NLP中的卷积神经网络
ShowMeAI 深度学习与自然语言处理教程(9) - 句法分析与树形递归神经网络

ShowMeAI 斯坦福NLP名课 CS224n带学详解（20讲·完整版）

斯坦福NLP名课带学详解 | CS224n 第1讲 - NLP介绍与词向量初步
斯坦福NLP名课带学详解 | CS224n 第2讲 - 词向量进阶
斯坦福NLP名课带学详解 | CS224n 第3讲 - 神经网络知识回顾
斯坦福NLP名课带学详解 | CS224n 第4讲 - 神经网络反向传播与计算图
斯坦福NLP名课带学详解 | CS224n 第5讲 - 句法分析与依存解析
斯坦福NLP名课带学详解 | CS224n 第6讲 - 循环神经网络与语言模型
斯坦福NLP名课带学详解 | CS224n 第7讲 - 梯度消失问题与RNN变种
斯坦福NLP名课带学详解 | CS224n 第8讲 - 机器翻译、seq2seq与注意力机制
斯坦福NLP名课带学详解 | CS224n 第9讲 - cs224n课程大项目实用技巧与经验
斯坦福NLP名课带学详解 | CS224n 第10讲 - NLP中的问答系统
斯坦福NLP名课带学详解 | CS224n 第11讲 - NLP中的卷积神经网络
斯坦福NLP名课带学详解 | CS224n 第12讲 - 子词模型
斯坦福NLP名课带学详解 | CS224n 第13讲 - 基于上下文的表征与NLP预训练模型
斯坦福NLP名课带学详解 | CS224n 第14讲 - Transformers自注意力与生成模型
斯坦福NLP名课带学详解 | CS224n 第15讲 - NLP文本生成任务
斯坦福NLP名课带学详解 | CS224n 第16讲 - 指代消解问题与神经网络方法
斯坦福NLP名课带学详解 | CS224n 第17讲 - 多任务学习(以问答系统为例)
斯坦福NLP名课带学详解 | CS224n 第18讲 - 句法分析与树形递归神经网络
斯坦福NLP名课带学详解 | CS224n 第19讲 - AI安全偏见与公平
斯坦福NLP名课带学详解 | CS224n 第20讲 - NLP与深度学习的未来

ShowMeAI系列教程精选推荐

大厂技术实现：推荐与广告计算解决方案
大厂技术实现：计算机视觉解决方案
大厂技术实现：自然语言处理行业解决方案
图解Python编程：从入门到精通系列教程
图解数据分析：从入门到精通系列教程
图解AI数学基础：从入门到精通系列教程
图解大数据技术：从入门到精通系列教程
图解机器学习算法：从入门到精通系列教程
机器学习实战：手把手教你玩转机器学习系列
深度学习教程：吴恩达专项课程 · 全套笔记解读
自然语言处理教程：斯坦福CS224n课程 · 课程带学与全套笔记解读
深度学习与计算机视觉教程：斯坦福CS231n · 全套笔记解读

阿里云服务器2核4G5M带宽1年多少钱？最低1128.53元最高4035.04元（附购买教程）阿里云最新优惠和活动汇总
阿里云服务器2核4G配置目前有AMD计算型c6a、AMD计算型c8a、通用算力型u1、计算型c7等多种实例规格可选，不同实例的阿里云服务器收费价格是有很大差别的，同时带宽越高价格也越高，以2核4G5M带宽配置为例AMD计算型c6a实例的收费标准为2781.60元1年，AMD计算型c8a实例的收费标准为3322.27元1年，二者相差了540.67元1年。不过好在阿里云对2核4G5M带宽的云服务器有活
【教程4＞第9章＞第8节】通过FPGA实现RGB图像转换为CMYK图像——verilog实现与MATLAB辅助验证 fpga和matlab #fpga开发 CMYK RGB 教程4 verilog
本课程学习成果预览(FPGA测试结果通过MATLAB显示)目录1.软件版本2.通过FPGA实现RGB图像转CMYK3.RGB图像转CMYK的测试3.1步骤一：生成测试样本3.2步骤二：通过testbench调用X2.bmp3.3步骤三：vivado仿真3.4步骤四：MATLAB辅助验证4.视频操作步骤演示欢迎订阅FPGA/MATLAB/Simulink系列教程《★教程1:matlab入门100例》
Android音视频探索之旅 | Webrtc 1对1音视频通话核心流程分析慢行的骑兵音视频 android 音视频 webrtc
一.前言使用Webrtc实现1对1的音视频通话，先从Web端进行学习要比直接从Android端进行学习要轻松许多（若没有JS和Html以及Node基础，查找相关基础教程，能梳理代码的逻辑即可）。本文Android端接入Webrtc是通过引入官方的sdk来实现的。本文涉及到的Demo代码包含三部分，服务器端、Web端、Android端。服务器端使用的是Node，Web使用的是Html和JS，Andr
python教程修订版 Ethan learn English python
9/23Inthiscourse,I'mgoingtoteachyoueverythingyouneedtoknowtogetstartedprogramminginPython.Now,Pythonisoneofthemostpopularprogramminglanguagesoutthere在众多的……中.Andit'sbyfar目前为止oneofthemostsõughtafter受欢迎的
关于猫头虎，认识猫头虎，建联猫头虎，商务合作，产品评测，产品推广，个人自媒体创作，超级个体，涨粉秘籍，一起探索编程世界的无限可能！猫头虎猫头虎精品博客专栏 CSDN开发云人机交互交互程序人生程序员创富创业创新学习方法
猫头虎建联猫头虎，商务合作，产品评测，产品推广，个人自媒体创作，超级个体，涨粉秘籍，一起探索编程世界的无限可能！猫头虎是谁？大家好，我是猫头虎，别名猫头虎博主，擅长的技术领域包括云原生、前端、后端、运维和AI。我的博客主要分享技术教程、bug解决思路、开发工具教程、前沿科技资讯、产品评测图文、产品使用体验图文、产品优点推广文稿、产品横测对比文稿，以及线下技术沙龙活动参会体验文稿。内容涵盖云服务产品
TinyMCE富文本编辑器在Vue中的使用教程
介绍TinyMCE是一款功能强大的富文本编辑器，本教程将指导您如何在Vue项目中集成和使用TinyMCE编辑器，从基础使用到高级功能扩展。目录基础集成核心配置详解图片上传处理自定义功能扩展双向数据绑定样式定制常见问题解决vue项目实际应用1.基础集成安装依赖#yarnyarnaddtinymceyarnadd@tinymce/tinymce-vue#npmnpminstalltinymce-Snp
After Effects 教程，如何在 After Effects 中应用平铺效果？ Mac123123
欢迎观看AfterEffects中文版教程，小编带大家学习AfterEffects的基本工具和使用技巧，了解如何在AE中平铺效果。随着背景图层开始变得模糊，图标大约在1秒后开始显现。可以使用一种叫做「平铺」的效果，对图标进行动画处理。选择「图层1」，转到界面右侧的「效果和预设」面板，单击一次搜索字段，然后键入「tiler」，随即弹出扭曲滤镜「CCTiler」。单击该滤镜，把它拖入「合成」面板，放到
阿里工程师教你使用 Svelte 构建阅读列表的小技巧 JAVA学习
velte在过去两年中获得了很多赞誉，远非“只是另一个前端框架”。它在2019年JS调查中获得了“年度突破奖”，随后在2020年的满意度评分中名列前茅。它还在StackOverflow2021调查中被评为最受喜爱的Web框架。Svelte以其小包大小、非常好的性能和易用性的组合吸引了开发人员。同时，它还装满了很多好东西。已经提供了一个简单的状态管理解决方案，以及现成的过渡和动画。本介绍性教程将阐明
淘宝内部优惠券在哪领取？淘宝优惠券领取教程高省张导师
您可以通过以下几种途径来领取淘宝优惠券：淘宝官方活动：淘宝经常会推出一些官方活动，并通过各种方式发放优惠券，比如开展双11、618等大型促销活动时。您可以通过淘宝的首页、手机客户端等渠道关注官方活动信息，并按照活动规则参与领取优惠券。商家优惠券：在淘宝上购买商品时，很多商家也会提供优惠券供用户领取。您可以在商品详情页面或店铺主页上查找并领取相应的优惠券。注意，不同商家的优惠券规则和限制条件可能会有
HAL STM32 I2C方式读取MT6701磁编码器获取角度例程 perseverance52 嵌入式开发笔记 stm32 MT6701
HALSTM32I2C方式读取MT6701磁编码器获取角度例程相关篇《Arduino通过I2C驱动MT6701磁编码器并读取角度数据》《STM32软件I2C方式读取MT6701磁编码器获取角度例程》使用CH341编程器读取，可以参考《CH341A/BUSB转USART/I2C/SPI介绍》MT6701当前最新文档资料：https://www.magntek.com.cn/upload/MT6701
Linux指令大全网站
Linux指令大全网站！Linux命令大全(手册)：超全！且提供指令查询网址：https://www.linuxcool.com/Linux指令(菜鸟教程)：超全！提供清晰的表格查找网址：https://www.runoob.com/linux/linux-command-manual.htmlLinux中文在线手册：这个网站可以检索Linux命令，提供了命令的例子和收藏命令的搜索平台网址：htt
高省邀请码是多少?必须填吗?高省邀请码日常购物小技巧
今天说说：高省邀请码千万不要随便填写,不然会后悔！高省邀请码怎么获取高省邀请码多少?官方邀请码及邀请码填写教程一、高省是什么？高省是淘宝天猫优惠券搬运工，是学生党、上班族、家庭主妇、宝妈、自由职业者等省钱首选，天天都能让你过双11的省钱还能赚钱的APP，支持全网商品搜索，是一个强大的社交购物APP，这里可以领券，直接省钱关键还免费。如果你本身就喜欢在淘宝天猫购物，建议一定要去注册一下高省，领了优惠
通俗易懂循环神经网络（RNN）指南
本文用直观类比、图表和代码，带你轻松理解RNN及其变体（LSTM、GRU、双向RNN）的原理和应用。什么是循环神经网络循环神经网络（RecurrentNeuralNetwork,RNN）是一类专门用于处理序列数据的神经网络。与前馈神经网络不同，RNN具有“记忆”能力，能够利用过去的信息来帮助当前的决策。这使得RNN特别适合处理像语言、语音、时间序列这样具有时序特性的数据。类比：你在阅读一句话时，会
设计模式教程：状态模式（State Pattern）遇见伯灵说设计模式教程设计模式状态模式
一、概述状态模式（StatePattern）是一种行为型设计模式，允许对象在内部状态发生变化时改变其行为。换句话说，状态模式让对象的行为随其状态变化而变化。它的主要目的是将状态相关的行为封装到状态类中，从而避免在类中大量使用if-else或switch语句来判断不同的状态并执行相应的操作。二、状态模式的结构状态模式的核心概念在于将不同的状态抽象出来，并且将每个状态的行为封装到独立的类中。它的结构包
Netflix DGS Codegen 开源项目教程裴剑苹
NetflixDGSCodegen开源项目教程1.项目的目录结构及介绍NetflixDGSCodegen项目的目录结构如下：dgs-codegen/├──dgs-codegen-core/│├──src/││├──main/│││├──java/││││├──com/│││││├──netflix/││││││├──dgs/│││││││├──codegen/││││││││├──core/│││
Markdown编辑器入门教程 AIIDECode 编辑器 visual studio docker vscode pycharm windows postman
这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题，有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能，丰富你的文章UML图表FLowchart流程图导出与导入导出导入欢迎使用Mark
2.1 UIView视图的基本使用 [iOS开发-Xcode教程] 互动教程网
1.在欢迎窗口右侧的历史项目列表中，双击打开之前创建的单视图项目模板。image2.本节课将为您演示，如何创建最基本的视图对象。在此使用之前创建的空白项目，然后打开视图控制器的代码文件。image3.接着我们来一步步编写代码，在视图控制器的根视图里，添加两个视图对象。image4.初始化一个CGRect对象，它在屏幕上定义了一个矩形的显示区域。包含了对象的原点位置，和大小尺寸信息。image5.创
sqlplus连接Oracle 11g 数据库 zone-- sqlplus oracle
sqlplus连接Oracle11g数据库安装如下Oracle11g安装教程//Anhighlightedblocksqlplus有几种登陆方式比如：sqlplus"/assysdba"--以操作系统权限认证的oraclesys管理员登陆sqlplus/nolog--不在cmd或者terminal当中暴露密码的登陆方式conn/assysdbaconnsys/passwordassysdbasql
Redis入门教程（一）：基本数据类型
一、Redis是什么？为什么你需要它？Redis（RemoteDictionaryServer）是一个开源的内存数据结构存储系统，它可以用作数据库、缓存和消息中间件。与传统的关系型数据库不同，Redis将数据存储在内存中，使其读写速度达到惊人的11万次读/秒和8.1万次写/秒。同时支持数据持久化，重启后数据不丢失，完美平衡了速度与可靠性。Redis的五大核心优势：丰富的数据结构：支持字符串（Str
高阶知识库搭建实战五、（向量数据库Milvus安装）伯牙碎琴大模型数据库 milvus 大模型 AI
以下是关于在Windows环境下直接搭建Milvus向量数据库的教程：本教程分两部分，第一部分是基于docker安装，在Windows环境下直接安装Milvus向量数据库，目前官方推荐的方式是通过Docker进行部署，因为Milvus的运行环境依赖于Linux系统。如果你希望在Windows上直接运行Milvus，可以考虑使用MilvusLite版本，这是一个轻量级的Python库，适用于快速原型
新版进销存管理系统完整教程：PB9.0与SQL Server 2000的实战应用语嫣凝冰
本文还有配套的精品资源，点击获取简介：本文档提供了一个基于PowerBuilder9.0和SQLServer2000开发的进销存管理系统的全面教程。系统涵盖了企业管理中的采购、销售和库存管理环节，通过强大的数据窗口组件和三层架构设计，实现了业务逻辑和数据库的有效交互。文章详细解释了系统的技术栈、核心功能、系统架构、数据窗口组件、数据库设计、报表分析及权限安全管理等关键点，旨在帮助用户深入理解进销存
从0构建 HarmonyOS 本地语音识别项目：Whisper 完整落地教程观熵国产大模型部署实战全流程指南 harmonyos 语音识别 whisper 深度学习机器学习
第一章：鸿蒙手机语音识别项目实战（基于Whisper本地推理）项目目标：构建一个可以在鸿蒙系统手机本地运行的语音识别应用，使用Whisper模型识别用户语音为文字，全程无需联网。1.为什么要在鸿蒙手机本地部署语音识别？在很多移动场景下（驾驶、弱网环境、隐私敏感场景等），云端语音识别存在如下痛点：⏳网络延迟高、体验割裂⚠️数据隐私风险大网络依赖强，弱网/无网直接无法使用而将语音识别模型部署在鸿蒙设备
2x2矩阵教程
2x2矩阵教程1.简介2x2矩阵是线性代数中的基本概念，用于表示二维线性变换。本教程将介绍如何使用C++实现2x2矩阵的基本运算，包括矩阵加减、乘法、行列式、逆矩阵等操作。2.代码实现2.1头文件(matrix2x2.h)#ifndefMATRIX2X2_H#defineMATRIX2X2_H#include#include#includenamespacemath{namespacelinear
WPF利用NotifyIcon创建任务栏图标（菜鸟教程）不喜欢打篮球的厨师不是好程序员 c#windows
学习目标：记录从WPF应用创建开始，一步步到任务栏图标创建的全过程。流程：1、环境：Win10+VS2017打开VS2017，选择文件->新建->项目->VisualC#->Windows桌面->WPF应用->更改项目名为TasbarIcon->确定2、添加图标类右键项目->添加->引用，找到System.Windows.Forms和System.Drawing两个程序集，打上勾添加进去。双击打开
在NLP深层语义分析中，深度学习和机器学习的区别与联系
在自然语言处理（NLP）的深层语义分析任务中，深度学习与机器学习的区别和联系主要体现在以下方面：一、核心区别特征提取方式机器学习：依赖人工设计特征（如词频、句法规则、TF-IDF等），需要领域专家对文本进行结构化处理。例如，传统情感分析需人工定义“情感词库”或通过词性标注提取关键成分。深度学习：通过神经网络自动学习多层次特征。例如，BERT等模型可从原始文本中捕获词向量、句法关系甚至篇章级语义，无
抖劵劵是什么平台，抖劵劵赚钱方法运营变现教程优惠券高省
抖券券平台是全新上线的“抖快购物返佣平台”，简单来说抖券券就是一款，对于在抖音喜欢购物的朋友，通过在抖券券领优惠券在分享给潜在消费者，对方通过你的链接成功下单，即可产生推广收益。如果是购买，他也将成为你的粉丝，之后在抖券券消费，你同样可以获得推广奖励。还可以邀请还有一起加入做团队。抖券券的业务模式抖券券，不仅可以自用省钱，分享赚钱，相比其他平台，也是优势多多，比如佣金高，提现快，团队强大靠谱，有培
ESP32-s3+QMI8658A姿态传感器完全开发指南 Despacito0o ESP32-S3 单片机嵌入式硬件
ESP32-s3+QMI8658A姿态传感器完全开发指南前言大家好！今天给大伙带来一篇干货满满的教程，我们将详细讲解如何在ESP32开发板上使用QMI8658A姿态传感器。这颗小芯片功能强大，不仅能检测加速度，还能读取陀螺仪数据，是做姿态检测、平衡控制等项目的好帮手。一、硬件介绍QMI8658A是一款6D姿态传感器，特点如下：集成三轴加速度计和三轴陀螺仪通过I²C接口与MCU通信可输出XYZ三轴倾
敏捷开发中的自然语言处理集成项目管理实战手册项目管理最佳实践敏捷流程自然语言处理 easyui ai
敏捷开发中的自然语言处理集成：让代码与需求“说人话”关键词：敏捷开发、自然语言处理（NLP）、用户故事分析、需求自动化、持续集成优化摘要：在敏捷开发中，“快速响应变化”的核心目标常被繁琐的文本处理拖慢——需求文档像“天书”、用户故事靠“脑补”、缺陷报告整理耗时……自然语言处理（NLP）就像一位“智能翻译官”，能让开发团队与需求文档“流畅对话”。本文将用“搭积木”“翻译机”等生活化比喻，带您理解如何
豆瓣电影信息爬虫【2024年6月】教程，赋完整代码桃宝护卫队爬虫 python
豆瓣电影信息爬虫【2024年6月】教程，赋完整代码在本教程中，我们将使用以下技术栈来构建一个爬虫，用于爬取豆瓣电影列表页面的信息：完整代码放到最后；完整代码放到最后；完整代码放到最后；重要的事情说三遍。1.技术栈介绍在本教程中，我们将使用以下技术栈来构建一个爬虫，用于爬取豆瓣电影列表页面的信息：Python:一种广泛使用的高级编程语言，因其简洁的语法和强大的库支持而受到开发者的喜爱。Request
Playwright 网络抓取：实用教程 Decodo 网络 php 开发语言 playwright puppeteer selenium 爬虫
文章目录前言一、什么是Playwright？二、使用Playwright进行网络抓取的方法三、使用Playwright进行网络搜索：分步指南四、代理实施五、剧作家与其他框架六、Playwright与Puppeteer的网页抓取对比七、Playwright与Selenium的网页抓取对比总结前言网络抓取就像没有剧本的戏剧导演——难以预测、杂乱无章。这就是Playwright的用武之地：它是一款功能强
枚举的构造函数中抛出异常会怎样 bylijinnan java enum 单例
首先从使用enum实现单例说起。为什么要用enum来实现单例？这篇文章（ http://javarevisited.blogspot.sg/2012/07/why-enum-singleton-are-better-in-java.html）阐述了三个理由： 1.enum单例简单、容易，只需几行代码： public enum Singleton { INSTANCE;
CMake 教程 aigo C++
转自：http://xiang.lf.blog.163.com/blog/static/127733322201481114456136/ CMake是一个跨平台的程序构建工具，比如起自己编写Makefile方便很多。介绍：http://baike.baidu.com/view/1126160.htm 本文件不介绍CMake的基本语法，下面是篇不错的入门教程： http:
cvc-complex-type.2.3: Element 'beans' cannot have character Cb123456 spring Webgis
cvc-complex-type.2.3: Element 'beans' cannot have character Line 33 in XML document from ServletContext resource [/WEB-INF/backend-servlet.xml] is i
jquery实例:随页面滚动条滚动而自动加载内容 120153216 jquery
<script language="javascript"> $(function (){ var i = 4;$(window).bind("scroll", function (event){ //滚动条到网页头部的高度，兼容ie,ff,chrome var top = document.documentElement.s
将数据库中的数据转换成dbs文件何必如此 sql dbs
旗正规则引擎通过数据库配置器（DataBuilder）来管理数据库，无论是Oracle，还是其他主流的数据都支持，操作方式是一样的。旗正规则引擎的数据库配置器是用于编辑数据库结构信息以及管理数据库表数据，并且可以执行SQL 语句，主要功能如下。 1)数据库生成表结构信息：主要生成数据库配置文件(.conf文
在IBATIS中配置SQL语句的IN方式 357029540 ibatis
在使用IBATIS进行SQL语句配置查询时，我们一定会遇到通过IN查询的地方，在使用IN查询时我们可以有两种方式进行配置参数：String和List。具体使用方式如下： 1.String:定义一个String的参数userIds，把这个参数传入IBATIS的sql配置文件，sql语句就可以这样写： <select id="getForms" param
Spring3 MVC 笔记（一） 7454103 spring mvc bean REST JSF
自从 MVC 这个概念提出来之后 struts1.X struts2.X jsf 。。。。。这个view 层的技术一个接一个！都用过！不敢说哪个绝对的强悍！要看业务，和整体的设计！最近公司要求开发个新系统！
Timer与Spring Quartz 定时执行程序 darkranger spring bean 工作 quartz
有时候需要定时触发某一项任务。其实在jdk1.3，java sdk就通过java.util.Timer提供相应的功能。一个简单的例子说明如何使用，很简单： 1、第一步，我们需要建立一项任务，我们的任务需要继承java.util.TimerTask package com.test; import java.text.SimpleDateFormat; import java.util.Date;
大端小端转换，le32_to_cpu 和cpu_to_le32 aijuans C语言相关
大端小端转换，le32_to_cpu 和cpu_to_le32 字节序 http://oss.org.cn/kernel-book/ldd3/ch11s04.html 小心不要假设字节序. PC 存储多字节值是低字节为先(小端为先, 因此是小端), 一些高级的平台以另一种方式(大端)
Nginx负载均衡配置实例详解 avords
[导读] 负载均衡是我们大流量网站要做的一个东西，下面我来给大家介绍在Nginx服务器上进行负载均衡配置方法，希望对有需要的同学有所帮助哦。负载均衡先来简单了解一下什么是负载均衡，单从字面上的意思来理解就可以解负载均衡是我们大流量网站要做的一个东西，下面我来给大家介绍在Nginx服务器上进行负载均衡配置方法，希望对有需要的同学有所帮助哦。负载均衡先来简单了解一下什么是负载均衡
乱说的 houxinyou 框架敏捷开发软件测试
从很久以前，大家就研究框架，开发方法，软件工程，好多！反正我是搞不明白！这两天看好多人研究敏捷模型，瀑布模型！也没太搞明白. 不过感觉和程序开发语言差不多，瀑布就是顺序，敏捷就是循环. 瀑布就是需求、分析、设计、编码、测试一步一步走下来。而敏捷就是按摸块或者说迭代做个循环，第个循环中也一样是需求、分析、设计、编码、测试一步一步走下来。也可以把软件开发理
欣赏的价值——一个小故事 bijian1013 有效辅导欣赏欣赏的价值
　　第一次参加家长会，幼儿园的老师说："您的儿子有多动症，在板凳上连三分钟都坐不了，你最好带他去医院看一看。"　　回家的路上，儿子问她老师都说了些什么，她鼻子一酸，差点流下泪来。因为全班30位小朋友，惟有他表现最差；惟有对他，老师表现出不屑，然而她还在告诉她的儿子："老师表扬你了，说宝宝原来在板凳上坐不了一分钟，现在能坐三分钟。其他妈妈都非常羡慕妈妈，因为全班只有宝宝
包冲突问题的解决方法 bingyingao eclipse maven exclusions 包冲突
包冲突是开发过程中很常见的问题：其表现有： 1.明明在eclipse中能够索引到某个类，运行时却报出找不到类。 2.明明在eclipse中能够索引到某个类的方法，运行时却报出找不到方法。 3.类及方法都有，以正确编译成了.class文件，在本机跑的好好的，发到测试或者正式环境就抛如下异常： java.lang.NoClassDefFoundError: Could not in
【Spark七十五】Spark Streaming整合Flume-NG三之接入log4j bit1129 Stream
先来一段废话：实际工作中，业务系统的日志基本上是使用Log4j写入到日志文件中的，问题的关键之处在于业务日志的格式混乱，这给对日志文件中的日志进行统计分析带来了极大的困难，或者说，基本上无法进行分析，每个人写日志的习惯不同，导致日志行的格式五花八门，最后只能通过grep来查找特定的关键词缩小范围，但是在集群环境下，每个机器去grep一遍，分析一遍，这个效率如何可想之二，大好光阴都浪费在这上面了
sudoku solver in Haskell bookjovi sudoku haskell
这几天没太多的事做，想着用函数式语言来写点实用的程序，像fib和prime之类的就不想提了（就一行代码的事），写什么程序呢？在网上闲逛时发现sudoku游戏，sudoku十几年前就知道了，学生生涯时也想过用C/Java来实现个智能求解，但到最后往往没写成，主要是用C/Java写的话会很麻烦。现在写程序，本人总是有一种思维惯性，总是想把程序写的更紧凑，更精致，代码行数最少，所以现
java apache ftpClient bro_feng java
最近使用apache的ftpclient插件实现ftp下载，遇见几个问题，做如下总结。 1. 上传阻塞，一连串的上传，其中一个就阻塞了，或是用storeFile上传时返回false。查了点资料，说是FTP有主动模式和被动模式。将传出模式修改为被动模式ftp.enterLocalPassiveMode();然后就好了。看了网上相关介绍，对主动模式和被动模式区别还是比较的模糊，不太了解被动模
读《研磨设计模式》-代码笔记-工厂方法模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 工厂方法模式：使一个类的实例化延迟到子类 * 某次，我在工作不知不觉中就用到了工厂方法模式（称为模板方法模式更恰当。2012-10-29）： * 有很多不同的产品，它
面试记录语 chenyu19891124 招聘
或许真的在一个平台上成长成什么样，都必须靠自己去努力。有了好的平台让自己展示，就该好好努力。今天是自己单独一次去面试别人，感觉有点小紧张，说话有点打结。在面试完后写面试情况表，下笔真的好难，尤其是要对面试人的情况说明真的好难。今天面试的是自己同事的同事，现在的这个同事要离职了，介绍了我现在这位同事以前的同事来面试。今天这位求职者面试的是配置管理，期初看了简历觉得应该很适合做配置管理，但是今天面
Fire Workflow 1.0正式版终于发布了 comsci 工作 workflow Google
Fire Workflow 是国内另外一款开源工作流，作者是著名的非也同志，哈哈.... 官方网站是 http://www.fireflow.org 经过大家努力,Fire Workflow 1.0正式版终于发布了正式版主要变化: 1、增加IWorkItem.jumpToEx(...)方法，取消了当前环节和目标环节必须在同一条执行线的限制，使得自由流更加自由 2、增加IT
Python向脚本传参 daizj python 脚本传参
如果想对python脚本传参数，python中对应的argc, argv(c语言的命令行参数)是什么呢？需要模块：sys 参数个数：len(sys.argv) 脚本名： sys.argv[0] 参数1： sys.argv[1] 参数2： sys.argv[
管理用户分组的命令gpasswd dongwei_6688 passwd
NAME： gpasswd - administer the /etc/group file SYNOPSIS： gpasswd group gpasswd -a user group gpasswd -d user group gpasswd -R group gpasswd -r group gpasswd [-A user,...] [-M user,...] g
郝斌老师数据结构课程笔记 dcj3sjt126com 数据结构与算法
<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
yii2 cgridview加上选择框进行操作 dcj3sjt126com GridView
页面代码 <?=Html::beginForm(['controller/bulk'],'post');?> <?=Html::dropDownList('action','',[''=>'Mark selected as: ','c'=>'Confirmed','nc'=>'No Confirmed'],['class'=>'dropdown',])
linux mysql fypop linux
enquiry mysql version in centos linux yum list installed | grep mysql yum -y remove mysql-libs.x86_64 enquiry mysql version in yum repositoryyum list | grep mysql oryum -y list mysql* install mysq
Scramble String hcx2013 String
Given a string s1, we may represent it as a binary tree by partitioning it to two non-empty substrings recursively. Below is one possible representation of s1 = "great":
跟我学Shiro目录贴 jinnianshilongnian 跟我学shiro
历经三个月左右时间，《跟我学Shiro》系列教程已经完结，暂时没有需要补充的内容，因此生成PDF版供大家下载。最近项目比较紧，没有时间解答一些疑问，暂时无法回复一些问题，很抱歉，不过可以加群（334194438/348194195）一起讨论问题。 ----广告-----------------------------------------------------
nginx日志切割并使用flume-ng收集日志 liyonghui160com
nginx的日志文件没有rotate功能。如果你不处理，日志文件将变得越来越大，还好我们可以写一个nginx日志切割脚本来自动切割日志文件。第一步就是重命名日志文件，不用担心重命名后nginx找不到日志文件而丢失日志。在你未重新打开原名字的日志文件前，nginx还是会向你重命名的文件写日志，linux是靠文件描述符而不是文件名定位文件。第二步向nginx主
Oracle死锁解决方法 pda158 oracle
　select p.spid,c.object_name,b.session_id,b.oracle_username,b.os_user_name from v$process p,v$session a, v$locked_object b,all_objects c where p.addr=a.paddr and a.process=b.process and c.object_id=b.
java之List排序 shiguanghui list排序
在Java Collection Framework中定义的List实现有Vector，ArrayList和LinkedList。这些集合提供了对对象组的索引访问。他们提供了元素的添加与删除支持。然而，它们并没有内置的元素排序支持。　　你能够使用java.util.Collections类中的sort()方法对List元素进行排序。你既可以给方法传递
servlet单例多线程 utopialxw 单例多线程 servlet
转自http://www.cnblogs.com/yjhrem/articles/3160864.html 和 http://blog.chinaunix.net/uid-7374279-id-3687149.html Servlet 单例多线程 Servlet如何处理多个请求访问？Servlet容器默认是采用单实例多线程的方式处理多个请求的：1.当web服务器启动的