蜡笔大龙猫

CS224D 课程学习笔记 L02

Lecture 2 主要介绍了传统的共现矩阵生成词向量方法和迭代生成词向量的方法，例如word2vec和Glove。

文章目录

Word Vectors

one-hot vector
共现矩阵
共现矩阵存在的问题

SVD存在的问题

word2vec

*word2vec的神奇之处*
Glove
几种得到词向量方法的对比

Iteration Based Method

一元、二元语言模型
CBOW
Skip-gram
Negative Sample

Word Vectors

人类对“词义”定义为通过一个词或者短语表示的意思，人想要通过词表达的意思，写作、艺术表达的意思。

计算机定义“词义”，通常是使用WordNet之类的分类方法，比如说，具有is-a关系、代名词集合。例如，“panda” is-a “animal”，“panda” is-a “vertebrate”，“good”的代名词集合有“full”，“expert”等。

首先，介绍一个可以说是最简单的词向量：

one-hot vector

one-hot向量就是将每个词表达为一个大小为|V|*1的向量，其中词所在的位置为1，其他位置全为0。|V|表示词典的大小。

这种表示方法存在的问题有：

丢失了词词之间的细小的差别
无法处理新词
带有主观性
需要人力实现
很难精确计算词之间的相似性

现在，一个很成功的统计NLP想法就是，通过邻域词（上下文）来表达词的信息。

怎样通过上下文表达词呢？答案是，共现矩阵。

共现矩阵

生成共现矩阵有两种方法：整篇文档和滑动窗口。

整篇文档

根据文档生成大小为|V|*M的共现矩阵，第 i 行第 j 列表示词 i 在文档 j 中出现的次数。这种方法会由主题引申到“潜语义分析”。很明显，随着文档数量M的增加，矩阵大小也在增加。
滑动窗口

使用滑动窗口能够同时捕获到句法（POS）和语义信息。

生成的共现矩阵是对称的，对角线上元素为0，矩阵大小为n*n，n表示词的个数。

共现矩阵存在的问题

在Google级别的公司处理NLP任务，词的个数会达到百万级别，这就导致了共现矩阵具有很高的维度，需要更大的存储空间。而在后续的分类等任务中，也会存在着矩阵稀疏的问题，导致模型的鲁棒性很差。

解决方法：使用低纬度的向量来存储词的大部分信息，也叫“密集向量”，通常大小为25~1000。怎样降低共现矩阵的维度呢？

接下来介绍两种方法：SVD-Based和 Iteration-Based。

SVD

对共现矩阵X应用SVD（Singular Value Decomposition）奇异值分解。奇异值分解适用于任意大小的矩阵。对于大小为n*m的矩阵X，奇异值分解为：

$X=USV^T$

其中，U的大小n*n，每列向量是正交的，成为左奇异向量；S的大小n*m，对角线上为奇异值，按照从大到小排列，除对角线外其他元素都是0；V的大小为m*m，列向量也是正交的，成为右奇异向量。奇异值表征的是特征向量的重要性。

复习一下SVD的求解过程：

$(X^TX)v_i = \lambda_iv_i$
$\sigma_i = \sqrt{\lambda_i}$
$u_i = \frac{1}{\sigma_i}Xv_i$

通常，前10%~1%的奇异值的和就占了全部的奇异值之和的99%以上，所以，经常用部分奇异值分类来近似矩阵X。得到的分解公式：

X_{n*m} = U_{n*r}S_{r*r}V_{r*m}^{T}

python可以通过调用numpy实现SVD：

import numpy as np
la = np.linalg
words = [“I”,”like”,”enjoy”,”deep”,”learning”,”NLP”,”flying”,”.”]
X = np.array([0,2,1,0,0,0,0,0],
                       [2,0,0,1,0,1,0,0],
                       [1,0,0,0,0,0,1,0],
                       [0,1,0,0,1,0,0,0],
                       [0,0,0,1,0,0,0,1],
                       [0,1,0,0,0,0,0,1],
                       [0,0,1,0,0,0,0,1],
                       [0,0,0,0,1,1,1,0])
U, s, vh = la.svd(X, full_matrices=False)

对于出现频率很高的词，例如“the”“she”“has”等，对X有很大的影响，所以经常采用几种补救方法：

设置词频阈值，高于阈值用阈值取代
忽略这些无意义的高频词
滑动窗口使用斜坡窗口，即越靠近中心词，计数越多，远离中心词的词计数减少
使用皮尔逊系数代替计数统计，将小于0的皮尔逊系数设置为0。

SVD存在的问题

计算复杂度高，当n*m大小的共现矩阵，耗费 $O(mn^2)$ 的复杂度
对新词或者新文档难处理

SVD缺点的解决办法存在很多，与本课程和深度学习相关的主要有以下：

Learning representations by back-propagating errors.(Rumelhart et al., 1986)
A neural probabilistic language model (Bengio et al ., 2003)
NLP from scratch (Collobert & Weston, 2008)
A recent and even simpler model: word2vec (Mikolov et al., 2013)

word2vec

word2vec就是接下来我们要介绍的重点。

word2vec的主要思想是：对每个词，预测周围可能出现的词，而不是计算共现矩阵。这样，对于新词、新出现的句子和文档，也可以快速及时处理。

对于大小为c的窗口，预测目标词的上下文可能出现的词，目标函数为：

$J(\theta) = \frac{1}{T}\sum_{t=1}^T\sum_{-c\leq{j}\leq{c},j \neq0}logp(w_{t+j}|w_t)$

即，最大化给定中心词的任意上下文词的概率。对于 $p(w_{t+j}|w_t)$ 最简单的公式为：

$p(w_O|w_I)=\frac{exp(u_{O}^Tv_{I})}{\sum_{w=1}^{W}exp(u_w^Tv_{I})}$

就是softmax函数形式，其中 $u$ 和 $v$ 分别表示词的输入向量和输出向量（每个词都有两个向量，这点很重要！）

想要优化目标函数，我们需要对公式求导求梯度，在推导的过程中，有两个知识点需要掌握：

矩阵求导 $\frac{\partial{X^Ta}}{\partial{X}} = \frac{\partial{a^TX}}{\partial{X}} = a$
链式法则 $\frac{dy}{dx} = \frac{dy}{du}\frac{du}{dx}$

对概率p进行求导：

$\frac{\partial{p(o|c)}}{\partial{v_c}} = \frac{\partial}{\partial{v_c}}log(\frac{exp(u_o^Tv_c)}{\sum_{w=1}^{W}exp(u_w^Tv_c)})$

$\frac{\partial}{\partial{v_c}}(log(exp(u_o^Tv_c)) - log(\sum_{w=1}^{W}exp(u_w^Tv_c)))$

$u_o - \frac{1}{\sum_{w=1}^Wexp(u_w^Tv_c)}\frac{\partial}{\partial{v_c}}\sum_{x=1}^Wexp(u_x^Tv_c)$

$u_o - \frac{1}{\sum_{w=1}^Wexp(u_w^Tv_c)}\sum_{x=1}^W\frac{\partial}{\partial{v_c}}exp(u_x^Tv_c)$

$u_o - \frac{1}{\sum_{w=1}^Wexp(u_w^Tv_c)}\sum_{x=1}^Wexp(u_x^Tv_c)u_x$

$u_o - \sum_{x=1}^W\frac{exp(u_x^Tv_c)}{\sum_{w=1}^Wexp(u_w^Tv_c)}u_x$

$=u_o - \sum_{x=1}^Wp(x|c)u_x$

在第三步，使用x代替w，防止与前面求和的w混淆；在第六步对求和做简化。

具体梯度求导在Lecture 3中还会做详细介绍。

从公式中可以看出，需要所有的词做求和，当词典数量很大的时候，目标函数不可扩展，训练速度很慢。解决这个问题有两种方法，一是对归一化做近似，二是仅采样少量负样本。在作业一种，我们会推导实现负采样。

word2vec的神奇之处

word2vec学习得到的词向量非常擅长于相似性计算。主要表现在类比和语义两个方面。例如：

语法空间上的类比性。

$X_{apple} - X_{apples}\approx X_{car} - X_{cars}$
形态学语义上的相似性。

$X_{king} - X_{man} = X_{queen} - X_{woman}$

Glove

Glove这里只是简单提了一下，它的目标函数是：

$\frac{1}{2}\sum_{ij}f(P_{ij})(w_i{\cdot}\tilde{w_j} - logP_{ij})^2$

几种得到词向量方法的对比

共现次数

代表方法有LSA、HAL、COALS、Hellinger-PCA。训练速度快，有效的利用了统计学，主要用于获取词之间的相似性，不利于低频词。
直接推导

代表方法有NNLM、HLBL、RNN、Skip-gram/CBOW。对于不同大小的数据集可扩展，没有利用统计学，在其他任务上表现有较好，能够获取词的复杂模式，例如类比关系。
Glove

训练速度快，对大文档集可扩展，对小文档或者低维向量表现也不错。

词向量是我们接下来学习的每节课的基础，所有的语义表达和NLP任务都会基于词向量来完成。深度学习得到的词向量的最大的好处就是可以在神经网络中传播他们本身带有的信息，具体内容下节课将会介绍。

Iteration Based Method

我们尝试建立一个能够迭代学习的模型，根据中心词的上下文来预测中心词出现的概率。这个概率模型有已知的参数和未知的参数，我们每次使用一个训练样本，根据输入信息、输出信息和期望得到的输出信息，来学习未知的参数。

一元、二元语言模型

例如存在这样一个句子：“The cat jumped over the puddle. ”，从语法和语义上说，这个句子是个不错的句子，它的概率应该是一个较高的值。用数学公式来表达，一个n个词组成的句子的概率为：

$P(w^{(1)}, w^{(2)}, …, w^{(n)}) = \prod_{i=1}^n{P(w^{(i)})}$

这就是一元模型（Unigram model）。一元模型依赖的假设条件是词与词之间是相互独立的。但是在现实中，这种假设基本不成立。所以就有了二元模型（bigram model）：

$P(w^{(1)},w^{(2)},…,w^{(n)}) = \prod_{i=2}^n{P(w^{(i)}|w^{(i-1)})}$

虽然二元模型还是没有利用整个句子的信息，但是比一元模型进步很多。

接下来介绍两种能过学习到句子概率的模型。

CBOW

还是以上节中的句子为例，假设中心词为“jumped”，窗口C取2，那么上下文为{“The”，“cat”，“over”，“the”}，CBOW就是根据上下文预测中心词。

首先，定义已知参数：

$x^{(i)}$ : 上下文词的one-hot vectors
$ y^{(i)} $: 中心词的one-hot Vector
$w^{(i)}$ : 词典V中的词i

定义未知参数：

$W^{(1)}$ :大小为n * |V|，输入词向量矩阵
$u^{(i)}$ : $W^{(1)}$ 的第i列向量，也是词 $w^{(i)}$ 的输入向量表达。
$W^{(2)}$ :大小为|V|*n，输出词向量矩阵
$v^{(i)}$ : $W^{(2)}$ 的第i航向量，也是词 $w^{(i)}$ 的输出向量表达。

注意：每个词都有两个向量，输入向量u和输出向量v。

我们将CBOW模型分解为以下步骤：

对窗口大小C的上下文，生成one-hot矩阵 $x^{(i-C)}, …,x^{(i-1)},x^{(i+1)},…,x^{(i+C)})$
one-hot向量左乘输入矩阵 $W^{(1)}$ ，即可得到上下文的词向量 $u^{(i-C)}=W^{(1)}x^{(i-C)}, u^{(i-C+1)}=W^{(1)}x^{(i-C+1)}, …, u^{(i+C)}=W^{(1)}x^{(i+C)}$
对上下文的词向量求平均 $h=\frac{u^{(i-C)} + … u^{(i+C)}}{2C}$
根据输出矩阵 $W^{(2)}$ 生成得分向量 $z=W^{(2)}h$
将得分转化为概率， $\hat{y} = softmax(z)$

现在我们知道了CBOW模型是如何工作的，那么怎样学习到参数 $W^{(1)}$ 和 $W^{(2)}$ 呢？

首先，我们需要创建目标函数。从真实概率分布中学习未知概率分布，我们通常会根据信息论从中选择两个分布的距离度量函数，这里，我们选择交叉熵作为目标函数：

$H(\hat{y}, y) = - \sum_{j=1}^{|V|}y_ilog(\hat{y_j})$

因为y是one-hot向量，所以上面式子可以简化为：

$H(\hat{y}, y) = - y_ilog(\hat{y_j})$

因为 $y_i$ 是1，所以优化目标为：

$minimize J = - logP(w^{(i)} | w^{(i-C)},…, w^{(i-1)},w^{(i+1)},…,w^{(i+C)})$

$log P(v^{(i)} | h)$

$log\frac{exp(v^{(i)T}h)}{\sum_{j=1}^{|V|}{exp(v^{(i)T}u^{(j)})}}$

$v^{(i)T}h + log\sum_{j=1}^{|V|}exp(v^{(i)T}u^{(j)})$

接下来的问题就是，如何用梯度下降优化目标函数？

这里解释一下为什么可以用交叉熵作为目标函数？如果预测准确， $\hat{y}=1$ ,我们可以计算损失也就是交叉熵 $H(\hat{y}, y) = -1log(1) = 0$ , 如果预测不准确，假设 $\hat{y}=0.01$ ,交叉熵 $H(\hat{y},y) = -1log(0.01) \approx {4.605}$ . 所以，对于概率分布的距离，交叉熵有很好的表现。

Skip-gram

与CBOW不同的是，Skip-gram模型是根据中心词预测上下文的词出现的概率。参数的定义同上，我们将Skip-gram模型的步骤分解为：

生成中心词的one-hot向量 $x$
得到上下文的词向量 $u^{(i)} = W^{(1)x}$
h设置为 $h = u^{(i)} = W^{(1)}x$
根据 $v=W^{(2)}h$ 生成2C个分数向量， $v^{(i-C), …, v^{i-1}, v^{i+1},…,v{(i+C)}}$
将每个词的得分转化为概率， $y = s o f t m a x (v)$

同样的，我们将生成的概率与真是的上下文的词作比较，希望得到匹配的结果。

与CBOW的目标函数不同，Skip-gram使用了贝叶斯假设来推导概率，假设条件独立。换句话说，给定中心词，它的上下文词之间的关系是独立的。我们可以得到优化函数：

$minimize J = -logP(w^{(i-C)},…,w^{(i-1)}, w^{(i+1)},…,w^{(i+c)} | w^{(i)})$

${\prod_{j=0,j\neq{C}}^{2C}{P(w^{(i-C+j)}|w^{(i)})}}$

$\prod_{j=0,j\neq{C}}^{2C}{P(v^{(i-c+j)}|u^{(i)})}$

$\prod_{j=0,j\neq{C}}^{2C}{\frac{exp(v^{(i-C+j)T}u^{(i)})}{\sum_{k=1}^{|V|}{exp(v^{(k)T}u^{(i)})}}}$

$\sum_{j=0,j\neq{C}}^{2C}v^{(i-C+j)T}u^{(i)} + 2Clog\sum_{k=1}^{|V|}exp(v^{(k)T}u^{(i)})$

同样，在每次迭代中，我们通过计算梯度更新未知参数。

Negative Sample

回顾上述两种模型的目标函数可以发现，在迭代更新的过程中，需要计算整个词汇集|V|的和，而词的个数通常在百万级别，这就要花费大量的运算时间。一个简单的做法是可以对全部词汇做近似。

在每个训练步骤中，只采样几个负样本来代替遍历整个词汇集。我们从按照词频排序的分布 $P_n{(w)}$ 中采样，把上述的公式和负采样结合在一起，我们只需要更新这些：

目标函数
梯度
更新法则

NS方法是Mikolov et al.在论文Distribution Representations of Words and Phrases and Their Compositionality 中提出的。NS事实上优化的是不同于上面的目标函数。存在一个中心词和上下文词对 $(w, c)$ ，我们用 $P (D = 1 ∣ w, c)$ 表示该词对来自训练集， $P (D = 0 ∣ w, c)$ 表示词对不存在训练数据中，首先，我们用sigmoid函数对概率P建模：

$P(D=1|w,c,\theta) = \frac{1}{1+exp(-v_c^Tv_w)}$

然后，我们建立一个目标函数，来最大化出现在训练集的词对的概率和没有出现在训练集的词对的概率。我们采用简单的最大似然来计算，这里 $\theta$ 就是模型的未知参数，也就是上面的模型中的 $W^{(1)}$ 和 $W^{(2)}$ ，

$\theta = argmax_\theta{\prod_{(w,c)\in{D}}{P(D=1|w,c,\theta)}\prod_{(w,c\notin{D})}{P(D=0|w,c,\theta)}}$

$=argmax_\theta {\prod_{(w,c)\in{D}}{P(D=1|w,c,\theta)}\prod_{(w,c)\notin{D}}{(1-P(D=1|w,c,\theta))}}$

$log\theta = argmax_\theta{\sum_{(w,c)\in{D}}{logP(D=1|w,c,\theta)} + \sum_{(w,c)\notin{D}}{log(1-P(D=1|w,c,\theta))}}$

$=argmax_\theta{ \sum_{(w,c)\in{D}}log{\frac{1}{1+exp(-v_c^Tv_w)}} + \sum_{(w,c)\notin{D}}{log(1 - \frac{1}{1+exp(-v_c^Tv_w)})} }$

$=argmax_\theta{\sum_{(w,c)\in{D}}{log\frac{1}{1+exp(-v_c^Tv_w)}} + \sum_{(w,c)\notin{D}}log\frac{1}{1+exp(v_c^Tv_w)}}$

其中， $(w,c)\notin{D}$ 表示负采样的样本。那么，我们的目标函数就变成了：

$-log\sigma(v^{(i-C+j)}\cdot{h}) + \sum_{k=1}^{K}{log\sigma({\breve{v}^{(k)}}\cdot{h})}$

${\breve{v}^{(k)}|k=1…K}$ 表示从分布 $P_n(w)$ 采样的 $K$ 个负样本。

关于什么样的分布 $P_n(w)$ 能够使得近似效果最好的讨论有很多，看起来最好的方法是一元模型值取3/4次方，3/4能够使得低频词的采样几率被提高。

关于堆的判断秋说 PTA 数据结构题目集算法数据结构 c语言
本专栏持续输出数据结构题目集，欢迎订阅。文章目录题目代码题目将一系列给定数字顺序插入一个初始为空的最小堆。随后判断一系列相关命题是否为真。命题分下列几种：xistheroot：x是根结点；xandyaresiblings：x和y是兄弟结点；xistheparentofy：x是y的父结点；xisachildofy：x是y的一个子结点。输入格式：每组测试第1行包含2个正整数n（≤1000）和m（≤20
2024 睿抗机器人开发者大赛CAIP-编程技能赛-本科组（省赛）RC-u3题解 EarthOnline玩家机器人 java 开发语言
题目：暖炉与水豚源题目地址：https://pintia.cn/problem-sets/1813039306479005696/exam/problems/type/7?problemSetProblemId=1813039385617129474问题描述给定一个N×M的矩阵，包含水豚（‘c’表示冷，‘w’表示暖）、暖炉（‘m’）和空格（’.’）。暖炉可以温暖其3×3范围内的水豚。题目保证最多只
树1 树的同构 C++实现
树1树的同构C++实现#题目给定两棵树T1和T2。如果T1可以通过若干次左右孩子互换就变成T2，则我们称两棵树是“同构”的。例如图1给出的两棵树就是同构的，因为我们把其中一棵树的结点A、B、G的左右孩子互换后，就得到另外一棵树。而图2就不是同构的。图1图2现给定两棵树，请你判断它们是否是同构的。输入格式:输入给出2棵二叉树树的信息。对于每棵树，首先在一行中给出一个非负整数N(≤10)，即该树的结点
03-树1 树的同构 CO₂ PTA 树的同构
03-树1树的同构（25分)给定两棵树，请你判断它们是否是同构的。输入格式:输入给出2棵二叉树树的信息。对于每棵树，首先在一行中给出一个非负整数N(≤10)，即该树的结点数（此时假设结点从0到N−1编号）；随后N行，第i行对应编号第i个结点，给出该结点中存储的1个英文大写字母、其左孩子结点的编号、右孩子结点的编号。如果孩子结点为空，则在相应位置上给出“-”。给出的数据间用一个空格分隔。注意：题目保
人工智能入门指南：从基础概念到实际应用
前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站。https://www.captainbed.cn/north文章目录1.**人工智能的基本概念**1.1什么是人工智能？1.2人工智能的分类2.**人工智能的核心技术**2.1机器学习（MachineLearning）2.1.1机器学习的类型2.1.2机器学习流程2.2深度学习（DeepLearni
7-1 树的同构 studyovo_Hz hbu数据结构 c++算法数据结构
7-1树的同构分数20作者陈越单位浙江大学给定两棵树T1和T2。如果T1可以通过若干次左右孩子互换就变成T2，则我们称两棵树是“同构”的。例如图1给出的两棵树就是同构的，因为我们把其中一棵树的结点A、B、G的左右孩子互换后，就得到另外一棵树。而图2就不是同构的。现给定两棵树，请你判断它们是否是同构的。输入格式:输入给出2棵二叉树树的信息。对于每棵树，首先在一行中给出一个非负整数N(≤10)，即该树
十种常用数据分析模型耐思nice～数据分析数据分析人工智能机器学习数学建模
1-线性回归（LinearRegression）场景：预测商品销售额优点：简单易用，结果易于解释缺点：假设线性关系，容易受到异常值影响概念：建立自变量和因变量之间线性关系的模型。公式：[y=b_0+b_1x_1+b_2x_2+...+b_nx_n]代码示例：importpandasaspdfromsklearn.linear_modelimportLinearRegressionfromsklea
每天学习点销售技巧：潜水艇销售法 V叔能量圈
文/巍巍昆仑日更D11每个人都离开销售技巧，即使你不从事销售工作，因为我们平台工作与生活，都要与人打交道，销售就是让人与人沟通更顺畅，彼此达到双赢多赢合作。潜水艇销售法一、建立与客户亲和信任客户成交的前提是建立彼此信任，信任从几个方面入手，对公司信任，对产品信任，对销售人员信任，成交就是成功交换价值，客户提供金钱，我们提供产品和服务，客户对我们产品和服务满意，就会重复购买，同时介绍一些其他客户进行
Java与机器学习的邂逅：Weka框架入门指南墨夶 Java学习资料1 java 机器学习数据挖掘
在这个数据驱动的时代，机器学习已经成为各行业创新和优化的关键技术。而Java，作为一门成熟且广泛应用的编程语言，在企业级应用开发中占据着重要地位。将二者结合起来，利用Java实现机器学习算法，不仅可以充分发挥其强大的生态系统优势，还能为开发者提供一个高效、稳定的开发环境。今天，我们将带您走进Java与机器学习的世界，探索如何使用Weka这一著名的机器学习库来开启您的智能之旅。Weka简介及其优势什
《父母的语言》20190617 D5 小鱼_4ac5
轮流谈话，轮流谈话是三丅原则中最重要的一个原则，成功的关键在于父母必须耐心等待孩子的回应，随着孩子慢慢长大，轮流谈话的方式也要发生变化在轮流谈话中，不是所有的话语都有利于他的开展，例如这是什么？等询问什么类别的疑问，对于谈话的人体以及孩子词汇的积累是没有好处的，相反，开放式的话题能够完美的实现轮流谈话的目的，只需将怎么办？和为什么抛给孩子，让孩子能够独立思考并学会解决问题，大脑的营养源来自于一个良
2025年睿抗机器人开发者大赛CAIP-编程技能赛(省赛)-RoboCom 世界机器人开发者大赛-本科组小竹子14 算法 c++数据结构
RC-u1早鸟价代码#include"bits/stdc++.h"usingnamespacestd;intmain(){intn;cin>>n;intm,d,q;while(n--){cin>>m>>d>>q;if(m>7||m==7&&d>11){cout>T;intn,s;intcnt=0;intp,f;intsumm=0;while(T--){cin>>n>>s;intm=n;cnt=0;
Python基础和高级【抽取复习】斟的是酒中桃 python 学习
1.Python的深拷贝和浅拷贝有什么区别？浅拷贝【ls.copy()】：将列表的不可变对象【值】复制一份，同时引用其中的可变对象【列表】，共用一个内存地址深拷贝【ls=copy.deepcopy(list)】：完全的复制原可变对象，生成新的可变对象，两个对象互相独立2.列表和元组的区别是什么？1.列表概念：有序序列，使用[]定义，元素之间用，隔开有序序列增删改操作：可以增删改列表的任意元素不可变
《论语》日日谈第63期 wuhuaping9807
《论语》日日谈第63期本章为《论语》：雍也篇第六篇第九章【原文】季氏使闵子骞为费宰①。闵子骞曰．“善为我辞焉。如有复我者，则吾必在汶上矣②。”【注释】①闵子骞(qiān)：孔子的学生，姓闵，名损，字骞。费．季氏的封邑，在今山东省费县西北。②汶：汶水，即今山东大汶河。汶上，暗指齐国。【翻译】季氏派人通知闵子骞，让他当季氏采邑费城的长官。闵子骞告诉来人说：“好好地为我推辞掉吧！如果再有人为这事来找我，
FPGA相关通信问题详解霖12 fpga开发笔记信号处理信息与通信学习开发语言
首先感谢大佬@征途黯然.-CSDN博客的就我的上篇文章《FPGA通信设计十问》提出的问题，我在此做出回复一.解释FFT（快速傅里叶变换）如何在FPGA的IP核中高效实现FFT作为将时域信号转换为频域的核心算法，其在FPGA中的高效实现依赖于硬件架构与算法特性的深度适配。1.流水线架构：提升吞吐量FFT的核心是“蝶形运算”，其计算过程可分解为log2(N)级（N为FFT点数），每级包含N/2次蝶形运
华为OD机试 2025 B卷 - We are a Team (C++ & Python & JAVA & JS & GO) 无限码力华为OD机试真题刷题笔记华为od 华为OD2025B卷华为OD机考2025B卷华为OD机试2025B卷华为OD机试
WeareaTeam华为OD机试真题目录点击查看:华为OD机试2025B卷真题题库目录｜机考题库+算法考点详解华为OD机试2025B卷100分题型题目描述总共有n个人在机房，每个人有一个标号（1<=标号<=n），他们分成了多个团队，需要你根据收到的m条消息判定指定的两个人是否在一个团队中，具体的：消息构成为abc，整数a、b分别代表两个人的标号，整数c代表指令c==0代表a和b在一个团队内c==1
华为OD 面试手撕真题目录无限码力华为OD面试手撕代码真题合集华为od 面试华为OD面试手撕真题
华为OD面试手撕真题目录，收集的都是实际面试出现过的手撕代码真题，对于是力扣原题的我会在对应题目博客中给出对应对应链接，推荐自己写代码去通过。华为OD机试2025B卷真题题库目录｜机考题库+算法考点详解目录序号题目名称考点1求1-n的最小公倍数数学原理2判断是IPV4还是IPV6字符串、模拟3旋转矩阵模拟4
我的2035 5a5e523094b5
时光转瞬而逝，2035年，我又回到了矿大。随着科技的进步，许许多多的东西也随之发生了改变。首先便是课堂教育了，这个时代，课堂叫做网课课堂。网络课堂是一种新颖的学习课堂，课堂内拥有小学到大学各种的教学资料，课堂由网络设计教师上课。还有就是用5D教学电影，吸引孩子们的眼球，让孩子们身心放松，全心全意的投入到学习当中来。学习上真正体现了寓教娱乐的作用。孩子们可以通过超音速传感装置，把作业传送到教师的办公
vue json格式导出excel文件家电修理师 vue.js json excel 前端 javascript
1、下载xlsx、file-saver插件npminstallxlsxfile-saver2、页面中引入插件import*asXLSXfrom'xlsx';import{saveAs}from'file-saver';3、创建excel导出结构每一个数组表示一行constdata=[["姓名","性别","电话"],["张三","男","15888888888"],];4、将数据转换为工作表//d
3D TOF 安全防护传感器 Laurel Vision 3D TOF 3d 安全计算机视觉
背景3DTOF安全防护传感器是一种先进的传感器技术，主要用于工业自动化、物流仓储、机器人应用等领域。基于3DToF原理，即飞行时间法的传感器，通过测量光脉冲从发射到接收的时间来计算物体与传感器之间的距离，从而获取三维空间信息，实现立体成像。立体安全传感器功能特性：空间安全防护：相比传统二维区域防护，三维立体具有更高安全性和灵活性。高精度：相比激光雷达精度更高，重复精度可达毫米级。简便软件设置
基于探路者算法优化的核极限学习机(KELM)分类算法智能算法研学社（Jack旭）智能优化算法应用机器学习 #核极限学习机（KELM）算法分类数据挖掘
基于探路者算法优化的核极限学习机(KELM)分类算法文章目录基于探路者算法优化的核极限学习机(KELM)分类算法1.KELM理论基础2.分类问题3.基于探路者算法优化的KELM4.测试结果5.Matlab代码摘要：本文利用探路者算法对核极限学习机(KELM)进行优化，并用于分类1.KELM理论基础核极限学习机（KernelBasedExtremeLearningMachine，KELM）是基于极限
Java | Leetcode Java题解之第338题比特位计数 m0_57195758 分享 Java Leetcode 题解
题目：题解：classSolution{publicint[]countBits(intn){int[]bits=newint[n+1];for(inti=1;i<=n;i++){bits[i]=bits[i&(i-1)]+1;}returnbits;}}
LeetCode第338题——比特位计数（Java） m0_52861211 LeetCode刷题笔记 leetcode 算法
题目描述：给你一个整数n，对于001-->12-->10示例2：输入：n=5输出：[0,1,1,2,1,2]解释：0-->01-->12-->103-->114-->1005-->101提示：00时p[n]=p[n/2]//当n为偶数时，n>0时代码：classSolution{publicint[]countBits(intn){int[]result=newint[n+1];intcount=
【3D并排条状图】：附Origin详细画图教程
目录No.1理解3D并排条状图1什么是3D并排条状图2空间坐标系构建3应用场景No.2画图教程1导入数据并绘图2设置绘图细节3设置图例4设置坐标轴No.1理解3D并排条状图1什么是3D并排条状图3D并排条状图，是一种多维数据可视化形式，通过在三维坐标系中并排展示多个数据系列的柱状体，实现三类变量的联合对比分析。这种图表扩展了传统二维并排条状图的表达能力，增加了深度维度（z轴）的信息承载能力。2空间
动态分析软件：DYNA3D_（12）.优化与校准
优化与校准在动态分析软件的二次开发中，优化与校准是提高模型准确性和效率的关键步骤。通过优化，可以减少计算时间、提高计算精度，而校准则确保模型的预测结果与实际试验数据相匹配。本节将详细探讨优化与校准的原理和方法，并提供具体的代码示例和数据样例。优化原理优化是指在有限的计算资源和时间内，通过调整模型参数或结构，使模型达到最佳性能的过程。在动态分析软件中，优化通常涉及以下几个方面：模型参数优化：调整材料
动态分析软件：DYNA3D_（5）.材料模型
材料模型在进行动态分析时，材料模型的选择和定义是至关重要的一步。DYNA3D提供了多种材料模型，以适应不同的物理现象和材料特性。本节将详细介绍几种常用的材料模型，并通过具体的例子说明如何在仿真中进行配置和使用。1.线弹性材料模型线弹性材料模型是最简单的材料模型之一，适用于在小变形范围内线性响应的材料。这种模型假设材料的应力与应变之间存在线性关系，即符合胡克定律。线弹性材料模型通常用于金属材料在低应
Vector/Arraylist/LinkedList 「已注销」 Java面试基础
一．ArrayList与LinkedList区别ArrayList和LinkedList都实现了List接口，他们有以下的不同点：ArrayList是基于索引的数据接口，它的底层是数组。它可以以O(1)时间复杂度对元素进行随机访问。与此对应，LinkedList是以元素列表的形式存储它的数据，每一个元素都和它的前一个和后一个元素链接在一起，在这种情况下，查找某个元素的时间复杂度是O(n)。相对于A
【每日知识】go语言基本语法 2018-06-09 大爬虫Shalom
变量变量的声明：varainta=10fmt.Println("a=",a)varb=20fmt.Println("b=",b)c:=30//自动推导类型fmt.Println("c=",c）Println和Printf的区别a:=12b,c:=13,14fmt.Println(a,b,c)//有自动换行的功能fmt.Printf("%d\n%d\n%d",a,b,c)//打印字符串"%d%d%d
Java:对给定的字符串和给定的模式执行Boyer-Moore搜索算法（附带源码） Katie。 Java算法完整教程 java 开发语言
一、项目背景详细介绍在文本处理与信息检索中，需要在海量文本中高效地查找模式串（Pattern）。经典的朴素搜素在最坏情况下时间复杂度为O(N·M)，效率不够高。Boyer–Moore算法则采用“坏字符”与“好后缀”两种启发规则，从模式尾部匹配开始，通常能大幅跳过不可能匹配的位置，平均时间复杂度接近O(N/M)，在实际应用（如grep、数据库索引）中非常高效。本项目旨在用Java实现Boyer–Mo
Java:实现Ternary search三元搜索算法（附带源码） Katie。 Java算法完整教程算法
一、项目背景详细介绍在计算机科学与软件工程领域，查找算法是最基础也是最重要的模块之一。对于有序数组的查找，经典的二分（Binary）查找算法凭借O(log N)的时间复杂度在许多场景中被广泛应用。另一方面，三元（Ternary）查找作为对二分查找的扩展，将区间划分为三段，每次比对两个“探测点”而非一个，从理论上也能达到对数级时间复杂度。三元查找常用于以下几种场景：函数极值查找当我们要在一个unim
LeetCode 77 Java实现零一魔法 LeetCode java leetcode 开发语言算法
1.题目原题链接：77.组合-力扣（LeetCode）:https://leetcode.cn/problems/combinations/给定两个整数n和k，返回范围[1,n]中所有可能的k个数的组合。（可以按任何顺序返回答案）示例输入：n=4,k=2输出：[[2,4],[3,4],[2,3],[1,2],[1,3],[1,4],]2.题解参考//https://github.com/cc01c
安装数据库首次应用 Array_06 java oracle sql
可是为什么再一次失败之后就变成直接跳过那个要求 enter full pathname of java.exe的界面这个java.exe是你的Oracle 11g安装目录中例如：【F:\app\chen\product\11.2.0\dbhome_1\jdk\jre\bin】下的java.exe 。不是你的电脑安装的java jdk下的java.exe！注意第一次，使用SQL D
Weblogic Server Console密码修改和遗忘解决方法 bijian1013 Welogic
在工作中一同事将Weblogic的console的密码忘记了，通过网上查询资料解决，实践整理了一下。一.修改Console密码打开weblogic控制台，安全领域 --> myrealm -->&n
IllegalStateException: Cannot forward a response that is already committed Cwind java Servlets
对于初学者来说，一个常见的误解是：当调用 forward() 或者 sendRedirect() 时控制流将会自动跳出原函数。标题所示错误通常是基于此误解而引起的。示例代码： protected void doPost() { if (someCondition) { sendRedirect(); } forward(); // Thi
基于流的装饰设计模式木zi_鸣设计模式
当想要对已有类的对象进行功能增强时，可以定义一个类，将已有对象传入，基于已有的功能，并提供加强功能。自定义的类成为装饰类模仿BufferedReader，对Reader进行包装，体现装饰设计模式装饰类通常会通过构造方法接受被装饰的对象，并基于被装饰的对象功能，提供更强的功能。装饰模式比继承灵活，避免继承臃肿，降低了类与类之间的关系装饰类因为增强已有对象，具备的功能该
Linux中的uniq命令被触发 linux
Linux命令uniq的作用是过滤重复部分显示文件内容，这个命令读取输入文件，并比较相邻的行。在正常情况下，第二个及以后更多个重复行将被删去，行比较是根据所用字符集的排序序列进行的。该命令加工后的结果写到输出文件中。输入文件和输出文件必须不同。如果输入文件用“- ”表示，则从标准输入读取。 AD： uniq [选项] 文件说明：这个命令读取输入文件，并比较相邻的行。在正常情况下，第二个
正则表达式Pattern 肆无忌惮_ Pattern
正则表达式是符合一定规则的表达式，用来专门操作字符串，对字符创进行匹配，切割，替换，获取。例如，我们需要对QQ号码格式进行检验规则是长度6~12位不能0开头只能是数字，我们可以一位一位进行比较，利用parseLong进行判断，或者是用正则表达式来匹配[1-9][0-9]{4,14} 或者 [1-9]\d{4,14} &nbs
Oracle高级查询之OVER (PARTITION BY ..) 知了ing oracle sql
一、rank()/dense_rank() over(partition by ...order by ...) 现在客户有这样一个需求，查询每个部门工资最高的雇员的信息，相信有一定oracle应用知识的同学都能写出下面的SQL语句： select e.ename, e.job, e.sal, e.deptno from scott.emp e, (se
Python调试矮蛋蛋 python pdb
原文地址： http://blog.csdn.net/xuyuefei1988/article/details/19399137 1、下面网上收罗的资料初学者应该够用了，但对比IBM的Python 代码调试技巧： IBM：包括 pdb 模块、利用 PyDev 和 Eclipse 集成进行调试、PyCharm 以及 Debug 日志进行调试： http://www.ibm.com/d
webservice传递自定义对象时函数为空，以及boolean不对应的问题 alleni123 webservice
今天在客户端调用方法 NodeStatus status=iservice.getNodeStatus(). 结果NodeStatus的属性都是null。进行debug之后，发现服务器端返回的确实是有值的对象。后来发现原来是因为在客户端，NodeStatus的setter全部被我删除了。本来是因为逻辑上不需要在客户端使用setter，结果改了之后竟然不能获取带属性值的
java如何干掉指针，又如何巧妙的通过引用来操作指针————>说的就是java指针百合不是茶
C语言的强大在于可以直接操作指针的地址，通过改变指针的地址指向来达到更改地址的目的,又是由于c语言的指针过于强大，初学者很难掌握， java的出现解决了c，c++中指针的问题 java将指针封装在底层，开发人员是不能够去操作指针的地址，但是可以通过引用来间接的操作：定义一个指针p来指向a的地址（&是地址符号）：
Eclipse打不开，提示“An error has occurred.See the log file ***/.log” bijian1013 eclipse
打开eclipse工作目录的\.metadata\.log文件，发现如下错误： !ENTRY org.eclipse.osgi 4 0 2012-09-10 09:28:57.139 !MESSAGE Application error !STACK 1 java.lang.NoClassDefFoundError: org/eclipse/core/resources/IContai
spring aop实例annotation方法实现 bijian1013 java spring AOP annotation
在spring aop实例中我们通过配置xml文件来实现AOP，这里学习使用annotation来实现，使用annotation其实就是指明具体的aspect,pointcut和advice。1.申明一个切面(用一个类来实现)在这个切面里,包括了advice和pointcut AdviceMethods.jav
[Velocity一]Velocity语法基础入门 bit1129 velocity
用户和开发人员参考文档 http://velocity.apache.org/engine/releases/velocity-1.7/developer-guide.html 注释 1.行级注释## 2.多行注释#* *# 变量定义使用$开头的字符串是变量定义，例如$var1, $var2, 赋值使用#set为变量赋值，例
【Kafka十一】关于Kafka的副本管理 bit1129 kafka
1. 关于request.required.acks request.required.acks控制者Producer写请求的什么时候可以确认写成功，默认是0， 0表示即不进行确认即返回。 1表示Leader写成功即返回，此时还没有进行写数据同步到其它Follower Partition中 -1表示根据指定的最少Partition确认后才返回，这个在 Th
lua统计nginx内部变量数据 ronin47 lua nginx　统计
server { listen 80; server_name photo.domain.com; location /{set $str $uri; content_by_lua ' local url = ngx.var.uri local res = ngx.location.capture(
java-11.二叉树中节点的最大距离 bylijinnan java
import java.util.ArrayList; import java.util.List; public class MaxLenInBinTree { /* a. 1 / \ 2 3 / \ / \ 4 5 6 7 max=4 pass "root"
Netty源码学习-ReadTimeoutHandler bylijinnan java netty
ReadTimeoutHandler的实现思路：开启一个定时任务，如果在指定时间内没有接收到消息，则抛出ReadTimeoutException 这个异常的捕获，在开发中，交给跟在ReadTimeoutHandler后面的ChannelHandler，例如 private final ChannelHandler timeoutHandler = new ReadTim
jquery验证上传文件样式及大小(好用) cngolon 文件上传 jquery验证
<!DOCTYPE html> <html> <head> <meta http-equiv="Content-Type" content="text/html; charset=utf-8" /> <script src="jquery1.8/jquery-1.8.0.
浏览器兼容【转】 cuishikuan css 浏览器 IE
浏览器兼容问题一：不同浏览器的标签默认的外补丁和内补丁不同问题症状：随便写几个标签，不加样式控制的情况下，各自的margin 和padding差异较大。碰到频率:100% 解决方案：CSS里 *{margin:0;padding:0;} 备注：这个是最常见的也是最易解决的一个浏览器兼容性问题，几乎所有的CSS文件开头都会用通配符*来设
Shell特殊变量：Shell $0, $#, $*, $@, $?, $$和命令行参数 daizj shell $#$?特殊变量
前面已经讲到，变量名只能包含数字、字母和下划线，因为某些包含其他字符的变量有特殊含义，这样的变量被称为特殊变量。例如，$ 表示当前Shell进程的ID，即pid，看下面的代码： $echo $$ 运行结果 29949 特殊变量列表变量含义 $0 当前脚本的文件名 $n 传递给脚本或函数的参数。n 是一个数字，表示第几个参数。例如，第一个
程序设计KISS 原则-------KEEP IT SIMPLE, STUPID! dcj3sjt126com unix
翻到一本书，讲到编程一般原则是kiss：Keep It Simple, Stupid.对这个原则深有体会，其实不仅编程如此，而且系统架构也是如此。 KEEP IT SIMPLE, STUPID! 编写只做一件事情，并且要做好的程序；编写可以在一起工作的程序，编写处理文本流的程序，因为这是通用的接口。这就是UNIX哲学.所有的哲学真正的浓缩为一个铁一样的定律，高明的工程师的神圣的“KISS 原
android Activity间List传值 dcj3sjt126com Activity
第一个Activity： import java.util.ArrayList;import java.util.HashMap;import java.util.List;import java.util.Map;import android.app.Activity;import android.content.Intent;import android.os.Bundle;import a
tomcat 设置java虚拟机内存 eksliang tomcat 内存设置
转载请出自出处：http://eksliang.iteye.com/blog/2117772 http://eksliang.iteye.com/ 常见的内存溢出有以下两种: java.lang.OutOfMemoryError: PermGen space java.lang.OutOfMemoryError: Java heap space ------------
Android 数据库事务处理 gqdy365 android
使用SQLiteDatabase的beginTransaction()方法可以开启一个事务，程序执行到endTransaction() 方法时会检查事务的标志是否为成功，如果程序执行到endTransaction()之前调用了setTransactionSuccessful() 方法设置事务的标志为成功则提交事务，如果没有调用setTransactionSuccessful() 方法则回滚事务。事
Java 打开浏览器 hw1287789687 打开网址 open浏览器 open browser 打开url 打开浏览器
使用java 语言如何打开浏览器呢? 我们先研究下在cmd窗口中,如何打开网址使用IE 打开 D:\software\bin>cmd /c start iexplore http://hw1287789687.iteye.com/blog/2153709 使用火狐打开 D:\software\bin>cmd /c start firefox http://hw1287789
ReplaceGoogleCDN：将 Google CDN 替换为国内的 Chrome 插件 justjavac chrome Google google api chrome插件
Chrome Web Store 安装地址： https://chrome.google.com/webstore/detail/replace-google-cdn/kpampjmfiopfpkkepbllemkibefkiice 由于众所周知的原因，只需替换一个域名就可以继续使用Google提供的前端公共库了。同样，通过script标记引用这些资源，让网站访问速度瞬间提速吧
进程VS.线程 m635674608 线程
资料来源： http://www.liaoxuefeng.com/wiki/001374738125095c955c1e6d8bb493182103fac9270762a000/001397567993007df355a3394da48f0bf14960f0c78753f000 1、Apache最早就是采用多进程模式 2、IIS服务器默认采用多线程模式 3、多进程优缺点优点：多进程模式最大
Linux下安装MemCached 字符串 memcached
前提准备：1. MemCached目前最新版本为：1.4.22，可以从官网下载到。2. MemCached依赖libevent，因此在安装MemCached之前需要先安装libevent。2.1 运行下面命令，查看系统是否已安装libevent。[root@SecurityCheck ~]# rpm -qa|grep libevent libevent-headers-1.4.13-4.el6.n
java设计模式之--jdk动态代理（实现aop编程） Supanccy2013 java DAO 设计模式 AOP
与静态代理类对照的是动态代理类，动态代理类的字节码在程序运行时由Java反射机制动态生成，无需程序员手工编写它的源代码。动态代理类不仅简化了编程工作，而且提高了软件系统的可扩展性，因为Java 反射机制可以生成任意类型的动态代理类。java.lang.reflect 包中的Proxy类和InvocationHandler 接口提供了生成动态代理类的能力。 &
Spring 4.2新特性-对java8默认方法(default method)定义Bean的支持 wiselyman spring 4
2.1 默认方法(default method) java8引入了一个default medthod; 用来扩展已有的接口,在对已有接口的使用不产生任何影响的情况下,添加扩展使用default关键字 Spring 4.2支持加载在默认方法里声明的bean 2.2 将要被声明成bean的类 public class DemoService {