jessie_weiqing

【笔记3-2】CS224N课程笔记+作业参考代码 - 词向量表示 word2vec

CS224N（二）Word Vectors

如何表示字的含义
基于SVD的方法
基于迭代的方法 - Word2vec

CBOW (continuous bag of words)
skip-gram

梯度的推导过程
skip-gram和CBOW的改进
Assignment 1 参考代码

【笔记3-1】CS224N课程笔记 - 深度自然语言处理
【笔记3-3】CS224N课程笔记 - 高级词向量表示
【笔记3-4】CS224N课程笔记 - 分类与神经网络
【笔记3-5】CS224N课程笔记 - 依存分析
【笔记3-6】CS224N课程笔记 - RNN和语言模型
【笔记3-7】CS224N课程笔记 - 神经机器翻译seq2seq注意力机制
【笔记3-8】CS224N课程笔记 - 卷积神经网络

CS224n：深度学习的自然语言处理（2017年冬季）1080p https://www.bilibili.com/video/av28030942/

涉及到的论文：

Efficient Estimation of Word Representations in Vector Space (2013,Tomas Mikolov, Kai Chen, Greg Corrado, Jeffrey Dean)
https://arxiv.org/pdf/1301.3781.pdf

Distributed Representations of Words and Phrases and their Compositionality (2013, Tomas Mikolov, Ilya Sutskever, Kai Chen, Greg Corrado, Jeffrey Dean)
https://arxiv.org/pdf/1310.4546.pdf
关键词：词向量，SVD，skip-gram，CBOW，负采样，word2vec，hierarchical softmax

如何表示字的含义

meaning=denotation:
signifier (symbol) $\Leftrightarrow$ signified (idea or thing)
Usable meaning in computer:
以往会使用WordNet来查找同义词以及重名词

WorldNet的缺点:

缺乏字词之间的细微差别
丢失字词的新含义
带有主观色彩
需要大量的人力劳动进行标注
难以准确计算字词之间的相似性

出发点：字典里面有许多不同的单词，如果要对字典里的N个单词进行表示，需要将其映射到一个N维的空间，但是，实际上很多单词之间存在关联，由此出发，必定存在一个K维的空间，K<

字词的离散型符号表示:
独热码向量表示： 向量的维度 = 字典当中单词的个数。
根据字典中单词的个数N构造一个N维的向量，对于第i个单词，在第i维对该单词赋值为1，其余值为零。由于只有一个数字为1，称为独热码，即one-hot vector。

缺点: 所有向量之间都是正交的，无法获取词语之间的相似性。
解决方法: 自动学习向量之间的相似性表示，用更低维度的向量来表示每一个单词。

用上下文来表示单词:
由于单词的意思可以通过上下文来得到反映，因此可以使用单词周边的上下文来对中心词的词表示进行构建。

构建词向量的方法: (word embedding/representation)
对每一个单词构建一个密集向量，使得会出现在相同的上下文当中的具有相同含义的词语具有相似的向量表示。

基于SVD的方法

对于SVD构造的词向量，先对整个数据集进行遍历，并统计所有单词的共现现象，来生成一个矩阵X。然后对这个矩阵进行奇异值分解，即 $X = USV^T$ ，然后取矩阵U的行向量作为整个字典中单词的词向量表示。

矩阵X的构造方法：

构造单词-文档矩阵
这个矩阵构造方法基于一个假设，即认为相似的单词总是会经常在一个文档当中同时出现，所以在构造的时候会遍历所有的M个文档，看字典中的V个单词是否在文档中出现过，对于每个单词i在文档j中出现一次，就对Xij加一。但是这样构造出来的矩阵会十分庞大 $\in \mathbb{R}^{V*M}$ 因此需要采用一个更好的X矩阵的构造方式。
基于窗口的共现矩阵
这个方法的思想和前面所述的方法类似，但是不再是对所有文档进行遍历，而是对单词窗口内的共现单词进行统计。步骤如下：
（1）构造一个维度V x V的共现矩阵X
（2）对X进行SVD，得到 $X = USV^T$
（3）选择矩阵U的前K列作为K维的单词向量表示
（4）得到K维的向量表示之后， $\frac{\sum_{i=1}^{k}\sigma_i}{\sum_{i=1}^{|V|}\sigma_i}$ 代表该K维向量表示所包含的字典整体的方差比例。

上述方法能够给我们提供单词的语义和词性信息，但是这个方法依旧存在一定的问题：

X矩阵的经常需要根据新单词的加入而不断改变
由于很多词语是不经常一起出现的，因此构造出来的X矩阵会十分稀疏
构造出来的矩阵往往维度很高
对矩阵X进行SVD分解时，计算量较大
需要处理X构造时某些词语经常出现的问题，如the, a等

因此提出基于迭代的方法-word2vec来解决上述问题。

基于迭代的方法 - Word2vec

与上述需要遍历整个文档库的SVD方法不同，word2vec的方法每次迭代都会对单词基于上下文的概率进行更新。

大致思想：设计一个模型，用模型的参数来作为单词的向量表示，然后对模型进行训练，在每次迭代中根据loss对参数进行更新，最终得到的更新过后的参数就是单词的向量表示。

word2vec当中包含两种算法：CBOW（根据上下文词汇的词向量来预测中心词）skip-gram（根据中心词来预测上下文单词的概率分布）
还包含两种训练方法：负采样（通过采集负样本来构造新的目标函数）分层softmax（使用不对称的树结构来高效地计算每个词出现的概率）

CBOW (continuous bag of words)

CBOW是根据上下文预测或生成中心词的方法。

对于输入的上下文单词（窗口大小为m）生成其对应的独热码 $(x^{(c-m)},......,x^{(c-1)},x^{(c+1)},......,x^{(c+m)})\in \mathbb{R}^{|V|}$
构建两个矩阵， $V\in\mathbb{R}^{n*|V|},U\in\mathbb{R}^{|V|*n}$ ，其中，n为构造的词嵌入空间的维度，V为输入单词矩阵，其中第i列为单词 $w_i$ 作为模型输入时的n维词嵌入向量 $v_i$ ，U为输出单词矩阵，第j行为单词 $w_i$ 作为模型输出时的n维词嵌入向量 $u_i$ ，因此每个单词作为输入和输出时分别有两个向量。据此得到上下文的词嵌入向量 $(v_{c-m}=Vx^{(c-m)},v_{c-m+1}=Vx^{(c-m+1)},......,v_{c+m}=Vx^{(c+m)}\in \mathbb{R}^n)$
对上下文向量进行平均 $\hat{v}=\frac{v_{c-m}+v_{c-m+1}+...+v_{c+m}}{2m}\in\mathbb{R}^n$
生成一个分值向量 $z=U\hat{v}\in\mathbb{R}^{|V|}$
将分值向量转换成概率 $\hat{y}=softmax(z)\in \mathbb{R}^{|V|}$ ，使输出的概率向量向真实输出的独热码靠近。

了解CBOW的算法之后，就是对矩阵U和V的构造过程，需要根据目标损失函数使用梯度下降的方法求解。

根据信息论当中对两个分布的距离的计算方法，使用交叉熵来计算损失函数： $H(\hat{y},y)=-\sum_{j=1}^{|V|}y_jlog(\hat{y}_j)=-y_ilog(\hat{y}_i)$ 因此优化目标为： $-logP(w_c|w_{c-m},...,w_{c-1},w_{c+1},...,w_{c+m})\\ =-logP(u_c|\hat{v})=-log\frac{exp(u_c^T\hat{v})}{\sum_{j=1}^{|V|}exp(u_j^T\hat{v})}\\ =-u_c^T\hat{v}+log\sum_{j=1}^{|V|}exp(u_j^T\hat{v})$ 优化的过程中使用SGD对参数进行更新。

skip-gram

思想与CBOW类似，但是这里是利用中心词来对上下文单词出现的概率进行预测。

对中心词生成其对应的独热码向量 $x\in \mathbb{R}^{|V|}$
对中心词生成其对应的词嵌入向量 $v_c=Vx\in \mathbb{R}^n$
生成一个分值向量 $z = Uv_c$
将分值向量变成概率分布 $\hat{y}=softmax(z)$ ，需要注意的是，这里生成的概率 $\hat{y}_{c-m},...,\hat{y}_{c-1},\hat{y}_{c+1},...,\hat{y}_{c+m}$ 是每一个上下文单词对应的概率
要使得上面生成的上下文单词的概率接近真实的上下文单词的独热码

同样的，定义目标函数： $minJ=-logP(w_{c-m},...,w_{c-1},w_{c+1},...,w_{c+m}|w_c)\\=-log\prod_{j=0.j\neq m}^{2m}P(w_{c-m+j}|w_c)\\=-log\prod_{j=0,j\neq m}^{2m}P(u_{c-m+j}|v_c)\\=-log\prod_{j=0,j\neq m}^{2m}\frac{exp(u_{c-m+j}^Tv_c)}{\sum_{k=1}^{|V|}exp(u_k^Tv_c)}\\=-\sum_{j=0,j\neq m}^{2m}u_{c-m+j}^Tv_c+2mlog\sum_{k=1}^{|V|}exp(u_k^Tv_c)$ 同样的，对于这个目标函数，也可以使用SGD来进行优化和参数更新。

skip-gram示例:

本例中, $w_t$ = “into”, 是前面提到过的中心词 c.
中心词会随着遍历位置的改变而不断改变 (中心词： “into” --> “banking” --> “crises”…)

注意: 最小化目标函数 $\Leftrightarrow$ 最大化预测准确率

梯度的推导过程

为什么要用到两个向量?
优化的过程当中会更简单，最后会对两个向量取平均，作为最后的向量表示。

skip-gram和CBOW的改进

提高训练效率的方法: 负采样

在前文中，对单词预测时计算的概率是一个softmax函数（max: 表示放大最大值的概率; soft: 表示对较小的值依旧分配一定的概率）在计算的过程中，分母包含对所有点乘的加和，每一次迭代都需要对分母进行一次计算，这样会导致巨大的计算量，因此需要找到更加高效的训练方法——负采样，negative sampling

使用负采样的方法对loss进行近似，此时参数的求解就变成了对下述问题的求解： $\theta = argmax_{\theta}\prod_{(w,c)\in D}P(D=1|w,c,\theta)\prod_{(w,c)\in \tilde{D}}P(D=0|w,c,\theta)\\=argmax_{\theta}\prod_{(w,c)\in D}P(D=1|w,c,\theta)\prod_{(w,c)\in \tilde{D}}(1-P(D=1|w,c,\theta))\\=argmax_{\theta}\sum_{(w,c)\in D}logP(D=1|w,c,\theta)+\sum_{(w,c)\in \tilde{D}}log(1-P(D=1|w,c,\theta))\\=argmax_{\theta}\sum_{(w,c)\in D}log\frac{1}{1+exp(-u_w^Tv_c)}+\sum_{(w,c)\in \tilde{D}}log(1-\frac{1}{1+exp(-u_w^Tv_c)})\\=argmax_{\theta}\sum_{(w,c)\in D}log\frac{1}{1+exp(-u_w^Tv_c)}+\sum_{(w,c)\in \tilde{D}}log(\frac{1}{1+exp(u_w^Tv_c)})$ 进而损失函数为： $J=-\sum_{(w,c)\in D}log\frac{1}{1+exp(-u_w^Tv_c)}+\sum_{(w,c)\in \tilde{D}}log(\frac{1}{1+exp(u_w^Tv_c)})$

softmax的改进：分层softmax
另外还有一个对softmax进行改进的方法，即分层softmax（hierarchical softmax）

一般而言，分层softmax适用于对非常用词，非频繁词的改进，而负采样则更适用于频繁词即低纬向量。

分层softmax的思想是根据词频构造一棵二叉树，词汇越频繁，该词汇对应的叶节点距离根节点就越近。每次需要根据一个给定的词去预测另外一个词时，只需要对二叉树上位于被预测的词路径上的节点向量进行更新。因此，对于频繁词汇的更新比较快速，且整个模型的算法复杂度低。

给定词汇 $w_i$ 预测词汇 $w$ 的概率为 $(w|w_i)=\prod_{j=1}^{L(w)-1}\sigma([n(w,j+1)=ch(n(w,j))]v_{n(w,j)}^Tv_{w_i})$ 其中， $\sigma$ 表示sigmoid函数， $L (w)$ 代表从根节点到词汇w的叶节点路径上所需要经过的节点总数。 $n (w, j)$ 表示从根节点到词汇w叶节点路径上的第j个节点，其中 $n (w, 1)$ 表示根节点。 $c h ()$ 表示某一个节点的子节点，可能是左子节点也可能是右子节点。函数 $[x]$ 的含义是，当x为真时，该函数值取1，否则取0， $v_{n(w,j)}$ 是节点 $n (w, j)$ 的向量表示，即需要学习的向量。

模型训练的目标函数则为 $logP(w|w_i)$ ，训练过程中只需要对二叉树中位于路径上的节点的向量进行更新。

Assignment 1 参考代码

Question 1.1: Implement distinct_words

def distinct_words(corpus):
    """ Determine a list of distinct words for the corpus.
        Params:
            corpus (list of list of strings): corpus of documents
        Return:
            corpus_words (list of strings): list of distinct words across the corpus, sorted (using python 'sorted' function)
            num_corpus_words (integer): number of distinct words across the corpus
    """
    corpus_words = []
    num_corpus_words = -1
    
    # ------------------
    # Write your implementation here.
    flattened_corpus = [y for x in corpus for y in x]
    num_corpus_words += 1
    for word in flattened_corpus:
        if word not in corpus_words:
            corpus_words.append(word)
            num_corpus_words += 1
    corpus_words.sort()
    # ------------------

    return corpus_words, num_corpus_words

Question 1.2: Implement compute_co_occurrence_matrix

def compute_co_occurrence_matrix(corpus, window_size=4):
    """ Compute co-occurrence matrix for the given corpus and window_size (default of 4).
    
        Note: Each word in a document should be at the center of a window. Words near edges will have a smaller
              number of co-occurring words.
              
              For example, if we take the document "START All that glitters is not gold END" with window size of 4,
              "All" will co-occur with "START", "that", "glitters", "is", and "not".
    
        Params:
            corpus (list of list of strings): corpus of documents
            window_size (int): size of context window
        Return:
            M (numpy matrix of shape (number of corpus words, number of corpus words)): 
                Co-occurence matrix of word counts. 
                The ordering of the words in the rows/columns should be the same as the ordering of the words given by the distinct_words function.
            word2Ind (dict): dictionary that maps word to index (i.e. row/column number) for matrix M.
    """
    words, num_words = distinct_words(corpus)
    M = None
    word2Ind = {}
    # ------------------
    # Write your implementation here.
    flattened_corpus = [y for x in corpus for y in x]
    for index, word in enumerate(words):
        word2Ind[word] = index
    M = np.zeros((len(words),len(words)))
    for index, word in enumerate(flattened_corpus):
        left = max(0,index-window_size)
        right = min(len(flattened_corpus),index+window_size)
        for i in range(left,right):
            if i != index:
                co_word = flattened_corpus[i]
                if word in ["START","END"] and co_word in ["STRAT","END"]:
                    pass
                else:
                    M[word2Ind[word]][word2Ind[co_word]] += 1.
                    M[word2Ind[co_word]][word2Ind[word]] += 1.
    # ------------------
    return M, word2Ind

Question 1.3: Implement reduce_to_k_dim

def reduce_to_k_dim(M, k=2):
    """ Reduce a co-occurence count matrix of dimensionality (num_corpus_words, num_corpus_words)
        to a matrix of dimensionality (num_corpus_words, k) using the following SVD function from Scikit-Learn:
            - http://scikit-learn.org/stable/modules/generated/sklearn.decomposition.TruncatedSVD.html
    
        Params:
            M (numpy matrix of shape (number of corpus words, number of corpus words)): co-occurence matrix of word counts
            k (int): embedding size of each word after dimension reduction
        Return:
            M_reduced (numpy matrix of shape (number of corpus words, k)): matrix of k-dimensioal word embeddings.
                    In terms of the SVD from math class, this actually returns U * S
    """    
    n_iters = 10     # Use this parameter in your call to `TruncatedSVD`
    M_reduced = None
    print("Running Truncated SVD over %i words..." % (M.shape[0]))
    
        # ------------------
        # Write your implementation here.
    svd = TruncatedSVD(n_components=k, n_iter=n_iters)
    M_reduced = svd.fit_transform(M)
        # ------------------

    print("Done.")
    return M_reduced

Question 1.4: Implement plot_embeddings

def plot_embeddings(M_reduced, word2Ind, words):
    """ Plot in a scatterplot the embeddings of the words specified in the list "words".
        NOTE: do not plot all the words listed in M_reduced / word2Ind.
        Include a label next to each point.
        
        Params:
            M_reduced (numpy matrix of shape (number of unique words in the corpus , k)): matrix of k-dimensioal word embeddings
            word2Ind (dict): dictionary that maps word to indices for matrix M
            words (list of strings): words whose embeddings we want to visualize
    """
    # ------------------
    # Write your implementation here.
    for i,type in enumerate(words):
        x = M_reduced[i][0]
        y = M_reduced[i][1]
        plt.scatter(x, y, marker='x', color='red')
        plt.text(x, y, type, fontsize=9)
    plt.show()
    # ------------------

Qt 各种功能学习笔记栈不收 qt 学习笔记
目录1.Qt关于数据库1.1Qt链接数据库1.2将数据库的模型显示在控件中2.Qt关于控件2.1用正则表达式设置输入框只能输入正浮点数2.2设置QDateTimeEdit的时间格式和设置为当前时间1.Qt关于数据库1.1Qt链接数据库基础教学：使用Qt链接MySql数据库_qt连接mysql_栈不收的博客-CSDN博客需要注意的问题：在链接MySQL的时候，首先要确保MySQL已经安装成功在目录Q
【学习】《算法图解》第八章学习笔记：平衡树自学也学好编程程序人生
前言在上一章中，我们学习了二叉搜索树(BST)的基本概念和操作。虽然BST在平均情况下提供了O(logn)的搜索、插入和删除效率，但在最坏情况下（如按顺序插入数据），它可能退化为链表，导致操作效率降为O(n)。为了解决这个问题，《算法图解》第八章介绍了平衡树的概念和几种主要的平衡树结构，这些结构能够在各种情况下保持较好的平衡性，确保操作的高效性。一、平衡树的基本概念（一）什么是平衡树平衡树是一种特
【深度学习|学习笔记】什么是k折交叉验证？K折交叉验证的步骤详解？以及如何在K折交叉验证中选择k? 努力毕业的小土博^_^ 机器学习基础算法优质笔记2 深度学习学习笔记人工智能
【深度学习|学习笔记】什么是k折交叉验证？K折交叉验证的步骤详解？以及如何在K折交叉验证中选择k?【深度学习|学习笔记】什么是k折交叉验证？K折交叉验证的步骤详解？以及如何在K折交叉验证中选择k?文章目录【深度学习|学习笔记】什么是k折交叉验证？K折交叉验证的步骤详解？以及如何在K折交叉验证中选择k?一、什么是K折交叉验证？✅目的：二、K折交叉验证的发展背景三、K折交叉验证的步骤详解步骤如下：数学
【深度学习|学习笔记】网格搜索（GridSearchCV）和随机搜索（RandomizedSearchCV）详解，附代码。努力毕业的小土博^_^ 深度学习学习笔记深度学习学习笔记机器学习人工智能
【深度学习|学习笔记】网格搜索（GridSearchCV）和随机搜索（RandomizedSearchCV）详解，附代码。【深度学习|学习笔记】网格搜索（GridSearchCV）和随机搜索（RandomizedSearchCV）详解，附代码。文章目录【深度学习|学习笔记】网格搜索（GridSearchCV）和随机搜索（RandomizedSearchCV）详解，附代码。一、背景与发展：为什么需要
数据结构笔记3：双向链表逑之数据结构笔记链表 c语言学习经验分享算法
目录双向链表的方法：双向链表的初始化方法我们可以对比双向链表和单链表方法在实现上的区别：双向链表的实现引进头结点的概念：双向链表的优势：1、尾插尾删2、指定位置的插入和删除双向链表：也叫做有头节点的双向循环链表双向链表的方法：typedefintLTDataType;typedefstructListNode{LTDataTypex;structListNode*next;structListNo
C语言笔记1：编译和链接、算术操作符、转义字符等。逑之笔记学习 c语言经验分享
目录关键字：编译和链接：字符数组:转义字符：负数取模：输入输出函数：关键字：关键字是C语言保留的，具有特殊含义和用途的标识符，也叫作保留字。具体详见下面博主链接：C语言关键字详解-CSDN博客需要注意的一点是：define不是C语言的关键字。因为#define这一段代码是由预处理器来处理的，而不是由编译器来直接解析的，故而不算C语言语法的一部分。同理include也不是C语言的关键字。#defin
加快Dlib人脸检测速度 weixin_46019223 opencv 人脸识别视频处理机器学习
加快Dlib人脸检测速度前言一、让电脑以最大运行效率运行二、开启Dlib自带的加速三、彩色图像转灰度图像四、其它的坑总结前言使用dlib人脸检测接口detector()速度过慢,导致视频只有1帧所以找了一些方法,并解决了一些问题将视频帧数提升到了十几帧。一、让电脑以最大运行效率运行之前笔记本电脑,都是没插电源运行得,插了之后视频变成了两帧(-_-||),但是可以查看电脑电源设置,查看cup是否全速
vue项目做导入excel（通过base64）
最近项目的需求，记录下笔记要求：1..xls后缀名文件2.文件不超过10M3.转成base64传给后端导入excel//点击导入exceluploadFile(res){letfile=res.filethis.getBase64(file).then(baseFile=>{letdata=baseFile.split(';')[1]//base64的截取,根据后端要求截取的后半截的this.sa
SerDes学习-提纲 Xuan.Yang serdes serdes 混合信号电路信号完整性
#记录一下学习serdes的笔记首先已有PLL的学习基础，国内serdes体系书籍比较少，大部分外文中文课程：b站，jrilee老师PLL、AIC、equalizer、CDR等均有讲解，较为系统，可按顺序学习，附主页链接：https://space.bilibili.com/1629031600/listsserdes两个很重要的东西PLLCDRDataLink/SerDesAmplifiersl
vue中导入导出Excel 前端小白一枚笔记 vue导入导出Excel
以下仅个人做笔记使用：简单版导出Excel1、安装依赖：cnpminstall--savexlsxfile-savercnpmiscript-loader-S2、下载两个js文件：Blob.js和Export2Excel.js（放在最后面）3、添加导出按钮：导出数据4、添加导出事件：derive(){this.$http.post('admin/service_list',{pre_page:th
Android笔记（十五）ContentProvider源码浅析 jametang25 andorid
ContentProvider作为四大组件之一，由于业务上用到的地方不多,目前业务是系统界面，属于系统应用，最适合使用ContentProvider来进行少量数据存储，我们业务中涉及到的Settings.system和Settings.Secure等数据库，就是通过ContentProvider来封装、用ContentResolver来访问的//通过ContentResolver来访问Settin
【力扣hot100】python刷题笔记之哈希 Animato. 哈希算法 leetcode 笔记
1.两数之和（简单）题目描述：给定一个整数数组nums和一个整数目标值target，请你在该数组中找出和为目标值target的那两个整数，并返回它们的数组下标。你可以假设每种输入只会对应一个答案，并且你不能使用两次相同的元素。你可以按任意顺序返回答案。示例：解法一：暴力解法：双层循环（这里就不给代码了）解法二：哈希表（时间复杂度O(n)）算法思路：（1）先创建一个空字典当做哈希表来存储已经遍历过的
golang游戏开发学习笔记-开发一个简单的2D游戏(基础篇）
2.人物运动图（只展示第一帧）2.方块纹理图将资源准备完成之后，就能开始代码的开发了五.开始实现！1.资源管理在上一篇文章中我们将纹理和着色器分别封装成了两个类，这里我们创建一个资源管理类对这两个类进行管理，由于golang中是没有静态变量的，需要用包内变量对其进行模拟shader.gopackageresourceimport(“github.com/go-gl/gl/v4.1-core/gl”
【算法笔记】红黑树插入操作 PXM的算法星球算法笔记算法笔记
红黑树插入与调整详解一、红黑树的五大性质红黑树是一种自平衡的二叉搜索树（BST），其核心特性如下：颜色属性：每个节点非红即黑根属性：根节点必须为黑色叶子属性：所有的NIL叶子节点都是黑色红节点约束：红色节点的子节点必须为黑色（即无连续红节点）黑高平衡：从任一节点到其所有后代叶子节点的路径中，黑色节点数量相等二、插入操作流程阶段1：标准BST插入从根节点开始查找插入位置新节点总是红色按照BST规则插
Git 学习笔记笑衬人心。 git 学习笔记
Git简介Git是一个分布式版本控制系统，用于跟踪文件更改，协作开发软件项目。特点：分布式：每个开发者本地都有完整仓库。高效：分支和合并操作快速。安全：数据通过哈希存储，不易被篡改。安装GitWindows:下载地址：https://git-scm.com/安装后可使用GitBash。macOS:brewinstallgitLinux:sudoaptupdatesudoaptinstallgitG
路由器对数据包的处理过程分析笔记月生言己笔记智能路由器网络
虽然TCP-IP协议中传输数据会在各个路由器再次经过物理层、链路层、网络层的解封装、加工、封装、转发，但是对于两个主机间的运输层，在逻辑上，应用进程是直接通信的。路由器主要工作在网络层，但它也涉及到物理层和链路层的一些功能。以下是路由器在这三个层面上对数据进行的处理：物理层：在物理层，路由器负责接收和发送比特流（即电信号、光信号等）。这包括编码和解码信号，以及处理接口上的物理连接。路由器的每个端口
AD20学习笔记——BOM表输出 Fz@ EDA学习学习笔记
BOM表输出脚本链接GitHub上-lianlian33/InteractiveHtmlBomForAD网盘链接链接：https://pan.baidu.com/s/1uGpwDyWKNgzghY5EH1Aj8A?pwd=72tx提取码：72tx1、下载文件并解压2、复制文件路径3、将脚本导入AD①点击设置中的ScriptingSystem中的GlobalProjects，选择从文件夹安装。②粘贴
Java设计模式之抽象工厂模式（Abstract Factory）笔记 ikwil 设计模式专栏 java 设计模式抽象工厂模式
目录什么叫做抽象工厂模式抽象工厂模式作用抽象工厂模式特征对比抽象工厂和工厂方法抽象工厂模应用场景抽象工厂模式的实现定义抽象工厂接口实现具体产品类定义抽象工厂接口实现具体工厂类进行测试总结参考文献什么叫做抽象工厂模式抽象工厂模式（AbstractFactoryPattern）是一种创建型设计模式，用于提供一个接口，使得客户端能够创建一系列相关或依赖的对象，而无需指定它们的具体类。这个模式有助于确保一
ROS学习笔记5：常用API和模块导入
前言本人ROS小白，利用寒假时间学习ROS，在此以笔记的方式记录自己每天的学习过程。争取写满15篇(5/15)。环境：Ubuntu20.04、ROS1：noetic环境配置：严格按照下方学习链接的教程配置，基本一次成功。学习链接：【Autolabor初级教程】ROS机器人入门对应链接文档：ROS机器人入门课程《ROS理论与实践》笔记绝大部分代码使用Python语言编写。本期关键词：初始化，话题服务
【深度学习|学习笔记】什么是正则化？如何理解正则化？L0、L1、L2正则化的起源、发展、原理、应用和对比详解，附代码。努力毕业的小土博^_^ 深度学习学习笔记深度学习学习笔记人工智能机器学习
【深度学习|学习笔记】什么是正则化？如何理解正则化？L0、L1、L2正则化的起源、发展、原理、应用和对比详解，附代码。【深度学习|学习笔记】什么是正则化？如何理解正则化？L0、L1、L2正则化的起源、发展、原理、应用和对比详解，附代码。文章目录【深度学习|学习笔记】什么是正则化？如何理解正则化？L0、L1、L2正则化的起源、发展、原理、应用和对比详解，附代码。前言一、什么是正则化？为什么需要它？✅
C++语言学习笔记：常对象和常引用
对于既需要共享、又需要防止改变的数据应该声明为常量。一、常对象1、声明对象时用const修饰，称之为常对象。const类型说明符对象名；2、常对象的数据成员值在对象的整个生存期间不能被改变。常对象必须进行初始化，而且不能被更新。3、在定义一个变量或常量时为它指定初值叫作初始化，而在定义一个变量或常量以后使用赋值运算符修改它的值叫作赋值。4、改变对象的数据成员值有两个途径：一是通过对象名访问其成员对
Django项目前后端类型中，用户注册功能实现笔记（第一部分）后端django
用户注册前端逻辑为了学会使用Vue.js的双向绑定实现用户的交互和页面局部刷新效果。1.用户注册页面绑定Vue数据1.准备div盒子标签......2.register.html绑定内容：变量、事件、错误提示等{{csrf_input}}用户名:[[error_name_message]]密码:请输入8-20位的密码确认密码:两次输入的密码不一致号:[[error_mobile_message]]
黑马JVM解析笔记（六）：深入理解JVM类加载机制与运行时优化 null不是我干的 JVM jvm 笔记
1.JVM类加载类加载是Java虚拟机将描述类.class文件加载到内存，并对数据进行校验、转换解析和初始化，最终形成可以被JVM直接使用的Java类型的过程。核心阶段：加载—>连接—>初始化1.1加载，以jdk1.8为例类加载器先把Person.class字节码解析为InstanceKlass（底层是c++）结构，存放一些关键信息和对象的引用，生命周期与类加载器相同（类卸载时才释放）然后就是把新
【学习】《算法图解》第七章学习笔记：树程序员
前言在前面的章节中，我们学习了数组、链表、散列表等基本数据结构，以及一些基础算法。本章将介绍一种非常重要的数据结构——树(Tree)，特别是二叉搜索树(BinarySearchTree)。树结构在计算机科学中应用广泛，从文件系统到数据库再到人工智能，都能看到树的身影。《算法图解》第七章深入浅出地介绍了树的基本概念、实现和应用，帮助读者理解这一关键数据结构。一、树的基本概念（一）什么是树树是一种分层
无线路由dns服务器地址,无线路由器更换DHCP地址段、DNS地址设置 weixin_39826080 无线路由dns服务器地址
随着科技的发展，越来越多的设备需要无线路由器连接，以便更快的速度上网，如智能手机、平板电脑、笔记本电脑，甚至是无线相机。而如果这些终端上网都需要事先指定好IP才能上网，那无线路由器就失去本身的一些特性，如DHCP功能，下面小编以TP-Linktl-941N为例，详解如何分配DHCP地址段并设置DNS地址？详细设置教程如下：1、使用网关地址(管理地址)登陆上路由器界面。一般路由器管理地址为192.1
YOLOv12_ultralytics-8.3.145_2025_5_27部分代码阅读笔记-block.py 红色的山茶花 YOLO 笔记深度学习
block.pyultralytics\nn\modules\block.py目录block.py1.所需的库和模块2.classDFL(nn.Module):3.classProto(nn.Module):4.classHGStem(nn.Module):5.classHGBlock(nn.Module):6.classSPP(nn.Module):7.classSPPF(nn.Module):
我的创作纪念日茉莉玫瑰花茶个人感想
一、初心：技术分享与自我提升成为一名创作者的初衷，源于我在技术学习和实战项目中的点滴积累。在日常的学习和工作中，我常常会遇到一些有趣的技术问题，也会掌握一些实用的解决方案。最初，我只是将这些内容记录在个人笔记中，但后来发现，通过分享这些经验，不仅可以帮助到更多有需要的人，还能促使自己更深入地思考和总结知识。于是，我决定在CSDN上开设博客，将自己的技术心得以文章的形式呈现出来。我的博客茉莉玫瑰花茶
RabbitMQ学习笔记：rabbitmq-server -detached Warning: PID file not written； -detached was passed 码炫课堂-码哥 rabbitmq专题 rabbitmq
作者简介：大家好，我是smart哥，前中兴通讯、美团架构师，现某互联网公司CTO联系qq：184480602，加我进群，大家一起学习，一起进步，一起对抗互联网寒冬学习必须往深处挖，挖的越深，基础越扎实！阶段1、深入多线程阶段2、深入多线程设计模式阶段3、深入juc源码解析阶段4、深入jdk其余源码解析
ESP32学习笔记-读取SD卡并显示到屏幕上搞机械的假程序猿 ESP32学习笔记学习笔记 ESP32
硬件FireBeetle2ESP32-E开发板1.54"240x240IPS广视角TFT显示屏硬件接线测试代码//加载库#include"Arduino.h"#include"FS.h"#include"SD.h"#include"SPI.h"#include"DFRobot_GDL.h"//定义显示屏针脚#defineTFT_DCD2#defineTFT_CSD6#defineTFT_RSTD3
C++入门笔记张峻铖 C++c++
写在开头初衷：对于一个程序员/算法工程师来说，只会Python未免过于单薄了。出于未来找工作的需要，开始学习C++，并使用C++刷LeetCode。背景：本科有C语言课程，甚至学过汇编，研究生阶段主要使用Python。提醒：该系列文章以尽可能快地应用C++（刷题）为目的，暂以B站黑马程序员C++教程为教材，主要记录重点内容和对个人来讲不易理解或陌生的内容，具有较浓的个人笔记特点，因此，在全面性和权
设计模式介绍 tntxia 设计模式
设计模式来源于土木工程师克里斯托弗亚历山大（http://en.wikipedia.org/wiki/Christopher_Alexander）的早期作品。他经常发表一些作品，内容是总结他在解决设计问题方面的经验，以及这些知识与城市和建筑模式之间有何关联。有一天，亚历山大突然发现，重复使用这些模式可以让某些设计构造取得我们期望的最佳效果。亚历山大与萨拉-石川佳纯和穆雷西乐弗斯坦合作
android高级组件使用(一) 百合不是茶 android RatingBar Spinner
1、自动完成文本框（AutoCompleteTextView） AutoCompleteTextView从EditText派生出来，实际上也是一个文本编辑框，但它比普通编辑框多一个功能：当用户输入一个字符后，自动完成文本框会显示一个下拉菜单，供用户从中选择，当用户选择某个菜单项之后，AutoCompleteTextView按用户选择自动填写该文本框。使用AutoCompleteTex
[网络与通讯]路由器市场大有潜力可挖掘 comsci 网络
如果国内的电子厂商和计算机设备厂商觉得手机市场已经有点饱和了,那么可以考虑一下交换机和路由器市场的进入问题..... 这方面的技术和知识,目前处在一个开放型的状态,有利于各类小型电子企业进入 &nbs
自写简单Redis内存统计shell 商人shang Linux shell 统计Redis内存
#!/bin/bash address="192.168.150.128:6666,192.168.150.128:6666" hosts=(${address//,/ }) sfile="staticts.log" for hostitem in ${hosts[@]} do ipport=(${hostitem
单例模式(饿汉 vs懒汉) oloz 单例模式
package 单例模式; /* * 应用场景:保证在整个应用之中某个对象的实例只有一个 * 单例模式种的《懒汉模式》 * */ public class Singleton { //01 将构造方法私有化，外界就无法用new Singleton()的方式获得实例 private Singleton(){}; //02 申明类得唯一实例 priva
springMvc json支持杨白白 json springmvc
1.Spring mvc处理json需要使用jackson的类库，因此需要先引入jackson包 2在spring mvc中解析输入为json格式的数据:使用@RequestBody来设置输入 @RequestMapping("helloJson") public @ResponseBody JsonTest helloJson() {
android播放，掃描添加本地音頻文件小桔子
最近幾乎沒有什麽事情，繼續鼓搗我的小東西。想在項目中加入一個簡易的音樂播放器功能，就像華為p6桌面上那麼大小的音樂播放器。用過天天動聽或者QQ音樂播放器的人都知道，可已通過本地掃描添加歌曲。不知道他們是怎麼實現的，我覺得應該掃描設備上的所有文件，過濾出音頻文件，每個文件實例化為一個實體，記錄文件名、路徑、歌手、類型、大小等信息。具體算法思想，
oracle常用命令 aichenglong oracle dba 常用命令
1 创建临时表空间 create temporary tablespace user_temp tempfile 'D:\oracle\oradata\Oracle9i\user_temp.dbf' size 50m autoextend on next 50m maxsize 20480m extent management local
25个Eclipse插件 AILIKES eclipse插件
提高代码质量的插件1. FindBugsFindBugs可以帮你找到Java代码中的bug，它使用Lesser GNU Public License的自由软件许可。2. CheckstyleCheckstyle插件可以集成到Eclipse IDE中去，能确保Java代码遵循标准代码样式。3. ECLemmaECLemma是一款拥有Eclipse Public License许可的免费工具，它提供了
Spring MVC拦截器+注解方式实现防止表单重复提交 baalwolf spring mvc
原理：在新建页面中Session保存token随机码，当保存时验证，通过后删除，当再次点击保存时由于服务器端的Session中已经不存在了，所有无法验证通过。 1.新建注解： ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
《Javascript高级程序设计(第3版)》闭包理解 bijian1013 JavaScript
“闭包是指有权访问另一个函数作用域中的变量的函数。”--《Javascript高级程序设计(第3版)》看以下代码： <script type="text/javascript"> function outer() { var i = 10; return f
AngularJS Module类的方法 bijian1013 JavaScript AngularJS Module
AngularJS中的Module类负责定义应用如何启动，它还可以通过声明的方式定义应用中的各个片段。我们来看看它是如何实现这些功能的。一.Main方法在哪里如果你是从Java或者Python编程语言转过来的，那么你可能很想知道AngularJS里面的main方法在哪里？这个把所
[Maven学习笔记七]Maven插件和目标 bit1129 maven插件
插件(plugin)和目标(goal) Maven，就其本质而言，是一个插件执行框架，Maven的每个目标的执行逻辑都是由插件来完成的，一个插件可以有1个或者几个目标，比如maven-compiler-plugin插件包含compile和testCompile，即maven-compiler-plugin提供了源代码编译和测试源代码编译的两个目标使用插件和目标使得我们可以干预
【Hadoop八】Yarn的资源调度策略 bit1129 hadoop
1. Hadoop的三种调度策略 Hadoop提供了3中作业调用的策略， FIFO Scheduler Fair Scheduler Capacity Scheduler 以上三种调度算法，在Hadoop MR1中就引入了，在Yarn中对它们进行了改进和完善.Fair和Capacity Scheduler用于多用户共享的资源调度 2. 多用户资源共享的调度
Nginx使用Linux内存加速静态文件访问 ronin47
Nginx是一个非常出色的静态资源web服务器。如果你嫌它还不够快，可以把放在磁盘中的文件，映射到内存中，减少高并发下的磁盘IO。先做几个假设。nginx.conf中所配置站点的路径是/home/wwwroot/res，站点所对应文件原始存储路径：/opt/web/res shell脚本非常简单，思路就是拷贝资源文件到内存中，然后在把网站的静态文件链接指向到内存中即可。具体如下：
关于Unity3D中的Shader的知识 brotherlamp unity unity资料 unity教程 unity视频 unity自学
首先先解释下Unity3D的Shader，Unity里面的Shaders是使用一种叫ShaderLab的语言编写的，它同微软的FX文件或者NVIDIA的CgFX有些类似。传统意义上的vertex shader和pixel shader还是使用标准的Cg/HLSL 编程语言编写的。因此Unity文档里面的Shader，都是指用ShaderLab编写的代码，然后我们来看下Unity3D自带的60多个S
CopyOnWriteArrayList vs ArrayList bylijinnan java
package com.ljn.base; import java.util.ArrayList; import java.util.Iterator; import java.util.List; import java.util.concurrent.CopyOnWriteArrayList; /** * 总述： * 1.ArrayListi不是线程安全的，CopyO
内存中栈和堆的区别 chicony 内存
1、内存分配方面：堆：一般由程序员分配释放，若程序员不释放，程序结束时可能由OS回收。注意它与数据结构中的堆是两回事，分配方式是类似于链表。可能用到的关键字如下：new、malloc、delete、free等等。栈：由编译器(Compiler)自动分配释放，存放函数的参数值，局部变量的值等。其操作方式类似于数据结构中
回答一位网友对Scala的提问 chenchao051 scala map
本来准备在私信里直接回复了，但是发现不太方便，就简要回答在这里。问题写道对于scala的简洁十分佩服，但又觉得比较晦涩，例如一例，Map("a" -> List(11,111)).flatMap(_._2)，可否说下最后那个函数做了什么，真正在开发的时候也会如此简洁？谢谢先回答一点，在实际使用中，Scala毫无疑问就是这么简单。
mysql 取每组前几条记录 daizj mysql 分组最大值最小值每组三条记录
一、对分组的记录取前N条记录：例如：取每组的前3条最大的记录 1.用子查询： SELECT * FROM tableName a WHERE 3> (SELECT COUNT(*) FROM tableName b WHERE b.id=a.id AND b.cnt>a. cnt) ORDER BY a.id,a.account DE
HTTP深入浅出 http请求 dcj3sjt126com http
HTTP(HyperText Transfer Protocol)是一套计算机通过网络进行通信的规则。计算机专家设计出HTTP，使HTTP客户（如Web浏览器）能够从HTTP服务器(Web服务器)请求信息和服务，HTTP目前协议的版本是1.1.HTTP是一种无状态的协议，无状态是指Web浏览器和Web服务器之间不需要建立持久的连接，这意味着当一个客户端向服务器端发出请求，然后We
判断MySQL记录是否存在方法比较 dcj3sjt126com mysql
把数据写入到数据库的时，常常会碰到先要检测要插入的记录是否存在，然后决定是否要写入。　　我这里总结了判断记录是否存在的常用方法：　　sql语句： select count ( * ) from tablename; 　　然后读取count(*)的值判断记录是否存在。对于这种方法性能上有些浪费，我们只是想判断记录记录是否存在，没有必要全部都查出来。
对HTML XML的一点认识 e200702084 html xml
感谢http://www.w3school.com.cn提供的资料 HTML 文档中的每个成分都是一个节点。节点根据 DOM，HTML 文档中的每个成分都是一个节点。 DOM 是这样规定的：整个文档是一个文档节点每个 HTML 标签是一个元素节点包含在 HTML 元素中的文本是文本节点每一个 HTML 属性是一个属性节点注释属于注释节点 Node 层次
jquery分页插件 genaiwei jquery Web 前端分页插件
//jquery页码控件// 创建一个闭包 (function($) { // 插件的定义 $.fn.pageTool = function(options) { var totalPa
Mybatis与Ibatis对照入门于学习 Josh_Persistence mybatis ibatis 区别联系
一、为什么使用IBatis/Mybatis 对于从事 Java EE 的开发人员来说，iBatis 是一个再熟悉不过的持久层框架了，在 Hibernate、JPA 这样的一站式对象 / 关系映射（O/R Mapping）解决方案盛行之前，iBaits 基本是持久层框架的不二选择。即使在持久层框架层出不穷的今天，iBatis 凭借着易学易用、
C中怎样合理决定使用那种整数类型？秋风扫落叶 c 数据类型
如果需要大数值(大于32767或小于32767), 使用long 型。否则, 如果空间很重要 (如有大数组或很多结构), 使用 short 型。除此之外, 就使用 int 型。如果严格定义的溢出特征很重要而负值无关紧要, 或者你希望在操作二进制位和字节时避免符号扩展的问题, 请使用对应的无符号类型。但是, 要注意在表达式中混用有符号和无符号值的情况。 &nbs
maven问题 zhb8015 maven问题
问题1： Eclipse 中新建maven项目无法添加src/main/java 问题 eclipse创建maevn web项目，在选择maven_archetype_web原型后，默认只有src/main/resources这个Source Floder。按照maven目录结构，添加src/main/ja
(二)androidpn-server tomcat版源码解析之--push消息处理 spjich java androdipn 推送
在 (一)androidpn-server tomcat版源码解析之--项目启动这篇中，已经描述了整个推送服务器的启动过程，并且把握到了消息的入口即XmppIoHandler这个类，今天我将继续往下分析下面的核心代码，主要分为3大块，链接创建，消息的发送，链接关闭。先贴一段XmppIoHandler的部分代码 /** * Invoked from an I/O proc
用js中的formData类型解决ajax提交表单时文件不能被serialize方法序列化的问题中华好儿孙 JavaScript Ajax Web 上传文件 FormData
var formData = new FormData($("#inputFileForm")[0]); $.ajax({ type:'post', url:webRoot+"/electronicContractUrl/webapp/uploadfile", data:formData, async: false, ca
mybatis常用jdbcType数据类型 ysj5125094 mybatis mapper jdbcType
MyBatis 通过包含的jdbcType 类型 BIT FLOAT CHAR