【读书笔记】《深度学习进阶，自然语言处理》总结记录

文章目录

一、神经网络
- - 1. mini-batch的损失计算以及反向传播
  - 2. 计算图中几个常见神经元节点
  - 3. 计算图中节点的代码实现以及螺旋状数据集的demo
二、自然语言以及单词的分布式表示
- - 1. 同义词词典
  - 2. 基于统计的方法
三、word2vec
四、语言模型与RNN
- - 1. 语言模型的评价
  - 2. RNN网络结构的优化
  - 3. 使用RNN生成文本
五、Attention
- - 1. 一般的Attention机制
  - 2. Transformer
结语

最近需要开始做nlp相关的东西，参考知乎的问答列了一个书单，其中有这本：《深度学习进阶，自然语言处理》。断断续续花了几周时间把这本书看完了，总结回顾了一下书中的大致内容，并在此做一个记录，不过详细的地方大家还是买书去看比较好。
这本书比较好的就是不止有原理性地描述，还有正向与反向传播计算图的说明以及不借助pytorch、tensorflow等深度学习库的底层计算实现。由于主要涉及深度学习，在传统机器学习算法以及一些公式的推导上相比西瓜书和统计学习方法来说没有那么详细，但总的来说是一本很不错的书。

一、神经网络

书中主要说了神经网络的基本构成与实现，重心放在神经元之间进行的操作上而不是整体的网络结构。涉及的一些线性代数（矩阵乘积）和python数组（Numpy）的知识就不说了，此外的几个比较值得注意的点有：

1. mini-batch的损失计算以及反向传播

交叉熵误差是多分类问题中常用的损失函数。其一般计算形式如下：
$L=-\sum_{k}t_k log_ey_k$
其中 $y_k$ 是网络输出，表示输出向量中第k个类别的值（概率）， $t_k$ 是第k个类别的监督标签，以one-hot形式表示（比如[1,0,0]），实际上求和符号里表示的就是取对应 $t_k=1$ 的类别的输出概率 $y_k$ 的自然对数。
而在mini-batch下的交叉熵误差则使用下面公式计算：
$L=-\frac{1}{N}\sum_{n}\sum_{k}t_{nk} log_ey_{nk}$
其中 $y_{nk}$ 是第n个batch的网络输出， $t_{nk}$ 是第n个batch第k个类别的one-hot表示，相比于上式，其实就是加了batch的维度的并取平均。而反向传播时具体如何更新的似乎没说，猜测是使用此平均Loss基于此batch中的{输入，标签}对来更新网络参数。

2. 计算图中几个常见神经元节点

Repeat节点（复制节点/分支节点）：Repeat节点实际就是将输入的x复制了几份，它的反向传播则是所有分支上传过来的相同的梯度之和。
Sum节点： $z = x + y$ ，此节点的反向传播是将上游传来的梯度分配到所有输入的加法分支流中。也就是说，Sum节点和Repeat节点实际上是互为逆向的关系。
乘法节点： $\times y$ ，此时反向传播时的倒数很简单，分别是： $\frac{\partial z}{\partial x}=y$ ， $\frac{\partial z}{\partial y}=x$ 。此时的计算图如下所示：

MatMul节点：矩阵的乘积节点，这个是一个比较重要的节点，具体的推导过程书上有，这里就不说了，主要说一下它的反向传播公式。
有运算： $y = x W$ ，其中 $x$ 与 $y$ 都是一维向量(batch_size=1)，W是一个矩阵，上游传来的梯度为 $\frac{\partial L}{\partial y}$ 。
则可以得到对应的反向传播公式为：
$\frac{\partial L}{\partial x}=\frac{\partial L}{\partial y}W^T$
$\frac{\partial L}{\partial W}=x^T\frac{\partial L}{\partial y}$

3. 计算图中节点的代码实现以及螺旋状数据集的demo

这个在书中都有很详细的实现，实现了Affine层（ $y = x W + b$ ），使用的是SGD，这里可以再拿书仔细看一遍。

二、自然语言以及单词的分布式表示

书中的这一部分说的是一些基础的自然语言处理知识，其中提到单词表示有以下几类方法：

基于同义词词典的方法（人工整理）
基于统计的方法（计数）
基于推理的方法（word2vec）

1. 同义词词典

同义词词典是通过人工定义单词含义得到的，它将含义相同或相近的词归为同一个组，有时还会定义更细粒度的关系，比如“上级-下级”、“整体-部分”关系，最著名的同义词词典是普林斯顿大学在1985年开发的WordNet。显然，同义词词典所需的人工成本过高，难以扩展，且不能准确地表示单词间的细微差别，是非常落后的方法了。

2. 基于统计的方法

将单词表示为一个固定长度向量称为单词的分布式表示，这是所有单词表示方法都在做的事，为了能够自动化此过程需要使用到语料库(corpus)。从这里开始引入了一个非常重要的假设——分布式假设：某个单词的含义由它的上下文（周围的单词）构成。其中上下文的数量通常称为窗口大小。
简单的基于统计的方法：利用单词共现矩阵可以实现简单的基于统计的表示方法，共现矩阵的形状为 $N\times N$ （语料库中总共有 $N$ 个单词），而如果单词 $c_i$ 和 $c_j$ 同时在一句话中出现，则将矩阵中 $(i, j)$ 的值设置为1。构造完成后，可以将共现矩阵中的每一行（或每一列，因为实际上是一个对称矩阵）视为单词的表示。可以采用向量之间的相似度计算方法（余弦相似度）来衡量两单词是否相似。

统计方法改进1——互点信息：只依据单词出现次数显然是不够的，因为有很多常用词在哪一个句子中出现频率都很高，需要能够清洗此类噪声的方法，而实际上我们的目的是表示两个单词之间的相关程度，因此互点信息（Pointwise Mutual Information）就很自然地可以用到这上面来，PMI值越高，相关性越强。看公式就可以发现互点信息相比于原始的方法，加入了单词本身在语料库中出现的次数这一信息，减少了因为词语使用过于频繁而带来的噪声。
$PMI(x,y)=log_2 \frac{P(x,y)}{P(x)P(y)} \approx log_2 \frac{C(x,y)\times N}{C(x)C(y)}$
统计方法改进2——降维：使用上述方法得到的每个单词表示都是一个 $N$ 维向量，且大部分单词都是一个稀疏向量，这显然是冗余的，因此需要对单词表示进行降维，经典的降维方法就是基于奇异值分解（SVD）的方法。简而言之就是可以利用奇异值分解将任意矩阵分解为三个矩阵的乘积，其中 $U, V$ 是列向量彼此正交的正交矩阵，而 $S$ 是一个对角矩阵，对角线上的值（奇异值）表示了矩阵 $U$ 中对应列向量（基轴）的重要性，据此我们就可以删除奇异值较小的基轴来实现降维，并得到降维后的矩阵 $U^{'}$ 作为单词的分布式表示。不过一般SVD的复杂度为 $O(N^3)$ ，计算量过于巨大，所以一般会使用一些改进的方法加快速度（比如Truncated SVD）。
$X=USV^T$

最后，这本书还在PTB数据集上实现了改进后的基于统计的方法，可以做参考。

三、word2vec

基于推理的方法实际就是求解一个预测任务，即给定单词的上下文预测此单词（CBOW）或给定此单词预测此单词的上下文（skip-gram），显然这也是遵循单词分布式假设的。通过上一节可以看到基于计数的方法需要构造矩阵并分解，所以需要一次性处理全部数据，在大型预料库中这类方法由于计算量太大而没办法很好地学习，而使用神经网络来学习的基于推理的方法在这方面有很大优势。word2vec是基于推理的方法中的一类典型模型（以至于现在一般都直接说word2vec而不说基于推理的方法了）
word2vec的基本思路就是：通过求解预测任务，优化神经网络，最终将优化得到的权重矩阵（一般是用的输入权重矩阵） 作为单词的分布式表示。

这里其实有一个很容易被忽略的问题，就是word2vec的目的是获得自然语言中单词的向量表示，而我们word2vec网络的输入又必须得是单词的向量表示，乍一看有点像鸡生蛋、蛋生鸡的问题。因此，这里实际需要定义一个单词的简单表示（即one-hot）来作为原始word2vec的输入，然后让word2vec从语料库中学习并得到更优的单词表示。使用one-hot表示有一个十分巧妙的地方就是：输入 $c$ 与权重矩阵 $W$ 的乘积实际上就是提取矩阵中的某一行，也正因如此，我们才可以直观地将权重矩阵的每一行视为每个单词的分布式表示。
word2vec改进1——embedding层：在词汇量大的时候，输入层部分one-hot形式的输入与 $W_{in}$ 矩阵的乘积计算量是比较大的，而实际上这项操作只是取了矩阵中的某一行，因此可以直接定义并实现一个神经网络层，功能是取矩阵的某一行从而避免矩阵乘积运算（这样反向传播时从上游传来的梯度只被应用到权重梯度的某一行）。这里主要是代码实现方面有区别，还是看书上的解释比较好。
word2vec改进2——negative sample：在输出层与最后的softmax环节，也会因为词汇量太大导致计算量激增，此时我们可以采用负采样的方法。这里书中花了很多篇幅来说明，也比较复杂，大致来说就是：首先我们只关注正确标签输出的概率值必须接近1，这时即转化为一个二分类问题（输出是/不是正确的），这样我们就可以只使用输出矩阵 $W_{out}$ 中对应标签的那一列（在 $W_{in}$ 中的每行是单词向量表示，在 $W_{out}$ 中每列是单词向量表示）与上一层的神经元进行点积来得到二分类概率，理想情况下这样学习得到的网络正确标签对应的输出接近1。然后针对负例，就需要使用负采样的方法，依据上述二分类学习策略，使部分错误标签的输出概率值接近0。这些负例一般是概率性地选择语料库中出现频率比较高的词，这样不仅大幅减少了计算量，且对最终结果准确率的影响不大。

四、语言模型与RNN

RNN由于其在处理时间序列数据上的优越性，是之前nlp中最常使用的模型。关于RNN的细节以及实现在书中也都有，而且RNN又是很经典的一种网络结构，因此在这里就不多说了。除RNN本身之外，这部分需要注意的还有以下几个点：

1. 语言模型的评价

语言模型表示的是一个单词序列发生的可能性，从概率的角度上来说就是求m个单词的联合概率。困惑度（概率的倒数）是一个常用的评价指标， $Pe=\frac{1}{P(x)}$ 。困惑度在某种程度上也可以叫做分叉度，实际上就是指可能的候选词个数，显然困惑度越低，模型越好。
在多个输入的情况下，困惑度计算公式则为 $Pe=e^{Loss}$ ，当然，也是困惑度越低，模型越好。目前许多模型困惑度能够达到50左右甚至更低。

2. RNN网络结构的优化

gated RNN：RNN极其容易产生梯度消失和梯度爆炸的问题，本质上是反向传播时激活函数以及链式求导法则导致的。虽然可以通过修改激活函数为ReLu等改善部分梯度消失问题，也可以通过梯度裁剪改善部分梯度爆炸问题，而由于网络层数过深导致链式求导过程中出现的梯度消失问题则需要从网络结构入手进行改进，带门控的RNN就是一个比较好的改进结构。LSTM就是一个著名的门控型RNN，它在普通RNN基础上加上了输入们、输出门和遗忘门，并且在学习过程中内部多传递了一个记忆单元 $c$ ，具体细节在书和许多其它博客中都有说明，在此就不多说了，放上一张经典的LSTM结构图：

一般来说，RNN只是作为整个语言模型中的一个网络层，一个比较完整的网络结构应该还包括起到word2vec作用的Embedding层与Affine层，以及使最终输出转变为概率的Softmax层。如下图是一个简单的以一个单词为起点不断生成接下来的单词的语言模型：

针对各种语言模型，为了提升模型精度，书中提到了如下几个优化方案：

多层RNN：即纵向加深RNN层，这与图像处理时中加深卷积层的思路是一样的，当数据量足够时可以考虑多加几层来提升模型学习能力，谷歌翻译使用的GNMT模型就是叠加了8层LSTM。
dropout抑制过拟合：dropout指在训练时随机忽略一部分神经元，通常以单独的一层来实现。为了不丢失必要数据通常在纵向上使用dropout（即加深）而不是在RNN自身的时间轴上使用。不过也有研究提出了一种变分dropout能够在时间轴上使用以提升模型精度。
权值共享：这里实际就是将Embedding层和Affine层设置为相同的权重，两矩阵互为转置，这样可以减少参数数量并提升学习精度。

3. 使用RNN生成文本

上面所讲的语言模型输出的只是一些概率数值，是没办法生成文本的。以文本翻译为例，人在翻译过程中首先会理解源语句的含义，然后再根据含义翻译成其它语言的语句。类比到机器，很容易就可以想到我们首先通过一个编码器（Encoder）将源文本变成一个中间向量表示，这个向量中应当包含了文本的含义，然后再通过一个解码器（Decoder）将此向量再转化为其它自然语言。因此，此类seq2seq的任务通常都是由Encoder-Decoder架构来解决，结构如下：

如果用RNN实现其实就是将Encoder中RNN层最后一个神经元的隐藏状态输出 $h$ 作为Decoder中RNN层第一个神经元的初始隐藏状态。这里在书中有很详细的结构说明和代码实现，除此之外，书中还提到了两个改进结构的方案：

Reverse Input：即将训练数据的输入翻转过来，输出不翻转。这个方法不仅扩充了数据集，更重要的一点是，这种方法调整了encoder和decoder中相对应的单词的距离。比如说原本单词 $w_0$ 是长度为 $m$ 的源文本中的第一个单词，其对应的输出单词为目标语句的第一个单词 $y_0$ ，那么两个单词所所对应的神经元相距为 $N - 1$ ，而如果翻转输入，则两个单词所对应的神经元变为了相邻的神经元，这样能够在seq2seq任务中更好地学习到对应单词间的依赖关系。
Peeky Decoder：针对编码器，其所有的信息来源只有Encoder传过来的 $h$ ，而 $h$ 又只用于第一个神经元的隐藏层初始化。为了更好地利用信息，很容易就可以想到把 $h$ 共享给Decoder中除第一个循环神经元以外的其它结构，比如可以作为一部分Affine层的输入使用。

五、Attention

这一章讲的就是大名鼎鼎的注意力机制了。

1. 一般的Attention机制

使用Attention机制的Encoder-Decoder架构与一般架构的不同之处如图所示，上面是普通法的encoder-decoder架构而下面是加入了注意力机制的encoder-decoder架构：

公式表示如下：
$Normal：y_i=D(C,y_1,y_2,...,y_{i-1})$
$Attention：y_i=D(C_i,y_1,...,y_{i-1})$
实际上就是对于decoder不同时刻的输出使用不同 $C_i$ （一般称之为上下文向量）来计算， $C_i$ 的引入是基于一种对齐的思想，即想要得到输入的哪一部分对于输出的哪一部分影响更大，这里自然就想到可以用权重来表示，权重的表示方法是可微的也就是可以用梯度反向传播算法训练的。因此有了如下的Attention公式：
$C_i=\sum_j^n\alpha_{ij}h_j$
其中 $h_j$ 是从编码器中传过来的源语句中每一个单词对应的中间向量表示（如果编码器是RNN结构，那么一般是每个循环神经元的隐藏状态输出），而 $\alpha_{ij}$ 就是我们想要学习的权重，也是注意力机制算法的关键。它的含义可以解释为第j个位置的输入与第i个位置的输出的相似程度，于是可以将上面的公式更为一般化，这个公式可以与下面的经典注意力机制图相对应：
$Attention(Query,Source)=\sum_j^nSimilarity(Query,key_j)\times Value_j$

对于公式中 $S i m i l a r i t y$ 函数，不同的论文有不同的计算实现方法，比如使用向量点积算相似度、使用余弦相似度甚至使用一个小型的MLP直接学习相似度等等。
这样的注意力机制一般是作为一个单独的注意力层，加在原来语言模型RNN层的后面。

2. Transformer

transformer是一个完全不用CNN或RNN，完全使用Attention与MLP的Encoder-Decoder架构，经过实验表明它能够达到与其它CNN、RNN模型一样甚至更高的准确率，除此之外还有计算可并行度高、更好地学习远程依赖关系、更具解释性等优点，是近年来大火的网络结构。Transformer的结构如下：

总的来说包括以下几个结构：

其中还加入了多头注意力、自注意力等机制，具体细节建议去认真看看这篇transformer开山之作《Attention is all you need》，真的特别经典，而且写得很好很详细。

结语

至此整本书差不多总结完了，其中的内容都是书中所讲解的再加上我自己的理解，如果我有哪里理解不到位的地方，还请各位不吝赐教。

【Python】一文详细介绍 py格式文件高斯小哥 Python基础【高质量合集】python 新手入门学习
【Python】一文详细介绍py格式文件个人主页：高斯小哥高质量专栏：Matplotlib之旅：零基础精通数据可视化、Python基础【高质量合集】、PyTorch零基础入门教程希望得到您的订阅和支持~创作高质量博文(平均质量分92+)，分享更多关于深度学习、PyTorch、Python领域的优质内容！（希望得到您的关注~）文章目录一、py格式文件简介二、如何创建和编辑py格式文件三、如何运行py
python抓包与解包_Python—网络抓包与解包（pcap、dpkt） weixin_39691055 python抓包与解包
pcap安装[root@localhost~]#pipinstallpypcap抓包与解包#-*-coding:utf-8-*-importpcap,dpktimportre,threading,requests__black_ip=['103.224.249.123','203.66.1.212']#抓包：param1eth_name网卡名，如：eth0,eth3。param2p_type日志捕
华为OD机试 - 单向链表中间节点（Java & JS & Python & C & C++）华为OD题库华为od 链表 java
须知哈喽，本题库完全免费，收费是为了防止被爬，大家订阅专栏后可以私信联系退款。感谢支持文章目录须知题目描述输出描述解析代码题目描述给定一个单链表L，请编写程序输出L中间结点保存的数据。如果有两个中间结点，则输出第二个中间结点保存的数据。例如：给定L为1→7→5，则输出应该为7；给定L为1→2→3→4，则输出应该为3；输入描述每个输入包含1个测试用例。每个测试用例：第一行给出链表首结点的地址、结点总
python 推导式(派生、衍生) sanduo112 人工智能 python windows 开发语言
python推导式一、推导式(派生、衍生)1.Python推导式是一种独特的数据处理方式，可以从一个数据序列构建另一个新的数据序列的结构体。2.列表(list)推导式3.字典(dict)推导式4.集合(set)推导式5.元组(tuple)推导式二、代码概述一、推导式(派生、衍生)1.Python推导式是一种独特的数据处理方式，可以从一个数据序列构建另一个新的数据序列的结构体。Python支持各种数
数据挖掘|数据预处理|基于Python的数据标准化方法皖山文武数据挖掘数据建模与分析 python 数据挖掘开发语言
基于Python的数据标准化方法1.z-score方法2.极差标准化方法3.最大绝对值标准化方法在数据分析之前，通常需要先将数据标准化（Standardization），利用标准化后的数据进行数据分析，以避免属性之间不同度量和取值范围差异造成数据对分析结果的影响。1.z-score方法Z-score方法是基于原始数据的均值和标准差来进行数据标准化的，处理后的数据均值为0，方差为1，符合标准正态分布
CSV指南：Python程序获取大型CSV文件行数孤独打铁匠Julian 笔记经验分享 python
本指南提供了几种使用Python来获取大型CSV文件行数的方法，并解释了每种方法的适用场景。方法1:使用csv.reader处理复杂CSV文件当你的CSV文件中包含多行字段（即某些字段的值中包含换行符）时，使用csv.reader是一个可靠的选择，因为它能够正确处理这些复杂情况。这个方法适用于大多数大小的CSV文件，但是对于非常大的文件，读取整个文件可能会占用较多的时间和内存。对于极大的文件，考虑
谷歌浏览器驱动Chromedriver（114-120版本）文件以及驱动下载教程 pigerr杨 Python python chrome drivers
ChromeDriver官方网站GitHub||GoogleChromeLabs/chrome-for-testingChromeDriver113-125_JSONChromeforTestingavailability123-125zip白月黑羽Python基础|进阶|Qt图形界面|Django|自动化测试|性能测试|JS语言|JS前端|原理与安装
大创项目推荐深度学习 opencv python 公式识别(图像识别机器视觉) laafeer python
文章目录0前言1课题说明2效果展示3具体实现4关键代码实现5算法综合效果6最后0前言优质竞赛项目系列，今天要分享的是基于深度学习的数学公式识别算法实现该项目较为新颖，适合作为竞赛课题方向，学长非常推荐！学长这里给一个题目综合评分(每项满分5分)难度系数：3分工作量：4分创新点：4分更多资料,项目分享：https://gitee.com/dancheng-senior/postgraduate1课题
ES-LTR粗排模块 poins jenkins 运维
ES-LTR粗排模块官方资源：https://github.com/HeiBoWang/elasticsearch-learning-to-rankElasticsearch学习排名插件使用机器学习提高搜索相关性排名。它为维基媒体基金会和Snagajob等地方的搜索提供了动力！这个插件有什么功能此插件：允许您在Elasticsearch中存储特征（Elasticsearch查询模板）记录特征得分（
python转码 Desamond python 开发语言
转码在许多场景中都有应用，以下是一些常见的场景：网页开发：当用户在网页上输入文本时，可能需要将特殊字符（如空格、引号、特殊符号等）进行转码，以防止这些字符对URL或HTML代码产生干扰。文件名处理：在处理文件名时，可能需要将特殊字符进行转码，以避免文件名被错误地解析或显示。数据传输：在数据传输过程中，为了确保数据的完整性和正确性，可能需要将数据中的特殊字符进行转码。数据存储：在数据库或数据存储中，
排序算法太多？常用排序都在这了，一篇文章总结和实现所有面试会考的排序算法（基于Python实现）宇宙之一粟不归路之Python #IT面试题收集与总结数据结构与算法算法数据结构排序算法 python java
文章目录排序算法1.常见的排序算法1.1选择排序1.1.1思想1.1.2实现**1.1.3选择排序分析**1.2冒泡排序**1.2.1思想****1.2.2实现****1.2.3冒泡排序分析**1.3插入排序**1.3.1思想****1.3.2实现****1.3.3插入排序分析**1.4归并排序☆☆★**1.4.1思想****1.4.2实现****1.4.3归并排序分析**1.5快速排序☆★★**
27.Python从入门到精通—Python异常处理抛出异常用户自定义异常定义清理行为预定义的清理行为以山河作礼。 #Python基础入门—详解版 python java 服务器
27.从入门到精通：Python异常处理抛出异常用户自定义异常定义清理行为预定义的清理行为异常处理抛出异常用户自定义异常定义清理行为预定义的清理行为异常处理在Python中，异常处理是一种处理程序在执行期间可能遇到的错误的方法。当Python解释器遇到错误时，它会引发异常。异常是一种Python对象，它包含有关错误的信息，例如错误类型和错误位置。为了处理异常，您可以使用try-except语句。在
python清华大学出版社答案_Python机器学习及实践 weixin_39805119 python清华大学出版社答案
第1章机器学习的基础知识1.1何谓机器学习1.1.1传感器和海量数据1.1.2机器学习的重要性1.1.3机器学习的表现1.1.4机器学习的主要任务1.1.5选择合适的算法1.1.6机器学习程序的步骤1.2综合分类1.3推荐系统和深度学习1.3.1推荐系统1.3.2深度学习1.4何为Python1.4.1使用Python软件的由来1.4.2为什么使用Python1.4.3Python设计定位1.4.
Python | Redis工具类 -拟墨画扇- Python redis 数据库缓存 python
一、需求自动连接Redis数据库，通过连接池处理数据对输出结果进行Log打印并保存到文件二、代码Utils.redisUtils.py#!/usr/bin/envpython#-*-coding:utf-8-*-importredisfromUtils.loggerimportlog"""Redis数据格式(1)字符串|存储形式:key-value:str-存储二进制数据:可以存储任意类型的数据，
Python dict字符串转json对象，小数精度丢失问题朝如青丝暮成雪 json python
一前言JSON(JavaScriptObjectNotation)是一种轻量级的数据交换格式，dict是Python的一种数据格式。本篇介绍一个float数据转换时精度丢失的案例。二问题描述importjsontest_str1='{"π":3.1415926535897932384626433832795028841971}'test_str2='{"value":10.00000}'print
UNDERSTANDING HTML WITH LARGE LANGUAGE MODELS liferecords LLM 语言模型人工智能自然语言处理
UNDERSTANDINGHTMLWITHLARGELANGUAGEMODELS相关链接：arXiv关键字：大型语言模型、HTML理解、Web自动化、自然语言处理、机器学习摘要大型语言模型（LLMs）在各种自然语言任务上表现出色。然而，它们在HTML理解方面的能力——即解析网页的原始HTML，对于自动化基于Web的任务、爬取和浏览器辅助检索等应用——尚未被充分探索。我们为HTML理解模型（经过微调
Python+Requests模拟发送GET请求爱学习的执念自动化测试软件测试技术分享 python 开发语言
模拟发送GET请求前置条件：导入requests库一、发送不带参数的get请求代码如下：以百度首页为例importrequests#发送get请求response=requests.get(url="http://www.baidu.com")print(response.content.decode("utf-8"))#以utf-8的编码输出内容二、发送带参数的get请求发送带参数的get请求有
Python极速入门：五分钟开启实战之旅！知白守黑V Python 编程语言系统运维 python 编程语言 python开发 python学习 python入门 python数据分析
1.Python基础语法和结构：了解Python的基本语法，包括变量、数据类型、运算符、注释等。控制流：掌握条件语句（if-elif-else）、循环（for和while）及其控制（break和continue）。函数：学习如何定义和使用函数，包括参数传递、返回值、作用域和闭包。模块和包：理解如何导入和使用模块，以及如何创建和使用自己的包。2.数据处理列表、元组和集合：学习这些序列类型的操作和方法
Python Flask 使用数据库安果移不动 python flask 开发语言
pipinstallflask_sqlalchemy官方文档：Flask-SQLAlchemy—Flask-SQLAlchemyDocumentation(3.1.x)为了不报错也需要导入另外两个库#pipinstallflask_sqlalchemy#pipinstallmysqlclient完整代码importosfromflaskimportFlaskfromflask_sqlalchemy
深度学习项目-基于深度学习的股票价格预测研究雅致教育计算机毕业设计深度学习人工智能
概要随着经济的发展，中国股票市场的规模持续扩大，早已成为金融投资的重要部分，掌握股票市场的变化规律无论是对监管者还是投资者都具有极其重要的意义。正因如此，人们不断探索着股票市场的变化规律，其中使用深度学习预测股价是当前国内国际研究与应用的热点。本文首先从有效市场假说和分形市场假说两个角度讨论了中国股票市场的有效性，说明股票市场具有复杂的非线性特征。其次，结合股票市场特征对比了当前的预测方法
PaperWeekly sapienst Papers PaperwithCode General ML
1.Python软件包解决DL在未见过的数据分布下性能差的问题：（1）神经网络和损失分离的模块化设计（2）强大便捷的基准测试能力（3）易于使用但难以修改（4）github:https://github.com/marrlab/domainlabTrainer和Models之间是什么关系Trainer和Models是DomainLab中的两个核心概念。Trainer是一个用于指导数据流向模型并计算S
使用Python读取Excel文件并计算平均分嘻嘻爱编码 Python从入门到放弃 python excel 开发语言
在这篇博客中，我们将探讨如何使用Python的pandas库来读取Excel文件，并计算其中数据的平均分。pandas是一个强大的数据分析工具，它允许我们以简单直观的方式处理表格数据。安装必要的库在开始之前，确保你的环境中安装了pandas和openpyxl库。可以使用以下命令进行安装：pipinstallpandasopenpyxl读取Excel文件首先，我们需要读取Excel文件。假设我们有一
python项目练习——7.网站访问日志分析器 F—— python项目练习 python 信息可视化数据分析数据挖掘开发语言学习
项目功能分析：这个项目可以读取网站的访问日志文件，统计访问量、独立访客数、访问来源等信息，并以图表或表格的形式展示出来。这个项目涉及到文件操作、数据处理、数据可视化等方面的技术。示例代码：importrefromcollectionsimportCounterimportmatplotlib.pyplotaspltdefparse_log_file(log_file):#读取日志文件内容witho
python的while双重循环九九乘法表 Jinm_R python 开发语言
a=1whilea<=9:b=1#乘数每次需要从1开始whileb<=a:print(f"{a}*{b}={a*b}\t",end='')#\t为制表符使乘法表整齐end=''代表用空格代替换行b+=1a+=1print()#乘数每加一换行
ChatGPT技巧大揭秘：AI写代码新境界 2401_83550420 chatgpt4.0 chatgpt chatgpt 人工智能 AI写作
ChatGPT无限次数:点击直达ChatGPT技巧大揭秘：AI写代码新境界随着人工智能技术的不断进步，开发人员现在有了更多有趣的工具来提高他们的工作效率。其中，ChatGPT作为一种基于深度学习的自然语言处理模型，已经成为许多开发者的新宠。在本文中，我们将揭秘使用ChatGPT来帮助编写代码的技巧，探索AI在编程领域的新境界。ChatGPT简介ChatGPT是一种基于大型神经网络的对话生成模型，它
AI大模型学习：开启智能时代的新篇章游向大厂的咸鱼人工智能学习
随着人工智能技术的不断发展，AI大模型已经成为当今领先的技术之一，引领着智能时代的发展。这些大型神经网络模型，如OpenAI的GPT系列、Google的BERT等，在自然语言处理、图像识别、智能推荐等领域展现出了令人瞩目的能力。然而，这些模型的背后是一系列复杂的学习过程，深度学习技术的不断演进推动了AI大模型学习的发展。首先，AI大模型学习的基础是深度学习技术。深度学习是一种模仿人类大脑结构的机器
【Python】成功解决ModuleNotFoundError: No module named ‘torchinfo‘ 高斯小哥 BUG解决方案合集 python pytorch 新手入门学习 debug
【Python】成功解决ModuleNotFoundError:Nomodulenamed‘torchinfo’个人主页：高斯小哥高质量专栏：Matplotlib之旅：零基础精通数据可视化、Python基础【高质量合集】、PyTorch零基础入门教程希望得到您的订阅和支持~创作高质量博文(平均质量分92+)，分享更多关于深度学习、PyTorch、Python领域的优质内容！（希望得到您的关注~）文
OpenCV（一个C++人工智能领域重要开源基础库）简介愚梦者 OpenCV 人工智能人工智能 opencv c++图像处理计算机视觉开源
返回：OpenCV系列文章目录（持续更新中......）上一篇：OpenCV4.9.0配置选项参考下一篇：OpenCV4.9.0开源计算机视觉库安装概述引言：OpenCV（全称OpenSourceComputerVisionLibrary）是一个基于开放源代码发行的跨平台计算机视觉库，可以用来进行图像处理、计算机视觉和机器学习等领域的开发。该库由英特尔公司于1999年开始开发，最初是为了加速处理器
Python自动化测试web常见框架汇总自动化测试薰儿软件测试技术分享 python 前端开发语言
1、前言目前，有非常多的Python框架，用来帮助你更轻松的创建web应用。这些框架把相应的模块组织起来，使得构建应用的时候可以更快捷，也不用去关注一些细节（例如socket和协议），所以需要的都在框架里了。接下来我们会介绍不同的选项。经过初期的不起眼，Python已经成为互联网最流行的服务端编程语言之一。根据W3Techs的统计，它被用于很多的大流量的站点很多的大流量的站点很多的大流量的站点，超
零基础机器学习(5)之线性回归模型的性能评估一只特立独行猪机器学习机器学习线性回归人工智能
文章目录线性回归模型的性能评估1.举例1-单一特征2.举例2-多特征线性回归模型的性能评估评估线性回归模型时，首先要建立评估的测试数据集（测试集不能与训练集相同），然后选择合适的评估方法，实现对线性回归模型的评估。回归任务中最常用的评估方法有均方误差、均方根误差和预测准确率（确定系数）。1.举例1-单一特征分别对两个模型进行评估，输入的测试集如表所示。面积/（m2）售价/（万元）面积/（m2）售价
jquery实现的jsonp掉java后台知了ing java jsonp jquery
什么是JSONP？先说说JSONP是怎么产生的：其实网上关于JSONP的讲解有很多，但却千篇一律，而且云里雾里，对于很多刚接触的人来讲理解起来有些困难，小可不才，试着用自己的方式来阐释一下这个问题，看看是否有帮助。 1、一个众所周知的问题，Ajax直接请求普通文件存在跨域无权限访问的问题，甭管你是静态页面、动态网页、web服务、WCF，只要是跨域请求，一律不准； 2、
Struts2学习笔记 caoyong struts2
SSH : Spring + Struts2 + Hibernate 三层架构(表示层,业务逻辑层,数据访问层) MVC模式 (Model View Controller) 分层原则:单向依赖，接口耦合 1、Struts2 = Struts + Webwork 2、搭建struts2开发环境 a>、到www.apac
SpringMVC学习之后台往前台传值方法满城风雨近重阳 springMVC
springMVC控制器往前台传值的方法有以下几种： 1.ModelAndView 通过往ModelAndView中存放viewName：目标地址和attribute参数来实现传参： ModelAndView mv=new ModelAndView(); mv.setViewName="success
WebService存在的必要性？一炮送你回车库 webservice
做Java的经常在选择Webservice框架上徘徊很久，Axis Xfire Axis2 CXF ，他们只有一个功能，发布HTTP服务然后用XML做数据传输。是的，他们就做了两个功能，发布一个http服务让客户端或者浏览器连接，接收xml参数并发送xml结果。当在不同的平台间传输数据时，就需要一个都能解析的数据格式。但是为什么要使用xml呢？不能使json或者其他通用数据
js年份下拉框 3213213333332132 java web ee
<div id="divValue">test...</div>测试 //年份 <select id="year"></select> <script type="text/javascript"> window.onload =
简单链式调用的实现技术归来朝歌方法调用链式反应编程思想
在编程中，我们可以经常遇到这样一种场景：一个实例不断调用它自身的方法，像一条链条一样进行调用这样的调用你可能在Ajax中，在页面中添加标签： $("<p>").append($("<span>").text(list[i].name)).appendTo("#result"); 也可能在HQ
JAVA调用.net 发布的webservice 接口 darkranger webservice
/** * @Title: callInvoke * @Description: TODO(调用接口公共方法) * @param @param url 地址 * @param @param method 方法 * @param @param pama 参数 * @param @return * @param @throws BusinessException
Javascript模糊查找 | 第一章循环不能不重视。 aijuans Way
最近受我的朋友委托用js+HTML做一个像手册一样的程序，里面要有可展开的大纲，模糊查找等功能。我这个人说实在的懒，本来是不愿意的，但想起了父亲以前教我要给朋友搞好关系，再加上这也可以巩固自己的js技术，于是就开始开发这个程序，没想到却出了点小问题，我做的查找只能绝对查找。具体的js代码如下： function search(){ var arr=new Array("my
狼和羊，该怎么抉择 atongyeye 工作
狼和羊，该怎么抉择在做一个链家的小项目，只有我和另外一个同事两个人负责，各负责一部分接口，我的接口写完，并全部测联调试通过。所以工作就剩下一下细枝末节的，工作就轻松很多。每天会帮另一个同事测试一些功能点，协助他完成一些业务型不强的工作。今天早上到公司没多久，领导就在QQ上给我发信息，让我多协助同事测试，让我积极主动些，有点责任心等等，我听了这话，心里面立马凉半截，首先一个领导轻易说
读取android系统的联系人拨号百合不是茶 android sqlite数据库内容提供者系统服务的使用
联系人的姓名和号码是保存在不同的表中,不要一下子把号码查询来,我开始就是把姓名和电话同时查询出来的,导致系统非常的慢关键代码: 1, 使用javabean操作存储读取到的数据 package com.example.bean; /** * * @author Admini
ORACLE自定义异常 bijian1013 数据库自定义异常
实例： CREATE OR REPLACE PROCEDURE test_Exception ( ParameterA IN varchar2, ParameterB IN varchar2, ErrorCode OUT varchar2 --返回值,错误编码 ) AS /*以下是一些变量的定义*/ V1 NUMBER; V2 nvarc
查看端号使用情况征客丶 windows
一、查看端口在windows命令行窗口下执行： >netstat -aon|findstr "8080" 显示结果： TCP 127.0.0.1:80 0.0.0.0:0 &
【Spark二十】运行Spark Streaming的NetworkWordCount实例 bit1129 wordcount
Spark Streaming简介 NetworkWordCount代码 /* * Licensed to the Apache Software Foundation (ASF) under one or more * contributor license agreements. See the NOTICE file distributed with
Struts2 与 SpringMVC的比较 BlueSkator struts2 spring mvc
1. 机制：spring mvc的入口是servlet，而struts2是filter，这样就导致了二者的机制不同。 2. 性能：spring会稍微比struts快。spring mvc是基于方法的设计，而sturts是基于类，每次发一次请求都会实例一个action，每个action都会被注入属性，而spring基于方法，粒度更细，但要小心把握像在servlet控制数据一样。spring
Hibernate在更新时，是可以不用session的update方法的(转帖） BreakingBad Hibernate update
地址：http://blog.csdn.net/plpblue/article/details/9304459 public void synDevNameWithItil() {Session session = null;Transaction tr = null;try{session = HibernateUtil.getSession();tr = session.beginTran
读《研磨设计模式》-代码笔记-观察者模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; import java.util.Observable; import java.util.Observer; /** * “观
重置MySQL密码 chenhbc mysql 重置密码忘记密码
如果你也像我这么健忘，把MySQL的密码搞忘记了，经过下面几个步骤就可以重置了（以Windows为例，Linux/Unix类似）： 1、关闭MySQL服务 2、打开CMD，进入MySQL安装目录的bin目录下，以跳过权限检查的方式启动MySQL mysqld --skip-grant-tables 3、新开一个CMD窗口，进入MySQL mysql -uroot
再谈系统论，控制论和信息论 comsci 设计模式生物能源企业应用领域模型
再谈系统论，控制论和信息论偶然看
oracle moving window size与 AWR retention period关系 daizj oracle
转自： http://tomszrp.itpub.net/post/11835/494147 晚上在做11gR1的一个awrrpt报告时,顺便想调整一下AWR snapshot的保留时间,结果遇到了ORA-13541这样的错误.下面是这个问题的发生和解决过程. SQL> select * from v$version; BANNER -------------------
Python版B树 dieslrae python
话说以前的树都用java写的,最近发现python有点生疏了,于是用python写了个B树实现,B树在索引领域用得还是蛮多了,如果没记错mysql的默认索引好像就是B树... 首先是数据实体对象,很简单,只存放key,value class Entity(object): '''数据实体''' def __init__(self,key,value)
C语言冒泡排序 dcj3sjt126com 算法
代码示例： # include <stdio.h> //冒泡排序 void sort(int * a, int len) { int i, j, t; for (i=0; i<len-1; i++) { for (j=0; j<len-1-i; j++) { if (a[j] > a[j+1]) // >表示升序
自定义导航栏样式 dcj3sjt126com 自定义
-(void)setupAppAppearance { [[UILabel appearance] setFont:[UIFont fontWithName:@"FZLTHK—GBK1-0" size:20]]; [UIButton appearance].titleLabel.font =[UIFont fontWithName:@"FZLTH
11.性能优化-优化-JVM参数总结 frank1234 jvm参数性能优化
1.堆 -Xms --初始堆大小 -Xmx --最大堆大小 -Xmn --新生代大小 -Xss --线程栈大小 -XX:PermSize --永久代初始大小 -XX:MaxPermSize --永久代最大值 -XX:SurvivorRatio --新生代和suvivor比例,默认为8 -XX:TargetSurvivorRatio --survivor可使用
nginx日志分割 for linux HarborChung nginx linux 脚本
nginx日志分割 for linux 默认情况下，nginx是不分割访问日志的，久而久之，网站的日志文件将会越来越大，占用空间不说，如果有问题要查看网站的日志的话，庞大的文件也将很难打开，于是便有了下面的脚本使用方法，先将以下脚本保存为 cutlog.sh，放在/root 目录下，然后给予此脚本执行的权限复制代码代码如下: chmo
Spring4新特性——泛型限定式依赖注入 jinnianshilongnian spring spring4 泛型式依赖注入
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
centOS安装GCC和G++ liuxihope centos gcc
Centos支持yum安装，安装软件一般格式为yum install .......，注意安装时要先成为root用户。按照这个思路，我想安装过程如下：安装gcc：yum install gcc 安装g++： yum install g++ 实际操作过程发现，只能有gcc安装成功，而g++安装失败，提示g++ command not found。上网查了一下，正确安装应该
第13章 Ajax进阶（上） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
How to determine BusinessObjects service pack and fix pack blueoxygen BO
http://bukhantsov.org/2011/08/how-to-determine-businessobjects-service-pack-and-fix-pack/ The table below is helpful. Reference BOE XI 3.x 12.0.0. y BOE XI 3.0 12.0. x. y BO
Oracle里的自增字段设置 tomcat_oracle oracle
　大家都知道吧，这很坑，尤其是用惯了mysql里的自增字段设置，结果oracle里面没有的。oh，no 　　我用的是12c版本的，它有一个新特性，可以这样设置自增序列，在创建表是，把id设置为自增序列 create table t ( id 　　　　 number generated by default as identity (start with 1 increment b
Spring Security（01）——初体验 yang_winnie spring Security
Spring Security（01）——初体验博客分类： spring Security Spring Security入门安全认证首先我们为Spring Security专门建立一个Spring的配置文件，该文件就专门用来作为Spring Security的配置