双木的木

PyTorch深度学习实践概论笔记12-循环神经网络基础篇

上一讲链接在这PyTorch深度学习实践概论笔记11-卷积神经网络高级篇。接下来12讲，来讨论一下基本的RNN（循环神经网络）。

RNN其实是对之前神经网络的复用。

0 Revision

0.1 Revision:DNN

回顾之前的DNN（深度神经网络）。

Dense网络是稠密网络，Dense连接就是指全连接。有很多线性层对输入数据进行空间上的变换，又叫DNN。输入x1，x2，…，x8是数据样本的不同特征。

考虑这样一个场景：比如预测天天气，就需要知道之前几天的数据，每一天的数据都包含若个特征（温度、气压、雨天），如果你已知今天的温度、气压等特征去预测有没有雨，这是没有用的，徐提前预测，需要之前若干天的数据作为输入。

假设现在取前3天，每一天有3个特征（温度、气压、雨天），如何预测第4天是否有雨？

第一种方法：把x1，x2，x3拼成有9个维度的长向量，然后去训练最后一天是否有雨。用全连接稠密网络进行预测，如果输入序列很长，而且每一个序列维度很高的话，对网络训练有很大挑战，因为稠密网络（全连接网络）实际上权重是最多的。对于卷积层：比如输入通道是128个，输出通道是64个，如果用55的卷积，权重数就是 25*64*188=204800，卷积层的输入输出只与通道数和卷积核的大小有关，全连接层和变换之后的数据大小有关，比如3阶张量经过一系列的卷积变换还剩下4096个元素，4096我们很少直接降成1维或者10维，而是先降成1024维，全连接层的权重为4096*1024=4194304，所以相比起来，卷积层的权重并不多，而全连接层的权重较多。全连接层是在网络的全部参数中占大头的。

为什么卷积神经网络的权重比较少呢？因为使用了权重共享的概念，做卷积时，整个图像的卷积核是共享的，并不是图像上的每一个像素要和下一层的featureMap建立连接，权重数量就少。处理视频的时候，每一帧就少一张图像，我们需要把一组图像做成一个集合，如果用全连接网络的话，使用到的权重的数量就是一个天文数字，极大可能难以处理。

所以RNN专门用来处理带有序列模式的数据，也使用权重共享减少需要训练的权重的数量。我们把x1，x2，x3看成是一个序列，不仅考虑x1，x2之间的连接关系，还考虑x1，x2的时间上的先后顺序（x2依赖于x1，x3依赖于x2），下一天的天气状况部分依赖于前一天的天气状况，RNN主要处理这种具有序列连接的数据。

天气，股市，金融，自然语言处理都是序列数据。

0.2 Revision:CNN

以及之前的CNN（卷积神经网络）。

1 What is RNNs?

RNN Cell本质是一个线性层（linear），把一个维度映射到另一个维度（比如把输入的3维向量xt变成输出5维向量ht）。这个线性层与普通的线性层的区别是这个线性层是共享的。

左侧展开就是右侧图（其中所有的RNN cell是同一个线性层，因为是展开的），h0是先验值，没有就设置成0向量（纬度和h1一样）。

RNN具体的计算过程：

输入xt先做线性变换，h t-1也是，xt的维度是input_size，h t-1的维度是hidden_size，输出ht的维度是hidden_size。我们需要先把xt的维度变成hidden_size，所以Wih应该是一个 hidden_size*input_size的矩阵，Wihxt得到一个 hidden_size的矩阵（就是维度为hidden_size的向量），bih是偏置。输入权重矩阵Whh是一个hidden_size*hidden_size的矩阵。

whhh t-1+bhh和Wihxt+bih都是维度为hidden_size的向量，然后两个向量相加，就把信息融合起来了，融合之后用tanh做激活，循环神经网络的激活函数用的是tanh（为什么呢？因为tanh的取值在-1到+1之间），算出结果得到这一层的隐藏层输出ht。完整写出来的公式就是上图第一行的公式。

把RNN Cell以循环的方式把序列（x1,x2,…）一个一个送进去，然后依次算出隐藏层(h1,h2…)的过程，每一次算出来的h会作为下一个RNN Cell的输入，这就叫循环神经网络。

如果我们要构造RNN，在pytorch中有两种方式，我们看一下：

1.1 RNN Cell in PyTorch

方式一：构建cell

使用torch.nn.RNNCell()，需要设定输入的值input_size和隐层的值hidden_size，就能确定权重W的维度和偏置b的维度。

如上图，RNN本质上还是一个线性层，要弄清楚纬度。代码如下：

cell = torch.nn.RNNCell(input_size=input_size, hidden_size=hidden_size)
#实例化Cell后，需要给定当前的输入input以及当前的hidden，所以需要用循环来处理
hidden = cell(input, hidden)

1.2 How to use RNNCell

具体看一下例子。

batchSize表示批量大小
seqLen=3表示每一个样本都有x1,x2,x3这些特征
inputSize=4表示每一个特征都是4维的
hoddenSize=2表示每一个隐藏层是2维的

代码如下：

import torch

#参数设置
batch_size = 1

seq_len = 3

input_size = 4

hidden_size = 2

#构造RNN单元
cell = torch.nn.RNNCell(input_size=input_size, hidden_size=hidden_size)


# 设置dataset的维度为(seq, batch, features)

dataset = torch.randn(seq_len, batch_size, input_size)

#初始化h0为0
hidden = torch.zeros(batch_size, hidden_size)


for idx, input in enumerate(dataset):

    print('=' * 20, idx, '=' * 20)

    print('Input size: ', input.shape)#Input size: torch.Size([1, 4])

    hidden = cell(input, hidden)

    print('outputs size: ', hidden.shape)#outputs size: torch.Size([1, 2])

    print(hidden)

结果如下：

将来使用RNN的时候一定要先把纬度搞清楚，RNN比之前多了一个seq_len(序列)的纬度。

方式二：直接使用RNN

直接使用torch.nn.RNN()需要知道input_size、hidden_size和num_layers（RNN有多少层，默认为1）。cell(inputs,hidden)中 inputs指包含整个输入序列（x1,x2,x3,...xN），hidden指h0。

代码如下：

cell = torch.nn.RNN(input_size=input_size, hidden_size=hidden_size,num_layers=num_layers)
out,hidden = cell(inputs,hidden)

具体看看上述代码的维度要求：

用RNN不用自己写循环，它自动循环，所以输入的时候要把所有的序列都送进去，然后给定h0，然后我们就会得到所有的隐层输出以及最后一层的输出。

看一个栗子，假设有下面的信息：

1.2.1 How to use RNN - numLayers

那么什么是numLayers？

当RNN有多层，同样颜色的RNNCell是同一个，所以上图是有3个线性层（一个RNNCell是一个线性层）。这样就能解释为什么隐藏层h的纬度需要numLayers参数，因为每一层都需要。看看代码：

代码如下：

import torch


batch_size = 1

seq_len = 3

input_size = 4

hidden_size = 2

num_layers = 1


cell = torch.nn.RNN(input_size=input_size, hidden_size=hidden_size,

num_layers=num_layers)


# (seqLen, batchSize, inputSize)

inputs = torch.randn(seq_len, batch_size, input_size)

hidden = torch.zeros(num_layers, batch_size, hidden_size)


out, hidden = cell(inputs, hidden)


print('Output size:', out.shape)

print('Output:', out)

print('Hidden size: ', hidden.shape)

print('Hidden: ', hidden)

注意：如果初始化RNN时，把batch_first设置成了TRUE，那么inputs的参数batch_size和seq_len需要调换一下位置，batch_size变成第一个纬度。

代码如下：

2 Example

下面看看分别用两种构造RNN的方法来解决一个小问题。

2.1 Example 12-1

2.1.1 Example 12-1: Using RNNCell

看一个小栗子，seq到seq。训练一个模型：输入hello，输出ohlol。

RNN Cell 的输入是向量，第一步先把字符转成向量。

在NLP中，先根据字符构造一个词典（Dictionary），然后根据indeces转换成相应的one-hot向量。这里inputsize=4，因为输入有4个字符（e h l o）这相当于一个多分类问题，输出就是一个4维的向量，每一维代表是某一个字符的概率，接交叉熵就能输出概率了。

输出的output_size=4

2.1.2 Example 12-1: Code-Parameters

具体看看代码实现，如下：

#Parameters
import torch

input_size = 4

hidden_size = 4

batch_size = 1

#Prepare Data
idx2char = ['e', 'h', 'l', 'o']#字典dictionary

x_data = [1, 0, 2, 2, 3]#输入序列"hello"

y_data = [3, 1, 2, 3, 2]#输出序列"ohlol"

one_hot_lookup = [[1, 0, 0, 0],

    	       [0, 1, 0, 0],

    	       [0, 0, 1, 0],

    	       [0, 0, 0, 1]]

x_one_hot = [one_hot_lookup[x] for x in x_data]#将indice转换成one-hot向量，纬度为seq*inputsize

#改变inputs的维度为(seqLen,batchSize,inputSize)
inputs = torch.Tensor(x_one_hot).view(-1, batch_size, input_size)

#改变标签labels的维度为(seqLen,1)
labels = torch.LongTensor(y_data).view(-1, 1)

#Design Model
class Model(torch.nn.Module):

    def __init__(self, input_size, hidden_size, batch_size):

    	super(Model, self).__init__()
     	#初始化参数

    	self.batch_size = batch_size

    	self.input_size = input_size

    	self.hidden_size = hidden_size
     	#input维度为(batchSize,inputSize)
      	#hidden维度为(batchSize,hiddenSize)

    	self.rnncell = torch.nn.RNNCell(input_size=self.input_size,

hidden_size=self.hidden_size)

    
    def forward(self, input, hidden):

    	hidden = self.rnncell(input, hidden)

    	return hidden


    def init_hidden(self):
    	#工具方法，用来生成默认的初始化hidden
    	return torch.zeros(self.batch_size, self.hidden_size)


net = Model(input_size, hidden_size, batch_size)

#Loss and Optimizer
criterion = torch.nn.CrossEntropyLoss()

optimizer = torch.optim.Adam(net.parameters(), lr=0.1)

#train
for epoch in range(15):

    loss = 0

    optimizer.zero_grad()

    hidden = net.init_hidden()

    print('Predicted string: ', end='')
    #inputs的维度为(seqLen,batchSize,inputSize)
    #input维度为(batchSize,inputSize)
    #labels的维度为(seqLen,1)
    #label的维度为(1)

    for input, label in zip(inputs, labels):

    	hidden = net(input, hidden)#RNN模型

    	loss += criterion(hidden, label)  #注意这里不要用item()！！！！因为loss是用来构造计算图的，可以直接相加

    	_, idx = hidden.max(dim=1)#输出预测，找到最大值的下标

    	print(idx2char[idx.item()], end='')

    loss.backward()

    optimizer.step()

    print(', Epoch [%d/15] loss=%.4f' % (epoch+1, loss.item()))

结果如下：

Predicted string: eeeee, Epoch [1/15] loss=7.0864
Predicted string: ohloe, Epoch [2/15] loss=5.8847
Predicted string: ohloe, Epoch [3/15] loss=5.0372
Predicted string: ohlol, Epoch [4/15] loss=4.3152
Predicted string: ohlol, Epoch [5/15] loss=3.7545
Predicted string: ohlol, Epoch [6/15] loss=3.3624
Predicted string: ohlol, Epoch [7/15] loss=3.0933
Predicted string: ohlol, Epoch [8/15] loss=2.9041
Predicted string: ohlol, Epoch [9/15] loss=2.7653
Predicted string: ohlol, Epoch [10/15] loss=2.6594
Predicted string: ohlol, Epoch [11/15] loss=2.5755
Predicted string: ohlol, Epoch [12/15] loss=2.5040
Predicted string: ohlol, Epoch [13/15] loss=2.4336
Predicted string: ohlol, Epoch [14/15] loss=2.3505
Predicted string: ohlol, Epoch [15/15] loss=2.2406

PPT结果：

2.2 Example 12-2

2.2.1 Example 12-2： Using RNN Module

接下来直接使用RNN，就简单许多。

2.2.2 Example 12-2：Change Model

代码如下：

class Model(torch.nn.Module):

    def __init__(self, input_size, hidden_size, batch_size, num_layers=1):

    	super(Model, self).__init__()
     	#input_size = 4

    	#hidden_size = 4

    	#num_layers = 1

    	#batch_size = 1

    	#seq_len = 5

    	self.num_layers = num_layers#1

    	self.batch_size = batch_size#1

    	self.input_size = input_size#4

    	self.hidden_size = hidden_size#4

    	self.rnn = torch.nn.RNN(input_size=self.input_size,

    	hidden_size=self.hidden_size,num_layers=num_layers)

    
    def forward(self, input):
    	#hidden维度为(, , )

    	hidden = torch.zeros(self.num_layers,

    			self.batch_size,

    			self.hidden_size)

    	out, _ = self.rnn(input, hidden)
     	#out维度为( × , )

    	return out.view(-1, self.hidden_size)
     

net = Model(input_size, hidden_size, batch_size, num_layers)

2.2.3 Example 12-2：Change Data

代码如下：

idx2char = ['e', 'h', 'l', 'o']

x_data = [1, 0, 2, 2, 3]

y_data = [3, 1, 2, 3, 2]


one_hot_lookup = [[1, 0, 0, 0],

    	       [0, 1, 0, 0],

    	       [0, 0, 1, 0],

    	       [0, 0, 0, 1]]

x_one_hot = [one_hot_lookup[x] for x in x_data]
#inputs的维度为(seqLen,batchSize,inputSize)
inputs = torch.Tensor(x_one_hot).view(seq_len, batch_size, input_size)

#labels的维度为(seqLen*batchSize,1)
labels = torch.LongTensor(y_data)

训练代码：

criterion = torch.nn.CrossEntropyLoss()

optimizer = torch.optim.Adam(net.parameters(), lr=0.05)


for epoch in range(15):
    #训练

    optimizer.zero_grad()

    outputs = net(inputs)#inputs纬度seq,batchsize,inputsize

    loss = criterion(outputs, labels)#lables纬度seq,batchsize,1

    loss.backward()

    optimizer.step()
    

    _, idx = outputs.max(dim=1)

    idx = idx.data.numpy()

    print('Predicted: ', ''.join([idx2char[x] for x in idx]), end='')

    print(', Epoch [%d/15] loss = %.3f' % (epoch + 1, loss.item()))

结果如下：

Predicted:  ooooo, Epoch [1/15] loss = 1.334
Predicted:  ooooo, Epoch [2/15] loss = 1.200
Predicted:  ooool, Epoch [3/15] loss = 1.082
Predicted:  ohool, Epoch [4/15] loss = 0.992
Predicted:  ohlol, Epoch [5/15] loss = 0.928
Predicted:  ohlol, Epoch [6/15] loss = 0.880
Predicted:  ohlol, Epoch [7/15] loss = 0.842
Predicted:  ohlol, Epoch [8/15] loss = 0.807
Predicted:  ohlol, Epoch [9/15] loss = 0.771
Predicted:  ohlol, Epoch [10/15] loss = 0.732
Predicted:  ohlol, Epoch [11/15] loss = 0.694
Predicted:  ohlol, Epoch [12/15] loss = 0.660
Predicted:  ohlol, Epoch [13/15] loss = 0.633
Predicted:  ohlol, Epoch [14/15] loss = 0.615
Predicted:  ohlol, Epoch [15/15] loss = 0.601

PPT结果：

2.2.4 Associate a vector with a word/character

接下来看看在nlp中的one-hot向量。

因为one-hot encoding存在高维度、离散、硬编码的问题，我们一般采用一个更流行、更高效的方式——embedding。

2.2.5 One-hot vs Embedding

embedding将高维离散的数据映射到加低维稠密的空间，就是常说的数据降维。在输入层和RNN层之中。

2.3 Example 12-3

2.3.1 Example 12-3：Using embedding and linear layer

接下来看看加入了嵌入层然后写代码。

最后连接一个线性层是为了保证输出一致。

下面查看官方文档，注意各个维度的匹配问题。~~Input的纬度是seq*batchsize。~~

torch.nn.Embedding：

torch.nn.Linear：

torch.nn.CrossEntropyLoss：

网络结构的代码如下：

class Model(torch.nn.Module):

    def __init__(self):

    	super(Model, self).__init__()
     	#embedding矩阵大小

    	self.emb = torch.nn.Embedding(input_size, embedding_size)  #4,5
        #RNN输入维度为(, , embedding)
     	#RNN输出维度为(, , )
    	self.rnn = torch.nn.RNN(input_size=embedding_size,

    				hidden_size=hidden_size,

    				num_layers=num_layers,

    				batch_first=True)#batchSize在input和output维度第一位

    	#FC输入维度为(, , )
     	#FC输出维度为(, , )
     	self.fc = torch.nn.Linear(hidden_size, num_class)


def forward(self, x):

    hidden = torch.zeros(num_layers, x.size(0), hidden_size)

    x = self.emb(x) #输入纬度为（batchSize,seqLen），输出维度为(batchSize, seqLen, embeddingSize)

    x, _ = self.rnn(x, hidden)

    x = self.fc(x)
    #Reshape result to use Cross Entropy Loss:( × , )

    return x.view(-1, num_class)
    
    
# parameters
num_class = 4

input_size = 4

hidden_size = 8

embedding_size = 10

num_layers = 2

batch_size = 1

seq_len = 5

idx2char = ['e', 'h', 'l', 'o']

x_data = [[1, 0, 2, 2, 3]] # (batch, seq_len)

y_data = [3, 1, 2, 3, 2] # (batch * seq_len)
#Input should be LongTensor:(, )
#Target should be LongTensor:( × )

inputs = torch.LongTensor(x_data)

labels = torch.LongTensor(y_data)

#构造模型
net = Model()

criterion = torch.nn.CrossEntropyLoss()

optimizer = torch.optim.Adam(net.parameters(), lr=0.05)

for epoch in range(15):

    optimizer.zero_grad()

    outputs = net(inputs)

    loss = criterion(outputs, labels)

    loss.backward()

    optimizer.step()
    

    _, idx = outputs.max(dim=1)

    idx = idx.data.numpy()

    print('Predicted: ', ''.join([idx2char[x] for x in idx]), end='')

    print(', Epoch [%d/15] loss = %.3f' % (epoch + 1, loss.item()))

结果如下：

Predicted: lllll, Epoch [1/15] loss = 1.412

Predicted: lllll, Epoch [2/15] loss = 1.038

Predicted: lhlll, Epoch [3/15] loss = 0.799

Predicted: ohlol, Epoch [4/15] loss = 0.652

Predicted: ohloo, Epoch [5/15] loss = 0.548

Predicted: ohlol, Epoch [6/15] loss = 0.459

Predicted: ohlol, Epoch [7/15] loss = 0.381

Predicted: ohlol, Epoch [8/15] loss = 0.313

Predicted: ohlol, Epoch [9/15] loss = 0.248

Predicted: ohlol, Epoch [10/15] loss = 0.188

Predicted: ohlol, Epoch [11/15] loss = 0.136

Predicted: ohlol, Epoch [12/15] loss = 0.098

Predicted: ohlol, Epoch [13/15] loss = 0.072

Predicted: ohlol, Epoch [14/15] loss = 0.055

Predicted: ohlol, Epoch [15/15] loss = 0.043

在此基础上还可以构建更为复杂的LSTM和GRU模块。

3 Exercise

3.1 Exercise 12–1：Using LSTM

练习12-1 使用LSTM（可解释性不强）

torch.nn.LSTM()源码：

ref：torch.nn — PyTorch 1.10.1 documentation

上图可以减少梯度传播的症状（可解释）。

源码：

一般来说，LSTM比RNN效果好，但计算复杂，运算性能比较低，现在更流行的是GRU。

3.2 Exercise 12–2：Using GRU

练习12-1 使用GRU，下面是公式实现：

torch.nn.GRU()源码：

ref：https://pytorch.org/docs/stable/nn.html#gru

总结：使用RNN首先要理解序列数据的纬度，然后理解循环过程的权重共享机制。第3节练习之后会补上，留意评论区。

说明：记录学习笔记，如果错误欢迎指正！写文章不易，转载请联系我。

guava loadingCache代码示例 IM 胡鹏飞 Java 工具类介绍
publicclassTest2{publicstaticvoidmain(String[]args)throwsException{LoadingCachecache=CacheBuilder.newBuilder()//设置并发级别为8，并发级别是指可以同时写缓存的线程数.concurrencyLevel(8)//设置缓存容器的初始容量为10.initialCapacity(10)//设置缓存
Flask框架入门：快速搭建轻量级Python网页应用「已注销」 python-AI python基础网站网络 python flask 后端
转载：Flask框架入门：快速搭建轻量级Python网页应用1.Flask基础Flask是一个使用Python编写的轻量级Web应用框架。它的设计目标是让Web开发变得快速简单，同时保持应用的灵活性。Flask依赖于两个外部库：Werkzeug和Jinja2，Werkzeug作为WSGI工具包处理Web服务的底层细节，Jinja2作为模板引擎渲染模板。安装Flask非常简单，可以使用pip安装命令
Python Flask 框架入门：快速搭建 Web 应用的秘诀 Python编程之道 Python人工智能与大数据 Python编程之道 python flask 前端 ai
PythonFlask框架入门：快速搭建Web应用的秘诀关键词Flask、微框架、路由系统、Jinja2模板、请求处理、WSGI、Web开发摘要想快速用Python搭建一个灵活的Web应用？Flask作为“微框架”代表，凭借轻量、可扩展的特性，成为初学者和小型项目的首选。本文将从Flask的核心概念出发，结合生活化比喻、代码示例和实战案例，带你一步步掌握：如何用Flask搭建第一个Web应用？路由
C++ 11 Lambda表达式和min_element()与max_element()的使用_c++ lamda函数 min_element((1) 2401_84976182 程序员 c语言 c++学习
既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵盖了95%以上CC++开发知识点，真正体系化！由于文件比较多，这里只是将部分目录截图出来，全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频，并且后续会持续更新如果你需要这些资料，可以戳这里获取#include#include#includeusingnamespacestd;boolcmp(int
C++ 11 Lambda表达式和min_element()与max_element()的使用_c++ lamda函数 min_element(
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以添加戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！intmain(){vectormyvec{3,
【LeetCode 热题 100】24. 两两交换链表中的节点——（解法一）迭代+哨兵 xumistore LeetCode leetcode 链表算法 java
Problem:24.两两交换链表中的节点题目：给你一个链表，两两交换其中相邻的节点，并返回交换后链表的头节点。你必须在不修改节点内部的值的情况下完成本题（即，只能进行节点交换）。文章目录整体思路完整代码时空复杂度时间复杂度：O(N)空间复杂度：O(1)整体思路这段代码旨在解决一个经典的链表操作问题：两两交换链表中的节点(SwapNodesinPairs)。问题要求将链表中每两个相邻的节点进行交换
基于定制开发开源AI智能名片S2B2C商城小程序的社群游戏定制策略研究说私域人工智能小程序游戏
摘要：本文聚焦社群游戏定制领域，深入探讨以社群文化和用户偏好为导向的定制策略。通过分析互动游戏活动、社群文化塑造等关键要素，结合定制开发开源AI智能名片S2B2C商城小程序的技术特性，提出针对性游戏定制方案。研究旨在提升社群用户参与度与游戏体验，为社群游戏发展提供理论支持与实践指导。关键词：社群游戏定制；定制开发开源AI智能名片S2B2C商城小程序；社群文化；用户偏好一、引言在数字化社交蓬勃发展的
PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
Android ViewBinding 使用与封装教程积跬步DEV Android 开发实战大全 android
AndroidViewBinding使用与封装教程：一、ViewBinding是什么？核心功能：为每个XML布局文件自动生成一个绑定类（如ActivityMainBinding），直接暴露所有带ID的视图引用。优点：避免繁琐的findViewById()，类型安全且编译时检查。对比DataBinding：ViewBinding仅处理视图引用，无数据绑定功能。DataBinding支持双向数据绑定，
基于链家网的二手房数据采集清洗与可视化分析 Mint_Datazzh 项目 selenium 网络爬虫
个人学习内容笔记，仅供参考。项目链接：https://gitee.com/rongwu651/lianjia原文链接：基于链家网的二手房数据采集清洗与可视化分析–笔墨云烟研究内容该课题的主要目的是通过将二手房网站上的存量与已销售房源，构建一个二手房市场行情情况与房源特点的可视化平台。该平台通过HTML架构和Echarts完成可视化的搭建。因此，该课题的主要研究内容就是如何利用相关技术设计并实现这样
Java大厂面试实录：谢飞机的电商场景技术问答（Spring Cloud、MyBatis、Redis、Kafka、AI等）
Java大厂面试实录：谢飞机的电商场景技术问答（SpringCloud、MyBatis、Redis、Kafka、AI等）本文模拟知名互联网大厂Java后端岗位面试流程，以电商业务为主线，由严肃面试官与“水货”程序员谢飞机展开有趣的对话，涵盖SpringCloud、MyBatis、Redis、Kafka、SpringSecurity、AI等热门技术栈，并附详细解析，助力求职者备战大厂面试。故事设定谢
【超硬核】JVM源码解读：Java方法main在虚拟机上解释执行 HeapDump性能社区 java 开发语言后端 jvm
本文由HeapDump性能社区首席讲师鸠摩（马智）授权整理发布第1篇-关于Java虚拟机HotSpot，开篇说的简单点开讲Java运行时，这一篇讲一些简单的内容。我们写的主类中的main()方法是如何被Java虚拟机调用到的？在Java类中的一些方法会被由C/C++编写的HotSpot虚拟机的C/C++函数调用，不过由于Java方法与C/C++函数的调用约定不同，所以并不能直接调用，需要JavaC
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
分布式学习笔记_04_复制模型 NzuCRAS 分布式学习笔记架构后端
常见复制模型使用复制的目的在分布式系统中，数据通常需要被分布在多台机器上，主要为了达到：拓展性：数据量因读写负载巨大，一台机器无法承载，数据分散在多台机器上仍然可以有效地进行负载均衡，达到灵活的横向拓展高容错&高可用：在分布式系统中单机故障是常态，在单机故障的情况下希望整体系统仍然能够正常工作，这时候就需要数据在多台机器上做冗余，在遇到单机故障时能够让其他机器接管统一的用户体验：如果系统客户端分布
Python之七彩花朵代码实现 PlutoZuo Python python 开发语言
Python之七彩花朵代码实现文章目录Python之七彩花朵代码实现下面是一个简单的使用Python的七彩花朵。这个示例只是一个简单的版本，没有很多高级功能，但它可以作为一个起点，你可以在此基础上添加更多功能。importturtleastuimportrandomasraimportmathtu.setup(1.0,1.0)t=tu.Pen()t.ht()colors=['red','skybl
算法学习笔记：15.二分查找 ——从原理到实战，涵盖 LeetCode 与考研 408 例题呆呆企鹅仔算法学习算法学习笔记考研二分查找
在计算机科学的查找算法中，二分查找以其高效性占据着重要地位。它利用数据的有序性，通过不断缩小查找范围，将原本需要线性时间的查找过程优化为对数时间，成为处理大规模有序数据查找问题的首选算法。二分查找的基本概念二分查找（BinarySearch），又称折半查找，是一种在有序数据集合中查找特定元素的高效算法。其核心原理是：通过不断将查找范围减半，快速定位目标元素。与线性查找逐个遍历元素不同，二分查找依赖
Python 脚本最佳实践2025版
前文可以直接把这篇文章喂给AI,可以放到AI角色设定里,也可以直接作为提示词.这样,你只管提需求,写脚本就让AI来.概述追求简洁和清晰：脚本应简单明了。使用函数(functions)、常量(constants)和适当的导入(import)实践来有逻辑地组织你的Python脚本。使用枚举(enumerations)和数据类(dataclasses)等数据结构高效管理脚本状态。通过命令行参数增强交互性
（Python基础篇）字典的操作 EternityArt 基础篇 python 开发语言
一、引言在Python编程中，字典（Dictionary）是一种极具灵活性的数据结构，它通过“键-值对”（key-valuepair）的形式存储数据，如同现实生活中的字典——通过“词语（键）”快速查找“释义（值）”。相较于列表和元组的有序索引访问，字典的优势在于基于键的快速查找，这使得它在处理需要频繁通过唯一标识获取数据的场景中极为高效。掌握字典的操作，能让我们更高效地组织和管理复杂数据，是Pyt
基于开源AI智能名片链动2+1模式与S2B2C商城小程序的渠道选择策略研究说私域人工智能小程序
摘要：在数字化商业环境下，品牌与产品的渠道选择对其市场推广和运营成功至关重要。本文聚焦于如何依据自身品牌和产品特性，结合开源AI智能名片链动2+1模式与S2B2C商城小程序，运用科学的渠道选择方法，慎重挑选1-2个适宜平台，集中资源发力并取得成绩后再拓展其他渠道。通过理论分析与案例研究，探讨该策略的有效性和可行性，为企业渠道布局提供参考。关键词：渠道选择；开源AI智能名片；链动2+1模式；S2B2
深入解析 TCP 连接状态与进程挂起、恢复与关闭誰能久伴不乏 tcp/ip 网络服务器
文章目录深入解析TCP连接状态与进程挂起、恢复与关闭一、TCP连接的各种状态1.**`LISTEN`**（监听）2.**`SYN_SENT`**（SYN已发送）3.**`SYN_RECEIVED`**（SYN已接收）4.**`ESTABLISHED`**（已建立）5.**`FIN_WAIT_1`**（关闭等待1）6.**`FIN_WAIT_2`**（关闭等待2）7.**`CLOSE_WAIT`**
Java大厂面试故事：谢飞机的互联网音视频场景技术面试全纪录（Spring Boot、MyBatis、Kafka、Redis、AI等）来旺 Java场景面试宝典 Java Spring Boot MyBatis Kafka Redis 微服务 AI
Java大厂面试故事：谢飞机的互联网音视频场景技术面试全纪录（SpringBoot、MyBatis、Kafka、Redis、AI等）互联网大厂技术面试不仅考察技术深度，更注重业务场景与系统设计能力。本篇以严肃面试官与“水货”程序员谢飞机的对话，带你体验音视频业务场景下的Java面试全过程，涵盖主流技术栈，并附详细答案解析，助你面试无忧。故事场景设定谢飞机是一名有趣但技术基础略显薄弱的程序员，这次应
配音助手：自媒体神器，内置海量音色的语音，支持多主播配音阿幸软件杂货间媒体
软件介绍内置文字转语音，提供多个主播音色，男声、女声、小孩、方言。支持的场景也是比较多，比如：广告促销、有声读物、广播配音、影视配音、Ai配音等。这个软件是免费的，只不过需要通过手机号码登录就可以使用全部功能了。软件下载夸克下载
Anaconda 详细下载与安装教程
Anaconda详细下载与安装教程1.简介Anaconda是一个用于科学计算的开源发行版，包含了Python和R的众多常用库。它还包括了conda包管理器，可以方便地安装、更新和管理各种软件包。2.下载Anaconda2.1访问官方网站首先，打开浏览器，访问Anaconda官方网站。2.2选择适合的版本在页面中，你会看到两个主要的下载选项：AnacondaIndividualEdition：适用于
MySQL Explain 详解：从入门到精通，让你的 SQL 飞起来
引言：为什么Explain是SQL优化的“照妖镜”？在Java开发中，我们常常会遇到数据库性能瓶颈的问题。一条看似简单的SQL语句，在数据量增长到一定规模后，可能会从毫秒级响应变成秒级甚至分钟级响应，直接拖慢整个应用的性能。此时，你是否曾困惑于：为什么这条SQL突然变慢了？索引明明建了，为什么没生效？到底是哪里出了问题？答案就藏在MySQL的EXPLAIN命令里。EXPLAIN就像一面“照妖镜”，
kube-scheduler 抢占机制分享放大价值 kubernetes源码分析 kubernetes kube-scheduler 抢占
当pod调度失败后，会在PostFilter扩展点执行抢占流程，下面分析相关的代码实现抢占接口//PodNominatorabstractsoperationstomaintainnominatedPods.typePodNominatorinterface{//将pod加入抢占成功的node中AddNominatedPod(pod*PodInfo,nodeNamestring)//将pod从no
Java特性之设计模式【责任链模式】 Naijia_OvO Java特性 java 设计模式责任链模式
一、责任链模式概述顾名思义，责任链模式（ChainofResponsibilityPattern）为请求创建了一个接收者对象的链。这种模式给予请求的类型，对请求的发送者和接收者进行解耦。这种类型的设计模式属于行为型模式在这种模式中，通常每个接收者都包含对另一个接收者的引用。如果一个对象不能处理该请求，那么它会把相同的请求传给下一个接收者，依此类推主要解决：职责链上的处理者负责处理请求，客户只需要将
windows安装pnpm后报错：pnpm : 无法将“pnpm”项识别为 cmdlet、函数、脚本文件或可运行程序的名称。 Ithao2 Vue npm 前端 node.js
使用npm方式安装pnpm,命令如下：npminstall-gpnpm安装完以后，执行pnpm-v查看版本号：pnpm-v执行完发现报错：pnpm:无法将“pnpm”项识别为cmdlet、函数、脚本文件或可运行程序的名称。尝试配置环境变量，重启后均不生效。解决方案：使用PowerShell进行安装1.以管理员用户打开PowerShell，执行如下命令：iwrhttps://get.pnpm.io/
日历插件-FullCalendar的详细使用老马聊技术 JavaScript 前端 javascript
一、介绍FullCalendar是一个功能强大、高度可定制的JavaScript日历组件，用于在网页中显示和管理日历事件。它支持多种视图（月、周、日等），可以轻松集成各种框架，并提供丰富的事件处理功能。二、实操案例具体代码如下：FullCalendar日期选择body{font-family:Arial,sans-serif;margin:20px;}#calendar{max-width:900
ThinkSound V2版 - 一键给无声视频配音，为AI视频生成匹配音效支持50系显卡一键整合包下载昨日之日2006 ai语音音视频人工智能
ThinkSound是阿里通义实验室开源的首个音频生成模型，它能够让AI像专业“音效师”一样，根据视频内容生成高度逼真、与视觉内容完美契合的音频。ThinkSound可直接应用于影视后期制作，为AI生成的视频自动匹配精准的环境噪音与爆炸声效；服务于游戏开发领域，实时生成雨势变化等动态场景的自适应音效；同时可以无障碍视频生产，为视障用户同步生成画面描述与环境音效。今天分享的ThinkSoundV2版
Kafka系列之：Dead Letter Queue死信队列DLQ 快乐骑行^_^ Kafka Kafka系列 Dead Letter Queue 死信队列 DLQ
Kafka系列之：DeadLetterQueue死信队列DLQ一、死信队列二、参数errors.tolerance三、创建死信队列主题四、在启用安全性的情况下使用死信队列更多内容请阅读博主这篇博客：Kafka系列之：KafkaConnect深入探讨-错误处理和死信队列一、死信队列死信队列（DLQ）仅适用于接收器连接器。当一条记录以JSON格式到达接收器连接器时，但接收器连接器配置期望另一种格式，如
scala的option和some 矮蛋蛋编程 scala
原文地址： http://blog.sina.com.cn/s/blog_68af3f090100qkt8.html 对于学习 Scala 的 Java™ 开发人员来说，对象是一个比较自然、简单的入口点。在本系列前几期文章中，我介绍了 Scala 中一些面向对象的编程方法，这些方法实际上与 Java 编程的区别不是很大。我还向您展示了 Scala 如何重新应用传统的面向对象概念，找到其缺点
NullPointerException Cb123456 android BaseAdapter
java.lang.NullPointerException: Attempt to invoke virtual method 'int android.view.View.getImportantForAccessibility()' on a null object reference 出现以上异常.然后就在baidu上
PHP使用文件和目录天子之骄 php文件和目录读取和写入 php验证文件 php锁定文件
PHP使用文件和目录 1.使用include()包含文件 (1)：使用include()从一个被包含文档返回一个值 (2)：在控制结构中使用include() include_once()函数需要一个包含文件的路径，此外，第一次调用它的情况和include()一样，如果在脚本执行中再次对同一个文件调用，那么这个文件不会再次包含。在php.ini文件中设置
SQL SELECT DISTINCT 语句何必如此 sql
SELECT DISTINCT 语句用于返回唯一不同的值。 SQL SELECT DISTINCT 语句在表中，一个列可能会包含多个重复值，有时您也许希望仅仅列出不同（distinct）的值。 DISTINCT 关键词用于返回唯一不同的值。 SQL SELECT DISTINCT 语法 SELECT DISTINCT column_name,column_name F
java冒泡排序 3213213333332132 java 冒泡排序
package com.algorithm; /** * @Description 冒泡 * @author FuJianyong * 2015-1-22上午09:58:39 */ public class MaoPao { public static void main(String[] args) { int[] mao = {17,50,26,18,9,10
struts2.18 +json,struts2-json-plugin-2.1.8.1.jar配置及问题！ 7454103 DAO spring Ajax json qq
struts2.18 出来有段时间了！（貌似是稳定版）闲时研究下下！貌似 sruts2 搭配 json 做 ajax 很吃香！实践了下下！不当之处请绕过！呵呵网上一大堆 struts2+json 不过大多的json 插件都是 jsonplugin.34.jar strut
struts2 数据标签说明 darkranger jsp bean struts servlet Scheme
数据标签主要用于提供各种数据访问相关的功能，包括显示一个Action里的属性，以及生成国际化输出等功能数据标签主要包括： action ：该标签用于在JSP页面中直接调用一个Action，通过指定executeResult参数，还可将该Action的处理结果包含到本页面来。 bean ：该标签用于创建一个javabean实例。如果指定了id属性，则可以将创建的javabean实例放入Sta
链表.简单的链表节点构建 aijuans 编程技巧
/*编程环境WIN-TC*/ #include "stdio.h" #include "conio.h" #define NODE(name, key_word, help) \ Node name[1]={{NULL, NULL, NULL, key_word, help}} typedef struct node { &nbs
tomcat下jndi的三种配置方式 avords tomcat
jndi(Java Naming and Directory Interface，Java命名和目录接口)是一组在Java应用中访问命名和目录服务的API。命名服务将名称和对象联系起来，使得我们可以用名称访问对象。目录服务是一种命名服务，在这种服务里，对象不但有名称，还有属性。 tomcat配置
关于敏捷的一些想法 houxinyou 敏捷
从网上看到这样一句话：“敏捷开发的最重要目标就是：满足用户多变的需求，说白了就是最大程度的让客户满意。” 感觉表达的不太清楚。感觉容易被人误解的地方主要在“用户多变的需求”上。第一种多变，实际上就是没有从根本上了解了用户的需求。用户的需求实际是稳定的，只是比较多，也比较混乱，用户一般只能了解自己的那一小部分，所以没有用户能清楚的表达出整体需求。而由于各种条件的，用户表达自己那一部分时也有
富养还是穷养，决定孩子的一生 bijian1013 教育人生
是什么决定孩子未来物质能否丰盛？为什么说寒门很难出贵子，三代才能出贵族？真的是父母必须有钱，才能大概率保证孩子未来富有吗？-----作者：@李雪爱与自由事实并非由物质决定，而是由心灵决定。一朋友富有而且修养气质很好，兄弟姐妹也都如此。她的童年时代，物质上大家都很贫乏，但妈妈总是保持生活中的美感，时不时给孩子们带回一些美好小玩意，从来不对孩子传递生活艰辛、金钱来之不易、要懂得珍惜
oracle 日期时间格式转化征客丶 oracle
oracle 系统时间有 SYSDATE 与 SYSTIMESTAMP； SYSDATE：不支持毫秒，取的是系统时间； SYSTIMESTAMP：支持毫秒，日期，时间是给时区转换的，秒和毫秒是取的系统的。日期转字符窜：一、不取毫秒： TO_CHAR(SYSDATE, 'YYYY-MM-DD HH24:MI:SS') 简要说明， YYYY 年 MM 月
【Scala六】分析Spark源代码总结的Scala语法四 bit1129 scala
1. apply语法 FileShuffleBlockManager中定义的类ShuffleFileGroup，定义： private class ShuffleFileGroup(val shuffleId: Int, val fileId: Int, val files: Array[File]) { ... def apply(bucketId
Erlang中有意思的bug bookjovi erlang
代码中常有一些很搞笑的bug，如下面的一行代码被调用两次（Erlang beam） commit f667e4a47b07b07ed035073b94d699ff5fe0ba9b Author: Jovi Zhang <[email protected]> Date: Fri Dec 2 16:19:22 2011 +0100 erts:
移位打印10进制数转16进制-2008-08-18 ljy325 java 基础
/** * Description 移位打印10进制的16进制形式 * Creation Date 15-08-2008 9:00 * @author 卢俊宇 * @version 1.0 * */ public class PrintHex { // 备选字符 static final char di
读《研磨设计模式》-代码笔记-组合模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; abstract class Component { public abstract void printStruct(Str
利用cmd命令将.class文件打包成jar chenyu19891124 cmd jar
cmd命令打jar是如下实现：在运行里输入cmd，利用cmd命令进入到本地的工作盘符。(如我的是D盘下的文件有此路径 D:\workspace\prpall\WEB-INF\classes) 现在是想把D:\workspace\prpall\WEB-INF\classes路径下所有的文件打包成prpall.jar。然后继续如下操作： cd D: 回车 cd workspace/prpal
[原创]JWFD v0.96 工作流系统二次开发包 for Eclipse 简要说明 comsci eclipse 设计模式算法工作 swing
JWFD v0.96 工作流系统二次开发包 for Eclipse 简要说明 &nb
SecureCRT右键粘贴的设置 daizj secureCRT 右键粘贴
一般都习惯鼠标右键自动粘贴的功能，对于SecureCRT6.7.5 ，这个功能也已经是默认配置了。老版本的SecureCRT其实也有这个功能，只是不是默认设置，很多人不知道罢了。菜单： Options->Global Options ...->Terminal 右边有个Mouse的选项块。 Copy on Select Paste on Right/Middle
Linux 软链接和硬链接 dongwei_6688 linux
1.Linux链接概念Linux链接分两种，一种被称为硬链接（Hard Link），另一种被称为符号链接（Symbolic Link）。默认情况下，ln命令产生硬链接。【硬连接】硬连接指通过索引节点来进行连接。在Linux的文件系统中，保存在磁盘分区中的文件不管是什么类型都给它分配一个编号，称为索引节点号(Inode Index)。在Linux中，多个文件名指向同一索引节点是存在的。一般这种连
DIV底部自适应 dcj3sjt126com JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
Centos6.5使用yum安装mysql——快速上手必备 dcj3sjt126com mysql
第1步、yum安装mysql [root@stonex ~]# yum -y install mysql-server 安装结果： Installed: mysql-server.x86_64 0:5.1.73-3.el6_5 &nb
如何调试JDK源码 frank1234 jdk
相信各位小伙伴们跟我一样，想通过JDK源码来学习Java，比如collections包，java.util.concurrent包。可惜的是sun提供的jdk并不能查看运行中的局部变量，需要重新编译一下rt.jar。下面是编译jdk的具体步骤： 1.把C:\java\jdk1.6.0_26\sr
Maximal Rectangle hcx2013 max
Given a 2D binary matrix filled with 0's and 1's, find the largest rectangle containing all ones and return its area. public class Solution { public int maximalRectangle(char[][] matrix)
Spring MVC测试框架详解——服务端测试 jinnianshilongnian spring mvc test
随着RESTful Web Service的流行，测试对外的Service是否满足期望也变的必要的。从Spring 3.2开始Spring了Spring Web测试框架，如果版本低于3.2，请使用spring-test-mvc项目（合并到spring3.2中了）。 Spring MVC测试框架提供了对服务器端和客户端（基于RestTemplate的客户端）提供了支持。 &nbs
Linux64位操作系统（CentOS6.6）上如何编译hadoop2.4.0 liyong0802 hadoop
一、准备编译软件 1.在官网下载jdk1.7、maven3.2.1、ant1.9.4，解压设置好环境变量就可以用。环境变量设置如下：（1）执行vim /etc/profile （2）在文件尾部加入: export JAVA_HOME=/home/spark/jdk1.7 export MAVEN_HOME=/ho
StatusBar 字体白色 pangyulei status
[[UIApplication sharedApplication] setStatusBarStyle:UIStatusBarStyleLightContent]; /*you'll also need to set UIViewControllerBasedStatusBarAppearance to NO in the plist file if you use this method
如何分析Java虚拟机死锁 sesame java thread oracle 虚拟机 jdbc
英文资料： Thread Dump and Concurrency Locks Thread dumps are very useful for diagnosing synchronization related problems such as deadlocks on object monitors. Ctrl-\ on Solaris/Linux or Ctrl-B
位运算简介及实用技巧（一）：基础篇 tw_wangzhengquan 位运算
http://www.matrix67.com/blog/archives/263 去年年底写的关于位运算的日志是这个Blog里少数大受欢迎的文章之一，很多人都希望我能不断完善那篇文章。后来我看到了不少其它的资料，学习到了更多关于位运算的知识，有了重新整理位运算技巧的想法。从今天起我就开始写这一系列位运算讲解文章，与其说是原来那篇文章的follow-up，不如说是一个r
jsearch的索引文件结构 yangshangchuan 搜索引擎 jsearch 全文检索信息检索 word分词
jsearch是一个高性能的全文检索工具包，基于倒排索引，基于java8，类似于lucene，但更轻量级。 jsearch的索引文件结构定义如下： 1、一个词的索引由=分割的三部分组成：第一部分是词第二部分是这个词在多少

PyTorch深度学习实践概论笔记12-循环神经网络基础篇

0 Revision

0.1 Revision:DNN

0.2 Revision:CNN

1 What is RNNs?

1.1 RNN Cell in PyTorch

1.2 How to use RNNCell

1.2.1 How to use RNN - numLayers

2 Example

2.1 Example 12-1

2.1.1 Example 12-1: Using RNNCell

2.1.2 Example 12-1: Code-Parameters

2.2 Example 12-2

2.2.1 Example 12-2： Using RNN Module

2.2.2 Example 12-2：Change Model

2.2.3 Example 12-2：Change Data

2.2.4 Associate a vector with a word/character

2.2.5 One-hot vs Embedding

2.3 Example 12-3

2.3.1 Example 12-3：Using embedding and linear layer

3 Exercise

3.1 Exercise 12–1：Using LSTM

3.2 Exercise 12–2：Using GRU

你可能感兴趣的:(DL框架,AI,笔记,rnn,深度学习,机器学习,pytorch,人工智能)