GDUT 小胖鱼

从理论和Pytorch代码一步步了解RNN(Recurrent Neural Network)循环神经网络+EmBedding层通俗理解

初学者学习Pytorch系列

第一篇 Pytorch初学简单的线性模型代码实操
第二篇 Pytorch实现逻辑斯蒂回归模型代码实操
第三篇 Pytorch实现多特征输入的分类模型代码实操
第四篇 Pytorch实现Dataset数据集导入必要性解释及代码实操
第五篇 Pytorch实现多分类问题样例解释通俗易懂新手必看
第六篇 Pytorch使用CNN实现基本的MNIST数据集学习通俗理解CNN
第七篇 Pytorch使用CNN实现Inception及Residual 解决代码冗余梯度为零
第八篇从理论和Pytorch代码一步步了解RNN(Recurrent Neural Network)循环神经网络

文章目录

初学者学习Pytorch系列
前言
一、RNN理论
- 1.RNN的R在哪里体现？
- RNN为什么行？
- RNN有不同的循环模式（拓展）
二、RNN的pytorch代码
- 方式一：使用torch.nn.RNNCell
- 方式二：使用torch.nn.RNN
使用pytorch实现序列转换小案例
- 问题一：输入是Hello，怎么转化为可以输入模型的数字
- 使用RNNCell版本
- RNN版本
- 可能有人会对交叉熵的维度有疑问
- 改变编码方式，使用Embedding层
- Embedding在上述例子的应用
- 为什么使用Embedding后就能更快收敛，loss减小
总结

前言

RNN是专门用来处理具有序列模式的数据，也就是带有时间前后的时序数据，或者有先后顺序关系的序列数据，例如一个视频（每一帧的都有前后序列关系）、语言的处理（每一个词的前后序列）。而像我们的MNIST数据集，其是没有前后或者时间的序列关系。

一、RNN理论

1.RNN的R在哪里体现？

上图是RNN一个工作机理的简图，对于一个样本来说，X1，X2等的输入的一个样本的序列，例如我们要根据前三天的的天气状况，预测第四天的天气状况，那么X1，X2等输入的是第一天的天气，第二天的天气，至于某一天中有什么特征，那就是X1，X2中去表示。RNN Cell本质是线形层。

RNN Cell是怎么工作的呢？

上图的几个模块用序号标记，下文直接用1，2，3代表。

3是输入的数据，input_size是指你一个序列有多大，例如在天气序列中，一个序列是一天，一天可能有气压，气温，风向，湿度四个指标，那就说明input_size = 4。在RNN Cell中可以看到，2和5都是一个线性层，它们的结果会相加作为下一次的输入，也就是模块1,第一个RNN Cell输入的模块1没有来着上一个RNNCell的结果，所以我们一般会定义一个全零初始值，当然它的维度为hidden_size。其中，5中是对输入数据3做了线性变化，将其维度变化至hidden_size的大小。而2对输入1也是乘上了相对的权重矩阵，结果2和5的维度是一样的（这样才能相加）。而在RNN Cell中，我们使用的激活函数是tanh，它映射的范围是[-1,1]。

RNN为什么行？

举个例子，如文本数据，I like beijing，在输入RNN网络的时候，它通过编码后，并不是一整串数据直接输入进去，而是先输入I，接着是like，最后才是beijing，记住这只是一个样本。它输入的数据不再是孤立的，输入的数据之间有关联性（这个时候权重还没更新），在一个样本中，每输入一个序列会考虑前面的数据。所以我们通俗的理解上，它是将当前信息与历史信息做融合，它能更加综合地考虑前后的关系。这就是为什么有效！

RNN有不同的循环模式（拓展）

除了基本的模式，还有特殊的结构，如下面这种，从先往后学习，再从后往前，最后把两个加起来，这样子模型不仅能看到序列正向的特征，还能看到序列逆向的特征，视野更广阔，准确率更高。如下图，这样子的RNN称为Bidirectional RNN。

又或者有进阶的版本，如LSTM

二、RNN的pytorch代码

方式一：使用torch.nn.RNNCell

使用这个方法生成一个对象，创建的时候需要给出两个参数，input_size和hidden_size。而在使用的时候，不是直接传入数据集，需要我们自己去遍历数据集。而我们数据集的张量维度会有所不同。我们以前使用batch小批量处理数据集的时候，数据集的维度第一维都是batch_size，第二维开始才是每一个数据具体的维度，例如在MNIST数据集中，一个图片28*28，一个batch_size为64，那么输入的时候，维度为[64，28，28]。但是在RNN中，我们第一个维度设置为 [seq_len, batch_size, input_size],第一个维度为seq_size，这因为，seq_size在前面，我们遍历的时候，输入的是每一个样本第一个序列的集合，这时候数据特征都是第一个序列，而使用batch_size在第一维，遍历的时候，输入的是第一个样本的全部序列特征，这并不符合我们的需求，我们RNN是需要一个个序列去输入的。（一个样本有多个序列）

具体代码如下：

import torch

batch_size = 2
seq_len = 3
input_size = 4
hidden_size = 2

cell = torch.nn.RNNCell(input_size=input_size, hidden_size=hidden_size)
dataset = torch.randn(seq_len, batch_size, input_size)          # 随机生成测试数据
hidden = torch.zeros(batch_size, hidden_size)       # 初始化hidden，全部为0

for index, input in enumerate(dataset):
    print(index, "-" * 20)
    print("input_size", input.shape)
    hidden = cell(input, hidden)  # hidden 记录上一次的数据
    print("out_size", hidden.shape)
    print(hidden)

输出结果如下：

0 --------------------
input_size torch.Size([2, 4])
out_size torch.Size([2, 2])
tensor([[-0.0454,  0.4357],
        [-0.0059, -0.7380]], grad_fn=<TanhBackward0> )
1 --------------------
input_size torch.Size([2, 4])
out_size torch.Size([2, 2])
tensor([[-0.5145, -0.0131],
        [-0.7017,  0.8675]], grad_fn<TanhBackward0>)
2 --------------------
input_size torch.Size([2, 4])
out_size torch.Size([2, 2])
tensor([[-0.2853, -0.7647],
        [-0.7544,  0.2117]], grad_fn<TanhBackward0>)

输入cell 的 input的shape为[batch_size,input_size]，因为enumerate按照第一个维度去迭代，所以只有两个维度
hidden的shape为[batch_size,hidden_size]

方式二：使用torch.nn.RNN

使用这种方式创建的类不一样，传入参数也不同,这里需要传入三个参数input_size，hidden_size和num_layers。num_layers是指定有多少个RNN Cell层。但是和RNNCell第一个不同的是，在使用的时候，我们不需要自己去遍历数据集，直接把数据集交给RNN即可。第二个不同是RNN的输出有两个参数，一个是ouput，一个是hidden，他们的区别如下图。

此外，在程序中，我们同样要初始化hidden，但是由于我们有多层的num_layers，所以初始化维度会多考虑一个num_layers维度。而输入的数据，维度依旧和RNNCell是一样的。

import torch

input_size = 4
seq_size = 3
hidden_size = 2
num_layers = 3
batch_size = 2

cell = torch.nn.RNN(input_size=input_size, hidden_size=hidden_size, num_layers=num_layers)  # 定义RNN
inputs = torch.randn(seq_size, batch_size, input_size)      # 输入数据

hidden = torch.zeros(num_layers, batch_size, hidden_size)       # 初始化hidden，注意多了num_layers维度

out, hidden = cell(inputs, hidden)      # 输出有两个

print('Output size:', out.shape)
print('Output:', out)
print('Hidden size: ', hidden.shape)
print('Hidden: ', hidden)

代码结果如下：

Output size: torch.Size([3, 2, 2])
Output: tensor([[[-0.6000, -0.1455],
         [-0.6175, -0.1514]],

        [[-0.4070,  0.0970],
         [-0.4465,  0.0839]],

        [[-0.4894,  0.1308],
         [-0.4135,  0.1664]]], grad_fn=<StackBackward0>)
Hidden size:  torch.Size([3, 2, 2])
Hidden:  tensor([[[-0.0903,  0.8416],
         [-0.6701,  0.8851]],

        [[ 0.6462, -0.9428],
         [ 0.8133, -0.8924]],

        [[-0.4894,  0.1308],
         [-0.4135,  0.1664]]], grad_fn=<StackBackward0>)

hidden 的shape为[num_layers,batch_size,hidden_size]
output 的shape为[seq_size, batch_size, hidden_size]

使用pytorch实现序列转换小案例

这里我们想让模型不断学习，以至于我们输入Hello，它能帮我们转换成ohlol。

问题一：输入是Hello，怎么转化为可以输入模型的数字

答案就是:编码！这里我们使用one-hot 编码。我们有四个字符[‘e’, ‘h’, ‘l’, ‘o’]，分别给一种字符一个向量去表示。如下：

one_hot_lookup = [[1, 0, 0, 0],
                  [0, 1, 0, 0],
                  [0, 0, 1, 0],
                  [0, 0, 0, 1]]

但是我们知道我们输入的时候，数据维度是(seq_size, batch_size, input_size)，所以我们会使用view进行变化维度。变化后如下：

tensor([[[0., 1., 0., 0.]],
        [[1., 0., 0., 0.]],
        [[0., 0., 1., 0.]],
        [[0., 0., 1., 0.]],
        [[0., 0., 0., 1.]]])

使用RNNCell版本

import torch

input_size = 4
batch_size = 1
hidden_size = 4  # 因为总的序列类型只有4，所以hidden需要设置为4

inx2char = ['e', 'h', 'l', 'o']
x_data = [1, 0, 2, 2, 3]
y_data = [3, 1, 2, 3, 2]

one_hot_lookup = [[1, 0, 0, 0],         # one-hot编码表
                  [0, 1, 0, 0],
                  [0, 0, 1, 0],
                  [0, 0, 0, 1]]

x_one_hot = [one_hot_lookup[x] for x in x_data]        #给序列编码成向量

inputs = torch.Tensor(x_one_hot).view(-1, batch_size, input_size)       # 改变输入的维度
labels = torch.LongTensor(y_data).view(-1, 1)   


class Model(torch.nn.Module):
    def __init__(self, input_size, hidden_size, batch_size):
        super(Model, self).__init__()
        self.batch_size = batch_size    # 这些输入是初始化传入的
        self.input_size = input_size
        self.hidden_size = hidden_size
        self.rnnCell = torch.nn.RNNCell(input_size=self.input_size, hidden_size=self.hidden_size)   # 定义RnnCell

    def forward(self, input, hidden):       
        hidden = self.rnnCell(input, hidden)
        return hidden

    def init_hidden(self):          # hidden初始化函数
        return torch.zeros(self.batch_size, self.hidden_size)

net = Model(input_size, hidden_size, batch_size)

criterion = torch.nn.CrossEntropyLoss()
optimize = torch.optim.Adam(net.parameters(), lr=0.1)       # 使用Adam的优化器

for epoch in range(15):
    loss = 0
    optimize.zero_grad()
    hidden = net.init_hidden()      #初始化hidden，全为0
    for input, label in zip(inputs, labels):
        hidden = net(input, hidden)
        loss += criterion(hidden, label)       # 每次只是一个样本中一个序列，所以loss要加起来
        _, idx = hidden.max(dim=1)      # 提取下标
        print(inx2char[idx.item()],end='')      # 输入预测的值，这里一次输入一个字母，所以输出也只有一个字母
    # 记得要等遍历完所以序列再更新参数
    loss.backward()
    optimize.step()
    print(',Epoch [%d/15]  loss=%.4f' % (epoch+1,loss.item()))

RNNCell在实际应用的时候，与RNN的区别就是数据的维度不一样，例如输出的维度就不一样，RNNCell输出是hidden，而RNN是直接输出output，又或者hidden的维度不一样，这个都需要考虑。
在RNNCell中，我们去遍历序列，每次计算的loss只是一个序列的loss，在计算的时候需要把loss加起来。
记住我们是在遍历完样本后才更新权重，所以optimize.step()不能写在for循环中

代码结果如下：

oeeee,Epoch [1/15]  loss=7.5488
oleee,Epoch [2/15]  loss=5.9819
ohlll,Epoch [3/15]  loss=5.0428
ohlll,Epoch [4/15]  loss=4.5036
ohlll,Epoch [5/15]  loss=4.1299
ohlll,Epoch [6/15]  loss=3.8504
ohlll,Epoch [7/15]  loss=3.6446
ohlll,Epoch [8/15]  loss=3.4796
ohlll,Epoch [9/15]  loss=3.3314
ohlll,Epoch [10/15]  loss=3.1920
ohlll,Epoch [11/15]  loss=3.0597
ohlol,Epoch [12/15]  loss=2.9324
ohlol,Epoch [13/15]  loss=2.8076
ohlol,Epoch [14/15]  loss=2.6886
ohlol,Epoch [15/15]  loss=2.5873

可以看到我们的Hello输入后，成功转换成ohlol。

RNN版本

import torch

input_size = 4
batch_size = 1
hidden_size = 4  # 因为总的序列类型只有4，所以hidden需要设置为4
num_layers = 1
seq_size=5

one_hot_lookup = [[1, 0, 0, 0],
                  [0, 1, 0, 0],
                  [0, 0, 1, 0],
                  [0, 0, 0, 1]]

inx2char = ['e', 'h', 'l', 'o']
x_data = [1, 0, 2, 2, 3]
y_data = [3, 1, 2, 3, 2]

x_one_hot = [one_hot_lookup[x] for x in x_data]
inputs = torch.Tensor(x_one_hot).view(seq_size, batch_size, input_size)
labels = torch.LongTensor(y_data)       


class RNN(torch.nn.Module):
    def __init__(self, batch_size, input_size, hidden_size, num_layers):
        super(RNN, self).__init__()
        self.batch_size = batch_size
        self.input_size = input_size
        self.hidden_size = hidden_size
        self.num_layers = num_layers
        self.rnn = torch.nn.RNN(input_size=input_size, hidden_size=self.hidden_size, num_layers=self.num_layers)

    def forward(self, input, hidden):
        out, _ = self.rnn(input, hidden)
        return out.view(-1, self.hidden_size)

    def init_hidden(self):
        return torch.zeros(self.num_layers, self.batch_size, self.hidden_size)

rnn = RNN(batch_size, input_size, hidden_size, num_layers)
criterion = torch.nn.CrossEntropyLoss()
optimizer = torch.optim.Adam(rnn.parameters(), lr=0.05)

for epoch in range(15):
    hidden = rnn.init_hidden()
    optimizer.zero_grad()
    out = rnn(inputs, hidden)
    loss = criterion(out, labels)
    loss.backward()
    optimizer.step()
    _, idx = out.max(dim=1)
    print(''.join(inx2char[x] for x in idx), end='')
    print(', Epoch [%d/15] loss = %.3f' % (epoch + 1, loss.item()))

这份代码的主题逻辑和上一份的差不多，这里就不做过多的备注。主要的不同还是数据维度的不同
在RNN中，我们不需要去遍历整个样本了，直接把样本丢给它。

运行结果如下：

hoeee, Epoch [1/15] loss = 1.629
hooee, Epoch [2/15] loss = 1.499
ooooo, Epoch [3/15] loss = 1.381
ooooo, Epoch [4/15] loss = 1.279
ooooo, Epoch [5/15] loss = 1.195
ooloo, Epoch [6/15] loss = 1.127
ooloo, Epoch [7/15] loss = 1.071
ooloo, Epoch [8/15] loss = 1.020
ooloo, Epoch [9/15] loss = 0.971
oolol, Epoch [10/15] loss = 0.922
ohlol, Epoch [11/15] loss = 0.873
ohlol, Epoch [12/15] loss = 0.826
ohlol, Epoch [13/15] loss = 0.783
ohlol, Epoch [14/15] loss = 0.741
ohlol, Epoch [15/15] loss = 0.702

可能有人会对交叉熵的维度有疑问

数据维度[5]和[5,4]是能做交叉熵的，但是[5,1]和[5,4]是做不了交叉熵的。例如在上面例子RNN版本中的out和label，就是[5]和[5,4]，他们是能做交叉熵的。

out:tensor([[-0.6276, -0.0094,  0.4876,  0.8977],
        [-0.7712,  0.6199, -0.0840,  0.3055],
        [-0.8253,  0.0306,  0.8742,  0.8950],
        [-0.9027,  0.1658,  0.8473,  0.6830],
        [-0.7908, -0.7214,  0.7088,  0.2062]], grad_fn=<ViewBackward0>)
label:tensor([3, 1, 2, 3, 2])

改变编码方式，使用Embedding层

我们上面所使用的编码方式是one-hot编码，这个编码方式虽然可以实现我们的需求，但是却存在很多缺点，如下：

它的数据维度非常长，我们有4个人字母，就需要4维的数据去编码，假如我们有10000维，这个数量级的增长非常快。
它的数据非常稀疏，我们希望稠密一点
它的数据是固定的，并非学习过来的

针对上面问题，我们提出了Embedding层。网上很多资料说了本质是什么，但是很多人看了还是一头雾水，其实我们来看它的计算就知道了，它通过一个矩阵的变化，将一个高维的数据映射到低维，我们one-hot是高维的编码数据，我们用Embedding层直接降到低维，然后再去计算，这就能节省很多资源！而降到低维后，我们依然能用低维的数据去唯一表示一个数据。这就是为什么使用Embedding层最最最简单的理解！！！！

那它是怎么工作的呢？？？？非常简单，看下面！！！

序号1 是我们的one-hot编码的数据，注意！！它只有一个数值为1，序号2是Embedding的矩阵，我们就是通过这样子一个矩阵进行线性变化！！！，当我们输入为[0,1,0,0]的时候，我们做矩阵运算，结果为[B1,B2]，而[B1,B2]就是用低维去代表了我们原来高维的[0,1,0,0]。

注意这个矩阵是不断变化的，在有监督的学习中，它也是一个层，也是我们模型中的一种，里面的值也随着梯度下降去变化。
至于其他文章讲的例子，公主王妃等，其实就是想说，数据映射到另一个维度，本质就是线性变化。大家可以配合着去理解！！
当然编码也可以去升维，好处就是感受野更大了，更好拟合曲线。我觉得有一个比喻很好，比如前一个高维embedding是1x4，分别表示牛马花草四种属性值，后一个低维embedding是1x2，分别表示动物植物两种属性值。从高维embedding降维成低维embedding是信息的聚合，即牛马聚合成动物，花草聚合成植物: 从低维embedding升维成高维embedding是信息的解耦，动物解耦成牛马，植物解耦成花草。当然，这些是感性的理解，在模型中都是数值。 大家能做感性直观理解即可！

Embedding在上述例子的应用

加入Embedding后，我们需要稍微改变我们模型的结构，如下：

我们在embedding层输入数据的时候，是使用LongTensor，它的维度我们一般是设置为（, ），而且里面的数值我们不需要去转化为one-hot编码了，应该直接给出了下标。例如，我们上面的例子Hello，不需要转化为one-hot编码，但是我们还是应该保留[‘e’, ‘h’, ‘l’, ‘o’]这几个字母对应的下标，Hello对应的下标是[1, 0, 2, 2, 3]。所以hello转化为张量并进行维度转换后的LongTensor 为 tensor([[1, 0, 2, 2, 3]])（我们的batch_size只有1）。
我们最后还接入了一个Linear Layer层，把最后的维度转为我们需要的

在pytorch中，我们使用torch.nn.Embedding去创建Embedding类
一般构造的时候我们需要两个参数，torch.nn.Embedding(num_embeddings, embedding_dim)

num_embeddings ：字典中词的个数,例如我们有[‘e’, ‘h’, ‘l’, ‘o’]这4个字母，所以为4
embedding_dim：想要用几个维度的数据去编码我们的序列。

构造完毕后，输入输出的数据维度如下

input维度 ：[batch_size,seq_size],因为输入batch_size是在前面了，所以RNN构造的时候，需要设置batch_first=True
output维度：[input维度，embedding_size] ，如果代入input维度，就为[batch_size , seq_size，embedding_size]，embedding_size为构造参数embedding_dim时候我们输入的值。

代码如下：

import torch

input_size = 4  # 有4个字母所以是4维
batch_size = 1
hidden_size = 8  # 因为总的序列类型只有4，所以hidden需要设置为4
num_layers = 2  # RnnCell的层数
seq_size = 5  # 序列长度
embedding_size = 10  # 嵌入层输出的维度
num_class = 4  # 最终序列的类型可能总数

inx2char = ['e', 'h', 'l', 'o']
x_data = [[1, 0, 2, 2, 3]]
y_data = [3, 1, 2, 3, 2]

inputs = torch.LongTensor(x_data)       # (batch_size,seq_size)
labels = torch.LongTensor(y_data)

class RNN(torch.nn.Module):
    def __init__(self, batch_size, input_size, hidden_size, num_layers, embedding_size):
        super(RNN, self).__init__()
        self.batch_size = batch_size
        self.input_size = input_size
        self.hidden_size = hidden_size
        self.num_layers = num_layers
        self.embedding_size = embedding_size
        self.rnn = torch.nn.RNN(input_size=self.embedding_size,
                                hidden_size=self.hidden_size,
                                num_layers=self.num_layers,
                                batch_first=True)
        self.emb = torch.nn.Embedding(self.input_size, self.embedding_size)
        self.fc = torch.nn.Linear(hidden_size, num_class)

    def forward(self, input, hidden):
        input = self.emb(input)     # (batch_size,seq_list,embedding_size)
        input, _ = self.rnn(input, hidden)  # (batch_size,seq_list,hidden_size)
        input = self.fc(input)          # (batch_size,seq_list,num_class)
        return input.view(-1, num_class)

    def init_hidden(self):
        return torch.zeros(self.num_layers, self.batch_size, self.hidden_size)

rnn = RNN(batch_size, input_size, hidden_size, num_layers, embedding_size)
criterion = torch.nn.CrossEntropyLoss()
optimizer = torch.optim.Adam(rnn.parameters(), lr=0.05)

for epoch in range(15):
    hidden = rnn.init_hidden()
    optimizer.zero_grad()
    out = rnn(inputs, hidden)
    loss = criterion(out, labels)
    loss.backward()
    optimizer.step()
    _, idx = out.max(dim=1)
    print(''.join(inx2char[x] for x in idx), end='')
    print(', Epoch [%d/15] loss = %.3f' % (epoch + 1, loss.item()))

代码结果如下：

heeee, Epoch [1/15] loss = 1.904
hhehh, Epoch [2/15] loss = 1.408
ohhoh, Epoch [3/15] loss = 1.172
ohhoh, Epoch [4/15] loss = 0.981
ohlol, Epoch [5/15] loss = 0.798
ohlol, Epoch [6/15] loss = 0.616
ohlol, Epoch [7/15] loss = 0.463
ohlol, Epoch [8/15] loss = 0.349
ohlol, Epoch [9/15] loss = 0.264
ohlol, Epoch [10/15] loss = 0.201
ohlol, Epoch [11/15] loss = 0.154
ohlol, Epoch [12/15] loss = 0.118
ohlol, Epoch [13/15] loss = 0.091
ohlol, Epoch [14/15] loss = 0.070
ohlol, Epoch [15/15] loss = 0.054

通过上面的结果，我们可以看到我们的代码收敛得更快，更快达到我们所要的结果，loss也下降得更小。

为什么使用Embedding后就能更快收敛，loss减小

这里我的个人理解是，如果是Emdedding是升维的话，感受野扩大了，所以能可以加快拟合。如果是降维的话，感受野虽然没有增大，但是我们要把embdedding层看作模型中的一个层，我们神经网络层数越多，越能拟合（但是也不能过多！），embedding层中的参数是学习得到的，相当于权重的数量增加了，所以更能拟合。

总结

以上就是我个人对RNN和Embedding的理解，希望配合上其他文章，能让初学者更容易理解。如果觉得有用，请大家点赞支持！！！！。

【AI系统】混合并行 ZOMI酱人工智能
混合并行混合并行（HybridParallel）是一种用于分布式计算的高级策略，它结合了数据并行和模型并行的优势，以更高效地利用计算资源，解决深度学习中的大模型训练问题。混合并行不仅能提高计算效率，还能在有限的硬件资源下处理更大的模型和数据集。在深度学习中，数据并行和模型并行各自有其适用的场景和局限性。数据并行适用于训练样本较多而模型较小的情况，通过将数据集分割成多个子集并在不同的设备上同时训练来
BladeDISC++：Dynamic Shape AI 编译器下的显存优化技术人工智能机器学习分布式阿里云
近年来，随着深度学习技术的迅猛发展，越来越多的模型展现出动态特性，这引发了对动态形状深度学习编译器(DynamicShapeAICompiler)的广泛关注。本文将介绍阿里云PAI团队近期发布的BladeDISC++项目，探讨在动态场景下如何优化深度学习训练任务的显存峰值，主要内容包括以下三个部分：DynamicShape场景下显存优化的背景与挑战BladeDISC++的创新解决方案Llama2模
MindIE+MindFormers推理方案指导人工智能pytorch
组件介绍CANNCANN是什么异构计算架构CANN（ComputeArchitectureforNeuralNetworks）是昇腾针对AI场景推出的异构计算架构，向上支持多种AI框架，包括MindSpore、PyTorch、TensorFlow等，向下服务AI处理器与编程，发挥承上启下的关键作用，是提升昇腾AI处理器计算效率的关键平台。同时针对多样化应用场景，提供多层次编程接口，支持用户快速构建
【TVM 教程】为 x86 CPU 自动调优卷积网络
ApacheTVM是一个深度的深度学习编译框架，适用于CPU、GPU和各种机器学习加速芯片。更多TVM中文文档可访问→https://tvm.hyper.ai/作者：YaoWang,EddieYan本文介绍如何为x86CPU调优卷积神经网络。注意，本教程不会在Windows或最新版本的macOS上运行。如需运行，请将本教程的主体放在ifname=="__main__":代码块中。importosi
交叉熵损失与二元交叉熵损失：区别、联系及实现细节专业发呆业余科研深度模型底层原理人工智能深度学习 python
在机器学习和深度学习中，交叉熵损失（Cross-EntropyLoss）和二元交叉熵损失（BinaryCross-EntropyLoss）是两种常用的损失函数，它们在分类任务中发挥着重要作用。本文将详细介绍这两种损失函数的区别和联系，并通过具体的代码示例来说明它们的实现细节。交叉熵损失（Cross-EntropyLoss）常用于多类分类问题，即每个样本只能属于一个类别，但总类别数量较多。例如，在手
pytorch基操01-常用Tensor创建方法汇总 von Libniz Python 机器学习机器学习深度学习人工智能
目录1.Tensor的创建1.1使用torch.Tensor1.2使用torch.eye1.3全0或全1的tensor1.4根据分布随机生成tensor1.4.1torch.rand1.4.2torch.randn1.4.3torch.normal1.4.4torch.Tensor.uniform_1.5生成序列tensor1.5.1torch.arange(a,b,step)1.5.2torch
深度学习YOLOv3压双黄线期末项目 yzx991013 giit YOLO
一、引言实现功能目录一、引言实现功能打开视频连续检测车辆能检测到道路中间的双黄线能检测出车辆是否压双黄线当车辆压到双黄线时给出提示要求使用多线程实现功能二、技术栈概览三、代码功能深度剖析视频文件选择功能（choosevideo函数）四、项目亮点提炼五、总结与展望1.打开视频2.连续检测车辆3.能检测到道路中间的双黄线4.能检测出车辆是否压双黄线5.当车辆压到双黄线时给出提示6.要求使用多线程实现功
深度定制：Embedding与Reranker模型的微调艺术从零开始学习人工智能 embedding 人工智能
微调是深度学习中的一种常见做法，它允许模型在预训练的基础上进一步学习特定任务的特定特征。对于Embedding模型，微调的目的是让模型更适配特定的数据集，从而取得更好的召回效果。这通常涉及到使用特定的数据集对模型进行额外的训练，以便模型能够学习到数据集中的特定语义关系。微调过程可以使用不同的库和框架来实现，例如sentence-transformers库，它提供了便捷的API来调整Embeddin
【机器学习】—时序数据分析：机器学习与深度学习在预测、金融、气象等领域的应用云边有个稻草人热门文章机器学习数据分析深度学习笔记
云边有个稻草人-CSDN博客目录引言1.时序数据分析基础1.1时序数据的特点1.2时序数据分析的常见方法2.深度学习与时序数据分析2.1深度学习在时序数据分析中的应用2.1.1LSTM（长短期记忆网络）2.2深度学习在金融市场预测中的应用2.2.1股票市场预测2.3深度学习在设备故障检测中的应用3.强化学习与时序数据分析3.1强化学习的基本概念3.2强化学习在金融市场中的应用3.3强化学习在设备故
使用 AI 在医疗影像分析中的应用探索
摘要医疗影像分析是AI在医疗领域的重要应用方向，能够提高诊断效率，减少误诊率。本文将深入探讨AI技术在医疗影像数据分析中的应用，包括核心算法、关键实现步骤和实际案例，并提供一个基于卷积神经网络（CNN）的图像分类Demo。引言随着医疗影像数据的爆炸式增长，传统的人工分析已无法满足高效、精准诊断的需求。AI技术通过深度学习算法，在医疗影像的识别、分类和标注中发挥了重要作用。本文章将结合技术实现与案例
【机器学习】---神经架构搜索（NAS） Undoom 机器学习 Python 机器学习架构人工智能 python
这里写目录标题引言1.什么是神经架构搜索（NAS）1.1为什么需要NAS？2.NAS的三大组件2.1搜索空间搜索空间设计的考虑因素：2.2搜索策略2.3性能估计3.NAS的主要方法3.1基于强化学习的NAS3.2基于进化算法的NAS3.3基于梯度的NAS4.NAS的应用5.实现一个简单的NAS框架6.总结引言随着深度学习的成功应用，神经网络架构的设计变得越来越复杂。模型的性能不仅依赖于数据和训练方
Pytorch实现猫狗分类 NoKnowovo Python pytorch 分类人工智能
在进行编码之前，确保已经安装好Pytorch以及相关依赖环境模型定义构建构建一个较为简单的卷积神经网络模型#定义神经网络模型classCatDogClassifier(nn.Module):def__init__(self):super(CatDogClassifier,self).__init__()self.conv1=nn.Conv2d(3,16,kernel_size=5,stride=1
开源人工智能模型框架：探索与实践 CodeJourney. 人工智能能源
摘要本文深入探讨了开源人工智能模型框架，旨在为研究人员、开发者及相关从业者提供全面的理解与参考。通过对多个主流开源框架，如TensorFlow、PyTorch、Keras、Detectron2、OpenCV、HuggingFaceTransformers、AllenNLP、MindSpore和Fastai的详细分析，阐述其特点、应用场景、优势与不足，并结合具体示例说明其使用方法，同时配以相关架构图
【C#深度学习之路】如何使用C#读取pickle类型的大模型文件来瓶霸王防脱发 C#深度学习之路 c#机器学习
【C#深度学习之路】如何使用C#读取pickle类型的大模型文件背景Pickle文件的结构及读取思路读取方法以压缩文件的方式加载Pickle类型文件读取Header的内容读取tensor的权重值该方法的不足总结本文为原创文章，若需要转载，请注明出处。原文地址：https://blog.csdn.net/qq_30270773/article/details/141367057项目对应的Github
【C#深度学习之路】如何使用C#实现Yolov8模型的训练和推理来瓶霸王防脱发 C#深度学习之路 c#机器学习图像处理视觉检测 YOLO
【C#深度学习之路】如何使用C#实现Yolov8模型的训练和推理项目背景算法实现模型结构项目展望写在最后项目下载链接本文为原创文章，若需要转载，请注明出处。原文地址：https://blog.csdn.net/qq_30270773/article/details/143529308项目对应的Github地址：https://github.com/IntptrMax/YoloSharpC#深度学习
【C#深度学习之路】如何使用C#实现Yolov11模型的训练和推理来瓶霸王防脱发 C#深度学习之路 c#深度学习 YOLO
【C#深度学习之路】如何使用C#实现Yolov11模型的训练和推理项目背景算法实现模型结构项目展望写在最后项目下载链接本文为原创文章，若需要转载，请注明出处。原文地址：https://blog.csdn.net/qq_30270773/article/details/143722404项目对应的Github地址：https://github.com/IntptrMax/YoloSharpC#深度学
华为昇腾AI处理器，atc模型转换和推理过程，华为的CANN库对标的是NVIDIA的cuda，所以在华为昇腾AI处理器上安装了CANN后，就可以直接使用pytorch了，以及推理框架(参考学习) 鼾声鼾语嵌入式硬件学习 stm32 python 数据库
1，模型转换atc模型转换模型转换如图参考链接如下：https://toscode.mulanos.cn/ascend/samples/tree/master/inference/modelInference/sampleResnetQuickStart/cpp2，推理运行，这里需要注意用到了infer，有点类似的pytorch对模型的加载使用model=InferSession(0,model_
AlexNet：开启深度学习图像识别新纪元池央深度学习人工智能
一、引言在深度学习的璀璨星空中，AlexNet无疑是一颗极为耀眼的明星。它于2012年横空出世，并在ImageNet竞赛中一举夺冠，这一历史性的突破彻底改变了计算机视觉领域的发展轨迹，让全世界深刻认识到深度卷积神经网络在图像识别任务中的巨大潜力，从而掀起了深度学习研究与应用的热潮。二、AlexNet网络架构详解（一）输入层AlexNet的输入图像通常为224x224x3的彩色图像。这一尺寸的确定是
拯救者电脑安装Windows和Ubuntu双系统遇到黑屏或者花屏问题的解决方法，亲测有效我爱猪肉炖粉条 ubuntu 深度学习
最近想在电脑上跑深度学习，有一定基础的都知道，ubuntu更适合gpu、apex以及其他加速的使用，如果在Windows上总是遇到各种各样的问题，所以我给电脑安装了双系统。装系统的过程此处忽略，随便找个教程都可以。总结一下就是在C盘压缩一定的空间（比如80G），然后通过U盘工具制作一个Ubuntu启动盘，把系统安装到压缩的那个盘里。我使用的电脑是拯救者R7000P，英伟达RTX2060，AMD处理
AI大模型荆州克莱面试题汇总与解析技术 css3 spring cloud spring boot spring
系列简书文章目录https://www.jianshu.com/p/d47d5cdc8a3e本篇目录AI大模型什么是AI大模型AI大模型，通常指的是在人工智能领域中，特别是机器学习和深度学习范畴内，具有巨大参数量和复杂结构的模型。这些模型通过使用大规模数据集和先进的计算硬件进行训练，能够学习到数据中的复杂模式和特征，从而在多种任务上展现出卓越的性能。特点包括：参数量大：AI大模型的参数数量往往达到
深度学习：从基础到实践（上、下册）(安德鲁·格拉斯纳) fyjgfyjfg 深度学习人工智能
（pdf）:python33+(0m深度学习概述：深度学习是机器学习的一个分支，它试图通过使用深层神经网络来模拟人脑的学习过程。随机性与基础统计学：在深度学习中，随机性起着重要作用，了解基础统计学有助于更好地理解深度学习中的随机过程和不确定性。训练与测试：深度学习模型的训练过程包括使用训练数据来优化模型参数，而测试过程则使用测试数据来评估模型的性能。过拟合与欠拟合：过拟合是指模型在训练数据上表现过
《量子计算对人工智能发展的深远影响》 cc++人工智能深度学习
在科技发展的浪潮中，量子计算与人工智能无疑是两颗璀璨的明星，二者的融合正引领着一场深刻的科技变革.量子计算的独特之处在于其利用量子比特的叠加和纠缠特性，能够实现并行计算，从而在处理复杂问题时展现出超越传统计算的巨大潜力.这种强大的计算能力为人工智能的发展带来了诸多积极影响。加速机器学习训练机器学习，尤其是深度学习，通常需要处理海量数据和复杂的模型训练，耗时极长。量子计算的并行性可使训练过程大幅加速
Python基于YOLOv8和OpenCV实现车道线和车辆检测 old_power 计算机视觉 YOLO opencv 计算机视觉 python
使用YOLOv8（YouOnlyLookOnce）和OpenCV实现车道线和车辆检测，目标是创建一个可以检测道路上的车道并识别车辆的系统，并估计它们与摄像头的距离。该项目结合了计算机视觉技术和深度学习物体检测。1、系统主要功能车道检测：使用边缘检测和霍夫线变换检测道路车道。汽车检测：使用YOLOv8模型识别汽车并在汽车周围绘制边界框。距离估计：使用边界框大小计算检测到的汽车与摄像头的距离。2、环境
每天五分钟深度学习框架pytorch:快速搭建VGG网络的基础模块VGG块每天五分钟玩转人工智能深度学习框架pytorch 深度学习 pytorch 网络卷积神经网络卷积层人工智能
本文重点前面我们介绍了VGG神经网络，我们知道VGG是由许多的VGG块构成，那么本文我们将使用pytorch搭建VGG块代码实现：importtorchfromtorchimportnndefvgg_block(num_convs,in_channels,out_channels):net=[nn.Conv2d(in_channels,out_channels,kernel_size=3,padd
探秘6-DoF GraspNet：面向对象操纵的变分抓取生成庞锦宇
探秘6-DoFGraspNet：面向对象操纵的变分抓取生成项目地址:https://gitcode.com/gh_mirrors/py/pytorch_6dof-graspnet在人工智能和机器人领域，我们正逐步接近让机器模拟人类的手部动作，实现精准的六自由度（6-DoF）物体抓取。6-DoFGraspNet是一项革新性的技术，现在，这个强大的工具已有了PyTorch实现。本文将详细介绍这一开源项
AI如何帮助电商企业进行数据分析 AI大模型应用之禅计算机软件编程原理与应用实践 java python javascript kotlin golang 架构人工智能
电商数据分析，人工智能，机器学习，深度学习，推荐系统，预测模型，客户画像1.背景介绍在当今数字化时代，电商行业蓬勃发展，数据成为企业最重要的资产。电商企业每天都会产生海量的数据，包括用户行为、商品信息、交易记录等。如何有效地分析这些数据，挖掘其中的价值，对于电商企业的运营、营销和发展至关重要。传统的数据分析方法往往难以应对海量数据的处理和复杂分析需求，而人工智能（AI）技术的出现为电商数据分析带来
大规模语言模型从理论到实践大语言模型预训练数据 AI大模型应用之禅 AI大模型与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
大规模语言模型从理论到实践：大语言模型预训练数据关键词：大规模语言模型、预训练数据、数据集选择、数据清洗、数据增强、数据集评估、数据集扩展1.背景介绍1.1问题的由来随着深度学习和大规模神经网络的发展，大型语言模型（LargeLanguageModels,LLMs）成为了自然语言处理（NLP）领域的一项突破性技术。LLMs能够生成流畅且具有上下文关联性的文本，这得益于它们在海量文本数据上的预训练。
神经架构搜索在大模型效率优化中的应用 AI大模型应用之禅计算机软件编程原理与应用实践 java python javascript kotlin golang 架构人工智能
神经架构搜索，大模型，效率优化，自动机器学习，深度学习1.背景介绍近年来，深度学习模型取得了令人瞩目的成就，在图像识别、自然语言处理、语音识别等领域展现出强大的能力。然而，随着模型规模的不断扩大，训练和部署这些大模型也带来了巨大的挑战。计算资源消耗巨大:大模型的训练需要大量的计算资源，例如高性能GPU和TPU，这导致训练成本高昂，难以普及。内存占用量大:大模型的参数量庞大，需要大量的内存进行存储和
卷积神经网络（CNN）：深度学习中的核心模型任义礼智信深度学习 cnn 人工智能
引言卷积神经网络（ConvolutionalNeuralNetworks,CNNs）是深度学习领域的一种重要模型，广泛应用于图像处理、计算机视觉、自然语言处理等多个领域。CNN凭借其卓越的特征提取能力和参数共享机制，已成为计算机视觉任务中最主流的算法之一。本文将深入探讨CNN的基本原理、结构组件、应用场景及其发展方向。CNN的基本原理CNN是一种特殊的前馈神经网络（FeedforwardNeura
【机器学习：十五、神经网络的编译和训练】 KeyPan 机器学习机器学习神经网络人工智能深度学习 pytorch ubuntu linux
1.TensorFlow实现代码TensorFlow是深度学习中最为广泛使用的框架之一，提供了灵活的接口来构建、编译和训练神经网络。以下是实现神经网络的一个完整代码示例，以“手写数字识别”为例：importtensorflowastffromtensorflow.kerasimportlayers,models#加载MNIST数据集(x_train,y_train),(x_test,y_test)
HttpClient 4.3与4.3版本以下版本比较 spjich java httpclient
网上利用java发送http请求的代码很多，一搜一大把，有的利用的是java.net.*下的HttpURLConnection，有的用httpclient，而且发送的代码也分门别类。今天我们主要来说的是利用httpclient发送请求。 httpclient又可分为 httpclient3.x httpclient4.x到httpclient4.3以下 httpclient4.3
Essential Studio Enterprise Edition 2015 v1新功能体验 Axiba .net
概述：Essential Studio已全线升级至2015 v1版本了！新版本为JavaScript和ASP.NET MVC添加了新的文件资源管理器控件，还有其他一些控件功能升级，精彩不容错过，让我们一起来看看吧！ syncfusion公司是世界领先的Windows开发组件提供商，该公司正式对外发布Essential Studio Enterprise Edition 2015 v1版本。新版本
[宇宙与天文]微波背景辐射值与地球温度 comsci 背景
宇宙这个庞大,无边无际的空间是否存在某种确定的,变化的温度呢? 如果宇宙微波背景辐射值是表示宇宙空间温度的参数之一,那么测量这些数值,并观测周围的恒星能量输出值,我们是否获得地球的长期气候变化的情况呢? &nbs
lvs-server 男人50 server
#!/bin/bash # # LVS script for VS/DR # #./etc/rc.d/init.d/functions # VIP=10.10.6.252 RIP1=10.10.6.101 RIP2=10.10.6.13 PORT=80 case $1 in start) /sbin/ifconfig eth2:0 $VIP broadca
java的WebCollector爬虫框架 oloz 爬虫
WebCollector主页： https://github.com/CrawlScript/WebCollector 下载：webcollector-版本号-bin.zip将解压后文件夹中的所有jar包添加到工程既可。接下来看demo package org.spider.myspider; import cn.edu.hfut.dmic.webcollector.cra
jQuery append 与 after 的区别小猪猪08
1、after函数定义和用法： after() 方法在被选元素后插入指定的内容。语法： $(selector).after(content) 实例： <html> <head> <script type="text/javascript" src="/jquery/jquery.js"></scr
mysql知识充电香水浓 mysql
索引索引是在存储引擎中实现的，因此每种存储引擎的索引都不一定完全相同，并且每种存储引擎也不一定支持所有索引类型。根据存储引擎定义每个表的最大索引数和最大索引长度。所有存储引擎支持每个表至少16个索引，总索引长度至少为256字节。大多数存储引擎有更高的限制。MYSQL中索引的存储类型有两种：BTREE和HASH，具体和表的存储引擎相关； MYISAM和InnoDB存储引擎
我的架构经验系列文章索引 agevs 架构
下面是一些个人架构上的总结，本来想只在公司内部进行共享的，因此内容写的口语化一点，也没什么图示，所有内容没有查任何资料是脑子里面的东西吐出来的因此可能会不准确不全，希望抛砖引玉，大家互相讨论。要注意，我这些文章是一个总体的架构经验不针对具体的语言和平台，因此也不一定是适用所有的语言和平台的。（内容是前几天写的，现附上索引）前端架构 http://www.
Android so lib库远程http下载和动态注册 aijuans andorid
一、背景在开发Android应用程序的实现，有时候需要引入第三方so lib库，但第三方so库比较大，例如开源第三方播放组件ffmpeg库, 如果直接打包的apk包里面, 整个应用程序会大很多.经过查阅资料和实验，发现通过远程下载so文件，然后再动态注册so文件时可行的。主要需要解决下载so文件存放位置以及文件读写权限问题。二、主要
linux中svn配置出错 conf/svnserve.conf:12: Option expected 解决方法 baalwolf option
在客户端访问subversion版本库时出现这个错误： svnserve.conf:12: Option expected 为什么会出现这个错误呢，就是因为subversion读取配置文件svnserve.conf时，无法识别有前置空格的配置文件，如### This file controls the configuration of the svnserve daemon, if you##
MongoDB的连接池和连接管理 BigCat2013 mongodb
在关系型数据库中，我们总是需要关闭使用的数据库连接，不然大量的创建连接会导致资源的浪费甚至于数据库宕机。这篇文章主要想解释一下mongoDB的连接池以及连接管理机制，如果正对此有疑惑的朋友可以看一下。通常我们习惯于new 一个connection并且通常在finally语句中调用connection的close()方法将其关闭。正巧，mongoDB中当我们new一个Mongo的时候，会发现它也
AngularJS使用Socket.IO bijian1013 JavaScript AngularJS Socket.IO
目前，web应用普遍被要求是实时web应用，即服务端的数据更新之后，应用能立即更新。以前使用的技术（例如polling）存在一些局限性，而且有时我们需要在客户端打开一个socket，然后进行通信。 Socket.IO(http://socket.io/)是一个非常优秀的库，它可以帮你实
[Maven学习笔记四]Maven依赖特性 bit1129 maven
三个模块为了说明问题，以用户登陆小web应用为例。通常一个web应用分为三个模块，模型和数据持久化层user-core, 业务逻辑层user-service以及web展现层user-web， user-service依赖于user-core user-web依赖于user-core和user-service 依赖作用范围 Maven的dependency定义
【Akka一】Akka入门 bit1129 akka
什么是Akka Message-Driven Runtime is the Foundation to Reactive Applications In Akka, your business logic is driven through message-based communication patterns that are independent of physical locatio
zabbix_api之perl语言写法 ronin47 zabbix_api之perl
zabbix_api网上比较多的写法是python或curl。上次我用java－－http://bossr.iteye.com/blog/2195679，这次用perl。for example: #!/usr/bin/perl use 5.010 ; use strict ; use warnings ; use JSON :: RPC :: Client ; use
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ brotherlamp linux运维工程师 linux运维工程师教程 linux运维工程师视频 linux运维工程师资料 linux运维工程师自学
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ ----------------------------------------------------- 兄弟连Linux运维工程师课堂实录-计算机基础-1-课程体系介绍1 链接：http://pan.baidu.com/s/1i3GQtGL 密码：bl65 兄弟连Lin
bitmap求哈密顿距离-给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y( bylijinnan java
import java.util.Random; /** * 题目： * 给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y(y1,y2,y3,y4,y5)， * 使得他们的哈密顿距离（d=|x1-y1| + |x2-y2| + |x3-y3| + |x4-y4| + |x5-y5|）最大
map的三种遍历方法 chicony map
package com.test; import java.util.Collection; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Set; public class TestMap { public static v
Linux安装mysql的一些坑 chenchao051 linux
1、mysql不建议在root用户下运行 2、出现服务启动不了，111错误，注意要用chown来赋予权限，我在root用户下装的mysql，我就把usr/share/mysql/mysql.server复制到/etc/init.d/mysqld, (同时把my-huge.cnf复制/etc/my.cnf) chown -R cc /etc/init.d/mysql
Sublime Text 3 配置 daizj 配置 Sublime Text
Sublime Text 3 配置解释(默认){// 设置主题文件“color_scheme”: “Packages/Color Scheme – Default/Monokai.tmTheme”,// 设置字体和大小“font_face”: “Consolas”,“font_size”: 12,// 字体选项：no_bold不显示粗体字，no_italic不显示斜体字，no_antialias和
MySQL server has gone away 问题的解决方法 dcj3sjt126com SQL Server
MySQL server has gone away 问题解决方法，需要的朋友可以参考下。应用程序（比如PHP）长时间的执行批量的MYSQL语句。执行一个SQL，但SQL语句过大或者语句中含有BLOB或者longblob字段。比如，图片数据的处理。都容易引起MySQL server has gone away。今天遇到类似的情景，MySQL只是冷冷的说：MySQL server h
javascript/dom:固定居中效果 dcj3sjt126com JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&
使用 Spring 2.5 注释驱动的 IoC 功能 e200702084 spring bean 配置管理 IOC Office
使用 Spring 2.5 注释驱动的 IoC 功能 developerWorks 文档选项将打印机的版面设置成横向打印模式打印本页将此页作为电子邮件发送将此页作为电子邮件发送级别：初级陈雄华 ([email protected]), 技术总监, 宝宝淘网络科技有限公司 2008 年 2 月 28 日 &nb
MongoDB常用操作命令 geeksun mongodb
1. 基本操作 db.AddUser(username,password) 添加用户 db.auth(usrename,password) 设置数据库连接验证 db.cloneDataBase(fromhost)
php写守护进程（Daemon） hongtoushizi PHP
转载自： http://blog.csdn.net/tengzhaorong/article/details/9764655 守护进程（Daemon）是运行在后台的一种特殊进程。它独立于控制终端并且周期性地执行某种任务或等待处理某些发生的事件。守护进程是一种很有用的进程。php也可以实现守护进程的功能。 1、基本概念 &nbs
spring整合mybatis,关于注入Dao对象出错问题 jonsvien DAO spring bean mybatis prototype
今天在公司测试功能时发现一问题：先进行代码说明： 1，controller配置了Scope="prototype"（表明每一次请求都是原子型） @resource/@autowired service对象都可以（两种注解都可以）。 2，service 配置了Scope="prototype"（表明每一次请求都是原子型）
对象关系行为模式之标识映射 home198979 PHP 架构企业应用对象关系标识映射
HELLO!架构一、概念 identity Map:通过在映射中保存每个已经加载的对象，确保每个对象只加载一次，当要访问对象的时候，通过映射来查找它们。其实在数据源架构模式之数据映射器代码中有提及到标识映射，Mapper类的getFromMap方法就是实现标识映射的实现。二、为什么要使用标识映射？在数据源架构模式之数据映射器中 //c
Linux下hosts文件详解 pda158 linux
　1、主机名：　　无论在局域网还是INTERNET上，每台主机都有一个IP地址，是为了区分此台主机和彼台主机，也就是说IP地址就是主机的门牌号。　　公网：IP地址不方便记忆，所以又有了域名。域名只是在公网（INtERNET)中存在，每个域名都对应一个IP地址，但一个IP地址可有对应多个域名。　　局域网：每台机器都有一个主机名，用于主机与主机之间的便于区分，就可以为每台机器设置主机
nginx配置文件粗解 spjich java nginx
#运行用户#user nobody;#启动进程,通常设置成和cpu的数量相等worker_processes 2;#全局错误日志及PID文件#error_log logs/error.log;#error_log logs/error.log notice;#error_log logs/error.log inf
数学函数 w54653520 java
public class S { // 传入两个整数，进行比较，返回两个数中的最大值的方法。 public int get( int num1, int nu

从理论和Pytorch代码 一步步了解RNN(Recurrent Neural Network)循环神经网络+EmBedding层通俗理解

初学者学习Pytorch系列

文章目录

前言

一、RNN理论

1.RNN的R在哪里体现？

RNN为什么行？

RNN有不同的循环模式（拓展）

二、RNN的pytorch代码

方式一：使用torch.nn.RNNCell

方式二：使用torch.nn.RNN

使用pytorch实现序列转换小案例

问题一：输入是Hello，怎么转化为可以输入模型的数字

使用RNNCell版本

RNN版本

可能有人会对交叉熵的维度有疑问

改变编码方式，使用Embedding层

Embedding在上述例子的应用

为什么使用Embedding后就能更快收敛，loss减小

总结

你可能感兴趣的:(Pytorch,pytorch,rnn,深度学习)

从理论和Pytorch代码一步步了解RNN(Recurrent Neural Network)循环神经网络+EmBedding层通俗理解