阿丢是丢心心

RNN（pytorch）的维度问题——用GRU实现文本分类（参考刘二大人）

最近学RNN的时候对于其中各种输入输出都有点懵，然后参考了刘二大人关于pytorch实践以及下面这篇文章Pytorch深度学习实践（b站刘二大人）P13讲 (RNN循环神经网络高级篇)_努力学习的朱朱的博客-CSDN博客代码把维度问题整理了一下

一、pytorch中embedding在做什么？

我们先看下面这一段代码：

import torch
embedding = torch.nn.Embedding(10, 3)
print(embedding.weight)  # 根据索引取embedding中的词向量
input = torch.LongTensor([[0,2,4,5],[4,3,2,0]])   
output = embedding(input)
print(output)
print(output.shape)

这段代码输出如下：

Parameter containing:
tensor([[ 0.1540, -0.8776, -0.9737],
        [-2.0864, -1.1387, -1.9999],
        [ 0.3297,  1.2760,  0.4246],
        [-0.4424,  1.0758, -1.3849],
        [ 0.6420, -2.5247, -1.1060],
        [ 1.0529,  1.3949, -1.0098],
        [ 1.1634, -1.1316, -0.1378],
        [ 1.3910,  0.9718,  0.1931],
        [-1.9672, -0.5770,  1.0776],
        [-0.4043, -0.9368,  3.2478]], requires_grad=True)
tensor([[[ 0.1540, -0.8776, -0.9737],
         [ 0.3297,  1.2760,  0.4246],
         [ 0.6420, -2.5247, -1.1060],
         [ 1.0529,  1.3949, -1.0098]],

        [[ 0.6420, -2.5247, -1.1060],
         [-0.4424,  1.0758, -1.3849],
         [ 0.3297,  1.2760,  0.4246],
         [ 0.1540, -0.8776, -0.9737]]], grad_fn=)
torch.Size([2, 4, 3])

我们可以看到embedding就是跟我我们设置的参数（词典大小vocab_size，词嵌入向量大小embedding_dim）随机生成一个对应维度的向量矩阵，而nn.embedding就相当于根据对应input的index在这个矩阵中取向量，比如input中[0,2,4,5]就对应了向量矩阵中的第0行，第2行，第4行以及第5行。在这个过程中，输入维度是【batch_size, seq_len】(批量大小，句子长度），输出维度是【batch_size, seq_len, embedding_size】。注意，在实际运用过程中输入【batch_size, seq_len】要进行转置再输入，这里写的是没有经过转置的对应维度，仅为了理解embedding的作用。

二、batch_size与seq_len

在TensorFlow中有专门的seq_len来对应于句子长度，但是pytorch中参数如下：

class torch.nn.LSTM(*args, **kwargs) ：

input_size：x的特征维度
hidden_size：隐藏层的特征维度
num_layers：lstm隐层的层数，默认为1 
bias：False则bihbih=0和bhhbhh=0. 默认为True 
batch_first：True则输入输出的数据格式为 (batch, seq, feature) 
dropout：除最后一层，每一层的输出都进行dropout，默认为: 0 
bidirectional：True则为双向lstm默认为False

显然是没有seq_len，那么在pytorch中我们是怎么解决这个问题的呢？这就需要我们自己在数据输入LSTM前将数据进行padding为同一纬度的向量，对于pytorch中LSTM来说，只要保证每一个batch中的seq_len相同即可。一般来说我们有两种方法：

1.自己构造DataLoader：将每个batch_size中的句子都填充为该batch中最长句子的长度（该方法后面讲）

2.用pytorch中的torch.utils.data.Data.TensorDataset和torch.utils.data.DataLoader，使用这个就需要在最开始就把句子都padding为同一长度，用下面方法：

def truncate_pad(line, num_steps, padding_token):
    """截断或填充文本序列"""
    if len(line) > num_steps:
        return line[:num_steps]  # 截断
    return line + [padding_token] * (num_steps - len(line))  # 填充

num_steps = 100  #设置padding维度
train_features = torch.tensor([truncate_pad(
    vocab[line], num_steps, vocab['']) for line in tokens])

train_dataset = Data.TensorDataset(X_train, torch.tensor(y_train))  #构造为Dataset

trainloader = DataLoader(train_dataset, batch_size=BATCH_SIZE,shuffle=True)  #构造为DataLoader

三、RNN模型的维度

下面就用刘二大人pytorch教学（《PyTorch深度学习实践》完结合集_哔哩哔哩_bilibili）中的例子来看看数据在LSTM中流转过程各个维度是怎样的

import torch
import random
import  time
import csv
import gzip
from  torch.utils.data import DataLoader
import datetime
import matplotlib.pyplot as plt
import numpy as np
 
# Parameters
HIDDEN_SIZE = 100
BATCH_SIZE = 32
N_LAYER = 2
N_EPOCHS = 20
N_CHARS = 128
USE_GPU = False
 
class NameDataset():         #处理数据集
    def __init__(self, is_train_set=True):
        filename = 'names_train.csv.gz' if is_train_set else 'names_test.csv.gz'
        with gzip.open(filename, 'rt') as f:    
            reader = csv.reader(f)              
            rows = list(reader)
        random.shuffle(rows)
        rows = rows[:256]
        self.names = [row[0] for row in rows]   #取出人名
        self.len = len(self.names)              #人名数量
        self.countries = [row[1] for row in rows]#取出国家名
        self.country_list = list(sorted(set(self.countries)))#国家名集合，18个国家名的集合
        #countrys是所有国家名，set(countrys)把所有国家明元素设为集合（去除重复项），sorted（）函数是将集合排序
        #测试了一下，实际list(sorted(set(self.countrys)))==sorted(set(self.countrys))
        self.country_dict = self.getCountryDict()#转变成词典
        self.country_num = len(self.country_list)#得到国家集合的长度18
 
    def __getitem__(self, index):
        return self.names[index], self.country_dict[self.countries[index]]
 
    def __len__(self):
        return self.len
 
    def getCountryDict(self):
        country_dict = dict()                                       #创建空字典
        for idx, country_name in enumerate(self.country_list,0):    #取出序号和对应国家名
            country_dict[country_name] = idx                        #把对应的国家名和序号存入字典
        return country_dict
 
    def idx2country(self,index):            #返回索引对应国家名
        return self.country_list(index)
 
    def getCountrysNum(self):               #返回国家数量
        return self.country_num

trainset = NameDataset(is_train_set=True)
trainloader = DataLoader(trainset, batch_size=BATCH_SIZE,shuffle=True)
testset = NameDataset(is_train_set=False)
testloader = DataLoader(testset, batch_size=BATCH_SIZE,shuffle=False)

for item in trainloader:
    print(item)
    
N_COUNTRY = trainset.getCountrysNum()

为了方便展示，我只选择了其中256来演示，我们可以看一下样本转为dataloader后的样子：

每一个batch由32个名字和对应国家组成，接下俩我们需要将其转变为向量

def name2list(name):
    """返回ASCII码表示的姓名列表与列表长度"""
    arr = [ord(c) for c in name]
    return arr, len(arr)
 
def make_tensors(names, countries):
    sequences_and_lengths = [name2list(name) for name in names]表
    name_sequences = [sl[0] for sl in sequences_and_lengths]
    seq_lengths = torch.LongTensor([sl[1] for sl in sequences_and_lengths])
    countries = countries.long()
    seq_tensor = torch.zeros(len(name_sequences), seq_lengths.max()).long()
    for idx, (seq, seq_len) in enumerate(zip(name_sequences, seq_lengths), 0):
        seq_tensor[idx, :seq_len] = torch.LongTensor(seq)
    seq_lengths, perm_idx = seq_lengths.sort(dim=0, descending=True)
    seq_tensor = seq_tensor[perm_idx]
    countries = countries[perm_idx]
    return seq_tensor, seq_lengths, countries

这段代码做的其实就是把每个batch转化为每个名字长度一致的向量，每一个batch向量维度为：batch*seq_len

我们可以看一下处理后的数据：

for i, (names, countries) in enumerate(trainloader, 1):
    print('names',names, 'Coounties',countries)
    inputs, seq_lengths, target = make_tensors(names, countries)
    print('inputs, seq_lengths, target',inputs, seq_lengths, target)
    print('inputs.shape',inputs.shape)

names ('Balawin', 'Likhovtsev', 'Cullen', 'Abadi', 'Uzky', 'Moshnyaga', 'Abrosimov', 'Fencl', 'Antar', 'Pastore', 'Matjeka', 'Larsen', 'Mikhalkov', 'Chavez', 'Agoshkov', 'Hasek', 'Fedotko', 'Koury', 'Winter', 'Hautem', 'Dioli', 'Chershintsev', 'Herbert', 'Anami', 'Makferson', 'Christakos', 'Molnovetsky', 'Tsagareli', 'Hublaryan', 'Matskovsky', 'Radford', 'Antyushin') Coounties tensor([13, 13,  4,  0, 13, 13, 13,  2,  0,  9,  2,  4, 13, 14, 13,  6, 13,  0,
         4,  3,  9, 13,  4, 10, 13,  7, 13, 13, 13, 13,  4, 13])
inputs, seq_lengths, target tensor([[ 67, 104, 101, 114, 115, 104, 105, 110, 116, 115, 101, 118],
        [ 77, 111, 108, 110, 111, 118, 101, 116, 115, 107, 121,   0],
        [ 76, 105, 107, 104, 111, 118, 116, 115, 101, 118,   0,   0],
        [ 67, 104, 114, 105, 115, 116,  97, 107, 111, 115,   0,   0],
        [ 77,  97, 116, 115, 107, 111, 118, 115, 107, 121,   0,   0],
        [ 77, 111, 115, 104, 110, 121,  97, 103,  97,   0,   0,   0],
        [ 65,  98, 114, 111, 115, 105, 109, 111, 118,   0,   0,   0],
        [ 77, 105, 107, 104,  97, 108, 107, 111, 118,   0,   0,   0],
        [ 77,  97, 107, 102, 101, 114, 115, 111, 110,   0,   0,   0],
        [ 84, 115,  97, 103,  97, 114, 101, 108, 105,   0,   0,   0],
        [ 72, 117,  98, 108,  97, 114, 121,  97, 110,   0,   0,   0],
        [ 65, 110, 116, 121, 117, 115, 104, 105, 110,   0,   0,   0],
        [ 65, 103, 111, 115, 104, 107, 111, 118,   0,   0,   0,   0],
        [ 66,  97, 108,  97, 119, 105, 110,   0,   0,   0,   0,   0],
        [ 80,  97, 115, 116, 111, 114, 101,   0,   0,   0,   0,   0],
        [ 77,  97, 116, 106, 101, 107,  97,   0,   0,   0,   0,   0],
        [ 70, 101, 100, 111, 116, 107, 111,   0,   0,   0,   0,   0],
        [ 72, 101, 114,  98, 101, 114, 116,   0,   0,   0,   0,   0],
        [ 82,  97, 100, 102, 111, 114, 100,   0,   0,   0,   0,   0],
        [ 67, 117, 108, 108, 101, 110,   0,   0,   0,   0,   0,   0],
        [ 76,  97, 114, 115, 101, 110,   0,   0,   0,   0,   0,   0],
        [ 67, 104,  97, 118, 101, 122,   0,   0,   0,   0,   0,   0],
        [ 87, 105, 110, 116, 101, 114,   0,   0,   0,   0,   0,   0],
        [ 72,  97, 117, 116, 101, 109,   0,   0,   0,   0,   0,   0],
        [ 65,  98,  97, 100, 105,   0,   0,   0,   0,   0,   0,   0],
        [ 70, 101, 110,  99, 108,   0,   0,   0,   0,   0,   0,   0],
        [ 65, 110, 116,  97, 114,   0,   0,   0,   0,   0,   0,   0],
        [ 72,  97, 115, 101, 107,   0,   0,   0,   0,   0,   0,   0],
        [ 75, 111, 117, 114, 121,   0,   0,   0,   0,   0,   0,   0],
        [ 68, 105, 111, 108, 105,   0,   0,   0,   0,   0,   0,   0],
        [ 65, 110,  97, 109, 105,   0,   0,   0,   0,   0,   0,   0],
        [ 85, 122, 107, 121,   0,   0,   0,   0,   0,   0,   0,   0]]) tensor([12, 11, 10, 10, 10,  9,  9,  9,  9,  9,  9,  9,  8,  7,  7,  7,  7,  7,
         7,  6,  6,  6,  6,  6,  5,  5,  5,  5,  5,  5,  5,  4]) tensor([13, 13, 13,  7, 13, 13, 13, 13, 13, 13, 13, 13, 13, 13,  9,  2, 13,  4,
         4,  4,  4, 14,  4,  3,  0,  2,  0,  6,  0,  9, 10, 13])
inputs.shape torch.Size([32, 12])

这里展示的就是一个batch的数据情况，接下来就开始构造我们的RNN模型，这里用的是GRU

class RNNClassifier(torch.nn.Module):
    def __init__(self, vocab_size, embedding_size, output_size, n_layers=1, bidirectional=True):
        super(RNNClassifier, self).__init__()
        self.hidden_size = embedding_size 
        self.n_layers = n_layers
        self.n_directions = 2 if bidirectional else 1
        self.embedding = torch.nn.Embedding(vocab_size, embedding_size)#input.shape=(seqlen,batch) output.shape=(seqlen,batch,hiddensize)
        self.gru = torch.nn.GRU(embedding_size, self.hidden_size , n_layers, bidirectional=bidirectional)                               
        self.fc = torch.nn.Linear(self.hidden_size * self.n_directions, output_size)
 
    def forward(self, input, seq_lengths):
        input = input.t()               
        print('input.shape',input.shape)
        batch_size = input.size(1)
        hidden =self._init_hidden(batch_size)
        print('hidden shape',hidden.shape)
        embedding = self.embedding(input)
        print('embedding shape',embedding.shape)
        
        seq_lengths = seq_lengths.cpu()

        output, hidden = self.gru(embedding, hidden)
        print("output, hidden",output.shape, hidden.shape)
        if self.n_directions ==2:
            hidden_cat = torch.cat([hidden[-1], hidden[-2]], dim=1)
        else:
            hidden_cat = hidden[-1]
        fc_output = self.fc(hidden_cat)
        return fc_output
 
    def _init_hidden(self,batch_size):
        hidden = torch.zeros(self.n_layers * self.n_directions, batch_size, self.hidden_size)
        return  create_tensor(hidden)

然后开始训练模型

def trainModel():
    total_loss = 0
 
    for i, (names, countries) in enumerate(trainloader, 1):
        optimizer.zero_grad()
        inputs, seq_lengths, target = make_tensors(names, countries)
        output = classifier(inputs, seq_lengths)    #把输入和序列放入分类器
        loss = criterion(output, target)            #计算损失
 
        loss.backward()
        optimizer.step()
        total_loss += loss.item()
 
        #打印输出结果
        if i == len(trainset) // BATCH_SIZE :
            print(f'loss={total_loss / (i * len(inputs))}')
  
    return total_loss


print("Train for %d epochs..." % N_EPOCHS)
classifier = RNNClassifier(N_CHARS, HIDDEN_SIZE, N_COUNTRY, N_LAYER)
if USE_GPU:
    device = torch.device('cuda:0')
    classifier.to(device)

criterion = torch.nn.CrossEntropyLoss()    
optimizer = torch.optim.Adam(classifier.parameters(), lr = 0.001)   

for epoch in range(1, N_EPOCHS+1):
    #训练
    print('%d / %d:' % (epoch, N_EPOCHS))
    trainModel()

我们可以看一下维度的情况（只截取了部分结果）：,

Train for 20 epochs...
1 / 20:
input.shape torch.Size([10, 32])
hidden shape torch.Size([4, 32, 100])
embedding shape torch.Size([10, 32, 100])
output, hidden torch.Size([10, 32, 200]) torch.Size([4, 32, 100])
input.shape torch.Size([14, 32])
hidden shape torch.Size([4, 32, 100])
embedding shape torch.Size([14, 32, 100])
output, hidden torch.Size([14, 32, 200]) torch.Size([4, 32, 100])
input.shape torch.Size([13, 32])
hidden shape torch.Size([4, 32, 100])
embedding shape torch.Size([13, 32, 100])
output, hidden torch.Size([13, 32, 200]) torch.Size([4, 32, 100])

input就是我们经过向量化的一个batch向量，因为在这里进行了转置，由之前的（batch_size, seq_len）变为了（seq_len，batch_size），其中seq_len就对应于一个batch中最长的单词（句子）长度

hidden就是GRU中隐藏层输出（最开始我们先初始化h0）,它对应的维度是(n_layers * n_directions, batch_size, hidden_size)

embedding代表的是input经过nn.Embedding层计算后得到的结果，他的维度是：（seq_len，batch_size, embedding_size）

经过GRU模型后有两个输出结果，output：（seq_len, batch, n_directions*hidden_size）,hn：（n_layers*n_directions, batch, hiddem_size）

这里的output和hn分别对应的是中间所有输出以及最后隐藏层输出：

也可以直接看官方说明：

这篇文章主要讲了一下RNN模型的维度问题，希望对大家有帮助！

使用 Python 和 scikit-learn 实现 KNN 分类：以鸢尾花数据集为例弥树子 python scikit-learn 分类
在机器学习的世界里，K-NearestNeighbors（KNN）算法是一种简单而强大的分类方法。它基于一个直观的想法：相似的数据点往往属于同一类别。本文将通过Python的scikit-learn库实现KNN分类，以经典的鸢尾花数据集为例，展示从数据加载到模型评估的完整流程。1.KNN算法简介KNN是一种监督学习算法，主要用于分类和回归任务。它的工作原理非常简单：对于一个新的数据点，算法会查找训
machine learning knn算法之使用KNN对鸢尾花数据集进行分类知识鱼丸 machine learning 机器学习算法分类
通过导入必要的scikit-learn导入必要的库，加载给定的数据，划分测试集和训练集之后训练预测和评估即可具体代码如下：importnumpyasnpfromsklearn.datasetsimportload_irisfromsklearn.model_selectionimporttrain_test_splitfromsklearn.preprocessingimportStandardS
LSTM的推导与实现 YZXnuaa NLP Python库
最近在看CS224d，这里主要介绍LSTM(LongShort-TermMemory)的推导过程以及用Python进行简单的实现。LSTM是一种时间递归神经网络，是RNN的一个变种，非常适合处理和预测时间序列中间隔和延迟非常长的事件。假设我们去试着预测‘IgrewupinFrance...（很长间隔）...IspeakfluentFrench’最后的单词，当前的信息建议下一个此可能是一种语言的名字
AI软件外包需要注意什么外包开发AI软件的关键因素是什么如何选择AI外包开发语言北京动点飞扬软件 AI外包
1.定义目标与需求首先，要明确你希望AI智能体做什么。是自动化任务、数据分析、自然语言处理，还是其他功能？明确目标可以帮助你选择合适的技术和方法。2.选择开发平台与工具开发AI智能体的软件时，你需要选择适合的编程语言、框架和工具。例如：编程语言：Python是最常用的语言，因为它有强大的AI/ML库，如TensorFlow、PyTorch、scikit-learn等。开发平台：你可以使用本地环境、
《Kotlin核心编程》下篇张云瀚 kotlin kotlin核心编程
设计模式设计模式分类创建型设计模式：概念：创建型设计模式主要用于对象的创建过程，比如对象的实例化、创建对象的方式和时机等，它关注的是如何将对象的创建和使用分离，使得代码在创建对象时更加灵活、可维护和可扩展。特点：封装对象创建过程；提高灵活性；便于代码复用。常见模式：单例模式、工厂模式、抽象工厂模式、建造者模式、原型模式。结构型设计模式：概念：结构型设计模式主要用于处理类或对象的组合结构，它关注的是
ultralytics 是什么？博刻 AI 学习笔记 python
ultralytics是一个用于计算机视觉任务的Python库，专注于提供高效、易用的目标检测、实例分割和图像分类工具。它最著名的功能是实现YOLO（YouOnlyLookOnce）系列模型，特别是最新的YOLOv8。1.YOLO是什么？YOLO是一种流行的目标检测算法，以其速度快和精度高而闻名。YOLO的核心思想是将目标检测问题转化为一个回归问题，直接预测目标的边界框和类别。YOLOv8是YOL
mysql 树形结构_MySQL 树形结构数据库设计 | 剑花烟雨江南来B mysql 树形结构
程序设计过程中，我们常常用树形结构来表示某些数据的关联关系，如企业的部门上下级、电商平台的商品分类等等，通常而言，我们需要通过数据库来完成数据的持久化。由于关系型数据库没有一个很好的树形结构解决方案，因此设计合适的Schema以及其对应的CURD算法是关键。接下来，我们以电商商品分类结构来介绍几种解决方案。邻接表邻接表就是把所有节点都放在一张表中，然后用一个属性来记录每个节点的父节点。如下：CRE
《动手学深度学习》(PyTorch版) chaser&upper 深度学习 pytorch 深度学习 python
《动手学深度学习》PyTorch版前言简介面向人群食用方法方法一方法二方法三目录原书地址引用阅读指南前言读书啦！！！本项目将《动手学深度学习》原书中MXNet代码实现改为PyTorch实现。原书作者：阿斯顿·张、李沐、扎卡里C.立顿、亚历山大J.斯莫拉以及其他社区贡献者，GitHub地址：https://github.com/d2l-ai/d2l-zh此书的中英版本存在一些不同，针对此书英文版的P
使用onnxruntime-web 运行yolov8-nano推理 CHEN_RUI_2200 机器学习 YOLO
ONNX（OpenNeuralNetworkExchange）模型具有以下两个特点促成了我们可以使用onnxruntime-web直接在web端上运行推理模型，为了让这个推理更直观，我选择了试验下yolov8识别预览图片：1.跨平台兼容性ONNX是一种开放的格式，可以在不同的深度学习框架之间共享模型，如PyTorch、TensorFlow、MXNet和Caffe2。这使得用户可以在一个框架中训练模
使用Bert+BiLSTM+CRF训练 NER任务 CHEN_RUI_2200 机器学习 bert 人工智能深度学习
使用的数据集在这里E-CommercialNERDataset/电商NER数据集_数据集-阿里云天池针对面向电商的命名实体识别研究，我们通过爬取搜集了淘宝商品文本的标题，并标注了4大类，9小类的实体类别。具体类型及实体数量如下针对面向电商的命名实体识别研究，我们通过爬取搜集了淘宝商品文本的标题，并标注了4大类，9小类的实体类别。具体类型及实体数量如下：每个文件数据格式相同，都为根据BIschema
Silero VAD 开源项目教程苏鹃咪Healthy
SileroVAD开源项目教程项目地址:https://gitcode.com/gh_mirrors/si/silero-vad项目介绍SileroVAD是一个预训练的企业级语音活动检测器（VoiceActivityDetector），由snakers4团队开发并开源在GitHub上。该项目支持多种语言和不同领域的音频，具有灵活的采样率（8000Hz和16000Hz），并且可以在PyTorch和O
FSMN-VAD与Silero-VAD Wasser. python 语音识别
引用说明：FSMN-VAD引用魔塔社区项目：https://modelscope.cn/models/iic/speech_fsmn_vad_zh-cn-16k-common-pytorch/summary感谢阿里大佬的开源与介绍。这篇文章主要介绍两种的ASR中的VAD开源模型，第一种就是FSMN-VAD，这个是达摩院语音团队提出的高效语音端点检测模型，用于检测输入音频中有效语音的起止时间点信息。
人工智能学习框架：深入解析与实战指南一ge科研小菜鸡人工智能人工智能
个人主页：一ge科研小菜鸡-CSDN博客期待您的关注引言随着人工智能（AI）技术的飞速发展，深度学习、强化学习和自然语言处理等领域的应用愈加广泛。掌握人工智能学习框架（如TensorFlow、PyTorch、Keras等）已成为开发智能系统、研究前沿技术的必备技能。本指南将全面介绍人工智能主流学习框架的特点、安装方法、核心功能，以及通过实践案例展示如何使用这些框架进行AI模型开发、训练与优化。1.
从零开始构建一个JAVA项目 SUGERBOOM java log4j 开发语言
本篇文章将从结构框架入手，系统介绍一个完整Java程序的结构步骤，不涉及JAVA基础代码学习。在本文章中先简单介绍Maven、Spring、MyBatis三种Java类型。一、分类介绍首先我们先来了解Java程序的类型，不同类型结构略有区别。Java程序的类型可以根据多个分类方式进行划分，以下是一些常见的分类和简要解释：构建工具类型：Maven：用于管理项目的构建、报告和文档的生成。它提供了一种标
如何解决小尺寸图像分割中的样本不均衡问题司南锤深度学习遥感笔记深度学习
1.生成对抗数据增强（Copy-PasteAugmentation）原理：将稀有目标的像素块复制粘贴到其他图像中，低成本生成平衡数据。适用场景：小目标（如车辆、船只）或极端稀疏类别（如灾害损毁区域）。PyTorch实现：importrandomdefcopy_paste_augment(image,mask,paste_image,paste_mask):#从粘贴数据中随机选择一个目标实例obj_
【深度学习|地学应用】遥感与深度学习：揭示梦柯冰川奥秘的前沿应用与实践解析 985小水博一枚呀深度学习地学应用深度学习人工智能
【深度学习|地学应用】遥感与深度学习：揭示梦柯冰川奥秘的前沿应用与实践解析【深度学习|地学应用】遥感与深度学习：揭示梦柯冰川奥秘的前沿应用与实践解析文章目录【深度学习|地学应用】遥感与深度学习：揭示梦柯冰川奥秘的前沿应用与实践解析前言一、使用高分6号遥感影像结合深度学习对梦柯冰川的研究方向1.冰川边界自动化提取2.冰川变化动态监测3.冰川分类与分布特征分析二、梦柯冰川（MunkuGlacier）的
一文大白话讲清楚webpack进阶——3——Loader的执行顺序(pre,normal,inline,post) 16年上任的CTO webpack webpack 前端 node.js loader执行顺序
文章目录一文大白话讲清楚webpack进阶——3——Loader的执行顺序(pre,normal,inline,post)1.loader的分类和执行顺序1.1pre1.2normal1.3inline1.4post1.5相同优先级2.如何制定分类2.1非inline2.2inline2.2.1禁用普通loader2.2.2禁用所有loader2.2.3禁用非post类型loader一文大白话讲清
Isaac Lab 独鹿算法人工智能 python 开发语言机器人
一、安装isaacsimcondacreate-nisaaclabpython=3.10condaactivateisaaclabpipinstalltorch==2.2.2--index-urlhttps://download.pytorch.org/whl/cu121pipinstallisaacsim-rlisaacsim-replicatorisaacsim-extscache-physi
Isaac Lab 安装（ubuntu22.04环境） AIGCnn Isaac Lab isaac sim Omniverse Isaac Sim
Windows下的安装见这篇博客：IsaacLab安装与初体验（windows环境）-CSDN博客ubuntu22.04下的安装与windows下十分类似，还是参考官方的，InstallationusingIsaacSimBinariesInstallationusingIsaacSimBinaries—IsaacLabdocumentation(isaac-sim.github.io)https
JVM垃圾回收器的原理和调优详解！喵手零基础学Java jvm
全文目录：开篇语前言摘要概述垃圾回收器分类及原理1.Serial垃圾回收器2.Parallel垃圾回收器3.CMS垃圾回收器4.G1垃圾回收器源码解析示例代码使用案例分享案例1：Web服务的GC调优案例2：大数据任务的GC优化应用场景案例垃圾回收调优策略优缺点分析优点缺点核心类方法介绍测试用例小结总结文末开篇语哈喽，各位小伙伴们，你们好呀，我是喵手。运营社区：C站/掘金/腾讯云/阿里云/华为云/5
python识别复杂验证码2020_python 验证码识别示例（二）复杂验证码识别 y921112y921112
在这篇博文中手把手教你如何去分割验证，然后进行识别。一：下载验证码验证码分析，图片上有折线，验证码有数字，有英文字母大小写，分类的时候需要更多的样本，验证码的字母是彩色的，图片上有雪花等噪点，因此识别改验证码难度较大二：二值化和降噪：三：切割：四：分类：五：测试识别率六：总结：综合识别率在70%左右，对于这个识别率我觉得还是挺高的，因为这个验证码的识别难度还是很大代码：一.下载图片：#-*-cod
系统架构设计中的非功能需求分析与设计 Evaporator Core 系统架构设计师 Oracle Python开发经验系统架构需求分析
引言在系统架构设计中，非功能需求（Non-FunctionalRequirements,NFRs）与功能需求同样重要。非功能需求定义了系统的质量属性，如性能、可用性、安全性、可扩展性等。这些需求虽然不直接描述系统的功能，但它们对系统的成功与否起着决定性作用。本文将深入探讨非功能需求的分析与设计方法，帮助读者理解如何在系统架构设计中有效地处理非功能需求。第一章：非功能需求的分类与重要性非功能需求通常
使用 PyTorch 实现逻辑回归：从数据到模型保存与加载弥树子 pytorch 逻辑回归人工智能
在机器学习中，逻辑回归是一种经典的分类算法，广泛应用于二分类问题。本文将通过一个简单的示例，展示如何使用PyTorch框架实现逻辑回归模型，从数据准备到模型训练、保存和加载，最后进行预测。1.数据准备逻辑回归的核心是通过学习数据中的特征与标签之间的关系来进行分类。在本示例中，我们手动创建了一个简单的二维数据集，包含两类数据点。第一类数据点的标签为0，第二类数据点的标签为1。class1_point
[论文笔记] Megatron: mistral sliding window（ImportError: /workspace/venv/lib/python3.10/site-packag报错解决）心心喵论文笔记论文阅读
pyTorch—TransformerEngine1.2.1documentation论文：https://arxiv.org/pdf/2310.06825.pdftransformerengine的slidingwindow是用了flashatttention（新版本2以上，这里用的最新版本2.5.2）里对sliding_window的实现。所以不需要用transformerengine。直接用
构建高可用系统设计OpenStack、Docker、Mesos和Kubernetes(简称K8s) 葡萄爱 openstack docker kubernetes
如果构建高可用、高并发、高效运维的大型系统大型系统架构设计包括业务层设计、服务层设计、基础架层设计、存储层设计、网络层协同设计来完成。一、业务层根据主要业务范畴的分类和特征提取，抽象出独立的业务系统，分别统计系统的用户角色群体、访问量、计算量。二、服务层细化和落地业务层的划分、拆分、服务治理三、架构技术层构建技术包括：OpenStack、Docker、Mesos和Kubernetes(简称K8s)
transformer.js（二）：关于pipe管道的一切余生H 前端的AI工具书 transformer javascript 深度学习 webml webAI 前端
前面的章节transformer.js（一）：这个前端大模型运行框架的可运行环境、使用方式、代码示例以及适合与不适合的场景介绍了transformer.js的应用场景。pipe管道（Pipeline）作为Transformer.js的核心功能之一，负责简化各种常见的NLP任务，例如文本生成、翻译、分类等，本文将详细介绍：从它的概念、实现到实际使用场景，帮助开发者全面掌握这一功能。什么是Pipe管道
pytorch 手写数字识别 CrxzYia 深度学习 pytorch 机器学习
importnumpyasnpimporttorchimporttorch.nnasnnimporttorch.nn.functionalasFimportstructimporttorch.optimasoptimfromPILimportImagefrommatplotlibimportpyplotaspltclassNet(nn.Module):def__init__(self):super
DDD-全面理解领域驱动设计中的各种“域” liruiqiang05 架构架构开发语言
一、DDD-领域在领域驱动设计（Domain-DrivenDesign，DDD）中，**领域（Domain）**指的是软件系统所要解决的特定业务问题的范围。它涵盖了业务知识、规则和逻辑，是开发团队与领域专家共同关注的核心区域。通过深入理解领域，开发团队能够构建出准确反映业务需求的软件系统。具体示例：电子商务平台：领域：在线购物子域：商品管理：处理商品的创建、更新、分类和库存管理。订单处理：管理订单
【JavaScript】作用域、变量提升、函数提升 Jerry_ww JavaScript javascript 前端
作用域（Scope）的概念和分类概念：作用域是一个变量或函数的作用范围。作用域在函数定义时，就已经确定了。目的：为了提高程序的可靠性，同时减少命名冲突。在JS中，一共有两种作用域：（ES5中）全局作用域：作用于整个script标签内部，或者作用于一个独立的JS文件。函数作用域（局部作用域）：作用于函数内的代码环境。全局作用域和window对象直接编写在script标签中的JS代码，都在全局作用域。
openmv模块学习笔记：openmv瞳孔识别代码详细解析 DIY机器人工房 openmv学习笔记计算机视觉人工智能深度学习 opencv python 学习笔记
这段代码的主要功能是使用OpenMV摄像头持续采集图像，通过Haar级联分类器检测图像中的眼睛，然后在检测到的眼睛区域内寻找瞳孔，并使用矩形框标记眼睛、十字形标记瞳孔的位置，同时输出程序的处理帧率。#瞳孔识别例程##这个例子展示了如何找到图像中的眼睛后的瞳孔（瞳孔检测）。该脚本使用#find_eyes函数来确定应该包含瞳孔的roi的中心点。它通过基本上找到瞳孔#中心的眼睛最黑暗的区域的中心。##注
关于旗正规则引擎下载页面需要弹窗保存到本地目录的问题何必如此 jsp 超链接文件下载窗口
生成下载页面是需要选择“录入提交页面”，生成之后默认的下载页面<a>标签超链接为：<a href="<%=root_stimage%>stimage/image.jsp?filename=<%=strfile234%>&attachname=<%=java.net.URLEncoder.encode(file234filesourc
【Spark九十八】Standalone Cluster Mode下的资源调度源代码分析 bit1129 cluster
在分析源代码之前，首先对Standalone Cluster Mode的资源调度有一个基本的认识：首先，运行一个Application需要Driver进程和一组Executor进程。在Standalone Cluster Mode下，Driver和Executor都是在Master的监护下给Worker发消息创建(Driver进程和Executor进程都需要分配内存和CPU，这就需要Maste
linux上独立安装部署spark daizj linux 安装 spark 1.4 部署
下面讲一下linux上安装spark，以 Standalone Mode 安装 1）首先安装JDK 下载JDK：jdk-7u79-linux-x64.tar.gz ，版本是1.7以上都行，解压 tar -zxvf jdk-7u79-linux-x64.tar.gz 然后配置 ~/.bashrc&nb
Java 字节码之解析一周凡杨 java 字节码 javap
一： Java 字节代码的组织形式类文件 { OxCAFEBABE ，小版本号，大版本号，常量池大小，常量池数组，访问控制标记，当前类信息，父类信息，实现的接口个数，实现的接口信息数组，域个数，域信息数组，方法个数，方法信息数组，属性个数，属性信息数组 } &nbs
java各种小工具代码 g21121 java
1.数组转换成List import java.util.Arrays; Arrays.asList(Object[] obj); 2.判断一个String型是否有值 import org.springframework.util.StringUtils; if (StringUtils.hasText(str)) 3.判断一个List是否有值 import org.spring
加快FineReport报表设计的几个心得体会老A不折腾 finereport
一、从远程服务器大批量取数进行表样设计时，最好按“列顺序”取一个“空的SQL语句”，这样可提高设计速度。否则每次设计时模板均要从远程读取数据，速度相当慢！！二、找一个富文本编辑软件（如NOTEPAD+）编辑SQL语句，这样会很好地检查语法。有时候带参数较多检查语法复杂时，结合FineReport中生成的日志，再找一个第三方数据库访问软件（如PL/SQL）进行数据检索，可以很快定位语法错误。
mysql linux启动与停止墙头上一根草
如何启动/停止/重启MySQL一、启动方式1、使用 service 启动：service mysqld start2、使用 mysqld 脚本启动：/etc/inint.d/mysqld start3、使用 safe_mysqld 启动：safe_mysqld&二、停止1、使用 service 启动：service mysqld stop2、使用 mysqld 脚本启动：/etc/inin
Spring中事务管理浅谈 aijuans spring 事务管理
Spring中事务管理浅谈 By Tony Jiang@2012-1-20 Spring中对事务的声明式管理拿一个XML举例 [html] view plain copy print ? <?xml version="1.0" encoding="UTF-8"?>&nb
php中隐形字符65279（utf-8的BOM头）问题 alxw4616
php中隐形字符65279（utf-8的BOM头）问题今天遇到一个问题. php输出JSON 前端在解析时发生问题:parsererror. 调试: 1.仔细对比字符串发现字符串拼写正确.怀疑是非打印字符的问题. 2.逐一将字符串还原为unicode编码. 发现在字符串头的位置出现了一个 65279的非打印字符.
调用对象是否需要传递对象(初学者一定要注意这个问题) 百合不是茶对象的传递与调用技巧
类和对象的简单的复习,在做项目的过程中有时候不知道怎样来调用类创建的对象,简单的几个类可以看清楚,一般在项目中创建十几个类往往就不知道怎么来看为了以后能够看清楚,现在来回顾一下类和对象的创建,对象的调用和传递(前面写过一篇) 类和对象的基础概念: JAVA中万事万物都是类类有字段(属性),方法,嵌套类和嵌套接
JDK1.5 AtomicLong实例 bijian1013 java thread java多线程 AtomicLong
JDK1.5 AtomicLong实例类 AtomicLong 可以用原子方式更新的 long 值。有关原子变量属性的描述，请参阅 java.util.concurrent.atomic 包规范。AtomicLong 可用在应用程序中（如以原子方式增加的序列号），并且不能用于替换 Long。但是，此类确实扩展了 Number，允许那些处理基于数字类的工具和实用工具进行统一访问。
自定义的RPC的Java实现 bijian1013 java rpc
网上看到纯java实现的RPC，很不错。 RPC的全名Remote Process Call，即远程过程调用。使用RPC，可以像使用本地的程序一样使用远程服务器上的程序。下面是一个简单的RPC 调用实例，从中可以看到RPC如何
【RPC框架Hessian一】Hessian RPC Hello World bit1129 Hello world
什么是Hessian The Hessian binary web service protocol makes web services usable without requiring a large framework, and without learning yet another alphabet soup of protocols. Because it is a binary p
【Spark九十五】Spark Shell操作Spark SQL bit1129 shell
在Spark Shell上，通过创建HiveContext可以直接进行Hive操作 1. 操作Hive中已存在的表 [hadoop@hadoop bin]$ ./spark-shell Spark assembly has been built with Hive, including Datanucleus jars on classpath Welcom
F5　往header加入客户端的ip ronin47
when HTTP_RESPONSE {if {[HTTP::is_redirect]}{ HTTP::header replace Location [string map {:port/ /} [HTTP::header value Location]]HTTP::header replace Lo
java-61-在数组中，数字减去它右边(注意是右边)的数字得到一个数对之差. 求所有数对之差的最大值。例如在数组{2, 4, 1, 16, 7, 5, bylijinnan java
思路来自： http://zhedahht.blog.163.com/blog/static/2541117420116135376632/ 写了个java版的 public class GreatestLeftRightDiff { /** * Q61.在数组中，数字减去它右边(注意是右边)的数字得到一个数对之差。 * 求所有数对之差的最大值。例如在数组
mongoDB 索引开窍的石头 mongoDB索引
在这一节中我们讲讲在mongo中如何创建索引得到当前查询的索引信息 db.user.find(_id:12).explain(); cursor: basicCoursor 指的是没有索引 &
[硬件和系统]迎峰度夏 comsci 系统
从这几天的气温来看，今年夏天的高温天气可能会维持在一个比较长的时间内所以，从现在开始准备渡过炎热的夏天。。。。每间房屋要有一个落地电风扇，一个空调(空调的功率和房间的面积有密切的关系) 坐的，躺的地方要有凉垫，床上要有凉席电脑的机箱
基于ThinkPHP开发的公司官网 cuiyadll 行业系统
后端基于ThinkPHP，前端基于jQuery和BootstrapCo.MZ 企业系统轻量级企业网站管理系统运行环境:PHP5.3+, MySQL5.0 系统预览系统下载：http://www.tecmz.com 预览地址：http://co.tecmz.com 各种设备自适应响应式的网站设计能够对用户产生友好度，并且对于
Transaction and redelivery in JMS (JMS的事务和失败消息重发机制) darrenzhu jms 事务承认 MQ acknowledge
JMS Message Delivery Reliability and Acknowledgement Patterns http://wso2.com/library/articles/2013/01/jms-message-delivery-reliability-acknowledgement-patterns/ Transaction and redelivery in
Centos添加硬盘完全教程 dcj3sjt126com linux centos hardware
Linux的硬盘识别: sda 表示第1块SCSI硬盘 hda 表示第1块IDE硬盘 scd0 表示第1个USB光驱一般使用“fdisk -l”命
yii2 restful web服务路由 dcj3sjt126com PHP yii2
路由随着资源和控制器类准备，您可以使用URL如 http://localhost/index.php?r=user/create访问资源，类似于你可以用正常的Web应用程序做法。在实践中，你通常要用美观的URL并采取有优势的HTTP动词。例如，请求POST /users意味着访问user/create动作。这可以很容易地通过配置urlManager应用程序组件来完成如下所示
MongoDB查询(4)——游标和分页[八] eksliang mongodb MongoDB游标 MongoDB深分页
转载请出自出处：http://eksliang.iteye.com/blog/2177567 一、游标数据库使用游标返回find的执行结果。客户端对游标的实现通常能够对最终结果进行有效控制，从shell中定义一个游标非常简单，就是将查询结果分配给一个变量（用var声明的变量就是局部变量），便创建了一个游标，如下所示： > var
Activity的四种启动模式和onNewIntent() gundumw100 android
Android中Activity启动模式详解　　在Android中每个界面都是一个Activity，切换界面操作其实是多个不同Activity之间的实例化操作。在Android中Activity的启动模式决定了Activity的启动运行方式。　　Android总Activity的启动模式分为四种： Activity启动模式设置： <acti
攻城狮送女友的CSS3生日蛋糕 ini html Web html5 css css3
在线预览：http://keleyi.com/keleyi/phtml/html5/29.htm 代码如下： <!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <title>攻城狮送女友的CSS3生日蛋糕-柯乐义<
读源码学Servlet（1）GenericServlet 源码分析 jzinfo tomcat Web servlet 网络应用网络协议
Servlet API的核心就是javax.servlet.Servlet接口，所有的Servlet 类（抽象的或者自己写的）都必须实现这个接口。在Servlet接口中定义了5个方法，其中有3个方法是由Servlet 容器在Servlet的生命周期的不同阶段来调用的特定方法。先看javax.servlet.servlet接口源码： package
JAVA进阶：VO(DTO)与PO(DAO)之间的转换 snoopy7713 java VO Hibernate po
PO即 Persistence Object　　VO即 Value Object 　VO和PO的主要区别在于：　　VO是独立的Java Object。　　PO是由Hibernate纳入其实体容器（Entity Map）的对象，它代表了与数据库中某条记录对应的Hibernate实体，PO的变化在事务提交时将反应到实际数据库中。　实际上，这个VO被用作Data Transfer
mongodb group by date 聚合查询日期统计每天数据（信息量） qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
/* 1 */ { "_id" : ObjectId("557ac1e2153c43c320393d9d"), "msgType" : "text", "sendTime" : ISODate("2015-06-12T11:26:26.000Z")
java之18天常用的类(一) Luob. Math Date System Runtime Rundom
System类 import java.util.Properties; /** * System: * out:标准输出,默认是控制台 * in:标准输入,默认是键盘 * * 描述系统的一些信息 * 获取系统的属性信息:Properties getProperties(); * * * */ public class Sy
maven wuai maven
1、安装maven：解压缩、添加M2_HOME、添加环境变量path 2、创建maven_home文件夹，创建项目mvn_ch01,在其下面建立src、pom.xml，在src下面简历main、test、main下面建立java文件夹 3、编写类，在java文件夹下面依照类的包逐层创建文件夹，将此类放入最后一级文件夹 4、进入mvn_ch01 4.1、mvn compile ,执行后会在

RNN（pytorch）的维度问题——用GRU实现文本分类（参考刘二大人）

一、pytorch中embedding在做什么？

二、batch_size与seq_len

三、RNN模型的维度

你可能感兴趣的:(pytorch,lstm,分类)