文火冰糖的硅基工坊

[Pytorch系列-60]：循环神经网络 - 中文新闻文本分类详解-2-LSTM网络训练与评估代码详解

作者主页(文火冰糖的硅基工坊)：文火冰糖（王文兵）的博客_文火冰糖的硅基工坊_CSDN博客

本文网址：https://blog.csdn.net/HiWangWenBing/article/details/121800521

第1章预备知识

1.1 业务概述

1.2 LSTM网络

第2章代码准备 (Jupter）

2.1 代码与数据集下载

2.2 导入库

2.3 系统配置

第3章构建数据集

3.1 构建单词表API

3.2 定义构建数据集API

3.3 构建三大数据集

3.4 构建迭代器

第4章构建模型：LSTM

4.1 定义模型类

4.2 实例化模型并显示模型结构

4.3 初始化模型权重参数

第5章模型训练、评估

5.1 模型评估方法

5.2 模型训练方法

5.3 边训练、边评估模型

第6章在测试集上对模型进行评估

6.1 测试方法的定义

6.2 开始测试

第1章预备知识

1.1 业务概述

[Pytorch系列-59]：循环神经网络 - 中文新闻文本分类详解-1-业务目标分析与总体架构_文火冰糖（王文兵）的博客-CSDN博客https://blog.csdn.net/HiWangWenBing/article/details/121756744

1.2 LSTM网络

（1）双向LSTM

备注：

本案例是双向的LSTM，因此隐藏层的输出，是两个方向输出的拼接。

因此全连接网络的输入是 2 * 隐藏层特征数。

(2) LSTM的层数

（3）隐藏的输出

只使用当前的隐层输出送入到全连接网络。

第2章代码准备 (Jupter）

2.1 代码与数据集下载

2.2 导入库

import time
import numpy as np
import torch
import torch.nn as nn
import torch.nn.functional as F
from tensorboardX import SummaryWriter
from sklearn import metrics
import os
import torch
import numpy as np
import pickle as pkl
from tqdm import tqdm
import time
from datetime import timedelta

2.3 系统配置

（1）系统配置数据结构

class Config(object):

    """配置参数"""
    def __init__(self, dataset, embedding):
        self.model_name = 'TextRNN'
        #数据集路径
        self.train_path = dataset + '/data/train.txt'                                # 训练集
        self.dev_path = dataset + '/data/dev.txt'                                    # 验证集
        self.test_path = dataset + '/data/test.txt'                                  # 测试集
        
        #类别文件
        self.class_list = [x.strip() for x in open(
            dataset + '/data/class.txt').readlines()]                                # 类别名单
        
        #单词表：是单词与其索引的对应表
        self.vocab_path = dataset + '/data/vocab.pkl'                                # 词表
        
        # 词向量表: 是索引与向量编码的对应表
        self.embedding_pretrained = torch.tensor(
            np.load(dataset + '/data/' + embedding)["embeddings"].astype('float32'))\
            if embedding != 'random' else None                                       # 预训练词向量

        self.embed = self.embedding_pretrained.size(1)\
            if self.embedding_pretrained is not None else 300           # 字向量维度, 若使用了预训练词向量，则维度统一
    
        # 训练数据保存
        self.save_path = dataset + '/saved_dict/' + self.model_name + '.ckpt'        # 模型训练结果
        self.log_path = dataset + '/log/' + self.model_name
        
        # GPU or CPU
        self.device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')   # 设备
        
        # 模型参数
        self.hidden_size = 128                                          # lstm隐藏层
        self.num_layers = 2                                             # lstm层数
        
        # 训练时的参数
        self.dropout = 0.5                                              # 随机失活
        self.require_improvement = 1000                                 # 若超过1000batch效果还没提升，则提前结束训练
        self.num_classes = len(self.class_list)                         # 类别数
        self.n_vocab = 0                                                # 词表大小，在运行时赋值
        self.num_epochs = 20                                            # epoch数
        self.batch_size = 64                                           # mini-batch大小
        self.pad_size = 32                                              # 每句话处理成的长度(短填长切)
        self.learning_rate = 1e-3                                       # 学习率

（2）实例化配置对象

# 数据集目录
dataset = 'THUCNews'  

# 搜狗新闻:embedding_SougouNews.npz, 腾讯:embedding_Tencent.npz, 随机初始化:random
embedding = 'embedding_SougouNews.npz'

#通过空格分隔的英文单词还是中文的字符
word = False

#初始化配置实例
config = Config(dataset, embedding)

#显示配置信息
print(config.device)
print(config.embed)
print(config.embedding_pretrained)

第3章构建数据集

3.1 构建单词表API

MAX_VOCAB_SIZE = 10000

#新闻标题的填充，固定输入长度为32
UNK, PAD = '', ''

# 单词表不是词向量表，而是单词与其索引对应关系的字典表。
# 从指定单词表中读取词向量表：
# file_path：单词表的路径
# tokenizer：分词器，与英文不同，中文的单词是仅仅相邻的，中间没有空格，因此需要分词器进行分词。
# max_size：单词的最大数量
# min_freq：单词表排序时的参考词频
def build_vocab(file_path, tokenizer, max_size, min_freq):
    # 单词表是一个字典
    vocab_dic = {}
    with open(file_path, 'r', encoding='UTF-8') as f:
        # 通过tqdm从单词表中读取一行单词，tqdm能够显示进度条
        for line in tqdm(f):
            # 移除字符串头尾指定的字符(默认为空格或换行符)或字符序列
            lin = line.strip()
            if not lin:
                #空行
                continue
            #按照空格或table键，把字符转换成短语列表
            content = lin.split('\t')[0]
            
            # 从列表中提取一个个独立的中文单词（即中文字）
            for word in tokenizer(content):
                # 构建单词字典表
                vocab_dic[word] = vocab_dic.get(word, 0) + 1
        
        #对单词表进行排序
        vocab_list = sorted([_ for _ in vocab_dic.items() if _[1] >= min_freq], key=lambda x: x[1], reverse=True)[:max_size]
        
        #还原成字典
        vocab_dic = {word_count[0]: idx for idx, word_count in enumerate(vocab_list)}
        
        #使用UNK填充单词表的尾部
        #  ，'': 4760, '': 4761}
        vocab_dic.update({UNK: len(vocab_dic), PAD: len(vocab_dic) + 1})
    return vocab_dic

3.2 定义构建数据集API

def build_dataset(config, ues_word):
    print("构建单词表")
    # 指定分词器
    print("ues_word=",ues_word)
    if ues_word:
        tokenizer = lambda x: x.split(' ')  # 以空格隔开，word-level
    else:
        tokenizer = lambda x: [y for y in x]  # char-level =》适合中文
    
    # load单词表
    if os.path.exists(config.vocab_path):
        # 如果有现成的单词表，则使用已有的单词表（单词与索引的字典）
        print("使用已有的单词表:", config.vocab_path)
        vocab = pkl.load(open(config.vocab_path, 'rb'))
    else:
        # 如果没有现成的单词表，则基于训练集，构建一个新的词表
        print("基于训练集，新构建单词表：", config.train_path)
        vocab = build_vocab(config.train_path, tokenizer=tokenizer, max_size=MAX_VOCAB_SIZE, min_freq=1)
        pkl.dump(vocab, open(config.vocab_path, 'wb'))
    
    print(f"Vocab size: {len(vocab)}")

    print("构建数据集")
    # 定义load和转换数据集的函数
    # 固定长度为32。
    def load_dataset(path, pad_size=32):
        contents = []
        print("数据集：", path)
        with open(path, 'r', encoding='UTF-8') as f:
            # 读取一行文件，并显示进度条
            for line in tqdm(f):
                #去掉头尾标识符
                lin = line.strip()
                if not lin:
                    # 跳过空行
                    continue
                
                #通过空格分离单词和标签
                content, label = lin.split('\t')
                
                words_line = []
                token = tokenizer(content)
                seq_len = len(token)
                
                # 根据填充单词，确定有效字符长度：seq_len
                if pad_size:
                    if len(token) < pad_size:
                        token.extend([vocab.get(PAD)] * (pad_size - len(token)))
                    else:
                        token = token[:pad_size]
                        seq_len = pad_size
                
                #构建一个个样本数据
                for word in token:
                    # 从单词表中获取每个单词对应的索引index，并添加到文字样本对应的列表中
                    # words_line：存放当个样本数据（单词的index列表）
                    words_line.append(vocab.get(word, vocab.get(UNK)))
                
                #contents：存放所有样本数据（单词的index列表）
                contents.append((words_line, int(label), seq_len))
        return contents  # [([...], 0), ([...], 1), ...]
    
    # load训练数据集
    train = load_dataset(config.train_path, config.pad_size)
    
    # load 验证数据集
    dev = load_dataset(config.dev_path, config.pad_size)
    
    # load 测试数据集
    test = load_dataset(config.test_path, config.pad_size)
    
    return vocab, train, dev, test

3.3 构建三大数据集

（1）构建数据集

def get_time_dif(start_time):
    """获取已使用时间"""
    end_time = time.time()
    time_dif = end_time - start_time
    return timedelta(seconds=int(round(time_dif)))

start_time = time.time()

#构建三大数据集
print("Loading data...")
vocab, train_data, dev_data, test_data = build_dataset(config, word)

# 更新词向量的长度
config.n_vocab = len(vocab)

time_dif = get_time_dif(start_time)
print("Time usage:", time_dif)

（2）显示单词表

print(vocab)

{' ': 0, '0': 1, '1': 2, '2': 3, '：': 4, '大': 5, '国': 6, '图': 7, '(': 8, ')': 9, '3': 10, '人': 11, '年': 12, '5': 13, '中': 14, '新': 15, '9': 16, '生': 17, '金': 18, '高': 19, '《': 20, '》': 21, '4': 22, '上': 23, '8': 24, '不': 25, '考': 26, '一': 27, '6': 28, '日': 29, '元': 30, '开': 31, '美': 32, '价': 33, '发': 34, '学': 35, '公': 36, '成': 37, '月': 38, '将': 39, '万': 40, '7': 41, '基': 42, '市': 43, '出': 44, '子': 45, '行': 46, '机': 47, '业': 48, '被': 49, '家': 50, '股': 51, '的': 52, '在': 53, '网': 54, '女': 55, '期': 56, '平': 57, '房': 58, '名': 59, '三': 60, '-': 61, '会': 62, '地': 63, '场': 64, '全': 65, '小': 66, '现': 67, '有': 68, '分': 69, '后': 70, '称': 71, '组': 72, '为': 73, '下': 74, '盘': 75, '最': 76, '“': 7

........

737, '恫': 4738, '诣': 4739, '叁': 4740, '氮': 4741, '曳': 4742, '膑': 4743, '峦': 4744, '攫': 4745, '鹄': 4746, '啄': 4747, '憩': 4748, '鞑': 4749, '垠': 4750, '鹕': 4751, '鄞': 4752, '呸': 4753, 'Ｖ': 4754, '玷': 4755, '瘁': 4756, '蚱': 4757, '§': 4758, '霎': 4759, '': 4760, '': 4761}

（3）显示训练数据集

# 训练集索引是单词的索引
# 样本：
# 第一组数: 输入：32个单词序列的索引，文本新闻标题样本，转换成其索引，固定长度为32个单词，不足填充=》4760：PAD
# 第二个数：分类的类别
# 第三个数：有效字符的长度（不包括填充字符）

# 训练集输入数据的长度（包括填充字符）
print(len(train_data[0][0]))

#中华女子学院：本科层次仅1专业招男生	3
print(train_data[0])

#两天价网站背后重重迷雾：做个网站究竟要多少钱	4
print(train_data[1])

32
([14, 125, 55, 45, 35, 307, 4, 81, 161, 941, 258, 494, 2, 175, 48, 145, 97, 17, 4760, 4760, 4760, 4760, 4760, 4760, 4760, 4760, 4760, 4760, 4760, 4760, 4760, 4760], 3, 18)
([135, 80, 33, 54, 505, 1032, 70, 95, 95, 681, 2288, 4, 486, 179, 54, 505, 626, 1156, 180, 115, 421, 561, 4760, 4760, 4760, 4760, 4760, 4760, 4760, 4760, 4760, 4760], 4, 22)

（3）显示验证数据集

print(dev_data[0])
print(dev_data[1])

([173, 714, 3, 186, 1844, 889, 0, 2641, 80, 2061, 416, 478, 382, 5, 308, 15, 1264, 1344, 4760, 4760, 4760, 4760, 4760, 4760, 4760, 4760, 4760, 4760, 4760, 4760, 4760, 4760], 8, 18)
([28, 1, 12, 567, 1371, 31, 365, 899, 846, 1300, 1095, 256, 1311, 8, 72, 7, 9, 4760, 4760, 4760, 4760, 4760, 4760, 4760, 4760, 4760, 4760, 4760, 4760, 4760, 4760, 4760], 5, 17)

（4）显示测试数据集

print(test_data[0])
print(test_data[1])

([1393, 686, 1350, 656, 110, 232, 1138, 0, 1, 24, 12, 26, 216, 1533, 56, 123, 434, 270, 742, 65, 112, 236, 4760, 4760, 4760, 4760, 4760, 4760, 4760, 4760, 4760, 4760], 3, 22)
([14, 6, 11, 156, 36, 211, 5, 35, 3, 1, 2, 3, 12, 830, 324, 216, 626, 17, 334, 291, 461, 659, 334, 4760, 4760, 4760, 4760, 4760, 4760, 4760, 4760, 4760], 3, 23)

3.4 构建迭代器

（1）定义类或函数

# 迭代器类
class DatasetIterater(object):
    def __init__(self, batches, batch_size, device):
        self.batch_size = batch_size
        self.batches = batches
        self.n_batches = len(batches) // batch_size
        self.residue = False  # 记录batch数量是否为整数
        if len(batches) % self.n_batches != 0:
            self.residue = True
        self.index = 0
        self.device = device

    def _to_tensor(self, datas):
        x = torch.LongTensor([_[0] for _ in datas]).to(self.device)
        y = torch.LongTensor([_[1] for _ in datas]).to(self.device)

        # pad前的长度(超过pad_size的设为pad_size)
        seq_len = torch.LongTensor([_[2] for _ in datas]).to(self.device)
        return (x, seq_len), y

    # 迭代函数
    def __next__(self):
        if self.residue and self.index == self.n_batches:
            batches = self.batches[self.index * self.batch_size: len(self.batches)]
            self.index += 1
            batches = self._to_tensor(batches)
            return batches

        elif self.index > self.n_batches:
            self.index = 0
            raise StopIteration
        else:
            batches = self.batches[self.index * self.batch_size: (self.index + 1) * self.batch_size]
            self.index += 1
            batches = self._to_tensor(batches)
            return batches

    def __iter__(self):
        return self

    def __len__(self):
        if self.residue:
            return self.n_batches + 1
        else:
            return self.n_batches

# 构建迭代器的API
def build_iterator(dataset, config):
    iter = DatasetIterater(dataset, config.batch_size, config.device)
    return iter

（2）实例化

# 训练集loader
train_iter = build_iterator(train_data, config)

# 验证集loader
dev_iter = build_iterator(dev_data, config)

# 测试集loader
test_iter = build_iterator(test_data, config)

print(train_iter)

<__main__.DatasetIterater object at 0x0000022804DAFD30>

第4章构建模型：LSTM

4.1 定义模型类

class Model(nn.Module):
    def __init__(self, config):
        super(Model, self).__init__()
        # 词向量网络
        if config.embedding_pretrained is not None:
            # 使用不需要重新训练的、预训练好的词向量，加快训练速度、提升性能
            self.embedding = nn.Embedding.from_pretrained(config.embedding_pretrained, freeze=False)
        else:
            # 使用新定义的可训练的词词向量
            self.embedding = nn.Embedding(config.n_vocab, config.embed, padding_idx=config.n_vocab - 1)
        
        # LSTM网络
        # config.embed：词向量的输出长度=300，它是LSTM的输入
        # config.hidden_size：隐藏层输出特征的长度
        # config.num_layers：隐藏层的层数
        # bidirectional：双向网络
        # batch_first： [batch_size, seq_len, embeding]
        # dropout：随机丢弃
        self.lstm = nn.LSTM(config.embed, config.hidden_size, config.num_layers,
                            bidirectional=True, batch_first=True, dropout=config.dropout)
        
        # 全连接分类网络
        # 使用隐层当前时刻的输出作为全连接的输入。
        # config.hidden_size * 2：双向LSTM的输出是隐层特征输出的2倍
        self.fc = nn.Linear(config.hidden_size * 2, config.num_classes)

    def forward(self, x):
        x, _ = x
        out = self.embedding(x)  # [batch_size, seq_len, embeding]=[128, 32, 300]
        out, _ = self.lstm(out)
        out = self.fc(out[:, -1, :])  # 句子最后时刻的 hidden state
        return out

4.2 实例化模型并显示模型结构

# 构建模型
#设定随机种子，确保每次随机初始化的结果是一样的
np.random.seed(1)
torch.manual_seed(1)
torch.cuda.manual_seed_all(1)
torch.backends.cudnn.deterministic = True  # 保证每次结果一样

model_name = "TextRNN"

# 创建模型实例
model = Model(config).to(config.device)

#显示网络参数
for name, w in model.named_parameters():
    print(name)
    
print(model.parameters)

embedding.weight
lstm.weight_ih_l0
lstm.weight_hh_l0
lstm.bias_ih_l0
lstm.bias_hh_l0
lstm.weight_ih_l0_reverse
lstm.weight_hh_l0_reverse
lstm.bias_ih_l0_reverse
lstm.bias_hh_l0_reverse
lstm.weight_ih_l1
lstm.weight_hh_l1
lstm.bias_ih_l1
lstm.bias_hh_l1
lstm.weight_ih_l1_reverse
lstm.weight_hh_l1_reverse
lstm.bias_ih_l1_reverse
lstm.bias_hh_l1_reverse
fc.weight
fc.bias

4.3 初始化模型权重参数

# 权重初始化：不同的初始化方法，导致精确性和收敛时间不同
# 默认xavier
# xavier：“Xavier”初始化方法是一种很有效的神经网络初始化方法
# kaiming：何凯明初始化
# normal_: 正态分布初始化
def init_network(model, method='xavier', exclude='embedding', seed=123):
    for name, w in model.named_parameters():
        if exclude not in name:
            if 'weight' in name:
                if method == 'xavier':
                    nn.init.xavier_normal_(w)
                elif method == 'kaiming':
                    nn.init.kaiming_normal_(w)
                else:
                    nn.init.normal_(w)
            elif 'bias' in name:
                nn.init.constant_(w, 0)
            else:
                pass

#初始化网络
init_network(model)

第5章模型训练、评估

5.1 模型评估方法

# 模型评估方法
def evaluate(config, model, data_iter, test=False):
    # 设置在评估模式
    model.eval()
    loss_total = 0
    predict_all = np.array([], dtype=int)
    labels_all = np.array([], dtype=int)
    
    # 不进行梯度更新
    with torch.no_grad():
        # 数据集迭代
        for texts, labels in data_iter:
            
            # 模型预测输出
            outputs = model(texts)
            
            # 计算当前的loss
            loss = F.cross_entropy(outputs, labels)
            loss_total += loss
            
            # 计算当前的精度
            labels = labels.data.cpu().numpy()
            predic = torch.max(outputs.data, 1)[1].cpu().numpy()
            
            # 记录当前的label的数目
            labels_all = np.append(labels_all, labels)
            
            # 记录当前正确预测的数目
            predict_all = np.append(predict_all, predic)
    
    # 计算整个数据集上的平均精度
    acc = metrics.accuracy_score(labels_all, predict_all)
    
    if test:
        report = metrics.classification_report(labels_all, predict_all, target_names=config.class_list, digits=4)
        confusion = metrics.confusion_matrix(labels_all, predict_all)
        return acc, loss_total / len(data_iter), report, confusion
    
    # 返回整个数据集上的平均精度与平均loss
    return acc, loss_total / len(data_iter)

5.2 模型训练方法

# 训练方法
writer = SummaryWriter(log_dir=config.log_path + '/' + time.strftime('%m-%d_%H.%M', time.localtime()))

def train(config, model, train_iter, dev_iter, writer):
    start_time = time.time()
    
    # 设定在模式下
    model.train()
    
    #设定优化器
    optimizer = torch.optim.Adam(model.parameters(), lr=config.learning_rate)

    # 学习率指数衰减，每次epoch：学习率 = gamma * 学习率
    # scheduler = torch.optim.lr_scheduler.ExponentialLR(optimizer, gamma=0.9)
    total_batch = 0  # 记录进行到多少batch，一个训练集包含多个batch
    
    #记录当前最好的loss值
    dev_best_loss = float('inf')
    last_improve = 0  # 记录上次验证集loss下降的batch数
    flag = False  # 记录是否很久没有效果提升
    
    # 启动一个SummaryWriter对象，用于 记录训练过程
    writer = SummaryWriter(log_dir=config.log_path + '/' + time.strftime('%m-%d_%H.%M', time.localtime()))
    
    #开始训练
    for epoch in range(config.num_epochs):
        print('Epoch [{}/{}]'.format(epoch + 1, config.num_epochs))
        
        #自动调整学习率
        #scheduler.step() # 学习率衰减
        
        # 迭代数据集
        for i, (trains, labels) in enumerate(train_iter):
            #print (trains[0].shape)
            
            #获取模型输出
            outputs = model(trains)
            
            #复位模型梯度
            model.zero_grad()
            
            # 计算模型loss
            loss = F.cross_entropy(outputs, labels)
            
            # 根据loss计算梯度
            loss.backward()
            
            # 反向迭代，更新W参数
            optimizer.step()
            
            # 对迭代进行测试与评估
            # 每100次迭代输出，在训练集和验证集上的评估一次效果
            if total_batch % 100 == 0:
                # 获取训练集上的精度
                true = labels.data.cpu()
                predic = torch.max(outputs.data, 1)[1].cpu()
                train_acc = metrics.accuracy_score(true, predic)
                
                # 获取验证集上的精度
                dev_acc, dev_loss = evaluate(config, model, dev_iter, test=False)
                if dev_loss < dev_best_loss:
                    dev_best_loss = dev_loss
                    # 保存当前精度更高时候的模型
                    torch.save(model.state_dict(), config.save_path)
                    improve = '*'
                    
                    # 记录模型更新时的batch数
                    last_improve = total_batch
                else:
                    improve = ''
                
                # 打印log信息
                time_dif = get_time_dif(start_time)
                msg = 'Iter: {0:>6},  Train Loss: {1:>5.2},  Train Acc: {2:>6.2%},  Val Loss: {3:>5.2},  Val Acc: {4:>6.2%},  Time: {5} {6}'
                print(msg.format(total_batch, loss.item(), train_acc, dev_loss, dev_acc, time_dif, improve))
                writer.add_scalar("loss/train", loss.item(), total_batch)
                writer.add_scalar("loss/dev", dev_loss, total_batch)
                writer.add_scalar("acc/train", train_acc, total_batch)
                writer.add_scalar("acc/dev", dev_acc, total_batch)
                
                #重新进入训练模式
                model.train()
            
            # batch数++
            total_batch += 1
            
            # 如果连续迭代后，精度没有得到进一步的提升，当次数得到一定的设定值后，自动停止迭代。
            # total_batch：连续进行了多少次batch
            # last_improve：记录模型更新时的batch数
            # config.require_improvement
            if total_batch - last_improve > config.require_improvement:
                # 验证集loss超过1000batch 没下降，结束训练
                print("No optimization for a long time, auto-stopping...")
                print("total_batch=", total_batch)
                print("last_improve=", last_improve)
                print("require_improvement=", config.require_improvement)
                flag = True
                break
        if flag:
            break
    writer.close()

5.3 边训练、边评估模型

在训练集上训练，在验证集上评估

# 一边训练，一边评估
train(config, model, train_iter, dev_iter, writer)

Epoch [1/20]
Iter:      0,  Train Loss:   2.3,  Train Acc: 17.19%,  Val Loss:   2.3,  Val Acc: 10.00%,  Time: 0:00:01 *
Iter:    100,  Train Loss:   1.7,  Train Acc: 34.38%,  Val Loss:   1.8,  Val Acc: 28.56%,  Time: 0:00:02 *
Iter:    200,  Train Loss:   1.3,  Train Acc: 56.25%,  Val Loss:   1.4,  Val Acc: 46.30%,  Time: 0:00:03 *
Iter:    300,  Train Loss:   1.1,  Train Acc: 60.94%,  Val Loss:   1.1,  Val Acc: 61.21%,  Time: 0:00:04 *
.............................................................................
Iter:   5300,  Train Loss:   0.3,  Train Acc: 90.62%,  Val Loss:  0.34,  Val Acc: 88.94%,  Time: 0:01:04 
Iter:   5400,  Train Loss:  0.33,  Train Acc: 89.06%,  Val Loss:  0.32,  Val Acc: 89.61%,  Time: 0:01:05 
Iter:   5500,  Train Loss:  0.43,  Train Acc: 84.38%,  Val Loss:  0.34,  Val Acc: 89.69%,  Time: 0:01:07 
Iter:   5600,  Train Loss:  0.31,  Train Acc: 89.06%,  Val Loss:  0.32,  Val Acc: 89.91%,  Time: 0:01:08 
Epoch [3/20]
Iter:   5700,  Train Loss:  0.22,  Train Acc: 90.62%,  Val Loss:  0.33,  Val Acc: 89.70%,  Time: 0:01:09 
No optimization for a long time, auto-stopping...
total_batch= 5701
last_improve= 4700
require_improvement= 1000

第6章在测试集上对模型进行评估

6.1 测试方法的定义

# 在测试集上对模型进行评估
def test(config, model, test_iter):
    # test
    # 获取保存的最佳精度的模型
    model.load_state_dict(torch.load(config.save_path))
    
    # 进入评估模式
    model.eval()
    
    start_time = time.time()
    
    # 测试测试集进行评估
    test_acc, test_loss, test_report, test_confusion = evaluate(config, model, test_iter, test=True)
    
    # 打印测试集的评估结果
    # 测试集的loss和精度
    msg = 'Test Loss: {0:>5.2},  Test Acc: {1:>6.2%}'
    print(msg.format(test_loss, test_acc))
    
    # 打印准确率、召回率、F1-Score的分数
    print("Precision, Recall and F1-Score...")
    print(test_report)
    
    # 打印混淆矩阵
    print("Confusion Matrix...")
    print(test_confusion)
    
    
    time_dif = get_time_dif(start_time)
    print("Time usage:", time_dif)

备注：

至于模型的评分指标：Loss、accuracy、Precision, Recall and F1-Score，请参看相关文章。

6.2 开始测试

# 对训练好的模型进行测试
test(config, model, test_iter)

Test Loss:  0.31,  Test Acc: 89.73%
Precision, Recall and F1-Score...
               precision    recall  f1-score   support

      finance     0.9240    0.8630    0.8925      1000
       realty     0.8796    0.9280    0.9032      1000
       stocks     0.8547    0.8060    0.8296      1000
    education     0.9477    0.9420    0.9448      1000
      science     0.8188    0.8540    0.8360      1000
      society     0.8817    0.9020    0.8917      1000
     politics     0.8645    0.8680    0.8663      1000
       sports     0.9662    0.9730    0.9696      1000
         game     0.9351    0.9080    0.9214      1000
entertainment     0.9055    0.9290    0.9171      1000

     accuracy                         0.8973     10000
    macro avg     0.8978    0.8973    0.8972     10000
 weighted avg     0.8978    0.8973    0.8972     10000

Confusion Matrix...
[[863  24  65   2  18  11  10   2   2   3]
 [ 10 928  14   0  13  16   3   1   3  12]
 [ 38  44 806   1  54   2  41   2   9   3]
 [  0   4   2 942   8  14   9   0   3  18]
 [  4   8  26   8 854  22  25   1  32  20]
 [  3  21   2  18   2 902  31   2   3  16]
 [ 11  15  19  11  24  37 868   4   1  10]
 [  1   2   1   2   4   3   6 973   1   7]
 [  1   2   6   5  55   7   4   4 908   8]
 [  3   7   2   5  11   9   7  18   9 929]]
Time usage: 0:00:00

作者主页(文火冰糖的硅基工坊)：文火冰糖（王文兵）的博客_文火冰糖的硅基工坊_CSDN博客

本文网址：https://blog.csdn.net/HiWangWenBing/article/details/121800521

你可能感兴趣的:(人工智能-PyTorch,pytorch,lstm,rnn,新闻文本分类,代码详解)

简单工厂模式、工厂方法模式、抽象工厂模式对比学习笔记 idgoodbye 简单工厂模式工厂方法模式抽象工厂模式
工厂模式架构设计原则开闭原则：是指一个软件实体（如类、模块和函数）应该对扩展开放，对修改关闭。依赖倒置原则：是指设计代码结构时，高层模块不应该依赖低层模块，二者都应该依赖其抽象。抽象不应该依赖细节，细节应该依赖抽象。单一职责：是指一个类只负责一个主要任务，避免因一个类负责两个以上任务时，修改其中一个任务代码导致另一个任务代码受到连带影响。接口隔离原则：是指用多个专门的接口，而不使用单一的总接口，客
94.HarmonyOS NEXT动画系统实现教程：深入理解FuncUtils harmonyos-next
温馨提示：本篇博客的详细代码已发布到git:https://gitcode.com/nutpi/HarmonyosNext可以下载运行哦！HarmonyOSNEXT动画系统实现教程：深入理解FuncUtils1.动画系统基础1.1核心概念概念说明应用场景动画持续时间动画执行的时长控制动画速度动画曲线动画的变化规律定义动画效果动画回调动画执行的具体内容实现状态变化1.2动画执行函数解析exportf
97.HarmonyOS NEXT跑马灯组件教程：基础概念与架构设计 harmonyos-next
温馨提示：本篇博客的详细代码已发布到git:https://gitcode.com/nutpi/HarmonyosNext可以下载运行哦！HarmonyOSNEXT跑马灯组件教程：基础概念与架构设计1.跑马灯组件概述跑马灯（Marquee）是一种常见的UI组件，主要用于在有限的空间内展示超出显示区域的文本内容。当文本内容过长无法在固定宽度内完整显示时，跑马灯组件会使文本自动滚动，以便用户可以查看全
85.HarmonyOS NEXT 网络请求与数据处理：构建可靠的数据层 harmonyos-next
温馨提示：本篇博客的详细代码已发布到git:https://gitcode.com/nutpi/HarmonyosNext可以下载运行哦！HarmonyOSNEXT网络请求与数据处理：构建可靠的数据层1.网络请求基础1.1基本概念概念说明使用场景HTTP请求基本的网络通信API调用WebSocket双向实时通信即时消息数据序列化数据格式转换请求/响应处理1.2HTTP请求封装classHttpCl
82.HarmonyOS NEXT 性能优化指南：从理论到实践 harmonyos-next
温馨提示：本篇博客的详细代码已发布到git:https://gitcode.com/nutpi/HarmonyosNext可以下载运行哦！HarmonyOSNEXT性能优化指南：从理论到实践1.性能优化概述1.1性能指标指标类型关键指标目标值启动时间首屏渲染=[];privatepageSize:number=20;//2.使用虚拟列表build(){List(){LazyForEach(this
c#中将数据库数据导出到EXCEL中 lujunql 技术 excel 数据库 c#microsoft library string
我分以下几步进行介绍：1，新建一个C#应用程序，在对话框上放置一个按钮，Name=buttonOutput,Text=Output,用这个按钮激发导出程序；2，添加对“MicrosoftExcel9.0ObjectLibrary”的引用，根据自己计算机上安装Office版本的来确定Library的版本；3，在代码中加入引用：usingExcel;usingSystem.Reflection;4，在
解析 iframe bbppooi 测试学习 javascript selenium 测试用例功能测试模块测试
iframe（inlineframe，内联框架）是HTML标签，用于在一个网页内嵌入另一个网页。它通常用于：广告嵌入（如GoogleAds）视频播放器（如YouTube、Bilibili）第三方登录页面（如Google登录）在线支付（如支付宝、微信支付）嵌入iframe示例主页面在上面的代码中，iframe的src属性指向https://www.example.com，宽度800px
python 装饰器每天减 1/5kg python
装饰器装饰器本质上是一个返回函数的高阶函数，可以接收函数作为参数，并返回一个新的函数。它允许你在不修改原函数代码的情况下，动态地给函数或方法添加额外的功能在我们的日常使用中，装饰器一般用于：日志记录、权限认证、性能分析、缓存等场景。简单示例defmy_decorator(func):defwrapper(*args,**kwargs):print("Beforecallingthefunction
协程与事件循环每天减 1/5kg python
协程与事件循环协程协程是一种用户态的轻量级线程，允许在多个任务间高效的切换，而无需依赖操作系统的线程调度。特点协作式多任务：协程主动让出执行权(通过yield或await)，而非被操作系统调度(强制中断——抢占式)。状态保存：协程的状态保存在协程的栈中，协程切换时保存上下文(如局部变量、执行位置)，恢复时从中断处继续。性能提升：协程相比线程，在切换消耗上性能提升。缺点需要在代码中显式调用，且需要手
支持向量机 (SVM) 算法详解 sssugarr 机器学习算法详解 python svm 支持向量机算法 sklearn
支持向量机(SVM)算法详解支持向量机（SupportVectorMachine,SVM）是一种监督学习模型，广泛应用于分类和回归分析。SVM特别适合高维数据，并且在处理复杂非线性数据时表现出色。本文将详细讲解SVM的原理、数学公式、应用场景及其在Python中的实现。什么是支持向量机？支持向量机的目标是找到一个最佳的决策边界（或称超平面）来最大限度地分隔不同类别的数据点。对于线性可分的数据，SV
DeepSeek掘金——IDEA 接入 DeepSeek 写代码的效率翻倍不二人生大模型 DeepSeek掘金指南 intellij-idea 大模型 deepseek
IDEA接入DeepSeek写代码的效率翻倍给大家简单介绍一下如何在常用的IDE中接入DeepSeek，这里以Java开发最常用的IDEA为例。目前，IDEA中接入DeepSeek，可以借助CodeGPT和Continue这两个插件。CodeGPT目前用的人最多，稳定性有保障，Continue接入最简单。这两个插件对IDEA版本有要求，IDEA版本太低的话，无法使用。⚠️注意：由于一些特殊原因，目
java代码接入腾讯云上的deepseek 扣:2037218079 腾讯云云计算 ai
之前已经试过用java代码去调用deepseek官网的api接口了.不管是被攻击还是啥,反正速度不尽人意.正好昨晚看到腾讯云上已经部署了满血的deepseek和其他的大模型,今天写一篇用java去调用deepseek的demo.1:api文档和计费查看.知识引擎原子能力对话-API文档-文档中心-腾讯云上面是api文档的地址需要获取secretid和secretkey还有app_key.前两个是腾
Java实战：Spring Boot application.yml配置文件详解 web_13233421436 面试学习路线阿里巴巴 java spring boot 网络
本文将详细介绍SpringBootapplication.yml配置文件的使用和配置项。我们将探讨application.yml文件的基本概念，以及如何使用它来配置SpringBoot应用程序的各个方面。此外，我们将通过具体的示例来展示如何配置不同的SpringBoot组件，如数据源、数据库、缓存、邮件服务等。本文适合希望深入了解SpringBoot配置文件的开发者阅读。一、引言在SpringBo
【C语言--趣味游戏系列】--电脑关机整蛊小游戏 User_芊芊君子 C语言内容概括 c语言游戏电脑
前言：老铁们，还是那句话，学习很苦游戏来补，为了提高大家与朋友之间的友谊，博主在这里分享一个电脑关机的恶作剧小游戏，快拿去试试吧！！！目录：1.电脑关机代码2.详解1.电脑关机代码#define_CRT_SECURE_NO_WARNINGS#include#include#includeintmain(){charinput[20]={0};system("shutdown-s-t60");whi
MySQL EXPLAIN 详解 Jing_jing_X mysql 数据库
一、EXPLAIN是什么？EXPLAIN是MySQL提供的性能分析工具，用于查看SQL查询的执行计划（即优化器如何执行查询）。它通过模拟查询过程（不实际执行SQL）返回一个表格，展示索引使用、表连接方式、扫描行数等关键信息，帮助开发者诊断性能瓶颈并优化查询。核心作用：分析查询是否高效利用索引。识别全表扫描、临时表、文件排序等高开销操作。提供优化方向，如调整索引或重构SQL。二、为什么要用EXPLA
MongoDB集合（表）自动创建机制 zpjing~.~ mongodb 数据库
开发项目时，要整理上线涉及的表，MongoDB里新创建的表是不用整理发给运维的，因为代码中插入数据时，MongoDB会自动创建哦MongoDB中的集合（表）是在插入数据时自动创建的。当你第一次向一个不存在的集合插入文档时，MongoDB会自动创建该集合。你不需要像在关系型数据库中那样预先定义表结构。例如，执行以下操作时：db.myCollection.insertOne({name:"Alice"
【ASMbits--常用算术运算指令】中古传奇 ISA ASM
ASMbits--常用算术运算指令1基本运算算术指令--最基础1.1加法和减法1.2移位操作1.3乘法2practice2.1编写invert(intn)2.2编写judge_odd(intn)2.3计算绝对值abs(intn)2.4add(intn1,intn2)函数2.4shift寄存器2.5sihftathright2.6shiftleft在ARMv7汇编中，代码片段：1:b1b//Done
Flutter Dart 面向对象编程全面解析顾林海 Flutter系列教程 flutter 前端 android
引言在Flutter开发中，Dart作为其编程语言，采用了面向对象的编程范式。面向对象编程（OOP）将数据和操作数据的方法封装在一起，形成对象，以提高代码的可维护性、可扩展性和可重用性。本文将详细介绍Dart面向对象编程的核心概念，包括类、对象、继承、多态、抽象类和接口等，并结合代码示例进行说明。1.类和对象类是对象的蓝图，它定义了对象的属性和方法。对象是类的实例，通过类可以创建多个不同的对象。代
Python常用国内镜像源（清华、豆瓣、阿里云、中科大）老马达 #深度学习基础 python
使用Python最便捷的就是下载使用各种“包”，然而往往长时间不用就容易忘记，在这里将网上一些资源收集整理，一是方便自己日后使用，二是与诸君共享。一、代码清华大学开源软件镜像站：https://pypi.tuna.tsinghua.edu.cn/simple阿里云开源镜像站：https://mirrors.aliyun.com/pypi/simple/豆瓣：https://pypi.douban.
python调用数据库存储过程_python连接mysql调用存储过程示例 weixin_39806948 python调用数据库存储过程
复制代码代码如下:#!/usr/bin/envpython#-*-coding:utf8-*-importMySQLdbimporttimeimportos,sys,stringdefCallProc(id,onlinetime):'''调用存储过程，输入参数：编号，在线时间，输出：帐号，密码;使用输出参数方式'''accname=''accpwd=''conn=MySQLdb.connect(h
PyTorch从入门到精通：探索深度学习新境界 lmtealily 深度学习 pytorch 人工智能
引言PyTorch作为当前最受欢迎的深度学习框架之一，凭借其动态计算图的独特设计和与Python生态的无缝集成，正重塑着人工智能开发的新范式1。从NVIDIA的研究实践到Meta的产业应用，PyTorch的价值已渗透至学术研究、工业部署的每个角落。本文将带领您从张量操作基础开始，逐步探索GPU加速、动态图机制、框架生态集成等高级主题，最终实现理论与实战的双重突破。一、PyTorch核心基础构建1.
如何使用pymysql库向数据库表中插入数据？爬虫数据虫巢 python编程从入门到实践数据库 oracle
使用pymysql库向数据库表中插入数据，需要在连接数据库之后，构造合适的SQL插入语句并执行。以下是一个详细的示例：首先确保已经安装了pymysql库，如果没有安装，可以使用pipinstallpymysql进行安装。连接数据库并插入数据的示例代码如下：importpymysql#连接数据库conn=pymysql.connect(host='localhost',user='your_user
RSA加密算法详解：从基础原理到实际应用冬停算法
RSA加密算法详解：从基础原理到实际应用在现代信息安全领域，RSA加密算法因其坚实的数学基础和广泛的应用而备受关注。本文将全面介绍RSA算法的原理、密钥生成、加密解密过程以及数字签名的实现，并通过Python示例代码帮助您深入理解和掌握RSA的实际应用。目录什么是RSA？RSA的基本原理RSA密钥生成RSA加密与解密RSA签名与验证RSA的安全性Python实现RSA7.1RSA密钥生成示例7.2
JAVA 提取四则运算表达式的运算符和数字 qq_22556699 java 开发语言
代码：StringregEx="([0-9]\\d*\\.?\\d+)|(0\\.\\d*[0-9])|(\\d+)|([\\+\\-\\*\\/\$\$])"Patternpattern=Pattern.compile(regEx);Matchermatcher=pattern.matcher(text);while(matcher.find()){Log.e("number",matche
【Python】已解决：pip安装第三方模块（库）与PyCharm中不同步的问题（PyCharm添加本地python解释器）屿小夏 python pip pycharm
个人简介：某不知名博主，致力于全栈领域的优质博客分享|用最优质的内容带来最舒适的阅读体验！文末获取免费IT学习资料！文末获取更多信息精彩专栏推荐订阅收藏专栏系列直达链接相关介绍书籍分享点我跳转书籍作为获取知识的重要途径，对于IT从业者来说更是不可或缺的资源。不定期更新IT图书，并在评论区抽取随机粉丝，书籍免费包邮到家AI前沿点我跳转探讨人工智能技术领域的最新发展和创新，涵盖机器学习、深度学习、自然
《Python 环境配置指南：pip 安装与常用命令大全（附代码示例）》细水长流者环境 python pip chrome
《Python环境配置指南：pip安装与常用命令大全（附代码示例）》目录1.前言2.什么是pip？3.检查pip是否安装4.安装pip5.常用pip命令1)安装包2)升级包3)卸载包4)查看已安装的包5)导出与安装依赖6.配置国内镜像源7.虚拟环境管理8.总结9.参考文档1.前言在Python开发中，pip是管理第三方库的必备工具。无论是安装、升级还是卸载包，pip都能轻松搞定。本文将详细介绍pi
本地部署大模型QPS推理测试内卷焦虑人士 QPS 本地部署大模型测试 RAG
目录1、测试环境1.1、显卡1.2、模型1.3、部署环境1.3.1、docker1.3.2、执行命令2、测试问题2.1、20字左右问题2.2、50字左右问题2.3、100字左右问题3、测试代码3.1、通用测试代码3.2、通用测试代码（仅供参考）4、测试结果4.1、通用测试结果4.2、RAG测试结果1、测试环境1.1、显卡1.2、模型Qwen2.5-32B-Instruct1.3、部署环境xinfe
【Vue3+Vite指南】全局引入SCSS文件后出现Undefined mixin？一招解决命名空间陷阱！积水成江前端 scss 前端 html5 vue.js
【Vue3+Vite全局引入SCSS指南】解决Undefinedmixin错误的完整方案本文目录前置准备：安装SCSS环境问题现象与错误分析根本原因：Sass模块化的命名空间三大解决方案详解方案1:显式命名空间调用方案2:全局暴露命名空间方案3:主文件聚合导出操作验证步骤扩展：@use与@import对比最佳实践与避坑指南常见问题FAQ️前置准备：安装SCSS环境{#-前置准备}步骤1：安装Sas
如何测试模型的推理速度想要躺平的一枚 AI图像算法计算机视觉
前言模型的推理速度测试有两种方式：一种是使用python的时间戳time函数来记录，另一种是使用Pytorch里的Event。同时，在进行GPU测试时，为减少冷启动的状态影响，可以先进行预热。代码如下（示例）：if__name__=="__main__":model=BiSeNet(backbone='STDCNet813',n_classes=2,export=True)model.cuda()
Python tkinter设置背景颜色乙龙 python 开发语言
在Python的tkinter库中，设置组件的背景颜色通常使用bg选项，通过config方法来实现。以下是一些设置背景颜色的基本示例：设置单个组件的背景颜色：widget.config(bg='color')其中widget是tkinter组件的实例，color可以是颜色名称（如'red','blue'等）或者十六进制颜色代码（如'#FF5733'）。创建窗口并设置背景颜色：importtkint
Enum 枚举 120153216 enum 枚举
原文地址：http://www.cnblogs.com/Kavlez/p/4268601.html Enumeration 于Java 1.5增加的enum type...enum type是由一组固定的常量组成的类型，比如四个季节、扑克花色。在出现enum type之前，通常用一组int常量表示枚举类型。比如这样： public static final int APPLE_FUJI = 0
Java8简明教程 bijian1013 java jdk1.8
Java 8已于2014年3月18日正式发布了，新版本带来了诸多改进，包括Lambda表达式、Streams、日期时间API等等。本文就带你领略Java 8的全新特性。一.允许在接口中有默认方法实现 Java 8 允许我们使用default关键字，为接口声明添
Oracle表维护快速备份删除数据 cuisuqiang oracle 索引快速备份删除
我知道oracle表分区，不过那是数据库设计阶段的事情，目前是远水解不了近渴。当前的数据库表，要求保留一个月数据，且表存在大量录入更新，不存在程序删除。为了解决频繁查询和更新的瓶颈，我在oracle内根据需要创建了索引。但是随着数据量的增加，一个半月数据就要超千万，此时就算有索引，对高并发的查询和更新来说，让然有所拖累。为了解决这个问题，我一般一个月会进行一次数据库维护，主要工作就是备
java多态内存分析麦田的设计者 java 内存分析多态原理接口和抽象类
“ 时针如果可以回头，熟悉那张脸，重温嬉戏这乐园，墙壁的松脱涂鸦已经褪色才明白存在的价值归于记忆。街角小店尚存在吗？这大时代会不会牵挂，过去现在花开怎么会等待。但有种意外不管痛不痛都有伤害，光阴远远离开，那笑声徘徊与脑海。但这一秒可笑不再可爱，当天心
Xshell实现Windows上传文件到Linux主机被触发 windows
经常有这样的需求，我们在Windows下载的软件包，如何上传到远程Linux主机上？还有如何从Linux主机下载软件包到Windows下；之前我的做法现在看来好笨好繁琐，不过也达到了目的，笨人有本方法嘛；我是怎么操作的： 1、打开一台本地Linux虚拟机，使用mount 挂载Windows的共享文件夹到Linux上，然后拷贝数据到Linux虚拟机里面；（经常第一步都不顺利，无法挂载Windo
类的加载ClassLoader 肆无忌惮_ ClassLoader
类加载器ClassLoader是用来将java的类加载到虚拟机中，类加载器负责读取class字节文件到内存中，并将它转为Class的对象（类对象），通过此实例的 newInstance()方法就可以创建出该类的一个对象。其中重要的方法为findClass(String name)。如何写一个自己的类加载器呢？首先写一个便于测试的类Student
html5写的玫瑰花知了ing html5
<html> <head> <title>I Love You!</title> <meta charset="utf-8" /> </head> <body> <canvas id="c"></canvas>
google的ConcurrentLinkedHashmap源代码解析矮蛋蛋 LRU
原文地址： http://janeky.iteye.com/blog/1534352 简述 ConcurrentLinkedHashMap 是google团队提供的一个容器。它有什么用呢？其实它本身是对 ConcurrentHashMap的封装，可以用来实现一个基于LRU策略的缓存。详细介绍可以参见 http://code.google.com/p/concurrentlinke
webservice获取访问服务的ip地址 alleni123 webservice
1. 首先注入javax.xml.ws.WebServiceContext, @Resource private WebServiceContext context; 2. 在方法中获取交换请求的对象。 javax.xml.ws.handler.MessageContext mc=context.getMessageContext(); com.sun.net.http
菜鸟的java基础提升之道——————>是否值得拥有百合不是茶
1，c++，java是面向对象编程的语言，将万事万物都看成是对象；java做一件事情关注的是人物，java是c++继承过来的，java没有直接更改地址的权限但是可以通过引用来传值操作地址，java也没有c++中繁琐的操作，java以其优越的可移植型，平台的安全型，高效性赢得了广泛的认同，全世界越来越多的人去学习java，我也是其中的一员 java组成：
通过修改Linux服务自动启动指定应用程序 bijian1013 linux
Linux中修改系统服务的命令是chkconfig (check config)，命令的详细解释如下: chkconfig 功能说明：检查，设置系统的各种服务。语　　法：chkconfig [ -- add][ -- del][ -- list][系统服务] 或 chkconfig [ -- level <</SPAN>
spring拦截器的一个简单实例 bijian1013 java spring 拦截器 Interceptor
Purview接口 package aop; public interface Purview { void checkLogin(); } Purview接口的实现类PurviesImpl.java package aop; public class PurviewImpl implements Purview { public void check
[Velocity二]自定义Velocity指令 bit1129 velocity
什么是Velocity指令在Velocity中，#set,#if, #foreach, #elseif, #parse等，以#开头的称之为指令，Velocity内置的这些指令可以用来做赋值，条件判断，循环控制等脚本语言必备的逻辑控制等语句，Velocity的指令是可扩展的，即用户可以根据实际的需要自定义Velocity指令自定义指令(Directive)的一般步骤 &nbs
【Hive十】Programming Hive学习笔记 bit1129 programming
第二章 Getting Started 1.Hive最大的局限性是什么？一是不支持行级别的增删改(insert, delete, update)二是查询性能非常差(基于Hadoop MapReduce）,不适合延迟小的交互式任务三是不支持事务2. Hive MetaStore是干什么的？Hive persists table schemas and other system metadata.
nginx有选择性进行限制 ronin47 nginx 动静　限制
http { limit_conn_zone $binary_remote_addr zone=addr:10m; limit_req_zone $binary_remote_addr zone=one:10m rate=5r/s;... server {... location ~.*\.(gif|png|css|js|icon)$ {
java-4.-在二元树中找出和为某一值的所有路径 . bylijinnan java
/* * 0.use a TwoWayLinkedList to store the path.when the node can't be path,you should/can delete it. * 1.curSum==exceptedSum:if the lastNode is TreeNode,printPath();delete the node otherwise
Netty学习笔记 bylijinnan java netty
本文是阅读以下两篇文章时： http://seeallhearall.blogspot.com/2012/05/netty-tutorial-part-1-introduction-to.html http://seeallhearall.blogspot.com/2012/06/netty-tutorial-part-15-on-channel.html 我的一些笔记 ===
js获取项目路径 cngolon js
//js获取项目根路径，如： http://localhost:8083/uimcardprj function getRootPath(){ //获取当前网址，如： http://localhost:8083/uimcardprj/share/meun.jsp var curWwwPath=window.document.locati
oracle 的性能优化 cuishikuan oracle SQL Server
在网上搜索了一些Oracle性能优化的文章，为了更加深层次的巩固[边写边记]，也为了可以随时查看，所以发表这篇文章。 1.ORACLE采用自下而上的顺序解析WHERE子句，根据这个原理，表之间的连接必须写在其他WHERE条件之前，那些可以过滤掉最大数量记录的条件必须写在WHERE子句的末尾。（这点本人曾经做过实例验证过，的确如此哦！
Shell变量和数组使用详解 daizj linux shell 变量数组
Shell 变量定义变量时，变量名不加美元符号（$，PHP语言中变量需要），如： your_name="w3cschool.cc" 注意，变量名和等号之间不能有空格，这可能和你熟悉的所有编程语言都不一样。同时，变量名的命名须遵循如下规则：首个字符必须为字母（a-z，A-Z）。中间不能有空格，可以使用下划线（_）。不能使用标点符号。不能使用ba
编程中的一些概念，KISS、DRY、MVC、OOP、REST dcj3sjt126com REST
KISS、DRY、MVC、OOP、REST （1）KISS是指Keep It Simple,Stupid（摘自wikipedia），指设计时要坚持简约原则，避免不必要的复杂化。（2）DRY是指Don't Repeat Yourself（摘自wikipedia），特指在程序设计以及计算中避免重复代码，因为这样会降低灵活性、简洁性，并且可能导致代码之间的矛盾。（3）OOP 即Object-Orie
[Android]设置Activity为全屏显示的两种方法 dcj3sjt126com Activity
1. 方法1：AndroidManifest.xml 里，Activity的 android:theme 指定为" @android:style/Theme.NoTitleBar.Fullscreen" 示例: <application
solrcloud 部署方式比较 eksliang solrCloud
solrcloud 的部署其实有两种方式可选，那么我们在实践开发中应该怎样选择呢？第一种：当启动solr服务器时，内嵌的启动一个Zookeeper服务器，然后将这些内嵌的Zookeeper服务器组成一个集群。第二种：将Zookeeper服务器独立的配置一个集群，然后将solr交给Zookeeper进行管理谈谈第一种：每启动一个solr服务器就内嵌的启动一个Zoo
Java synchronized关键字详解 gqdy365 synchronized
转载自：http://www.cnblogs.com/mengdd/archive/2013/02/16/2913806.html 多线程的同步机制对资源进行加锁，使得在同一个时间，只有一个线程可以进行操作，同步用以解决多个线程同时访问时可能出现的问题。同步机制可以使用synchronized关键字实现。当synchronized关键字修饰一个方法的时候，该方法叫做同步方法。当s
js实现登录时记住用户名 hw1287789687 记住我记住密码 cookie 记住用户名记住账号
在页面中如何获取cookie值呢? 如果是JSP的话,可以通过servlet的对象request 获取cookie,可以参考:http://hw1287789687.iteye.com/blog/2050040 如果要求登录页面是html呢?html页面中如何获取cookie呢? 直接上代码了页面:loginInput.html 代码: <!DOCTYPE html PUB
开发者必备的 Chrome 扩展 justjavac chrome
Firebug：不用多介绍了吧https://chrome.google.com/webstore/detail/bmagokdooijbeehmkpknfglimnifench ChromeSnifferPlus：Chrome 探测器，可以探测正在使用的开源软件或者 js 类库https://chrome.google.com/webstore/detail/chrome-sniffer-pl
算法机试题李亚飞 java 算法机试题
在面试机试时，遇到一个算法题，当时没能写出来，最后是同学帮忙解决的。这道题大致意思是：输入一个数，比如4,。这时会输出： &n
正确配置Linux系统ulimit值字符串 ulimit
在Linux下面部署应用的时候，有时候会遇上Socket/File: Can’t open so many files的问题；这个值也会影响服务器的最大并发数，其实Linux是有文件句柄限制的，而且Linux默认不是很高，一般都是1024，生产服务器用其实很容易就达到这个数量。下面说的是，如何通过正解配置来改正这个系统默认值。因为这个问题是我配置Nginx+php5时遇到了，所以我将这篇归纳进
hibernate调用返回游标的存储过程 Supanccy2013 java DAO oracle Hibernate jdbc
注：原创作品，转载请注明出处。上篇博文介绍的是hibernate调用返回单值的存储过程，本片博文说的是hibernate调用返回游标的存储过程。此此扁博文的存储过程的功能相当于是jdbc调用select 的作用。 1，创建oracle中的包，并在该包中创建的游标类型。 ---创建oracle的程
Spring 4.2新特性-更简单的Application Event wiselyman application
1.1 Application Event Spring 4.1的写法请参考10点睛Spring4.1-Application Event 请对比10点睛Spring4.1-Application Event 使用一个@EventListener取代了实现ApplicationListener接口,使耦合度降低; 1.2 示例包依赖 <p

[Pytorch系列-60]：循环神经网络 - 中文新闻文本分类详解-2-LSTM网络训练与评估代码详解

第1章 预备知识

1.1 业务概述

1.2 LSTM网络

第2章 代码准备 (Jupter）

2.1 代码与数据集下载

2.2 导入库

2.3 系统配置

第3章 构建数据集

3.1 构建单词表API

3.2 定义构建数据集API

3.3 构建三大数据集

3.4 构建迭代器

第4章 构建模型：LSTM

4.1 定义模型类

4.2 实例化模型并显示模型结构

4.3 初始化模型权重参数

第5章 模型训练、评估

5.1 模型评估方法

5.2 模型训练方法

5.3 边训练、边评估模型

第6章 在测试集上对模型进行评估

6.1 测试方法的定义

6.2 开始测试

你可能感兴趣的:(人工智能-PyTorch,pytorch,lstm,rnn,新闻文本分类,代码详解)

第1章预备知识

第2章代码准备 (Jupter）

第3章构建数据集

第4章构建模型：LSTM

第5章模型训练、评估

第6章在测试集上对模型进行评估