幼稚的人呐

PyTorch实战 | 文本情感分类任务 | LSTM与LSTM+Attention | TextCNN

文章目录

- 一、数据介绍
- 二、模型介绍
- - 1.双向LSTM
  - 2.LSTM+Attention
  - 3.TextCNN
- 三、文本情感分类任务实现
- - 1.数据预处理
  - 2.数据读入
  - 3.模型搭建
  - 4.模型训练、验证与测试

一、数据介绍

实验数据集采用已分词与标注的影评文本，文本标签分为两类：0表示正面评价、1表示负面评价。数据集概况如下：

训练集含19998条评价（正面、负面评价各占一半）；
测试集含369条评价（正面评价：182，负面评价：187）；
验证集含5629条评价（正面评价：2817，负面评价：2812）
预训练词向量：中文维基百科词向量wiki_word2vec_50.bin

如果未分词，第一步应该对影评文本进行分词

二、模型介绍

1.双向LSTM

双向LSTM可以理解为同时训练两个LSTM，两个LSTM的方向、参数都不同。当前时刻的 $h_t$ 就是将两个方向不同的LSTM得到的两个 $h_t$ 向量拼接到一起。我们使用双向LSTM捕捉到当前时刻 $t$ 的过去和未来的特征,通过反向传播来训练双向LSTM网络。

模型搭建核心点：
由于该任务是情感分类任务，因此，只需要对整个句子的信息进行分类，所以，这里拼接的是整个句子的信息-正向LSTM与负向LSTM的最深的隐藏层的结果。

单向LSTM与双向LSTM的输出结果差别：

由于双向LSTM当前时刻的 $h_t$ 就是将两个方向不同的LSTM得到的两个 $h_t$ 向量拼接到一起。因此，在维度方面，正向LSTM的最深的隐藏层 $h_t$ 的维度为[2,batch,hidden_size]，负向LSTM的最深的隐藏层 $h_0$ 的维度为[2,batch,hidden_size]，两者再拼接的话，维度就是[4,batch,hidden_size]

模型搭建代码为：

import torch
import torch.nn as nn
import torch.nn.functional as F

class LSTMModel(nn.Module):
    def __init__(
                self,
                input_size,
                hidden_size,
                num_layers,
                dropout,
                bidirectional,
                batch_first,
                classes,
                pretrained_weight,
                update_w2v
                ):
        """
        :param input_size: 输入x的特征数,即embedding的size
        :param hidden_size:隐藏层的大小
        :param num_layers:LSTM的层数，可形成多层的堆叠LSTM
        :param dropout: 如果非0，则在除最后一层外的每个LSTM层的输出上引入Dropout层，Dropout概率等于dropout
        :param classes:类别数
        :param batch_first:控制输入与输出的形状，如果为True，则输入和输出张量被提供为(batch, seq, feature)
        :param bidirectional:如果为True，则为双向LSTM
        :param pretrained_weight:预训练的词向量
        :param update_w2v:控制是否更新词向量
        :return:
        """
        super(LSTMModel, self).__init__()
        # embedding:向量层，将单词索引转为单词向量
        self.embedding = nn.Embedding.from_pretrained(pretrained_weight)
        self.embedding.weight.requires_grad = True

        # encoder层
        self.encoder = nn.LSTM(
            input_size=input_size,
            hidden_size=hidden_size,
            num_layers=num_layers,
            batch_first=batch_first,
            dropout=dropout,
            bidirectional=bidirectional
        )

        # decoder层
        if bidirectional:
            self.decoder1 = nn.Linear(hidden_size * 4, hidden_size)
            self.decoder2 = nn.Linear(hidden_size, classes)
        else:
            self.decoder1 = nn.Linear(hidden_size * 2, hidden_size)
            self.decoder2 = nn.Linear(hidden_size, classes)

    def forward(self, x):
        """
        前向传播
        :param x：输入
        :return:
        """
        # embedding层
        # x.shape=(batch,seq_len);embedding.shape=(num_embeddings, embedding_dim) => emb.shape=(batch,seq_len,embedding_dim)
        emb = self.embedding(x)

        # encoder层
        state, hidden = self.encoder(emb)
        # states: (batch,seq_len, D*hidden_size), D=2 if bidirectional = True else 1, =>[64,75,256]
        # hidden: (h_n, c_n) => h_n / c_n shape:(D∗num_layers, batch, hidden_size) =>[4,64,128]

        # 这里看似拼接输出层结果，实则拼接正向与负向LSTM的隐藏层结果
        encoding = torch.cat([state[:, 0, :], state[:, -1, :]], dim=1)
        # decoder层
        # encoding shape: (batch, 2*D*hidden_size): [64,512]
        outputs = self.decoder1(encoding)
        outputs = self.decoder2(outputs)  # outputs shape:(batch, n_class) => [64,2]
        return outputs

2.LSTM+Attention

如果是静态Attention，其网络结构如下：

$h_t$ 是每一个词的hidden state，而 $\overline{h_s}$ 向量，开始是随机生成的，后面经过反向传播可以得到 $\frac{\partial{Loss}}{\partial{\overline{h_s}}}$ ，通过梯度不断迭代更新。
该分类任务中，注意力得分计算公式为：
$score(h_t,\overline{h_s})=v_{a}^{T}tanh(W_a[h_t;\overline{h_s}])$

score是标量。每句话进行拼接，然后做softmax得到概率，然后对hidden state进行加权平均，得到总向量，然后经过一个分类层，经softmax得到每一个类别的得分。

这里的注意力机制，就是通过训练给予重要的词一个大的权重，给予不重要的词一个小的权重。

模型搭建代码为：

class LSTM_attention(nn.Module):
    def __init__(self,
                 input_size,
                 hidden_size,
                 num_layers,
                 dropout,
                 bidirectional,
                 batch_first,
                 classes,
                 pretrained_weight,
                 update_w2v,
                 ):
        """
        :param input_size: 输入x的特征数,即embedding的size
        :param hidden_size:隐藏层的大小
        :param num_layers:LSTM的层数，可形成多层的堆叠LSTM
        :param dropout: 如果非0，则在除最后一层外的每个LSTM层的输出上引入Dropout层，Dropout概率等于dropout
        :param classes:类别数
        :param batch_first:控制输入与输出的形状，如果为True，则输入和输出张量被提供为(batch, seq, feature)
        :param bidirectional:如果为True，则为双向LSTM
        :param pretrained_weight:预训练的词向量
        :param update_w2v:控制是否更新词向量
        :return:
        """
        super(LSTM_attention, self).__init__()
        # embedding:向量层，将单词索引转为单词向量
        self.embedding = nn.Embedding.from_pretrained(pretrained_weight)
        self.embedding.weight.requires_grad = True

        # encoder层
        self.encoder = nn.LSTM(
            input_size=input_size,
            hidden_size=hidden_size,
            num_layers=num_layers,
            batch_first=batch_first,
            dropout=dropout,
            bidirectional=bidirectional
        )

        # nn.Parameter:使用这个函数的目的也是想让某些变量在学习的过程中不断的修改其值以达到最优化。
        self.weight_W = nn.Parameter(torch.Tensor(2 * hidden_size, 2 * hidden_size))
        self.weight_proj = nn.Parameter(torch.Tensor(2 * hidden_size, 1))
        # 向量初始化
        nn.init.uniform_(self.weight_W, -0.1, 0.1)
        nn.init.uniform_(self.weight_proj, -0.1, 0.1)

        # decoder层
        if bidirectional:
            self.decoder1 = nn.Linear(hidden_size * 2, hidden_size)
            self.decoder2 = nn.Linear(hidden_size, classes)
        else:
            self.decoder1 = nn.Linear(hidden_size, hidden_size)
            self.decoder2 = nn.Linear(hidden_size, classes)

    def forward(self, x):
        """
        前向传播
        :param x：输入
        :return:
        """
        # embedding层
        # x.shape=(batch,seq_len);embedding.shape=(num_embeddings, embedding_dim) => emb.shape=(batch,seq_len,embedding_dim)
        emb = self.embedding(x)

        # encoder层
        state, hidden = self.encoder(emb)
        # states: (batch,seq_len, D*hidden_size), D=2 if bidirectional = True else 1, =>[64,75,256]
        # hidden: (h_n, c_n) => h_n / c_n shape:(D∗num_layers, batch, hidden_size) =>[4,64,128]

        # attention:self.weight_proj * tanh(self.weight_W * state)
        # (batch,seq_len, 2*hidden_size) => (batch,seq_len, 2*hidden_size)
        u = torch.tanh(torch.matmul(state, self.weight_W))
        # (batch,seq_len, 2*hidden_size) => (batch,seq_len,1)
        att = torch.matmul(u, self.weight_proj)
        att_score = F.softmax(att, dim=1)
        scored_x = state * att_score

        encoding = torch.sum(scored_x, dim=1)
        # decoder层
        # encoding shape: (batch, D*hidden_size): [64,256]
        outputs = self.decoder1(encoding)
        outputs = self.decoder2(outputs)  # outputs shape:(batch, n_class) => [64,2]
        return outputs

3.TextCNN

论文中的模型结构为：

图中的卷积核提取的是相邻两个单词向量（Two-gram），我们可以提取不同的窗口大小的特征，即利用不同的卷积核。如下图，卷积核分别提取了2-gram、3-gram、4-gram的信息。

TextCNN模型的核心在于以不同尺寸的卷积核来提取词向量分别得到输出，将不同的输出结果分别经池化层后进行拼接，得到总的输出，再经全连接层进行分类。
其模型搭建代码为：

class TextCNNModel(nn.Module):
    def __init__(self,
                 num_filters,
                 kernel_sizes,
                 embedding_dim,
                 dropout,
                 classes,
                 pretrained_weight,
                 update_w2v):
        """
        搭建TextCNN模型
        :param num_filters: 输出通道数
        :param kernel_sizes: 多个卷积核的高[2,3,4]
        :param embedding_dim: 卷积核的宽
        :param dropout: 遗失率
        :param classes: 类别数
        :param pretrained_weight: 权重
        :param update_w2v: 是否更新w2v
        """
        super(TextCNNModel, self).__init__()
        # embedding层：加载预训练词向量
        self.embedding = nn.Embedding.from_pretrained(pretrained_weight)
        self.embedding.weight.data.requires_grad = update_w2v

        # 多个卷积层，2-gram；3-gram；4-gram...
        self.convs = nn.ModuleList([nn.Conv2d(1, num_filters, (K, embedding_dim)) for K in kernel_sizes])  ## 卷积层
        # drouopt层
        self.dropout = nn.Dropout(dropout)
        # 全连接层
        self.fc = nn.Linear(len(kernel_sizes) * num_filters, classes)  ##全连接层

    def forward(self, x):
        """
        前向传播
        :param x: 输入
        :return:
        """
        # # (batch,seq_len) => (batch,seq_len,emb_size)
        x = self.embedding(x)
        # (batch,seq_len,emb_size) => (batch,1,seq_len,emb_size)
        x = x.unsqueeze(1)
        # (batch,1,seq_len,emb_size) => (batch,num_filters,seq_len - kernel_size + 1)
        x = [F.relu(conv(x)).squeeze(3) for conv in self.convs]
        # (batch,num_filters,seq_len - kernel_size + 1) => (batch,num_filters)
        x = [F.max_pool1d(line, line.size(2)).squeeze(2) for line in x]
        # [(batch,num_filters)*len(kernel_sizes)] => (batch,len(kernel_sizes) * num_filters)
        x = torch.cat(x, 1)
        x = self.dropout(x)
        # (batch,len(kernel_sizes) * num_filters) => (batch,classes)
        logit = self.fc(x)
        return logit

三、文本情感分类任务实现

一个深度学习任务的实现，一般需要如下几个模块：

数据预处理
数据读入
模型搭建
训练、验证与测试

#!usr/bin/env python
# -*- coding:utf-8 -*-
"""
@author: liujie
@file: Config.py
@time: 2022/08/29
@desc:参数统一配置
"""


class MyConfig:
    num_filters = 6  # CNN的输出通道数
    kernel_sizes = [2, 3, 4]
    update_w2v = True  # 是否在训练中更新w2v
    n_class = 2  # 分类数：分别为pos和neg
    max_sen_len = 75  # 句子最大长度
    embedding_dim = 50  # 词向量维度
    batch_size = 64  # 批处理尺寸
    hidden_dim = 128  # 隐藏层节点数
    n_epoch = 50  # 训练迭代周期，即遍历整个训练样本的次数
    lr = 0.0001  # 学习率；若opt=‘adadelta'，则不需要定义学习率
    drop_keep_prob = 0.2  # dropout层，参数keep的比例
    num_layers = 2  # LSTM层数
    seed = 2022
    batch_first = True
    bidirectional = True  # 是否使用双向LSTM
    model_dir = "./model"
    stopword_path = "./data/stopword.txt"
    train_path = "./data/train.txt"
    val_path = "./data/validation.txt"
    test_path = "./data/test.txt"
    pre_path = "./data/pre.txt"
    word2id_path = "./word2vec/word2id.txt"
    pre_word2vec_path = "./word2vec/wiki_word2vec_50.bin"
    corpus_word2vec_path = "./word2vec/word_vec.txt"
    model_state_dict_path = "./model/sen_model.pkl"
    best_model_path = "./model/sen_model_best.pkl"

1.数据预处理

数据预处理流程如下：

加载训练、验证、测试数据集与停用词表
建立word2index与index2word映射字典
利用预训练word2vec向量来构建字典集对应的word2vec向量，向量的行数代表单词的索引
文本转为索引数字模式-将原始文本（包括标签和文本）里的每个词转为word2id对应的索引数字，并以数组返回

其代码dataProcess.py为：

#!usr/bin/env python
# -*- coding:utf-8 -*-
"""
@author: liujie
@file: dataProcess.py
@time: 2022/08/29
@desc:
    数据预处理流程：
        1.加载训练、验证、测试数据集与停用词表
        2.建立word2index与index2word映射字典
        3.利用预训练word2vec向量来构建字典集对应的word2vec向量，向量的行数代表单词的索引
        4.文本转为索引数字模式-将原始文本（包括标签和文本）里的每个词转为word2id对应的索引数字，并以数组返回
"""
import re
import codecs
import gensim
import numpy as np
from Config import MyConfig


class Dataprocess:
    def __init__(self):
        self.stopWords = self.stopWordList_Load(MyConfig.stopword_path)
        self.word2id = self.bulid_word2index(MyConfig.word2id_path)  # 建立word2id
        self.id2word = self.bulid_index2word(self.word2id)  # 建立id2word
        self.w2vec = self.bulid_word2vec(MyConfig.pre_word2vec_path, self.word2id,
                                         MyConfig.corpus_word2vec_path)  # 建立word2vec
        # 构造训练集、验证集、测试集数组
        self.result = self.prepare_data(self.word2id,
                                        train_path=MyConfig.train_path,
                                        val_path=MyConfig.val_path,
                                        test_path=MyConfig.test_path,
                                        seq_lenth=MyConfig.max_sen_len)

    def org_data_load(self, file_path):
        """
        加载原数据集中的lable与text
        :param file_path: 文件路径
        :return: lable列表与text列表
        """
        lable = []
        text = []
        with codecs.open(file_path, "r", encoding="utf-8") as f:
            for line in f.readlines():
                # 切割
                str = line.strip().split("\t")
                lable.append(str[0])
                text.append(str[1])
            return lable, text

    def stopWordList_Load(self, filepath):
        """
        加载停用词表
        :param filepath: 文件路径
        :return: 返回停用词
        """
        stopWordList = []
        with codecs.open(filepath, "r", encoding="utf-8") as f:
            for line in f.readlines():
                line = line.strip()
                stopWordList.append(line)
            return stopWordList

    def bulid_word2index(self, file_path):
        """
        构造word2index字典文件
        :return:
        """
        # 读取文件路径
        path = [MyConfig.train_path, MyConfig.val_path]
        word2id = {"_PAD_": 0}

        for _path in path:
            with codecs.open(_path, 'r', encoding="utf-8") as f:
                for line in f.readlines():
                    output = []
                    words = line.strip().split("\t")[1].split(" ")
                    for word in words:
                        if word not in self.stopWords:
                            # 找出长度大于1的汉字字符串
                            rt = re.findall("[\u4E00-\u9FA5]+", word)
                            if len(rt) == 0:
                                continue
                            else:
                                output.append(rt[0])

                    for word in output:
                        if word not in word2id.keys():
                            word2id[word] = len(word2id)

                # 将word2id写入文件
                with codecs.open(file_path, 'w', encoding="utf-8") as f:
                    for word, index in word2id.items():
                        f.write(word + "\t" + str(index) + '\n')
        return word2id

    def bulid_index2word(self, word2id):
        """
        构建id2word字典
        :param word2id:
        :return:
        """
        id2word = {}
        for word, index in word2id.items():
            id2word[index] = word
        return id2word

    def bulid_word2vec(self, fname, word2id, save_to_path=None):
        """
        利用预训练word2vec向量来构建字典集对应的word2vec向量，向量的行数代表单词的索引
        :param fname: 预训练模型名称
        :param word2id: 字典
        :param save_to_path: 存储语料的词向量文件
        :return:
        """
        n_words = max(word2id.values()) + 1  # 总词数
        # 加载预训练的word2vec模型
        model = gensim.models.KeyedVectors.load_word2vec_format(fname, binary=True)
        # 初始化word2vec向量
        words_vec = np.array(np.random.uniform(-1, 1, [n_words, model.vector_size]))
        for word in word2id.keys():
            # 避免因未登录词造成的错误
            try:
                words_vec[word2id[word]] = model[word]
            except KeyError:
                pass
        if save_to_path:
            with codecs.open(save_to_path, 'w', encoding="utf-8") as f:
                for vec in words_vec:
                    vec = [str(w) for w in vec]
                    f.write(",".join(vec))
                    f.write("\n")
        return words_vec

    def text_of_array(self, word2id, seq_lenth, path):
        """
        文本转为索引数字模式-将原始文本（包括标签和文本）里的每个词转为word2id对应的索引数字，并以数组返回
        :param word2id: dict, 语料文本中包含的词汇集
        :param seq_lenth: int, 序列的限定长度
        :param path: str, 待处理的原始文本数据集
        :return: 返回原始文本转化索引数字数组后的数据集(array), 标签集(list)
        """
        labels = []
        i = 0
        sens = []

        # 获取句子个数
        with codecs.open(path, encoding="utf-8") as f:
            for line in f.readlines():
                words = line.strip().split("\t")[1].split(" ")
                new_sen = [word2id.get(word, 0) for word in words if word not in self.stopWords]
                new_sen_vec = np.array(new_sen).reshape(1, -1)
                sens.append(new_sen_vec)

        # 将原始数据集中的文本转为单词索引，并将单词索引格式的文件写入到文件中
        with codecs.open(path, encoding="utf-8") as f:
            sentences_array = np.zeros(shape=(len(sens), seq_lenth))
            for line in f.readlines():
                words = line.strip().split("\t")[1].split(" ")
                new_sen = [word2id.get(word, 0) for word in words if word not in self.stopWords]
                new_sen_vec = np.array(new_sen).reshape(1, -1)

                # 如果句子长度小于seq_lenth，则进行填充处理；反之，进行截断处理
                if np.size(new_sen_vec, axis=1) < seq_lenth:
                    sentences_array[i, seq_lenth - np.size(new_sen_vec, axis=1):] = new_sen_vec[0, :]
                else:
                    sentences_array[i, :] = new_sen_vec[0, 0:seq_lenth]

                i += 1
                label = line.strip().split("\t")[0]
                labels.append(int(label))
        return np.array(sentences_array), labels

    def text_of_array_nolable(self, word2id, seq_lenth, path):
        """
        文本转为索引数字模式-将原始文本（仅包括文本）里的每个词转为word2id对应的索引数字，并以数组返回.
        :param word2id: 语料文本中包含的词汇集
        :param seq_lenth: 序列的限定长度
        :param path: 待处理的原始文本数据集
        :return: 原始文本转化索引数字数组后的数据集(array)
        """
        i = 0
        sens = []

        # 获取句子个数
        with codecs.open(path, encoding="utf-8") as f:
            for line in f.readlines():
                words = line.strip().split("\t")[1].split(" ")
                new_sen = [word2id.get(word, 0) for word in words if word not in self.stopWords]
                new_sen_vec = np.array(new_sen).reshape(1, -1)
                sens.append(new_sen_vec)

        # 将原始数据集中的文本转为单词索引，并将单词索引格式的文件写入到文件中
        with codecs.open(path, encoding="utf-8") as f:
            sentences_array = np.zeros(shape=(len(sens), seq_lenth))
            for line in f.readlines():
                words = line.strip().split("\t")[1].split(" ")
                new_sen = [word2id.get(word, 0) for word in words if word not in self.stopWords]
                new_sen_vec = np.array(new_sen).reshape(1, -1)

                # 如果句子长度小于seq_lenth，则进行填充处理；反之，进行截断处理
                if np.size(new_sen_vec, axis=1) < seq_lenth:
                    sentences_array[i, seq_lenth - np.size(new_sen_vec, axis=1):] = new_sen_vec[0, :]
                else:
                    sentences_array[i, :] = new_sen_vec[0, 0:seq_lenth]

                i += 1
        return np.array(sentences_array)

    def to_categorical(self, y, num_classes=None):
        """
        将类别转化为one-hot编码
        :param y: 类别特征列表
        :param num_classes: 类别个数
        :return: 返回one-hot编码数组,shape:（len(y), num_classes）
        """
        y = np.array(y, dtype="int")
        input_shape = y.shape
        if input_shape and input_shape[-1] == 1 and len(input_shape) > 1:
            input_shape = tuple(input_shape[:-1])
        # ravel方法：将多维数组变成一维数组
        y = y.ravel()
        if not num_classes:
            num_classes = np.max(y) + 1
        n = y.shape[0]
        categorical = np.zeros((n, num_classes))
        categorical[np.arange(n), y] = 1
        output_shape = input_shape + (num_classes,)
        categorical = np.reshape(categorical, output_shape)
        return categorical

    def prepare_data(self, word2id, train_path, val_path, test_path, seq_lenth):
        """
        得到数字索引表示的句子和标签
        :param word2id: 语料文本中包含的词汇集.
        :param train_path: 文件路径
        :param val_path: 文件路径
        :param test_path: 文件路径
        :param seq_lenth: 序列固定长度
        :return: 返回训练集、验证集、测试集数组
        """
        train_array, train_label = self.text_of_array(word2id, seq_lenth, train_path)
        val_array, val_label = self.text_of_array(word2id, seq_lenth, val_path)
        test_array, test_label = self.text_of_array(word2id, seq_lenth, test_path)

        # train_label = self.to_categorical(train_label, num_classes=2)
        # val_label = self.to_categorical(val_label, num_classes=2)
        # test_label = self.to_categorical(test_label, num_classes=2)
        train_label = np.array([train_label]).T
        val_label = np.array([val_label]).T
        test_label = np.array([test_label]).T

        return train_array, train_label, val_array, val_label, test_array, test_label


if __name__ == '__main__':
    dataprocess = Dataprocess()
    train_array, train_label, val_array, val_label, test_array, test_label = dataprocess.result

2.数据读入

数据读入，主要涉及自定义数据集。
其代码dataSet.py如下：

#!usr/bin/env python
# -*- coding:utf-8 -*-
"""
@author: liujie
@file: dataSet.py
@time: 2022/08/29
@desc:
"""
import torch
from torch.utils.data import Dataset


class MyDataSet(Dataset):

    def __init__(self, data, label):
        """
        用于向类中传入外部参数，同时定义样本集
        """
        self.data = data
        if label is not None:
            self.label = label

    def __len__(self):
        """
        用于返回数据集的样本数
        :return:
        """
        return len(self.data)

    def __getitem__(self, index):
        """
        用于逐个读取样本集合中的元素,用于逐个读取样本集合中的元素
        :param item:
        :return:
        """
        if self.label is not None:
            data = torch.from_numpy(self.data[index])
            label = torch.from_numpy(self.label[index])
            return data, label
        else:
            data = torch.from_numpy(self.data[index])
            return data

3.模型搭建

这一部分利用模型块可迅速搭建。

#!usr/bin/env python
# -*- coding:utf-8 -*-
"""
@author: liujie
@file: models.py
@time: 2022/08/29
@desc: 分别搭建模型LSTM与LSTM+Attention
"""

import torch
import torch.nn as nn
import torch.nn.functional as F
from torchinfo import summary
from Config import MyConfig


class LSTMModel(nn.Module):
    def __init__(
            self,
            input_size,
            hidden_size,
            num_layers,
            dropout,
            bidirectional,
            batch_first,
            classes,
            pretrained_weight,
            update_w2v
    ):
        """
        :param input_size: 输入x的特征数,即embedding的size
        :param hidden_size:隐藏层的大小
        :param num_layers:LSTM的层数，可形成多层的堆叠LSTM
        :param dropout: 如果非0，则在除最后一层外的每个LSTM层的输出上引入Dropout层，Dropout概率等于dropout
        :param classes:类别数
        :param batch_first:控制输入与输出的形状，如果为True，则输入和输出张量被提供为(batch, seq, feature)
        :param bidirectional:如果为True，则为双向LSTM
        :param pretrained_weight:预训练的词向量
        :param update_w2v:控制是否更新词向量
        :return:
        """
        super(LSTMModel, self).__init__()
        # embedding:向量层，将单词索引转为单词向量
        self.embedding = nn.Embedding.from_pretrained(pretrained_weight)
        self.embedding.weight.requires_grad = True

        # encoder层
        self.encoder = nn.LSTM(
            input_size=input_size,
            hidden_size=hidden_size,
            num_layers=num_layers,
            batch_first=batch_first,
            dropout=dropout,
            bidirectional=bidirectional
        )

        # decoder层
        if bidirectional:
            self.decoder1 = nn.Linear(hidden_size * 4, hidden_size)
            self.decoder2 = nn.Linear(hidden_size, classes)
        else:
            self.decoder1 = nn.Linear(hidden_size * 2, hidden_size)
            self.decoder2 = nn.Linear(hidden_size, classes)

    def forward(self, x):
        """
        前向传播
        :param x：输入
        :return:
        """
        # embedding层
        # x.shape=(batch,seq_len);embedding.shape=(num_embeddings, embedding_dim) => emb.shape=(batch,seq_len,embedding_dim)
        emb = self.embedding(x)

        # encoder层
        state, hidden = self.encoder(emb)
        # states: (batch,seq_len, D*hidden_size), D=2 if bidirectional = True else 1, =>[64,75,256]
        # hidden: (h_n, c_n) => h_n / c_n shape:(D∗num_layers, batch, hidden_size) =>[4,64,128]

        # 这里拼接输出层结果
        encoding = torch.cat([state[:, 0, :], state[:, -1, :]], dim=1)
        # decoder层
        # encoding shape: (batch, 2*D*hidden_size): [64,512]
        outputs = self.decoder1(encoding)
        outputs = self.decoder2(outputs)  # outputs shape:(batch, n_class) => [64,2]
        return outputs


class LSTM_attention(nn.Module):
    def __init__(self,
                 input_size,
                 hidden_size,
                 num_layers,
                 dropout,
                 bidirectional,
                 batch_first,
                 classes,
                 pretrained_weight,
                 update_w2v,
                 ):
        """
        :param input_size: 输入x的特征数,即embedding的size
        :param hidden_size:隐藏层的大小
        :param num_layers:LSTM的层数，可形成多层的堆叠LSTM
        :param dropout: 如果非0，则在除最后一层外的每个LSTM层的输出上引入Dropout层，Dropout概率等于dropout
        :param classes:类别数
        :param batch_first:控制输入与输出的形状，如果为True，则输入和输出张量被提供为(batch, seq, feature)
        :param bidirectional:如果为True，则为双向LSTM
        :param pretrained_weight:预训练的词向量
        :param update_w2v:控制是否更新词向量
        :return:
        """
        super(LSTM_attention, self).__init__()
        # embedding:向量层，将单词索引转为单词向量
        self.embedding = nn.Embedding.from_pretrained(pretrained_weight)
        self.embedding.weight.requires_grad = True

        # encoder层
        self.encoder = nn.LSTM(
            input_size=input_size,
            hidden_size=hidden_size,
            num_layers=num_layers,
            batch_first=batch_first,
            dropout=dropout,
            bidirectional=bidirectional
        )

        # nn.Parameter:使用这个函数的目的也是想让某些变量在学习的过程中不断的修改其值以达到最优化。
        self.weight_W = nn.Parameter(torch.Tensor(2 * hidden_size, 2 * hidden_size))
        self.weight_proj = nn.Parameter(torch.Tensor(2 * hidden_size, 1))
        # 向量初始化
        nn.init.uniform_(self.weight_W, -0.1, 0.1)
        nn.init.uniform_(self.weight_proj, -0.1, 0.1)

        # decoder层
        if bidirectional:
            self.decoder1 = nn.Linear(hidden_size * 2, hidden_size)
            self.decoder2 = nn.Linear(hidden_size, classes)
        else:
            self.decoder1 = nn.Linear(hidden_size, hidden_size)
            self.decoder2 = nn.Linear(hidden_size, classes)

    def forward(self, x):
        """
        前向传播
        :param x：输入
        :return:
        """
        # embedding层
        # x.shape=(batch,seq_len);embedding.shape=(num_embeddings, embedding_dim) => emb.shape=(batch,seq_len,embedding_dim)
        emb = self.embedding(x)

        # encoder层
        state, hidden = self.encoder(emb)
        # states: (batch,seq_len, D*hidden_size), D=2 if bidirectional = True else 1, =>[64,75,256]
        # hidden: (h_n, c_n) => h_n / c_n shape:(D∗num_layers, batch, hidden_size) =>[4,64,128]

        # attention:self.weight_proj * tanh(self.weight_W * state)
        # (batch,seq_len, 2*hidden_size) => (batch,seq_len, 2*hidden_size)
        u = torch.tanh(torch.matmul(state, self.weight_W))
        # (batch,seq_len, 2*hidden_size) => (batch,seq_len,1)
        att = torch.matmul(u, self.weight_proj)
        att_score = F.softmax(att, dim=1)
        scored_x = state * att_score

        encoding = torch.sum(scored_x, dim=1)
        # decoder层
        # encoding shape: (batch, D*hidden_size): [64,256]
        outputs = self.decoder1(encoding)
        outputs = self.decoder2(outputs)  # outputs shape:(batch, n_class) => [64,2]
        return outputs

4.模型训练、验证与测试

#!usr/bin/env python
# -*- coding:utf-8 -*-
"""
@author: liujie
@file: main.py
@time: 2022/08/30
@desc: 训练与预测
"""
import os
import tqdm
import torch
import torch.nn as nn
from dataProcess import Dataprocess
from dataSet import MyDataSet
from Config import MyConfig
from torch.utils.data import DataLoader
from models import LSTMModel, LSTM_attention
from torch import optim
from torchinfo import summary
from sklearn.metrics import f1_score, recall_score, confusion_matrix


def train_val(train_dataloader, val_dataloader, model, device, epoches, lr):
    optimizer = optim.Adam(model.parameters(), lr=lr)  # 优化器
    criterion = nn.CrossEntropyLoss()  # 损失函数
    # scheduler = optim.lr_scheduler.StepLR(optimizer, step_size=10, gamma=0.2)  # 学习率调整
    best_acc = 0.8
    for epoch in range(epoches):
        train_loss = 0.0
        correct = 0
        total = 0

        # 显示训练进度
        train_dataloader = tqdm.tqdm(train_dataloader)
        train_dataloader.set_description(
            '[%s%04d/%04d]' % ('Epoch:', epoch + 1, epoches))

        # 训练
        model.train()  # 训练模式更新参数
        model.to(device)
        for i, data_ in enumerate(train_dataloader):
            data, label = data_[0].type(torch.LongTensor).to(device), data_[1].type(torch.LongTensor).to(device)
            # 开始当前批次训练时，优化器的梯度置零，否则，梯度会累加
            optimizer.zero_grad()
            # 模型输出:output, shape:[num_samples, 2]
            output = model(data)
            # 实际目标label:label, shape:[num_samples, 1]=>[num_samples]
            label = label.squeeze(1)
            # 利用预先定义的criterion计算损失函数
            loss = criterion(output, label)
            # 反向传播
            loss.backward()
            # 利用优化器更新参数
            optimizer.step()

            # 损失
            train_loss += loss.item()
            # get predicted label: Returns ``(values, indices)``
            _, predicted = torch.max(output, 1)
            total += label.size(0)
            correct += (label == predicted).sum().item()
            F1 = f1_score(label.cpu(), predicted.cpu(), average="weighted")
            Recall = recall_score(label.cpu(), predicted.cpu(), average="micro")

            # 设置日志
            postfic = {
                "train_loss: {:.5f},train_acc:{:.3f}%,F1: {:.3f}%,Recall:{:.3f}%"
                    .format(
                    train_loss / (i + 1), 100 * correct / total, 100 * F1, 100 * Recall
                )
            }

            train_dataloader.set_postfix(log=postfic)

        # 验证
        model.eval()
        model.to(device)
        val_dataloader = tqdm.tqdm(val_dataloader)
        with torch.no_grad():
            correct = 0  # 预测的和实际的label相同的样本个数
            total = 0  # 累计validation样本个数
            val_loss = 0.0
            for i, val_data_ in enumerate(val_dataloader):
                val_data, val_label = val_data_[0].type(torch.LongTensor).to(device), val_data_[1].type(
                    torch.LongTensor).to(device)
                output = model(val_data)
                # 实际目标label:label, shape:[num_samples, 1]=>[num_samples]
                val_label = val_label.squeeze(1)
                loss = criterion(output, val_label)
                # 损失
                val_loss += loss.item()
                # get predicted label: Returns ``(values, indices)``
                _, predicted = torch.max(output, 1)
                total += val_label.size(0)
                correct += (val_label == predicted).sum().item()
                F1 = f1_score(val_label.cpu(), predicted.cpu(), average="weighted")
                Recall = recall_score(val_label.cpu(), predicted.cpu(), average="micro")
                CM = confusion_matrix(val_label.cpu(), predicted.cpu())

                # 设置日志
                postfic = {
                    "val_loss: {:.5f},val_acc:{:.3f}%,F1: {:.3f}%,Recall:{:.3f}%,CM:{}"
                        .format(
                        val_loss / (i + 1), 100 * correct / total, 100 * F1, 100 * Recall, CM
                    )
                }
                val_dataloader.set_postfix(log=postfic)
            acc = correct / total

            if acc > best_acc:
                best_acc = acc
                if os.path.exists(MyConfig.model_dir) == False:
                    os.mkdir(MyConfig.model_dir)
                torch.save(model, MyConfig.best_model_path)
                torch.save(model.state_dict(), MyConfig.model_state_dict_path)


def test(test_dataloader, model, device):
    model.eval()
    model.to(device)
    criterion = nn.CrossEntropyLoss()  # 损失函数

    test_dataloader = tqdm.tqdm(test_dataloader)
    with torch.no_grad():
        correct = 0  # 预测的和实际的label相同的样本个数
        total = 0  # 总测试样本个数
        for i, test_data_ in enumerate(test_dataloader):
            test_data, test_label = test_data_[0].type(torch.LongTensor).to(device), test_data_[1].type(
                torch.LongTensor).to(device)
            output = model(test_data)
            # 实际目标label:label, shape:[num_samples, 1]=>[num_samples]
            test_label = test_label.squeeze(1)
            loss = criterion(output, test_label)

            _, predicted = torch.max(output, 1)
            total += test_label.size(0)
            correct += (test_label == predicted).sum().item()
            F1 = f1_score(test_label.cpu(), predicted.cpu(), average="weighted")
            Recall = recall_score(test_label.cpu(), predicted.cpu(), average="micro")
            CM = confusion_matrix(test_label.cpu(), predicted.cpu())

            # 设置日志
            postfic = {
                "test_acc:{:.3f}%,F1: {:.3f}%,Recall:{:.3f}%,CM:{}"
                    .format(
                    100 * correct / total, 100 * F1, 100 * Recall, CM
                )
            }
            test_dataloader.set_postfix(log=postfic)


if __name__ == '__main__':
    device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
    # 得到句子表示与标签
    (
        train_array,
        train_label,
        val_array,
        val_label,
        test_array,
        test_label,
    ) = Dataprocess().result

    # 得到word2vec词向量表示
    w2vec = Dataprocess().w2vec
    w2vec = torch.from_numpy(w2vec)
    w2vec = w2vec.float()  # CUDA接受float32，不接受float64

    # 数据载入
    train_loader = MyDataSet(train_array, train_label)
    train_dataloader = DataLoader(
        train_loader, batch_size=MyConfig.batch_size, shuffle=True
    )

    val_loader = MyDataSet(val_array, val_label)
    val_dataloader = DataLoader(
        val_loader, batch_size=MyConfig.batch_size, shuffle=True
    )

    test_loader = MyDataSet(test_array, test_label)
    test_dataloader = DataLoader(
        test_loader, batch_size=MyConfig.batch_size, shuffle=True
    )

    # 模型的搭建
    # model2 = LSTMModel(
    #     MyConfig.embedding_dim,
    #     MyConfig.hidden_dim,
    #     MyConfig.num_layers,
    #     MyConfig.drop_keep_prob,
    #     MyConfig.bidirectional,
    #     MyConfig.batch_first,
    #     MyConfig.n_class,
    #     w2vec,
    #     MyConfig.update_w2v,
    # )

    # model2 = LSTM_attention(
    #     MyConfig.embedding_dim,
    #     MyConfig.hidden_dim,
    #     MyConfig.num_layers,
    #     MyConfig.drop_keep_prob,
    #     MyConfig.bidirectional,
    #     MyConfig.batch_first,
    #     MyConfig.n_class,
    #     w2vec,
    #     MyConfig.update_w2v,
    # )

    # TextCNN
    model2 = TextCNNModel(MyConfig.num_filters,
                          MyConfig.kernel_sizes,
                          MyConfig.embedding_dim,
                          MyConfig.drop_keep_prob,
                          MyConfig.n_class,
                          w2vec,
                          MyConfig.update_w2v,
                          )

    # 训练与验证
    train_val(train_dataloader,
              val_dataloader,
              model2,
              device,
              MyConfig.n_epoch,
              MyConfig.lr)

    # 测试
    test(test_dataloader,
         model2,
         device)

LSTM_attention运模型行结果为：

D:\softwares\anaconda3\envs\tfpt368\python.exe D:/PycharmProjects/sxlj/PyTorch_demo/text_classification_base_of_lstm/main.py
[Epoch:0001/0050]: 100%|██████████| 313/313 [00:13<00:00, 23.29it/s, log={'train_loss: 0.56064,train_acc:70.102%,F1: 86.667%,Recall:86.667%'}]
100%|██████████| 88/88 [00:00<00:00, 95.69it/s, log={'val_loss: 0.48481,val_acc:76.941%,F1: 80.307%,Recall:80.328%,CM:[[24  8]\n [ 4 25]]'}]
[Epoch:0002/0050]: 100%|██████████| 313/313 [00:10<00:00, 29.68it/s, log={'train_loss: 0.46692,train_acc:77.558%,F1: 66.518%,Recall:66.667%'}]
100%|██████████| 88/88 [00:00<00:00, 91.15it/s, log={'val_loss: 0.47865,val_acc:77.545%,F1: 88.430%,Recall:88.525%,CM:[[32  2]\n [ 5 22]]'}]
[Epoch:0003/0050]: 100%|██████████| 313/313 [00:10<00:00, 30.41it/s, log={'train_loss: 0.43907,train_acc:79.458%,F1: 80.000%,Recall:80.000%'}]
100%|██████████| 88/88 [00:00<00:00, 92.39it/s, log={'val_loss: 0.46185,val_acc:78.327%,F1: 88.518%,Recall:88.525%,CM:[[28  3]\n [ 4 26]]'}]
[Epoch:0004/0050]: 100%|██████████| 313/313 [00:10<00:00, 30.38it/s, log={'train_loss: 0.41398,train_acc:81.133%,F1: 96.639%,Recall:96.667%'}]
100%|██████████| 88/88 [00:00<00:00, 94.37it/s, log={'val_loss: 0.43865,val_acc:80.227%,F1: 73.970%,Recall:73.770%,CM:[[26 10]\n [ 6 19]]'}]
[Epoch:0005/0050]: 100%|██████████| 313/313 [00:10<00:00, 29.46it/s, log={'train_loss: 0.39387,train_acc:82.488%,F1: 80.000%,Recall:80.000%'}]
100%|██████████| 88/88 [00:00<00:00, 95.18it/s, log={'val_loss: 0.42749,val_acc:80.814%,F1: 81.909%,Recall:81.967%,CM:[[23  7]\n [ 4 27]]'}]
[Epoch:0006/0050]: 100%|██████████| 313/313 [00:10<00:00, 28.88it/s, log={'train_loss: 0.37042,train_acc:83.698%,F1: 82.922%,Recall:83.333%'}]
100%|██████████| 88/88 [00:00<00:00, 93.87it/s, log={'val_loss: 0.42287,val_acc:81.453%,F1: 78.474%,Recall:78.689%,CM:[[30  5]\n [ 8 18]]'}]
[Epoch:0007/0050]: 100%|██████████| 313/313 [00:10<00:00, 29.63it/s, log={'train_loss: 0.34795,train_acc:84.998%,F1: 96.694%,Recall:96.667%'}]
100%|██████████| 88/88 [00:00<00:00, 93.07it/s, log={'val_loss: 0.41776,val_acc:82.146%,F1: 83.732%,Recall:83.607%,CM:[[29  7]\n [ 3 22]]'}]
[Epoch:0008/0050]: 100%|██████████| 313/313 [00:10<00:00, 29.49it/s, log={'train_loss: 0.32638,train_acc:86.114%,F1: 86.481%,Recall:86.667%'}]
100%|██████████| 88/88 [00:00<00:00, 94.27it/s, log={'val_loss: 0.42515,val_acc:81.915%,F1: 72.236%,Recall:72.131%,CM:[[23 12]\n [ 5 21]]'}]
[Epoch:0009/0050]: 100%|██████████| 313/313 [00:10<00:00, 28.99it/s, log={'train_loss: 0.30633,train_acc:87.354%,F1: 93.167%,Recall:93.333%'}]
100%|██████████| 88/88 [00:01<00:00, 87.88it/s, log={'val_loss: 0.42712,val_acc:81.542%,F1: 91.790%,Recall:91.803%,CM:[[31  2]\n [ 3 25]]'}]
[Epoch:0010/0050]: 100%|██████████| 313/313 [00:10<00:00, 29.48it/s, log={'train_loss: 0.28550,train_acc:88.349%,F1: 86.726%,Recall:86.667%'}]
100%|██████████| 88/88 [00:01<00:00, 83.00it/s, log={'val_loss: 0.41023,val_acc:83.088%,F1: 91.821%,Recall:91.803%,CM:[[24  2]\n [ 3 32]]'}]
[Epoch:0011/0050]: 100%|██████████| 313/313 [00:10<00:00, 30.16it/s, log={'train_loss: 0.26399,train_acc:89.524%,F1: 80.000%,Recall:80.000%'}]
100%|██████████| 88/88 [00:00<00:00, 93.27it/s, log={'val_loss: 0.42133,val_acc:81.649%,F1: 78.735%,Recall:78.689%,CM:[[28  7]\n [ 6 20]]'}]
[Epoch:0012/0050]: 100%|██████████| 313/313 [00:10<00:00, 30.35it/s, log={'train_loss: 0.24763,train_acc:90.169%,F1: 86.787%,Recall:86.667%'}]
100%|██████████| 88/88 [00:00<00:00, 93.87it/s, log={'val_loss: 0.42143,val_acc:82.910%,F1: 86.885%,Recall:86.885%,CM:[[28  4]\n [ 4 25]]'}]
[Epoch:0013/0050]: 100%|██████████| 313/313 [00:10<00:00, 29.85it/s, log={'train_loss: 0.22936,train_acc:91.289%,F1: 89.753%,Recall:90.000%'}]
100%|██████████| 88/88 [00:00<00:00, 91.91it/s, log={'val_loss: 0.44425,val_acc:81.862%,F1: 88.512%,Recall:88.525%,CM:[[29  3]\n [ 4 25]]'}]
[Epoch:0014/0050]: 100%|██████████| 313/313 [00:10<00:00, 29.95it/s, log={'train_loss: 0.21512,train_acc:91.609%,F1: 96.678%,Recall:96.667%'}]
100%|██████████| 88/88 [00:00<00:00, 93.87it/s, log={'val_loss: 0.44040,val_acc:83.336%,F1: 83.615%,Recall:83.607%,CM:[[25  4]\n [ 6 26]]'}]
[Epoch:0015/0050]: 100%|██████████| 313/313 [00:10<00:00, 30.17it/s, log={'train_loss: 0.19601,train_acc:92.679%,F1: 93.122%,Recall:93.333%'}]
100%|██████████| 88/88 [00:00<00:00, 96.12it/s, log={'val_loss: 0.49242,val_acc:82.466%,F1: 76.874%,Recall:77.049%,CM:[[27  5]\n [ 9 20]]'}]
[Epoch:0016/0050]: 100%|██████████| 313/313 [00:10<00:00, 29.89it/s, log={'train_loss: 0.18043,train_acc:93.339%,F1: 93.304%,Recall:93.333%'}]
100%|██████████| 88/88 [00:00<00:00, 93.37it/s, log={'val_loss: 0.45973,val_acc:83.088%,F1: 83.740%,Recall:83.607%,CM:[[23  2]\n [ 8 28]]'}]
[Epoch:0017/0050]: 100%|██████████| 313/313 [00:10<00:00, 29.90it/s, log={'train_loss: 0.16902,train_acc:93.899%,F1: 96.678%,Recall:96.667%'}]
100%|██████████| 88/88 [00:00<00:00, 91.72it/s, log={'val_loss: 0.49138,val_acc:82.341%,F1: 83.688%,Recall:83.607%,CM:[[30  6]\n [ 4 21]]'}]
[Epoch:0018/0050]: 100%|██████████| 313/313 [00:10<00:00, 30.25it/s, log={'train_loss: 0.15129,train_acc:94.869%,F1: 93.333%,Recall:93.333%'}]
100%|██████████| 88/88 [00:00<00:00, 97.28it/s, log={'val_loss: 0.51235,val_acc:82.608%,F1: 83.651%,Recall:83.607%,CM:[[23  4]\n [ 6 28]]'}]
[Epoch:0019/0050]: 100%|██████████| 313/313 [00:10<00:00, 30.05it/s, log={'train_loss: 0.14316,train_acc:95.010%,F1: 96.678%,Recall:96.667%'}]
100%|██████████| 88/88 [00:00<00:00, 96.43it/s, log={'val_loss: 0.51579,val_acc:82.874%,F1: 80.286%,Recall:80.328%,CM:[[24 10]\n [ 2 25]]'}]
[Epoch:0020/0050]: 100%|██████████| 313/313 [00:10<00:00, 29.93it/s, log={'train_loss: 0.12620,train_acc:95.650%,F1: 96.663%,Recall:96.667%'}]
100%|██████████| 88/88 [00:00<00:00, 94.47it/s, log={'val_loss: 0.54916,val_acc:82.537%,F1: 83.615%,Recall:83.607%,CM:[[26  6]\n [ 4 25]]'}]
[Epoch:0021/0050]: 100%|██████████| 313/313 [00:10<00:00, 30.31it/s, log={'train_loss: 0.11475,train_acc:96.200%,F1: 96.678%,Recall:96.667%'}]
100%|██████████| 88/88 [00:00<00:00, 96.43it/s, log={'val_loss: 0.60967,val_acc:82.093%,F1: 77.049%,Recall:77.049%,CM:[[24  7]\n [ 7 23]]'}]
[Epoch:0022/0050]: 100%|██████████| 313/313 [00:10<00:00, 30.00it/s, log={'train_loss: 0.10402,train_acc:96.605%,F1: 93.426%,Recall:93.333%'}]
100%|██████████| 88/88 [00:00<00:00, 93.17it/s, log={'val_loss: 0.58835,val_acc:81.791%,F1: 78.677%,Recall:78.689%,CM:[[23  7]\n [ 6 25]]'}]
[Epoch:0023/0050]: 100%|██████████| 313/313 [00:10<00:00, 29.64it/s, log={'train_loss: 0.09436,train_acc:97.030%,F1: 100.000%,Recall:100.000%'}]
100%|██████████| 88/88 [00:00<00:00, 92.20it/s, log={'val_loss: 0.61472,val_acc:81.968%,F1: 85.196%,Recall:85.246%,CM:[[20  5]\n [ 4 32]]'}]
[Epoch:0024/0050]: 100%|██████████| 313/313 [00:10<00:00, 29.67it/s, log={'train_loss: 0.08209,train_acc:97.620%,F1: 90.011%,Recall:90.000%'}]
100%|██████████| 88/88 [00:00<00:00, 93.27it/s, log={'val_loss: 0.64169,val_acc:82.110%,F1: 86.892%,Recall:86.885%,CM:[[27  5]\n [ 3 26]]'}]
[Epoch:0025/0050]: 100%|██████████| 313/313 [00:10<00:00, 29.55it/s, log={'train_loss: 0.07454,train_acc:97.760%,F1: 100.000%,Recall:100.000%'}]
100%|██████████| 88/88 [00:00<00:00, 95.08it/s, log={'val_loss: 0.63647,val_acc:81.897%,F1: 81.691%,Recall:81.967%,CM:[[21  9]\n [ 2 29]]'}]
[Epoch:0026/0050]: 100%|██████████| 313/313 [00:10<00:00, 30.02it/s, log={'train_loss: 0.07037,train_acc:97.985%,F1: 100.000%,Recall:100.000%'}]
100%|██████████| 88/88 [00:00<00:00, 95.49it/s, log={'val_loss: 0.72361,val_acc:82.217%,F1: 91.817%,Recall:91.803%,CM:[[29  4]\n [ 1 27]]'}]
[Epoch:0027/0050]: 100%|██████████| 313/313 [00:10<00:00, 29.99it/s, log={'train_loss: 0.06135,train_acc:98.285%,F1: 100.000%,Recall:100.000%'}]
100%|██████████| 88/88 [00:00<00:00, 93.08it/s, log={'val_loss: 0.67263,val_acc:81.453%,F1: 77.086%,Recall:77.049%,CM:[[25  8]\n [ 6 22]]'}]
[Epoch:0028/0050]: 100%|██████████| 313/313 [00:10<00:00, 30.26it/s, log={'train_loss: 0.05325,train_acc:98.530%,F1: 96.678%,Recall:96.667%'}]
100%|██████████| 88/88 [00:00<00:00, 97.18it/s, log={'val_loss: 0.80234,val_acc:81.791%,F1: 83.444%,Recall:83.607%,CM:[[17  6]\n [ 4 34]]'}]
[Epoch:0029/0050]: 100%|██████████| 313/313 [00:10<00:00, 30.17it/s, log={'train_loss: 0.04880,train_acc:98.635%,F1: 100.000%,Recall:100.000%'}]
100%|██████████| 88/88 [00:00<00:00, 93.37it/s, log={'val_loss: 0.84946,val_acc:81.631%,F1: 83.607%,Recall:83.607%,CM:[[26  5]\n [ 5 25]]'}]
[Epoch:0030/0050]: 100%|██████████| 313/313 [00:10<00:00, 29.87it/s, log={'train_loss: 0.04463,train_acc:98.860%,F1: 100.000%,Recall:100.000%'}]
100%|██████████| 88/88 [00:00<00:00, 92.68it/s, log={'val_loss: 0.77501,val_acc:81.435%,F1: 77.049%,Recall:77.049%,CM:[[24  7]\n [ 7 23]]'}]
[Epoch:0031/0050]: 100%|██████████| 313/313 [00:10<00:00, 29.99it/s, log={'train_loss: 0.04244,train_acc:98.855%,F1: 93.333%,Recall:93.333%'}]
100%|██████████| 88/88 [00:00<00:00, 94.57it/s, log={'val_loss: 0.89640,val_acc:80.991%,F1: 78.549%,Recall:78.689%,CM:[[28  5]\n [ 8 20]]'}]
[Epoch:0032/0050]: 100%|██████████| 313/313 [00:10<00:00, 30.14it/s, log={'train_loss: 0.03746,train_acc:99.020%,F1: 96.670%,Recall:96.667%'}]
100%|██████████| 88/88 [00:00<00:00, 94.47it/s, log={'val_loss: 0.79363,val_acc:81.737%,F1: 85.278%,Recall:85.246%,CM:[[30  5]\n [ 4 22]]'}]
[Epoch:0033/0050]: 100%|██████████| 313/313 [00:10<00:00, 30.22it/s, log={'train_loss: 0.03398,train_acc:99.170%,F1: 100.000%,Recall:100.000%'}]
100%|██████████| 88/88 [00:00<00:00, 95.59it/s, log={'val_loss: 0.89114,val_acc:81.560%,F1: 83.607%,Recall:83.607%,CM:[[21  5]\n [ 5 30]]'}]
[Epoch:0034/0050]: 100%|██████████| 313/313 [00:10<00:00, 30.06it/s, log={'train_loss: 0.02994,train_acc:99.255%,F1: 100.000%,Recall:100.000%'}]
100%|██████████| 88/88 [00:00<00:00, 95.60it/s, log={'val_loss: 0.89480,val_acc:81.578%,F1: 83.669%,Recall:83.607%,CM:[[29  6]\n [ 4 22]]'}]
[Epoch:0035/0050]: 100%|██████████| 313/313 [00:10<00:00, 29.86it/s, log={'train_loss: 0.02764,train_acc:99.300%,F1: 96.648%,Recall:96.667%'}]
100%|██████████| 88/88 [00:00<00:00, 93.67it/s, log={'val_loss: 1.04152,val_acc:81.791%,F1: 76.901%,Recall:77.049%,CM:[[22 11]\n [ 3 25]]'}]
[Epoch:0036/0050]: 100%|██████████| 313/313 [00:10<00:00, 29.83it/s, log={'train_loss: 0.02564,train_acc:99.315%,F1: 100.000%,Recall:100.000%'}]
100%|██████████| 88/88 [00:00<00:00, 95.91it/s, log={'val_loss: 0.93769,val_acc:81.737%,F1: 80.328%,Recall:80.328%,CM:[[27  6]\n [ 6 22]]'}]
[Epoch:0037/0050]: 100%|██████████| 313/313 [00:10<00:00, 29.96it/s, log={'train_loss: 0.02017,train_acc:99.490%,F1: 100.000%,Recall:100.000%'}]
100%|██████████| 88/88 [00:00<00:00, 96.75it/s, log={'val_loss: 1.04526,val_acc:81.649%,F1: 83.686%,Recall:83.607%,CM:[[27  8]\n [ 2 24]]'}]
[Epoch:0038/0050]: 100%|██████████| 313/313 [00:10<00:00, 30.07it/s, log={'train_loss: 0.01771,train_acc:99.580%,F1: 100.000%,Recall:100.000%'}]
100%|██████████| 88/88 [00:00<00:00, 95.08it/s, log={'val_loss: 0.98604,val_acc:81.649%,F1: 93.446%,Recall:93.443%,CM:[[29  3]\n [ 1 28]]'}]
[Epoch:0039/0050]: 100%|██████████| 313/313 [00:10<00:00, 30.03it/s, log={'train_loss: 0.01636,train_acc:99.600%,F1: 100.000%,Recall:100.000%'}]
100%|██████████| 88/88 [00:00<00:00, 95.18it/s, log={'val_loss: 1.12957,val_acc:81.578%,F1: 81.907%,Recall:81.967%,CM:[[19  6]\n [ 5 31]]'}]
[Epoch:0040/0050]: 100%|██████████| 313/313 [00:10<00:00, 29.38it/s, log={'train_loss: 0.01256,train_acc:99.755%,F1: 100.000%,Recall:100.000%'}]
100%|██████████| 88/88 [00:00<00:00, 93.47it/s, log={'val_loss: 1.15598,val_acc:81.435%,F1: 78.758%,Recall:78.689%,CM:[[22  5]\n [ 8 26]]'}]
[Epoch:0041/0050]: 100%|██████████| 313/313 [00:10<00:00, 30.09it/s, log={'train_loss: 0.01042,train_acc:99.785%,F1: 100.000%,Recall:100.000%'}]
100%|██████████| 88/88 [00:00<00:00, 95.39it/s, log={'val_loss: 1.20844,val_acc:81.471%,F1: 85.278%,Recall:85.246%,CM:[[22  4]\n [ 5 30]]'}]
[Epoch:0042/0050]: 100%|██████████| 313/313 [00:10<00:00, 28.73it/s, log={'train_loss: 0.02031,train_acc:99.435%,F1: 100.000%,Recall:100.000%'}]
100%|██████████| 88/88 [00:01<00:00, 87.80it/s, log={'val_loss: 1.00797,val_acc:81.364%,F1: 82.055%,Recall:81.967%,CM:[[28  7]\n [ 4 22]]'}]
[Epoch:0043/0050]: 100%|██████████| 313/313 [00:11<00:00, 28.36it/s, log={'train_loss: 0.00935,train_acc:99.800%,F1: 100.000%,Recall:100.000%'}]
100%|██████████| 88/88 [00:01<00:00, 87.45it/s, log={'val_loss: 1.16982,val_acc:81.116%,F1: 83.598%,Recall:83.607%,CM:[[26  4]\n [ 6 25]]'}]
[Epoch:0044/0050]: 100%|██████████| 313/313 [00:10<00:00, 29.35it/s, log={'train_loss: 0.00776,train_acc:99.855%,F1: 100.000%,Recall:100.000%'}]
100%|██████████| 88/88 [00:01<00:00, 87.80it/s, log={'val_loss: 1.23823,val_acc:81.311%,F1: 80.208%,Recall:80.328%,CM:[[30  5]\n [ 7 19]]'}]
[Epoch:0045/0050]: 100%|██████████| 313/313 [00:10<00:00, 29.44it/s, log={'train_loss: 0.01205,train_acc:99.640%,F1: 100.000%,Recall:100.000%'}]
100%|██████████| 88/88 [00:00<00:00, 89.85it/s, log={'val_loss: 1.32987,val_acc:81.240%,F1: 83.544%,Recall:83.607%,CM:[[22  6]\n [ 4 29]]'}]
[Epoch:0046/0050]: 100%|██████████| 313/313 [00:10<00:00, 29.29it/s, log={'train_loss: 0.00906,train_acc:99.780%,F1: 100.000%,Recall:100.000%'}]
100%|██████████| 88/88 [00:00<00:00, 89.22it/s, log={'val_loss: 1.29088,val_acc:81.080%,F1: 70.508%,Recall:70.492%,CM:[[21  8]\n [10 22]]'}]
[Epoch:0047/0050]: 100%|██████████| 313/313 [00:10<00:00, 29.22it/s, log={'train_loss: 0.02002,train_acc:99.520%,F1: 96.639%,Recall:96.667%'}]
100%|██████████| 88/88 [00:01<00:00, 86.17it/s, log={'val_loss: 0.71967,val_acc:80.352%,F1: 68.802%,Recall:68.852%,CM:[[18 10]\n [ 9 24]]'}]
[Epoch:0048/0050]: 100%|██████████| 313/313 [00:10<00:00, 28.71it/s, log={'train_loss: 0.01397,train_acc:99.595%,F1: 100.000%,Recall:100.000%'}]
100%|██████████| 88/88 [00:00<00:00, 95.80it/s, log={'val_loss: 1.25143,val_acc:80.796%,F1: 86.814%,Recall:86.885%,CM:[[29  2]\n [ 6 24]]'}]
[Epoch:0049/0050]: 100%|██████████| 313/313 [00:10<00:00, 29.84it/s, log={'train_loss: 0.00444,train_acc:99.930%,F1: 100.000%,Recall:100.000%'}]
100%|██████████| 88/88 [00:00<00:00, 95.60it/s, log={'val_loss: 1.30688,val_acc:80.814%,F1: 81.907%,Recall:81.967%,CM:[[31  5]\n [ 6 19]]'}]
[Epoch:0050/0050]: 100%|██████████| 313/313 [00:10<00:00, 29.76it/s, log={'train_loss: 0.00473,train_acc:99.880%,F1: 100.000%,Recall:100.000%'}]
100%|██████████| 88/88 [00:00<00:00, 94.37it/s, log={'val_loss: 1.33346,val_acc:81.489%,F1: 78.746%,Recall:78.689%,CM:[[23  4]\n [ 9 25]]'}]
100%|██████████| 6/6 [00:00<00:00, 98.62it/s, log={'test_acc:82.656%,F1: 77.038%,Recall:77.551%,CM:[[22  1]\n [10 16]]'}]
Process finished with exit code 0

可以发现：经过50轮迭代训练，在测试集上的准确率达到了82.656%。
TextCNN模型运行结果为：

D:\softwares\anaconda3\envs\tfpt368\python.exe D:/PycharmProjects/sxlj/PyTorch_demo/text_classification_base_of_lstm_textcnn/main.py
[Epoch:0001/0050]: 100%|██████████| 313/313 [00:06<00:00, 47.68it/s, log={'train_loss: 0.69621,train_acc:52.150%,F1: 53.333%,Recall:53.333%'}] 
100%|██████████| 88/88 [00:00<00:00, 264.41it/s, log={'val_loss: 0.67885,val_acc:63.137%,F1: 52.280%,Recall:52.459%,CM:[[17 11]\n [18 15]]'}]
[Epoch:0002/0050]: 100%|██████████| 313/313 [00:01<00:00, 175.49it/s, log={'train_loss: 0.67432,train_acc:59.216%,F1: 53.333%,Recall:53.333%'}]
100%|██████████| 88/88 [00:00<00:00, 269.04it/s, log={'val_loss: 0.65875,val_acc:69.302%,F1: 60.656%,Recall:60.656%,CM:[[21 12]\n [12 16]]'}]
[Epoch:0003/0050]: 100%|██████████| 313/313 [00:01<00:00, 173.83it/s, log={'train_loss: 0.65302,train_acc:64.061%,F1: 76.745%,Recall:76.667%'}]
100%|██████████| 88/88 [00:00<00:00, 269.86it/s, log={'val_loss: 0.63558,val_acc:71.594%,F1: 78.617%,Recall:78.689%,CM:[[18  7]\n [ 6 30]]'}]
[Epoch:0004/0050]: 100%|██████████| 313/313 [00:01<00:00, 170.94it/s, log={'train_loss: 0.62896,train_acc:67.792%,F1: 80.000%,Recall:80.000%'}]
100%|██████████| 88/88 [00:00<00:00, 269.83it/s, log={'val_loss: 0.61021,val_acc:73.139%,F1: 71.826%,Recall:72.131%,CM:[[18 11]\n [ 6 26]]'}]
[Epoch:0005/0050]: 100%|██████████| 313/313 [00:01<00:00, 175.40it/s, log={'train_loss: 0.60655,train_acc:69.452%,F1: 70.247%,Recall:70.000%'}]
100%|██████████| 88/88 [00:00<00:00, 272.33it/s, log={'val_loss: 0.58741,val_acc:73.814%,F1: 78.903%,Recall:78.689%,CM:[[18  5]\n [ 8 30]]'}]
[Epoch:0006/0050]: 100%|██████████| 313/313 [00:01<00:00, 171.92it/s, log={'train_loss: 0.58609,train_acc:70.827%,F1: 86.546%,Recall:86.667%'}]
100%|██████████| 88/88 [00:00<00:00, 272.33it/s, log={'val_loss: 0.56825,val_acc:74.489%,F1: 76.987%,Recall:77.049%,CM:[[21  8]\n [ 6 26]]'}]
[Epoch:0007/0050]: 100%|██████████| 313/313 [00:01<00:00, 176.77it/s, log={'train_loss: 0.57175,train_acc:71.492%,F1: 69.829%,Recall:70.000%'}]
100%|██████████| 88/88 [00:00<00:00, 277.48it/s, log={'val_loss: 0.55366,val_acc:74.720%,F1: 83.598%,Recall:83.607%,CM:[[25  6]\n [ 4 26]]'}]
[Epoch:0008/0050]: 100%|██████████| 313/313 [00:01<00:00, 174.42it/s, log={'train_loss: 0.55642,train_acc:72.567%,F1: 79.911%,Recall:80.000%'}]
100%|██████████| 88/88 [00:00<00:00, 274.05it/s, log={'val_loss: 0.54188,val_acc:74.773%,F1: 83.669%,Recall:83.607%,CM:[[29  6]\n [ 4 22]]'}]
[Epoch:0009/0050]: 100%|██████████| 313/313 [00:01<00:00, 171.51it/s, log={'train_loss: 0.54889,train_acc:72.782%,F1: 70.171%,Recall:70.000%'}]
100%|██████████| 88/88 [00:00<00:00, 284.63it/s, log={'val_loss: 0.53333,val_acc:74.987%,F1: 78.700%,Recall:78.689%,CM:[[25  7]\n [ 6 23]]'}]
[Epoch:0010/0050]: 100%|██████████| 313/313 [00:01<00:00, 175.80it/s, log={'train_loss: 0.53995,train_acc:73.382%,F1: 60.000%,Recall:60.000%'}]
100%|██████████| 88/88 [00:00<00:00, 273.17it/s, log={'val_loss: 0.52711,val_acc:75.004%,F1: 80.253%,Recall:80.328%,CM:[[28  5]\n [ 7 21]]'}]
[Epoch:0011/0050]: 100%|██████████| 313/313 [00:01<00:00, 170.06it/s, log={'train_loss: 0.53371,train_acc:73.477%,F1: 80.000%,Recall:80.000%'}]
100%|██████████| 88/88 [00:00<00:00, 273.17it/s, log={'val_loss: 0.52056,val_acc:75.253%,F1: 72.041%,Recall:72.131%,CM:[[24  7]\n [10 20]]'}]
[Epoch:0012/0050]: 100%|██████████| 313/313 [00:01<00:00, 176.01it/s, log={'train_loss: 0.52858,train_acc:73.937%,F1: 80.000%,Recall:80.000%'}]
100%|██████████| 88/88 [00:00<00:00, 269.80it/s, log={'val_loss: 0.51623,val_acc:75.431%,F1: 78.723%,Recall:78.689%,CM:[[27  7]\n [ 6 21]]'}]
[Epoch:0013/0050]: 100%|██████████| 313/313 [00:01<00:00, 173.58it/s, log={'train_loss: 0.52194,train_acc:74.527%,F1: 76.800%,Recall:76.667%'}]
100%|██████████| 88/88 [00:00<00:00, 279.19it/s, log={'val_loss: 0.51252,val_acc:75.520%,F1: 83.695%,Recall:83.607%,CM:[[23  3]\n [ 7 28]]'}]
[Epoch:0014/0050]: 100%|██████████| 313/313 [00:01<00:00, 172.54it/s, log={'train_loss: 0.51817,train_acc:74.587%,F1: 89.943%,Recall:90.000%'}]
100%|██████████| 88/88 [00:00<00:00, 274.03it/s, log={'val_loss: 0.50848,val_acc:75.324%,F1: 77.277%,Recall:77.049%,CM:[[15  6]\n [ 8 32]]'}]
[Epoch:0015/0050]: 100%|██████████| 313/313 [00:01<00:00, 173.94it/s, log={'train_loss: 0.51235,train_acc:75.298%,F1: 73.333%,Recall:73.333%'}]
100%|██████████| 88/88 [00:00<00:00, 270.66it/s, log={'val_loss: 0.50518,val_acc:75.395%,F1: 78.747%,Recall:78.689%,CM:[[19  6]\n [ 7 29]]'}]
[Epoch:0016/0050]: 100%|██████████| 313/313 [00:01<00:00, 172.38it/s, log={'train_loss: 0.50972,train_acc:75.133%,F1: 66.518%,Recall:66.667%'}]
100%|██████████| 88/88 [00:00<00:00, 265.77it/s, log={'val_loss: 0.50244,val_acc:75.786%,F1: 80.328%,Recall:80.328%,CM:[[28  6]\n [ 6 21]]'}]
[Epoch:0017/0050]: 100%|██████████| 313/313 [00:01<00:00, 174.45it/s, log={'train_loss: 0.50889,train_acc:75.338%,F1: 61.667%,Recall:60.000%'}]
100%|██████████| 88/88 [00:00<00:00, 270.66it/s, log={'val_loss: 0.49999,val_acc:75.893%,F1: 80.689%,Recall:80.328%,CM:[[30  9]\n [ 3 19]]'}]
[Epoch:0018/0050]: 100%|██████████| 313/313 [00:01<00:00, 176.64it/s, log={'train_loss: 0.50319,train_acc:75.548%,F1: 76.796%,Recall:76.667%'}]
100%|██████████| 88/88 [00:00<00:00, 273.20it/s, log={'val_loss: 0.49774,val_acc:75.875%,F1: 75.530%,Recall:75.410%,CM:[[26  9]\n [ 6 20]]'}]
[Epoch:0019/0050]: 100%|██████████| 313/313 [00:01<00:00, 169.32it/s, log={'train_loss: 0.50157,train_acc:75.578%,F1: 69.900%,Recall:70.000%'}]
100%|██████████| 88/88 [00:00<00:00, 272.36it/s, log={'val_loss: 0.49553,val_acc:76.088%,F1: 73.770%,Recall:73.770%,CM:[[17  8]\n [ 8 28]]'}]
[Epoch:0020/0050]: 100%|██████████| 313/313 [00:01<00:00, 175.62it/s, log={'train_loss: 0.49466,train_acc:76.033%,F1: 83.389%,Recall:83.333%'}]
100%|██████████| 88/88 [00:00<00:00, 273.17it/s, log={'val_loss: 0.49245,val_acc:76.532%,F1: 85.286%,Recall:85.246%,CM:[[27  7]\n [ 2 25]]'}]
[Epoch:0021/0050]: 100%|██████████| 313/313 [00:01<00:00, 171.93it/s, log={'train_loss: 0.49366,train_acc:76.458%,F1: 63.457%,Recall:63.333%'}]
100%|██████████| 88/88 [00:00<00:00, 267.35it/s, log={'val_loss: 0.49038,val_acc:76.568%,F1: 68.769%,Recall:68.852%,CM:[[20 12]\n [ 7 22]]'}]
[Epoch:0022/0050]: 100%|██████████| 313/313 [00:01<00:00, 175.70it/s, log={'train_loss: 0.49277,train_acc:76.383%,F1: 86.411%,Recall:86.667%'}]
100%|██████████| 88/88 [00:00<00:00, 274.02it/s, log={'val_loss: 0.48877,val_acc:76.763%,F1: 73.770%,Recall:73.770%,CM:[[23  8]\n [ 8 22]]'}]
[Epoch:0023/0050]: 100%|██████████| 313/313 [00:01<00:00, 175.35it/s, log={'train_loss: 0.48951,train_acc:76.488%,F1: 66.815%,Recall:66.667%'}]
100%|██████████| 88/88 [00:00<00:00, 274.87it/s, log={'val_loss: 0.48666,val_acc:76.710%,F1: 77.160%,Recall:77.049%,CM:[[22  4]\n [10 25]]'}]
[Epoch:0024/0050]: 100%|██████████| 313/313 [00:01<00:00, 172.19it/s, log={'train_loss: 0.48742,train_acc:76.603%,F1: 69.967%,Recall:70.000%'}]
100%|██████████| 88/88 [00:00<00:00, 273.20it/s, log={'val_loss: 0.48497,val_acc:76.781%,F1: 75.543%,Recall:75.410%,CM:[[21  5]\n [10 25]]'}]
[Epoch:0025/0050]: 100%|██████████| 313/313 [00:01<00:00, 174.55it/s, log={'train_loss: 0.48509,train_acc:77.008%,F1: 76.589%,Recall:76.667%'}]
100%|██████████| 88/88 [00:00<00:00, 272.33it/s, log={'val_loss: 0.48300,val_acc:76.905%,F1: 83.598%,Recall:83.607%,CM:[[25  6]\n [ 4 26]]'}]
[Epoch:0026/0050]: 100%|██████████| 313/313 [00:01<00:00, 174.00it/s, log={'train_loss: 0.48135,train_acc:77.168%,F1: 53.333%,Recall:53.333%'}]
100%|██████████| 88/88 [00:00<00:00, 264.94it/s, log={'val_loss: 0.48137,val_acc:76.923%,F1: 77.049%,Recall:77.049%,CM:[[25  7]\n [ 7 22]]'}]
[Epoch:0027/0050]: 100%|██████████| 313/313 [00:01<00:00, 174.83it/s, log={'train_loss: 0.47785,train_acc:77.313%,F1: 74.299%,Recall:73.333%'}]
100%|██████████| 88/88 [00:00<00:00, 283.75it/s, log={'val_loss: 0.47971,val_acc:77.101%,F1: 76.987%,Recall:77.049%,CM:[[21  8]\n [ 6 26]]'}]
[Epoch:0028/0050]: 100%|██████████| 313/313 [00:01<00:00, 176.86it/s, log={'train_loss: 0.47841,train_acc:77.198%,F1: 69.967%,Recall:70.000%'}]
100%|██████████| 88/88 [00:00<00:00, 275.72it/s, log={'val_loss: 0.47854,val_acc:77.136%,F1: 65.555%,Recall:65.574%,CM:[[21 10]\n [11 19]]'}]
[Epoch:0029/0050]: 100%|██████████| 313/313 [00:01<00:00, 168.87it/s, log={'train_loss: 0.47548,train_acc:77.233%,F1: 86.922%,Recall:86.667%'}]
100%|██████████| 88/88 [00:00<00:00, 279.22it/s, log={'val_loss: 0.47715,val_acc:77.243%,F1: 73.770%,Recall:73.770%,CM:[[22  8]\n [ 8 23]]'}]
[Epoch:0030/0050]: 100%|██████████| 313/313 [00:01<00:00, 176.38it/s, log={'train_loss: 0.47491,train_acc:77.953%,F1: 79.911%,Recall:80.000%'}]
100%|██████████| 88/88 [00:00<00:00, 274.02it/s, log={'val_loss: 0.47600,val_acc:77.190%,F1: 73.742%,Recall:73.770%,CM:[[23  6]\n [10 22]]'}]
[Epoch:0031/0050]: 100%|██████████| 313/313 [00:01<00:00, 172.56it/s, log={'train_loss: 0.47108,train_acc:77.668%,F1: 80.000%,Recall:80.000%'}]
100%|██████████| 88/88 [00:00<00:00, 250.69it/s, log={'val_loss: 0.47458,val_acc:77.172%,F1: 77.111%,Recall:77.049%,CM:[[21  6]\n [ 8 26]]'}]
[Epoch:0032/0050]: 100%|██████████| 313/313 [00:01<00:00, 176.38it/s, log={'train_loss: 0.46813,train_acc:77.813%,F1: 83.315%,Recall:83.333%'}]
100%|██████████| 88/88 [00:00<00:00, 277.47it/s, log={'val_loss: 0.47341,val_acc:77.651%,F1: 76.962%,Recall:77.049%,CM:[[20  8]\n [ 6 27]]'}]
[Epoch:0033/0050]: 100%|██████████| 313/313 [00:01<00:00, 174.12it/s, log={'train_loss: 0.46566,train_acc:77.968%,F1: 83.429%,Recall:83.333%'}]
100%|██████████| 88/88 [00:00<00:00, 273.99it/s, log={'val_loss: 0.47243,val_acc:77.314%,F1: 80.028%,Recall:80.328%,CM:[[21 10]\n [ 2 28]]'}]
[Epoch:0034/0050]: 100%|██████████| 313/313 [00:01<00:00, 172.30it/s, log={'train_loss: 0.46597,train_acc:77.933%,F1: 76.859%,Recall:76.667%'}]
100%|██████████| 88/88 [00:00<00:00, 272.30it/s, log={'val_loss: 0.47175,val_acc:78.025%,F1: 74.030%,Recall:73.770%,CM:[[27 10]\n [ 6 18]]'}]
[Epoch:0035/0050]: 100%|██████████| 313/313 [00:01<00:00, 174.15it/s, log={'train_loss: 0.46090,train_acc:78.378%,F1: 76.091%,Recall:76.667%'}]
100%|██████████| 88/88 [00:00<00:00, 269.01it/s, log={'val_loss: 0.47008,val_acc:77.616%,F1: 87.074%,Recall:86.885%,CM:[[38  5]\n [ 3 15]]'}]
[Epoch:0036/0050]: 100%|██████████| 313/313 [00:01<00:00, 174.45it/s, log={'train_loss: 0.46238,train_acc:78.243%,F1: 72.823%,Recall:73.333%'}]
100%|██████████| 88/88 [00:00<00:00, 247.87it/s, log={'val_loss: 0.46991,val_acc:77.527%,F1: 77.037%,Recall:77.049%,CM:[[23  8]\n [ 6 24]]'}]
[Epoch:0037/0050]: 100%|██████████| 313/313 [00:01<00:00, 172.85it/s, log={'train_loss: 0.46166,train_acc:78.318%,F1: 89.899%,Recall:90.000%'}]
100%|██████████| 88/88 [00:00<00:00, 274.02it/s, log={'val_loss: 0.46848,val_acc:78.042%,F1: 83.119%,Recall:83.607%,CM:[[17  8]\n [ 2 34]]'}]
[Epoch:0038/0050]: 100%|██████████| 313/313 [00:01<00:00, 174.03it/s, log={'train_loss: 0.46136,train_acc:78.353%,F1: 73.704%,Recall:73.333%'}]
100%|██████████| 88/88 [00:00<00:00, 274.87it/s, log={'val_loss: 0.46792,val_acc:77.882%,F1: 84.836%,Recall:85.246%,CM:[[19  8]\n [ 1 33]]'}]
[Epoch:0039/0050]: 100%|██████████| 313/313 [00:01<00:00, 169.26it/s, log={'train_loss: 0.45702,train_acc:78.488%,F1: 73.092%,Recall:73.333%'}]
100%|██████████| 88/88 [00:00<00:00, 282.81it/s, log={'val_loss: 0.46709,val_acc:78.167%,F1: 88.578%,Recall:88.525%,CM:[[35  4]\n [ 3 19]]'}]
[Epoch:0040/0050]: 100%|██████████| 313/313 [00:01<00:00, 176.28it/s, log={'train_loss: 0.45724,train_acc:78.413%,F1: 79.819%,Recall:80.000%'}]
100%|██████████| 88/88 [00:00<00:00, 274.02it/s, log={'val_loss: 0.46706,val_acc:77.740%,F1: 73.870%,Recall:73.770%,CM:[[26  9]\n [ 7 19]]'}]
[Epoch:0041/0050]: 100%|██████████| 313/313 [00:01<00:00, 174.09it/s, log={'train_loss: 0.45531,train_acc:78.678%,F1: 66.518%,Recall:66.667%'}]
100%|██████████| 88/88 [00:00<00:00, 258.78it/s, log={'val_loss: 0.46644,val_acc:77.740%,F1: 76.002%,Recall:75.410%,CM:[[27 13]\n [ 2 19]]'}]
[Epoch:0042/0050]: 100%|██████████| 313/313 [00:01<00:00, 172.67it/s, log={'train_loss: 0.45388,train_acc:78.968%,F1: 86.787%,Recall:86.667%'}]
100%|██████████| 88/88 [00:00<00:00, 286.48it/s, log={'val_loss: 0.46547,val_acc:78.220%,F1: 77.049%,Recall:77.049%,CM:[[24  7]\n [ 7 23]]'}]
[Epoch:0043/0050]: 100%|██████████| 313/313 [00:01<00:00, 176.42it/s, log={'train_loss: 0.45191,train_acc:78.673%,F1: 80.000%,Recall:80.000%'}]
100%|██████████| 88/88 [00:00<00:00, 274.90it/s, log={'val_loss: 0.46534,val_acc:77.794%,F1: 71.582%,Recall:72.131%,CM:[[26  4]\n [13 18]]'}]
[Epoch:0044/0050]: 100%|██████████| 313/313 [00:01<00:00, 170.63it/s, log={'train_loss: 0.45087,train_acc:78.978%,F1: 76.745%,Recall:76.667%'}]
100%|██████████| 88/88 [00:00<00:00, 280.11it/s, log={'val_loss: 0.46433,val_acc:78.273%,F1: 77.037%,Recall:77.049%,CM:[[23  8]\n [ 6 24]]'}]
[Epoch:0045/0050]: 100%|██████████| 313/313 [00:01<00:00, 176.83it/s, log={'train_loss: 0.45019,train_acc:79.073%,F1: 76.588%,Recall:76.667%'}]
100%|██████████| 88/88 [00:00<00:00, 279.20it/s, log={'val_loss: 0.46350,val_acc:78.042%,F1: 81.967%,Recall:81.967%,CM:[[25  7]\n [ 4 25]]'}]
[Epoch:0046/0050]: 100%|██████████| 313/313 [00:01<00:00, 173.57it/s, log={'train_loss: 0.44801,train_acc:79.008%,F1: 83.389%,Recall:83.333%'}]
100%|██████████| 88/88 [00:00<00:00, 263.39it/s, log={'val_loss: 0.46312,val_acc:78.344%,F1: 77.049%,Recall:77.049%,CM:[[18  7]\n [ 7 29]]'}]
[Epoch:0047/0050]: 100%|██████████| 313/313 [00:01<00:00, 175.49it/s, log={'train_loss: 0.44767,train_acc:79.178%,F1: 96.648%,Recall:96.667%'}]
100%|██████████| 88/88 [00:00<00:00, 270.66it/s, log={'val_loss: 0.46221,val_acc:78.202%,F1: 82.114%,Recall:81.967%,CM:[[28  8]\n [ 3 22]]'}]
[Epoch:0048/0050]: 100%|██████████| 313/313 [00:01<00:00, 173.91it/s, log={'train_loss: 0.44852,train_acc:78.873%,F1: 96.678%,Recall:96.667%'}]
100%|██████████| 88/88 [00:00<00:00, 275.74it/s, log={'val_loss: 0.46215,val_acc:78.149%,F1: 70.428%,Recall:70.492%,CM:[[22  5]\n [13 21]]'}]
[Epoch:0049/0050]: 100%|██████████| 313/313 [00:01<00:00, 172.21it/s, log={'train_loss: 0.44544,train_acc:79.273%,F1: 80.000%,Recall:80.000%'}]
100%|██████████| 88/88 [00:00<00:00, 275.73it/s, log={'val_loss: 0.46195,val_acc:78.362%,F1: 83.607%,Recall:83.607%,CM:[[32  5]\n [ 5 19]]'}]
[Epoch:0050/0050]: 100%|██████████| 313/313 [00:01<00:00, 174.59it/s, log={'train_loss: 0.44742,train_acc:79.058%,F1: 80.000%,Recall:80.000%'}]
100%|██████████| 88/88 [00:00<00:00, 274.03it/s, log={'val_loss: 0.46105,val_acc:78.380%,F1: 81.919%,Recall:81.967%,CM:[[24  8]\n [ 3 26]]'}]
100%|██████████| 6/6 [00:00<00:00, 286.50it/s, log={'test_acc:79.133%,F1: 80.067%,Recall:79.592%,CM:[[15  2]\n [ 8 24]]'}]

Process finished with exit code 0

可以发现：经过50轮迭代训练，在测试集上的准确率达到了79.592%。

参考文献：

pytorch lstm 什么时候使用output(输出层)，什么时候使用h(隐藏层)
Sentiment-Analysis-Chinese-pytorch
Attention-Based Bidirectional Long Short-Term Memory Networks for Relation Classification
Convolutional Neural Networks for Sentence Classification

你可能感兴趣的:(#,PyTorch工程篇,#,自然语言处理（NLP）,pytorch,LSTM,LSTM+Attention,文本情感分类任务,中文电影评论数据集)

Spring Batch批处理操作与实践面朝大海，春不暖，花不开基础管理后台开发 spring batch 前端
SpringBatch是一个强大的批处理框架，专为处理大规模数据和执行复杂批处理任务而设计。它基于Spring框架构建，继承了Spring的许多优点，如依赖注入、事务管理等，同时提供了丰富的功能来简化批处理应用的开发。什么是批处理？批处理是指在后台运行的一系列操作，通常用于处理大量数据或执行长时间运行的任务。这些任务往往不需要用户交互，可以在非高峰时段运行，以减少对系统资源的影响。常见的批处理任务
深入解析Spring Cloud：微服务架构的利器（下） Wells974 爪哇架构 spring cloud 微服务
在上一篇文章中，我们介绍了SpringCloud的基本概念、核心组件以及如何在Java项目中使用SpringCloud进行服务注册与发现。本文将继续探讨SpringCloud的负载均衡、配置管理、服务熔断和API网关等高级特性。4.负载均衡4.1使用RibbonSpringCloudRibbon是一个客户端负载均衡器，与Eureka无缝集成，支持多种负载均衡策略。在服务消费者项目中，引入Ribbo
【深度学习】计算机视觉（CV）-图像分类-ResNet（Residual Network，残差网络） IT古董深度学习人工智能深度学习计算机视觉分类
ResNet（ResidualNetwork，残差网络）是一种深度卷积神经网络（CNN）架构，由何恺明（KaimingHe）等人在2015年提出，最初用于ImageNet竞赛，并在分类任务上取得了冠军。ResNet的核心思想是残差学习（ResidualLearning），它通过跳跃连接（SkipConnections）解决了深度神经网络训练中的梯度消失和梯度爆炸问题，使得非常深的网络（如50层、1
【深度学习基础】什么是注意力机制我的青春不太冷深度学习人工智能注意力机制
文章目录一、注意力机制的核心地位：从补充到主导二、技术突破：从Transformer到多模态融合三、跨领域应用：从NLP到通用人工智能四、未来挑战与趋势结语参考链接注意力机制：深度学习的核心革命与未来基石在深度学习的发展历程中，注意力机制（AttentionMechanism）的引入堪称一场革命。它不仅解决了传统模型的根本性缺陷，更通过动态聚焦关键信息的能力，重塑了人工智能处理复杂任务的范式。本文
【第15章：量子深度学习与未来趋势—15.3 量子深度学习在图像处理、自然语言处理等领域的应用潜力分析】再见孙悟空_ #【深度学习・探索智能核心奥秘】深度学习机器学习人工智能音视频自然语言处理量子深度学习量子学习未来
一、开篇：为什么我们需要关注这场"量子+AI"的世纪联姻？各位技术爱好者们，今天我们要聊的这个话题，可能是未来十年最值得押注的技术革命——量子深度学习。这不是简单的"1+1=2"的物理叠加，而是一场可能彻底改写AI发展轨迹的范式转移。想象这样一个场景：你现在训练一个GPT-5级别的模型，不需要耗费价值上亿美元的算力资源，不需要等待数周的训练时间，甚至不需要纠结于模型参数是否过拟合。这就是量子深度学
【第15章：量子深度学习与未来趋势—15.1 量子计算基础与量子机器学习的发展背景】再见孙悟空_ #【深度学习・探索智能核心奥秘】机器翻译自然语言处理计算机视觉量子计算人工智能深度学习机器学习
想象一下，你正在用ChatGPT生成一篇小说，突然它卡在"主角穿越虫洞"的情节上——这不是因为想象力枯竭，而是传统计算机的晶体管已经烧到冒烟。当前AI大模型的参数规模每4个月翻一番，但摩尔定律的终结让经典计算机的算力增长首次跟不上AI的进化速度。这时候，量子计算带着它的"超能力"登场了：1台50量子位的量子计算机，处理某些问题的速度可达超级计算机的1亿倍。这场算力革命，正在改写深度学习的游戏规则。
语音与自然语言处理（NLP）：智能交互的核心技术给生活加糖！热门知识自然语言处理交互人工智能
随着人工智能（AI）技术的飞速发展，语音识别与自然语言处理（NaturalLanguageProcessing,NLP）成为了智能交互系统的核心技术。它们不仅改变了人们与计算机、设备的交互方式，也推动了众多行业的革新。从智能助手（如苹果的Siri、亚马逊的Alexa）到机器翻译、自动客服系统，语音和NLP技术正逐步融入日常生活，改善我们与数字世界的沟通方式。一、什么是语音识别与自然语言处理（NLP
asp.net javascrip获取session的值_一篇文章搞定 Django Cookie 与 Session weixin_39962285 asp.net html获取session的值 session保存密码 session失效前端怎么获取session的值
cookieCookie的由来大家都知道HTTP协议是无状态的。无状态的意思是每次请求都是独立的，它的执行情况和结果与前面的请求和之后的请求都无直接关系，它不会受前面的请求响应情况直接影响，也不会直接影响后面的请求响应情况。一句有意思的话来描述就是人生只如初见，对服务器来说，每次的请求都是全新的。状态可以理解为客户端和服务器在某次会话中产生的数据，那无状态的就以为这些数据不会被保留。会话中产生的数
Lua 5.1中文编程手册：全面指南与实践元楼
本文还有配套的精品资源，点击获取简介：Lua是一种轻量级脚本语言，常嵌入到应用程序中提供扩展性。本手册是Lua5.1版本的官方文档中文翻译，涵盖了语法、特性到使用方法的全面指南。内容包括基础语法、数据类型、表、控制结构、函数、模块、元编程、错误处理、C接口、垃圾收集、线程及标准库等关键概念。此外，还包含如何解压和使用手册的说明。手册适用于各级别开发者，并为多个应用领域提供了实践指导。1.Lua语言
Python学习教程：必须掌握的Cookie知识点都在这里了 weixin_30387339 python 爬虫 javascript ViewUI
今天我们来全面了解一下Cookie（小饼干）相关的知识！篇幅有点长，在学习Python的伙伴或者有兴趣的你，可以耐心看哦！相信很多同学肯定听过Cookie这个东西，也大概了解其作用，但是其原理以及如何设置，可能没有做过web的同学并不是非常清楚，以前的Python学习教程中其实有跟大家提到过，那今天就带大家详细了解下Cookie相关的知识！一、诞生背景爬虫系列教程的第一篇：HTTP详解中我们便说过
论deepseek软件底层原理星糖曙光磨刀不误砍柴工（工具重要性）AI作画经验分享人工智能笔记
DeepSeek软件底层原理剖析一、核心架构基石（一）混合专家架构（MoE）架构本质：MoE架构模拟人类专家协作模式，构建一个专家集合。每个专家模块专门负责特定类型或领域知识的处理。任务分配机制：当模型面临输入任务时，类似智能调度系统的“路由器”会分析任务特征，将其导向最适配的专家模块。如处理医学文本时，将任务分配给擅长医学知识处理的专家，避免通用模块处理的低效性，极大提升计算效率与任务处理的针对
Python学习之cookies及session用法一个人旅行*-* Python Python cookies session
当想利用Python在网页上发表评论的时候，需要一些账号密码登录的信息，这个时候用requests.get()请求的话，账号密码全部会显示在网址上，这显然不科学！这个时候需要用post请求，可以这么理解，get是明文显示，post是非明文显示。通常，get请求会应用于获取网页数据，比如我们之前学的requests.get()。post请求则应用于向网页提交数据，比如提交表单类型数据（像账号密码就是
Python随机森林算法详解与案例实现闲人编程 python 算法 python 随机森林数据分析人工智能
目录Python随机森林算法详解与案例实现1、随机森林算法概述2、随机森林的原理3、实现步骤4、分类案例：使用随机森林预测鸢尾花品种4.1数据集介绍4.2代码实现4.3代码解释4.4运行结果5、回归案例：使用随机森林预测波士顿房价5.1数据集介绍5.2代码实现5.3代码解释5.4运行结果6、随机森林的优缺点7、改进方向8、应用场景9、总结Python随机森林算法详解与案例实现1、随机森林算法概述随
Python 循环神经网络（RNN）算法详解与应用案例闲人编程 python python rnn 算法循环神经网络深度学习文本生成
目录Python循环神经网络（RNN）算法详解与应用案例引言一、RNN的基本原理1.1RNN的结构1.2RNN的优势与挑战二、Python中RNN的面向对象实现2.1`RNNCell`类的实现2.2`RNNModel`类的实现2.3`Trainer`类的实现三、案例分析3.1序列预测3.1.1数据准备3.1.2模型训练3.1.3结果分析3.2文本生成3.2.1数据准备3.2.2模型训练3.2.3文
DeepSeek 助力 Vue 开发：打造丝滑的开关切换（Switch）宝码香车 #DeepSeek vue.js 前端 javascript DeepSeek ecmascript
前言：哈喽，大家好，今天给大家分享一篇文章！并提供具体代码帮助大家深入理解，彻底掌握！创作不易，如果能帮助到大家或者给大家一些灵感和启发，欢迎收藏+关注哦目录DeepSeek助力Vue开发：打造丝滑的开关切换（Switch）前言进入安装好的DeepSeek页面效果指令输入think组件代码组件特点说明：额外建议：代码测试页面效果自己部署DeepSeek安装地址相关文章️✍️️️️⚠️⬇️·正文开始
Inpaint for Mac v11.0.2 抠图去水印工具支持M、Intel芯片 Macdo_cn macos
Inpaintformac可以帮助用户快速从照片中删除不需要的对象，比如人物、文本、水印、阴影等，另外inpaint还能消除皱纹、粉刺和皮肤瑕疵，修复旧照片上的划痕、眼泪和斑点，功能很实用。应用介绍#从您的照片中神奇地删除游客或其他不受欢迎的人从照片中删除一个人讨厌的游客来回跟踪并破坏最佳镜头而感到沮丧？使用Inpaint将它们从您的照片中移除！只需几个简单的手势，您就可以获得清晰、壮观的图片，就
Python的那些事第二十三篇：Express（Node.js）与 Python：一场跨语言的浪漫邂逅暮雨哀尘 Python的那些事 linux python node.js express 服务器开发语言 web开发
摘要在当今的编程世界里，Node.js和Python像是两个性格迥异的超级英雄，一个以速度和灵活性著称，另一个则以强大和优雅闻名。本文将探讨如何通过Express框架将Node.js和Python结合起来，打造出一个高效、有趣的Web应用。我们将通过一系列幽默风趣的实例和表格，展示这种跨语言合作的无限可能。如果你厌倦了单调的技术论文，那么这篇论文绝对能让你眼前一亮！1.引言：当Node.js遇上P
用户实操 | GBase 8a MPP Cluster慢SQL分析排查和优化方法 GBASE数据库数据库 GBASE南大通用 GBASE
本期供稿|中国农业银行研发中心蔡鹍鹏01排查和优化方法SQL任务历史性能对比分析：通过开启GBase8a的audit_log审计日志，可以连续收集周期性任务的执行时间，通过对比相同SQL任务历史执行时长可以判定相同任务SQL长周期内的执行耗时趋势，通过对比发现执行性能异常情况，并进行针对性的分析。如，相同SQL任务在一定周期内执行时间逐渐变长，则需要结合表内数据量变化趋势、SQL任务类型需要访问全
分析投资策略数据 Young_Zn_Cu 投资策略
投资策略分析（在实习最后一周，当然要再多学一点金融相关知识啦，于是就有了这篇文章，以下均出于个人对投资策略的浅薄见解，欢迎大家提出建议）任务：分析私募排排网上的数据，并根据不同的策略进行分析，写出报告由于本人之前对投资部分了解较少，所以名词解释会占相当大一部分篇幅，大家可以直接移步后面部分！私募投资投资策略分析数据名词解释投资策略名词解释股票策略债券策略期货及衍生品策略多资产策略组合基金对筛选出来
使用多模态大语言模型进行深度学习的图像、文本和语音数据增强数行天下人工智能语言模型深度学习人工智能自然语言处理
在过去的五年里，研究方向已从传统的机器学习（ML）和深度学习（DL）方法转向利用大语言模型（LLMs），包括多模态方法，用于数据增强，以提高泛化能力，并在训练深度卷积神经网络时防止过拟合。然而，现有的综述文章主要集中于机器学习和深度学习技术或有限的模态（如文本或图像），在涵盖LLM方法的最新进展和多模态应用方面仍存在空白。本文通过探索利用多模态LLMs进行图像、文本和语音数据增强的最新文献，填补了
LLM 大模型学习必知必会系列(一)：大模型基础知识篇汀、人工智能 LLM技术汇总人工智能自然语言处理 prompt RAG LLM 模型训练模型部署
LLM大模型学习必知必会系列(一)：大模型基础知识篇魔搭ModelScope开源的LLM模型魔搭ModelScope欢迎各个开源的LLM模型在社区上做开源分享。目前社区上已经承载了来自各个机构贡献的不同系列的LLM模型。并且社区的开发者也在这些模型的基础上，贡献了许多创新应用，并在ModelScope的创空间上进行分享。本专题初步梳理了当前社区上一些典型的LLM以及对应的创空间应用，方便大家对于L
《深入浅出LLM基础篇》（三）：大模型结构分类 GoAI 深入浅出LLM 深入浅出AI 自然语言处理NLP 大模型 LLM 人工智能 transformer chatgpt
AI学习星球推荐：GoAI的学习社区知识星球是一个致力于提供《机器学习|深度学习|CV|NLP|大模型|多模态|AIGC》各个最新AI方向综述、论文等成体系的学习资料，配有全面而有深度的专栏内容，包括不限于前沿论文解读、资料共享、行业最新动态以、实践教程、求职相关（简历撰写技巧、面经资料与心得）多方面综合学习平台，强烈推荐AI小白及AI爱好者学习，性价比非常高！加入星球➡️点击链接✨专栏介
OpenWebUI，RAG+外部知识库+AI写文的开源应用 m0_74824780 人工智能开源
引言自从去年AI火起来之后，很多人便热衷于寻找适合自用的AI开源项目，把各家大模型API接入到自己的AI程序里，便可以通过AI辅助完成一系列日常任务，比如内容翻译/润色/总结/撰写、格式转换、数据分类、代码分析、角色扮演等等。一般情况下，大模型依靠自身训练数据便能够完成的任务质量偏高，像翻译总结、格式转换之类，市面上所有的AI程序基本都能够满足这一点需求；但是需要结合外部资料/超长上文信息/实时信
深入理解TensorFlow中的形状处理函数 SEVEN-YEARS tensorflow 人工智能 python
摘要在深度学习模型的构建过程中，张量（Tensor）的形状管理是一项至关重要的任务。特别是在使用TensorFlow等框架时，确保张量的形状符合预期是保证模型正确运行的基础。本文将详细介绍几个常用的形状处理函数，包括get_shape_list、reshape_to_matrix、reshape_from_matrix和assert_rank，并通过具体的代码示例来展示它们的使用方法。1.引言在深
本地部署 DeepSeek：环境准备 + 详细步骤 + 高级部署方案 + 可视化工具集成 + 故障排除手册 + 性能优化建议 Katie。人工智能技术发展 ai deepseek 人工智能人工智能大模型
前言随着人工智能技术的迅猛发展，大语言模型（LLM）在多个行业中的应用日益广泛，从自然语言处理、内容生成到智能客服、医疗诊断等领域，AI正在深刻改变传统的工作方式和业务流程。DeepSeek作为一家新兴的AI公司，凭借其高效的AI模型和开源的优势，迅速在竞争激烈的AI市场中脱颖而出。其模型不仅在性能上表现出色，还通过开源策略吸引了大量开发者和企业的关注，形成了一个活跃的社区生态。然而，随着AI技术
深入探讨：CME期货CBOT高频合约历史行情数据分析方法 hightick 外盘期货高频历史行情数据集数据分析数据挖掘金融 python 数据库
深入探讨：CME期货CBOT高频合约历史行情数据分析方法为了促进学习和研究，我们在此分享一部分匿名处理的外盘期货高频历史行情数据集。外盘期货分钟高频历史行情数据链接:https://pan.baidu.com/s/19zhe1CCpDM56amDKO2nMwQ?pwd=4wpq提取码:4wpq请注意，分享这些数据的目的是为了教育和研究，不构成任何投资建议。交易量与价格关系分析交易量与价格之间的关系
【Vim Masterclass 笔记10】S06L23：Vim 核心操作训练之 —— 文本的搜索、查找与替换操作（第二部分）安冬的码畜日常 Vim Masterclass vim 笔记 vim查找与替换
文章目录S06L23Search,Find,andReplace-PartTwo1文本替换命令`:s/old/new/`2指定范围的文本替换3特例：路径的替换4文件行号的配置5要点总结（1）搜索当前行（SameLineSearching）（2）跨行搜索（Searching）（3）替换命令（SubstituteCommand）写在前面根据李笑来《自学是门手艺》的建议，梳理完知识要点后又对这章内容制作
【Vim Masterclass 笔记13】第 7 章：Vim 核心操作之——文本对象与宏操作 + S07L28：Vim 文本对象安冬的码畜日常 Vim Masterclass vim 笔记 vim文本对象文本对象
文章目录Section7：TextObjectsandMacrosS07L28TextObjects1文本对象的含义2操作文本对象的基本语法3操作光标所在的整个单词4删除光标所在的整个句子5操作光标所在的整个段落6删除光标所在的中括号内的文本7删除光标所在的小括号内的文本8操作尖括号内的文本9操作光标所在的标签文本10操作大括号内的文本11操作光标所在的各种括号内的文本12本节思维导图写在前面本篇
【论文精读】MotionLM EEPI 自动驾驶深度学习论文阅读
【论文精读】MotionLM1背景2存在的问题3具体方案轨迹转运动序列模型轨迹去重和聚类loss1背景团队：Waymo时间：2023.9代码：简介：采用自回归的方式做轨迹生成，能够更好地建模交互，且避免模态坍缩，在数据集达到了SOTA。2存在的问题轨迹回归方面：原本xy预测认为空间过大，有的xy很大（t大速度快的时候），有的xy很小（t小速度慢的时候）。3具体方案Encoder采用了之前的论文Wa
全面解析：AI大模型入门教程，让你的学习之路不再迷茫，这个大模型学习路线非常详细收藏这篇就够了！ AGI大模型老王人工智能学习大模型 AI大模型大模型学习大模型教程大模型入门
前言AI大模型，作为当前人工智能领域的热点，凭借其强大的处理复杂数据和任务的能力，受到广泛的关注和应用。无论你是技术小白还是有一定基础的开发者，本教程都将带你从入门到实践，逐步掌握AI大模型的核心技术。基础知识大模型概述定义：AI大模型是一种拥有海量参数和强大计算能力的神经网络模型，能够处理复杂的数据和任务。应用：广泛应用于自然语言处理、图像识别、生成等领域。学习大模型的意义提升技术能力：掌握大模
mondb入手木zi_鸣 mongodb
windows 启动mongodb 编写bat文件， mongod --dbpath D:\software\MongoDBDATA mongod --help 查询各种配置配置在mongob 打开批处理，即可启动，27017原生端口，shell操作监控端口扩展28017，web端操作端口启动配置文件配置，数据更灵活
大型高并发高负载网站的系统架构 bijian1013 高并发负载均衡
扩展Web应用程序一.概念简单的来说，如果一个系统可扩展，那么你可以通过扩展来提供系统的性能。这代表着系统能够容纳更高的负载、更大的数据集，并且系统是可维护的。扩展和语言、某项具体的技术都是无关的。扩展可以分为两种： 1.
DISPLAY变量和xhost(原创) czmmiao display
DISPLAY 在Linux/Unix类操作系统上, DISPLAY用来设置将图形显示到何处. 直接登陆图形界面或者登陆命令行界面后使用startx启动图形, DISPLAY环境变量将自动设置为:0:0, 此时可以打开终端, 输出图形程序的名称(比如xclock)来启动程序, 图形将显示在本地窗口上, 在终端上输入printenv查看当前环境变量, 输出结果中有如下内容:DISPLAY=:0.0
获取B/S客户端IP 周凡杨 java 编程 jsp Web 浏览器
最近想写个B/S架构的聊天系统，因为以前做过C/S架构的QQ聊天系统，所以对于Socket通信编程只是一个巩固。对于C/S架构的聊天系统，由于存在客户端Java应用，所以直接在代码中获取客户端的IP，应用的方法为： String ip = InetAddress.getLocalHost().getHostAddress(); 然而对于WEB
浅谈类和对象朱辉辉33 编程
类是对一类事物的总称，对象是描述一个物体的特征，类是对象的抽象。简单来说，类是抽象的，不占用内存，对象是具体的，占用存储空间。类是由属性和方法构成的，基本格式是public class 类名{ //定义属性 private/public 数据类型属性名； //定义方法 publ
android activity与viewpager+fragment的生命周期问题肆无忌惮_ viewpager
有一个Activity里面是ViewPager，ViewPager里面放了两个Fragment。第一次进入这个Activity。开启了服务，并在onResume方法中绑定服务后，对Service进行了一定的初始化，其中调用了Fragment中的一个属性。 super.onResume(); bindService(intent, conn, BIND_AUTO_CREATE);
base64Encode对图片进行编码 843977358 base64 图片 encoder
/** * 对图片进行base64encoder编码 * * @author mrZhang * @param path * @return */ public static String encodeImage(String path) { BASE64Encoder encoder = null; byte[] b = null; I
Request Header简介 aigo servlet
当一个客户端(通常是浏览器)向Web服务器发送一个请求是，它要发送一个请求的命令行，一般是GET或POST命令，当发送POST命令时，它还必须向服务器发送一个叫“Content-Length”的请求头(Request Header) 用以指明请求数据的长度，除了Content-Length之外，它还可以向服务器发送其它一些Headers，如：
HttpClient4.3 创建SSL协议的HttpClient对象 alleni123 httpclient 爬虫 ssl
public class HttpClientUtils { public static CloseableHttpClient createSSLClientDefault(CookieStore cookies){ SSLContext sslContext=null; try { sslContext=new SSLContextBuilder().l
java取反 -右移-左移-无符号右移的探讨百合不是茶位运算符位移
取反：在二进制中第一位，1表示符数，0表示正数 byte a = -1; 原码：10000001 反码：11111110 补码：11111111 //异或: 00000000 byte b = -2; 原码：10000010 反码：11111101 补码：11111110 //异或: 00000001
java多线程join的作用与用法 bijian1013 java 多线程
对于JAVA的join，JDK 是这样说的：join public final void join （long millis ）throws InterruptedException Waits at most millis milliseconds for this thread to die. A timeout of 0 means t
Java发送http请求(get 与post方法请求) bijian1013 java spring
PostRequest.java package com.bijian.study; import java.io.BufferedReader; import java.io.DataOutputStream; import java.io.IOException; import java.io.InputStreamReader; import java.net.HttpURL
【Struts2二】struts.xml中package下的action配置项默认值 bit1129 struts.xml
在第一部份，定义了struts.xml文件，如下所示： <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts Configuration 2.3//EN" "http://struts.apache.org/dtds/struts
【Kafka十三】Kafka Simple Consumer bit1129 simple
代码中关于Host和Port是割裂开的，这会导致单机环境下的伪分布式Kafka集群环境下，这个例子没法运行。实际情况是需要将host和port绑定到一起， package kafka.examples.lowlevel; import kafka.api.FetchRequest; import kafka.api.FetchRequestBuilder; impo
nodejs学习api ronin47 nodejs api
NodeJS基础什么是NodeJS JS是脚本语言，脚本语言都需要一个解析器才能运行。对于写在HTML页面里的JS，浏览器充当了解析器的角色。而对于需要独立运行的JS，NodeJS就是一个解析器。每一种解析器都是一个运行环境，不但允许JS定义各种数据结构，进行各种计算，还允许JS使用运行环境提供的内置对象和方法做一些事情。例如运行在浏览器中的JS的用途是操作DOM，浏览器就提供了docum
java-64.寻找第N个丑数 bylijinnan java
public class UglyNumber { /** * 64.查找第N个丑数具体思路可参考 [url] http://zhedahht.blog.163.com/blog/static/2541117420094245366965/[/url] * 题目：我们把只包含因子 2、3和5的数称作丑数（Ugly Number）。例如6、8都是丑数，但14
二维数组（矩阵）对角线输出 bylijinnan 二维数组
/** 二维数组对角线输出两个方向例如对于数组： { 1, 2, 3, 4 }, { 5, 6, 7, 8 }, { 9, 10, 11, 12 }, { 13, 14, 15, 16 }, slash方向输出： 1 5 2 9 6 3 13 10 7 4 14 11 8 15 12 16 backslash输出： 4 3
[JWFD开源工作流设计]工作流跳跃模式开发关键点(今日更新) comsci 工作流
既然是做开源软件的,我们的宗旨就是给大家分享设计和代码,那么现在我就用很简单扼要的语言来透露这个跳跃模式的设计原理大家如果用过JWFD的ARC-自动运行控制器,或者看过代码,应该知道在ARC算法模块中有一个函数叫做SAN(),这个函数就是ARC的核心控制器,要实现跳跃模式,在SAN函数中一定要对LN链表数据结构进行操作,首先写一段代码,把
redis常见使用 cuityang redis 常见使用
redis 通常被认为是一个数据结构服务器，主要是因为其有着丰富的数据结构 strings、map、 list、sets、 sorted sets 引入jar包 jedis-2.1.0.jar (本文下方提供下载) package redistest; import redis.clients.jedis.Jedis; public class Listtest
配置多个redis dalan_123 redis
配置多个redis客户端 <?xml version="1.0" encoding="UTF-8"?><beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi=&quo
attrib命令 dcj3sjt126com attr
attrib指令用于修改文件的属性.文件的常见属性有:只读.存档.隐藏和系统. 只读属性是指文件只可以做读的操作.不能对文件进行写的操作.就是文件的写保护. 存档属性是用来标记文件改动的.即在上一次备份后文件有所改动.一些备份软件在备份的时候会只去备份带有存档属性的文件.
Yii使用公共函数 dcj3sjt126com yii
在网站项目中，没必要把公用的函数写成一个工具类，有时候面向过程其实更方便。在入口文件index.php里添加 require_once('protected/function.php'); 即可对其引用，成为公用的函数集合。 function.php如下： <?php /** * This is the shortcut to D
linux 系统资源的查看（free、uname、uptime、netstat） eksliang netstat linux uname linux uptime linux free
linux 系统资源的查看转载请出自出处：http://eksliang.iteye.com/blog/2167081 http://eksliang.iteye.com 一、free查看内存的使用情况语法如下： free [-b][-k][-m][-g] [-t] 参数含义 -b:直接输入free时，显示的单位是kb我们可以使用b(bytes),m
JAVA的位操作符 greemranqq 位运算 JAVA位移 <<>>>
最近几种进制，加上各种位操作符，发现都比较模糊，不能完全掌握，这里就再熟悉熟悉。 1.按位操作符：按位操作符是用来操作基本数据类型中的单个bit,即二进制位，会对两个参数执行布尔代数运算，获得结果。与（&）运算： 1&1 = 1, 1&0 = 0, 0&0 &
Web前段学习网站 ihuning Web
Web前段学习网站菜鸟学习：http://www.w3cschool.cc/ JQuery中文网：http://www.jquerycn.cn/ 内存溢出：http://outofmemory.cn/#csdn.blog http://www.icoolxue.com/ http://www.jikexue
强强联合：FluxBB 作者加盟 Flarum justjavac r
原文：FluxBB Joins Forces With Flarum作者：Toby Zerner译文：强强联合：FluxBB 作者加盟 Flarum译者：justjavac FluxBB 是一个快速、轻量级论坛软件，它的开发者是一名德国的 PHP 天才 Franz Liedke。FluxBB 的下一个版本(2.0)将被完全重写，并已经开发了一段时间。FluxBB 看起来非常有前途的，
java统计在线人数（session存储信息的） macroli java Web
这篇日志是我写的第三次了前两次都发布失败！郁闷极了！由于在web开发中常常用到这一部分所以在此记录一下，呵呵，就到备忘录了！我对于登录信息时使用session存储的，所以我这里是通过实现HttpSessionAttributeListener这个接口完成的。 1、实现接口类，在web.xml文件中配置监听类，从而可以使该类完成其工作。 public class Ses
bootstrp carousel初体验快速构建图片播放 qiaolevip 每天进步一点点学习永无止境 bootstrap 纵观千象
img{ border: 1px solid white; box-shadow: 2px 2px 12px #333; _width: expression(this.width > 600 ? "600px" : this.width + "px"); _height: expression(this.width &
SparkSQL读取HBase数据，通过自定义外部数据源 superlxw1234 spark sparksql sparksql读取hbase sparksql外部数据源
关键字：SparkSQL读取HBase、SparkSQL自定义外部数据源前面文章介绍了SparSQL通过Hive操作HBase表。 SparkSQL从1.2开始支持自定义外部数据源(External DataSource)，这样就可以通过API接口来实现自己的外部数据源。这里基于Spark1.4.0，简单介绍SparkSQL自定义外部数据源，访
Spring Boot 1.3.0.M1发布 wiselyman spring boot
Spring Boot 1.3.0.M1于6.12日发布，现在可以从Spring milestone repository下载。这个版本是基于Spring Framework 4.2.0.RC1,并在Spring Boot 1.2之上提供了大量的新特性improvements and new features。主要包含以下： 1.提供一个新的sprin