Mechanotrooper

Day08【使用不同的网络模型实现外卖评价情感分类】

使用不同的网络模型实现外卖评价情感分类

- - 1.目标
  - 2.文件目录
  - 3.主程序
  - - 导入库
    - 配置全局随机种子
    - 训练主程序
    - 并行执行训练任务
    - 主程序入口
    - 超参数网格搜索
    - 并行训练和结果存储
  - 4.模型参数配置
  - 5.数据加载处理
  - - 导入的库
    - DataGenerator
    - - __init__(self, data_path, config)
      - load(self)
      - encode_sentence(self, text)
      - padding(self, input_id)
      - __len__(self)
      - __getitem__(self, index)
    - load_vocab(vocab_path)
    - load_data(data_path, config, shuffle=True)
    - 处理过程
    - 功能总结
  - 6.模型结构
  - - TorchModel类
    - cnn变体类
    - bert变体类
    - choose_optimizer函数
    - 总结
  - 7.测试及评估
  - - __init__方法
    - eval方法
    - write_stats 方法
    - show_stats 方法
    - Model Comparison Data

1.目标

本文通过自定义多种网络结构模型，通过对外卖评价数据处理，实现对评价数据的正负向情感分类。最终通过网格参数搜索方式，选择一组较好的网络结构参数，达到最佳分类准确率。

2.文件目录

main.py
config.py
loader.py
model.py
evaluate.py
chars.txt
外卖点评数据.csv

3.主程序

# -*- coding: utf-8 -*-

import torch
import time
import datetime
import random
import os
import numpy as np
import pandas as pd
import logging
from config import Config
from model import TorchModel, choose_optimizer
from evaluate import Evaluator
from loader import load_data

import multiprocessing
from itertools import product
from copy import deepcopy

#[DEBUG, INFO, WARNING, ERROR, CRITICAL]
logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(name)s - %(levelname)s - %(message)s')
logger = logging.getLogger(__name__)

"""
模型训练主程序
"""

from pytorch_lightning import Trainer, seed_everything


# 在主程序开始处添加
def set_global_determinism(seed):
    os.environ["CUBLAS_WORKSPACE_CONFIG"] = ":4096:8"
    torch.use_deterministic_algorithms(True)
    torch.backends.cudnn.deterministic = True
    torch.backends.cudnn.benchmark = False
    np.random.seed(seed)
    random.seed(seed)
    torch.manual_seed(seed)
    try:
        torch.mps.manual_seed(seed)  # MPS 专用种子
    except AttributeError:
        pass


def main(config):
    set_global_determinism(Config["seed"])
    #创建保存模型的目录
    if not os.path.isdir(config["model_path"]):
        os.mkdir(config["model_path"])
    #加载训练数据
    train_data, test_data = load_data(config["train_data_path"], config)
    #加载模型
    model = TorchModel(config)
    device = config["device_type"]
    # logger.info("{0}可以使用，迁移模型至{1}".format(device,device))

    model = model.to(device)
    #加载优化器
    optimizer = choose_optimizer(config, model)
    #加载效果测试类
    evaluator = Evaluator(config, model, logger)
    #训练
    for epoch in range(config["epoch"]):
        epoch += 1
        model.train()
        logger.info("epoch %d begin" % epoch)
        train_loss = []

        for index, batch_data in enumerate(train_data):
            optimizer.zero_grad()
            input_ids, labels = batch_data  #输入变化时这里需要修改，比如多输入，多输出的情况
            # 添加设备转移
            input_ids = input_ids.to(device)
            labels = labels.squeeze(1).to(device)
            loss = model(input_ids, labels)
            loss.backward()
            optimizer.step()

            train_loss.append(loss.item())
            if index % int(len(train_data) / 2) == 0:
                logger.info("batch loss %f" % loss)

        logger.info("epoch average loss: %f" % np.mean(train_loss))
        acc = evaluator.eval(test_data, epoch)

    # model_path = os.path.join(config["model_path"], "epoch_%d.pth" % epoch)
    # torch.save(model.state_dict(), model_path)  #保存模型权重
    return acc


def worker(config):
    """并行执行的函数"""
    # 深拷贝配置避免共享内存问题
    current_config = deepcopy(config)
    # 执行主函数并获取准确率
    acc = "{:.2%}".format(main(current_config))
    print("最后一轮准确率：", acc, "当前配置：", current_config)
    # 返回结果字典
    return {
        "model_type": current_config["model_type"],
        "epoch": current_config["epoch"],
        "num_layers": current_config["num_layers"],
        "hidden_size": current_config["hidden_size"],
        "batch_size": current_config["batch_size"],
        "pooling_style": current_config["pooling_style"],
        "optimizer": current_config["optimizer"],
        "learning_rate": current_config["learning_rate"],
        "acc": acc
    }


if __name__ == "__main__":
    print("启动训练...")
    # MPS可用性检查
    logger.info(f"MPS available: {torch.backends.mps.is_available()}")
    logger.info(f"MPS built: {torch.backends.mps.is_built()}")
    # main(Config)
    start = time.time()
    # for model in ["cnn"]:
    #     Config["model_type"] = model
    #     print("最后一轮准确率：", main(Config), "当前配置：", Config["model_type"])
    print("start...")
    #对比所有模型
    #中间日志可以关掉，避免输出过多信息
    # 超参数的网格搜索
    # 生成所有参数组合
    param_grid = {
        "model_type": ["gated_cnn", "bert", "lstm"],
        "learning_rate": [1e-3, 1e-4],
        "hidden_size": [128],
        "batch_size": [64, 128],
        "pooling_style": ["avg", "max"]
    }

    # 生成所有配置组合
    all_configs = []
    for params in product(*param_grid.values()):
        config = Config.copy()
        config.update(dict(zip(param_grid.keys(), params)))
        all_configs.append(config)
    # 并行处理
    with multiprocessing.Pool(processes=multiprocessing.cpu_count()) as pool:
        all_test_results = pool.map(worker, all_configs)

    df = pd.DataFrame(all_test_results)
    # 获取当前时间戳
    timestamp = datetime.datetime.now()
    # 将时间戳转换为字符串格式
    timestamp_str = timestamp.strftime('%Y-%m-%d_%H-%M-%S')
    filename = f"{timestamp_str}_all_test_results.xlsx"
    df.to_excel(os.path.join(filename), index=False, header=True)

    # all_test_results = []
    # for model in ['bert', "gated_cnn", 'lstm']:
    #     Config["model_type"] = model
    #     for lr in [1e-3, 1e-4]:
    #         Config["learning_rate"] = lr
    #         for hidden_size in [128]:
    #             Config["hidden_size"] = hidden_size
    #             for batch_size in [64, 128]:
    #                 Config["batch_size"] = batch_size
    #                 for pooling_style in ["avg", 'max']:
    #                     Config["pooling_style"] = pooling_style
    #                     acc = "{:.2%}".format(main(Config))
    #                     print("最后一轮准确率：", acc, "当前配置：", Config)
    #                     data_dict = {"model_type": Config["model_type"], "epoch": Config["epoch"],
    #                                  "num_layers": Config["num_layers"], "hidden_size": Config["hidden_size"],
    #                                  "batch_size": Config["batch_size"], "pooling_style": Config["pooling_style"],
    #                                  "optimizer": Config["optimizer"], "learning_rate": Config["learning_rate"],
    #                                  "acc": acc}
    #                     all_test_results.append(data_dict)
    # # 将所有数据合并为DataFrame
    # df = pd.DataFrame(all_test_results)
    # # 写入Excel文件（如果文件已存在，会覆盖）
    # df.to_excel(os.path.join("all_test_results.xlsx"), index=False, header=True)

    end = time.time()
    print(f"总训练时长：{end - start:.2f}秒")

使用了一个并行化的深度学习模型训练框架，通过网格搜索超参数，自动执行不同配置的训练任务，并将训练结果存储在 Excel 文件中。
使用了 multiprocessing 来加速超参数搜索过程，支持多种模型的训练（如 gated_cnn、bert、lstm），并且保证了每次实验的可重复性。
通过日志记录训练过程，帮助跟踪训练进度和调试。

导入库

导入了大量用于深度学习、数据处理和训练过程管理的库。包括：
- torch：PyTorch深度学习框架
- numpy, pandas：数据处理和分析
- logging：用于记录训练过程中的日志信息
- multiprocessing：用于并行计算，提升模型训练效率
- itertools.product：用于生成超参数的网格组合
- copy.deepcopy：避免修改原始配置的深拷贝
- datetime：用于生成当前时间戳，以便命名保存的结果文件

配置全局随机种子

def set_global_determinism(seed):
    ...

该函数用来设置全局的随机种子，使得训练过程具有可重复性。
torch.use_deterministic_algorithms(True) 设置为确定性算法，保证每次训练的计算结果一致。
设置 CUDA、CUDNN 等库为确定性模式，减少由于硬件优化带来的不确定性。
通过 torch.manual_seed(seed) 和 np.random.seed(seed) 等设置随机种子，确保训练中涉及的随机操作可重现。

训练主程序

def main(config):
    ...

该函数执行模型的训练过程，传入的 config 参数包含所有配置（如超参数、数据路径、设备类型等）。
步骤：
1. 设置全局随机种子：确保每次运行结果一致。
2. 创建模型保存目录：检查并创建保存模型的目录。
3. 加载训练和测试数据：调用 load_data 函数加载训练数据和测试数据。
4. 加载模型：实例化 TorchModel 并将其移至指定设备（如 GPU 或 CPU）。
5. 选择优化器：调用 choose_optimizer 函数根据配置选择优化器。
6. 训练过程：按配置中的 epoch 数量进行训练：
  - 在每个 epoch 中，遍历训练数据，计算损失，并执行反向传播和优化器步骤。
  - 每半个批次输出一次当前批次的损失。
7. 评估模型：每个 epoch 结束后使用 Evaluator 类进行模型评估。
8. 返回准确率：最终返回模型在测试数据上的准确率。

并行执行训练任务

def worker(config):
    ...

该函数是为了支持并行计算而设计的。
它会创建 config 配置的副本，然后调用 main() 函数执行训练，并返回训练结果（准确率）。
每个训练任务执行完后，都会输出当前配置和最后一轮训练的准确率。

主程序入口

if __name__ == "__main__":
    ...

日志设置：在主程序开始时，检查和输出 MPS（MacOS GPU）是否可用。
设置训练时间：记录训练开始的时间，最后输出总训练时长。
超参数网格搜索：
- 使用 itertools.product() 生成所有可能的超参数组合。
- 每种超参数配置都会被传入 worker 函数进行训练，并在训练结束后返回结果。
并行化训练：使用 multiprocessing.Pool 并行执行训练任务。每个配置的训练任务都会在独立的进程中执行，从而加速模型的训练。
结果保存：将所有训练结果（包括模型配置和对应的准确率）保存在 Excel 文件中，文件名包含时间戳，确保每次执行都保存为不同的文件。
- 使用 pd.DataFrame() 将所有训练结果转换为 DataFrame，然后通过 to_excel() 方法保存到 Excel 文件中。

超参数网格搜索

param_grid = {
    "model_type": ["gated_cnn", "bert", "lstm"],
    "learning_rate": [1e-3, 1e-4],
    "hidden_size": [128],
    "batch_size": [64, 128],
    "pooling_style": ["avg", "max"]
}

这里定义了一个超参数网格搜索的参数组合。包括：
- model_type：模型类型（如 gated_cnn、bert、lstm）。
- learning_rate：学习率（1e-3 和 1e-4）。
- hidden_size：隐藏层大小（128）。
- batch_size：批大小（64 和 128）。
- pooling_style：池化方式（avg 和 max）。

并行训练和结果存储

multiprocessing.Pool(processes=multiprocessing.cpu_count()) 用于开启与 CPU 核心数量相同数量的进程，进行并行训练。
通过 pool.map(worker, all_configs) 将每种配置传递给 worker 函数进行训练。
最终，所有训练结果被保存在 Excel 文件中，文件名包含当前时间戳，便于区分不同的实验。

4.模型参数配置

# -*- coding: utf-8 -*-

"""
配置参数信息
"""

Config = {
    "device_type": "cpu",
    "model_path": "output",
    "train_data_path": "外卖点评数据.csv",
    "valid_data_path": "外卖点评数据.csv",
    "vocab_path":"chars.txt",
    "model_type":"bert",
    "class_num": 2,
    "max_length": 30,
    "hidden_size": 256,
    "kernel_size": 3,
    "num_layers": 2,
    "epoch": 12,
    "batch_size": 128,
    "pooling_style":"max",
    "optimizer": "adam",
    "learning_rate": 1e-3,
    "pretrain_model_path":r"..//..//..//bert-base-chinese",
    "split_ratio": 0.2,  # 训练集比例
    "num_workers": 4,     # 数据加载的线程数
    "seed": 987
}

这段代码定义了一个配置字典 Config，它包含了模型训练和评估过程中所需的参数。以下是对每个参数的详细解释：

device_type: "cpu"
- 定义了训练和评估时使用的设备类型。在这里，设备类型被设置为 cpu，意味着模型将在 CPU 上运行。若设置为 cuda，则表示使用 GPU 进行训练。
model_path: "output"
- 该路径用于存储训练后保存的模型文件。模型训练完成后会保存在这个目录中。
train_data_path: "外卖点评数据.csv"
- 训练数据集的路径，指定了训练时使用的数据文件。在这里，数据集是一个 CSV 文件，包含外卖点评的数据。
valid_data_path: "外卖点评数据.csv"
- 验证数据集的路径，指定了模型验证时使用的数据文件。在此配置中，验证数据集与训练数据集是同一个文件。
vocab_path: "chars.txt"
- 字符或词汇表文件的路径，该文件包含了训练模型时所使用的词汇信息，通常是每个词汇的索引映射。
model_type: "bert"
- 指定所使用的模型类型。在这里，选择的是 bert 模型，这是一个基于 Transformer 的预训练语言模型，适用于多种自然语言处理任务。
class_num: 2
- 该参数指定模型要分类的类别数。在这个例子中，模型是一个二分类问题，分类数为 2。
max_length: 30
- 输入序列的最大长度。文本输入会被截断或填充到这个长度，确保所有输入的长度一致。这里设置最大长度为 30。
hidden_size: 256
- 模型隐藏层的大小，指的是模型内部每个层的特征维度。这里设置为 256，意味着每个隐藏层的输出维度为 256。
kernel_size: 3
- 该参数通常用于卷积神经网络 (CNN)，这里假设是与卷积层相关的参数。设定卷积核大小为 3，表示卷积操作会使用大小为 3 的窗口。
num_layers: 2
- 模型中层的数量。这个参数通常是指神经网络的层数。这里设置为 2，意味着模型将有 2 层（可能是指 Transformer 层或者其他类型的网络层）。
epoch: 12
- 训练的轮次数。训练过程中，模型会进行 12 次完整的遍历训练数据集。
batch_size: 128
- 每个批次的数据量。即每次训练时，模型会使用 128 个样本来更新参数。
pooling_style: "max"
- 池化方式。在这里，选择了 max 池化方式，表示在进行池化操作时，会选择最大值作为池化结果。max pooling 是一种常见的池化策略，常用于减少特征维度。
optimizer: "adam"
- 使用的优化器类型。在这里，设置为 adam，这是一种常用的优化算法，适用于大多数深度学习任务。Adam（Adaptive Moment Estimation）结合了动量和自适应学习率的优点。
learning_rate: 1e-3
- 学习率，控制模型参数更新的步伐大小。这里设置为 1e-3，即 0.001，表示每次参数更新的步长。
pretrain_model_path: r"..//..//..//bert-base-chinese"
- 预训练模型的路径。在这里，指向了一个中文的 BERT 模型（bert-base-chinese）。该模型会在训练开始前加载，用于初始化模型的权重。
split_ratio: 0.2
- 数据集的拆分比例。这里设置为 0.2，表示将 20% 的数据用于验证（测试），剩余的 80% 用于训练。
num_workers: 4
- 数据加载时使用的线程数。设置为 4，表示将使用 4 个工作线程来加载数据，从而加速数据的加载过程。
seed: 987
- 随机种子，用于保证实验的可重复性。设置了种子值为 987，以确保每次运行时生成的随机数序列相同，这样可以在不同的实验中获得一致的结果。

此 Config 字典包含了训练和评估模型时所需的多个关键配置参数。它定义了模型的结构（如层数、隐藏层大小等）、训练设置（如学习率、优化器等）、数据路径、设备设置等。通过调整这些参数，用户可以灵活地控制模型的训练过程。

5.数据加载处理

# -*- coding: utf-8 -*-

import json
import pandas as pd
import re
import os
import torch
import numpy as np
from torch.utils.data import DataLoader, random_split
from transformers import BertTokenizer
from pytorch_lightning import Trainer, seed_everything
from sklearn.model_selection import train_test_split


"""
数据加载
"""


class DataGenerator:
    def __init__(self, data_path, config):
        self.config = config
        self.path = data_path
        # self.index_to_label = {0: '家居', 1: '房产', 2: '股票', 3: '社会', 4: '文化',
        #                        5: '国际', 6: '教育', 7: '军事', 8: '彩票', 9: '旅游',
        #                        10: '体育', 11: '科技', 12: '汽车', 13: '健康',
        #                        14: '娱乐', 15: '财经', 16: '时尚', 17: '游戏'}
        # self.label_to_index = dict((y, x) for x, y in self.index_to_label.items())
        # self.config["class_num"] = len(self.index_to_label)
        if self.config["model_type"] == "bert":
            # str = os.path.abspath(config["pretrain_model_path"])
            self.tokenizer = BertTokenizer.from_pretrained(config["pretrain_model_path"])
        self.vocab = load_vocab(config["vocab_path"])
        self.config["vocab_size"] = len(self.vocab)
        self.load()
        # 设置随机种子以保证数据打乱的可重复性
        seed_everything(config["seed"])


    def load(self):
        self.data = []

        df = pd.read_csv(self.path)
        columns = df.columns.tolist()  # 获取列名，即第一行标题
        label_name, review_name = columns
        # 获取每一行的数据（所有行数据）
        for index, row in df.iterrows():
            label, review = row.tolist()
            if self.config["model_type"] == "bert":
                input_id = self.tokenizer.encode(review, max_length=self.config["max_length"], pad_to_max_length=True,
                                                 truncation=True, padding='max_length')

            else:
                input_id = self.encode_sentence(review)
            input_id = torch.LongTensor(input_id)
            label_index = torch.LongTensor([label])
            self.data.append([input_id, label_index])

        # 打乱数据顺序
        # np.random.shuffle(self.data)
        # self.data = self.data[:3000]
        return

    def encode_sentence(self, text):
        input_id = []
        for char in text:
            input_id.append(self.vocab.get(char, self.vocab["[UNK]"]))
        input_id = self.padding(input_id)
        return input_id

    #补齐或截断输入的序列，使其可以在一个batch内运算
    def padding(self, input_id):
        input_id = input_id[:self.config["max_length"]]
        input_id += [0] * (self.config["max_length"] - len(input_id))
        return input_id

    def __len__(self):
        return len(self.data)

    def __getitem__(self, index):
        return self.data[index]

def load_vocab(vocab_path):
    token_dict = {}
    with open(vocab_path, encoding="utf8") as f:
        for index, line in enumerate(f):
            token = line.strip()
            token_dict[token] = index + 1  #0留给padding位置，所以从1开始
    return token_dict


#用torch自带的DataLoader类封装数据
def load_data(data_path, config, shuffle=True):
    dg = DataGenerator(data_path, config)
    # 计算分割尺寸
    train_size = int(config["split_ratio"] * len(dg))
    val_size = len(dg) - train_size
    # 分割数据集
    train_dataset, val_dataset = random_split(dataset = dg, lengths = [train_size, val_size],
        generator=torch.Generator().manual_seed(config["seed"])  # 保证分割可重复
    )
    # 创建DataLoader
    train_loader = DataLoader(train_dataset,batch_size=config["batch_size"],shuffle=shuffle)
    val_loader = DataLoader(val_dataset, batch_size=config["batch_size"],shuffle=False)

    return train_loader, val_loader

这段代码是一个用于数据加载和预处理的 Python 脚本，特别是为深度学习模型（如 BERT）准备数据。它包括了一个 DataGenerator 类，用于加载和处理数据，以及一个 load_data 函数，使用 DataLoader 封装数据集。以下是代码的详细解释：

导入的库

json: 处理 JSON 数据格式（虽然在当前代码中没有使用）。
pandas: 用于数据处理，特别是 CSV 文件的加载。
re: 正则表达式（虽然在当前代码中没有使用）。
os: 用于与操作系统交互，例如读取文件路径。
torch: PyTorch 库，用于深度学习，特别是张量操作和数据加载。
numpy: 用于数组操作和数学计算。
BertTokenizer: 从 Hugging Face transformers 库导入，用于加载 BERT 模型的分词器。
pytorch_lightning: 用于简化 PyTorch 的训练过程，主要提供了 Trainer 类。
train_test_split: 从 sklearn.model_selection 导入，用于将数据分割为训练集和验证集。

DataGenerator

该类用于加载和处理数据，特别是对文本数据进行编码和分词操作。

init(self, data_path, config)

构造函数，初始化 DataGenerator 实例：

data_path: 数据文件的路径，通常是 CSV 文件。
config: 配置字典，包含模型类型、预训练模型路径、词汇表路径等配置信息。
self.tokenizer: 如果模型类型是 bert，则加载 BERT 的分词器（BertTokenizer）。
self.vocab: 加载自定义的词汇表（如果模型不是 bert）。
self.config[“vocab_size”]: 设置词汇表的大小。
seed_everything: 设置随机种子，以确保实验的可重复性。

load(self)

该方法加载并处理数据：

读取 CSV 文件（使用 pandas 的 pd.read_csv()）。
提取数据中的每一行，并根据模型类型进行处理：
- 如果模型是 bert，使用 self.tokenizer.encode() 方法将文本转换为 BERT 所需的输入格式（即 token IDs）。
- 如果是其他模型，则使用 self.encode_sentence() 方法将文本转换为自定义的 token IDs。
将输入文本（token IDs）和标签（label）存入 self.data 中。

encode_sentence(self, text)

该方法将句子（text）转换为自定义模型所需的 token IDs：

遍历文本中的每个字符，将其转换为对应的词汇表索引。
使用 self.padding() 对输入进行填充，使其长度一致。

padding(self, input_id)

该方法用于填充输入的序列，使其符合指定的最大长度 max_length：

如果输入序列较长，则截断；如果较短，则用零填充。

len(self)

返回数据集的大小，即样本的数量。

getitem(self, index)

返回数据集中的某一项（输入数据和标签）。

load_vocab(vocab_path)

该函数加载自定义的词汇表：

读取指定路径的词汇表文件（每行一个 token）。
将每个 token 与其对应的索引关联（词汇表索引从 1 开始，0 被保留给填充 token）。

load_data(data_path, config, shuffle=True)

该函数用于加载数据并使用 DataLoader 封装训练和验证数据集：

data_path: 数据文件路径。
config: 配置信息，包含数据分割比例、批大小等。
shuffle: 是否对数据进行洗牌。

处理过程

数据加载：创建 DataGenerator 实例，从文件中加载数据。
数据分割：根据 split_ratio 配置，将数据分割为训练集和验证集。使用 random_split 来分割数据，并确保分割操作的可重复性。
创建 DataLoader：
- train_loader: 使用训练数据集创建 DataLoader。
- val_loader: 使用验证数据集创建 DataLoader。
返回训练集和验证集的 DataLoader。

功能总结

文本预处理：
- 代码支持两种不同的文本编码方式：一种是针对 BERT 的分词器（BertTokenizer），另一种是基于自定义词汇表的编码方式。
- 通过 padding() 方法确保输入序列具有一致的长度，适用于批处理操作。
数据集处理：
- 通过 DataLoader 类对训练集和验证集进行批处理。
- 通过 random_split() 来拆分数据集，保证训练和验证数据的独立性。
可重复性：
- 设置了随机种子，确保每次实验的结果是一致的。

加载的外卖点评数据

6.模型结构

# -*- coding: utf-8 -*-

import torch
import torch.nn as nn
from torch.optim import Adam, SGD
from transformers import BertModel
"""
建立网络模型结构
"""

class TorchModel(nn.Module):
    def __init__(self, config):
        super(TorchModel, self).__init__()
        hidden_size = config["hidden_size"]
        vocab_size = config["vocab_size"] + 1
        class_num = config["class_num"]
        model_type = config["model_type"]
        num_layers = config["num_layers"]
        self.use_bert = False
        self.embedding = nn.Embedding(vocab_size, hidden_size, padding_idx=0)
        if model_type == "fast_text":
            self.encoder = lambda x: x
        elif model_type == "lstm":
            self.encoder = nn.LSTM(hidden_size, hidden_size, num_layers=num_layers, batch_first=True)
        elif model_type == "gru":
            self.encoder = nn.GRU(hidden_size, hidden_size, num_layers=num_layers, batch_first=True)
        elif model_type == "rnn":
            self.encoder = nn.RNN(hidden_size, hidden_size, num_layers=num_layers, batch_first=True)
        elif model_type == "cnn":
            self.encoder = CNN(config)
        elif model_type == "gated_cnn":
            self.encoder = GatedCNN(config)
        elif model_type == "stack_gated_cnn":
            self.encoder = StackGatedCNN(config)
        elif model_type == "rcnn":
            self.encoder = RCNN(config)
        elif model_type == "bert":
            self.use_bert = True
            self.encoder = BertModel.from_pretrained(config["pretrain_model_path"], return_dict=False)
            hidden_size = self.encoder.config.hidden_size
        elif model_type == "bert_lstm":
            self.use_bert = True
            self.encoder = BertLSTM(config)
            hidden_size = self.encoder.bert.config.hidden_size
        elif model_type == "bert_cnn":
            self.use_bert = True
            self.encoder = BertCNN(config)
            hidden_size = self.encoder.bert.config.hidden_size
        elif model_type == "bert_mid_layer":
            self.use_bert = True
            self.encoder = BertMidLayer(config)
            hidden_size = self.encoder.bert.config.hidden_size

        self.classify = nn.Linear(hidden_size, class_num)
        self.pooling_style = config["pooling_style"]
        # self.loss = nn.functional.binary_cross_entropy  #loss采用交叉熵损失


    # 自定义交叉熵损失函数
    def cross_entropy(self, pred, target):
        # 直接使用 log_softmax + gather 组合，避免生成完整 one-hot 矩阵
        log_softmax = nn.functional.log_softmax(pred, dim=1)
        # 关键优化：用 gather 代替 one-hot 乘法
        batch_loss = -log_softmax.gather(1, target.unsqueeze(1)).squeeze(1)
        return batch_loss.mean()


    #当输入真实标签，返回loss值；无真实标签，返回预测值
    def forward(self, x, target=None):
        if self.use_bert:  # bert返回的结果是 (sequence_output, pooler_output)
            #sequence_output:batch_size, max_len, hidden_size
            #pooler_output:batch_size, hidden_size
            x = self.encoder(x)
        else:
            x = self.embedding(x)  # input shape:(batch_size, sen_len)
            x = self.encoder(x)  # input shape:(batch_size, sen_len, input_dim)

        if isinstance(x, tuple):  #RNN类的模型会同时返回隐单元向量，我们只取序列结果
            x = x[0]
        #可以采用pooling的方式得到句向量
        if self.pooling_style == "max":
            self.pooling_layer = nn.MaxPool1d(x.shape[1])
        else:
            self.pooling_layer = nn.AvgPool1d(x.shape[1])
        x = self.pooling_layer(x.transpose(1, 2)).squeeze() #input shape:(batch_size, sen_len, input_dim)

        #也可以直接使用序列最后一个位置的向量
        # x = x[:, -1, :]
        predict = self.classify(x)   #input shape:(batch_size, input_dim)
        if target is not None:
            return self.cross_entropy(predict, target.squeeze())
        else:
            return predict


class CNN(nn.Module):
    def __init__(self, config):
        super(CNN, self).__init__()
        hidden_size = config["hidden_size"]
        kernel_size = config["kernel_size"]
        pad = int((kernel_size - 1)/2)
        self.cnn = nn.Conv1d(hidden_size, hidden_size, kernel_size, bias=False, padding=pad)

    def forward(self, x): #x : (batch_size, max_len, embeding_size)
        return self.cnn(x.transpose(1, 2)).transpose(1, 2)

class GatedCNN(nn.Module):
    def __init__(self, config):
        super(GatedCNN, self).__init__()
        self.cnn = CNN(config)
        self.gate = CNN(config)

    def forward(self, x):
        a = self.cnn(x)
        b = self.gate(x)
        b = torch.sigmoid(b)
        return torch.mul(a, b)


class StackGatedCNN(nn.Module):
    def __init__(self, config):
        super(StackGatedCNN, self).__init__()
        self.num_layers = config["num_layers"]
        self.hidden_size = config["hidden_size"]
        #ModuleList类内可以放置多个模型，取用时类似于一个列表
        self.gcnn_layers = nn.ModuleList(
            GatedCNN(config) for i in range(self.num_layers)
        )
        self.ff_liner_layers1 = nn.ModuleList(
            nn.Linear(self.hidden_size, self.hidden_size) for i in range(self.num_layers)
        )
        self.ff_liner_layers2 = nn.ModuleList(
            nn.Linear(self.hidden_size, self.hidden_size) for i in range(self.num_layers)
        )
        self.bn_after_gcnn = nn.ModuleList(
            nn.LayerNorm(self.hidden_size) for i in range(self.num_layers)
        )
        self.bn_after_ff = nn.ModuleList(
            nn.LayerNorm(self.hidden_size) for i in range(self.num_layers)
        )

    def forward(self, x):
        #仿照bert的transformer模型结构，将self-attention替换为gcnn
        for i in range(self.num_layers):
            gcnn_x = self.gcnn_layers[i](x)
            x = gcnn_x + x  #通过gcnn+残差
            x = self.bn_after_gcnn[i](x)  #之后bn
            # # 仿照feed-forward层，使用两个线性层
            l1 = self.ff_liner_layers1[i](x)  #一层线性
            l1 = torch.relu(l1)               #在bert中这里是gelu
            l2 = self.ff_liner_layers2[i](l1) #二层线性
            x = self.bn_after_ff[i](x + l2)        #残差后过bn
        return x


class RCNN(nn.Module):
    def __init__(self, config):
        super(RCNN, self).__init__()
        hidden_size = config["hidden_size"]
        self.rnn = nn.RNN(hidden_size, hidden_size)
        self.cnn = GatedCNN(config)

    def forward(self, x):
        x, _ = self.rnn(x)
        x = self.cnn(x)
        return x

class BertLSTM(nn.Module):
    def __init__(self, config):
        super(BertLSTM, self).__init__()
        self.bert = BertModel.from_pretrained(config["pretrain_model_path"], return_dict=False)
        self.rnn = nn.LSTM(self.bert.config.hidden_size, self.bert.config.hidden_size, batch_first=True)

    def forward(self, x):
        x = self.bert(x)[0]
        x, _ = self.rnn(x)
        return x

class BertCNN(nn.Module):
    def __init__(self, config):
        super(BertCNN, self).__init__()
        self.bert = BertModel.from_pretrained(config["pretrain_model_path"], return_dict=False)
        config["hidden_size"] = self.bert.config.hidden_size
        self.cnn = CNN(config)

    def forward(self, x):
        x = self.bert(x)[0]
        x = self.cnn(x)
        return x

class BertMidLayer(nn.Module):
    def __init__(self, config):
        super(BertMidLayer, self).__init__()
        self.bert = BertModel.from_pretrained(config["pretrain_model_path"], return_dict=False)
        self.bert.config.output_hidden_states = True

    def forward(self, x):
        layer_states = self.bert(x)[2]#(13, batch, len, hidden)
        layer_states = torch.add(layer_states[-2], layer_states[-1])
        return layer_states


#优化器的选择
def choose_optimizer(config, model):
    optimizer = config["optimizer"]
    learning_rate = config["learning_rate"]
    if optimizer == "adam":
        return Adam(model.parameters(), lr=learning_rate, weight_decay=1e-4) # 1e-4 是 L2 正则化的超参数
    elif optimizer == "sgd":
        return SGD(model.parameters(), lr=learning_rate, weight_decay=1e-4)

这部分定义了一个深度学习模型架构，包括不同类型的神经网络层以及优化器选择。代码的主要功能是根据配置文件 (config) 动态选择不同的网络结构，并定义了模型的前向传播过程。以下是代码的详细解释：

TorchModel类

TorchModel 是一个通用的深度学习模型，支持多种不同的网络架构。根据 config 字典中的 model_type 参数，模型可以选择不同的编码方式，例如 LSTM、GRU、CNN、BERT 等。

__init__ 方法：
- hidden_size: 隐藏层大小。
- vocab_size: 词汇表大小（包含 padding token）。
- class_num: 输出类别数。
- model_type: 选择的模型类型，决定了编码器的类型（如 LSTM、GRU、BERT 等）。
- num_layers: 对于 RNN 类模型，表示网络的层数。
- self.use_bert: 标记是否使用 BERT。
- self.embedding: 嵌入层，用于将词汇表中的每个词转换为固定维度的向量。
根据 model_type，会选择不同的编码器：
- 对于传统的 RNN、LSTM、GRU，使用对应的 nn.RNN, nn.LSTM, nn.GRU 作为编码器。
- 对于 CNN 类型模型，使用自定义的 CNN, GatedCNN, StackGatedCNN, RCNN 等。
- 对于 BERT 类型模型，使用 BertModel 或者结合 LSTM/CNN 的 BERT 变体（如 BertLSTM, BertCNN, BertMidLayer）。
self.classify 是最后一个全连接层，用于输出类别预测。
cross_entropy 方法：
自定义交叉熵损失函数，避免生成完整的 one-hot 编码矩阵，直接通过 log_softmax 和 gather 计算损失。
forward 方法：
模型的前向传播过程。根据是否使用 BERT（self.use_bert），处理输入数据。
- 如果使用 BERT，输入通过 BERT 编码器得到输出（BERT 返回的是 sequence_output 和 pooler_output）。
- 否则，先通过嵌入层 self.embedding 转换为嵌入向量，再通过选择的编码器进行处理。
然后，通过 pooling_style 决定使用最大池化（MaxPool1d）还是平均池化（AvgPool1d）来生成句向量。最后，通过 self.classify 生成预测。

cnn变体类

这些类定义了不同类型的神经网络层，用于处理输入数据：

CNN: 一个简单的卷积层，接受一个输入，进行卷积操作并返回卷积结果。
GatedCNN: 使用两个 CNN 层，其中一个用作主要的卷积层，另一个用作门控机制来控制信息流，最终通过元素级的乘法结合这两者。
StackGatedCNN: 使用多个 GatedCNN 层进行堆叠，同时使用残差连接来防止梯度消失，类似于 Transformer 中的层堆叠结构。
RCNN: 结合了 RNN 和 CNN。先通过 RNN 进行序列建模，然后通过 GatedCNN 层处理 RNN 的输出。

bert变体类

这些类结合了 BERT 模型和其他传统模型（如 LSTM 和 CNN）：

BertLSTM: 先通过 BERT 获取序列的表示，然后将其通过 LSTM 进行进一步的序列建模。
BertCNN: 先通过 BERT 获取序列的表示，然后使用卷积层进行特征提取。
BertMidLayer: 从 BERT 的中间层获取输出，而不是仅仅使用池化输出，结合多个中间层的输出。

choose_optimizer函数

根据 config 配置，选择适当的优化器（Adam 或 SGD）并返回：

optimizer: 优化器类型。
learning_rate: 学习率。
weight_decay: 权重衰减，用于正则化。

总结

这段代码实现了一个高度灵活的深度学习框架，可以根据不同的需求选择不同类型的网络结构（如传统的 RNN、LSTM、CNN，或是更现代的 BERT 变体），并支持多种优化器配置。模型的前向传播过程允许动态选择编码器和池化方式，可以广泛应用于文本分类、情感分析等任务。

7.测试及评估

# -*- coding: utf-8 -*-
import torch
from loader import load_data

"""
模型效果测试
"""

class Evaluator:
    def __init__(self, config, model, logger):
        self.config = config
        self.model = model
        self.logger = logger
        self.valid_data = None
        self.stats_dict = {"correct":0, "wrong":0}  #用于存储测试结果

    def eval(self, valid_data, epoch):
        self.logger.info("开始测试第%d轮模型效果：" % epoch)
        self.model.eval()
        # self.valid_data = valid_data
        self.stats_dict = {"correct": 0, "wrong": 0}  # 清空上一轮结果
        device = self.config["device_type"]
        for index, batch_data in enumerate(valid_data):
            input_ids, labels = batch_data   #输入变化时这里需要修改，比如多输入，多输出的情况
            # 添加设备转移
            input_ids = input_ids.to(device)
            labels = labels.to(device)
            with torch.no_grad():
                pred_results = self.model(input_ids) #不输入labels，使用模型当前参数进行预测
            self.write_stats(labels, pred_results)
        acc = self.show_stats()
        return acc

    def write_stats(self, labels, pred_results):
        assert len(labels) == len(pred_results)
        for true_label, pred_label in zip(labels, pred_results):
            pred_label = torch.argmax(pred_label)
            if int(true_label) == int(pred_label):
                self.stats_dict["correct"] += 1
            else:
                self.stats_dict["wrong"] += 1
        return

    def show_stats(self):
        correct = self.stats_dict["correct"]
        wrong = self.stats_dict["wrong"]
        self.logger.info("预测集合条目总量：%d" % (correct +wrong))
        self.logger.info("预测正确条目：%d，预测错误条目：%d" % (correct, wrong))
        self.logger.info("预测准确率：%.2f%%" % (correct * 100.0 / (correct + wrong)))
        self.logger.info("--------------------")
        return correct / (correct + wrong)

这段代码定义了一个名为 Evaluator 的类，主要用于评估模型的预测性能。Evaluator 类的主要目的是用于模型效果的评估。它通过接收验证数据集，并计算模型在这些数据上的预测准确率，最终输出评估结果。核心功能包括：

在验证数据集上评估模型的预测性能。
使用 write_stats 方法统计正确和错误的预测数量。
使用 show_stats 方法计算并输出准确率。

init方法

def __init__(self, config, model, logger):
    self.config = config
    self.model = model
    self.logger = logger
    self.valid_data = None
    self.stats_dict = {"correct": 0, "wrong": 0}

config: 配置字典，包含模型和评估的一些参数（例如设备类型等）。
model: 训练好的模型，用于进行预测。
logger: 日志记录器，用于输出评估过程中的信息。
valid_data: 验证数据集，初始为空。
stats_dict: 存储评估结果的字典，包括正确预测数（correct）和错误预测数（wrong）。

eval方法

def eval(self, valid_data, epoch):
    self.logger.info("开始测试第%d轮模型效果：" % epoch)
    self.model.eval()
    self.stats_dict = {"correct": 0, "wrong": 0}
    device = self.config["device_type"]
    for index, batch_data in enumerate(valid_data):
        input_ids, labels = batch_data
        input_ids = input_ids.to(device)
        labels = labels.to(device)
        with torch.no_grad():
            pred_results = self.model(input_ids)
        self.write_stats(labels, pred_results)
    acc = self.show_stats()
    return acc

valid_data: 验证数据集，用于评估模型的性能。
epoch: 当前的训练轮次，主要用于日志输出。
self.model.eval(): 将模型设置为评估模式。在此模式下，模型会禁用掉像 dropout 等训练时特有的操作，确保推理结果稳定。
device = self.config["device_type"]: 获取配置中的设备类型（如 CPU 或 GPU）。
for index, batch_data in enumerate(valid_data): 遍历验证数据集。每次获取一个批次的数据。
- input_ids, labels = batch_data: 假设每个 batch_data 是一个元组，包含输入数据（input_ids）和对应的标签（labels）。
- input_ids.to(device) 和 labels.to(device): 将输入数据和标签移动到指定设备（如 GPU 或 CPU）上。
- with torch.no_grad(): 在评估过程中，关闭梯度计算，以节省内存并提高性能，因为不需要计算梯度。
- pred_results = self.model(input_ids): 使用模型对输入数据进行预测。
- self.write_stats(labels, pred_results): 将标签与预测结果进行对比，并更新统计信息。
acc = self.show_stats(): 调用 show_stats 方法计算并显示模型的准确率。
return acc: 返回准确率。

write_stats 方法

def write_stats(self, labels, pred_results):
    assert len(labels) == len(pred_results)
    for true_label, pred_label in zip(labels, pred_results):
        pred_label = torch.argmax(pred_label)
        if int(true_label) == int(pred_label):
            self.stats_dict["correct"] += 1
        else:
            self.stats_dict["wrong"] += 1
    return

labels: 真实标签。
pred_results: 模型预测的结果。
assert len(labels) == len(pred_results): 确保标签和预测结果的长度一致。
for true_label, pred_label in zip(labels, pred_results): 遍历标签和预测结果对。
- torch.argmax(pred_label): pred_label 是模型的输出，通常是一个概率分布。使用 torch.argmax 找出预测结果中概率最高的类别。
- if int(true_label) == int(pred_label): 判断预测的类别是否与真实标签相同。如果相同，认为是正确预测。
- self.stats_dict["correct"] += 1: 如果预测正确，更新正确预测数。
- self.stats_dict["wrong"] += 1: 如果预测错误，更新错误预测数。

show_stats 方法

def show_stats(self):
    correct = self.stats_dict["correct"]
    wrong = self.stats_dict["wrong"]
    self.logger.info("预测集合条目总量：%d" % (correct + wrong))
    self.logger.info("预测正确条目：%d，预测错误条目：%d" % (correct, wrong))
    self.logger.info("预测准确率：%.2f%%" % (correct * 100.0 / (correct + wrong)))
    self.logger.info("--------------------")
    return correct / (correct + wrong)

correct 和 wrong: 从 self.stats_dict 获取正确预测数和错误预测数。
日志输出: 打印预测总数、正确预测数、错误预测数以及准确率。
- self.logger.info(...): 通过日志记录器输出评估结果。
- 准确率计算: correct * 100.0 / (correct + wrong)，计算并输出预测准确率。
return correct / (correct + wrong): 返回准确率，准确率等于正确预测数除以总预测数。

输出不同参数配置下最后一轮测试结果：

Model Comparison Data

model_type	epoch	num_layers	hidden_size	batch_size	pooling_style	optimizer	learning_rate	acc
bert	10	2	128	128	max	adam	0.0001	87.75%
gated_cnn	10	2	128	64	max	adam	0.001	87.67%
gated_cnn	10	2	128	128	max	adam	0.001	87.40%
bert	10	2	128	64	max	adam	0.0001	86.77%
bert	10	2	128	128	max	adam	0.001	86.10%
bert	10	2	128	128	avg	adam	0.0001	85.79%
lstm	10	2	128	64	max	adam	0.001	85.52%
lstm	10	2	128	128	max	adam	0.001	85.48%
bert	10	2	128	64	max	adam	0.001	85.44%
gated_cnn	10	2	128	64	avg	adam	0.001	85.41%
gated_cnn	10	2	128	64	max	adam	0.0001	85.31%
lstm	10	2	128	128	avg	adam	0.001	85.12%
bert	10	2	128	64	avg	adam	0.0001	85.03%
gated_cnn	10	2	128	128	avg	adam	0.001	84.90%
lstm	10	2	128	64	avg	adam	0.0001	84.48%
lstm	10	2	128	64	avg	adam	0.001	84.39%
bert	10	2	128	64	avg	adam	0.001	84.16%
lstm	10	2	128	64	max	adam	0.0001	84.08%
gated_cnn	10	2	128	128	max	adam	0.0001	83.80%
bert	10	2	128	128	avg	adam	0.001	83.65%
lstm	10	2	128	128	avg	adam	0.0001	82.04%
lstm	10	2	128	128	max	adam	0.0001	81.87%
gated_cnn	10	2	128	64	avg	adam	0.0001	80.89%
gated_cnn	10	2	128	128	avg	adam	0.0001	76.87%

你可能感兴趣的:(自然语言处理,文本分类,自然语言处理,分类)

圈子系统公众号app小程序系统源码公众号+圈子小程序：如何用“内容+社交”打造用户闭环生态？前端
圈子系统：构建"交流→共鸣→成长"的进阶生态一、系统设计理念演进1.0基础交流层话题发布/回复功能基础点赞评论互动简单分类标签系统2.0情感共鸣层情绪标签识别（AI分析内容情感倾向）共鸣指数算法（根据互动深度计算）志同道合推荐系统3.0成长体系层多维能力评估模型个性化成长路径成就勋章系统二、核心技术实现方案1.共鸣引擎#共鸣度计算算法示例defcalculate_resonance(topic):
Python 爬虫实战：爬取掘金平台文章（列表解析 + 技术领域分类统计） Python核芯 Python爬虫实战项目 python 爬虫开发语言
摘要：掘金平台汇聚了大量优质的编程技术和行业资讯文章。本文将深入讲解如何利用Python爬虫抓取掘金平台文章数据，解析文章列表信息，并进行技术领域分类统计，助力开发者了解技术热点和内容分布。一、引言掘金平台作为技术分享社区，专注于数字创业、编程技术和产品设计等领域。平台上的文章由开发者、创业者和设计者撰写，涵盖了从入门教程到前沿技术解析的丰富内容。通过爬取和分析这些文章数据，可以洞察当前技术领域的
Vibe Coding开发微信小程序实战案例程序员陆通微信小程序 notepad++小程序 AI编程
在AI编程时代，人人都能编程。我以"个人记账助手"小程序为例，详细演示整个开发过程。项目概述项目名称：个人记账助手功能描述：用户可以记录日常收支，查看统计图表，管理账单分类技术栈：微信小程序原生开发+云开发开发方式：VibeCoding+AI辅助第一阶段：需求分析与架构设计与AI对话进行需求梳理开发者描述：我想开发一个微信小程序，功能是个人记账。用户可以：1.添加收入和支出记录2.选择消费分类（餐
pytorch官方文档60分钟入门笔记 xiaodidadada 机器学习
文章目录1.张量（Tensors）定义张量张量操作2.自动求导（autograd）变量Variable3.神经网络4.训练一个分类器载入数据5.数据并行day63参考：官方文档https://blog.csdn.net/u014630987/article/details/786690511.张量（Tensors）tensors和numpy的ndarray类似,但是tensors可以使用GPU加快
百度颠覆了自己，飞算JavaAI造福了中国程序员！飞算JavaAI开发助手百度
在当今这个科技日新月异的时代，企业纷纷寻求技术突破，以期在激烈的市场竞争中脱颖而出。百度，作为中国互联网行业的领军企业之一，凭借其强大的科技实力和创新能力，在人工智能等多个领域取得了显著成就，并正在逐步颠覆自身的传统形象。百度自成立之初，就将技术创新视为企业的生命线。从最初的搜索引擎技术，到如今的深度学习、自然语言处理、计算机视觉等前沿领域，百度始终走在技术革新的前沿。其自主研发的飞桨深度学习平台
深度学习学习经验——卷积神经网络（CNN） Linductor 深度学习学习经验深度学习学习 cnn
卷积神经网络卷积神经网络（CNN）1.卷积神经网络的基本组成2.卷积操作3.激活函数（ReLU）4.池化操作5.全连接层6.卷积神经网络的完整实现项目示例项目目标1.加载数据2.卷积层：图像的特征探测器2.1第一个卷积层3.激活函数：增加非线性4.池化层：信息压缩器5.多层卷积和池化：逐层提取更高层次的特征6.全连接层：分类器7.模型训练和测试完整的项目示例代码总结卷积神经网络（CNN）卷积神经网
Python Day44 别勉. python机器学习 python 开发语言
Task：1.预训练的概念2.常见的分类预训练模型3.图像预训练模型的发展史4.预训练的策略5.预训练代码实战：resnet181.预训练的概念预训练（Pre-training）是指在大规模数据集上，先训练模型以学习通用的特征表示，然后将其用于特定任务的微调。这种方法可以显著提高模型在目标任务上的性能，减少训练时间和所需数据量。核心思想：在大规模、通用的数据（如ImageNet）上训练模型，学习丰
零基础起步：基于GpuGeek的文本生成模型实战昊昊该干饭了人工智能 nlp 深度学习 gpu算力 gru
在自然语言处理（NLP）领域，文本生成任务广泛应用于问答系统、智能摘要、内容创作等方向。本文将带领读者使用GpuGeek平台，从注册、上传数据到实例部署与训练，完整构建一个基于GPT2模型的文本生成系统，实战掌握AI模型的云端开发流程。目录一、GpuGeek平台使用流程详解1.注册与登录2.数据上传3.创建训练实例4.启动与使用实例5.关闭实例（手动&自动）二、文本生成实战任务：微调GPT-21.
大模型智能运维详解：技术架构、落地挑战与行业实践 FreeTools FreeAiGuard 运维架构人工智能运维开发科技
大模型智能运维详解：技术架构、落地挑战与行业实践作者：开源大模型智能运维FreeAiOps在数字化转型加速的背景下，企业IT系统复杂度呈指数级增长，传统运维模式面临效率低下、故障定位困难、成本高昂等瓶颈。大模型技术的出现为智能运维提供了突破性解决方案，其通过自然语言处理、多模态数据分析与自动化决策能力，正在重塑运维工作的底层逻辑。本文将从技术原理、落地挑战、行业实践三个维度，系统解析大模型智能运维
基于PLC的智能楼宇控制系统设计（源码+万字报告+部署讲解等) 炳烛之明科技 PLC
目录摘要2第一章绪论51.1引言51.2智能楼宇的课题背景51.3智能楼宇的功能和优势6第二章智能楼宇系统总体方案确定72.1智能楼宇系统总体方案的设计72.1.1智能楼宇概述72.1.2智能楼宇的分类71、建筑设备自动化系统(BA)72、通讯自动化系统（CA）73、办公自动化系统（OA）74、火灾报警于消防联动自动化系统（FA）85、安全保卫自动化系统（SA）82.1.2总体控制方案的设计82.
基于大模型的地中海贫血全流程预测与治疗管理研究报告 LCG元围术期危险因子预测模型研究人工智能
目录一、引言1.1研究背景与意义1.2研究目的与目标1.3研究方法与数据来源二、地中海贫血概述2.1疾病定义与分类2.2病因与发病机制2.3流行病学特征2.4临床表现与诊断方法三、大模型技术原理与应用现状3.1大模型基本原理3.2在医疗领域的应用案例3.3应用于地中海贫血预测的优势四、术前风险预测与手术方案制定4.1术前风险因素分析4.2大模型预测模型构建与验证4.3根据预测制定个性化手术方案五、
|cisco|ipv4地址-分类地址
验证分类ip地址的作用以及对路由器的功能进行初步了解构建简单的网络拓扑192.168.0.1---->192----->c类的ip地址---->前3个字节是网络号(192.168.0),后面1个字节(1)是用来表示主机的后面1个字节的取值范围是[0,255]192.168.0.0表示1个具体的c类网络最小标志主机的地址：192.168.0.1最大标志主机的地址：192.168.0.254192.1
IP地址的分类及范围详解：A、B、C、D、E五类是如何划分的倍云数据 ip代理 ip代理
IP地址类型最初设计互联网络时，为了便于寻址以及层次化构造网络，每个IP地址包括两个标识码(ID)，即网络ID和主机ID。同一个物理网络上的所有主机都使用同一个网络ID，网络上的一个主机(包括网络上工作站，服务器和路由器等)有一个主机ID与其对应。IP地址根据网络ID的不同分为5种类型，A类地址、B类地址、C类地址、D类地址和E类地址。A类IP地址一个A类IP地址由1字节的网络地址和3字节主机地址
JVM垃圾回收器俗尘某某 JVM java jvm jvm调优
JVM的垃圾回收机制主要通过不同的垃圾收集器来实现，垃圾收集器的设计围绕着几个核心目标：吞吐量、延迟（停顿时间）、内存占用，并根据它们工作的内存区域（年轻代/老年代）和工作方式（串行/并行/并发）进行分类。以下是JVM中主要的垃圾收集器类型及其特点，通常从两个维度来理解：维度一：按工作区域（分代收集的核心思想）年轻代收集器：主要负责回收年轻代（YoungGeneration）中的对象。特点：年轻代
深度学习之分类手写数字的网络 newyork major 卷积神经网络CNN 深度学习人工智能
面临的问题定义神经⽹络后，我们回到⼿写识别上来。我们可以把识别⼿写数字问题分成两个⼦问题：把包含许多数字的图像分成⼀系列单独的图像，每个包含单个数字；也就是把图像，分成6个单独的图像分类单独的数字我们将专注于编程解决第⼆个问题，分类单独的数字。这样是因为，⼀旦你有分类单独数字的有效⽅法，分割问题是不难解决的。⼀种⽅法是尝试不同的分割⽅式，⽤数字分类器对每⼀个切分⽚段打分；如果数字分类器对每⼀个⽚段
[AI笔记]-LLM中的3种架构:Encoder-Only、Decoder-Only、Encoder-Decoder Micheal超 AI笔记人工智能笔记架构
一、概述架构描述特点案例Encoder-Only仅包含编码器部分这类模型主要专注输入数据中提取特征或上下文信息，通常不需要生成新内容、只需要理解输入的任务，如：分类(文本分类、情感分析等)、信息抽取、序列标注等。在这种架构中，所有的注意力机制和网络层都集中在编码输入数据上，其输出通常是关于输入的复杂语义表示。谷歌的BERT、智谱AI发布的第四代基座大语言模型GLM4Decoder-Only也被称为
长尾形分布论文速览【80-119】木木阳 Long-tailed 人工智能
为便于理解和应用，以下将30篇关于长尾分布的研究文献按主题进行分类整理。每一大类包含相应的工作，帮助我们从整体上把握各方向的研究进展。1.长尾半监督学习与伪标签优化Paper90:Uncertainty-awareSamplingforLong-tailedSemi-supervisedLearning提出了一种动态阈值选择方法（UDTS），能有效改善尾部分类性能，适用于不平衡类别的半监督学习。P
Prompt Engineering 指南教程班磊闯Andrea
PromptEngineering指南教程Prompt-Engineering-Guidedair-ai/Prompt-Engineering-Guide:是一个用于指导对话人工智能开发的文档。适合用于学习对话人工智能开发和自然语言处理。特点是提供了详细的指南和参考资料，涵盖了多种对话人工智能技术和算法，并且可以自定义学习路径和行为。项目地址:https://gitcode.com/gh_mirr
电子词典开源项目源代码完全解析
本文还有配套的精品资源，点击获取简介：电子词典作为数字化学习工具，已由传统硬件发展为可定制的开源软件应用。本源代码提供深入理解其工作机制的机会，包括用户界面设计、词典数据库、查询引擎、翻译算法等。源代码通常由主流编程语言编写，涉及到数据结构与算法、UI设计、数据库管理、自然语言处理、本地化与多语言支持、版本控制、软件工程、API接口以及开源社区的协作和交流。1.电子词典工作原理和定制功能电子词典工
【ISAQB大纲解读】软件密集型系统的三大分类小马哥编程系统架构架构
软件密集型系统的类型划分为信息系统、嵌入式系统和移动系统，主要基于其应用场景、功能定位、硬件依赖程度及软件设计逻辑的显著差异。以下从三类系统的核心特征、典型场景及分类逻辑展开分析：一、软件密集型系统的定义与分类逻辑软件密集型系统指软件在系统功能实现中起决定性作用的系统，其分类本质上反映了不同场景下软件与硬件、业务需求的耦合方式。三类系统的划分依据包括：应用领域：商业办公、设备控制、移动交互等不同场
Python知识点：如何使用Nvidia Jetson与Python进行边缘计算杰哥在此 Python系列 python 边缘计算开发语言面试编程
开篇，先说一个好消息，截止到2025年1月1日前，翻到文末找到我，赠送定制版的开题报告和任务书，先到先得！过期不候！如何使用NvidiaJetson与Python进行边缘计算NvidiaJetson平台是专为边缘计算设计的一系列AI计算机，它们能够处理和分析来自物联网(IoT)设备和边缘节点的数据。这些设备小巧、节能且功能强大，非常适合用于执行机器学习、计算机视觉和自然语言处理等任务。Python
AI工作流平台对比分析 come11234 Ai 人工智能
以下是和「扣子工作流」（KoFlow）类似的AI工作流平台对比分析，涵盖主流工具的核心特点、使用方式、优缺点及区别：一、主流工作流平台分类平台类型核心定位代表用户扣子(KoFlow)低代码AI流程中文场景优化，深度集成大模型中文开发者/企业LangChain代码框架开发者灵活构建AI链Python开发者/AI工程师LlamaIndex数据增强框架企业级RAG（检索增强生成）数据工程师/知识库应用M
图论算法的大家庭——c++中的图论算法 imlarry0616 深度优先算法图论
图论算法是处理图结构问题的核心工具，广泛应用于路径规划、社交网络分析、计算机网络等领域。以下从基础概念、经典算法及其代码实现展开详细介绍，涵盖DFS、BFS、最短路径、最小生成树等核心内容，并附C++代码示例及注释。一、图的基础概念图的定义：由顶点（Vertex）集合V和边（Edge）集合E组成，记作G=(V,E)。分类：无向图：边无方向（如社交网络中的朋友关系）。有向图：边有方向（如网页链接关系
基于springboot+mysql+jpa+html实现商品销售信息系统五星资源 spring boot mysql java
基于springboot+mysql+jpa+html实现商品销售信息系统一、系统介绍1、系统主要功能：2.涉及技术框架：3.本项目所用环境：二、功能展示三、其它系统四、获取源码一、系统介绍1、系统主要功能：订单管理模块商品管理模块品牌管理模块分类管理模块客户管理模块供应商管理模块2.涉及技术框架：web框架：SpringBoot数据库框架：SpingDataJPA数据库：MySql项目构建工具：
AI人工智能领域：Bard的崛起之路 AIGC应用创新大全人工智能 bard ai
AI人工智能领域：Bard的崛起之路关键词：Bard、GoogleAI、大语言模型、对话式AI、自然语言处理、生成式AI、AI竞争摘要：本文深入探讨GoogleBard的发展历程、技术架构及其在AI领域的地位。我们将从Bard的诞生背景开始，分析其核心技术原理，比较与其他大语言模型的异同，并通过实际案例展示其应用场景。最后展望Bard的未来发展方向及面临的挑战。背景介绍目的和范围本文旨在全面解析G
脑机新手指南（二十）BCI2000 新手入门指南（下篇） Brduino脑机接口技术答疑脑机新手指南人工智能算法大数据
一、引言在上篇文章中，我们介绍了BCI2000的基本概念、特点和优势，以及安装、配置和基本使用流程。在本篇文章中，我们将深入探讨BCI2000的信号处理和分类算法，并提供一些实操的代码教程，帮助新手更好地掌握BCI2000的使用方法。二、BCI2000的信号处理（一）信号处理的基本概念在脑机接口系统中，信号处理是一个非常重要的环节，它的主要目的是从原始的脑电信号中提取有用的信息，并去除噪声和干扰。
磁盘是计算机存储设备的一种，用于持久存储和读取数据，通过磁性材料在盘片上制造磁道和磁点 Bol5261 engineering)Data(Structures Algorithms)App(Application Java Kotlin)制造网络
以下是关于磁盘的详细介绍：磁盘的定义与作用磁盘是计算机存储设备的一种，用于持久存储和读取数据。它以圆盘状的物理结构为基础，通过磁性材料在盘片上制造磁道和磁点，利用磁头来读写数据。其主要功能是存储操作系统、应用程序、用户数据等，并在需要时提供数据的读取和写入。磁盘的分类按磁头是否可以移动分类移动磁头式磁盘（MovableHeadDisk）：磁头可以移动，用于定位磁盘上不同的磁道，典型代表是机械硬盘（
Java基础集合框架结构分类图形骑牛小道士 java jvm 开发语言
集合集合分类分类图Collection分类Collection集合子结构之List合集Collection集合子结构之Set合集Collection集合子结构之Queue合集Map分类集合就是一个放数据的容器，准确的说是放数据对象引用的容器集合分类分类图java中集合分类有两大根接口Collection和Map集合CollectionMapCollection分类Collection集合的架构粗略
贝叶斯网络与深度学习的结合：图像识别和分类 AI天才研究院 AI人工智能与大数据计算 AI大模型企业级应用开发实战自然语言处理人工智能语言模型编程实践开发语言架构设计
本文我将为您撰写一篇关于"贝叶斯网络与深度学习的结合：图像识别和分类"的技术博客文章。这篇文章将深入探讨贝叶斯网络和深度学习在图像识别和分类领域的结合应用。我会遵循您提供的要求和结构模板,确保文章内容全面、深入且易于理解。让我们开始吧。贝叶斯网络与深度学习的结合：图像识别和分类关键词：贝叶斯网络、深度学习、图像识别、图像分类、概率推理、卷积神经网络、不确定性建模文章目录贝叶斯网络与深度学习的结合：
JVM垃圾回收调优知识点整理图灵农场个人笔记 jvm
目录1、JVM内存模型1.2、堆及垃圾回收1.3、JVM参数设置经验：1.4、对象逃逸分析：2、类加载2.1、类加载过程：2.2、类加载器分类：2.3、类加载机制：2.4、打破双亲委派机制：3、JVM内存分配机制4、如何判断对象可以被回收4.1、引用计数法4.2、可达性分析算法4.3、常见引用类型4.4、finalize()方法最终判定对象是否存活4.5、如何判断一个类是无用的类5、垃圾收集算法5
矩阵求逆（JAVA）利用伴随矩阵 qiuwanchi 利用伴随矩阵求逆矩阵
package gaodai.matrix; import gaodai.determinant.DeterminantCalculation; import java.util.ArrayList; import java.util.List; import java.util.Scanner; /** * 矩阵求逆(利用伴随矩阵) * @author 邱万迟
单例（Singleton）模式 aoyouzi 单例模式 Singleton
3.1 概述如果要保证系统里一个类最多只能存在一个实例时，我们就需要单例模式。这种情况在我们应用中经常碰到，例如缓存池，数据库连接池，线程池，一些应用服务实例等。在多线程环境中，为了保证实例的唯一性其实并不简单，这章将和读者一起探讨如何实现单例模式。 3.2
[开源与自主研发]就算可以轻易获得外部技术支持,自己也必须研发 comsci 开源
现在国内有大量的信息技术产品，都是通过盗版，免费下载，开源，附送等方式从国外的开发者那里获得的。。。。。。虽然这种情况带来了国内信息产业的短暂繁荣，也促进了电子商务和互联网产业的快速发展，但是实际上，我们应该清醒的看到，这些产业的核心力量是被国外的
页面有两个frame,怎样点击一个的链接改变另一个的内容 Array_06 UI XHTML
<a src="地址" targets="这里写你要操作的Frame的名字" />搜索然后你点击连接以后你的新页面就会显示在你设置的Frame名字的框那里 targerts="",就是你要填写目标的显示页面位置 ===================== 例如： <frame src=&
Struts2实现单个/多个文件上传和下载 oloz 文件上传 struts
struts2单文件上传：步骤01:jsp页面  　　<form action="fileUplo
推荐10个在线logo设计网站 362217990 logo
在线设计Logo网站。 1、http://flickr.nosv.org（这个太简单） 2、http://www.logomaker.com/?source=1.5770.1 3、http://www.simwebsol.com/ImageTool 4、http://www.logogenerator.com/logo.php?nal=1&tpl_catlist[]=2 5、ht
jsp上传文件香水浓 jsp fileupload
1. jsp上传 Notice： 1. form表单 method 属性必须设置为 POST 方法，不能使用 GET 方法 2. form表单 enctype 属性需要设置为 multipart/form-data 3. form表单 action 属性需要设置为提交到后台处理文件上传的jsp文件地址或者servlet地址。例如 uploadFile.jsp 程序文件用来处理上传的文
我的架构经验系列文章 - 前端架构 agevs JavaScript Web 框架 UI jQuer
框架层面：近几年前端发展很快，前端之所以叫前端因为前端是已经可以独立成为一种职业了，js也不再是十年前的玩具了，以前富客户端RIA的应用可能会用flash/flex或是silverlight，现在可以使用js来完成大部分的功能，因此js作为一门前端的支撑语言也不仅仅是进行的简单的编码，越来越多框架性的东西出现了。越来越多的开发模式转变为后端只是吐json的数据源，而前端做所有UI的事情。MVCMV
android ksoap2 中把XML(DataSet) 当做参数传递 aijuans android
我的android app中需要发送webservice ，于是我使用了 ksop2 进行发送，在测试过程中不是很顺利,不能正常工作.我的web service 请求格式如下 [html] view plain copy <Envelope xmlns="http://schemas.
使用Spring进行统一日志管理 + 统一异常管理 baalwolf spring
统一日志和异常管理配置好后，SSH项目中，代码以往散落的log.info() 和 try..catch..finally 再也不见踪影！统一日志异常实现类： [java] view plain copy package com.pilelot.web.util; impor
Android SDK 国内镜像 BigBird2012 android sdk
一、镜像地址： 1、东软信息学院的 Android SDK 镜像，比配置代理下载快多了。配置地址， http://mirrors.neusoft.edu.cn/configurations.we#android 2、北京化工大学的： IPV4:ubuntu.buct.edu.cn IPV4:ubuntu.buct.cn IPV6:ubuntu.buct6.edu.cn
HTML无害化和Sanitize模块 bijian1013 JavaScript AngularJS Linky Sanitize
一.ng-bind-html、ng-bind-html-unsafe AngularJS非常注重安全方面的问题，它会尽一切可能把大多数攻击手段最小化。其中一个攻击手段是向你的web页面里注入不安全的HTML，然后利用它触发跨站攻击或者注入攻击。考虑这样一个例子，假设我们有一个变量存
[Maven学习笔记二]Maven命令 bit1129 maven
mvn compile compile编译命令将src/main/java和src/main/resources中的代码和配置文件编译到target/classes中，不会对src/test/java中的测试类进行编译 MVN编译使用 maven-resources-plugin:2.6:resources maven-compiler-plugin:2.5.1:compile &nbs
【Java命令二】jhat bit1129 Java命令
jhat用于分析使用jmap dump的文件，，可以将堆中的对象以html的形式显示出来，包括对象的数量，大小等等，并支持对象查询语言。 jhat默认开启监听端口7000的HTTP服务，jhat是Java Heap Analysis Tool的缩写 1. 用法： [hadoop@hadoop bin]$ jhat -help Usage: jhat [-stack <bool&g
JBoss 5.1.0 GA:Error installing to Instantiated: name=AttachmentStore state=Desc ronin47
进到类似目录 server/default/conf/bootstrap，打开文件 profile.xml找到： Xml代码<bean name="AttachmentStore" class="org.jboss.system.server.profileservice.repository.AbstractAtta
写给初学者的6条网页设计安全配色指南 brotherlamp UI ui自学 ui视频 ui教程 ui资料
网页设计中最基本的原则之一是，不管你花多长时间创造一个华丽的设计，其最终的角色都是这场秀中真正的明星——内容的衬托我仍然清楚地记得我最早的一次美术课，那时我还是一个小小的、对凡事都充满渴望的孩子，我摆放出一大堆漂亮的彩色颜料。我仍然记得当我第一次看到原色与另一种颜色混合变成第二种颜色时的那种兴奋，并且我想，既然两种颜色能创造出一种全新的美丽色彩，那所有颜色
有一个数组，每次从中间随机取一个，然后放回去，当所有的元素都被取过，返回总共的取的次数。写一个函数实现。复杂度是什么。 bylijinnan java 算法面试
import java.util.Random; import java.util.Set; import java.util.TreeSet; /** * http://weibo.com/1915548291/z7HtOF4sx * #面试题#有一个数组，每次从中间随机取一个，然后放回去，当所有的元素都被取过，返回总共的取的次数。 * 写一个函数实现。复杂度是什么
struts2获得request、session、application方式 chiangfai application
1、与Servlet API解耦的访问方式。 a.Struts2对HttpServletRequest、HttpSession、ServletContext进行了封装，构造了三个Map对象来替代这三种对象要获取这三个Map对象，使用ActionContext类。 -----> package pro.action; import java.util.Map; imp
改变python的默认语言设置 chenchao051 python
import sys sys.getdefaultencoding() 可以测试出默认语言，要改变的话，需要在python lib的site-packages文件夹下新建： sitecustomize.py，这个文件比较特殊，会在python启动时来加载，所以就可以在里面写上： import sys sys.setdefaultencoding('utf-8') &n
mysql导入数据load data infile用法 daizj mysql 导入数据
我们常常导入数据！mysql有一个高效导入方法，那就是load data infile 下面来看案例说明基本语法： load data [low_priority] [local] infile 'file_name txt' [replace | ignore] into table tbl_name [fields [terminated by't'] [OPTI
phpexcel导入excel表到数据库简单入门示例 dcj3sjt126com PHP Excel
跟导出相对应的，同一个数据表，也是将phpexcel类放在class目录下，将Excel表格中的内容读取出来放到数据库中 <?php error_reporting(E_ALL); set_time_limit(0); ?> <html> <head> <meta http-equiv="Content-Type"
22岁到72岁的男人对女人的要求 dcj3sjt126com
22岁男人对女人的要求是：一，美丽，二，性感，三，有份具品味的职业，四，极有耐性，善解人意，五，该聪明的时候聪明，六，作小鸟依人状时尽量自然，七，怎样穿都好看，八，懂得适当地撒娇，九，虽作惊喜反应，但看起来自然，十，上了床就是个无条件荡妇。 32岁的男人对女人的要求，略作修定，是：一，入得厨房，进得睡房，二，不必服侍皇太后，三，不介意浪漫蜡烛配盒饭，四，听多过说，五，不再傻笑，六，懂得独
Spring和HIbernate对DDM设计的支持 e200702084 DAO 设计模式 spring Hibernate 领域模型
A：数据访问对象 DAO和资源库在领域驱动设计中都很重要。DAO是关系型数据库和应用之间的契约。它封装了Web应用中的数据库CRUD操作细节。另一方面，资源库是一个独立的抽象，它与DAO进行交互，并提供到领域模型的“业务接口”。资源库使用领域的通用语言，处理所有必要的DAO，并使用领域理解的语言提供对领域模型的数据访问服务。
NoSql 数据库的特性比较 geeksun NoSQL
Redis 是一个开源的使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库，并提供多种语言的API。目前由VMware主持开发工作。 1. 数据模型作为Key-value型数据库，Redis也提供了键（Key）和值（Value）的映射关系。除了常规的数值或字符串，Redis的键值还可以是以下形式之一： Lists （列表） Sets
使用 Nginx Upload Module 实现上传文件功能 hongtoushizi nginx
转载自： http://www.tuicool.com/wx/aUrAzm 普通网站在实现文件上传功能的时候，一般是使用Python，Java等后端程序实现，比较麻烦。Nginx有一个Upload模块，可以非常简单的实现文件上传功能。此模块的原理是先把用户上传的文件保存到临时文件，然后在交由后台页面处理，并且把文件的原名，上传后的名称，文件类型，文件大小set到页面。下
spring-boot-web-ui及thymeleaf基本使用 jishiweili spring thymeleaf
视图控制层代码demo如下： @Controller @RequestMapping("/") public class MessageController { private final MessageRepository messageRepository; @Autowired public MessageController(Mes
数据源架构模式之活动记录 home198979 PHP 架构活动记录数据映射
hello!架构一、概念活动记录（Active Record）：一个对象，它包装数据库表或视图中某一行，封装数据库访问，并在这些数据上增加了领域逻辑。对象既有数据又有行为。活动记录使用直截了当的方法，把数据访问逻辑置于领域对象中。二、实现简单活动记录活动记录在php许多框架中都有应用，如cakephp。 <?php /** * 行数据入口类 *
Linux Shell脚本之自动修改IP pda158 linux centos Debian 脚本
作为一名 Linux SA，日常运维中很多地方都会用到脚本，而服务器的ip一般采用静态ip或者MAC绑定，当然后者比较操作起来相对繁琐，而前者我们可以设置主机名、ip信息、网关等配置。修改成特定的主机名在维护和管理方面也比较方便。如下脚本用途为：修改ip和主机名等相关信息，可以根据实际需求修改，举一反三！ #!/bin/sh #auto Change ip netmask ga
开发环境搭建独浮云 eclipse jdk tomcat
最近在开发过程中，经常出现MyEclipse内存溢出等错误，需要重启的情况，好麻烦。对于一般的JAVA+TOMCAT项目开发，其实没有必要使用重量级的MyEclipse，使用eclipse就足够了。尤其是开发机器硬件配置一般的人。 &n