Dr.sky_

Bert+FGSM/PGD实现中文文本分类（Loss=0.5L1+0.5L2)

任务目标：在使用FGSM/PGD来训练Bert模型进行文本分类，其实现原理可以简单概括为以下几个步骤：

对原始文本每个词转换为对应的嵌入向量。

将每个嵌入向量与一个小的扰动向量相加，从而生成对抗样本。这个扰动向量的大小可以通过一个超参数来控制。

将生成的对抗样本和原始样本一起用于训练模型。具体来说，可以将它们组成一个batch，然后使用交叉熵损失函数来训练模型。

在训练过程中，可以周期性地增加扰动向量的大小，从而使得模型逐渐适应更强的攻击。这个过程可以称为“逐步增强对抗性训练”。

通过使用FGSM/PGD来训练Bert模型，可以使得模型对对抗样本更加鲁棒，从而提高其在真实场景中的泛化能力和分类准确率。

在训练过程中我们设置 总样本Loss=0.5原样本Loss+0.5对抗样本Loss，来提升模型的鲁棒性。

一、导入所需的库和模块

二、加载数据集

三、定义模型和优化器

四、基于原生Bert文本分类

4.1 定义训练函数

4.2 定义测试函数

五、Bert+FGSM文本分类

5.1 定义FGSM对抗训练函数

5.2 定义训练模型函数

5.3 定义测试函数

六、Bert+PGD文本分类

6.1 定义PGD攻击函数

6.2 定义训练函数

6.3 定义测试函数

在使用FGSM/PGD来训练Bert模型进行文本分类时，其实现原理可以概括为以下几个步骤：

一、导入所需的库和模块

这段代码主要是导入了一些必要的 PyTorch 和 transformers 库中的类和函数，其中： torch 是 PyTorch 库的主要模块，包含了大量的张量操作和神经网络模块等。 nn 是 PyTorch 中的神经网络模块，包含了各种神经网络层和模型等。 optim 是 PyTorch 中的优化器模块，包含了各种优化算法，如 SGD、Adam 等。 DataLoader 和 Dataset 是 PyTorch 中的数据集和数据加载器模块，用于加载和处理数据集。 BertTokenizerFast 是 transformers 库中的类，用于将文本转换为 BERT 模型的输入格式。 BertForSequenceClassification 是 transformers 库中的类，用于进行文本分类任务。

# 导入 PyTorch 库
import torch
# 导入 PyTorch 中的神经网络模块
import torch.nn as nn
# 导入 PyTorch 中的优化器模块
import torch.optim as optim
# 导入 PyTorch 中的数据集和数据加载器模块
from torch.utils.data import DataLoader, Dataset
# 导入 transformers 库中的 BertTokenizerFast 和 BertForSequenceClassification 类
from transformers import BertTokenizerFast, BertForSequenceClassification
import numpy as np

二、加载数据集

这段代码的主要作用是创建一个用于加载 THUCNews 数据集的数据集类 THUCNewsDataset，并实现 len 和 getitem 方法。其中： tqdm 库用于显示进度条，可以让我们在读取数据集时更直观地了解进度。 BertTokenizerFast.from_pretrained('bert-base-chinese') 创建了一个 BertTokenizerFast 对象，用于将文本转换为 BERT 模型的输入格式。 self.data 列表用于存储数据集中的每个样本，每个样本是一个元组，包含文本和标签。 init 方法用于初始化数据集对象。在该方法中，我们打开数据集文件，并逐行读取数据。对于每一行数据，我们使用 strip() 方法去除空格和换行符，然后使用 split('\t') 方法将文本和标签分开。最后，我们将文本和标签封装成一个元组，并将其添加到 self.data 列表中。 len 方法用于返回数据集的长度，即数据集中样本的个数。 getitem 方法用于获取数据集中的一个样本。在该方法中，我们从 self.data 列表中获取第 idx 个样本的文本和标签。然后，我们使用 self.tokenizer 将文本转换为 BERT 模型的输入格式，并将标签转换为 tensor，并将其添加到 inputs 字典中。最后，我们返回 inputs 字典。

# 导入 tqdm 库
from tqdm import tqdm
# 定义一个 THUCNewsDataset 类，继承自 PyTorch 中的 Dataset 类
class THUCNewsDataset(Dataset):
    # 定义构造函数，接收一个文件路径作为参数
    def __init__(self, file_path):
        # 初始化 BERT tokenizer
        self.tokenizer = BertTokenizerFast.from_pretrained('bert-base-chinese')
        # 定义一个列表，用于存储数据集中的每一条数据
        self.data = []
        # 打开数据集文件，逐行读取数据并处理
        with open(file_path, 'r', encoding='utf-8') as f:
            # 使用 tqdm 库显示读取进度
            for line in tqdm(f):
                # 从每一行数据中提取文本和标签，并将其存储到列表中
                text, label = line.strip().split('\t')
                self.data.append((text, int(label)))
    
    # 定义 __len__ 方法，返回数据集的大小
    def __len__(self):
        return len(self.data)
    
    # 定义 __getitem__ 方法，根据索引返回数据集中的一条数据
    def __getitem__(self, idx):
        # 从列表中获取文本和标签
        text, label = self.data[idx]
        # 使用 BERT tokenizer 对文本进行处理，将其转换为 BERT 模型的输入格式
        inputs = self.tokenizer(text, padding='max_length', truncation=True, max_length=32, return_tensors='pt')
        # 将标签转换为 PyTorch 的张量格式，并将其添加到输入中
        inputs['labels'] = torch.tensor(label)
        # 返回处理后的输入
        return inputs

# 加载训练集、测试集和验证集
train_dataset = THUCNewsDataset('train.txt')
test_dataset = THUCNewsDataset('test.txt')
dev_dataset = THUCNewsDataset('dev.txt')


# 导入 PyTorch 库中的 pad_sequence 函数，用于填充序列
from torch.nn.utils.rnn import pad_sequence

# 定义一个 collate_fn 函数，用于对数据进行批处理
def collate_fn(batch):
    # 从批次数据中提取 input_ids、attention_mask 和 labels
    input_ids = [item['input_ids'] for item in batch]
    attention_mask = [item['attention_mask'] for item in batch]
    labels = [item['labels'] for item in batch]
    # 对 input_ids 和 attention_mask 进行填充操作，使它们的长度相同
    input_ids = pad_sequence(input_ids, batch_first=True, padding_value=0)
    attention_mask = pad_sequence(attention_mask, batch_first=True, padding_value=0)
    # 将 labels 转换为 tensor 类型
    labels = torch.tensor(labels)
    # 返回一个字典，包含处理后的 input_ids、attention_mask 和 labels
    return {'input_ids': input_ids, 'attention_mask': attention_mask, 'labels': labels}

# 创建数据加载器，用于批量加载数据
train_loader = DataLoader(train_dataset, batch_size=32, shuffle=True, collate_fn=collate_fn)
test_loader = DataLoader(test_dataset, batch_size=32, shuffle=False, collate_fn=collate_fn)
dev_loader = DataLoader(dev_dataset, batch_size=32, shuffle=False, collate_fn=collate_fn)

三、定义模型和优化器

这段代码的主要作用是创建一个用于文本分类的 BERT 模型，并初始化优化器和损失函数。其中： BertForSequenceClassification.from_pretrained('bert-base-chinese', num_labels=10) 加载了预训练的 BERT 模型，并创建了一个用于文本分类的 BERT 模型。其中，'bert-base-chinese' 表示使用中文 BERT 模型，num_labels=10 表示模型的输出类别数为 10。 optim.Adam(model.parameters(), lr=2e-5) 创建了一个 Adam 优化器，用于更新模型参数。其中，model.parameters() 表示优化器需要更新的模型参数，lr=2e-5 表示学习率为 2e-5。 nn.CrossEntropyLoss() 创建了一个交叉熵损失函数，用于计算模型的损失。在文本分类任务中，通常使用交叉熵损失函数作为损失函数。

# 加载预训练的 BERT 模型，并创建一个用于文本分类的 BERT 模型
model = BertForSequenceClassification.from_pretrained('bert-base-chinese', num_labels=10)
# 创建一个 Adam 优化器，用于更新模型参数
optimizer = optim.Adam(model.parameters(), lr=2e-5)
# 创建一个交叉熵损失函数，用于计算模型的损失
criterion = nn.CrossEntropyLoss()

上面红色的提示是正常的，大概意思是指Bert用在下游任务需要微调。

四、基于原生Bert文本分类

4.1 定义训练函数

训练函数用于训练模型，测试函数用于测试模型在测试数据集上的性能。

# 训练函数在每个批次中都进行了反向传播和参数更新
def train(model, optimizer, criterion, train_loader, device):
    model.train() # 将模型设置为训练模式
    train_loss = 0 # 初始化训练损失为0
    train_acc = 0 # 初始化训练准确率为0
    for batch in train_loader: # 遍历训练数据集
        input_ids = batch['input_ids'].squeeze(1).to(device) # 将输入数据移动到计算设备上
        attention_mask = batch['attention_mask'].squeeze(1).to(device) # 将输入数据移动到计算设备上
        labels = batch['labels'].to(device) # 将标签移动到计算设备上
        optimizer.zero_grad() # 清空梯度
        outputs = model(input_ids, attention_mask=attention_mask, labels=labels) # 模型前向传播
        loss = criterion(outputs.logits, labels) # 计算损失
        train_loss += loss.item() # 累加损失
        loss.backward() # 反向传播，计算梯度
        optimizer.step() # 更新参数
        preds = torch.argmax(outputs.logits, dim=1) # 计算预测结果
        train_acc += torch.sum(preds == labels).item() # 计算准确率
    train_loss /= len(train_loader) # 计算平均损失
    train_acc /= len(train_loader.dataset) # 计算平均准确率
    return train_loss, train_acc # 返回训练损失和准确率
# 验证函数只进行了前向传播，没有进行反向传播和参数更新
def evaluate(model, criterion, test_loader, device):
    model.eval() # 将模型设置为评估模式
    test_loss = 0 # 初始化测试损失为0
    test_acc = 0 # 初始化测试准确率为0
    with torch.no_grad(): # 关闭梯度计算
        for batch in test_loader: # 遍历测试数据集
            input_ids = batch['input_ids'].squeeze(1).to(device) # 将输入数据移动到计算设备上
            attention_mask = batch['attention_mask'].squeeze(1).to(device) # 将输入数据移动到计算设备上
            labels = batch['labels'].to(device) # 将标签移动到计算设备上
            outputs = model(input_ids, attention_mask=attention_mask, labels=labels) # 模型前向传播
            loss = criterion(outputs.logits, labels) # 计算损失
            test_loss += loss.item() # 累加损失
            preds = torch.argmax(outputs.logits, dim=1) # 计算预测结果
            test_acc += torch.sum(preds == labels).item() # 计算准确率
    test_loss /= len(test_loader) # 计算平均损失
    test_acc /= len(test_loader.dataset) # 计算平均准确率
    return test_loss, test_acc # 返回测试损失和准确率

4.2 定义测试函数

# 将模型移动到计算设备上（GPU 或 CPU）
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
model.to(device)

# 训练模型
best_acc = 0 # 初始化最佳准确率为0
for epoch in range(10): # 遍历10个 epoch
    train_loss, train_acc = train(model, optimizer, criterion, train_loader, device) # 训练模型
    test_loss, test_acc = evaluate(model, criterion, test_loader, device) # 在测试集上评估模型
    dev_loss, dev_acc = evaluate(model, criterion, dev_loader, device) # 在验证集上评估模型
    # 输出当前 epoch 的训练损失、训练准确率、测试损失、测试准确率、验证损失和验证准确率
    print(f'Epoch {epoch + 1}: Train Loss {train_loss:.4f}, Train Acc {train_acc:.4f}, Test Loss {test_loss:.4f}, Test Acc {test_acc:.4f}, Dev Loss {dev_loss:.4f}, Dev Acc {dev_acc:.4f}')
    if dev_acc > best_acc: # 如果当前 epoch 的验证准确率大于历史最佳准确率
        best_acc = dev_acc # 更新历史最佳准确率
        torch.save(model.state_dict(), 'best_model.pt') # 保存模型参数到文件 best_model.pt

五、Bert+FGSM文本分类

以下是使用FGSM在embedding添加干扰，并考虑到对抗性样本的防御的训练和测试函数。我们在train()函数中添加了epsilon参数，以控制对抗性样本的干扰程度。我们还计算了原始样本的损失和对抗性样本的损失，并将它们加权平均作为总损失。在evaluate()函数中，我们仅对模型进行前向传递，以便计算测试损失和准确率。 BertTokenizerFast 是 transformers 库中的一个高速分词器，它是 BertTokenizer 的改进版本。与 BertTokenizer 不同，BertTokenizerFast 使用 Rust 实现的底层代码，因此在分词速度方面更快。另外，BertTokenizerFast 还支持更多的特殊标记，例如 Truncation，Padding，以及更好的处理未知单词（out-of-vocabulary，OOV）。如果你的代码需要处理大量文本数据，那么使用 BertTokenizerFast 可以显著提高代码的执行效率。但是，如果你的代码只需要处理少量文本数据，那么使用 BertTokenizer 更加方便和易于使用。

5.1 定义FGSM对抗训练函数

这是一个用于生成对抗样本的函数，输入参数包括原始文本嵌入向量embedding，扰动大小epsilon和梯度gradient。该函数会计算梯度的符号，创建扰动，并将扰动限制在有效范围内。最后返回生成的对抗样本。这段代码实现了 FGSM 对抗攻击，目的是在原始输入的嵌入（embeddings）中添加一些干扰，以生成对抗样本（adversarial sample）。

具体来说，这个函数接受三个参数：原始输入的嵌入（embeddings）、对于原始输入的梯度（grad）、添加干扰的程度（epsilon）。它首先将梯度值（grad）符号化（sign），得到输入的梯度符号，然后与干扰程度（epsilon）相乘，得到干扰值（perturb）。最后，将干扰（perturb）添加到原始输入的嵌入中，得到对抗样本的嵌入（perturb_embeds）。

FGSM 对抗攻击的核心思想是在保证对抗样本与原始样本之间尽可能小的距离（即干扰程度尽可能小）的同时，使得对抗样本能够欺骗深度学习模型。这个距离被称为 L_p 距离，通常选择 L_∞ 距离，即干扰程度的上界为 epsilon。

def fgsm_attack(embedding, epsilon, gradient):
    # 计算梯度的符号
    if gradient is None:
        print('gradient is None')
        return embedding
    sign_gradient = gradient.sign()
    # 创建扰动
    perturbed_embedding = embedding + epsilon * sign_gradient
    # 将扰动限制在有效范围内
    perturbed_embedding = torch.clamp(perturbed_embedding, min=0, max=1)
    return perturbed_embedding

5.2 定义训练模型函数

这是用于训练模型的函数，输入参数包括模型model，优化器optimizer，损失函数criterion，训练数据集的数据加载器train_loader，计算设备device和。该函数会遍历训练数据集，将输入数据和标签移动到计算设备上，清空梯度，生成对抗样本，计算损失和梯度，更新参数，计算准确率等操作，并返回训练损失和准确率。

学习率调度器的作用是在训练过程中自动调整学习率，以提高模型的训练效果。 ReduceLROnPlateau 是一个 PyTorch 自带的学习率调度器类，它有以下参数： optimizer：优化器对象，用于更新模型参数； mode：模式，可选值为 min、max 或 auto，表示监测的指标是越小越好、越大越好还是自动选择。这里我们选择 max，表示准确率越大越好； factor：学习率缩放因子，每次调整学习率时将当前学习率乘以该因子； patience：当监测指标在 patience 轮内没有变化时，减小学习率； verbose：是否打印调度器信息； epsilon：学习率变化的最小阈值，如果新学习率与旧学习率之间的差异小于该阈值，则不会更新学习率； cooldown：调整学习率后，暂停更新学习率的轮数； min_lr：学习率的下限； eps：数值稳定性参数。当调用 scheduler.step(acc) 时，调度器会根据当前的准确率 acc 来自动调整学习率。如果在 patience 轮内准确率没有提高，则会将学习率缩小 factor 倍，直到学习率达到下限 min_lr。

# 创建一个 Adam 优化器，用于更新模型参数
parameters = [p for p in model.parameters() if p.requires_grad]
optimizer = optim.Adam(parameters, lr=2e-5)
scheduler = ReduceLROnPlateau(optimizer, mode='max', factor=0.5, patience=3, verbose=1, epsilon=1e-4, cooldown=0, min_lr=0, eps=1e-8)
def train(model, optimizer, criterion, train_loader, device, epsilon):
    model.train() # 将模型设置为训练模式
    train_loss = 0 # 初始化训练损失为0
    train_acc = 0 # 初始化训练准确率为0
    tokenizer = BertTokenizerFast.from_pretrained('bert-base-chinese')
    for batch in train_loader: # 遍历训练数据集
        input_ids = batch['input_ids'].squeeze(1).to(device) # 将输入数据移动到计算设备上
        attention_mask = batch['attention_mask'].squeeze(1).to(device) # 将输入数据移动到计算设备上
        labels = batch['labels'].to(device) # 将标签移动到计算设备上
        optimizer.zero_grad() # 清空梯度
        embedding = model.bert.embeddings.word_embeddings(input_ids)
        embedding = embedding.detach().clone().requires_grad_(True)
        embedding.retain_grad()  # 保留梯度信息
        outputs = model(inputs_embeds=embedding, attention_mask=attention_mask)
        loss = criterion(outputs.logits, labels)
        embedding_grad = torch.autograd.grad(loss, embedding, allow_unused=True, retain_graph=True)[0]
        perturbed_embedding = fgsm_attack(embedding, epsilon, embedding_grad) # 添加扰动
        perturbed_tokens = tokenizer.convert_ids_to_tokens(np.argmax(perturbed_embedding.detach().cpu().numpy(), axis=-1).tolist()[0])
        perturbed_input_ids = torch.tensor(tokenizer.convert_tokens_to_ids(perturbed_tokens)).unsqueeze(0).to(device) # 将tokens转换为input_ids
        perturbed_outputs = model(perturbed_input_ids, attention_mask=attention_mask, labels=labels) # 模型前向传播
        perturbed_loss = criterion(perturbed_outputs.logits, labels) # 计算对抗样本损失
        optimizer.zero_grad() # 清空梯度
        loss = 0.5 * loss + 0.5 * perturbed_loss # 计算总损失
        loss.backward() # 反向传播，计算总梯度
        optimizer.step() # 更新参数
        pbar(step=step, info={'loss': loss.item()})
        preds = torch.argmax(outputs.logits, dim=1) # 计算原样本预测结果
        train_loss += loss.item() # 累加原样本损失
        train_acc += torch.sum(preds == labels).item() # 计算原样本准确率
    train_loss /= len(train_loader) # 计算平均原样本损失
    train_acc /= len(train_loader.dataset) # 计算平均原样本准确率
    return train_loss, train_acc # 返回训练损失和准确率

def evaluate(model, criterion, test_loader, device):
    """
    测试函数，仅进行前向传播，不生成对抗样本
    :param model: 模型
    :param criterion: 损失函数
    :param test_loader: 测试数据集的数据加载器
    :param device: 计算设备
    :return: 测试损失和准确率
    """
    model.eval() # 设置模型为评估模式
    test_loss = 0
    test_acc = 0
    with torch.no_grad(): # 关闭梯度计算
        for batch in test_loader:
            input_ids = batch['input_ids'].squeeze(1).to(device) # 将输入数据移动到计算设备上
            attention_mask = batch['attention_mask'].squeeze(1).to(device)
            labels = batch['labels'].to(device)
            outputs = model(input_ids, attention_mask=attention_mask, labels=labels) # 模型前向传播
            loss = criterion(outputs.logits, labels) # 计算损失
            test_loss += loss.item() # 加损失
            preds = torch.argmax(outputs.logits, dim=1) # 计算预测结果
            test_acc += torch.sum(preds == labels).item() #计算准确率
    test_loss /= len(test_loader) # 计算平均损失
    test_acc /= len(test_loader.dataset) # 计算平均准确率
    return test_loss, test_acc

5.3 定义测试函数

这是用于测试模型的函数，输入参数包括模型model，损失函数criterion，测试数据集的数据加载器test_loader和计算设备device。该函数会将模型设置为评估模式，关闭梯度计算，进行前向传播，计算损失和准确率，并返回测试损失和准确率。

# 将模型移动到计算设备上（GPU 或 CPU）
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
model.to(device)
best_acc = 0 # 初始化最佳准确率为0
for epoch in range(10): # 进行10轮训练
    train_loss, train_acc = train(model, optimizer, criterion, train_loader, device, epsilon=0.3) # 训练模型，并获取训练损失和准确率
    test_loss, test_acc = evaluate(model, criterion, test_loader, device) # 对测试集进行测试，并获取测试损失和准确率
    dev_loss, dev_acc = evaluate(model, criterion, dev_loader, device) # 对验证集进行测试，并获取验证损失和准确率
    print(f'Epoch {epoch+1}, Train Loss {train_loss:.4f}, Train Acc {train_acc:.4f}, Test Loss {test_loss:.4f}, Test Acc {test_acc:.4f}, Dev Loss {dev_loss:.4f}, Dev Acc {dev_acc:.4f}')
    # 打印训练轮数、训练损失和准确率、测试损失和准确率、验证损失和准确率
    if dev_acc > best_acc: # 如果当前验证准确率大于最佳准确率
        best_acc = dev_acc # 更新最佳准确率
        torch.save(model.state_dict(), 'adv_best_model.pt') # 保存模型参数到文件'best_model.pt'

六、Bert+PGD文本分类

FGSM（Fast Gradient Sign Method）和 PGD（Projected Gradient Descent）都是对抗训练中常用的方法，它们的主要区别在于对抗样本的生成方式和训练策略上。

FGSM 是一种基于梯度的对抗样本生成方法，它通过计算损失函数对输入数据的梯度来生成对抗样本。具体来说，对于一个输入样本，FGSM 会计算其梯度，然后将其与一个小的扰动值相乘，从而生成一个对抗样本。FGSM 的优点是计算效率高，但缺点是生成的对抗样本可能不够鲁棒，容易被攻击者攻击。

PGD 是一种基于迭代的对抗样本生成方法，它通过迭代多次生成对抗样本，并在每次迭代中对生成的对抗样本进行投影，以保证其在一定范围内。具体来说，PGD 会在每次迭代中计算输入数据的梯度，然后对其进行一定程度的扰动，并将扰动后的结果进行投影，以保证其在一定范围内。PGD 的优点是生成的对抗样本更加鲁棒，但缺点是计算效率较低。

在 Bert 文本分类任务中，采用 FGSM 和 PGD 对抗训练的区别主要在于训练策略上。FGSM 对抗训练通常采用单次扰动，而 PGD 对抗训练通常采用多次迭代扰动。在 FGSM 对抗训练中，每次训练只使用一个对抗样本，而在 PGD 对抗训练中，每次训练使用多个对抗样本。因此，PGD 对抗训练的鲁棒性更强，但计算代价也更高。

6.1 定义PGD攻击函数

def pgd_attack(model, embedding, attention_mask, labels, epsilon, embedding_grad, alpha, num_iters):
    """
    PGD 攻击函数
    :param model: 模型
    :param embedding: 原始输入的嵌入表示
    :param attention_mask: 输入的注意力掩码
    :param labels: 标签
    :param epsilon: 扰动范围
    :param embedding_grad: 原始输入的嵌入表示的梯度
    :param alpha: 步长
    :param num_iters: 迭代次数
    :return: 添加扰动后的嵌入表示
    """
    perturbed_embedding = torch.nn.Parameter(embedding) # 将嵌入表示转换为可训练的参数
    for i in range(num_iters):
        perturbed_embedding.requires_grad = True # 设置扰动为可求导
        perturbed_outputs = model(inputs_embeds=perturbed_embedding, attention_mask=attention_mask, labels=labels) # 模型前向传播
        perturbed_loss = criterion(perturbed_outputs.logits, labels) # 计算对抗样本损失
        perturbed_grad = torch.autograd.grad(perturbed_loss, perturbed_embedding, allow_unused=True, retain_graph=True)[0] # 计算梯度
        perturbed_embedding = perturbed_embedding.detach() + alpha * torch.sign(perturbed_grad) # 梯度方向上进行一定的步长更新
        perturbed_embedding = torch.max(torch.min(perturbed_embedding, embedding + epsilon), embedding - epsilon) # 将扰动限制在一定范围内
        perturbed_embedding = torch.nn.Parameter(perturbed_embedding) # 将更新后的嵌入表示重新转换为可训练的参数

    return perturbed_embedding

6.2 定义训练函数

def train(model, optimizer, criterion, train_loader, device, epsilon, alpha, num_iters):
    model.train() # 将模型设置为训练模式
    train_loss = 0 # 初始化训练损失为0
    train_acc = 0 # 初始化训练准确率为0
    tokenizer = BertTokenizerFast.from_pretrained('bert-base-chinese')
    for batch in train_loader: # 遍历训练数据集
        input_ids = batch['input_ids'].squeeze(1).to(device) # 将输入数据移动到计算设备上
        attention_mask = batch['attention_mask'].squeeze(1).to(device) # 将输入数据移动到计算设备上
        labels = batch['labels'].to(device) # 将标签移动到计算设备上
        optimizer.zero_grad() # 清空梯度
        embedding = model.bert.embeddings.word_embeddings(input_ids)
        embedding = embedding.detach().clone().requires_grad_(True)
        embedding.retain_grad()  # 保留梯度信息
        outputs = model(inputs_embeds=embedding, attention_mask=attention_mask)
        loss = criterion(outputs.logits, labels)
        embedding_grad = torch.autograd.grad(loss, embedding, allow_unused=True, retain_graph=True)[0]
        perturbed_embedding = pgd_attack(model, embedding, attention_mask, labels, epsilon, embedding_grad, alpha, num_iters)  # 添加扰动
        perturbed_tokens = tokenizer.convert_ids_to_tokens(np.argmax(perturbed_embedding.detach().cpu().numpy(), axis=-1).tolist()[0])
        perturbed_input_ids = torch.tensor(tokenizer.convert_tokens_to_ids(perturbed_tokens)).unsqueeze(0).to(device) # 将tokens转换为input_ids
        perturbed_outputs = model(perturbed_input_ids, attention_mask=attention_mask, labels=labels) # 模型前向传播
        perturbed_loss = criterion(perturbed_outputs.logits, labels) # 计算对抗样本损失
        optimizer.zero_grad() # 清空梯度
        loss = 0.5 * loss + 0.5 * perturbed_loss # 计算总损失
        loss.backward() # 反向传播，计算总梯度
        optimizer.step() # 更新参数
        preds = torch.argmax(outputs.logits, dim=1) # 计算原样本预测结果
        train_loss += loss.item() # 累加原样本损失
        train_acc += torch.sum(preds == labels).item() # 计算原样本准确率
    train_loss /= len(train_loader) # 计算平均原样本损失
    train_acc /= len(train_loader.dataset) # 计算平均原样本准确率
    return train_loss, train_acc # 返回训练损失和准确率

def evaluate(model, criterion, test_loader, device):
    """
    测试函数，仅进行前向传播，不生成对抗样本
    :param model: 模型
    :param criterion: 损失函数
    :param test_loader: 测试数据集的数据加载器
    :param device: 计算设备
    :return: 测试损失和准确率
    """
    model.eval() # 设置模型为评估模式
    test_loss = 0
    test_acc = 0
    with torch.no_grad(): # 关闭梯度计算
        for batch in test_loader:
            input_ids = batch['input_ids'].squeeze(1).to(device) # 将输入数据移动到计算设备上
            attention_mask = batch['attention_mask'].squeeze(1).to(device)
            labels = batch['labels'].to(device)
            outputs = model(input_ids, attention_mask=attention_mask, labels=labels) # 模型前向传播
            loss = criterion(outputs.logits, labels) # 计算损失
            test_loss += loss.item() # 加损失
            preds = torch.argmax(outputs.logits, dim=1) # 计算预测结果
            test_acc += torch.sum(preds == labels).item() #计算准确率
    test_loss /= len(test_loader) # 计算平均损失
    test_acc /= len(test_loader.dataset) # 计算平均准确率
    return test_loss, test_acc

6.3 定义测试函数

# 将模型移动到计算设备上（GPU 或 CPU）
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
model.to(device)
best_acc = 0 # 初始化最佳准确率为0
for epoch in range(10): # 进行10轮训练
    train_loss, train_acc = train(model, optimizer, criterion, train_loader, device, epsilon=0.3, alpha=0.04, num_iters=5) # 训练模型，并获取训练损失和准确率
    test_loss, test_acc = evaluate(model, criterion, test_loader, device) # 对测试集进行测试，并获取测试损失和准确率
    dev_loss, dev_acc = evaluate(model, criterion, dev_loader, device) # 对验证集进行测试，并获取验证损失和准确率
    print(f'Epoch {epoch+1}, Train Loss {train_loss:.4f}, Train Acc {train_acc:.4f}, Test Loss {test_loss:.4f}, Test Acc {test_acc:.4f}, Dev Loss {dev_loss:.4f}, Dev Acc {dev_acc:.4f}')
    # 打印训练轮数、训练损失和准确率、测试损失和准确率、验证损失和准确率
    if dev_acc > best_acc: # 如果当前验证准确率大于最佳准确率
        best_acc = dev_acc # 更新最佳准确率
        torch.save(model.state_dict(), 'adv_best_model.pt') # 保存模型参数到文件'best_model.pt'

综上所述，在Bert文本分类的基础上，分别加上FGSM、PGD对抗训练，分类结果基本差不多，而FGSM的训练速度要比PGD快。当然分类准确率可能跟数据集有关，理论上PGD攻击的鲁棒性和效果应该更好。

你可能感兴趣的:(对抗网络,bert,分类,深度学习)

Python编程实战：爬虫与数据可视化的全过程草莓味儿柠檬
本文还有配套的精品资源，点击获取简介：本项目通过Python编程实现网络数据爬取和数据可视化，适合初学者深入了解Python。我们将涵盖基础语法、网络爬虫技术、数据处理、可视化技术、文件操作和错误处理等关键知识点，最终完成从爬取各省降水量数据到可视化展示的全过程。1.Python基础语法使用Python作为一门流行的编程语言，因其简洁和易读性被广泛应用于网络爬虫、数据处理和可视化等领域。本章将帮助
《网络安全自学教程》- SQL注入漏洞详解士别三日wyx 《网络安全自学教程》sql 数据库网络安全安全 web安全
《网络安全自学教程》SQL注入的原理其实很简单：由于后端过滤不严格，把用户输入的数据当成SQL语句执行了。SQL注入1、SQL注入常出现在哪些功能？2、SQL注入危害3、SQL注入分类4、判断是否存在SQL注入5、SQL注入方式6、SQL注入防御6.1、预编译1、SQL注入常出现在哪些功能？凡是涉及「数据库操作的功能」，都有可能存在SQL注入，比如：搜索框等查询功能。用户注册/用户登录功能。密码找
构建全栈式数据库与消息队列服务治理体系：监控、告警与组件搭配实践喝醉酒的小白 DBA K8s 数据库
目录标题分类✅一、分类总览表✅二、详细分类说明1.关系型数据库（RDBMS）2.NoSQL数据库3.分布式系统协调组件4.消息队列系统✅三、按用途分类（实战参考）✅四、开源vs商业（闭源）分类全面的监控指标分类与告警模板清单✅一、通用结构✅二、数据库系统级别详细监控项与告警模板1.MySQL/TiDB/OceanBase2.PostgreSQL/openGauss/GaussDB/KingBase
基于python的公众号文章爬取思路（总结版）大数据小学僧 python 开发语言爬虫微信公众平台
目录一、技术方案分类1.接口直连模式（推荐）2.网页解析模式3.第三方API模式二、核心技术栈三、爬虫实现步骤1.接口直连模式（微信公众平台API）2.网页解析模式（搜狗微信搜索）3.第三方API模式（如清博大数据）四、可视化界面实现五、数据存储方案六、高级技巧七、注意事项八、推荐工具链一、技术方案分类1.接口直连模式（推荐）2.网页解析模式3.第三方API模式二、核心技术栈三、爬虫实现步骤1.接
OpenCV图像噪点消除五大滤波方法慕婉0307 opencv基础 opencv 人工智能计算机视觉
在数字图像处理中，噪点消除是提高图像质量的关键步骤。本文将基于OpenCV库，详细讲解五种经典的图像去噪滤波方法：均值滤波、方框滤波、高斯滤波、中值滤波和双边滤波，并通过丰富的代码示例展示它们的实际应用效果。一、图像噪点与滤波基础1.1常见图像噪声类型高斯噪声：符合正态分布的随机噪声椒盐噪声：随机出现的黑白像素点泊松噪声：光子计数噪声量化噪声：模拟信号数字化过程中产生1.2滤波方法分类滤波类型特点
从阻塞到异步：Java NIO与AIO的高性能网络编程实战全解析小张在编程网络 java nio
引言在高并发网络时代，传统BIO的“一个连接一个线程”模式早已力不从心——当万级连接涌来时，服务器线程池瞬间告急，资源耗尽的警报此起彼伏。JavaNIO与AIO的出现，如同为网络编程装上了“多线程调度器”和“异步引擎”：NIO用非阻塞机制化解并发瓶颈，让单线程管理千个连接成为可能；AIO则更进一步，通过事件回调实现真正异步，让程序在I/O等待时不再“干瞪眼”。本文将从原理到实战，带您揭开这两大高级
容器挂载传播模式学习岳来 #容器运维学习 k8s 容器挂载传播
在容器技术中，挂载传播模式（MountPropagationMode）定义了挂载点在主机和容器之间的传播行为。它决定了当主机或容器中的挂载点发生变化时，这些变化是否会影响到其他挂载点。挂载传播模式在多容器共享挂载、动态挂载更新等场景中非常重要。以下是挂载传播模式的详细解释及其分类：1.挂载传播模式的作用挂载传播模式主要用于控制挂载点的变化如何在主机和容器之间传播。例如：当主机上新增一个挂载点时，是
【翻译】多标签分类评价指标metrices multi-label classification surrender2u NLP 自然语言处理
翻译日期：2020-05-15翻译来源：LohithmunakalaAug28,2020MetricsforMulti-LabelClassification原地址：https://medium.com/analytics-vidhya/metrics-for-multi-label-classification-49cc5aeba1c3删减版本正文：用于多标签分类的最常见指标如下：Precisi
基于Spring Boot的网络购物商城的设计与实现代论文网课招代理 spring boot 后端 java
目录摘要：IAbstract：II第1章系统分析11.1系统概述11.2系统可行性分析11.2.1技术可行性分析11.2.2经济可行性分析11.2.3社会可行性分析11.3需求分析21.2.1业务角色分析21.2.2用例分析3第2章系统设计42.1功能模块设计42.2功能流程设计52.2.1商品加入购物车流程52.2.2用户下单流程62.3数据库设计72.3.1数据库E-R设计72.3.2数据表设
PCB设计实践(三十七）PCB机械孔设计全解析：作用原理与设计规范指南技术流浪者 PCB设计硬件工程 PCB设计单片机嵌入式硬件
在PCB设计中，机械孔是实现电路板机械固定、电气连接和功能扩展的核心要素之一。其设计质量直接影响PCB的组装效率、结构稳定性和长期可靠性。本文将从机械孔的基础概念出发，系统阐述其在PCB设计中的作用原理、分类特性、设计规范及进阶技巧，为工程师提供全面的设计指导。一、机械孔的核心作用解析机械孔在PCB中承担着多重关键功能，其作用远超过单纯的物理开孔概念：1.机械固定与结构支撑作为电路板与外壳、散热器
【ESP32摄像头开发实例】-视频流接入Home Assistant 视觉与物联智能物联网全栈开发实战 ESP32 单片机 MCU 物联网智能家居 Home Assistant 嵌入式硬件
ESP32-CAM视频流接入HomeAssistant文章目录ESP32-CAM视频流接入HomeAssistant1、硬件、软件准备2、ESP32-CAM介绍3、视频流服务器代码实现4、程序下载到开发板5、接入HomeAssistant在这个项目中，我们将使用ESP32-CAM板构建一个IP监控摄像头。ESP32摄像头将托管一个视频流媒体网络服务器，您可以使用网络中的任何设备进行访问。1、硬件、
番外篇 | SEAM-YOLO：引入SEAM系列注意力机制，提升遮挡小目标的检测性能小哥谈 YOLOv8：从入门到实战 YOLO 深度学习人工智能机器学习计算机视觉神经网络
前言：Hello大家好，我是小哥谈。SEAM(Squeeze-and-ExcitationAttentionModule)系列注意力机制是一种高效的特征增强方法，特别适合处理遮挡和小目标检测问题。该机制通过建模通道间关系来自适应地重新校准通道特征响应。在遮挡小目标检测中的应用优势包括：1）通道注意力增强：SEAM通过全局平均池化捕获通道级全局信息，帮助网络在遮挡情况下仍能关注关键特征。2）多尺度特
NB-IoT协议深度解析与应用实践.zip 豪欧巴
本文还有配套的精品资源，点击获取简介：NB-IoT（窄带物联网）是针对LPWAN（低功耗广域网络）领域设计的物联网技术，其特点是覆盖广泛、功耗低、设备连接能力强。技术概述包括了NB-IoT的技术目标和特点，如深度覆盖、高效节能、大连接能力及低成本。核心特性涵盖了物理层、媒介接入控制层、网络层、会话层以及应用层的协议栈分析。此外，还介绍了NB-IoT的部署模式，以及在智慧城市、智能表计、资产追踪、农
什么是IDS IPS以及IDS，IPS的区别 ke0hly 应急响应网络系统安全安全
目录IDS入侵检测系统定义工作原理主要功能主要类型：主动被动局限性：IPS入侵检测系统定义为什么会有IPS？功能主要类型主动被动IDS，IPS区别，选择IDS入侵检测系统定义入侵检测即通过从网络系统中的若干关键节点收集并分析信息，监控网络中是否有违反安全策略的行为或者是否存在入侵行为。入侵检测系统通常包含3个必要的功能组件：信息来源、分析引擎和响应组件。工作原理信息收集：信息收集包括收集系统，网络
数据标注师学习内容汇总试着数据标注师学习数据标注师
目录文本标注图像标注语音标注文本标注词性标注1词性标注2实体标注关系标注事件标注1事件标注2意图标注关键词标注分类标注问答标注对话标注图像标注拉框标注关键点标注2D标注3D标注线标注目标跟踪标注OCR标注图像分类标注语音标注语音切割转写语音校对标注拼音和停顿标注
IP证书在网络安全中的作用 qwerdfwc_ 安全 web安全网络
IP证书（IPSSL证书）是SSL/TLS证书的一种，与传统的域名SSL证书不同，它直接绑定到服务器的IP地址而非域名，在网络安全中发挥着多方面的重要作用，以下是详细介绍：身份验证作用机制：IP证书由受信任的证书颁发机构（CA）颁发。在申请过程中，CA会对申请者的IP地址进行严格的身份验证，确保申请者对该IP地址拥有合法的控制权。只有通过验证的IP地址才能获得相应的证书。重要性：这种身份验证机制可
办公IT问题管理平台（含移动端和PC端的问题提报与工单跟踪）避坑 Alex艾力的IT数字空间微服务 vscode 安全 tomcat spring boot 功能测试 ux
一、核心功能模块设计1.问题提报模块多渠道接入支持Web端、移动端（APP/小程序）、邮件、电话、企业微信/钉钉集成等多种提交方式，用户可快速描述问题并上传截图或附件。智能表单：根据用户角色（如员工、部门管理员）动态展示字段（如部门、设备类型、影响范围）。自动分类与优先级：通过关键词识别（如“网络中断”“系统崩溃”）自动分配问题分类，结合预设规则（如影响用户数）设定优先级。用户界面优化移动端：简化
E IO流.java 是紫焅呢 26字母学习：java入门篇 java 开发语言学习方法 visual studio code 后端
前言：I/O（输入/输出）操作是构建各类应用程序的基石之一。Java提供了功能强大且灵活的I/O流机制，用于处理数据的读取与写入，无论是简单的文本文件操作，还是复杂的网络数据传输，都离不开I/O流的支持。目录一、初识JavaI/O流数据的“传送带”二、字节流操作从读取到写入的实战1.读取文件（字节流）2.写入文件（字节流）三、字符流操作读写文本文件的简便之道1.读取文件（字符流）2.写入文件（字符
探秘 SELinux Notebook：安全增强的利器与实践指南纪亚钧
探秘SELinuxNotebook：安全增强的利器与实践指南去发现同类优质开源项目:https://gitcode.com/在网络安全日益重要的今天，SELinux（Security-EnhancedLinux）作为Linux内核的安全模块，提供了强制访问控制机制，极大地增强了系统的安全性。而SELinuxNotebook则是为了帮助用户更好地理解和使用SELinux的一款交互式教程平台。它将复杂
AI生成代码安全审计：从AST逆向到对抗样本生成梦玄海人工智能安全
引言随着Codex、Copilot等AI代码生成工具的普及，开发效率显著提升的同时，也引入了新型安全风险：模型生成的代码可能隐含漏洞（如SQL注入、XSS）、逻辑错误，或被恶意样本“投毒”。传统的静态扫描工具（如SonarQube）难以覆盖AI模型的上下文语义逻辑，亟需结合程序分析与AI对抗技术进行深度审计。本文将从AST逆向工程切入，深入探讨如何通过对抗样本检测AI生成代码的脆弱性。一、核心挑战
车联网网络安全渗透测试：深度解析与实践 ke0hly web安全网络安全物联网安全架构安全威胁分析
引言随着汽车智能化、网联化程度的不断深入，车联网（IoV）已成为连接人、车、路、云的关键枢纽。然而，技术进步的同时也带来了前所未有的网络安全挑战。从车载系统到云端平台，从车内通信到V2X通信，车联网的每一个环节都可能成为潜在的攻击面，一旦被恶意利用，将直接威胁到驾乘人员的生命财产安全，甚至影响国家安全和公共秩序。因此，构建一套全面、深入、实战化的车联网网络安全渗透测试流程和方法，对于保障车联网的健
庙算兵棋推演AI开发初探（7-神经网络训练与评估概述）超自然祈祷智能决策人工智能神经网络深度学习
前面我们提取了特征做了数据集、设计并实现了处理数据集的神经网络，接下来我们需要训练神经网络了，就是把数据对接好灌进去，训练后查看预测的和实际的结果是否一致——也就是训练与评估。数据解析提取数据编码为数据集设计神经网络-->>神经网络训练与评估神经网络一个重要指标是收敛，就是用可以逼近任意函数的神经网络是否可以逼近你数据集中隐含的模式。再重复一遍【特征工程】与【神经网络】的区别：前者就像人发现了牛顿
我的世界1.20.1forge模组开发进阶教程——序列化（1） lemon_sjdk java 我的世界 mc forge模组开发序列化
mc的序列化在《Minecraft》（MC）中，序列化指将游戏数据（如方块、实体、玩家状态等）转换为可存储或传输的格式。这是游戏运行、存档保存和网络通信的关键技术。以下是Minecraft中常见的序列化方式及其用途：一、序列化在Minecraft中的作用存档数据持久化将玩家建筑、地图、物品栏等数据保存到硬盘（如.minecraft/saves中的区域文件）。网络传输服务器与客户端同步方块更新、实体
浅谈卷积神经网络(CNN) cyc&阿灿 cnn 人工智能神经网络
卷积神经网络(ConvolutionalNeuralNetworks,CNN)作为深度学习领域最具影响力的架构之一，已在计算机视觉、自然语言处理、医学影像分析等领域取得了革命性突破。本文将系统全面地剖析CNN的核心原理、关键组件、经典模型、数学基础、训练技巧以及最新进展，通过理论解析与代码实践相结合的方式，帮助读者深入掌握这一重要技术。一、CNN基础与核心思想1.1传统神经网络的局限性在处理图像等
深入剖析 Linux 内核网络核心：sock.c 源码解析 109702008 编程 #C语言网络 linux 网络人工智能
作为Linux网络子系统的基石，sock.c承载着协议无关的核心功能。本文将深入分析其关键实现，揭示高性能网络通信背后的设计哲学。一、Socket生命周期管理1.1初始化与分配sock_init_data()是socket的初始化入口，负责设置核心回调函数和默认参数：voidsock_init_data(structsocket*sock,structsock*sk){sk->sk_state=T
随机森林详解：原理、优势与应用实践大千AI助手人工智能 Python #OTHER 随机森林算法机器学习决策树人工智能 DecisionTree 数据挖掘
本文由「大千AI助手」原创发布，专注用真话讲AI，回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我，一起撕掉过度包装，学习真实的AI技术！随机森林介绍1.定义：随机森林是一种强大的、高度灵活的集成学习（EnsembleLearning）算法，主要用于分类和回归任务。它的核心思想是构建多棵决策树（DecisionTree），并将这些树的预测结果进行组合（例如，分类任务采用投票，回归任务采用
【第二章:机器学习与神经网络概述】03.类算法理论与实践-(3)决策树分类器 IT古董人工智能课程机器学习算法神经网络
第二章:机器学习与神经网络概述第三部分：类算法理论与实践第三节：决策树分类器内容：信息增益、剪枝技术、过拟合与泛化能力。决策树是一种常用于分类和回归的树状结构模型，它通过一系列特征判断进行决策，有良好的可解释性。一、基本概念节点（Node）：表示特征判断条件边（Branch）：表示特征判断的结果路径叶子节点（Leaf）：表示分类结果二、划分准则：信息增益（InformationGain）信息增益衡
Alluxio在数据索引和模型分发中的核心价值与应用 Alluxio 人工智能深度学习机器学习
在当前的技术环境下，搜索、推荐、广告、大模型、自动驾驶等领域的业务依赖于海量数据的处理和复杂模型的训练。这些任务通常涉及从用户行为数据和社交网络数据中提取大量信息，进行模型训练和推理。这一过程需要强大的数据分发能力，尤其是在多个服务器同时拉取同一份数据时，更是考验基础设施的性能。在这样的背景下，AlluxioEnterpriseAI在数据索引与模型分发/部署方面展示了其独特的优势，特别是在处理海量
Alluxio EnterpriseAI on K8s 部署教程 Alluxio kubernetes 容器云原生
AlluxioEnterpriseAIonK8s部署视频教程视频为AlluxioEnterpriseAIonK8s部署视频教程。下面内容将主要介绍如何通过Operator（Kubernetes管理应用程序的扩展）在Kubernetes上安装Alluxio。1.系统要求Kubernetes至少1.19版本的Kubernetes集群，支持特性门控确保集群的Kubernetes网络策略允许应用程序（Al
Z-library数字图书馆镜像网址入口及客户端/app (持续更新) 黄豆匿zlib 学习
Z-Library（简称z-lib，前身为BookFinder）是一个影子图书馆和开放获取文件分享计划，用户可在此网络下载期刊文章以及各种类型的书籍。截止2022年6月12日，该网站共收录了10,456,034本书和84,837,646篇文章。zlibrary电脑客户端/安卓appzlibrary（windows/mac/安卓/ipad）安装包下载：夸克网盘分享（随时失效，先保存）无需魔法正常使用
怎么样才能成为专业的程序员？ cocos2d-x小菜编程 PHP
如何要想成为一名专业的程序员？仅仅会写代码是不够的。从团队合作去解决问题到版本控制，你还得具备其他关键技能的工具包。当我们询问相关的专业开发人员，那些必备的关键技能都是什么的时候，下面是我们了解到的情况。关于如何学习代码，各种声音很多，然后很多人就被误导为成为专业开发人员懂得一门编程语言就够了？！呵呵，就像其他工作一样，光会一个技能那是远远不够的。如果你想要成为
java web开发高并发处理 BreakingBad java Web 并发开发处理高
java处理高并发高负载类网站中数据库的设计方法（java教程,java处理大量数据，java高负载数据）一：高并发高负载类网站关注点之数据库没错,首先是数据库,这是大多数应用所面临的首个SPOF。尤其是Web2.0的应用，数据库的响应是首先要解决的。一般来说MySQL是最常用的，可能最初是一个mysql主机，当数据增加到100万以上，那么，MySQL的效能急剧下降。常用的优化措施是M-S（
mysql批量更新 ekian mysql
mysql更新优化：一版的更新的话都是采用update set的方式，但是如果需要批量更新的话，只能for循环的执行更新。或者采用executeBatch的方式，执行更新。无论哪种方式，性能都不见得多好。三千多条的更新，需要3分多钟。查询了批量更新的优化，有说replace into的方式，即： replace into tableName(id,status) values
微软BI（3） 18289753290 微软BI SSIS
1) Q：该列违反了完整性约束错误；已获得 OLE DB 记录。源:“Microsoft SQL Server Native Client 11.0” Hresult: 0x80004005 说明:“不能将值 NULL 插入列 'FZCHID'，表 'JRB_EnterpriseCredit.dbo.QYFZCH'；列不允许有 Null 值。INSERT 失败。”。 A：一般这类问题的存在是
Java中的List g21121 java
List是一个有序的 collection（也称为序列）。此接口的用户可以对列表中每个元素的插入位置进行精确地控制。用户可以根据元素的整数索引（在列表中的位置）访问元素，并搜索列表中的元素。与 set 不同，列表通常允许重复
读书笔记永夜-极光读书笔记
1. K是一家加工厂,需要采购原材料,有A,B,C,D 4家供应商,其中A给出的价格最低,性价比最高,那么假如你是这家企业的采购经理,你会如何决策? 传统决策: A:100%订单 B,C,D:0% &nbs
centos 安装 Codeblocks 随便小屋 codeblocks
1.安装gcc,需要c和c++两部分,默认安装下,CentOS不安装编译器的,在终端输入以下命令即可yum install gccyum install gcc-c++ 2.安装gtk2-devel,因为默认已经安装了正式产品需要的支持库,但是没有安装开发所需要的文档.yum install gtk2* 3. 安装wxGTK yum search w
23种设计模式的形象比喻 aijuans 设计模式
1、ABSTRACT FACTORY—追MM少不了请吃饭了，麦当劳的鸡翅和肯德基的鸡翅都是MM爱吃的东西，虽然口味有所不同，但不管你带MM去麦当劳或肯德基，只管向服务员说“来四个鸡翅”就行了。麦当劳和肯德基就是生产鸡翅的Factory 　　工厂模式：客户类和工厂类分开。消费者任何时候需要某种产品，只需向工厂请求即可。消费者无须修改就可以接纳新产品。缺点是当产品修改时，工厂类也要做相应的修改。如：
开发管理 CheckLists aoyouzi 开发管理 CheckLists
开发管理 CheckLists(23) -使项目组度过完整的生命周期开发管理 CheckLists(22) -组织项目资源开发管理 CheckLists(21) -控制项目的范围开发管理 CheckLists(20) -项目利益相关者责任开发管理 CheckLists(19) -选择合适的团队成员开发管理 CheckLists(18) -敏捷开发 Scrum Master 工作开发管理 C
js实现切换百合不是茶 JavaScript 栏目切换
js主要功能之一就是实现页面的特效,窗体的切换可以减少页面的大小,被门户网站大量应用思路: 1,先将要显示的设置为display:bisible 否则设为none 2,设置栏目的id ,js获取栏目的id,如果id为Null就设置为显示 3,判断js获取的id名字;再设置是否显示代码实现: html代码: <di
周鸿祎在360新员工入职培训上的讲话 bijian1013 感悟项目管理人生职场
这篇文章也是最近偶尔看到的，考虑到原博客发布者可能将其删除等原因，也更方便个人查找，特将原文拷贝再发布的。“学东西是为自己的，不要整天以混的姿态来跟公司博弈，就算是混，我觉得你要是能在混的时间里，收获一些别的有利于人生发展的东西，也是不错的，看你怎么把握了”，看了之后，对这句话记忆犹新。 &
前端Web开发的页面效果 Bill_chen html Web Microsoft
1.IE6下png图片的透明显示： <img src="图片地址" border="0" style="Filter.Alpha(Opacity)=数值(100),style=数值(3)"/> 或在<head></head>间加一段JS代码让透明png图片正常显示。 2.<li>标
【JVM五】老年代垃圾回收：并发标记清理GC(CMS GC) bit1129 垃圾回收
CMS概述并发标记清理垃圾回收(Concurrent Mark and Sweep GC）算法的主要目标是在GC过程中，减少暂停用户线程的次数以及在不得不暂停用户线程的请夸功能，尽可能短的暂停用户线程的时间。这对于交互式应用，比如web应用来说，是非常重要的。 CMS垃圾回收针对新生代和老年代采用不同的策略。相比同吞吐量垃圾回收，它要复杂的多。吞吐量垃圾回收在执
Struts2技术总结白糖_ struts2
必备jar文件早在struts2.0.*的时候，struts2的必备jar包需要如下几个： commons-logging-*.jar Apache旗下commons项目的log日志包 freemarker-*.jar
Jquery easyui layout应用注意事项 bozch jquery 浏览器 easyui layout
在jquery easyui中提供了easyui-layout布局，他的布局比较局限，类似java中GUI的border布局。下面对其使用注意事项作简要介绍：如果在现有的工程中前台界面均应用了jquery easyui，那么在布局的时候最好应用jquery eaysui的layout布局，否则在表单页面（编辑、查看、添加等等）在不同的浏览器会出
java-拷贝特殊链表：有一个特殊的链表，其中每个节点不但有指向下一个节点的指针pNext，还有一个指向链表中任意节点的指针pRand，如何拷贝这个特殊链表？ bylijinnan java
public class CopySpecialLinkedList { /** * 题目：有一个特殊的链表，其中每个节点不但有指向下一个节点的指针pNext，还有一个指向链表中任意节点的指针pRand，如何拷贝这个特殊链表？拷贝pNext指针非常容易，所以题目的难点是如何拷贝pRand指针。假设原来链表为A1 -> A2 ->... -> An，新拷贝
color Chen.H JavaScript html css
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <HTML> <HEAD>&nbs
[信息与战争]移动通讯与网络 comsci 网络
两个坚持:手机的电池必须可以取下来光纤不能够入户,只能够到楼宇建议大家找这本书看看:<&
oracle flashback query(闪回查询) daizj oracle flashback query flashback table
在Oracle 10g中，Flash back家族分为以下成员： Flashback Database Flashback Drop Flashback Table Flashback Query(分Flashback Query,Flashback Version Query，Flashback Transaction Query) 下面介绍一下Flashback Drop 和Flas
zeus持久层DAO单元测试 deng520159 单元测试
zeus代码测试正紧张进行中,但由于工作比较忙,但速度比较慢.现在已经完成读写分离单元测试了,现在把几种情况单元测试的例子发出来,希望有人能进出意见,让它走下去. 本文是zeus的dao单元测试: 1.单元测试直接上代码 package com.dengliang.zeus.webdemo.test; import org.junit.Test; import o
C语言学习三printf函数和scanf函数学习 dcj3sjt126com c printf scanf language
printf函数 /* 2013年3月10日20:42:32 地点：北京潘家园功能：目的：测试%x %X %#x %#X的用法 */ # include <stdio.h> int main(void) { printf("哈哈！\n"); // \n表示换行 int i = 10; printf
那你为什么小时候不好好读书? dcj3sjt126com life
dady, 我今天捡到了十块钱, 不过我还给那个人了 good girl! 那个人有没有和你讲thank you啊没有啦....他拉我的耳朵我才把钱还给他的, 他哪里会和我讲thank you 爸爸, 如果地上有一张5块一张10块你拿哪一张呢.... 当然是拿十块的咯... 爸爸你很笨的, 你不会两张都拿爸爸为什么上个月那个人来跟你讨钱, 你告诉他没
iptables开放端口 Fanyucai linux iptables 端口
1，找到配置文件 vi /etc/sysconfig/iptables 2，添加端口开放，增加一行，开放18081端口 -A INPUT -m state --state NEW -m tcp -p tcp --dport 18081 -j ACCEPT 3，保存 ESC :wq! 4，重启服务 service iptables
Ehcache（05）——缓存的查询 234390216 排序 ehcache 统计 query
缓存的查询目录 1. 使Cache可查询 1.1 基于Xml配置 1.2 基于代码的配置 2 指定可搜索的属性 2.1 可查询属性类型 2.2 &
通过hashset找到数组中重复的元素 jackyrong hashset
如何在hashset中快速找到重复的元素呢?方法很多，下面是其中一个办法： int[] array = {1,1,2,3,4,5,6,7,8,8}; Set<Integer> set = new HashSet<Integer>(); for(int i = 0
使用ajax和window.history.pushState无刷新改变页面内容和地址栏URL lanrikey history
后退时关闭当前页面 <script type="text/javascript"> jQuery(document).ready(function ($) { if (window.history && window.history.pushState) {
应用程序的通信成本 netkiller.github.com 虚拟机应用服务器陈景峰 netkiller neo
应用程序的通信成本什么是通信一个程序中两个以上功能相互传递信号或数据叫做通信。什么是成本这是是指时间成本与空间成本。时间就是传递数据所花费的时间。空间是指传递过程耗费容量大小。都有哪些通信方式全局变量线程间通信共享内存共享文件管道 Socket 硬件（串口，USB）等等全局变量全局变量是成本最低通信方法，通过设置
一维数组与二维数组的声明与定义恋洁e生二维数组一维数组定义声明初始化
/** * */ package test20111005; /** * @author FlyingFire * @date:2011-11-18 上午04:33:36 * @author ：代码整理 * @introduce :一维数组与二维数组的初始化 *summary： */ public c
Spring Mybatis独立事务配置 toknowme mybatis
在项目中有很多地方会使用到独立事务，下面以获取主键为例（1）修改配置文件spring-mybatis.xml  <tx:annotation-driven transaction-manager="transactionManager" /> &n
更新Anadroid SDK Tooks之后，Eclipse提示No update were found xp9802 eclipse
使用Android SDK Manager 更新了Anadroid SDK Tooks 之后，打开eclipse提示 This Android SDK requires Android Developer Toolkit version 23.0.0 or above, 点击Check for Updates 检测一会后提示 No update were found

Bert+FGSM/PGD实现中文文本分类（Loss=0.5L1+0.5L2)

一、导入所需的库和模块

二、加载数据集

三、定义模型和优化器

四、 基于原生Bert文本分类

4.1 定义训练函数

4.2 定义测试函数

五、Bert+FGSM文本分类

5.1 定义FGSM对抗训练函数

5.2 定义训练模型函数

5.3 定义测试函数

六、Bert+PGD文本分类

6.1 定义PGD攻击函数

6.2 定义训练函数

6.3 定义测试函数

你可能感兴趣的:(对抗网络,bert,分类,深度学习)

四、基于原生Bert文本分类