学人工智能的皮皮虾

XLNet Fine-Tuning Tutorial with PyTorch

前言

在本教程中，我将向您展示如何使用huggingface PyTorch库对预先训练好的XLNet模型进行调整，以快速生成用于文本分类的分类器。

Introduction

这篇文章有两种形式——一种是博客，另一种是Colab notebook。内容是相同的，但:

博客文章格式可能更容易阅读，并包含一个讨论的评论部分。
Colab Notebook允许您运行代码并在阅读过程中检查它。

What is XLNet?

XLNet是由CMU和谷歌研究人员在2019年年中开发的一种预训练语言表示方法。XLNet的创建是为了解决作者所认为的BERT和其他流行语言模型使用的预训练的自动编码方法的缺点。在这篇文章中，我们不会深入讨论XLNet的细节，但是作者倾向于使用自定义的自回归方法。在一系列NLP任务中，这种预训练方法的效果优于BERT模型，并产生了一个新的最先进的模型。

Install and Import

谷歌Colab提供免费的gpu和TPUs!因为我们将训练一个大型的神经网络，最好利用这个(在这种情况下，我们将附加一个GPU)，否则训练将花费很长时间。
添加一个GPU可以到菜单中选择:
Edit -> Notebook Settings -> Add accelerator (GPU)
然后运行以下单元以确认GPU已被检测到。

import tensorflow as tf

device_name = tf.test.gpu_device_name()
if device_name != '/device:GPU:0':
  raise SystemError('GPU device not found')
print('Found GPU at: {}'.format(device_name))

## Found GPU at: /device:GPU:0

接下来，让我们通过HuggingFace来安装XLNet的pytorch接口。(这个库包含其他预训练语言模型的接口，比如OpenAI的GPT、BERT和GPT-2。)我们选择了pytorch接口，因为它在高级api(易于使用，但不提供深入的工作原理)和tensorflow代码(其中包含很多细节，但经常让我们忽略tensorflow)之间取得了很好的平衡。
目前，hug Face库似乎是使用迁移学习模型工作的最广泛和最强大的pytorch接口。除了支持各种不同的预先训练的语言模型(以及未来的模型—在BERT和XLNet发布后的短短几个月，它们都被新模型超越了!)之外，这个库还包括针对您的特定任务预先构建的不同模型的修改。例如，在本教程中，我们将使用XLNet进行序列分类，但是这个库还包括为标记分类、问题回答、下一个句子预测等设计的模型修改。使用这些预构建的类可以简化修改迁移学习模型的过程。

!pip install pytorch-transformers

import torch
from torch.utils.data import TensorDataset, DataLoader, RandomSampler, SequentialSampler
from keras.preprocessing.sequence import pad_sequences
from sklearn.model_selection import train_test_split


from pytorch_transformers import XLNetModel, XLNetTokenizer, XLNetForSequenceClassification
from pytorch_transformers import AdamW

from tqdm import tqdm, trange
import pandas as pd
import io
import numpy as np
import matplotlib.pyplot as plt
% matplotlib inline

为了让torch使用GPU，我们需要识别并指定GPU为设备。稍后，在我们的训练循环中，我们将把数据加载到设备上。

device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
n_gpu = torch.cuda.device_count()
torch.cuda.get_device_name(0)
## 'Tesla T4'

Load Dataset

我们将使用Corpus of Linguistic Acceptability (CoLA)进行单句分类。它是一组语法被标记正确或不正确的句子。数据如下:

Column 1:表示句子来源的代码。
Column 2:可接受性判断标签(0=不可接受，1=可接受)。
Column 3: 作者最初标注的可接受性判断标签。
Column 4: 句子
从该链接下载数据集，提取并将其移动到本地驱动器。

数据的标记（tokenized）版本和原始（raw）版本都是可用的。我们将使用原始版本，因为我们需要使用XLNet tokenizer将文本分解为tokens和模型将识别的块。

from google.colab import files
uploaded = files.upload()

df = pd.read_csv("in_domain_train.tsv", delimiter='\t', header=None, names=['sentence_source', 'label', 'label_notes', 'sentence'])

df.shape
## （8551，4）

df.sample(10)

# Create sentence and label lists
sentences = df.sentence.values

我们需要在每个句子的开头和结尾添加特殊的标记(“[SEP]”和“[CLS]”)，以便XLNet正常工作。
对于BERT，special token pattern是这样的:

[CLS] + Sentence_A + [SEP] + Sentence_B + [SEP]

而XLNet的token pattern是这样的:

Sentence_A + [SEP] + Sentence_B + [SEP] + [CLS]

对于这里的单个句子输入，我们只需要在后面加上[SEP]和[CLS]:

sentences = [sentence + " [SEP] [CLS]" for sentence in sentences]
labels = df.label.values

Inputs

接下来，导入XLNet tokenizer，用于将文本转换为与XLNet词汇表相对应的tokens。

tokenizer = XLNetTokenizer.from_pretrained('xlnet-base-cased', do_lower_case=True)

tokenized_texts = [tokenizer.tokenize(sent) for sent in sentences]
print ("Tokenize the first sentence:")
print (tokenized_texts[0])

Tokenize the first sentence:
['▁our', '▁friends', '▁won', "'", 't', '▁buy', '▁this', '▁analysis', ',', '▁let', '▁alone', '▁the', '▁next', '▁one', '▁we', '▁propose', '.', '▁[', 's', 'ep', ']', '▁[', 'cl', 's', ']']

XLNet需要特定格式的输入。对于每个标记化（ tokenized）的输入语句，我们需要创建:

input ids:使用一个序列的整数去标记每个输入的token在XLNet tokenizer词汇表中的索引号
segment mask:(可选)一个1和0的序列，用来识别输入是一个句子还是两个句子长。对于一个句子输入，这只是一个0序列。对于两个句子输入，第一个句子的每个标记都是0，第二个句子的每个标记都是1
attention mask:(可选)1和0的序列，所有的输入标记用1表示，所有填充标记用0表示(我们将在下一段详细介绍)
labels:单个值1或0。在我们的任务中，1表示“合乎语法的”，0表示“不合语法的”
虽然我们可以有可变长度的输入语句，但XLNet要求输入数组的大小相同。我们首先选择一个最大的句子长度，然后填充和截断输入，直到每个输入序列的长度相同。
在这个上下文中，“pad”我们的输入意味着如果一个句子比最大的句子长度短，我们只需在序列的末尾添加0，直到它是最大的句子长度。
如果一个句子比最大的句子长度长，那么我们简单地截断序列的末尾，丢弃任何不符合最大句子长度的内容。
我们对序列进行填充和截断，使它们的长度都变为MAX_LEN(“post”表示我们希望填充和截断序列的末尾，而不是开头)。pad_sequences 是 Keras的一个工具函数，它只简单处理Python列表的截断和填充。

# Set the maximum sequence length. The longest sequence in our training set is 47, but we'll leave room on the end anyway. 
MAX_LEN = 128

# Use the XLNet tokenizer to convert the tokens to their index numbers in the XLNet vocabulary
input_ids = [tokenizer.convert_tokens_to_ids(x) for x in tokenized_texts]

# Pad our input tokens
input_ids = pad_sequences(input_ids, maxlen=MAX_LEN, dtype="long", truncating="post", padding="post")

Create the attention masks

# Create attention masks
attention_masks = []

# Create a mask of 1s for each token followed by 0s for padding
for seq in input_ids:
  seq_mask = [float(i>0) for i in seq]
  attention_masks.append(seq_mask)
# Use train_test_split to split our data into train and validation sets for training

train_inputs, validation_inputs, train_labels, validation_labels = train_test_split(input_ids, labels,                                                             random_state=2018, test_size=0.1)
train_masks, validation_masks, _, _ = train_test_split(attention_masks, input_ids, random_state=2018,test_size=0.1)

# Convert all of our data into torch tensors, the required datatype for our model

train_inputs = torch.tensor(train_inputs)
validation_inputs = torch.tensor(validation_inputs)
train_labels = torch.tensor(train_labels)
validation_labels = torch.tensor(validation_labels)
train_masks = torch.tensor(train_masks)
validation_masks = torch.tensor(validation_masks)

# Select a batch size for training. For fine-tuning with XLNet, the authors recommend a batch size of 32, 48, or 128. We will use 32 here to avoid memory issues.
batch_size = 32

# Create an iterator of our data with torch DataLoader. This helps save on memory during training because, unlike a for loop, 
# with an iterator the entire dataset does not need to be loaded into memory

train_data = TensorDataset(train_inputs, train_masks, train_labels)
train_sampler = RandomSampler(train_data)
train_dataloader = DataLoader(train_data, sampler=train_sampler, batch_size=batch_size)

validation_data = TensorDataset(validation_inputs, validation_masks, validation_labels)
validation_sampler = SequentialSampler(validation_data)
validation_dataloader = DataLoader(validation_data, sampler=validation_sampler, batch_size=batch_size)

Train Model

现在我们的输入数据已经正确格式化了，接下来就该对XLNet模型进行调优了。
对于这个任务，我们首先想要修改预训练的模型以提供分类的输出，然后我们想要继续在我们的数据集上训练模型，直到整个模型，端到端的，非常适合我们的任务。值得庆幸的是，huggingface pytorch实现包含一组为各种NLP任务设计的接口。虽然这些接口都是在一个训练好的模型之上构建的，但是每个接口都有不同的顶层和输出类型，以适应它们特定的NLP任务。
我们将装载XLNetForSequenceClassification。这是常规的XLNet模型，在上面添加了一个线性层用于分类，我们将使用它作为句子分类器。当我们输入数据时，整个预先训练过的XLNet模型和额外的未训练的分类层将针对我们的特定任务进行训练。

The Fine-Tuning Process

因为预先训练的模型层已经编码了大量关于语言的信息，所以训练分类器相对好些。而不是每一层在一个大模型从头训练,就好像我们已经进行了95%的训练工作,并且只需要根据具体下游任务适当的调整top layer的训练就可以了。
有时practicioners 会选择在微调时“freeze”某些layers，或者应用不同的学习速率，应用递减的学习速率等等，所有这些都是为了在网络中保持高质量的权重和加速训练(通常是相当快的)。事实上，最近对像BERT这样的转移学习模型的研究已经明确表明，freeze大部分的权重只会导致最低限度的准确性下降，但是也有例外，转移学习的更广泛的规则也应该被考虑。例如，如果您的任务和微调数据集与用于训练转移学习模型的数据集非常不同，那么冻结权重可能不是一个好主意。我们将在以后的文章中讨论NLP中更广泛的迁移学习。
好的，让我们加载XLNet!有几种不同的预先训练过的XLNet模型可用。 “xlnet-base-cased”是指同时包含大小写字母(“大小写混合格式”)和较小的大小写字母(“base”和“large”)的版本.

# Load XLNEtForSequenceClassification, the pretrained XLNet model with a single linear classification layer on top. 

model = XLNetForSequenceClassification.from_pretrained("xlnet-base-cased", num_labels=2)
model.cuda()

现在我们已经加载了模型，我们需要从存储的模型中获取训练超参数。
为了进行微调，作者建议在以下范围内使用以下超参数(将它们应用于哪些NLP数据集进行分解):

param_optimizer = list(model.named_parameters())
no_decay = ['bias', 'gamma', 'beta']
optimizer_grouped_parameters = [
    {'params': [p for n, p in param_optimizer if not any(nd in n for nd in no_decay)],
     'weight_decay_rate': 0.01},
    {'params': [p for n, p in param_optimizer if any(nd in n for nd in no_decay)],
     'weight_decay_rate': 0.0}
]

# This variable contains all of the hyperparemeter information our training loop needs
optimizer = AdamW(optimizer_grouped_parameters,
                     lr=2e-5)

下面是我们的训练循环。还有很多工作要做，但基本上我们的循环中的每一次循环都有一个training 阶段和一个validation 阶段。在每一关，我们需要:
Training loop:

告诉模型通过将模型设置为train模式来计算梯度
解压我们的数据输入和标签
加载数据到GPU
清除上一遍中计算的梯度。在pytorch中，除非您显式地清除gradients ，否则gradients 会自动累积(对于RNNs之类的东西很有用)
前向传递(通过网络输入数据)
反向传播
告诉网络使用optimizer.step()更新参数
跟踪变量以查看进度

Evalution loop:

告诉模型在评估模式中不要计算梯度
解压我们的数据输入和标签
加载数据到GPU
前向传递(通过网络输入数据
计算验证数据的损失，跟踪变量以查看进度

# Function to calculate the accuracy of our predictions vs labels
def flat_accuracy(preds, labels):
    pred_flat = np.argmax(preds, axis=1).flatten()
    labels_flat = labels.flatten()
    return np.sum(pred_flat == labels_flat) / len(labels_flat)

# Store our loss and accuracy for plotting
train_loss_set = []

# Number of training epochs (authors recommend between 2 and 4)
epochs = 4

# trange is a tqdm wrapper around the normal python range
for _ in trange(epochs, desc="Epoch"):
  
  
  # Training
  
  # Set our model to training mode (as opposed to evaluation mode)
  model.train()
  
  # Tracking variables
  tr_loss = 0
  nb_tr_examples, nb_tr_steps = 0, 0
  
  # Train the data for one epoch
  for step, batch in enumerate(train_dataloader):
    # Add batch to GPU
    batch = tuple(t.to(device) for t in batch)
    # Unpack the inputs from our dataloader
    b_input_ids, b_input_mask, b_labels = batch
    # Clear out the gradients (by default they accumulate)
    optimizer.zero_grad()
    # Forward pass
    outputs = model(b_input_ids, token_type_ids=None, attention_mask=b_input_mask, labels=b_labels)
    loss = outputs[0]
    logits = outputs[1]
    train_loss_set.append(loss.item())    
    # Backward pass
    loss.backward()
    # Update parameters and take a step using the computed gradient
    optimizer.step()
    
    
    # Update tracking variables
    tr_loss += loss.item()
    nb_tr_examples += b_input_ids.size(0)
    nb_tr_steps += 1

  print("Train loss: {}".format(tr_loss/nb_tr_steps))
    
    
  # Validation

  # Put model in evaluation mode to evaluate loss on the validation set
  model.eval()

  # Tracking variables 
  eval_loss, eval_accuracy = 0, 0
  nb_eval_steps, nb_eval_examples = 0, 0

  # Evaluate data for one epoch
  for batch in validation_dataloader:
    # Add batch to GPU
    batch = tuple(t.to(device) for t in batch)
    # Unpack the inputs from our dataloader
    b_input_ids, b_input_mask, b_labels = batch
    # Telling the model not to compute or store gradients, saving memory and speeding up validation
    with torch.no_grad():
      # Forward pass, calculate logit predictions
      output = model(b_input_ids, token_type_ids=None, attention_mask=b_input_mask)
      logits = output[0]
    
    # Move logits and labels to CPU
    logits = logits.detach().cpu().numpy()
    label_ids = b_labels.to('cpu').numpy()

    tmp_eval_accuracy = flat_accuracy(logits, label_ids)
    
    eval_accuracy += tmp_eval_accuracy
    nb_eval_steps += 1

  print("Validation Accuracy: {}".format(eval_accuracy/nb_eval_steps))

Training Evaluation

Let’s take a look at our training loss over all batches:

plt.figure(figsize=(15,8))
plt.title("Training loss")
plt.xlabel("Batch")
plt.ylabel("Loss")
plt.plot(train_loss_set)
plt.show()

Predict and Evaluate on Holdout Set

现在，我们将加载holdout数据集并准备输入，就像我们对训练集所做的那样。然后，我们将使用Matthew的相关系数来评估预测，因为这是更广泛的NLP社区用来评估CoLA性能的指标。在这个度量中，+1是最好的分数，-1是最差的分数。通过这种方式，我们可以看到我们在针对这个特定任务的最先进模型的状态下执行得有多好。

# Upload the test file from your local drive
from google.colab import files
uploaded = files.upload()

df = pd.read_csv("out_of_domain_dev.tsv", delimiter='\t', header=None, names=['sentence_source', 'label', 'label_notes', 'sentence'])

# Create sentence and label lists
sentences = df.sentence.values

# We need to add special tokens at the beginning and end of each sentence for XLNet to work properly
sentences = [sentence + " [SEP] [CLS]" for sentence in sentences]
labels = df.label.values

tokenized_texts = [tokenizer.tokenize(sent) for sent in sentences]


MAX_LEN = 128

# Use the XLNet tokenizer to convert the tokens to their index numbers in the XLNet vocabulary
input_ids = [tokenizer.convert_tokens_to_ids(x) for x in tokenized_texts]
# Pad our input tokens
input_ids = pad_sequences(input_ids, maxlen=MAX_LEN, dtype="long", truncating="post", padding="post")
# Create attention masks
attention_masks = []

# Create a mask of 1s for each token followed by 0s for padding
for seq in input_ids:
  seq_mask = [float(i>0) for i in seq]
  attention_masks.append(seq_mask) 

prediction_inputs = torch.tensor(input_ids)
prediction_masks = torch.tensor(attention_masks)
prediction_labels = torch.tensor(labels)
  
batch_size = 32  


prediction_data = TensorDataset(prediction_inputs, prediction_masks, prediction_labels)
prediction_sampler = SequentialSampler(prediction_data)
prediction_dataloader = DataLoader(prediction_data, sampler=prediction_sampler, batch_size=batch_size)

# Prediction on test set

# Put model in evaluation mode
model.eval()

# Tracking variables 
predictions , true_labels = [], []

# Predict 
for batch in prediction_dataloader:
  # Add batch to GPU
  batch = tuple(t.to(device) for t in batch)
  # Unpack the inputs from our dataloader
  b_input_ids, b_input_mask, b_labels = batch
  # Telling the model not to compute or store gradients, saving memory and speeding up prediction
  with torch.no_grad():
    # Forward pass, calculate logit predictions
    outputs = model(b_input_ids, token_type_ids=None, attention_mask=b_input_mask)
    logits = outputs[0]

  # Move logits and labels to CPU
  logits = logits.detach().cpu().numpy()
  label_ids = b_labels.to('cpu').numpy()
  
  # Store predictions and true labels
  predictions.append(logits)
  true_labels.append(label_ids)

from sklearn.metrics import matthews_corrcoef
matthews_set = []

for i in range(len(true_labels)):
  matthews = matthews_corrcoef(true_labels[i],
                 np.argmax(predictions[i], axis=1).flatten())
  matthews_set.append(matthews)

最终的分数将基于整个测试集，但让我们看看个别批次的分数，以了解批次之间度量的可变性。

# Flatten the predictions and true values for aggregate Matthew's evaluation on the whole dataset
flat_predictions = [item for sublist in predictions for item in sublist]
flat_predictions = np.argmax(flat_predictions, axis=1).flatten()
flat_true_labels = [item for sublist in true_labels for item in sublist]

matthews_corrcoef(flat_true_labels, flat_predictions)

酷，我们已经调优了XLNet!
我们的初始分数不是很高，所以最好尝试一些超参数调优(调整学习率、epoch、批大小、优化器属性等)以获得更好的分数。我还应该提到，我们并没有对整个训练数据集进行训练，而是将其中的一部分作为我们的验证集，以确保代码的可读性。

原文链接

Python——生成AIGC图像朱剑君 AIGC 人工智能 python
文章目录一、背景介绍二、效果图展示三、完整代码四、分步解释五、实用建议1）提示词技巧2）性能优化3）常见问题处理4）扩展功能建议六、注意事项1.硬件要求2.法律合规3.模型安全一、背景介绍AIGC（AI-GeneratedContent），即由人工智能生成的内容，涵盖了文本、图像、音频、视频等各种形式。通过深度学习、生成对抗网络（GAN）和扩散模型等技术，AIGC能够生成高度逼真、具有艺术性的内容
图像处理：模拟色差的生成何以为皇图像处理人工智能
图像处理：模拟色差的实战案例在做瓷砖瑕疵检测的过程中，需要检测色差。但在实际生产环境中，瓷砖色差检测的数据量较少，无法直接获取足够的数据来训练和优化深度学习模型。于是就考虑通过人为生成色差数据的方式来扩充数据集，进行色差的模拟。1.什么是色差？色差（ColorDifference）是指两种颜色之间的视觉差异。在色彩科学中，CIEDE2000是目前最先进的色差计算方法之一。然而，CIEDE1976也
python工具——pypinyin 汉字转换拼音 xiaoming0018 python python list
把汉字转成拼音后可以进行深度学习分类，做内容识别1.安装pipinstallpypinyin将汉字转换为拼音并生成slug字符串importpypinyinfrompypinyinimportStylecontent=pypinyin.slug('汉语拼音')print(content)#E:\python\>pythonpinyin.py#han-yu-pin-yin修改分隔字符串importp
淘系图搜API接入与使用全解析数据小爬虫.网站开发-Brad 各大电商平台api 国际平台API 1688 python 算法前端框架需求分析 AI编程
淘系图搜API接入与使用全解析一、接口概述淘系图搜API（即淘宝/天猫以图搜货接口）允许开发者通过上传商品图片，获取淘宝平台上的相似商品列表。其核心技术基于阿里巴巴的深度学习模型，支持服饰、家居、3C等多品类识别，广泛应用于比价、找同款、商品推荐等场景。二、接入准备资质要求：企业开发者需提供营业执照、应用场景说明（如“电商比价工具”）。个人开发者权限受限，建议通过第三方API服务商（如数位、Dat
深度学习革命背后：DBN、AlexNet、GAN 等神级架构，究竟藏着怎样的 AI 崛起密码？（附deepseek） universe_code 人工智能 python 深度学习经验分享
深度学习革命**3.深度学习革命（2006年至今）****2006年：深度学习奠基——深度信念网络（DBN）****2012年：AlexNet崛起****2014年：架构创新潮****生成对抗网络（GAN）****残差网络（ResNet）****Transformer****总结**补充（deepseek）一、核心技术原理1.**混合专家架构（MoE）**2.**多头潜在注意力（MLA）**3.*
整理：4篇论文知识蒸馏引领高效模型新时代 mslion 多模态人工智能知识蒸馏
知识蒸馏（KnowledgeDistillation）是当前机器学习研究中的一个重要方向，特别是在模型压缩和效率优化等任务中。传统的深度学习模型往往依赖于复杂的大型网络，以获取卓越的性能。然而，这些庞大的模型对计算资源和存储空间的需求，使得它们在实际应用中，尤其是在边缘设备或移动端部署中面临巨大挑战。知识蒸馏技术致力于解决这一问题，其核心思想是通过一个“教师模型”向一个更小、更高效的“学生模型”传
人工智能：从基础到前沿顾漂亮人工智能深度学习 windows
目录目录1.引言2.人工智能基础2.1什么是人工智能？2.2人工智能的历史2.3人工智能的分类3.机器学习3.1机器学习概述3.2监督学习3.3无监督学习3.4强化学习4.深度学习4.1深度学习概述4.2神经网络基础4.3卷积神经网络（CNN）4.4循环神经网络（RNN）5.自然语言处理（NLP）5.1NLP概述5.2文本预处理5.3词嵌入5.4语言模型6.计算机视觉6.1计算机视觉概述6.2图像
深度学习框架与边缘计算融合驱动医疗金融模型优化新路径智能计算研究中心其他
内容概要随着边缘计算与深度学习框架的深度融合，医疗与金融领域的模型优化正在突破传统算力与隐私保护的瓶颈。当前，TensorFlow、PyTorch等主流框架通过轻量化改造（如TensorFlowLite与PyTorchMobile）逐步适应边缘设备的资源限制，同时结合联邦学习技术构建分布式训练网络。这种技术协同不仅降低了医疗影像诊断中的数据传输延迟，还通过动态模型压缩策略（如量化与剪枝）将金融预测
人工智能学习框架静默.\\ 人工智能学习
人工智能学习框架概述随着人工智能技术的飞速发展，选择合适的机器学习或深度学习框架对于项目的成功至关重要。这些框架提供了强大的工具和库，使得开发者能够更高效地构建、训练和部署模型。目前市面上有许多流行的AI学习框架，每种框架都有其独特的特点和适用场景。首先，TensorFlow是由Google开发的一个开源机器学习框架，支持从简单的线性回归到复杂的神经网络等多种模型类型。它以其高度灵活性和可扩展性著
如何将DeepSeek集成到自己的项目中：从入门到精通木觞清人工智能
引言DeepSeek作为一款强大的深度学习平台，正在为开发者提供高效、灵活的AI解决方案。无论你是想构建一个图像分类系统，还是开发一个自然语言处理应用，DeepSeek都能帮助你快速实现目标。本文将详细介绍如何将DeepSeek集成到自己的项目中，并提供丰富的资源和示例代码，帮助你从入门到精通。为什么选择DeepSeek？在开始集成之前，我们先来看看DeepSeek的优势：高效的计算能力：支持GP
机器学习和深度学习有什么区别？ facaixxx2024 AI大模型机器学习深度学习人工智能
深度学习和机器学习有什么区别？深度学习是机器学习一个分支，机器学习包含深度学习。下面阿小云从定义、技术、数据需求、应用领域、模型复杂度和计算资源多维度来对比深度学习和机器学习的区别：二者的定义区别机器学习：是一种数据分析技术，通过算法使计算机能够在无明确编程的情况下进行学习和决策。深度学习：是机器学习的一个子领域，使用神经网络模型，尤其是深层神经网络模型，来处理、解释和分类数据。依赖算法和技术不同
AI趋势下，软件测试工程师怎么拥抱AI 悠然的笔记本人工智能
在AI趋势下，软件测试工程师怎么拥抱AI呢？以下是我的一些思考：一、掌握AI基础知识软件测试工程师需要学习机器学习、深度学习、自然语言处理等领域的基本原理和算法。这些基础知识有助于理解AI在测试中的应用基础，从而能够更好地利用AI技术提升测试效率和质量。二、掌握AI相关工具和技术编程语言：学习使用Python等编程语言，这是实现AI应用的常用工具之一。框架：掌握TensorFlow、PyTorch
深度学习之图像回归（二） zhengyawen666 深度学习回归数据挖掘人工智能
前言这篇文章主要是在图像回归（一）的基础上对该项目进行的优化。（一）主要是帮助迅速入门理清一个深度学习项目的逻辑这篇文章则主要注重在此基础上对于数据预处理和模型训练进行优化前者会通过涉及PCA主成分分析特征选择后者通过正则化数据预处理数据预处理的原因思路链未经过处理的原始数据存在一些问题->对数据进行处理（涉及多种方法）->提升模型性能数据可能存在的问题冗余信息：数据中可能存在重复的特征或高度相关
VGG 改进：加入GAMAttention注意力机制提升对全局信息捕捉能力听风吹等浪起 AI 改进系列深度学习 cnn 神经网络人工智能
目录1.GAMAttention注意力机制2.VGG加入GAMAttention模块3.完整代码Tips：融入模块后的网络经过测试，可以直接使用，设置好输入和输出的图片维度即可1.GAMAttention注意力机制GAMAttention（GlobalAttentionMechanism）是一种用于增强深度学习模型对全局信息捕捉能力的注意力机制。它通过引入全局上下文信息，帮助模型更好地理解输入数据
【深度学习】矩阵的理解与应用大数据追光猿深度学习矩阵算法线性代数机器学习 python 深度学习
一、矩阵基础知识1.什么是矩阵？矩阵是一个数学概念，通常表示为一个二维数组，它由行和列组成，用于存储数值数据。矩阵是线性代数的基本工具之一，广泛应用于数学、物理学、工程学、计算机科学、机器学习和数据分析等领域。1.1矩阵的表示一个矩阵通常用大写字母来表示，例如AAA，而矩阵中的元素则用小写字母来表示，例如aija_{ij}aij，其中iii表示行索引，jjj表示列索引。本质：矩阵是二维的张量矩阵的
Python中常见库 PyTorch和Pydantic 讲解爱丫爱 python pytorch 开发语言
PyTorch简介PyTorch是一个开源的深度学习框架，由Facebook的AI研究团队开发。它提供了丰富的工具和库，用于构建和训练各种深度学习模型，如卷积神经网络（CNN）、循环神经网络（RNN）及其变体（如LSTM、GRU）、生成对抗网络（GAN）等。核心特性动态计算图：PyTorch采用动态计算图，这意味着在运行时可以动态定义和修改计算图，使得模型的构建和调试更加灵活。这与TensorFl
计算机视觉CV学习路线我喝AD钙我的学习笔记计算机视觉学习人工智能
计算机视觉CV学习路线1.基础准备（可参考mooc学习）2.计算机视觉基础知识（可参考mooc学习、计算机图形学）3.经典计算机视觉算法（可参考吴恩达机器学习课程、国内外计算机图形学课程）4.深度学习基础（参考吴恩达和TF、Keras官网手册）5.深度学习在计算机视觉中的应用（李飞飞课程、arxiv论文原文和解析博客，实战参考gitee/github）6.现代计算机视觉技术（arxiv论文原文和解
【深度学习基础模型】去噪自编码器 (Denoising Autoencoders, DAE)详细理解并附实现代码。 985小水博一枚呀深度学习学习笔记深度学习人工智能 VAE python 学习 autoencoder
【深度学习基础模型】ExtractingandComposingRobustFeatureswithDenoisingAutoencoders【深度学习基础模型】ExtractingandComposingRobustFeatureswithDenoisingAutoencoders文章目录【深度学习基础模型】ExtractingandComposingRobustFeatureswithDeno
深入探索Mozilla的DeepSpeech：语音识别的新里程碑温宝沫Morgan
深入探索Mozilla的DeepSpeech：语音识别的新里程碑项目地址:https://gitcode.com/gh_mirrors/de/DeepSpeech项目简介是一个开源的语音识别引擎，基于深度学习技术，致力于提供准确、可扩展且易于集成的解决方案。该项目的目标是打破现有的语音识别壁垒，使开发者能够轻松构建支持语音的应用，推动人机交互进入新的时代。技术分析基于Baidu的DeepSpeec
【深度学习】Adam优化器九筠机器学习深度学习人工智能
目录1什么是Adam1.1基本概念1.2Adam的数学理解1.2.1计算一阶矩估计（mean）1.2.2计算二阶矩估计（uncenteredvariance）1.2.3矫正一阶矩估计（mean）和二阶矩估计（uncenteredvariance）的偏差1.2.4更新模型参数1.3Adam的简单理解2Adam优化算法怎么用2.1导入所需的库和模块2.2定义模型和损失函数2.3定义优化器2.4在训练循
计算机视觉与深度学习实战：以Python为工具，基于帧间差法进行视频目标检测好知识传播者 Python实例开发实战计算机视觉深度学习 python 基于帧间差法进行视频目标检测
一、引言随着科技的飞速发展，计算机视觉和深度学习已成为当今科技领域的热门话题。它们不仅在科研领域取得了显著的成果，而且在安防监控、智能交通、医疗影像分析、工业自动化等领域得到了广泛的应用。本文旨在探讨计算机视觉与深度学习的实战应用，特别是以Python为工具，基于帧间差法进行视频目标检测的方法。二、计算机视觉概述计算机视觉是一门研究如何使机器从数字图像或视频中提取、分析和理解有用信息的学科。它涉及
基于深度学习的入侵检测系统设计与实现 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 AI大模型企业级应用开发实战计算计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
基于深度学习的入侵检测系统设计与实现关键词：深度学习、入侵检测、网络安全、机器学习、神经网络、特征提取、实时分析文章目录基于深度学习的入侵检测系统设计与实现1.背景介绍1.1网络安全的重要性1.2传统入侵检测系统的局限性1.3深度学习在安全领域的应用前景2.核心概念与联系2.1入侵检测系统（IDS）概述2.2深度学习基础2.3深度学习在入侵检测中的应用3.核心算法原理&具体操作步骤3.1算法原理概
【大模型应用开发动手做AI Agent】大模型就是Agent的大脑杭州大厂Java程序媛 DeepSeek R1 &AI人工智能与大数据 java python javascript kotlin golang 架构人工智能
【大模型应用开发动手做AIAgent】大模型就是Agent的大脑关键词：大模型,AIAgent,智能决策,任务导向,知识表示,交互式学习,混合智能1.背景介绍1.1问题由来随着人工智能(AI)技术的发展，尤其是深度学习和自然语言处理(NLP)技术的进步，越来越多的应用场景开始采用AI模型来解决复杂的决策问题。然而，当前的AI模型大多依赖于大模型的预训练知识，这些模型虽然在通用知识获取上取得了显著进
2025最新Python机器视觉实战：基于OpenCV与深度学习的多功能工业视觉检测系统（附完整代码） emmm形成中 python opencv 深度学习
2025最新Python机器视觉实战：基于OpenCV与深度学习的多功能工业视觉检测系统（附完整代码）摘要：本文基于OpenCV与深度学习模型，实现一个多功能工业视觉检测系统，包含缺陷检测、尺寸测量、颜色识别、OCR文本识别、目标分类与数据可视化等功能。代码兼容Python3.7+，功能丰富且经过稳定性测试，适合工业场景应用。所有依赖库均为最新版本，确保运行流畅。一、环境准备安装依赖库pipins
航电系统智能诊断深度实战：从硬件集成到DO-178C认证全流程解析（附工业级代码） Coderabo DeepSeek R1模型企业级应用航电系统智能诊断
航电系统智能故障诊断全栈技术解析——基于深度学习的工业级实现指南一、航电系统故障诊断技术体系1.1典型故障模式与特征classAvionicFault:FAULT_TYPES={101:'总线通信故障',102:'传感器漂移',
直播美颜SDK的底层技术解析：图像处理与深度学习的结合美狐美颜sdk 美颜API 直播美颜SDK 美颜SDK 图像处理深度学习人工智能美颜API 视频美颜SDK 直播美颜SDK 滤镜sdk
直播美颜SDK通过高效的图像处理技术和深度学习算法，使得用户在直播过程中可以获得更为自然、精致的美颜效果。本文将深入解析直播美颜SDK的底层技术，探讨图像处理与深度学习如何在这一领域实现完美结合，提升用户体验并推动行业创新。一、直播美颜SDK的基本概述图像处理是直播美颜SDK的核心技术之一，它主要负责对图像进行预处理、特征提取以及美颜效果的实时合成。在直播美颜SDK中，图像处理技术包含多个关键步骤
Neat Vision：深度学习NLP注意力机制可视化工具教程纪亚钧
NeatVision：深度学习NLP注意力机制可视化工具教程neat-visionNeat(NeuralAttention)Vision,isavisualizationtoolfortheattentionmechanismsofdeep-learningmodelsforNaturalLanguageProcessing(NLP)tasks.(framework-agnostic)项目地址:h
介绍 TensorFlow 的基本概念和使用场景。 AC使者 github sqlite 开发语言自然语言处理
TensorFlow是一个由Google开发的开源机器学习框架，旨在让开发者能够构建和训练各种深度学习模型。以下是TensorFlow的基本概念和使用场景：张量（Tensor）：在TensorFlow中，数据以张量的形式表示，可以理解为多维数组。张量是TensorFlow的基本数据单位，常用于存储训练数据和模型的参数。计算图（ComputationalGraph）：TensorFlow使用计算图来
撰写文献必用的评价指标之DCA决策曲线小辉同志深度学习深度学习论文阅读
系列文章目录第一章撰写文献必用的评价指标之普通表格第二章撰写文献必用的评价指标之DCA决策曲线目录系列文章目录前言一、DCA决策曲线表现形式横轴纵轴曲线曲线解读图例二、单因素多因素分析单因素分析多因素分析三、R语言程序代码代码解释总结前言在智慧医疗中，深度学习模型用于疾病预测等任务，DCA决策曲线能将模型的预测结果与不同阈值下的临床决策相结合，直观展示在不同疾病概率阈值下，采取某种诊断或治疗策略所
DeepSeek 学习路线图 CarlowZJ 学习 deepseek
以下是基于最新搜索结果整理的DeepSeek学习路线图，涵盖从基础到高级的系统学习路径，帮助你全面掌握DeepSeek的使用和应用开发。一、基础知识与预备技能1.数学基础线性代数：掌握矩阵运算和向量空间，这是深度学习的核心。概率统计：理解贝叶斯理论和概率分布，用于模型训练和推理。微积分：了解优化算法中的梯度下降等概念。2.编程基础Python：掌握Python编程，这是深度学习和AI开发的主要语言
log4j对象改变日志级别 3213213333332132 java log4j level log4j对象名称日志级别
log4j对象改变日志级别可批量的改变所有级别，或是根据条件改变日志级别。 log4j配置文件： log4j.rootLogger=ERROR,FILE,CONSOLE,EXECPTION #log4j.appender.FILE=org.apache.log4j.RollingFileAppender log4j.appender.FILE=org.apache.l
elk+redis 搭建nginx日志分析平台 ronin47 elasticsearch kibana logstash
elk+redis 搭建nginx日志分析平台 logstash,elasticsearch,kibana 怎么进行nginx的日志分析呢？首先，架构方面，nginx是有日志文件的，它的每个请求的状态等都有日志文件进行记录。其次，需要有个队列，redis的l
Yii2设置时区 dcj3sjt126com PHP timezone yii2
时区这东西，在开发的时候，你说重要吧，也还好，毕竟没它也能正常运行，你说不重要吧，那就纠结了。特别是linux系统，都TMD差上几小时，你能不痛苦吗？win还好一点。有一些常规方法，是大家目前都在采用的1、php.ini中的设置，这个就不谈了，2、程序中公用文件里设置，date_default_timezone_set一下时区3、或者。。。自己写时间处理函数，在遇到时间的时候，用这个函数处理（比较
js实现前台动态添加文本框，后台获取文本框内容 171815164 文本框
<%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://w
持续集成工具 g21121 持续集成
持续集成是什么？我们为什么需要持续集成？持续集成带来的好处是什么？什么样的项目需要持续集成？... 持续集成(Continuous integration ,简称CI)，所谓集成可以理解为将互相依赖的工程或模块合并成一个能单独运行
数据结构哈希表(hash)总结永夜-极光数据结构
1.什么是hash 来源于百度百科: Hash，一般翻译做“散列”，也有直接音译为“哈希”的，就是把任意长度的输入，通过散列算法，变换成固定长度的输出，该输出就是散列值。这种转换是一种压缩映射，也就是，散列值的空间通常远小于输入的空间，不同的输入可能会散列成相同的输出，所以不可能从散列值来唯一的确定输入值。简单的说就是一种将任意长度的消息压缩到某一固定长度的消息摘要的函数。
乱七八糟程序员是怎么炼成的
eclipse中的jvm字节码查看插件地址： http://andrei.gmxhome.de/eclipse/ 安装该地址的outline 插件后重启，打开window下的view下的bytecode视图 http://andrei.gmxhome.de/eclipse/ jvm博客： http://yunshen0909.iteye.com/blog/2
职场人伤害了“上司” 怎样弥补 aijuans 职场
由于工作中的失误，或者平时不注意自己的言行“伤害”、“得罪”了自己的上司，怎么办呢？　　在职业生涯中这种问题尽量不要发生。下面提供了一些解决问题的建议：　　一、利用一些轻松的场合表示对他的尊重　　即使是开明的上司也很注重自己的权威，都希望得到下属的尊重，所以当你与上司冲突后，最好让不愉快成为过去，你不妨在一些轻松的场合，比如会餐、联谊活动等，向上司问个好，敬下酒，表示你对对方的尊重，
深入浅出url编码 antonyup_2006 应用服务器浏览器 servlet weblogic IE
出处：http://blog.csdn.net/yzhz 杨争 http://blog.csdn.net/yzhz/archive/2007/07/03/1676796.aspx 一、问题：编码问题是JAVA初学者在web开发过程中经常会遇到问题，网上也有大量相关的
建表后创建表的约束关系和增加表的字段百合不是茶标的约束关系增加表的字段
下面所有的操作都是在表建立后操作的,主要目的就是熟悉sql的约束,约束语句的万能公式 1,增加字段(student表中增加姓名字段) alter table 增加字段的表名 add 增加的字段名增加字段的数据类型 alter table student add name varchar2(10); &nb
Uploadify 3.2 参数属性、事件、方法函数详解 bijian1013 JavaScript uploadify
一.属性属性名称默认值说明 auto true 设置为true当选择文件后就直接上传了，为false需要点击上传按钮才上传。 buttonClass ” 按钮样式 buttonCursor ‘hand’ 鼠标指针悬停在按钮上的样子 buttonImage null 浏览按钮的图片的路
精通Oracle10编程SQL(16)使用LOB对象 bijian1013 oracle 数据库 plsql
/* *使用LOB对象 */ --LOB(Large Object)是专门用于处理大对象的一种数据类型，其所存放的数据长度可以达到4G字节 --CLOB/NCLOB用于存储大批量字符数据，BLOB用于存储大批量二进制数据，而BFILE则存储着指向OS文件的指针 /* *综合实例 */ --建立表空间 --#指定区尺寸为128k,如不指定，区尺寸默认为64k CR
【Resin一】Resin服务器部署web应用 bit1129 resin
工作中，在Resin服务器上部署web应用，通常有如下三种方式：配置多个web-app 配置多个http id 为每个应用配置一个propeties、xml以及sh脚本文件配置多个web-app 在resin.xml中,可以为一个host配置多个web-app <cluster id="app&q
red5简介及基础知识白糖_ 基础
简介 Red5的主要功能和Macromedia公司的FMS类似，提供基于Flash的流媒体服务的一款基于Java的开源流媒体服务器。它由Java语言编写，使用RTMP作为流媒体传输协议，这与FMS完全兼容。它具有流化FLV、MP3文件，实时录制客户端流为FLV文件，共享对象，实时视频播放、Remoting等功能。用Red5替换FMS后,客户端不用更改可正
angular.fromJson boyitech AngularJS AngularJS 官方API AngularJS API
angular.fromJson 描述: 把Json字符串转为对象使用方法: angular.fromJson(json); 参数详解: Param Type Details json string JSON 字符串返回值: 对象, 数组, 字符串或者是一个数字示例: <!DOCTYPE HTML> <h
java-颠倒一个句子中的词的顺序。比如： I am a student颠倒后变成：student a am I bylijinnan java
public class ReverseWords { /** * 题目：颠倒一个句子中的词的顺序。比如： I am a student颠倒后变成：student a am I.词以空格分隔。 * 要求： * 1.实现速度最快,移动最少 * 2.不能使用String的方法如split,indexOf等等。 * 解答：两次翻转。 */ publ
web实时通讯 Chen.H Web 浏览器 socket 脚本
关于web实时通讯，做一些监控软件。由web服务器组件从消息服务器订阅实时数据，并建立消息服务器到所述web服务器之间的连接，web浏览器利用从所述web服务器下载到web页面的客户端代理与web服务器组件之间的socket连接，建立web浏览器与web服务器之间的持久连接；利用所述客户端代理与web浏览器页面之间的信息交互实现页面本地更新，建立一条从消息服务器到web浏览器页面之间的消息通路
[基因与生物]远古生物的基因可以嫁接到现代生物基因组中吗? comsci 生物
大家仅仅把我说的事情当作一个IT行业的笑话来听吧..没有其它更多的意思如果我们把大自然看成是一位伟大的程序员,专门为地球上的生态系统编制基因代码,并创造出各种不同的生物来,那么6500万年前的程序员开发的代码,是否兼容现代派的程序员的代码和架构呢?
oracle 外部表 daizj oracle 外部表 external tables
oracle外部表是只允许只读访问，不能进行DML操作，不能创建索引，可以对外部表进行的查询，连接，排序，创建视图和创建同义词操作。 you can select, join, or sort external table data. You can also create views and synonyms for external tables. Ho
aop相关的概念及配置 daysinsun AOP
切面(Aspect): 通常在目标方法执行前后需要执行的方法（如事务、日志、权限），这些方法我们封装到一个类里面，这个类就叫切面。连接点（joinpoint） spring里面的连接点指需要切入的方法，通常这个joinpoint可以作为一个参数传入到切面的方法里面（非常有用的一个东西）。通知（Advice）通知就是切面里面方法的具体实现，分为前置、后置、最终、异常环
初一上学期难记忆单词背诵第二课 dcj3sjt126com english word
middle 中间的，中级的 well 喔，那么；好吧 phone 电话，电话机 policeman 警察 ask 问 take 拿到；带到 address 地址 glad 高兴的，乐意的 why 为什么 China 中国 family 家庭 grandmother (外)祖母 grandfather (外)祖父 wife 妻子 husband 丈夫 da
Linux日志分析常用命令 dcj3sjt126com linux log
1.查看文件内容 cat -n 显示行号 2.分页显示 more Enter 显示下一行空格显示下一页 F 显示下一屏 B 显示上一屏 less /get 查询"get"字符串并高亮显示 3.显示文件尾 tail -f 不退出持续显示 -n 显示文件最后n行 4.显示头文件 head -n 显示文件开始n行 5.内容排序 sort -n 按照
JSONP 原理分析 fantasy2005 JavaScript jsonp jsonp 跨域
转自 http://www.nowamagic.net/librarys/veda/detail/224 JavaScript是一种在Web开发中经常使用的前端动态脚本技术。在JavaScript中，有一个很重要的安全性限制，被称为“Same-Origin Policy”（同源策略）。这一策略对于JavaScript代码能够访问的页面内容做了很重要的限制，即JavaScript只能访问与包含它的
使用connect by进行级联查询 234390216 oracle 查询父子 Connect by 级联
使用connect by进行级联查询 connect by可以用于级联查询，常用于对具有树状结构的记录查询某一节点的所有子孙节点或所有祖辈节点。来看一个示例，现假设我们拥有一个菜单表t_menu，其中只有三个字段：
一个不错的能将HTML表格导出为excel,pdf等的jquery插件 jackyrong jquery插件
发现一个老外写的不错的jquery插件，可以实现将HTML 表格导出为excel,pdf等格式，地址在： https://github.com/kayalshri/ 下面看个例子，实现导出表格到excel,pdf <html> <head> <title>Export html table to excel an
UI设计中我们为什么需要设计动效 lampcy UI UI设计
关于Unity3D中的Shader的知识首先先解释下Unity3D的Shader，Unity里面的Shaders是使用一种叫ShaderLab的语言编写的，它同微软的FX文件或者NVIDIA的CgFX有些类似。传统意义上的vertex shader和pixel shader还是使用标准的Cg/HLSL 编程语言编写的。因此Unity文档里面的Shader，都是指用ShaderLab编写的代码，
如何禁止页面缓存 nannan408 html jsp cache
禁止页面使用缓存~ ------------------------------------------------ jsp:页面no cache： response.setHeader("Pragma","No-cache"); response.setHeader("Cache-Control","no-cach
以代码的方式管理quartz定时任务的暂停、重启、删除、添加等 Everyday都不同定时任务管理 spring-quartz
【前言】在项目的管理功能中，对定时任务的管理有时会很常见。因为我们不能指望只在配置文件中配置好定时任务就行了，因为如果要控制定时任务的 “暂停” 呢？暂停之后又要在某个时间点 “重启” 该定时任务呢？或者说直接 “删除” 该定时任务呢？要改变某定时任务的触发时间呢？ “添加” 一个定时任务对于系统的使用者而言，是不太现实的，因为一个定时任务的处理逻辑他是不
EXT实例 tntxia ext
（1）增加一个按钮 JSP: <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <% String path = request.getContextPath(); Stri
数学学习在计算机研究领域的作用和重要性 xjnine Math
最近一直有师弟师妹和朋友问我数学和研究的关系，研一要去学什么数学课。毕竟在清华，衡量一个研究生最重要的指标之一就是paper,而没有数学，是肯定上不了世界顶级的期刊和会议的，这在计算机学界尤其重要！你会发现，不论哪个领域有价值的东西，都一定离不开数学！在这样一个信息时代，当google已经让世界没有秘密的时候，一种卓越的数学思维，绝对可以成为你的核心竞争力. 无奈本人实在见地