zcongfly

【自然语言处理NLP】Bert预训练模型、Bert上搭建CNN、LSTM模型的输入、输出详解

一、BertModel的输入和输出

from transformers import BertModel
bert=BertModel.from_pretrained('bert-base-chinese')
out=bert(context, attention_mask=mask)

1. 输入

Bert模型的输入context张量需要满足以下要求：

张量形状：context应为二维张量，形状为[batch_size, sequence_length]，其中
- batch_size是输入样本的批量大小，
- sequence_length是输入序列的长度。
数据类型：context的数据类型应为整数类型，如torch.LongTensor。
值范围：context中的值应该是词汇表中的词索引。通常情况下，词汇表中的特殊符号会被分配预先定义好的索引，例如 [PAD]、[UNK]、[CLS] 和 [SEP]。其余的词将被映射到词汇表中的相应索引。

另外，为了有效控制模型的注意力，提高计算效率，可以使用 attention_mask 张量。attention_mask 是一个与输入张量形状相同的二进制张量（0和1组成），用于指示哪些位置是有效的（1表示有效）和哪些位置是填充的（0表示填充）。填充位置的注意力权重将被设为零，因此模型不会关注填充位置。

注意，输入张量的长度限制取决于Bert模型的最大序列长度限制。超过最大长度的部分需要进行截断或者其他处理。

总结起来，Bert模型的输入context张量应为二维整数张量，形状为[batch_size, sequence_length]，并且可以结合使用attention_mask张量来标识填充位置。

2. 输出

如上边调用Bert模型时，输出结果out中包含last_hidden_state、pooler_output、hidden_states、past_key_values、attentions、cross_attentions几个属性。

以下是在BERT模型的输出中的各个属性的含义：

last_hidden_state: 这是BERT模型最后一个隐藏层的输出。它是一个形状为 [batch_size, sequence_length, hidden_size] 的张量，表示每个输入令牌的上下文相关表示。这个张量包含了输入序列中每个位置的隐藏状态信息。

last_hidden_state[:,0] 表示BERT模型输出的最后一个隐藏层的所有令牌的第一个位置（即 [CLS] 令牌）的表示。
在BERT模型中，通常在输入序列的开头添加一个特殊的 [CLS] 令牌，用于表示整个序列的汇总信息。last_hidden_state[:,0] 提取了这个 [CLS] 令牌的表示，它是一个形状为 [batch_size, hidden_size] 的张量。
这个 [CLS] 令牌的表示可以用作整个序列的汇总或句子级别的表示，通常用于下游任务的分类或句子级别的特征提取。在一些任务中，可以将 last_hidden_state[:,0] 作为整个序列的表示，用于进行情感分类、文本匹配等任务。
需要注意的是，last_hidden_state[:,0] 是一个针对每个样本的表示，如果批量处理了多个样本，则 batch_size 的维度将对应于样本的数量。

pooler_output: 这是BERT模型经过池化操作得到的输出。它是一个形状为 [batch_size, hidden_size] 的张量，表示整个输入序列的池化表示。它通常被用作句子级别的表示，用于下游任务的分类或句子级别的特征提取。
hidden_states: 这是BERT模型中所有隐藏层的输出。它是一个包含每个隐藏层输出的列表，其中每个元素的形状为 [batch_size, sequence_length, hidden_size]。hidden_states[0] 表示第一个隐藏层的输出，hidden_states[1] 表示第二个隐藏层的输出，以此类推，hidden_states[-1] 表示最后一个隐藏层的输出（即 last_hidden_state）。这些隐藏层输出可以用于更详细的分析或进行一些特殊任务。
past_key_values: 这是用于生成下一个预测令牌的先前键值对。它是一个元组，其中包含了前几次调用BERT模型时生成的先前键值对。它通常在生成任务（如文本生成）中使用，以便在多步预测中保留先前的状态信息。
attentions: 这是自注意力机制产生的注意力权重。它是一个列表，包含每个注意力头的注意力权重矩阵。注意力权重矩阵的形状为 [batch_size, num_heads, sequence_length, sequence_length]，表示模型在每个位置上关注其他位置的程度。
cross_attentions: 这是BERT模型中的交叉注意力机制产生的注意力权重。它是一个列表，包含每个交叉注意力头的注意力权重矩阵。注意力权重矩阵的形状为 [batch_size, num_heads, sequence_length, sequence_length]，表示模型在每个位置上关注另一个输入序列（如句子级别的任务中的两个句子）的程度。

这些属性提供了BERT模型在不同层级和注意力机制上的输出信息，可以根据任务的需求选择合适的属性来使用。

二、CNN的输入和输出

from transformers import BertModel
import torch.nn.functional as F

def conv_and_pool(self, x, conv):
    x = F.relu(conv(x)).squeeze(3)  #[batch_size, out_channels, output_length]
    x = F.max_pool1d(x, x.size(2)).squeeze(2)   #[batch_size, channels]
    return x

num_filters = 256
filter_sizes = (2, 3, 4)
convs = nn.ModuleList(
            [nn.Conv2d(1, config.num_filters, (k, config.hidden_size))
             for k in config.filter_sizes])
             
bert=BertModel.from_pretrained('bert-base-chinese')

encoder_out = self.bert(context, attention_mask=mask).last_hidden_state   #[batch_size, sequence_length, hidden_size]
out = encoder_out.unsqueeze(1) # [batch_size, 1(in_channels), sequence_length, hidden_size]
out = torch.cat([self.conv_and_pool(out, conv) for conv in self.convs], 1)  #[batch_size, channels*len(self.convs)]

1. nn.Conv2d

convs = nn.ModuleList([nn.Conv2d(1, num_filters, (k, hidden_size)) for k in config.filter_sizes])

这行代码定义了一个卷积层的列表 convs，其中每个卷积层都是通过 nn.Conv2d 创建的。

nn.Conv2d 是PyTorch中用于定义二维卷积层的类。在这里，通过使用 nn.Conv2d(1, config.num_filters, (k, config.hidden_size))，创建了一个卷积层对象。
每一个卷积层的输入是一个四维张量，形状为 [batch_size, in_channels, sequence_length, embedding_size]，参数解释如下：

batch_size 是输入样本的批量大小。
in_channels 是输入通道数，对于文本数据通常为1，表示单通道输入。
sequence_length 是输入序列的长度，即令牌的数量。
embedding_size 是输入序列中每个令牌的嵌入维度。

通过使用列表推导式和 nn.ModuleList，将多个卷积层对象组成一个列表 self.convs。这样就创建了一个由多个卷积层组成的模块列表。

在该代码段中，config.filter_sizes 是一个元组，包含了多个卷积核的宽度。具体地，代码使用列表推导式和 nn.ModuleList 创建了三个卷积层对象，对应于宽度为2、3和4的卷积核。

这样设计的目的可能是为了在文本分类等任务中使用多尺度卷积操作，从不同的窗口尺寸中提取特征。每个卷积核会产生一个输出特征图，这些特征图将被用于后续的处理或分类任务。通过使用不同宽度的卷积核，模型能够同时捕捉不同范围的语义信息，从而提高模型对输入文本的理解能力。

2. conv(out)

conv=nn.Conv2d(1, num_filters, (k, config.hidden_size))

out 是经过卷积层之前的输入张量，形状为 [batch_size, in_channels, sequence_length, hidden_size]。
- batch_size 是输入样本的批量大小。
- in_channels 是输入通道数，通常为 1，因为在这个例子中，输入是一维序列。
- sequence_length 是输入序列的长度。
- hidden_size 是隐藏维度，即每个位置的特征向量的维度。
conv(out) 是经过卷积操作后的输出张量，形状为 [batch_size, out_channels, output_length, feature_size]。
- batch_size 与输入张量相同。
- out_channels 是卷积层的输出通道数，由 config.num_filters 决定。
- output_length 是经过卷积操作后的输出序列长度，取决于输入序列的长度、卷积核大小和填充方式。
- feature_size 是每个位置的特征向量的维度，由卷积核大小和隐藏维度决定。

feature_size的计算方法

要计算 feature_size，需要知道卷积核的大小和隐藏层的维度。

假设卷积核的大小为 (k, hidden_size)，其中 k 是卷积核的宽度，hidden_size 是隐藏层的维度。在二维卷积操作中，卷积核在两个维度上滑动，分别为序列长度和隐藏层维度。

定义序列长度output_length和隐藏层维度feature_size分别为H'和W'对于二维卷积操作，输出张量的维度计算公式为：

[batch_size, out_channels, H', W']

其中，

batch_size是批量大小，
out_channels是输出通道数（卷积核个数），
H'是输出特征图的高度，计算公式为：H' = H - kernel_size[0] + 1（默认stride为1），
W'是输出特征图的宽度，计算公式为：W' = W - kernel_size[1] + 1（默认stride为1），
。

综上所述，当卷积核大小为 (k, hidden_size) 时，执行卷积操作后，输出张量的形状为 [batch_size, out_channels, output_length, 1]，其中 out_channels 是卷积层的输出通道数，output_length 是根据输入序列长度和卷积核大小计算得到的输出序列长度，1 是隐藏层维度（hidden_size-hidden_size+1），也是每个位置的特征向量的维度（feature_size）。

3. F.max_pool1d

F.max_pool1d 是 PyTorch 中用于一维最大池化操作的函数，它的输入和输出张量维度要求如下：

输入张量的维度要求：输入张量的形状应为 [batch_size, channels, sequence_length]，其中
- batch_size 是输入样本的批量大小，
- channels 是输入通道数，通常对应卷积层的输出通道数，
- sequence_length 是输入序列的长度。
输出张量的维度：输出张量的形状与输入张量的形状相同，即 [batch_size, channels, output_length]，其中
- batch_size 与输入张量相同，
- channels 与输入张量相同，
- output_length 是经过最大池化操作后的输出序列长度，它取决于池化窗口大小、步幅和填充方式。
x = torch.nn.functional.max_pool1d(x, x.size(2))
- x 是输入张量，假设形状为 [batch_size, channels, sequence_length]。
- x.size(2) 返回输入张量 x 在第三个维度上的大小，即输入序列的长度 sequence_length。

需要注意的是，F.max_pool1d 只能在输入张量的最后一个维度上进行池化操作，即在序列维度上进行池化。池化窗口的大小、步幅以及填充方式可以通过参数进行指定。在进行一维最大池化操作时，每个窗口中的最大值将被提取出来形成输出张量。

如果输入张量的形状不符合要求，可以使用相应的函数进行形状调整，如 torch.unsqueeze 来增加维度或 torch.transpose 进行维度交换，以满足 F.max_pool1d 函数的要求。

4. Bert预训练模型上叠加CNN模型

要在BERT预训练模型的基础上叠加CNN模型用于分类，可以考虑使用模型的输出 last_hidden_state 和 pooler_output 作为卷积层的输入具有不同的特点和适用性：

last_hidden_state：last_hidden_state 是BERT模型最后一个隐藏层的输出，它是一个形状为 [batch_size, sequence_length, hidden_size] 的张量。在使用 last_hidden_state 作为卷积层的输入时，可以考虑以下情况：
- 适用性：last_hidden_state 包含了每个输入令牌的上下文相关表示，可以捕捉到输入序列的详细信息。因此，它适用于需要使用局部特征进行分类或处理的任务，例如文本分类、命名实体识别等。通过卷积操作，可以提取不同尺寸的局部特征，以便对输入进行更细粒度的分析和建模。
- 注意事项：由于 last_hidden_state 的形状是 [batch_size, sequence_length, hidden_size]，在应用卷积操作之前，需要将其转换为 [batch_size, 1, sequence_length, hidden_size] 的四维张量，以匹配卷积层的输入要求。
pooler_output：pooler_output 是BERT模型经过池化操作得到的输出，它是一个形状为 [batch_size, hidden_size] 的张量。在使用 pooler_output 作为卷积层的输入时，可以考虑以下情况：
- 适用性：pooler_output 可以看作是整个输入序列的池化表示，具有更高级别的语义信息。因此，它适用于对整个序列进行分类或处理的任务，例如句子级情感分类、文本相似度等。通过卷积操作，可以进一步提取 pooler_output 中的特征，以便对输入序列进行更深入的分析和建模。
- 注意事项：由于 pooler_output 的形状是 [batch_size, hidden_size]，在应用卷积操作之前，需要将其转换为 [batch_size, 1, 1, hidden_size] 的四维张量，以匹配卷积层的输入要求。

在实际应用中，选择使用哪个输出作为卷积层的输入取决于任务需求和数据特点。如果任务需要更详细的局部特征，可以使用 last_hidden_state；如果任务更关注整体语义信息或句子级别的表示，可以使用 pooler_output。同时，还可以尝试不同的组合和变体，以找到最适合任务的输入表示。

三、lstm的输入和输出

from transformers import BertModel
from torch import nn

bert=BertModel.from_pretrained('bert-base-chinese')
lstm=nn.LSTM(input_size, rnn_hidden_size, num_layers, bidirectional=True, batch_first=True, dropout=config.dropout)
# nn.LSTM(输入特征大小, 隐藏状态大小, lstm层数, 是否为双向, 输入张量第一维是否为批量维度, 丢弃率, bias=True是否使用偏置项)

encoder_out= bert(context, attention_mask=mask).last_hidden_state   # [batch_size, sequence_length, hidden_size]
out, _ = self.lstm(encoder_out)

1.默认batch_first=False

nn.LSTM()函数的输入参数如下：

input_size：输入特征的大小。
hidden_size：隐藏状态的大小。
num_layers：LSTM的层数。
bias：是否使用偏置项，默认为True。
batch_first：输入张量是否具有批量维度在第一维，默认为False。
dropout：应用于LSTM层输出的丢弃率，默认为0。
bidirectional：是否使用双向LSTM，默认为False。

该模型的输入参数和输出结果的类型和维度如下：

输入参数：
- input：形状为 [sequence_length, batch_size, input_size] 的输入张量，其中
  - sequence_length 是输入序列的长度，
  - batch_size 是输入样本的批量大小，
  - input_size 是输入特征的大小。
- h_0：形状为 [num_layers * num_directions, batch_size, hidden_size] 的初始隐藏状态张量，其中
  - num_layers 是LSTM的层数，
  - num_directions 是LSTM的方向数（双向为2，单向为1），
  - batch_size 是输入样本的批量大小，
  - hidden_size 是隐藏状态的大小。
- c_0：形状为 [num_layers * num_directions, batch_size, hidden_size] 的初始细胞状态张量，具有与 h_0 相同的维度。
输出结果：
- output：形状为 [sequence_length, batch_size, num_directions * hidden_size] 的输出序列张量，其中
  - sequence_length 是输入序列的长度，
  - batch_size 是输入样本的批量大小，
  - num_directions 是LSTM的方向数（双向为2，单向为1），
  - hidden_size 是隐藏状态的大小。
- h_n：形状为 [num_layers * num_directions, batch_size, hidden_size] 的最后一个时间步的隐藏状态张量，具有与 h_0 相同的维度。
- c_n：形状为 [num_layers * num_directions, batch_size, hidden_size] 的最后一个时间步的细胞状态张量，具有与 h_0 相同的维度。

请注意，输入参数和输出结果的维度和类型是基于输入张量和参数的实际形状和设置。上述描述是一般情况下的示例，具体的维度和类型可能会因具体的输入数据形状和模型参数而有所不同。

示例：

import torch
import torch.nn as nn

input_size = 10
hidden_size = 20
num_layers = 2
batch_size = 4
sequence_length = 6
num_directions = 1

lstm = nn.LSTM(input_size, hidden_size, num_layers, bidirectional=False, batch_first=False)

input = torch.randn(sequence_length, batch_size, input_size)
h_0 = torch.randn(num_layers * num_directions, batch_size, hidden_size)
c_0 = torch.randn(num_layers * num_directions, batch_size, hidden_size)

output, (h_n, c_n) = lstm(input, (h_0, c_0))

print("Output shape:", output.shape)
print("Hidden state shape:", h_n.shape)
print("Cell state shape:", c_n.shape)

2. 设置batch_first=True

如果在使用nn.LSTM()时设置了batch_first=True，那么输入张量的形状为 [batch_size, sequence_length, hidden_size]，其中：

batch_size 表示批量大小，即输入数据中的样本数量。
sequence_length 表示序列的长度，即每个样本的时间步数或序列长度。
hidden_size 表示 LSTM 模型的隐藏状态的维度。

在这种设置下，nn.LSTM()的输出张量的形状为 [batch_size, sequence_length, num_directions * hidden_size]，其中：

num_directions 表示 LSTM 模型的方向数，通常为 1（单向 LSTM）或 2（双向 LSTM）。
hidden_size 表示 LSTM 模型的隐藏状态的维度。

输出张量中的 num_directions 是由 LSTM 模型的 bidirectional 参数决定的。如果 bidirectional=True，则输出张量中的 num_directions 为 2，即包括正向和反向的隐藏状态；如果 bidirectional=False，则输出张量中的 num_directions 为 1，即只包括正向的隐藏状态。

因此，当 batch_first=True 时，nn.LSTM() 模型的输出张量形状为 [batch_size, sequence_length, num_directions * hidden_size]。

注意
如果想在Bert预训练模型输出的基础上增加LSTM层，由于Bert模型的输出out.last_hidden_state张量的形状一致，可以直接作为输入传入LSTM层，无需像CNN一样进行形状转换。此时，应该将batch_first设置为True。

你可能感兴趣的:(自然语言处理NLP,自然语言处理,bert,cnn)

探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
使用Apify加载Twitter消息以进行微调的完整指南 nseejrukjhad twitter easyui 前端 python
#使用Apify加载Twitter消息以进行微调的完整指南##引言在自然语言处理领域，微调模型以适应特定任务是提升模型性能的常见方法。本文将介绍如何使用Apify从Twitter导出聊天信息，以便进一步进行微调。##主要内容###使用Apify导出推文首先，我们需要从Twitter导出推文。Apify可以帮助我们做到这一点。通过Apify的强大功能，我们可以批量抓取和导出数据，适用于各类应用场景。
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
自然语言处理_tf-idf _feivirus_ 算法机器学习和数学自然语言处理 tf-idf 逆文档频率词频
importpandasaspdimportmath1.数据预处理docA="Thecatsatonmyface"docB="Thedogsatonmybed"wordsA=docA.split("")wordsB=docB.split("")wordsSet=set(wordsA).union(set(wordsB))print(wordsSet){'on','my','face','sat',
BART&BERT Ambition_LAO 深度学习
BART和BERT都是基于Transformer架构的预训练语言模型。模型架构：BERT(BidirectionalEncoderRepresentationsfromTransformers)主要是一个编码器（Encoder）模型，它使用了Transformer的编码器部分来处理输入的文本，并生成文本的表示。BERT特别擅长理解语言的上下文，因为它在预训练阶段使用了掩码语言模型（MLM）任务，即
100天持续行动—Day01 Richard_DL
今天开始站着学习，发现效率大幅提升。把fast.ai的Lesson1的后半部分和Lesson2看完了。由于Keras版本和视频中的不一致，运行notebook时经常出现莫名其妙的错误，导致自己只动手实践了视频中的一小部分内容。为了赶时间，我打算先把与CNN相关的视频过一遍。然后尽快开始做自己的项目。明天继续加油，争取把Lesson3和Lesson4看完。
yolov5＞onnx＞ncnn＞apk 图像处理大大大大大牛啊 opencv实战代码讲解 yolo onnx ncnn 安卓
一.yolov5pt模型转onnx条件：colabnotebookyolov51.安装环境!pipinstallonnx>=1.7.0#forONNXexport!pipinstallcoremltools==4.0#forCoreMLexport!pipinstallonnx-simplifier2.修改common.py在classFocus下面
免费的GPT可在线直接使用（一键收藏） kkai人工智能 gpt
1、LuminAI（https://kk.zlrxjh.top）LuminAI标志着一款融合了星辰大数据模型与文脉深度模型的先进知识增强型语言处理系统，旨在自然语言处理（NLP）的技术开发领域发光发热。此系统展现了卓越的语义把握与内容生成能力，轻松驾驭多样化的自然语言处理任务。VisionAI在NLP界的应用领域广泛，能够胜任从机器翻译、文本概要撰写、情绪分析到问答等众多任务。通过对大量文本数据的
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
AI论文题目生成器怎么用？9款论文写作网站简单3步搞定小猪包333 写论文人工智能深度学习计算机视觉
在当今信息爆炸的时代，AI写作工具的出现极大地提高了写作效率和质量。本文将详细介绍9款优秀的论文写作网站，并重点推荐千笔-AIPassPaper。一、千笔-AIPassPaper千笔-AIPassPaper是一款功能强大的AI论文生成器，基于最新的自然语言处理技术，能够一键生成高质量的毕业论文、开题报告等文本内容。它不仅提供智能选题、文献推荐和论文润色等功能，还具有较高的用户评价。其文献综述生成功
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
机器学习-聚类算法不良人龍木木机器学习机器学习算法聚类
机器学习-聚类算法1.AHC2.K-means3.SC4.MCL仅个人笔记，感谢点赞关注！1.AHC2.K-means3.SC传统谱聚类：个人对谱聚类算法的理解以及改进4.MCL目前仅专注于NLP的技术学习和分享感谢大家的关注与支持！
轻量级模型解读——轻量transformer系列 lishanlu136 #图像分类轻量级模型 transformer 图像分类
先占坑，持续更新。。。文章目录1、DeiT2、ConViT3、Mobile-Former4、MobileViTTransformer是2017谷歌提出的一篇论文，最早应用于NLP领域的机器翻译工作，Transformer解读，但随着2020年DETR和ViT的出现(DETR解读，ViT解读)，其在视觉领域的应用也如雨后春笋般渐渐出现，其特有的全局注意力机制给图像识别领域带来了重要参考。但是tran
FlagEmbedding 吉小雨 python库 python
FlagEmbedding教程FlagEmbedding是一个用于生成文本嵌入（textembeddings）的库，适合处理自然语言处理（NLP）中的各种任务。嵌入（embeddings）是将文本表示为连续向量，能够捕捉语义上的相似性，常用于文本分类、聚类、信息检索等场景。官方文档链接：FlagEmbedding官方GitHub一、FlagEmbedding库概述1.1什么是FlagEmbeddi
计算机视觉中，Pooling的作用 Wils0nEdwards 计算机视觉人工智能
在计算机视觉中，Pooling（池化）是一种常见的操作，主要用于卷积神经网络（CNN）中。它通过对特征图进行下采样，减少数据的空间维度，同时保留重要的特征信息。Pooling的作用可以归纳为以下几个方面：1.降低计算复杂度与内存需求Pooling操作通过对特征图进行下采样，减少了特征图的空间分辨率（例如，高度和宽度）。这意味着网络需要处理的数据量会减少，从而降低了计算量和内存需求。这对大型神经网络
【NumPy】深入解析numpy.zeros()函数二七830 numpy
欢迎莅临我的个人主页这里是我深耕Python编程、机器学习和自然语言处理（NLP）领域，并乐于分享知识与经验的小天地！博主简介：我是二七830，一名对技术充满热情的探索者。多年的Python编程和机器学习实践，使我深入理解了这些技术的核心原理，并能够在实际项目中灵活应用。尤其是在NLP领域，我积累了丰富的经验，能够处理各种复杂的自然语言任务。技术专长：我熟练掌握Python编程语言，并深入研究了机
探索创新科技： Lite-Mono - 简约高效的小型化Mono框架杭律沛Meris
探索创新科技：Lite-Mono-简约高效的小型化Mono框架Lite-Mono[CVPR2023]Lite-Mono:ALightweightCNNandTransformerArchitectureforSelf-SupervisedMonocularDepthEstimation项目地址:https://gitcode.com/gh_mirrors/li/Lite-Mono如果你在寻找一个轻
go语言安装快速入门吉祥鸟hu
[TOC]go语言是什么Go是一个开源的编程语言，它能让构造简单、可靠且高效的软件变得容易。Go是从2007年末由RobertGriesemer,RobPike,KenThompson主持开发，后来还加入了IanLanceTaylor,RussCox等人，并最终于2009年11月开源，在2012年早些时候发布了Go1稳定版本。现在Go的开发已经是完全开放的，并且拥有一个活跃的社区如何安装环境笔者这
Humanize 项目教程尤嫒冰
Humanize项目教程humanizeAJSlibraryforaddinga“humantouch”todata.项目地址:https://gitcode.com/gh_mirrors/humani/humanize项目介绍Humanize是一个开源项目，旨在将机器生成的文本转换为更加自然、人性化的文本。该项目通过先进的算法和自然语言处理技术，使得AI生成的内容更加贴近人类的表达方式，从而提高
全自动解密解码神器 — Ciphey K'illCode python_模块 python vscode
Ciphey是一个使用自然语言处理和人工智能的全自动解密/解码/破解工具。简单地来讲，你只需要输入加密文本，它就能给你返回解密文本。就是这么牛逼。有了Ciphey，你根本不需要知道你的密文是哪种类型的加密，你只知道它是加密的，那么Ciphey就能在3秒甚至更短的时间内给你解密，返回你想要的大部分密文的答案。下面就给大家介绍Ciphey的实战使用教程。1.准备开始之前，你要确保Python和pip已
解决BERT模型bert-base-chinese报错（无法自动联网下载）搬砖修狗 bert 人工智能深度学习 python
一、下载问题hugging-face是访问BERT模型的最初网站，但是目前hugging-face在中国多地不可达，在代码中涉及到该网站的模型都会报错，本文我们就以bert-base-chinese报错为例，提供一个下载到本地的方法来解决问题。二、网站google-bert(BERTcommunity)Thisorganizationismaintainedbythetransformerstea
CV、NLP、数据控掘推荐、量化海的那边- AI算法自然语言处理人工智能
下面是对CV（计算机视觉）、NLP（自然语言处理）、数据挖掘推荐和量化的简要概述及其应用领域的介绍：1.CV（计算机视觉，ComputerVision）定义：计算机视觉是一门让计算机能够从图像或视频中提取有用信息，并做出决策的学科。它通过模拟人类的视觉系统来识别、处理和理解视觉信息。主要任务：图像分类：识别图像中的物体并分类，比如猫、狗、车等。目标检测：在图像或视频中定位并识别多个对象，如人脸检测
深度解析：如何使用输出解析器将大型语言模型（LLM）的响应解析为结构化JSON格式 m0_57781768 语言模型 json 人工智能
深度解析：如何使用输出解析器将大型语言模型（LLM）的响应解析为结构化JSON格式在现代自然语言处理（NLP）的应用中，大型语言模型（LLM）已经成为了重要的工具。这些模型能够生成丰富的自然语言文本，适用于各种应用场景。然而，在某些应用中，开发者不仅仅需要生成文本，还需要将这些生成的文本转换为结构化的数据格式，例如JSON。这种结构化的数据格式在数据传输、存储以及进一步处理时具有显著优势。本文将深
深入探讨：如何在Python中通过LangChain技术精准追踪大型语言模型（LLM）的Token使用情况 m0_57781768 python langchain 语言模型
深入探讨：如何在Python中通过LangChain技术精准追踪大型语言模型（LLM）的Token使用情况在现代的人工智能开发中，大型语言模型（LLM）已经成为了不可或缺的工具，无论是用于自然语言处理、对话生成，还是其他复杂的文本生成任务。然而，随着这些模型的广泛应用，开发者面临的一个重要挑战是如何有效地追踪和管理Token的使用情况，特别是在生产环境中，Token的使用直接影响着API调用的成本
使用最大边际相关性(MMR)选择示例：提高AI模型的多样性和相关性 aehrutktrjk 人工智能 easyui 前端 python
使用最大边际相关性(MMR)选择示例：提高AI模型的多样性和相关性引言在机器学习和自然语言处理领域，选择合适的训练示例对模型性能至关重要。最大边际相关性(MaximalMarginalRelevance,MMR)是一种优秀的示例选择方法，它不仅考虑了示例与输入的相关性，还注重保持所选示例之间的多样性。本文将深入探讨如何使用MMR来选择示例，以提高AI模型的性能和泛化能力。什么是最大边际相关性(MM
使用LangChain和OpenAI实现高效文本标注 aehrutktrjk langchain python
使用LangChain和OpenAI实现高效文本标注引言在自然语言处理(NLP)领域，文本标注是一项重要且常见的任务。它涉及为文本分配标签，如情感、语言、风格等。本文将介绍如何使用LangChain和OpenAI的API来实现高效的文本标注系统。我们将探讨如何设置环境、定义标注模式，以及如何使用OpenAI的模型来执行标注任务。环境准备首先，我们需要安装必要的库并设置API密钥：%pipinsta
数据分析-24-时间序列预测之基于keras的VMD-LSTM和VMD-CNN-LSTM预测风速皮皮冰燃数据分析数据分析
文章目录1普通的LSTM模型1.1数据重采样1.2数据标准化1.3切分窗口1.4划分数据集1.5建立模型1.6预测效果2VMD-LSTM模型2.1VMD分解时间序列2.2对每一个IMF建立LSTM模型2.2.1IMF1—LSTM2.2.2IMF2-LSTM2.2.3统一代码2.3评估效果3CNN-LSTM模型3.1数据预处理3.2建立模型3.3效果预测4VMD-CNN-LSTM模型4.1VMD分解
【NLP5-RNN模型、LSTM模型和GRU模型】一蓑烟雨紫洛 nlp rnn lstm gru nlp
RNN模型、LSTM模型和GRU模型1、什么是RNN模型RNN（RecurrentNeuralNetwork)中文称为循环神经网络，它一般以序列数据为输入，通过网络内部的结构设计有效捕捉序列之间的关系特征，一般也是以序列形式进行输出RNN的循环机制使模型隐层上一时间步产生的结果，能够作为当下时间步输入的一部分（当下时间步的输入除了正常的输入外还包括上一步的隐层输出）对当下时间步的输出产生影响2、R
基于深度学习的农作物病害检测 SEU-WYL 深度学习dnn 深度学习人工智能
基于深度学习的农作物病害检测利用卷积神经网络（CNN）、生成对抗网络（GAN）、Transformer等深度学习技术，自动识别和分类农作物的病害，帮助农业工作者提高作物管理效率、减少损失。1.农作物病害检测的挑战病害种类繁多：农作物病害的类型多样，不同病害在同一作物上的表现差异很大，同时同一种病害在不同生长阶段的症状也可能不同。环境影响：天气、光照、湿度等外部环境因素会影响农作物的表现，使得病害检
基于深度学习的文本引导的图像编辑 SEU-WYL 深度学习dnn 深度学习人工智能
基于深度学习的文本引导的图像编辑（Text-GuidedImageEditing）是一种通过自然语言文本指令对图像进行编辑或修改的技术。它结合了图像生成和自然语言处理（NLP）的最新进展，使用户能够通过描述性文本对图像内容进行精确的调整和操控。1.文本引导的图像编辑的挑战文本和图像之间的对齐：如何将文本中的语义信息准确地映射到图像中的特定区域或元素是一个关键挑战。这涉及到多模态数据的对齐和理解。编
怎么样才能成为专业的程序员？ cocos2d-x小菜编程 PHP
如何要想成为一名专业的程序员？仅仅会写代码是不够的。从团队合作去解决问题到版本控制，你还得具备其他关键技能的工具包。当我们询问相关的专业开发人员，那些必备的关键技能都是什么的时候，下面是我们了解到的情况。关于如何学习代码，各种声音很多，然后很多人就被误导为成为专业开发人员懂得一门编程语言就够了？！呵呵，就像其他工作一样，光会一个技能那是远远不够的。如果你想要成为
java web开发高并发处理 BreakingBad java Web 并发开发处理高
java处理高并发高负载类网站中数据库的设计方法（java教程,java处理大量数据，java高负载数据）一：高并发高负载类网站关注点之数据库没错,首先是数据库,这是大多数应用所面临的首个SPOF。尤其是Web2.0的应用，数据库的响应是首先要解决的。一般来说MySQL是最常用的，可能最初是一个mysql主机，当数据增加到100万以上，那么，MySQL的效能急剧下降。常用的优化措施是M-S（
mysql批量更新 ekian mysql
mysql更新优化：一版的更新的话都是采用update set的方式，但是如果需要批量更新的话，只能for循环的执行更新。或者采用executeBatch的方式，执行更新。无论哪种方式，性能都不见得多好。三千多条的更新，需要3分多钟。查询了批量更新的优化，有说replace into的方式，即： replace into tableName(id,status) values
微软BI（3） 18289753290 微软BI SSIS
1) Q：该列违反了完整性约束错误；已获得 OLE DB 记录。源:“Microsoft SQL Server Native Client 11.0” Hresult: 0x80004005 说明:“不能将值 NULL 插入列 'FZCHID'，表 'JRB_EnterpriseCredit.dbo.QYFZCH'；列不允许有 Null 值。INSERT 失败。”。 A：一般这类问题的存在是
Java中的List g21121 java
List是一个有序的 collection（也称为序列）。此接口的用户可以对列表中每个元素的插入位置进行精确地控制。用户可以根据元素的整数索引（在列表中的位置）访问元素，并搜索列表中的元素。与 set 不同，列表通常允许重复
读书笔记永夜-极光读书笔记
1. K是一家加工厂,需要采购原材料,有A,B,C,D 4家供应商,其中A给出的价格最低,性价比最高,那么假如你是这家企业的采购经理,你会如何决策? 传统决策: A:100%订单 B,C,D:0% &nbs
centos 安装 Codeblocks 随便小屋 codeblocks
1.安装gcc,需要c和c++两部分,默认安装下,CentOS不安装编译器的,在终端输入以下命令即可yum install gccyum install gcc-c++ 2.安装gtk2-devel,因为默认已经安装了正式产品需要的支持库,但是没有安装开发所需要的文档.yum install gtk2* 3. 安装wxGTK yum search w
23种设计模式的形象比喻 aijuans 设计模式
1、ABSTRACT FACTORY—追MM少不了请吃饭了，麦当劳的鸡翅和肯德基的鸡翅都是MM爱吃的东西，虽然口味有所不同，但不管你带MM去麦当劳或肯德基，只管向服务员说“来四个鸡翅”就行了。麦当劳和肯德基就是生产鸡翅的Factory 　　工厂模式：客户类和工厂类分开。消费者任何时候需要某种产品，只需向工厂请求即可。消费者无须修改就可以接纳新产品。缺点是当产品修改时，工厂类也要做相应的修改。如：
开发管理 CheckLists aoyouzi 开发管理 CheckLists
开发管理 CheckLists(23) -使项目组度过完整的生命周期开发管理 CheckLists(22) -组织项目资源开发管理 CheckLists(21) -控制项目的范围开发管理 CheckLists(20) -项目利益相关者责任开发管理 CheckLists(19) -选择合适的团队成员开发管理 CheckLists(18) -敏捷开发 Scrum Master 工作开发管理 C
js实现切换百合不是茶 JavaScript 栏目切换
js主要功能之一就是实现页面的特效,窗体的切换可以减少页面的大小,被门户网站大量应用思路: 1,先将要显示的设置为display:bisible 否则设为none 2,设置栏目的id ,js获取栏目的id,如果id为Null就设置为显示 3,判断js获取的id名字;再设置是否显示代码实现: html代码: <di
周鸿祎在360新员工入职培训上的讲话 bijian1013 感悟项目管理人生职场
这篇文章也是最近偶尔看到的，考虑到原博客发布者可能将其删除等原因，也更方便个人查找，特将原文拷贝再发布的。“学东西是为自己的，不要整天以混的姿态来跟公司博弈，就算是混，我觉得你要是能在混的时间里，收获一些别的有利于人生发展的东西，也是不错的，看你怎么把握了”，看了之后，对这句话记忆犹新。 &
前端Web开发的页面效果 Bill_chen html Web Microsoft
1.IE6下png图片的透明显示： <img src="图片地址" border="0" style="Filter.Alpha(Opacity)=数值(100),style=数值(3)"/> 或在<head></head>间加一段JS代码让透明png图片正常显示。 2.<li>标
【JVM五】老年代垃圾回收：并发标记清理GC(CMS GC) bit1129 垃圾回收
CMS概述并发标记清理垃圾回收(Concurrent Mark and Sweep GC）算法的主要目标是在GC过程中，减少暂停用户线程的次数以及在不得不暂停用户线程的请夸功能，尽可能短的暂停用户线程的时间。这对于交互式应用，比如web应用来说，是非常重要的。 CMS垃圾回收针对新生代和老年代采用不同的策略。相比同吞吐量垃圾回收，它要复杂的多。吞吐量垃圾回收在执
Struts2技术总结白糖_ struts2
必备jar文件早在struts2.0.*的时候，struts2的必备jar包需要如下几个： commons-logging-*.jar Apache旗下commons项目的log日志包 freemarker-*.jar
Jquery easyui layout应用注意事项 bozch jquery 浏览器 easyui layout
在jquery easyui中提供了easyui-layout布局，他的布局比较局限，类似java中GUI的border布局。下面对其使用注意事项作简要介绍：如果在现有的工程中前台界面均应用了jquery easyui，那么在布局的时候最好应用jquery eaysui的layout布局，否则在表单页面（编辑、查看、添加等等）在不同的浏览器会出
java-拷贝特殊链表：有一个特殊的链表，其中每个节点不但有指向下一个节点的指针pNext，还有一个指向链表中任意节点的指针pRand，如何拷贝这个特殊链表？ bylijinnan java
public class CopySpecialLinkedList { /** * 题目：有一个特殊的链表，其中每个节点不但有指向下一个节点的指针pNext，还有一个指向链表中任意节点的指针pRand，如何拷贝这个特殊链表？拷贝pNext指针非常容易，所以题目的难点是如何拷贝pRand指针。假设原来链表为A1 -> A2 ->... -> An，新拷贝
color Chen.H JavaScript html css
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <HTML> <HEAD>&nbs
[信息与战争]移动通讯与网络 comsci 网络
两个坚持:手机的电池必须可以取下来光纤不能够入户,只能够到楼宇建议大家找这本书看看:<&
oracle flashback query(闪回查询) daizj oracle flashback query flashback table
在Oracle 10g中，Flash back家族分为以下成员： Flashback Database Flashback Drop Flashback Table Flashback Query(分Flashback Query,Flashback Version Query，Flashback Transaction Query) 下面介绍一下Flashback Drop 和Flas
zeus持久层DAO单元测试 deng520159 单元测试
zeus代码测试正紧张进行中,但由于工作比较忙,但速度比较慢.现在已经完成读写分离单元测试了,现在把几种情况单元测试的例子发出来,希望有人能进出意见,让它走下去. 本文是zeus的dao单元测试: 1.单元测试直接上代码 package com.dengliang.zeus.webdemo.test; import org.junit.Test; import o
C语言学习三printf函数和scanf函数学习 dcj3sjt126com c printf scanf language
printf函数 /* 2013年3月10日20:42:32 地点：北京潘家园功能：目的：测试%x %X %#x %#X的用法 */ # include <stdio.h> int main(void) { printf("哈哈！\n"); // \n表示换行 int i = 10; printf
那你为什么小时候不好好读书? dcj3sjt126com life
dady, 我今天捡到了十块钱, 不过我还给那个人了 good girl! 那个人有没有和你讲thank you啊没有啦....他拉我的耳朵我才把钱还给他的, 他哪里会和我讲thank you 爸爸, 如果地上有一张5块一张10块你拿哪一张呢.... 当然是拿十块的咯... 爸爸你很笨的, 你不会两张都拿爸爸为什么上个月那个人来跟你讨钱, 你告诉他没
iptables开放端口 Fanyucai linux iptables 端口
1，找到配置文件 vi /etc/sysconfig/iptables 2，添加端口开放，增加一行，开放18081端口 -A INPUT -m state --state NEW -m tcp -p tcp --dport 18081 -j ACCEPT 3，保存 ESC :wq! 4，重启服务 service iptables
Ehcache（05）——缓存的查询 234390216 排序 ehcache 统计 query
缓存的查询目录 1. 使Cache可查询 1.1 基于Xml配置 1.2 基于代码的配置 2 指定可搜索的属性 2.1 可查询属性类型 2.2 &
通过hashset找到数组中重复的元素 jackyrong hashset
如何在hashset中快速找到重复的元素呢?方法很多，下面是其中一个办法： int[] array = {1,1,2,3,4,5,6,7,8,8}; Set<Integer> set = new HashSet<Integer>(); for(int i = 0
使用ajax和window.history.pushState无刷新改变页面内容和地址栏URL lanrikey history
后退时关闭当前页面 <script type="text/javascript"> jQuery(document).ready(function ($) { if (window.history && window.history.pushState) {
应用程序的通信成本 netkiller.github.com 虚拟机应用服务器陈景峰 netkiller neo
应用程序的通信成本什么是通信一个程序中两个以上功能相互传递信号或数据叫做通信。什么是成本这是是指时间成本与空间成本。时间就是传递数据所花费的时间。空间是指传递过程耗费容量大小。都有哪些通信方式全局变量线程间通信共享内存共享文件管道 Socket 硬件（串口，USB）等等全局变量全局变量是成本最低通信方法，通过设置
一维数组与二维数组的声明与定义恋洁e生二维数组一维数组定义声明初始化
/** * */ package test20111005; /** * @author FlyingFire * @date:2011-11-18 上午04:33:36 * @author ：代码整理 * @introduce :一维数组与二维数组的初始化 *summary： */ public c
Spring Mybatis独立事务配置 toknowme mybatis
在项目中有很多地方会使用到独立事务，下面以获取主键为例（1）修改配置文件spring-mybatis.xml  <tx:annotation-driven transaction-manager="transactionManager" /> &n
更新Anadroid SDK Tooks之后，Eclipse提示No update were found xp9802 eclipse
使用Android SDK Manager 更新了Anadroid SDK Tooks 之后，打开eclipse提示 This Android SDK requires Android Developer Toolkit version 23.0.0 or above, 点击Check for Updates 检测一会后提示 No update were found