David_7788

From Known to Unknown: Knowledge-guided Transformer for Time-Series Sales Forecasting Aliformer模型

Aliformer

$\\$

paper：From Known to Unknown: Knowledge-guided Transformer for Time-Series Sales Forecasting in Alibaba

$\\$

理论讲解部分

paper任务是基于历史的数据销售数据，对未来的销售数据进行预测，paper发现因为原来的模型都是基于历史的信息数据对未来进行预测，但是例如产品销量的预测，未来的一些促销信息会对当前的销量产生一个很大的影响，例如在促销之前的一小段时间，产品销量会有一个较大幅度的下跌，而促销开始，产品的销量会有一个较大的涨幅，这些原来的模型都无法很好的预测到，但是例如促销等信息都是可以提前知道的，因此提出了Aliformer，会基于未来的信息和历史的数据和信息对当前的进行预测。

Aliformer的网络流程：

Aliformer模型的主要部分在于AliAttention机制。

AliAttention

下图为AliAttention流程图

其中
$x^h and ~~ \overline{x},x表示的是统计数据和知识信息，\overline{x}表示的是知识信息$
shape 都是(batch_size,seq_len+pred_len,embeded_dim)

xh->v,k,q的矩阵的shape 为（embeded_dim,d_ff）,d_ff为一个更高的维度，或者是同维度变换也可以

x的计算公式如下，并且T表示的是已知的时间序列的长度，L表述需要预测的时间序列的长度，
$S_t^{(n)}表示的是统计信息，k^{(n)}_t表示的是知识信息，u^{(n)}_t表示的是未来的统计信息,\\ 因为未来的统计信息是未知的，因此使用一个token来代表，这是一个可学习的参\\ 或者是一个默认的值~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~$

通过三个全连接层得到了
$注意力机制的~Q,K,V,\overline{K},\overline{Q}$
并且按照流程图送入多头的注意力机制中，分别得到
$and~~\overline{Att}~~其中Att表的是统计信息和知识信息的注意力\\ \overline{Att}~表示的是纯知识信息的注意力~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~$
下图为具体的注意力机制的计算过程，其中d表示的就是
$x_i^h*W_Q^x的结果的最后一个维度，d是一个规模因子$

span masking

但是由于我们是使用一个token去替代未来的统计数据，因此这本身就是对未来数据的一个有偏差的估计，因此模型在训练的时候会更加依赖历史的知识数据和统计数据，但是这不是我们想要的，因此提出了一个跨度掩码的策略来使得模型更加的强调未来的统计信息和数据。

跨度掩码（span masking）在训练中会随机掩盖掉时间序列的中间一段序列，然后根据被mask掉的数据两边的数据进行预测被mask掉的数据。

代码讲解部分

任务简介

该任务是一个预测电力变压器的油温等的任务，因此知识信息就是时间信息

输入数据维度为 (batch_size,seq_len+pred_len,d_feature)，其中batch_size为批量大小

seq_len为已知时间序列的长度,pred_len为需要预测的时间长度，d_feature为特征维度

代码的流程

①先进入Aliformer的forward部分，然后处理数据

②进入AliAttention部分，然后在进入多头注意力机制的计算部分

③然后在返回到Aliformer继续进入AliAttention（堆叠了12层的AliAttention部分）

代码中的名称

$\overline{x}~,~k-fei表示的是\overline{k}~,~q-fei表示的是\overline{q}\\ x-knowledge表示的也是\overline{x}~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~$

初始化Aliformer

args参数是一个分装好的参数，里面包含了已知的时间序列的长度，需要预测的时间序列的长度，输入模型特征维度，embedding后特征维度，时间维度，升维后的维度d_ff，这一个维度可以自行设定

初始化Aliformer的参数

class Aliformer(nn.Module):
    def __init__(self,args,h=8,p2=0.5,loss_fn=torch.nn.MSELoss()):
        '''
        Args:
        :param h:头数
        :param d_feature:输入数据的最后一个维度dim
        :param d_mark:知识信息的维度（本数据集为时间信息的维度，4）
        :param d_model:embedding后的维度
        :param d_ff:升维后的维度
        d_ff % h==0
        :param p2: 在训练的时候使用跨度掩码的概率为p2
        :param loss_fn 使用的loss函数
        '''
        super().__init__()
        self.h=h
        self.d_feature=args.d_feature
        self.d_mark=args.d_mark
        self.d_model=args.d_model
        self.d_ff=args.d_ff
        self.p2=p2
        self.pred_len=args.pred_len
        self.label_len=args.label_len
        self.seq_len=args.seq_len

初始化embedding层

time_embeded是对时间维度进行embedding，把时间维度从d_mark–>d_model

embeded是把时间信息和数据一起进行embedding，输出的维度为d_model

  # embedding层
        self.time_embeded = TimeEmbedding(d_mark=self.d_mark, d_model=self.d_model)  # 对时间维度进行embedding
        self.embeded =  DataEmbedding_time_token(d_feature=self.d_feature, d_mark=self.d_mark, d_model=self.d_model)  # 把原始数据和时间维度embedding并且加在一起

初始化AliAttention层

self.aliattention=AliAttention(h=self.h,d_feature=self.d_feature,
                                       d_mark=self.d_mark,d_model=self.d_model,d_ff=self.d_ff) # 初始化AliAttention层

pred_len 就是预测的时间序列的长度，seq_len就是已知的时间序列的长度，label_len其实只是为了在后面 Aliformer的forward的变量y中把pred_len部分的数据切分出来，因为y是label_len+pred_len,label_len就是取seq_len的后面的部分长度为label_len的部分的数据

        self.pred_len=args.pred_len
        self.label_len=args.label_len
        self.seq_len=args.seq_len

初始化FC层，为了将预测的数据在特征维度和时间维度上进行降维

    self.out_dim=nn.Linear(self.d_model,self.d_feature) # 对特征维度进行降纬
    self.out_time=nn.Linear((self.seq_len+self.pred_len),self.pred_len) # 对时间维度进行降维

这里是为了span masking而设置的，因为有p2的概率是使用span masking方式的，因此先初始化一个有100个零的列表，然后把其中100*p2个设置为1，然后在这个列表中随机抽，如果抽中为1，那么就使用span masking ，否则就不使用span masking

       self.choice=torch.zeros((100))
        # 为了后面的选择是否使用span masking 策略,如果选择为1，那么就使用span mask策略
        self.choice[:int(p2*100)]=1 # 把p2*100的数字变成1，剩下的是0，然后在这一个列表中随机抽样
        self.loss_fn=loss_fn

初始化AliAttention的网络结构

初始化AliAttention都是按照AliAttention的流程图中的结构来初始化的

初始AliAttention中使用的参数

class AliAttention(nn.Module):
    def __init__(self,h=8,d_feature=7,d_mark=4,d_model=64,d_ff=128):
        '''
        Args:
        :param h:头数
        :param d_feature:输入数据的最后一个维度dim
        :param d_mark:知识信息的维度（本数据集为时间信息的维度，4）
        :param d_model:embedding后的维度
        :param d_ff:升为后的维度
        d_ff % h==0
        '''
        assert d_ff %h==0
        super().__init__()
        self.h=h
        self.d_feature=d_feature
        self.d_mark=d_mark
        self.d_model=d_model
        self.d_ff=d_ff
        self.dk=self.d_ff//self.h # 多头注意力机制中每一个头的维度

# x -->q,k,v
# 输入为以下三个输入输出的维度都是相同的（batch_size,seq_len+pred_len,d_model)-->输出为（batch_size,seq_len+pred_len,d_ff)
self.fc_x_to_v = nn.Linear(self.d_model, self.d_ff)
self.fc_x_to_k = nn.Linear(self.d_model, self.d_ff)
self.fc_x_to_q=nn.Linear(self.d_model,self.d_ff)

# 知识信息x的非-->k的非，Q的非
# 以下两个的输入输出的维度都是相同的（batch_size,seq_len+pred_len,d_model)-->输出为（batch_size,seq_len+pred_len,d_ff)
self.fc_knowledge_x_to_k=nn.Linear(self.d_model,self.d_ff)
self.fc_knowledge_x_to_q = nn.Linear(self.d_model, self.d_ff)

# 多头注意力机制,同维度变换，然后再reshape为，h,dk,(d_ff=dk*h)，就相当于经过h个全连接层在拼接起来
# 以下四个的输入输出的shape都是相同的 batch_size,seq_len+pred_len,d_ff)-->输出为（batch_size,seq_len+pred_len,d_ff)
self.fc_q=nn.Linear(self.d_ff,self.d_ff)
self.fc_k=nn.Linear(self.d_ff,self.d_ff)
self.fc_k_fei=nn.Linear(self.d_ff,self.d_ff)
self.fc_q_fei=nn.Linear(self.d_ff,self.d_ff)

# 输入为（batch_size,seq_len+pred_len,d_ff)-->输出为（batch_size,seq_len+pred_len,d_model)
self.fc_out=nn.Linear(self.d_ff,self.d_model) # 将数据的维度变回输入进attention的维度

AliAttention的forward

首先先通过x是统计数据和知识信息embedding后的数据，embedding部分在Aliformer中

def forward(self,x,x_knowledge):
    '''
    Args:
    :param x: shape是(batch_size,seq_len+pred_len,d_model)
    :param x_knowledge: shape是(batch_size,seq_len+pred_len,mark),知识信息，时间维度
    :return:out: shape(batch_size,seq_len+pred_len,d_model)
    '''
    # 得到q，k，v
    v=self.fc_x_to_v(x)
    k=self.fc_x_to_k(x)
    q=self.fc_x_to_q(x) # v,q,v的shape都是(batch_size,seq_len+pred_len,d_ff)
    # 得到知识信息的q，k，称为q_fei,k_fei
    # k_fei,q_fei shape(batch_size,seq_len+pred_len,d_ff)
    k_fei=self.fc_knowledge_x_to_k(x_knowledge)
    q_fei=self.fc_knowledge_x_to_q(x_knowledge)
    # 输入进attention中得到输出
    out=self.attention(q,k,v,q_fei,k_fei)
    return out

定义多头Attention函数

其中输入的q , k , v , 是通过x得到的，q_fei , k_fei是通过x的非（纯知识信息）得到的

 def attention(self, q, k, v, q_fei, k_fei):
        '''
        Args:
        :param q: 综合信息的q,shape(batch_size,seq_len+pred_len,d_ff)
        :param k: 综合信息的k,shape(batch_size,seq_len+pred_len,d_ff)
        :param v: 综合信息的v,shape(batch_size,seq_len+pred_len,d_ff)
        :param q_fei: 知识信息的q,shape(batch_size,seq_len+pred_len,d_ff)
        :param v_fei: 知识信息的v,shape(batch_size,seq_len+pred_len,d_ff)
        :return: out,shape(batch_size,seq_len+pred_len,d_model)
        '''

首先q，k，q_fei , k_fei，先分别经过一个全连接然后在进行一下reshape变为（batch_size,h,seq_len+pred_len,dk)，因为经过一个全连接后在reshape，等同于经过多个全连接后在进行拼接

        # 多头注意力q,k,q_fei,k_fei的shape变为（batch_size,h,seq_len+pred_len,dk) ,dk*h=d_ff
        q=self.fc_q(q).reshape(q.shape[0],self.h,q.shape[1],-1)
        k = self.fc_k(k).reshape(k.shape[0],self.h,k.shape[1],-1)
        q_fei = self.fc_q_fei(q_fei).reshape(q_fei.shape[0],self.h ,q_fei.shape[1],-1)
        k_fei = self.fc_k_fei(k_fei).reshape(k_fei.shape[0], self.h, k_fei.shape[1],-1)

得到比例因子，为了后面计算Attention值的时候使用

    d= q.shape[-1]
    d_fei = q_fei.shape[-1] # 为了计算attention时候作为比例因子,就为dk

流程图中的
$x^h_i*W_Q^x在代码中就是q，x^h_j*W^x_K在代码中就是K，剩下的也同理$

      # K的最后两个维度进行一个转置，从(batch_size,h,seq_len+pred_len,dk)-->((batch_size,h,dk,seq_len+pred_len),为了能够进行矩阵的乘法
        # att and att_fei shape(batch_size,h,seq_len+pred_len,seq_len+pred_len)，表示的就是每一时间点之间的注意力关系
        att = torch.matmul(q, k.transpose(-1, -2)) / (math.sqrt(2 * d))
        att_fei = torch.matmul(q_fei, k_fei.transpose(-1, -2)) / (math.sqrt(2 * d_fei))
        att_final = att + att_fei

流程图中的
$_jSoftmax(Att(i,j)^*)在代码中就是score，（x_i^h*W_V^x）在代码中就是v，W在代码中为fc-out$

        score = torch.softmax(att_final, dim=-1) # score的shape(batch_size,h,seq_len+pred_len,seq_len+pred_len)
        # 为了使得V可以和score进行矩阵乘法，因此把V reshape成(batch_size,h,seq_len+pred_len,dk)
        v=v.reshape(v.shape[0],self.h,v.shape[1],-1) # v从(batch_size,seq_len+pred_len,d_ff)-->(batch_size,h,seq_len+pred_len,dk)
        out = torch.matmul(score, v) # out shape(batch_size,seq_len+pred_len,dk)
        out=out.reshape(out.shape[0],out.shape[2],-1) # reshape为(batch_size,seq_len+pred_len,d_ff)
        out=self.fc_out(out) # 对特征维度进行降维，输入为(batch_size,seq_len+pred_len,d_ff)-->（batch_size,seq_len+pred_len,d_model）

Aliformer的forward函数

模型的主体部分在此

def forward(self, enc_x, enc_mark, y, y_mark,mode):
    '''
    Args:
    :param enc_x: (batch_size,seq_len,dim)
    :param enc_mark: (batch_size,seq_len,4)
    :param y: (batch_size,label_len+pred_len,dim)
    :param y_mark: (batch_size,label_len+pred_len,4)
    :param  mode:判断是否是在训练
    :return:
    '''

使用全零进行初始化综合信息 x和知识信息x_knowledge

x = torch.zeros(enc_x.shape[0], enc_x.shape[1] + self.pred_len, enc_x.shape[2])
x_knowledge = torch.zeros(enc_mark.shape[0], enc_mark.shape[1] + self.pred_len, enc_mark.shape[2]) #初始化

训练的时候，由于有两个训练模式，模式1，普通的训练模式，模式2:，span masking训练模型

因此先将seq_len和pred_len部分对应的数据都拼接起来

x是将seq_len,pred_len的data数据拼接起来

x_knowledge是将seq_len,pred_len部分的时间数据拼接起来

if mode == 'train':
    x[:,:self.seq_len,:]=x[:,:self.seq_len,:]+enc_x
    x[:,self.seq_len:,:]=x[:,self.seq_len:,:]+y[:,self.label_len:,:] # 将pred_len的数据也拼接上去

    x_knowledge[:, :self.seq_len, :] = x_knowledge[:, :self.seq_len, :] + enc_mark
    x_knowledge[:, self.seq_len:, :] = x_knowledge[:, self.seq_len:, :] + y_mark[:, self.label_len:, :] # 将pred_len的数据也拼接上去

选择训练模式

在之前就已经按照概率将列表中放置了0,1的列表中随机抽取，如果抽到的是0，那么代表不是span masking，即就把pred_len部分设置为0即可，并且对应的label也是pred_len部分的数据

如果抽到是1，那么就是span masking ，就随机在0~seq_len中抽取起始点，从抽取到起始点往后pred_len长度就是本次预测的label，把该部分设置为0

    choice=random.choice(self.choice)
    if choice==0:
        label=x[:,self.pred_len:,:] # 把label分出来
        x[:,self.pred_len:,:]=0

    else:
        star=random.choice(range(self.seq_len)) # 随机选取初始点
        label=x[:,star:star+self.pred_len,:]
        x[:,star:star+self.pred_len,:]=0

测试

测试的时候就和训练的普通模式差不多

测试的时候就只把seq_len部分的数据放上，pred_len部分的数据直接使用零进行代替

  else: # 如果是在测试，那么直接把pred_len部分的数据mask掉，设置为0
        x[:, :self.seq_len, :] = x[:, :self.seq_len, :] + enc_x
        label = y[:, self.label_len:, :]
        x_knowledge[:, :self.seq_len, :] = x_knowledge[:, :self.seq_len, :] + enc_mark
        x_knowledge[:, self.seq_len:, :] = x_knowledge[:, self.seq_len:, :] + y_mark[:, self.label_len:,:] # 将pred_len的数据也拼接上,因为知识数据是可以预先知道的

将数据进行embedding

x=self.embeded(x,x_knowledge)
x_knowledge=self.time_embeded(x_knowledge) # shape都为（batch_size,seq_len+pred_len,d_model）

堆叠AliAttention层

'''
Args:
:param x: shape是(batch_size,seq_len+pred_len,d_feature)
:param x_knowledge: shape是(batch_size,seq_len+pred_len,mark),知识信息，时间维度
'''
#  堆叠12层的AliAttention
x = self.aliattention(x, x_knowledge)
x = self.aliattention(x,x_knowledge)
x = self.aliattention(x, x_knowledge)
x = self.aliattention(x, x_knowledge)
x = self.aliattention(x, x_knowledge)
x = self.aliattention(x, x_knowledge)
x = self.aliattention(x,x_knowledge)
x = self.aliattention(x, x_knowledge)
x = self.aliattention(x, x_knowledge)
x = self.aliattention(x, x_knowledge)
x = self.aliattention(x, x_knowledge)
x = self.aliattention(x, x_knowledge)

将数据在特征维度和时间维度进行降维，然后和label进行loss计算，返回pred和loss值

# 输入为(batch_size,seq_len+pred_len,d_model)-->输出为(batch_size,seq_len+pred_len,d_feature)
x = self.out_dim(x)
# 输入为(batch_size,seq_len+pred_len,d_feature)-->输出为(batch_size,pred_len,d_feature)
y_hat=(self.out_time(x.permute(0,2,1))).permute(0,2,1)

loss=self.loss_fn(y_hat,label)
return y_hat,loss

完整的Aliformer代码

import torch
import torch.nn as nn
import math
import random
from layers.embeded import  DataEmbedding_time_token,TimeEmbedding


#----------------------------------------------------------------------------------------------
# 首先我们得到的输入数据为enc_x(batch_size,seq_len,dim)，y(batch_size,label_len+pred_len,dim)
# 其对应的时间数据为enc_mark(batch_size,seq_len,dim)，y_mark（batch_size,label_len+pred_len,dim)
# lable_len就是seq_len的后面长度为label_len部分的数据
# 因此我们通过拼接将数据enc_x和y变为x=（batch_size,seq_len+pred_len,dim)
# 并且并且对应的时间数据enc_mark和y_mark变为x_knowledge=（batch_size,seq_len+pred_len,dim)
# 然后我们在Aliformer中把x和x_knowledge经过embedding后变为（batch_size,seq_len+pred_len,d_model)
# 把x_knowledge经过dateembedding后变为（batch_size,seq_len+pred_len,d_model)
# 然后在送入AliAttention中，在AliAttention输出也为(batch_size,seq_len+pred_len,d_model)
#----------------------------------------------------------------------------------------------

class AliAttention(nn.Module):
    def __init__(self,h=8,d_feature=7,d_mark=4,d_model=64,d_ff=128,drop_out=0.1):
        '''
        Args:
        :param h:头数
        :param d_feature:输入数据的最后一个维度dim
        :param d_mark:知识信息的维度（本数据集为时间信息的维度，4）
        :param d_model:embedding后的维度
        :param d_ff:升为后的维度
        d_ff % h==0
        :param drop_out：drop_out的概率
        '''
        assert d_ff %h==0
        super().__init__()
        self.h=h
        self.d_feature=d_feature
        self.d_mark=d_mark
        self.d_model=d_model
        self.d_ff=d_ff
        self.drop_out=nn.Dropout(p=drop_out)
        self.dk=self.d_ff//self.h # 多头注意力机制中每一个头的维度

        # x -->q,k,v
        # 输入为以下三个输入输出的维度都是相同的（batch_size,seq_len+pred_len,d_model)-->输出为（batch_size,seq_len+pred_len,d_ff)
        self.fc_x_to_v = nn.Linear(self.d_model, self.d_ff)
        self.fc_x_to_k = nn.Linear(self.d_model, self.d_ff)
        self.fc_x_to_q=nn.Linear(self.d_model,self.d_ff)

        # 知识信息x的非-->k的非，Q的非
        # 以下两个的输入输出的维度都是相同的（batch_size,seq_len+pred_len,d_model)-->输出为（batch_size,seq_len+pred_len,d_ff)
        self.fc_knowledge_x_to_k=nn.Linear(self.d_model,self.d_ff)
        self.fc_knowledge_x_to_q = nn.Linear(self.d_model, self.d_ff)

        # 多头注意力机制,同维度变换，然后再reshape为，h,dk,(d_ff=dk*h)，就相当于经过h个全连接层在拼接起来
        # 以下四个的输入输出的shape都是相同的 batch_size,seq_len+pred_len,d_ff)-->输出为（batch_size,seq_len+pred_len,d_ff)
        self.fc_q=nn.Linear(self.d_ff,self.d_ff)
        self.fc_k=nn.Linear(self.d_ff,self.d_ff)
        self.fc_k_fei=nn.Linear(self.d_ff,self.d_ff)
        self.fc_q_fei=nn.Linear(self.d_ff,self.d_ff)

        # 输入为（batch_size,seq_len+pred_len,d_ff)-->输出为（batch_size,seq_len+pred_len,d_model)
        self.fc_out=nn.Linear(self.d_ff,self.d_model) # 将数据的维度变回输入进attention的维度

    def attention(self, q, k, v, q_fei, k_fei):
        '''
        Args:
        :param q: 综合信息的q,shape(batch_size,seq_len+pred_len,d_ff)
        :param k: 综合信息的k,shape(batch_size,seq_len+pred_len,d_ff)
        :param v: 综合信息的v,shape(batch_size,seq_len+pred_len,d_ff)
        :param q_fei: 知识信息的q,shape(batch_size,seq_len+pred_len,d_ff)
        :param v_fei: 知识信息的v,shape(batch_size,seq_len+pred_len,d_ff)
        :return: out,shape(batch_size,seq_len+pred_len,d_model)
        '''

        # 多头注意力q,k,q_fei,k_fei的shape变为（batch_size,h,seq_len+pred_len,dk) ,dk*h=d_ff
        q=self.fc_q(q).reshape(q.shape[0],self.h,q.shape[1],-1)
        k = self.fc_k(k).reshape(k.shape[0],self.h,k.shape[1],-1)
        q_fei = self.fc_q_fei(q_fei).reshape(q_fei.shape[0],self.h ,q_fei.shape[1],-1)
        k_fei = self.fc_k_fei(k_fei).reshape(k_fei.shape[0], self.h, k_fei.shape[1],-1)

        d = q.shape[-1]
        d_fei = q_fei.shape[-1] # 为了计算attention时候作为比例因子,就为dk

        # K的最后两个维度进行一个转置，从(batch_size,h,seq_len+pred_len,dk)-->((batch_size,h,dk,seq_len+pred_len),为了能够进行矩阵的乘法
        # att and att_fei shape(batch_size,h,seq_len+pred_len,seq_len+pred_len)，表示的就是每一时间点之间的注意力关系
        att = torch.matmul(q, k.transpose(-1, -2)) / (math.sqrt(2 * d))
        att_fei = torch.matmul(q_fei, k_fei.transpose(-1, -2)) / (math.sqrt(2 * d_fei))
        att_final = att + att_fei
        score = torch.softmax(att_final, dim=-1) # score的shape(batch_size,h,seq_len+pred_len,seq_len+pred_len)
        score=self.drop_out(score)
        # 为了使得V可以和score进行矩阵乘法，因此把V reshape成(batch_size,h,seq_len+pred_len,dk)
        v=v.reshape(v.shape[0],self.h,v.shape[1],-1) # v从(batch_size,seq_len+pred_len,d_ff)变为(batch_size,h,seq_len+pred_len,dk)
        out = torch.matmul(score, v) # out shape(batch_size,seq_len+pred_len,dk)
        out=out.reshape(out.shape[0],out.shape[2],-1) # reshape为(batch_size,seq_len+pred_len,d_ff)
        out=self.fc_out(out) # 对特征维度进行降维，输入为(batch_size,seq_len+pred_len,d_ff)-->（batch_size,seq_len+pred_len,d_model）
        return out

    def forward(self,x,x_knowledge):
        '''
        Args:
        :param x: shape是(batch_size,seq_len+pred_len,d_model)
        :param x_knowledge: shape是(batch_size,seq_len+pred_len,mark),知识信息，时间维度
        :return:out: shape(batch_size,seq_len+pred_len,d_model)
        '''
        # 得到q，k，v
        # v,k,q都是(batch_size, seq_len + pred_len, d_model)-->（batch_size, seq_len + pred_len, d_ff)
        v=self.fc_x_to_v(x)
        k=self.fc_x_to_k(x)
        q=self.fc_x_to_q(x)
        # 得到知识信息的q，k，称为q_fei,k_fei
        # k_fei,q_fei（batch_size, seq_len + pred_len, d_model)-->输出为（batch_size, seq_len + pred_len, d_ff)
        k_fei=self.fc_knowledge_x_to_k(x_knowledge)
        q_fei=self.fc_knowledge_x_to_q(x_knowledge)

        # 输入进attention中得到输出out为（batch_size,seq_len+pred_len,d_model)
        out=self.attention(q,k,v,q_fei,k_fei)
        return out

    
    
class Aliformer(nn.Module):
    def __init__(self,args,h=8,p2=0.5,loss_fn=torch.nn.MSELoss()):
        '''
        Args:
        :param h:头数 多头注意力网络中的头数
        :param d_feature:输入数据的最后一个维度dim（本数据集为 7）
        :param d_mark:知识信息的维度（本数据集为时间信息的维度 4）
        :param d_model:embedding后的维度
        :param d_ff:升为后的维度
        d_ff % h==0
        :param p2: 在训练的时候使用跨度掩码的概率为p2
        :param loss_fn 使用的loss函数
        '''
        super().__init__()
        self.h=h
        self.d_feature=args.d_feature
        self.d_mark=args.d_mark
        self.d_model=args.d_model
        self.d_ff=args.d_ff
        self.p2=p2

        # embedding层
        self.time_embeded = TimeEmbedding(d_mark=self.d_mark, d_model=self.d_model)  # 对时间维度进行embedding
        self.embeded = DataEmbedding(d_feature=self.d_feature, d_mark=self.d_mark,
                                     d_model=self.d_model, dropout=0, pos=False)  # 把原始数据和时间维度embedding并且加在一起

        self.aliattention=AliAttention(h=self.h,d_feature=self.d_feature,
                                       d_mark=self.d_mark,d_model=self.d_model,d_ff=self.d_ff) # 初始化AliAttention层

        self.pred_len=args.pred_len
        self.label_len=args.label_len
        self.seq_len=args.seq_len

        self.out_dim=nn.Linear(self.d_model,self.d_feature) # 对特征维度进行降纬
        self.out_time=nn.Linear((self.seq_len+self.pred_len),self.pred_len) # 对时间维度进行降维

        self.choice=torch.zeros((100))
        # 为了后面的选择是否使用span masking 策略,如果选择为1，那么就使用span mask策略
        self.choice[:int(p2*100)]=1 # 把p2*100的数字变成1，剩下的是0，然后在这一个列表中随机抽样
        self.loss_fn=loss_fn

    def forward(self, enc_x, enc_mark, y, y_mark,mode):
        '''
        Args:
        :param enc_x: (batch_size,seq_len,dim)
        :param enc_mark: (batch_size,seq_len,d_mark)
        :param y: (batch_size,label_len+pred_len,dim)
        :param y_mark: (batch_size,label_len+pred_len,d_mark)
        :param  mode:判断是否是在训练
        :return:
        '''
        # 初始化x装的是data，x_knowledge装的是时间信息
        x = torch.zeros(enc_x.shape[0], enc_x.shape[1] + self.pred_len, enc_x.shape[2],device=enc_x.device) # x（batch_size,seq_len+pred_len,dim)
        x_knowledge = torch.zeros(enc_mark.shape[0], enc_mark.shape[1] + self.pred_len, enc_mark.shape[2],device=enc_x.device) # x_knowledge（batch_size,seq_len+pred_len,d_mark)

        if mode == 'train':
            # 将seq_len+pred_len的时间数据都拼到x上
            x[:,:self.seq_len,:]=x[:,:self.seq_len,:]+enc_x
            x[:,self.seq_len:,:]=x[:,self.seq_len:,:]+y[:,self.label_len:,:] # 将pred_len的数据拼接上去

            # 将seq_len+pred_len的时间数据都拼接到x_knowledge上
            x_knowledge[:, :self.seq_len, :] = x_knowledge[:, :self.seq_len, :] + enc_mark
            x_knowledge[:, self.seq_len:, :] = x_knowledge[:, self.seq_len:, :] + y_mark[:, self.label_len:, :] # 将pred_len的数据拼接上去

            choice=random.choice(self.choice) #self.choice中有100*int(p2)个1，剩下的都是0,在其中随机抽取来代表是使用span masking还是正常的预测
            if choice==0: #正常的预测
                label=x[:,self.pred_len:,:].clone() # 把label分出来
                x[:,self.pred_len:,:]=0 # 把label对应的部分设置为0
                star=self.seq_len # 需要预测的部分对应的起始index

            else: # span masking
                star=random.choice(range(self.seq_len)) # 在0~seq_len中随机选取初始点
                label=x[:,star:star+self.pred_len,:].clone() # label就是strar-star+pred_len部分
                x[:,star:star+self.pred_len,:]=0 # 把label对应的部分设置为0

        else: # 如果是在测试，那么直接把pred_len部分的数据mask掉，设置为0
        # 测试下的x shape也是(batch_size,seq_len+pred_len,dim),x_knowledge (batch_size,seq_len+pred_len,d_mark),
        # 只不过pred_len部分全部为0
            x[:, :self.seq_len, :] = x[:, :self.seq_len, :] + enc_x # 将seq_len部分的data赋值给x
            label = y[:, self.label_len:, :] # 得到label 是pred_len 部分对应的data
            x_knowledge[:, :self.seq_len, :] = x_knowledge[:, :self.seq_len, :] + enc_mark # 将seq_len部分的时间数据赋值给x_knowledge
            x_knowledge[:, self.seq_len:, :] = x_knowledge[:, self.seq_len:, :] + y_mark[:, self.label_len:,:] # 将pred_len的数据也赋值给x_knowledge,因为知识数据是可以预先知道的
            star=self.seq_len # 需要预测的部分对应的index
        '''
        Args:
        :param x: shape是(batch_size,seq_len+pred_len,d_feature)
        :param x_knowledge: shape是(batch_size,seq_len+pred_len,d_mark),知识信息，时间维度
        '''

        x=self.embeded(x,x_knowledge) # 输出x的shape为 (batch_size,seq_len+pred_len，d_model）
        x_knowledge=self.time_embeded(x_knowledge) # x_knowledge shape为（batch_size,seq_len+pred_len,d_model）

        x=self.aliattention(x,x_knowledge)
        x_new=x.clone()

        pred=self.out_time(x.permute(0,2,1)).permute(0,2,1)
        x_new[:,star:star+self.pred_len,:]=pred # 把使用AliAttention预测的值拼接回去

        x=self.embeded(x,x_knowledge)
        x_knowledge=self.time_embeded(x_knowledge) # shape都为（batch_size,seq_len+pred_len,d_model）

        #  堆叠12层的AliAttention
        x = self.aliattention(x, x_knowledge)
        x = self.aliattention(x, x_knowledge)
        x = self.aliattention(x, x_knowledge)
        x = self.aliattention(x, x_knowledge)
        x = self.aliattention(x, x_knowledge)
        x = self.aliattention(x, x_knowledge)
        x = self.aliattention(x, x_knowledge)
        x = self.aliattention(x, x_knowledge)
        x = self.aliattention(x, x_knowledge)
        x = self.aliattention(x, x_knowledge)
        x = self.aliattention(x, x_knowledge)
        x = self.aliattention(x, x_knowledge)
        # 输入为(batch_size,seq_len+pred_len,d_model)-->输出为(batch_size,seq_len+pred_len,d_feature)
        x = self.out_dim(x)
        # 输入为(batch_size,seq_len+pred_len,d_feature)-->输出为(batch_size,pred_len,d_feature)
        y_hat=(self.out_time(x.permute(0,2,1))).permute(0,2,1)
        loss=self.loss_fn(y_hat,label) # 计算损失loss
        return y_hat,loss

embedding层代码

class TokenEmbedding_Aliformer(nn.Module):
    def __init__(self, d_feature, d_model):
        super(TokenEmbedding_Aliformer, self).__init__()
        self.embed = nn.Linear(d_feature, d_model, bias=False)

    def forward(self, x):
        return self.embed(x)


class DataEmbedding_time_token(nn.Module):
    def __init__(self, d_feature, d_mark, d_model):
        super(DataEmbedding_time_token, self).__init__()

        self.value_embedding = TokenEmbedding_Aliformer(d_feature=d_feature, d_model=d_model)
        self.time_embedding = TimeEmbedding(d_mark=d_mark, d_model=d_model)

    def forward(self, x, x_mark):

        x = self.value_embedding(x) + self.time_embedding(x_mark)
        return x
    

class TimeEmbedding(nn.Module):
    def __init__(self, d_mark, d_model):
        super(TimeEmbedding, self).__init__()
        self.embed = nn.Linear(d_mark, d_model, bias=False)

    def forward(self, x):
        return self.embed(x)

你可能感兴趣的:(人工智能,深度学习)

Orange3实战教程：图像分析---图像嵌入 err2008 Orange3 实战教程数据挖掘神经网络自然语言处理机器学习计算机视觉深度学习 orange3中文版
图像嵌入通过深度神经网络实现图像嵌入。输入图像：图像列表。输出嵌入向量：用数字向量表示的图像。跳过的图像：未计算嵌入向量的图像列表。图像嵌入功能读取图像并将其上传至远程服务器或本地计算。深度学习模型用于为每张图像计算特征向量。该功能返回一个增强的数据表，包含额外的列（图像描述符）。图像可以通过导入图像小部件导入，也可以通过电子表格中的图像路径导入。在这种情况下，包含图像路径的列需要一个三行表头，第
宗毅说 | 乌卡瑟时代的生存思考裂变学院
今天，互联网经济、人工智能、全球化发展对我们的影响，要比我们想象得大得多。在多股合力的相互作用下，这个时代的社会特征、商业特征与之前相比显著不同，我称之为乌卡瑟“VUCASE”。备注：乌卡瑟（VUCASE）这个术语是我自创的，来自于乌卡(VUKA）。VUCA是Volatility(易变性)，Uncertainty(不确定性)，Complexity(复杂性)、Ambiguity（模糊性）这四个英文单
[论文阅读] 人工智能 + 软件工程 | 单会话方法论：一种以人类为中心的人工智能辅助软件开发协议张较瘦_ 前沿技术论文阅读人工智能软件工程
单一对话法（SCM）：AI辅助软件开发的“全局对话”新思路SingleConversationMethodology:AHuman-CenteredProtocolforAI-AssistedSoftwareDevelopmentarXiv:2507.12665SingleConversationMethodology:AHuman-CenteredProtocolforAI-AssistedSo
如何安全使用人工智能大模型
人工智能大模型的安全漏洞在推送，你只要有不一样的解决方案他就会通过学习学会，在别人讨论相同问题时，就会作为解决问题的推荐方案。这种机制是没办法防的。鉴于此我们只能采取如下措施:1.绝对本地部署，就是部署好以后断网，因为你使用时他还是会手机数据往后台传送，我本地部署的大模型在推理时看性能，网络也是有数据流的。也不知道在交换什么。2.既然搞不清楚那就彻底不相信，断网。那么我们要加快进度，快速完成任务，
PyTorch生成式人工智能（18）——循环神经网络详解与实现盼小辉丶 pytorch rnn 自然语言处理
PyTorch生成式人工智能（18）——循环神经网络详解与实现0.前言1.文本生成的挑战2.循环神经网络2.1文本数据2.2循环神经网络原理3.长短期记忆网络3.自然语言处理基础3.1分词3.2词嵌入3.3词嵌入在自然语言处理中的应用小结系列链接0.前言我们已经学习了如何生成数字和图像等内容。从本节开始，我们将主要聚焦于文本生成。人类语言极其复杂且充满细微差别，不仅仅涉及语法和词汇的理解，还包括上
【人工智能99问】卷积神经网络（CNN）的结构和原理是什么？(10/99)
文章目录卷积神经网络（CNN）的结构及原理一、CNN的核心结构1.输入层（InputLayer）2.卷积层（ConvolutionalLayer）2.卷积层的核心机制：局部感受野与权值共享3.池化层（PoolingLayer）4.全连接层（FullyConnectedLayer）5.输出层（OutputLayer）6.辅助层二、CNN的工作原理三、CNN的使用场景1.计算机视觉（最核心场景）2.其
基于Paillier同态加密算法的金融数据安全共享机制研究【附数据】
金融数据分析与建模专家金融科研助手|论文指导|模型构建✨专业领域：金融数据处理与分析量化交易策略研究金融风险建模投资组合优化金融预测模型开发深度学习在金融中的应用擅长工具：Python/R/MATLAB量化分析机器学习模型构建金融时间序列分析蒙特卡洛模拟风险度量模型金融论文指导内容：金融数据挖掘与处理量化策略开发与回测投资组合构建与优化金融风险评估模型期刊论文✅具体问题可以私信或查看文章底部二维码
YOLOv8实现手写数字识别系统：从MNIST到实时摄像头检测
在深度学习领域，手写数字识别是一个经典问题，也是入门计算机视觉的重要案例。本文将介绍一个基于YOLOv8和MNIST数据集的手写数字识别系统，该系统不仅能识别静态图像中的数字，还能通过摄像头实时检测手写数字。个人博客：YOLOv8实现手写数字识别系统：从MNIST到实时摄像头检测-iDing's博客项目概述这个项目结合了传统的MNIST数据集和现代的目标检测算法YOLOv8，实现了以下功能：将MN
基于深度学习的手写数字和符号识别系统：YOLOv5/v6/v7/v8/v10模型实现与UI界面集成 YOLO实战营深度学习 YOLO ui 人工智能目标检测计算机视觉
1.引言随着人工智能和深度学习技术的发展，手写数字和符号识别已经成为计算机视觉领域的重要研究方向。手写识别在很多实际应用中扮演着关键角色，例如邮政编码识别、表单自动处理和智能教育系统等。传统的手写识别方法通常依赖于复杂的特征工程，而深度学习则能够自动从数据中学习到特征，极大地提高了识别精度和速度。本文将介绍如何构建一个基于YOLO系列模型（YOLOv5、YOLOv6、YOLOv7、YOLOv8、Y
【人工智能艺术革命：科技灵感与艺术创新的交融纪元】陈辰学长人工智能科技
【人工智能艺术革命：科技灵感与艺术创新的交融纪元】在21世纪的科技浪潮中，人工智能（AI）作为一股不可忽视的力量，正以前所未有的速度渗透并重塑着我们的生活、工作乃至艺术创作领域。其中，AI绘画作为科技与艺术深度融合的产物，不仅挑战了传统艺术的边界，更开启了一个充满无限想象与可能的新时代。本文将从AI绘画的定义与发展历程、技术原理、对艺术创作的影响、面临的挑战与机遇以及未来展望等多个维度，深入探讨这
从零开始：搭建你的人工智能开发环境人工智能教程人工智能 YOLO 机器学习 transformer 线性回归动态规划排序算法
前言在人工智能和机器学习的旅程中，一个稳定且高效的开发环境是成功的关键第一步。无论是初学者还是经验丰富的开发者，一个配置良好的开发环境都能大大提高工作效率，减少遇到的问题。本文将从零开始，逐步指导你如何搭建一个完整的人工智能开发环境，包括操作系统选择、Python安装、常用库的配置以及开发工具的选择。一、选择合适的操作系统（一）主流操作系统介绍在搭建人工智能开发环境时，首先需要选择一个合适的操作系
骗局揭露：光远投研会马光远，环境排放3.0被骗不靠谱！不可信！真相震惊！易星辰分享普法
关于曝光网上光远投研会马光远在炒股群推荐智慧农业中粮仓平台骗局的文章，其内容主要揭示了近期频发的一种投资诈骗手段。以下是该骗局的主要特点和步骤：为什么明明跟老师对过视频，确认是本人，怎么还会被骗了?你有没有想过一个名人大咖怎么会有时间给你们一对一视频，其次我来给大家揭露一下，这个套路AI换脸骗局是一种利用人工智能技术，通过替换视频中的人脸来伪造身份或进行诈骗的行为。你的账户“余额”是真的吗？为什么
【Grafana】Prometheus指标可视化Grafana，手把手教你如何自定义图形景天科技苑 grafana prometheus prometheus可视化 grafana自定义图形手撕grafana 自定义监控图形
✨✨欢迎大家来到景天科技苑✨✨养成好习惯，先赞后看哦~作者简介：景天科技苑《头衔》：大厂架构师，华为云开发者社区专家博主，阿里云开发者社区专家博主，CSDN全栈领域优质创作者，掘金优秀博主，51CTO博客专家等。《博客》：Python全栈，前后端开发，小程序开发，人工智能，js逆向，App逆向，网络系统安全，数据分析，Django，fastapi，flask等框架，云原生k8s，Prometheu
SpringBoot单元测试全攻略：MockMVC+Testcontainers+覆盖率分析 fanxbl957 Web spring boot 单元测试后端
博主介绍：Java、Python、js全栈开发“多面手”，精通多种编程语言和技术，痴迷于人工智能领域。秉持着对技术的热爱与执着，持续探索创新，愿在此分享交流和学习，与大家共进步。DeepSeek-行业融合之万象视界(附实战案例详解100+)全栈开发环境搭建运行攻略：多语言一站式指南(环境搭建+运行+调试+发布+保姆级详解)感兴趣的可以先收藏起来，希望帮助更多的人SpringBoot单元测试全攻略：
AI作画：AI人工智能激发艺术创作灵感 AGI大模型与大数据研究院 AI作画人工智能 ai
AI作画：AI人工智能激发艺术创作灵感关键词：AI作画、生成艺术、深度学习、神经网络、艺术创作、人工智能、创意工具摘要：本文深入探讨AI作画技术如何激发艺术创作灵感。我们将从基础概念出发，解释AI如何"学习"艺术风格并生成新作品，分析核心技术原理，提供实际应用案例，并展望这一领域的未来发展趋势。通过通俗易懂的讲解和实际代码示例，帮助读者理解这项融合科技与艺术的创新技术。背景介绍目的和范围本文旨在向
从文本到语音：使用 ElevenLabs 和 FFmpeg 实现语音合成与播放曦紫沐语音模型 ffmpeg ElevenLabs 语音合成
摘要在当今的人工智能时代，语音合成技术正变得越来越普及。ElevenLabs是一个强大的语音合成平台，能够生成高质量的语音音频。本文将详细介绍如何结合Python、ElevenLabsAPI和FFmpeg工具集，实现从文本到语音的转换，并通过ffplay播放生成的音频文件。同时，我们将解决常见的问题，如ffplay未找到或音频无法播放等。1.引言随着人工智能技术的发展，语音合成（Text-to-S
DK遇见未来：机器人祖爸
人工智能、AI、机械设计、BigData……这些听起来就很高端的专业究竟是什么？这些前沿学科相遇又会碰撞出什么？机器人，将这些前沿领域结合在一起越来越多的融入到我们的工作与生活中可问题来了机器人究竟是什么呢？又该如何给孩子讲机器人呢？这本《DK遇见未来：机器人》完美解决您的烦恼最新数据、系统知识、精美插图可以说这是一本儿童机器人大百科让孩子在这里遇见未来在讲读版视频中与您共同思考未来社会中机器人与
ORACLE 11g 使用ROWNUM完美解决ORA-00600 内部错误代码有点智慧
分享一下我老师大神的人工智能教程！零基础，通俗易懂！http://blog.csdn.net/jiangjunshow也欢迎大家转载本篇文章。分享知识，造福人民，实现我们中华民族伟大复兴！1，ORA-00600：内部错误代码Oracle从11.2.0.1升级到11.2.0.4，开发人员报告说一个job运行失败，调试有报错信息，ORA-00600:内部错误代码，参数：[rwoirw:checkret
Kimi-Audio：最佳音LLM, 如何免费使用 Kimi-Audio AI 模型？知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 kimi
简介继DeepSeek之后，字节跳动（现名MoonShotAI，又名Kimi）也在生成式人工智能领域加速发展，并发布了自己的音频模型Kimi-Audio，据说是迄今为止最好的音频模型。推荐文章《NvidiaGPU入门教程之02ubuntu安装A100显卡驱动(含8步快速浓缩教程)》权重2，安装A100显卡驱动《本地大模型知识库OpenWebUI系列之如何解决知识库上传文件故障Extractedco
Python就业薪资好不好，学Python工作机会多吗？ Python小辰
Python就业薪资好不好？学Python工作机会多吗？人工智能时代的来临让Python崭露头角，各大企业纷纷加大对相关人才的招聘力度吸引了很多人入行学习Python。近年来Python开发发展迅猛，吸引了很多科技公司入驻，且看小编的分析。Python薪资好不好?数据是最有力的答案。职友集统计数据显示，全国Python工程师的平均月资达19160，其中20-30K的工程师数量超过了四成。来自智联招
Jetson平台编译Tengine space01 AIoT Jetson 人工智能深度学习计算机视觉
1.Tengine简介Tengine于2017年在GitHub（https://github.com/OAID/Tengine）开源，是OPENAILAB（开放智能）推出的自主知识产权的边缘AI计算框架，致力于解决AIoT产业链碎片化问题，加速AI产业化落地。Tengine兼容多种操作系统和深度学习算法框架，简化和加速面向场景的AI算法在嵌入式边缘设备上快速迁移，以及实际应用部署落地，可以十倍提升
机器人-组成结构-感知 - 决策 - 执行具身智能-查布嘎具身智能机器人人工智能
目录一、感知系统内部传感器：外部传感器：二、智能决策系统机器学习家族1.1机器学习2.1深度学习2.2深度学习模型(主要属于监督/强化学习范畴，但结构通用)：3.1监督学习3.2监督学习模型4.1半监督学习4.2无/半监督学习模型：5.1无监督学习5.2生成模型(可属于监督/无监督)：6.1强化学习7.1其他学习三、控制系统（运控）①对应小脑和脊柱一、感知系统①对应人体的五官。由具有不同功能的各种
深度学习篇---矩阵 Atticus-Orion 嵌入式知识篇上位机知识篇嵌入式硬件篇深度学习矩阵人工智能
在机械臂解算、深度学习网络等硬件和软件领域中，矩阵运算作为核心数学工具，承担着数据表示、变换、映射和优化的关键作用。以下从具体领域出发，详细总结涉及的矩阵运算及对应的核心知识：一、机械臂解算领域机械臂解算（运动学、动力学分析）的核心是描述“关节空间”与“操作空间”的映射关系，矩阵运算用于精准刻画坐标系转换、运动传递和力/力矩分析。1.运动学解算（正/逆运动学）核心目标：通过矩阵描述关节角度与末端执
AI驱动的电路仿真革命：从物理模型到智能学习的范式转移
AI驱动的电路仿真革命：从物理模型到智能学习的范式转移人工智能正颠覆传统电路仿真方法，本文将深入解析AI在电路建模、优化与故障诊断中的前沿应用，揭示智能仿真如何提升10倍效率并突破物理限制。一、AI电路仿真的数学基础1.1图神经网络建模电路拓扑电路可抽象为图结构G=(V,E)G=(V,E)G=(V,E)：VVV：节点（电子元件）EEE：边（连接关系）图卷积网络(GCN)更新公式：H(l+1)=σ(
MCP协议技术解析：AI时代的通信基础设施革命
MCP协议技术解析：AI时代的通信基础设施革命在AI从工具演变为协作伙伴的进程中，MCP协议正在成为连接智能体与现实世界的“数字神经系统”。当前人工智能技术正经历从孤立模型向生态系统协作的关键转型，而通信协议作为AI能力的“连接器”，其设计直接决定了智能系统的边界与效率。MCP协议（ModelContextProtocol）作为新一代AI通信基础设施，正在开发者社区引发一场静默革命。本文将从技术原
GENERALIST REWARD MODELS: FOUND INSIDE LARGELANGUAGE MODELS 樱花的浪漫大模型与智能体对抗生成网络与动作识别强化学习语言模型人工智能自然语言处理深度学习机器学习计算机视觉
GeneralistRewardModels:FoundInsideLargeLanguageModelshttps://arxiv.org/pdf/2506.232351.概述将大型语言模型（LLMs）与复杂的人类价值观（如乐于助人和诚实）对齐，仍然是人工智能发展中的一个核心挑战。这项任务的主要范式是来自人类反馈的强化学习（RLHF）[Christianoetal.,2017;Baietal.,
Python深度学习实践：LSTM与GRU在序列数据预测中的应用 AI智能应用 Python入门实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
Python深度学习实践：LSTM与GRU在序列数据预测中的应用作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来序列数据预测是机器学习领域的一个重要研究方向，涉及时间序列分析、自然语言处理、语音识别等多个领域。序列数据具有时间依赖性，即序列中每个元素都受到前面元素的影响。传统的机器学习算法难以捕捉这种时间依赖性，而深度学习
初探机器学习与力学研究的交叉领域 faderbic 机器学习人工智能深度学习
目录关于如何踏入机器学习领域机器学习与力学研究的交叉方向1.使用机器学习加速有限元求解2.结合有限元计算和机器学习预测复杂材料结构与力学性能的关系3.结构健康检测4.疲劳寿命预测总结关于如何踏入机器学习领域因为我本科的专业是力学，所以当我开始关注机器学习领域时，首先考虑的是机器学习和力学的交叉领域。对于很多对人工智能感兴趣的朋友，想加入人工智能的潮流却不知道从何学起，我提供一个思路，我认为将自己学
[NIPST AI]对抗性机器学习攻击和缓解的分类和术语 Anooyman 人工智能网络安全人工智能大语言模型网络安全安全
原文link：https://nvlpubs.nist.gov/nistpubs/ai/NIST.AI.100-2e2025.pdfIntroduction人工智能（AI）系统在过去几年中持续全球扩展。这些系统正在被众多国家开发并广泛部署于各自的经济体系中，人们在生活的许多领域都获得了更多使用AI系统的机会。本报告区分了两大类AI系统：预测型AI（PredictiveAI，PredAI）和生成型A
Baumer工业相机堡盟工业相机如何通过YoloV8深度学习模型实现打架检测（C#代码，UI界面版）格林威工业相机机器视觉数码相机 YOLO 深度学习计算机视觉人工智能
Baumer工业相机堡盟工业相机如何通过YoloV8深度学习模型实现打架检测（C#代码，UI界面版）工业相机使用YoloV8模型实现打架检测工业相机通过YoloV8模型实现打架检测的技术背景在相机SDK中获取图像转换图像的代码分析工业相机图像转换Bitmap图像格式和Mat图像重要核心代码本地文件图像转换Bitmap图像格式和Mat图像重要核心代码Mat图像导入YoloV8模型重要核心代码代码实现
java线程的无限循环和退出 3213213333332132 java
最近想写一个游戏，然后碰到有关线程的问题，网上查了好多资料都没满足。突然想起了前段时间看的有关线程的视频，于是信手拈来写了一个线程的代码片段。希望帮助刚学java线程的童鞋 package thread; import java.text.SimpleDateFormat; import java.util.Calendar; import java.util.Date
tomcat 容器 BlueSkator tomcat Web servlet
Tomcat的组成部分 1、server A Server element represents the entire Catalina servlet container. (Singleton) 2、service service包括多个connector以及一个engine，其职责为处理由connector获得的客户请求。 3、connector 一个connector
php递归,静态变量,匿名函数使用 dcj3sjt126com PHP 递归函数匿名函数静态变量引用传参
<!doctype html> <html lang="en"> <head> <meta charset="utf-8"> <title>Current To-Do List</title> </head> <body>
属性颜色字体变化周华华 JavaScript
function changSize(className){ var diva=byId("fot") diva.className=className; } </script> <style type="text/css"> .max{ background: #900; color:#039;
将properties内容放置到map中 g21121 properties
代码比较简单： private static Map<Object, Object> map; private static Properties p; static { //读取properties文件 InputStream is = XXX.class.getClassLoader().getResourceAsStream("xxx.properti
[简单]拼接字符串 53873039oycg 字符串
工作中遇到需要从Map里面取值拼接字符串的情况，自己写了个，不是很好，欢迎提出更优雅的写法，代码如下： import java.util.HashMap; import java.uti
Struts2学习云端月影
最近开始关注struts2的新特性，从这个版本开始，Struts开始使用convention-plugin代替codebehind-plugin来实现struts的零配置。配置文件精简了，的确是简便了开发过程，但是，我们熟悉的配置突然disappear了，真是一下很不适应。跟着潮流走吧，看看该怎样来搞定convention-plugin。使用Convention插件，你需要将其JAR文件放
Java新手入门的30个基本概念二 aijuans java 新手 java 入门
基本概念:　　1.OOP中唯一关系的是对象的接口是什么,就像计算机的销售商她不管电源内部结构是怎样的,他只关系能否给你提供电就行了,也就是只要知道can or not而不是how and why.所有的程序是由一定的属性和行为对象组成的,不同的对象的访问通过函数调用来完成,对象间所有的交流都是通过方法调用,通过对封装对象数据,很大限度上提高复用率。　　2.OOP中最重要的思想是类,类是模板是蓝图,
jedis 简单使用 antlove java redis cache command jedis
jedis.RedisOperationCollection.java package jedis; import org.apache.log4j.Logger; import redis.clients.jedis.Jedis; import java.util.List; import java.util.Map; import java.util.Set; pub
PL/SQL的函数和包体的基础百合不是茶 PL/SQL编程函数包体显示包的具体数据包
由于明天举要上课,所以刚刚将代码敲了一遍PL/SQL的函数和包体的实现(单例模式过几天好好的总结下再发出来);以便明天能更好的学习PL/SQL的循环,今天太累了,所以早点睡觉,明天继续PL/SQL总有一天我会将你永远的记载在心里,,, 函数; 函数:PL/SQL中的函数相当于java中的方法;函数有返回值定义函数的 --输入姓名找到该姓名的年薪 create or re
Mockito(二)--实例篇 bijian1013 持续集成 mockito 单元测试
学习了基本知识后，就可以实战了，Mockito的实际使用还是比较麻烦的。因为在实际使用中，最常遇到的就是需要模拟第三方类库的行为。比如现在有一个类FTPFileTransfer，实现了向FTP传输文件的功能。这个类中使用了a
精通Oracle10编程SQL(7)编写控制结构 bijian1013 oracle 数据库 plsql
/* *编写控制结构 */ --条件分支语句 --简单条件判断 DECLARE v_sal NUMBER(6,2); BEGIN select sal into v_sal from emp where lower(ename)=lower('&name'); if v_sal<2000 then update emp set
【Log4j二】Log4j属性文件配置详解 bit1129 log4j
如下是一个log4j.properties的配置 log4j.rootCategory=INFO, stdout , R log4j.appender.stdout=org.apache.log4j.ConsoleAppender log4j.appender.stdout.layout=org.apache.log4j.PatternLayout log4j.appe
java集合排序笔记白糖_ java
public class CollectionDemo implements Serializable,Comparable<CollectionDemo>{ private static final long serialVersionUID = -2958090810811192128L; private int id; private String nam
java导致linux负载过高的定位方法 ronin47
定位java进程ID 可以使用top或ps -ef |grep java ![图片描述][1] 根据进程ID找到最消耗资源的java pid 比如第一步找到的进程ID为5431 执行 top -p 5431 -H ![图片描述][2] 打印java栈信息 $ jstack -l 5431 > 5431.log 在栈信息中定位具体问题将消耗资源的Java PID转
给定能随机生成整数1到5的函数，写出能随机生成整数1到7的函数 bylijinnan 函数
import java.util.ArrayList; import java.util.List; import java.util.Random; public class RandNFromRand5 { /** 题目：给定能随机生成整数1到5的函数，写出能随机生成整数1到7的函数。解法1： f(k) = (x0-1)*5^0+(x1-
PL/SQL Developer保存布局 Kai_Ge
近日由于项目需要，数据库从DB2迁移到ORCAL，因此数据库连接客户端选择了PL/SQL Developer。由于软件运用不熟悉，造成了很多麻烦，最主要的就是进入后，左边列表有很多选项，自己删除了一些选项卡，布局很满意了，下次进入后又恢复了以前的布局，很是苦恼。在众多PL/SQL Developer使用技巧中找到如下这段： &n
[未来战士计划]超能查派[剧透,慎入] comsci 计划
非常好看,超能查派,这部电影......为我们这些热爱人工智能的工程技术人员提供一些参考意见和思想........ 虽然电影里面的人物形象不是非常的可爱....但是非常的贴近现实生活.... &nbs
Google Map API V2 dai_lm google map
以后如果要开发包含google map的程序就更麻烦咯 http://www.cnblogs.com/mengdd/archive/2013/01/01/2841390.html 找到篇不错的文章，大家可以参考一下 http://blog.sina.com.cn/s/blog_c2839d410101jahv.html 1. 创建Android工程由于v2的key需要G
java数据计算层的几种解决方法2 datamachine java sql 集算器
2、SQL SQL/SP/JDBC在这里属于一类，这是老牌的数据计算层，性能和灵活性是它的优势。但随着新情况的不断出现，单纯用SQL已经难以满足需求，比如： JAVA开发规模的扩大，数据量的剧增，复杂计算问题的涌现。虽然SQL得高分的指标不多，但都是权重最高的。成熟度：5星。最成熟的。
Linux下Telnet的安装与运行 dcj3sjt126com linux telnet
Linux下Telnet的安装与运行 linux默认是使用SSH服务的而不安装telnet服务如果要使用telnet 就必须先安装相应的软件包即使安装了软件包默认的设置telnet 服务也是不运行的需要手工进行设置如果是redhat9，则在第三张光盘中找到 telnet-server-0.17-25.i386.rpm
PHP中钩子函数的实现与认识 dcj3sjt126com PHP
假如有这么一段程序： function fun(){ fun1(); fun2(); } 首先程序执行完fun1()之后执行fun2()然后fun()结束。但是，假如我们想对函数做一些变化。比如说，fun是一个解析函数，我们希望后期可以提供丰富的解析函数，而究竟用哪个函数解析，我们希望在配置文件中配置。这个时候就可以发挥钩子的力量了。我们可以在fu
EOS中的WorkSpace密码修改蕃薯耀修改WorkSpace密码
EOS中BPS的WorkSpace密码修改 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 201
SpringMVC4零配置--SpringSecurity相关配置【SpringSecurityConfig】 hanqunfeng SpringSecurity
SpringSecurity的配置相对来说有些复杂，如果是完整的bean配置，则需要配置大量的bean，所以xml配置时使用了命名空间来简化配置，同样，spring为我们提供了一个抽象类WebSecurityConfigurerAdapter和一个注解@EnableWebMvcSecurity，达到同样减少bean配置的目的，如下： applicationContex
ie 9 kendo ui中ajax跨域的问题 jackyrong AJAX跨域
这两天遇到个问题，kendo ui的datagrid，根据json去读取数据，然后前端通过kendo ui的datagrid去渲染，但很奇怪的是，在ie 10,ie 11,chrome,firefox等浏览器中，同样的程序，浏览起来是没问题的，但把应用放到公网上的一台服务器，却发现如下情况： 1） ie 9下，不能出现任何数据，但用IE 9浏览器浏览本机的应用，却没任何问题
不要让别人笑你不能成为程序员 lampcy 编程程序员
在经历六个月的编程集训之后，我刚刚完成了我的第一次一对一的编码评估。但是事情并没有如我所想的那般顺利。说实话，我感觉我的脑细胞像被轰炸过一样。手慢慢地离开键盘，心里很压抑。不禁默默祈祷：一切都会进展顺利的，对吧？至少有些地方我的回答应该是没有遗漏的，是不是？难道我选择编程真的是一个巨大的错误吗——我真的永远也成不了程序员吗？我需要一点点安慰。在自我怀疑，不安全感和脆弱等等像龙卷风一
马皇后的贤德 nannan408
马皇后不怕朱元璋的坏脾气，并敢理直气壮地吹耳边风。众所周知，朱元璋不喜欢女人干政，他认为“后妃虽母仪天下，然不可使干政事”，因为“宠之太过，则骄恣犯分，上下失序”，因此还特地命人纂述《女诫》，以示警诫。但马皇后是个例外。　　有一次，马皇后问朱元璋道：“如今天下老百姓安居乐业了吗？”朱元璋不高兴地回答：“这不是你应该问的。”马皇后振振有词地回敬道：“陛下是天下之父，
选择某个属性值最大的那条记录（不仅仅包含指定属性，而是想要什么属性都可以） Rainbow702 sql group by 最大值 max 最大的那条记录
好久好久不写SQL了，技能退化严重啊！！！直入主题：比如我有一张表，file_info，它有两个属性（但实际不只，我这里只是作说明用）： file_code, file_version 同一个code可能对应多个version 现在，我想针对每一个code，取得它相关的记录中，version 值最大的那条记录， SQL如下： select *
VBScript脚本语言 tntxia VBScript
VBScript 是基于VB的脚本语言。主要用于Asp和Excel的编程。 VB家族语言简介 Visual Basic 6.0 源于BASIC语言。由微软公司开发的包含协助开发环境的事
java中枚举类型的使用 xiao1zhao2 java enum 枚举 1.5新特性
枚举类型是j2se在1.5引入的新的类型,通过关键字enum来定义,常用来存储一些常量. 1.定义一个简单的枚举类型 public enum Sex { MAN, WOMAN } 枚举类型本质是类,编译此段代码会生成.class文件.通过Sex.MAN来访问Sex中的成员,其返回值是Sex类型. 2.常用方法静态的values()方