散人stu174

机器翻译模型五CNN+seq2seq__Pytorch实现

1.CNN应用于机器翻译

1.1Encoder模块

1.2Decoder模块

2.代码实现

2.1数据准备

2.2模型构建

2.3训练

1.CNN应用于机器翻译

在深度学习中，RNN擅长处理序列数据，而CNN擅长做特征提取。我们之前的机器翻译都是采用RNN结构来翻译句子，但《Convolutional Sequence to Sequence Learning》这篇文章将CNN应用Seq2Seq模型中，并不在使用传统的串行RNN模型来预测模型，而是构造CNN卷积网络并行计算并预测结构。其论文模型如下：

直观的看，模型十分复杂，其较之前的模型理解难度直接上升一个级别（后面难度一个比一个更难），不过其本质思想与之前的Attention+Seq2Seq是一样的，也是encoder，decoder模块以及attention模型。（上述模型是英翻得），以下我们将详细介绍各个模块。

1.1Encoder模块

Encoder模块主要对源句进行编码，使得不定⻓的输⼊序列变换成⼀个定⻓的上下文变量context，使得编码以后的源句（context向量）在特征上的表现更明显（语义，上下文），首先给出Encoder模型的模型：

以下逐层介绍：

嵌入层：在之前的RNN模型中，我们的可以直接输入一句话带入RNN模型中，不用担心其词序问题，这是因为RNN模型串行处理，其记忆单元天然具有时间序列信息。但是，在CNN卷积网络并行处理中，这种RNN具有的天然时序信息其并不具备。我们需要给每个词添加位置信息，引入我们的嵌入层包含两个，一个是词嵌入（token_embed），另外一个则是位置嵌入（pos_embed）。最后将两者求和得到带有位置编码的词嵌入（elementwis sum）。我们假设输入的src=[batch src_len emb_size]

线性层（emb_size->hid_size）：在此模型中，所有线性层的功能都做维度转换的功能，在此处主要将词嵌入的维度转变为卷积层的输入维度，也可以说是隐藏层维度。即src=[batch src_len hid_size]

卷积层：卷积层是此模型的精髓，其主要承担着特征提取的功能，即提取词之间的语义，句法信息等。其一共有10层卷积块，其大致模型如下（前两层，后面类推）：

（1）block块输入（输出）层：block模块的输入层为为上一层的输出，第一层则是线性层（emb_size->hid_size）的输出。即src=[batch src_len hid_size]

（2）block块padding层：在编码器中，paddding层主要是用来使得卷积以后输入输出大小相同，我们知道单纯的卷积操作会使得序列长度变小，因此在卷积操作前需要进行padding操作。如，在我们机器翻译中，总不能输入句长为4，编码以后句长为3这种情况发现。padding的大小为：(kernel_size-1)//2(在两端padding添加，所以整除2，表示每端添加的数量，进行NLP一般将kernel_size设为奇数）。此时src=[batch src_len+kernel_size-1 hid_size]

切记：在编码器中，padding层的作用主要为控制输入输出的序列长度相同，而在解码器中，除此以外还另有他用！

（3）block块卷积：这一层的即为一维卷积操作，用于进行特征提取，提取源句中的语义信息，句法信息等。其输出的维度设置为输入的两倍（这是因为后面的激活函数为GLU），此时经过卷积以后的src=[batch src_len hid_size*2]

（4）block块GLU层：glu层是一个激活函数，其计算公式为: $GLU(a,b)=a\otimes\sigma(b)$ 。此时：src=[batch src_len hid_size]

（5）block块残差连接层：残差连接主要用于防止网络退化，即卷积层我们设置层10层，但是可能在4层网络就已经达到最优，即提取最佳的特征（后面继续做特征提取，粒度就过于粗糙了）。后面的6层只需要进行一个等值传递的功能即可，因此在此添加残差连接。即将GLU层的输出与输入层求和。此时得到的结果src=[batch src_len hid_size]。其为该层的输出或下一层的输出。

线性层（hid_size->emb_size）:这一层的线程层主要将10层卷积块的输出进行维度转换，此时：conved=src=[batch src_len emb_size]，其得到了我们的卷积向量（K）。

组合层（残差连接层）：这一层的残差主要功能并非为了防止网络退化，按理说上一层的线性层（hid_size->emb_size）其已经得到了编码向量，其包含了重要的上下文信息（卷积），但是卷积以后其的原始特征就比较稀薄了，原始特征里面除了原始的词嵌入以外，还有一个特征重要的位置特征，因此将编码向量与带有位置编码的词嵌入组合（求和操作），得到组合向量（Q）。

编码器最终返回卷积向量（K）与组合向量(Q)，其中卷积向量包含丰富的上下文信息，而组合向量具有更多关于特定标记的信息。若现在不理解其妙用，可继续看注意力机制层，加深对其理解。

1.2Decoder模块

Decoder模块主要对编码器输出的上下文向量进行解码，解码将其映射到新的样本空间中去，解码的长度不固定。解码的时候当然也可以有各种参考，以下给出解码器模型：

以下与编码器一样逐层介绍：

嵌入层：此层输入目标端的需要被翻译的句子，同编码中一样，也需要嵌入位置信息，最后将二者嵌入向量求和。得到trg=[batch trg_len emb_size]

线性层（emb_size->hid_size）：此线性层作维度变化的功能，将嵌入维度转变为隐层维度。trg=[batch trg_len hid_size]

卷积层：此卷积层也是解码器的精髓支出所在，作用依然是特征提取，提取目标词之间语义，句法特征。其一共有10层卷积块，其大致模型如下（一层，后面类推）：

（1）block块的输入层：block模块的输入层为为上一层的输出，第一层则是线性层（emb_size->hid_size）的输出，即trg=[batch trg_len hid_size]。后面则是dev_conved，维度同。

（2）block块的paddding层：在编码器中padding层的作用主要是维持输入输出的序列长度畅通，解码器中依旧有这样的功能，因此其padding的大小为（kernel_size-1）。但是不同于编码器的padding在两段操作，解码器的padding添加在句子前面，为什么需要这样呢？答案：错开正确答案，防止模型作弊。

假设我们和encoder层一样padding，如下：

我们发现，在一个卷积视野中（假设kernel_size=3），当前词预测词的答案竟然也出现在卷积视野中，比如我希望预测two，而卷积视野中也包含了，那么这样训练的时候，模型只需要将同一视野中的的输入作为上一视野的答案就可以实现完美翻译。这样显然是不行的，因此在前面添加kernel-1的padding，其目的也就是让视野看不到答案，防止模型作弊。如下：

经过padding以后，其trg=[batch trg_len+kernel_size-1 hid_size]。

（3）block块的卷积操作：同编码器，经过卷积操作以后使其输出维度是输入维度的两倍，此时trg=[batch trg_len 2*hid_size]

（4）block块的GLU层：同编码器，经过该激活函数以后，维度降低一半，此时trg=[batch trg_len hid_size]

（5）attention层：attention层的存在，使得卷积块不仅仅接收卷积操作经过激活函数的输出（dec_conved），还多3个变量。分别是en_conved（编码器的卷积向量），en_combined(编码器的组合向量)还有目标端带有位置信息的词嵌入信息（tokenPos_embed）。所以attention层一共接收4个变量。

我们知道attention机制的主要目的在于：够帮助decoder在生成词语时，有一个编码器上不同词语的权重参考。这其中涉及三个变量，分别是学习目标Query（查询向量），编码器中每个词经过特殊编码形成的value（值向量）以及查找每个此的key（键向量）。其计算过程如下：（其实也可以画一个类似block的图，github没找到图，自己随手画一个，很糙勿喷）：

step1（Linear）：接收GLU层的输出（batch trg_len hid_size）,将其维度转变为嵌入维度，此时dev_conved=[batch trg_len embed_size]

step2(elementwise sum)：卷积以后，其原始信息特征不在明显，将目标端原始的带位置编码的词嵌入（embedd=[batch trg_len emb_size]）与dev_conved求和，强化此类特征在卷积上（我认为这样的操作使得解码器的卷积具有更多关于源端特定标记的信息，这些标记信息将更有助于与编码器的卷积向量进行匹配）。这也得到了我们的学习目标Q=[batch trg_len emb_size。

step3(elementwise dot)：我们得到了学习目标以后Q，将与编码器的卷积向量enc_conved=[batch src_len emb_size]（K）对应元素进行相乘（匹配），我们知道编码器的卷积向量包含许多编码器的上下文信息，这更有助于进行匹配，得到匹配能量：energy=[batch trg_len src_len]

step4（softmax）：对匹配能量进行softamx，得到其编码器各个词的注意力权重a=[batch trg_len src_len]

step5（attention）：有了各个词的注意力权重以后，我们通过编码器的组合向量enc_combined[batch src_len emb_size]（V）进行加权求和得到最终的上下文向量context=[batch trg_len emb_size]。仔细想一个，我们在翻译的时候，是翻译词，更希望值向量包含多一点特定表征信息，因此这也是值向量选择组合向量而非卷积向量的原因，这也是组合词向量就是在原本卷积词向量基础上添加位置编码的词嵌入的原因。

step6(Liner)：将其维度变为hid_size。context=[batch trg_len hid_size]

step7(输出层)：与输入层初始的dev_conved=[batch trg_len hid_size]进行求和，使得context向量不仅包含解码器信息，也包含目标端翻译的前文信息。context=[batch trg_len hid_size]

所以经过attention层以后，有源端卷积激活得到的dev_conved变为context（包含源端和目标端翻译前文的信息）

（6）block块的残差连接：这一步作用其实和编码器的残差连接作用一样，防止网络退化。因此context加上block开始的输入，我们姑且称其为dev_conved,因为其也是下一层的输入。

以上block搭建10层，最后一层输出的dev_conved=[batch trg_len hid_size]

线性层（hid_size->emb_size）：维度变化，将其转变为为emb_size维度，dev_conved_emb=[batch trg_len emb_size]

输出层（映射到目标端样本空间）：即输出结果ouput=[batch trg_len trg_vocab_size]

至此，模型介绍完毕。其创新之处在于将CNN网络应用于Seq2Seq中，并取得的非常好的效果，下面我们将实现代码。

2.代码实现

工具：Jupyter

2.1数据准备

import torch
import spacy

from torchtext.data import Field,BucketIterator
from torchtext.datasets import Multi30k

de_seq=spacy.load("de_core_news_sm")
en_seq=spacy.load("en_core_web_sm")

def de_tokenizer(text):
    return [word.text for word in de_seq.tokenizer(text)]

def en_tokenizer(text):
    return [word.text for word in en_seq.tokenizer(text)]

SRC=Field(tokenize=de_tokenizer,
         init_token="",
         eos_token="",
         lower=True,
         batch_first=True)

TRG=Field(tokenize=en_tokenizer,
         init_token="",
         eos_token="",
         lower=True,
         batch_first=True)

train_data,val_data,test_data=Multi30k.splits(exts=(".de",".en"),
                                             fields=(SRC,TRG))
SRC.build_vocab(train_data,min_freq=2)
TRG.build_vocab(train_data,min_freq=2)

batch=128
device=torch.device("cuda" if torch.cuda.is_available() else "cpu")

train_iter,val_iter,test_iter=BucketIterator.splits(
    (train_data,val_data,test_data),
    device=device,
    batch_size=batch
)

测试：

for example in train_iter:
    src=example.src
    trg=example.trg
    break

print(src.shape)

结果：

torch.Size([128, 26])

2.2模型构建

import torch.nn as nn
import torch.nn.functional as F

class Encoder(nn.Module):
    def __init__(self,src_vocab_size,emb_size,hid_size,kernel_size,n_layers,dropout=0.25,max_len=100):
        #src_vocab_size 德语词库大小
        #embe_size 嵌入维度
        #hidden_size 卷积层的隐藏维度
        #kernel_size 卷积核大小
        #n_layers 卷积的block层数
        super(Encoder,self).__init__()
        self.token_emb=nn.Embedding(src_vocab_size,emb_size)
        self.pos_emb=nn.Embedding(max_len,emb_size)
        
        self.emb2hid=nn.Linear(emb_size,hid_size)
        self.hid2emb=nn.Linear(hid_size,emb_size)
        
        self.convs=nn.ModuleList([
            nn.Conv1d(in_channels=hid_size,
                     out_channels=hid_size*2,
                     kernel_size=kernel_size,
                     padding=(kernel_size-1)//2)
            for _  in range(n_layers)
        ])
        self.dropout=nn.Dropout(dropout)
        self.scale=torch.sqrt(torch.FloatTensor([0.5])).to(device)#其实是一个平均的过程
        
    def forward(self, src):
        #src[batch src_len]
        
        #产生位置序列
        batch_size=src.shape[0]
        src_len=src.shape[1]
        
        pos=torch.arange(0,src_len).to(device)
        #pos[src_len]
        pos=pos.unsqueeze(0).repeat(batch_size,1)
        #pos[batch src_len]
        #src[batch src_len]
        src_embed=self.token_emb(src)
        pos_embed=self.pos_emb(pos)
        #src[batch src_len emb_size]
        #pos[batch src_len emb_size]
        #词嵌入添加位置编码
        src_pos_embed=self.dropout(src_embed+pos_embed)
        
        #src_pos_embed[batch src_len emb_size]
        #转变维度使其进入卷积层
        conv_input=self.emb2hid(src_pos_embed)
        #conv_input[batch src_len hid_size]
        
        #注：1D卷积的输入shape为:[batch input_channel seq_len],input_channel为输入维度，
        #           输出shape为:[batch output_channel  (seq_len+2*padding-kernel_size)/stride+1]
        # 我们的padding=kernel_size-1//2(这样设计就是保住输入输出长度相同),stride=1，output_channel=2input_channel
        # 因此输出:[batch 2*input_channel seq_len]
        #所以首先先转变conv_input的shape
        
        conv_input=conv_input.permute(0,2,1)
        #conv_input[batch hid_size src_len]
        #进入卷积层
        for conv in self.convs:
            conved=conv(self.dropout(conv_input))
            #conved[batch hid_size*2 src_len]
            #输出为2*hid_size 是为了glu激活函数，其输出的维度是输入的一半
            conved=F.glu(conved,dim=1)
            #conved[batch hid_size src_len]
            
            #残差连接,防止网络退化 
            conved=(conved+conv_input)*self.scale
            #conved[batch hid_size src_len]
            #循环遍历，此卷积输出是下一次卷积的输入
            conv_input=conved
            #conv_input[batch hid_size src_len]
        
        #卷积结束：
        #conved[batch hid_size src_len]
        
        #转变shape
        conved=conved.permute(0,2,1)
        #conved[batch src_len hid_size]
        
        #转变维度，得到卷积向量,也是注意力机制的里面的k
        conved=self.hid2emb(conved)
        #conved[batch src_len emb_size]
        
        #残差连接，得到联合向量，也是注意力机制里面的v
        combined=(conved+src_pos_embed)*self.scale
        
        #返回卷积向量和联合向量
        return conved,combined

测试：

src_vocab_size=len(SRC.vocab)
trg_vocab_size=len(TRG.vocab)

emb_size=256
hid_size=512
kernel_size=3
n_layers=10

enModel=Encoder(src_vocab_size,emb_size,hid_size,kernel_size,n_layers).to(device)
conved,combined=enModel(src)
print(conved.shape,combined.shape)

结果：

torch.Size([128, 26, 256]) torch.Size([128, 26, 256])

class Attention(nn.Module):
    def __init__(self,emb_size,hid_size):
        #这里我默认了encoder与decoder的嵌入维度和隐层维度相同
        super(Attention,self).__init__()
        self.emb2hid=nn.Linear(emb_size,hid_size)
        self.hid2emb=nn.Linear(hid_size,emb_size)
        self.scale=torch.sqrt(torch.FloatTensor([0.5])).to(device)
    
    def forward(self,dec_conved,embedd,en_conved,en_combined):
        """
        注意力计算首先使用一个线性层改变Decoder传入的conved的隐藏维数为相同的嵌入维数。
        然后，再与嵌入（embedded）通过一个残差连接求和。然后，通过发现它与编码的卷积（conved）有多少“匹配”，然后再通过对编码的组合（combined）进行加权和，
        这样应用标准注意力计算。然后将其投影回隐藏的维度大小，并应用与注意力层初始输入（conved）的残差连接。
        """
        #embedd[batch trg_len emb_size]
        #dec_conved[batch hid_size trg_len]    Q（要加上词嵌入才算真正的Q）
        #en_conved[batch src_len emb_size]     K 
        #en_combined[batch src_len emb_size]   V
        
        #转变Q的shape，使其为[batch trg_len hid_size]
        dec_conved=dec_conved.permute(0,2,1)
        #dec_conved[batch trg_len hid_size]
        
        #改变其维度，使其与嵌入维度相同
        dec_conved_emb=self.hid2emb(dec_conved)
        #dec_conved_emb[batch trg_len emb_size]
        
        #与embedded嵌入求和
        Q=(dec_conved_emb+embedd)*self.scale
        #Q[batch trg_len emb_size]
        #en_conved[batch src_len emb_size]     K 
        
        #计算与每个k的匹配程度
        energy=torch.matmul(Q,en_conved.permute(0,2,1))
        #energy[batch trg_len src_len]
        a=F.softmax(energy,dim=2)
        #a[batch trg_len src_len]
        #en_combined[batch src_len emb_size]   V
        
        #得到权重以后计算其最终的向量
        context=torch.matmul(a,en_combined)
        #context[batch trg_len emb_size]
        
        #转变维度并加上卷积初始残差
        #context[batch trg_len emb_size]
        #dec_conved[batch trg_len hid_size]
        context=self.emb2hid(context)
        #context[batch trg_len hid_size]
        conved=(context+dec_conved)*self.scale
        #conved[batch trg_len hid_size]
        return conved.permute(0,2,1),a

测试：

attModel=Attention(emb_size,hid_size).to(device)
#自己造一个dec的卷积向量
dec_conved=torch.randn(128,hid_size,26).to(device)
#自己构造一个词嵌入（带有位置信息）--trg
embedded=torch.randn(128,26,emb_size).to(device)
dec_conved,a=attModel(dec_conved,embedded,conved,combined)
print(dec_conved.shape,a.shape)

结果：

torch.Size([128, 512, 26]) torch.Size([128, 26, 26])

class Decoder(nn.Module):
    def __init__(self,trg_vocab_size,emb_size,hid_size,kernel_size,n_layers,attnModel,dropout=0.25,max_len=50):
        #trg_vocab_size 英语的词库大小
        #emb_size 嵌入维度
        #hid_size 隐层维度
        #kernel_size 卷积核大小
        #n_layers 卷积网络的层数
        #attnModel 注意力机制层
        super(Decoder,self).__init__()
        self.attnModel=attnModel
        self.kernel_size=kernel_size#要根据其在前面创建kernel-1个pad
        
        self.token_embed=nn.Embedding(trg_vocab_size,emb_size)
        self.pos_embed=nn.Embedding(max_len,emb_size)
        
        self.emb2hid=nn.Linear(emb_size,hid_size)
        self.hid2emb=nn.Linear(hid_size,emb_size)
        
        self.fc=nn.Linear(emb_size,trg_vocab_size)
        
        self.scale=torch.sqrt(torch.FloatTensor([0.5])).to(device)
        
        self.convs=nn.ModuleList([
            nn.Conv1d(in_channels=hid_size,
                     out_channels=2*hid_size,
                     kernel_size=kernel_size)
            for _ in range(n_layers)])
        self.dropout=nn.Dropout(dropout)
    
    def forward(self,trg,en_conved,en_combined):
        #trg[batch trg_len]
        #en_conved[batch src_len emb_size]
        #en_combined[batch src_len emb_size]
        
        batch_size=trg.shape[0]
        trg_len=trg.shape[1]
        
        #位置编码
        pos=torch.arange(0,trg_len).to(device)
        #pos[trg_len]
        pos=pos.unsqueeze(0).repeat(batch_size,1)
        #pos[batch trg_len]
        
        #嵌入并求和
        token_embed=self.token_embed(trg)
        pos_embed=self.pos_embed(pos)
        #token_embed[batch trg_len emb_size]
        #pos_embed[batch trg_len emb_size]
        
        embedd=self.dropout(token_embed+pos_embed)
        #pos_embed[batch trg_len emb_size]
        
        #将embedd有emb_size维度转变为hid_size维度代入卷积层
        input_conv=self.emb2hid(embedd).permute(0,2,1)
        #input_conv[batch hid_size trg_len]
        hid_size=input_conv.shape[1]
        for _,conv in enumerate(self.convs):
            input_conv=self.dropout(input_conv)
            #对输入序列添加kernel_size的pad，防止翻译答案泄露
            padding=torch.ones(batch_size,hid_size,self.kernel_size-1).to(device)
            #padding[batch  hid_size kernel_size-1]
            #input_conv[batch  hid_size trg_len]
            pad_input_conv=torch.cat((padding,input_conv),dim=2)
            #pad_input_conv[batch hid_size trg_len+kernel_size-1]
            
            conved=conv(pad_input_conv)
            #conved[batch 2*hid_size trg_len]
            conved=F.glu(conved,dim=1)
            #conved[batch hid_size trg_len]
            conved,a=self.attnModel(conved,embedd,en_conved,en_combined)
            #conved[batch hid_size trg_len],a[batch trg_len src_len]
            
            #input_conv[batch hid_size trg_len]
            #残差连接
            conved=(conved+input_conv)*self.scale
            #conved[batch  hid_size trg_len]
            #带入下一层循环
            input_conv=conved
        
        #卷积层出来后
        #conved[batch  hid_size trg_len]
        #转变维度为emb_size
        output=self.hid2emb(conved.permute(0,2,1))
        #output[batch trg_len emb_size]
        #映射到英语字典空间上
        output=self.fc(self.dropout(output))
        return output,a

class Seq2Seq(nn.Module):
    def __init__(self,encoder,decoder):
        super(Seq2Seq,self).__init__()
        self.encoder=encoder
        self.decoder=decoder
    
    def forward(self,src,trg):
        en_coved,en_combined=self.encoder(src)
        output,attn=self.decoder(trg,en_coved,en_combined)
        return output,attn

测试：

model=Seq2Seq(enModel,deModel).to(device)
output,a=model(src,trg)
print(output.shape)

结果：

torch.Size([128, 31, 5893])

2.3训练

import math,time
from torch.optim import Adam

def epoch_time(start_time, end_time):
    elapsed_time = end_time - start_time
    elapsed_mins = int(elapsed_time / 60)
    elapsed_secs = int(elapsed_time - (elapsed_mins * 60))
    return elapsed_mins, elapsed_secs

epochs=10
clip=0.1
criterion=nn.CrossEntropyLoss(ignore_index=1)
optim=Adam(model.parameters())

def train(model,data_iter,criterion,optim,clip):
    
    model.train()
    lossAll=0
    for example in data_iter:
        src=example.src
        trg=example.trg
        
        optim.zero_grad()
        output,_=model(src,trg[:,:-1])
        #output[batch trg_len-1 trg_vocab_size]
        output=output.reshape(-1,trg_vocab_size)
        trg=trg[:,1:].reshape(-1)
        #output[batch*(trg_len-1),trg_vocab_size]
        #trg[batch*(trg_ken-1)]
        loss=criterion(output,trg)
        loss.backward()      
        torch.nn.utils.clip_grad_norm_(model.parameters(),clip)
        optim.step()
        
        lossAll+=loss.item()
    return lossAll/len(data_iter)

def evaluate(model,data_iter,criterion):
    
    model.eval()
    lossAll=0
    
    with torch.no_grad():
        for example in data_iter:
            src=example.src
            trg=example.trg

            output,_=model(src,trg[:,:-1])
            #output[batch trg_len-1 trg_vocab_size]
            output=output.reshape(-1,trg_vocab_size)
            trg=trg[:,1:].reshape(-1)
            #output[batch*(trg_len-1),trg_vocab_size]
            #trg[batch*(trg_ken-1)]
            loss=criterion(output,trg)
            lossAll+=loss.item()
    return lossAll/len(data_iter)

for epoch in range(epochs):
    
    start_time = time.time()
    train_loss = train(model,train_iter,criterion,optim,clip)
    valid_loss = evaluate(model,val_iter,criterion)
    end_time = time.time()
    epoch_mins, epoch_secs = epoch_time(start_time, end_time)
    
    
    print(f'Epoch: {epoch+1:02} | Time: {epoch_mins}m {epoch_secs}s')
    print(f'\tTrain Loss: {train_loss:.3f} | Train PPL: {math.exp(train_loss):7.3f}')
    print(f'\t Val. Loss: {valid_loss:.3f} |  Val. PPL: {math.exp(valid_loss):7.3f}')

过程展示：

测试集评估：

test_loss = evaluate(model,test_iter,criterion)
print(f'\t Test. Loss: {test_loss:.3f} |  Val. PPL: {math.exp(test_loss):7.3f}')

结果：

Test. Loss: 1.811 |  Val. PPL:   6.119

你可能感兴趣的:(机器翻译,自然语言处理,机器翻译,pytorch)

自动语音识别（ASR）：技术、应用与未来 ajie1117 语音识别人工智能
自动语音识别（ASR）：技术、应用与未来1.ASR简介自动语音识别（ASR，AutomaticSpeechRecognition）是一种将语音转换为文本的技术。它利用人工智能（AI）、深度学习和自然语言处理（NLP）技术来识别和理解人类的语言，使计算机能够与人类进行更自然的交互。2.ASR的工作原理ASR的核心流程通常包括以下几个步骤：语音信号采集：通过麦克风或其他设备获取音频数据。预处理：去除噪
知识图谱在人工智能语义理解与推理中的关键作用及发展研究 @王威& 人工智能
摘要本文聚焦知识图谱，深入剖析其在人工智能语义理解与推理中的核心作用。阐述知识图谱的构建原理、表示方法，分析其在自然语言处理、智能问答系统、推荐系统等多领域助力语义理解与推理的应用，探讨面临的挑战并展望未来发展方向，全面呈现知识图谱对人工智能发展的重要价值与深远影响。一、引言在人工智能追求更精准理解和处理人类语言与知识的进程中，知识图谱成为关键技术。它以结构化形式组织海量知识，揭示实体间复杂关系，
《深度剖析：BERT与GPT——自然语言处理架构的璀璨双星》人工智能深度学习
在自然语言处理（NLP）的广袤星空中，BERT（BidirectionalEncoderRepresentationsfromTransformers）与GPT（GenerativePretrainedTransformer）系列模型宛如两颗最为耀眼的星辰，引领着NLP技术不断迈向新的高度。它们基于独特的架构设计，以强大的语言理解与生成能力，彻底革新了NLP的研究与应用范式，成为学界和业界竞相探索
Open-Sora - 为所有人实现高效的视频制作大众化小众AI AI开源音视频人工智能 AI编程
GitHub：https://github.com/hpcaitech/Open-Sora更多AI开源软件：发现分享好用的AI工具、AI开源软件、AI模型、AI变现-小众AI这是一款开源的SOTA（State-of-the-Art）视频生成模型，仅用20万美元（224张GPU）就能训练出商业级11B参数的视频生成大模型。它采用Python语言和PyTorch深度学习框架开发，具有生成速度快、资源消
Transformer与图神经网络的融合与应用 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 AI大模型企业级应用开发实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
Transformer与图神经网络的融合与应用关键词：Transformer,图神经网络,注意力机制,图结构数据,图表示学习,图分类,图生成1.背景介绍近年来，深度学习技术在各个领域取得了显著的进展。其中，Transformer模型和图神经网络（GraphNeuralNetworks,GNNs）是两个备受关注的研究方向。Transformer最初应用于自然语言处理领域，通过自注意力机制实现了并行计
使用 OpenAI Chat 模型进行对话开发的入门指南 eahba python
技术背景介绍OpenAI的对话模型（ChatOpenAI）为开发者提供了强大的自然语言处理功能，可以实现高度交互的AI应用。这篇文章将帮助您快速入门，了解如何在您的应用中集成和使用这些模型，并探讨不同的功能特性。核心原理解析ChatOpenAI模型是基于OpenAI的GPT家族，能够理解上下文并产生对话式回应。最新版的模型不仅支持标准文本输入输出，还支持工具调用、结构化输出等高级特性，满足多种复杂
【ai】mocap：conda 安装python3.8+ cuda+ pytorch+torchaudio、torchvision 等风来不如迎风去 AI入门与实战人工智能 ubuntu conda
MotionCapubuntu18.04不知道为啥会依赖于ffmpeg、xorg渲染？安装pytorch就是会带上cudacudnn啥的pytorch【ai】tx2nx：安装torch、torchvisionforyolov5这里就发现pytorch和torchvision有依赖关系的，还涉及到rapidjson所以python的环境隔离很重要。核心库-cudatoolkit=11.3-pytor
Pytorch使用手册—扩展 TorchScript 使用自定义 C++ 操作符（专题五十三） AI专题精讲 Pytorch入门到精通 pytorch c++人工智能
提示本教程自PyTorch2.4起已弃用。有关PyTorch自定义操作符的最新指南，请参阅PyTorch自定义操作符。PyTorch1.0版本引入了一种名为TorchScript的新编程模型。TorchScript是Python编程语言的一个子集，可以被TorchScript编译器解析、编译和优化。此外，编译后的TorchScript模型可以选择序列化为磁盘文件格式，随后你可以从纯C++（以及Py
AI 大模型应用数据中心的数据迁移架构 AGI大模型与大数据研究院 DeepSeek R1 &大数据AI人工智能 java python javascript kotlin golang 架构人工智能
AI大模型、数据中心、数据迁移、架构设计、迁移策略、性能优化、安全保障1.背景介绍随着人工智能（AI）技术的飞速发展，大规模AI模型的应用日益广泛，涵盖了自然语言处理、计算机视觉、语音识别等多个领域。这些AI模型通常需要海量的数据进行训练和推理，因此数据中心作为AI应用的基础设施，显得尤为重要。然而，随着AI模型规模的不断扩大，数据中心面临着新的挑战：数据规模庞大:AI模型的训练和推理需要海量数据
部分标签数据集生成与过滤特定标签方法阳光明媚大男孩机器学习人工智能
完整代码总结这段代码的目的是通过构建一个部分标签学习（PartialLabelLearning,PLL）框架来生成一个包含部分标签的数据集，并且支持根据给定的标签列表对数据集进行筛选和过滤。代码包含了多个类和函数，主要分为以下几部分：数据预处理与加载：使用PyTorch和torchvision来加载CIFAR-10数据集，并对其进行标准化处理。部分标签数据集的生成：为每个样本生成多个候选标签，并模
模型部署实战：PyTorch生产化指南小诸葛IT课堂 pytorch 人工智能 python
‌一、为什么要做模型部署？‌模型部署是将训练好的模型‌投入实际应用‌的关键步骤，涉及：模型格式转换（TorchScript/ONNX）性能优化（量化/剪枝）构建API服务移动端集成本章使用ResNet18实现图像分类，并演示完整部署流程。‌二、模型转换：TorchScript与ONNX‌‌1.准备预训练模型importtorchimporttorchvision#加载预训练模型model=torc
下一代模型技术演进与场景应用突破智能计算研究中心其他
内容概要当前模型技术正经历多维度的范式跃迁，可解释性模型与自动化机器学习（AutoML）成为突破传统黑箱困境的核心路径。在底层架构层面，边缘计算与量子计算的融合重构了算力分配模式，联邦学习技术则为跨域数据协作提供了安全可信的解决方案。主流框架如TensorFlow和PyTorch持续迭代优化能力，通过动态参数压缩与自适应超参数调优策略，显著提升模型部署效率。应用层创新呈现垂直化特征，医疗诊断模型通
人工智能之数学基础：数学对人工智能技术发展的作用每天五分钟玩转人工智能机器学习深度学习之数学基础人工智能深度学习机器学习神经网络自然语言处理数学
本文重点数学是人工智能技术发展的基础，它提供了人工智能技术所需的数学理论和算法，包括概率论、统计学、线性代数、微积分、图论等等。本文将从以下几个方面探讨数学对人工智能技术发展的作用。概率论和统计学概率论和统计学是人工智能技术中最为重要的数学分支之一。概率论和统计学的应用范围非常广泛，包括机器学习、数据挖掘、自然语言处理、计算机视觉等领域。在人工智能技术中，概率论和统计学主要用于处理不确定性的问题，
PyTorch模型训练实战指南：掌握动态图特性与工业级部署技巧 lmtealily pytorch 人工智能 python
前言在深度学习领域，PyTorch凭借其动态计算图、高效的自动微分系统及高度Pythonic的设计哲学，已成为学术界与工业界的主流框架。其即时执行模式大幅简化了模型调试流程，而灵活的模块化设计则为复杂模型的构建提供了坚实基础。然而，从实验原型到工业级部署的全链路实践中，开发者仍需系统性掌握框架核心特性与工程化技巧。本文以实战为导向，深入剖析PyTorch动态图机制与自动微分原理，详解从数据预处理、
PyTorch 深度学习实战（19）：离线强化学习与 Conservative Q-Learning (CQL) 算法进取星辰 PyTorch 深度学习实战深度学习 pytorch 算法
在上一篇文章中，我们探讨了分布式强化学习与IMPALA算法，展示了如何通过并行化训练提升强化学习的效率。本文将聚焦离线强化学习（OfflineRL）这一新兴方向，并实现ConservativeQ-Learning(CQL)算法，利用Minari提供的静态数据集训练安全的强化学习策略。一、离线强化学习与CQL原理1.离线强化学习的特点无需环境交互：直接从预收集的静态数据集学习数据效率高：复用历史经验
一切皆是映射：DQN训练加速技术：分布式训练与GPU并行 AI天才研究院计算 AI大模型企业级应用开发实战 ChatGPT 计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
1.背景介绍1.1深度强化学习的兴起近年来，深度强化学习（DeepReinforcementLearning，DRL）在游戏、机器人控制、自然语言处理等领域取得了令人瞩目的成就。作为一种结合深度学习和强化学习的强大技术，DRL能够使智能体在与环境交互的过程中学习最优策略，从而实现自主决策和控制。1.2DQN算法及其局限性深度Q网络（DeepQ-Network，DQN）是DRL的一种经典算法，它利用
大规模语言模型从理论到实践分布式训练的集群架构 AI智能涌现深度研究 DeepSeek R1 &大数据AI人工智能 Python入门实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
大规模语言模型从理论到实践分布式训练的集群架构作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着深度学习技术的飞速发展，大规模语言模型（LargeLanguageModels,LLMs）在自然语言处理（NaturalLanguageProcessing,NLP）领域取得了突破性进展。LLMs，如BERT、GPT-3等，通
Hugging Face 模型格式全解析：从 PyTorch 到 GGUF mingo_敏 Deep Learning pytorch 人工智能 python
HuggingFace模型格式全解析：从PyTorch到GGUFHuggingFace生态支持多种模型格式，以满足不同场景下的存储、部署和推理需求。以下是主流格式的技术解析与演进脉络：1.PyTorch原生格式（.pt/.pth）特性：直接保存PyTorch的state_dict（模型参数）或完整模型（含结构）。兼容性强，与PyTorch训练/推理流程深度集成。文件体积较大，加载速度较慢，存在安全
近期计算机领域的热点技术 0dayNu1L 云计算量子计算人工智能
随着科技的飞速发展，计算机领域的新技术、新趋势层出不穷。本文将探讨近期计算机领域的几个热点技术趋势，并对它们进行简要的分析和展望。一、人工智能与机器学习人工智能（AI）和机器学习（ML）是近年来计算机领域最为热门的话题之一。AI和ML技术已经广泛应用于图像识别、自然语言处理、智能推荐等领域，并取得了显著的成果。随着技术的不断进步，AI和ML将更深入地渗透到各个行业，为人类社会带来更多便利和效益。在
书籍-《动手学深度学习（英文版）》
书籍：DiveintoDeepLearning作者：AstonZhang，ZacharyC.Lipton，MuLi，AlexanderJ.Smola出版：CambridgeUniversityPress编辑：陈萍萍的公主@一点人工一点智能下载：书籍下载-《动手学深度学习（英文版）》01书籍介绍深度学习已经彻底改变了模式识别，为计算机视觉、自然语言处理和自动语音识别等领域提供了强大的工具。应用深度学
向量数据库 PieCloudVector 进阶系列丨打造以 LLM 为基础的聊天机器人
本系列前两篇文章深入探讨了PieCloudVector在图片和音频数据上的应用之后，本文将聚焦于文本数据，探索PieCloudVector对于文本数据的向量化处理、存储以及检索，并最终结合LLM打造聊天机器人的全流程。在自然语言处理任务中涉及到大量对文本数据的处理、分析和理解，而向量数据库在其中发挥了重要的作用。本文为《PieCloudVector进阶系列》的第三篇，将为大家介绍如何利用PieCl
【十自然语言处理项目实战】【10.2 数据收集与预处理】再见孙悟空_ #自然语言处理人工智能知识图谱 transformer 自然语言处理数据收集自然语言处理预处理自然语言处理项目
各位在数据泥潭里打滚的勇士们，今天咱们要聊的这个话题，就像学做川菜必须掌握的"火锅底料炒制法"——数据收集与预处理！这玩意儿看着像脏活累活，实则是决定你模型上限的生死关卡。作为一个曾把BERT训成人工智障的老司机，这就把五年掉坑经验熬成一锅十全大补汤！（戴上橡胶手套准备掏数据）一、数据收集的野路子：比盗墓还刺激的冒险1.1公开数据集寻宝图（附藏宝坐标）①正道的光：Kaggle（数据界的沃尔玛）：搜
实战LLM强化学习——使用GRPO（DeepSeek R1出圈算法）大富大贵7 程序员知识储备1 程序员知识储备2 程序员知识储备3 经验分享
引言近年来，深度强化学习（DRL）已经成为解决复杂决策问题的一个强有力工具，尤其是在自然语言处理（NLP）领域的广泛应用。通过不断优化决策策略，DRL能在大量数据中学习最佳行为，尤其是大型语言模型（LLM）在任务中展现出的巨大潜力。然而，随着模型规模的扩大和任务复杂性的增加，传统的强化学习算法开始暴露出训练效率低、收敛速度慢等问题。为了解决这些挑战，DeepSeek公司提出了一个新的强化学习算法—
LeetCode98-验证二叉搜索树学习的学习者 LeetCode Python 二叉搜索树
上个星期和导师去了华农一趟名义上是和导师去参加一个国家级的项目其实没我啥事都是我导师在那口若悬河当时和那边的本科生去了另一间会议室交流了关于GAN的知识偶然听说大家都在用pytorch好像最新版的也挺好用的反正就是学术界目前主要用这个框架工业界主要用Tensorflow(没办法，Google出品)这两天也拿来瞧了瞧好像也确实可以的！！！98-验证二叉搜索树给定一个二叉树，判断其是否是一个有效的二叉
理解并使用基于n-gram重叠的示例选择器 shuoac easyui 前端 javascript python
在AI及自然语言处理任务中，选择与输入最相似的示例可以显著提升生成的质量和上下文相关性。本文将介绍如何使用NGramOverlapExampleSelector工具，通过n-gram重叠来筛选和排序示例，从而帮助实现这一目标。技术背景介绍n-gram重叠技术通过比较输入文本与示例文本在字符或词组上的相似度，计算一个介于0到1之间的分数来表示相似度。这个分数越高，表示文本间的重叠越大。NGramOv
文本纠错（Text Correction） dundunmm 人工智能数据挖掘文本纠错人工智能数据挖掘文本纠错深度学习
文本纠错（TextCorrection）是自然语言处理（NLP）中的一个重要任务，旨在自动检测并修正文本中的错误，包括拼写、语法、语义等层面的错误。其核心目标是通过算法模型将错误文本转换为符合语言规范的表达。该任务在自动写作辅助、搜索引擎优化、智能客服、教育等多个领域具有广泛应用。输入：包含错误的原始文本（如“我明天要去北京，希望天汽好。”）输出：修正后的规范文本（如“我明天要去北京，希望天气好。
使用CharacterTextSplitter实现文本按字符拆分 bavDHAUO python
在文本处理任务中，按字符进行拆分是一种简单且有效的方法。本篇文章将介绍如何使用CharacterTextSplitter类对文本进行按字符拆分，并生成适用于下游任务的LangChainDocument对象。技术背景介绍文本拆分是自然语言处理（NLP）中的一个基础步骤，尤其在大文本分块处理、文本摘要等任务中。CharacterTextSplitter是langchain-text-splitters
【产品小白】什么是AI产品经理百事不可口y 产品经理的一步一步人工智能产品经理学习产品运营内容运营用户运营
一、AI产品经理的定义与角色定位AI产品经理是人工智能技术与商业应用之间的核心桥梁，负责将复杂的AI技术转化为满足市场需求的产品。需同时具备技术理解力、商业洞察力和用户思维，既要参与算法选型与数据建模，又要定义产品功能与市场策略，是贯穿产品全生命周期的关键角色。与传统互联网产品经理相比，AI产品经理的独特之处在于：技术深度参与：需理解机器学习、自然语言处理（NLP）、计算机视觉等技术原理，并参与数
人工智能（AI）系统化学习路线 xiaoyu❅ python 人工智能学习
一、为什么需要系统化学习AI？人工智能技术正在重塑各行各业，但许多初学者容易陷入误区：❌盲目跟风：直接学习TensorFlow/PyTorch，忽视数学与算法基础。❌纸上谈兵：只看理论不写代码，无法解决实际问题。❌方向模糊：对CV/NLP/RL等细分领域缺乏认知，难以针对性提升。正确的学习姿势：“金字塔式”分层学习（理论→算法→框架→应用→工程化），逐步构建完整的AI知识体系。二、人工智能学习路线
使用LangChain实现大规模语言模型自发现推理结构 VYSAHF langchain 语言模型人工智能 python
使用LangChain实现大规模语言模型自发现推理结构在现代自然语言处理(NLP)的研究中，大规模语言模型（LLMs）已经展示了强大的能力。然而，在应对复杂的推理问题时，传统的提示方法常常力不从心。这篇文章将带您了解SELF-DISCOVER，一种新兴的框架，如何通过LangChain来实现自动化、动态化的推理结构构建，以提高LLMs的性能。技术背景介绍大规模语言模型（如GPT-4和PaLM2）已
LeetCode[位运算] - #137 Single Number II Cwind java Algorithm LeetCode 题解位运算
原题链接：#137 Single Number II 要求：给定一个整型数组，其中除了一个元素之外，每个元素都出现三次。找出这个元素注意：算法的时间复杂度应为O(n)，最好不使用额外的内存空间难度：中等分析：与#136类似，都是考察位运算。不过出现两次的可以使用异或运算的特性 n XOR n = 0, n XOR 0 = n，即某一
《JavaScript语言精粹》笔记 aijuans JavaScript
0、JavaScript的简单数据类型包括数字、字符创、布尔值（true/false）、null和undefined值，其它值都是对象。 1、JavaScript只有一个数字类型，它在内部被表示为64位的浮点数。没有分离出整数，所以1和1.0的值相同。 2、NaN是一个数值，表示一个不能产生正常结果的运算结果。NaN不等于任何值，包括它本身。可以用函数isNaN(number)检测NaN,但是
你应该更新的Java知识之常用程序库 Kai_Ge java
在很多人眼中，Java 已经是一门垂垂老矣的语言，但并不妨碍 Java 世界依然在前进。如果你曾离开 Java，云游于其它世界，或是每日只在遗留代码中挣扎，或许是时候抬起头，看看老 Java 中的新东西。 Guava Guava[gwɑ:və]，一句话，只要你做Java项目，就应该用Guava（Github）。 guava 是 Google 出品的一套 Java 核心库，在我看来，它甚至应该
HttpClient 120153216 httpclient
/** * 可以传对象的请求转发，对象已流形式放入HTTP中 */ public static Object doPost(Map<String,Object> parmMap,String url) { Object object = null; HttpClient hc = new HttpClient(); String fullURL
Django model字段类型清单 2002wmj django
Django 通过 models 实现数据库的创建、修改、删除等操作，本文为模型中一般常用的类型的清单，便于查询和使用： AutoField：一个自动递增的整型字段，添加记录时它会自动增长。你通常不需要直接使用这个字段；如果你不指定主键的话，系统会自动添加一个主键字段到你的model。(参阅自动主键字段) BooleanField：布尔字段,管理工具里会自动将其描述为checkbox。 Cha
在SQLSERVER中查找消耗CPU最多的SQL 357029540 SQL Server
返回消耗CPU数目最多的10条语句 SELECT TOP 10 total_worker_time/execution_count AS avg_cpu_cost, plan_handle, execution_count, (SELECT SUBSTRING(text, statement_start_of
Myeclipse项目无法部署，Undefined exploded archive location 7454103 eclipse MyEclipse
做个备忘！错误信息为： Undefined exploded archive location 原因：在工程转移过程中，导致工程的配置文件出错；解决方法：
GMT时间格式转换 adminjun GMT 时间转换
普通的时间转换问题我这里就不再罗嗦了，我想大家应该都会那种低级的转换问题吧，现在我向大家总结一下如何转换GMT时间格式，这种格式的转换方法网上还不是很多，所以有必要总结一下，也算给有需要的朋友一个小小的帮助啦。 1、可以使用 SimpleDateFormat SimpleDateFormat EEE-三位星期 d-天 MMM-月 yyyy-四位年
Oracle数据库新装连接串问题 aijuans oracle数据库
割接新装了数据库，客户端登陆无问题，apache/cgi-bin程序有问题，sqlnet.log日志如下： Fatal NI connect error 12170. VERSION INFORMATION: TNS for Linux: Version 10.2.0.4.0 - Product
回顾java数组复制 ayaoxinchao java 数组
在写这篇文章之前，也看了一些别人写的，基本上都是大同小异。文章是对java数组复制基础知识的回顾，算是作为学习笔记，供以后自己翻阅。首先，简单想一下这个问题：为什么要复制数组？我的个人理解：在我们在利用一个数组时，在每一次使用，我们都希望它的值是初始值。这时我们就要对数组进行复制，以达到原始数组值的安全性。java数组复制大致分为3种方式：①for循环方式 ②clone方式 ③arrayCopy方
java web会话监听并使用spring注入 bewithme Java Web
在java web应用中，当你想在建立会话或移除会话时，让系统做某些事情，比如说，统计在线用户，每当有用户登录时，或退出时，那么可以用下面这个监听器来监听。 import java.util.ArrayList; import java.ut
NoSQL数据库之Redis数据库管理(Redis的常用命令及高级应用) bijian1013 redis 数据库 NoSQL
一 .Redis常用命令 Redis提供了丰富的命令对数据库和各种数据库类型进行操作，这些命令可以在Linux终端使用。 a.键值相关命令 b.服务器相关命令 1.键值相关命令 &
java枚举序列化问题 bingyingao java 枚举序列化
对象在网络中传输离不开序列化和反序列化。而如果序列化的对象中有枚举值就要特别注意一些发布兼容问题: 1.加一个枚举值新机器代码读分布式缓存中老对象，没有问题，不会抛异常。老机器代码读分布式缓存中新对像，反序列化会中断，所以在所有机器发布完成之前要避免出现新对象，或者提前让老机器拥有新增枚举的jar。 2.删一个枚举值新机器代码读分布式缓存中老对象，反序列
【Spark七十八】Spark Kyro序列化 bit1129 spark
当使用SparkContext的saveAsObjectFile方法将对象序列化到文件，以及通过objectFile方法将对象从文件反序列出来的时候，Spark默认使用Java的序列化以及反序列化机制，通常情况下，这种序列化机制是很低效的，Spark支持使用Kyro作为对象的序列化和反序列化机制，序列化的速度比java更快，但是使用Kyro时要注意，Kyro目前还是有些bug。 Spark
Hybridizing OO and Functional Design bookjovi erlang haskell
推荐博文： Tell Above, and Ask Below - Hybridizing OO and Functional Design 文章中把OO和FP讲的深入透彻，里面把smalltalk和haskell作为典型的两种编程范式代表语言，此点本人极为同意，smalltalk可以说是最能体现OO设计的面向对象语言，smalltalk的作者Alan kay也是OO的最早先驱，
Java-Collections Framework学习与总结-HashMap BrokenDreams Collections
开发中常常会用到这样一种数据结构，根据一个关键字，找到所需的信息。这个过程有点像查字典，拿到一个key，去字典表中查找对应的value。Java1.0版本提供了这样的类java.util.Dictionary(抽象类)，基本上支持字典表的操作。后来引入了Map接口，更好的描述的这种数据结构。 &nb
读《研磨设计模式》-代码笔记-职责链模式-Chain Of Responsibility bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 业务逻辑：项目经理只能处理500以下的费用申请，部门经理是1000，总经理不设限。简单起见，只同意“Tom”的申请 * bylijinnan */ abstract class Handler { /*
Android中启动外部程序 cherishLC android
1、启动外部程序引用自： http://blog.csdn.net/linxcool/article/details/7692374 //方法一 Intent intent=new Intent(); //包名包名+类名（全路径） intent.setClassName("com.linxcool", "com.linxcool.PlaneActi
summary_keep_rate coollyj SUM
BEGIN /*DECLARE minDate varchar(20) ; DECLARE maxDate varchar(20) ;*/ DECLARE stkDate varchar(20) ; DECLARE done int default -1; /* 游标中注册服务器地址 */ DE
hadoop hdfs 添加数据目录出错 daizj hadoop hdfs 扩容
由于原来配置的hadoop data目录快要用满了，故准备修改配置文件增加数据目录，以便扩容，但由于疏忽，把core-site.xml, hdfs-site.xml配置文件dfs.datanode.data.dir 配置项增加了配置目录，但未创建实际目录，重启datanode服务时，报如下错误： 2014-11-18 08:51:39,128 WARN org.apache.hadoop.h
grep 目录级联查找 dongwei_6688 grep
在Mac或者Linux下使用grep进行文件内容查找时，如果给定的目标搜索路径是当前目录，那么它默认只搜索当前目录下的文件，而不会搜索其下面子目录中的文件内容，如果想级联搜索下级目录，需要使用一个“-r”参数： grep -n -r "GET" . 上面的命令将会找出当前目录“.”及当前目录中所有下级目录
yii 修改模块使用的布局文件 dcj3sjt126com yii layouts
方法一：yii模块默认使用系统当前的主题布局文件，如果在主配置文件中配置了主题比如: 'theme'=>'mythm', 那么yii的模块就使用 protected/themes/mythm/views/layouts 下的布局文件；如果未配置主题，那么 yii的模块就使用 protected/views/layouts 下的布局文件，总之默认不是使用自身目录 pr
设计模式之单例模式 come_for_dream 设计模式单例模式懒汉式饿汉式双重检验锁失败无序写入
今天该来的面试还没来，这个店估计不会来电话了，安静下来写写博客也不错，没事翻了翻小易哥的博客甚至与大牛们之间的差距，基础知识不扎实建起来的楼再高也只能是危楼罢了，陈下心回归基础把以前学过的东西总结一下。 *********************************
8、数组豆豆咖啡二维数组数组一维数组
一、概念数组是同一种类型数据的集合。其实数组就是一个容器。二、好处可以自动给数组中的元素从0开始编号，方便操作这些元素三、格式 //一维数组 1,元素类型[] 变量名 = new 元素类型[元素的个数] int[] arr =
Decode Ways hcx2013 decode
A message containing letters from A-Z is being encoded to numbers using the following mapping: 'A' -> 1 'B' -> 2 ... 'Z' -> 26 Given an encoded message containing digits, det
Spring4.1新特性——异步调度和事件机制的异常处理 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
squid3(高命中率)缓存服务器配置 liyonghui160com
系统:centos 5.x 需要的软件:squid-3.0.STABLE25.tar.gz 1.下载squid wget http://www.squid-cache.org/Versions/v3/3.0/squid-3.0.STABLE25.tar.gz tar zxf squid-3.0.STABLE25.tar.gz &&
避免Java应用中NullPointerException的技巧和最佳实践 pda158 java
1) 从已知的String对象中调用equals()和equalsIgnoreCase()方法，而非未知对象。　　总是从已知的非空String对象中调用equals()方法。因为equals()方法是对称的，调用a.equals(b)和调用b.equals(a)是完全相同的，这也是为什么程序员对于对象a和b这么不上心。如果调用者是空指针，这种调用可能导致一个空指针异常 Object unk
如何在Swift语言中创建http请求 shoothao http swift
概述：本文通过实例从同步和异步两种方式上回答了”如何在Swift语言中创建http请求“的问题。如果你对Objective-C比较了解的话，对于如何创建http请求你一定驾轻就熟了，而新语言Swift与其相比只有语法上的区别。但是，对才接触到这个崭新平台的初学者来说，他们仍然想知道“如何在Swift语言中创建http请求？”。在这里,我将作出一些建议来回答上述问题。常见的
Spring事务的传播方式 uule spring事务
传播方式：新建事务 required required_new - 挂起当前非事务方式运行 supports &nbs