诚威_lol_中大努力中

使用RNN联合注意力机制实现机器翻译

https://zhuanlan.zhihu.com/p/28834212

具体来自这一篇文章的指导

一、相关使用的查漏补缺：

1.其中的两种神奇的处理字符的操作：

2.关于nn.GRU()的参数解释和用法：

http://t.csdn.cn/30PZL

这篇文章讲得很清楚，需要用来预测的话看这篇也可以http://t.csdn.cn/VseAV

这里重点讲述以下它的参数的含义：

（1）输入参数：

(2)输出参数：

（3）用法示例：

3.关于nn.embedding的用法：

（1）就我看来，简单一点，就是将最里面的那个维度的数据由input_size->转化为 hidden_size,

然而并不是呢，看下面

（2）其他文章都没有chatGPT讲得清楚：

4.encoder 和attn_decoder的传参方式：

5.torch.data.topk()这个函数的作用：

听名字就知道这个函数是用来求tensor中某个dim的前k大或者前k小的值以及对应的index。

6.nn.nllloss 和 crossEntropyLoss的区别：

二、这是我在kaggle运行的第一个project：-_-

虽然kaggle一周只能用30个小时的GPU P100,但是，只要用的时候开，基本用不完，而且比那个Colab快多了，嘻嘻，重点是不会自动断掉，非常虚浮

1.关于Kaggle的使用经验：

（1）首先，登录之后，点击到code页面，添加新的notebook，就可以开始写代码了

（2）关于上传文件，我这一次是选择的从本地进行上传的方式，建议上传的时候关掉比较快，然后再打开，注意，最好选择拖动的方式，可以直接上传“整个文件夹”，并给整个文件放到一个文件夹目录，这个目录需要自己命名，注意，.ipynb文件没啥用

（3）特别经验，有时候文件路径老是很让人困惑，所以以下tips:

import os
print(os.path.exists('./kaggle/input/main-data/RNN_for_translate/data/eng-fra.txt'))

如果文件存在，该命令会输出True；如果文件不存在，会输出False。

2.关于具体的代码和注释：

#引入相关的库内容：
from __future__ import unicode_literals, print_function, division
from io import open # 处理文件
import unicodedata # 处理unicode字符相关事项
import string 
import re # 正则表达式相关
import random

import torch 
import torch.nn as nn
from torch.autograd import Variable
from torch import optim
import torch.nn.functional as F

use_cuda = torch.cuda.is_available() # 如果您的计算机支持cuda，则优先在cuda下运行
print(use_cuda) #看来本王的笔记本并不支持cuda

#下载数据并且对数据进行处理:

#把文本文件一次性读入内存
#对文本中出现的一些特殊字符进行适当处理
#分别建立“英语”、“法语”语料库（词向量），并对两库进行一定的修饰，剔除不常用的词、并剔除两库中使用不常用词的句子。
#提供后续程序需要的一些功能接口

#声明起始和结束占用符
SOS_token = 0
EOS_token = 1

#我们构建一个类Lang，来全权处理文本数据相关的操作：
class Lang: #这个注释挺详细的,而且这个部分的思想和c++的类设计很相似
    def __init__(self, name): #初始化函数，传递一个name参数
        self.name = name      
        self.word2index = {} # 单词对应的在字典里的索引号
        self.word2count = {} # 记录某一个单词在语料库里出现的次数
        self.index2word = {0: "SOS", 1: "EOS"} # 索引对应的单词
        self.n_words = 2  # Count SOS and EOS # 语料库里拥有的单词数量

    def addSentence(self, sentence): # 往语料库里增加一句话：扩充语料库 ,参数是这句话
        for word in sentence.split(' '): # 要增加的一句话是以空格来分割不同的单词
            self.addWord(word) # 把单词一个个加入语料库

    def addWord(self, word):   # 把单词加入到语料库中具体要做的事情
        if word not in self.word2index: # 对于语料库中不存在的新词
            self.word2index[word] = self.n_words # 索引号依据先来后到的次序分配
            self.word2count[word] = 1 # 更新该次的出现次数
            self.index2word[self.n_words] = word # 同时更新该字典
            self.n_words += 1
        else:
            self.word2count[word] += 1 # 对于已存在于语料库中的词，仅增加其出现次数。

#文中还提供了两个辅助方法，来将unicode字符转化为ascii字符，
#同时对英语、法语句子中存在一些大小写、缩写、连写、特殊字符等现象进行的规范化处理：
# Turn a Unicode string to plain ASCII, thanks to
# http://stackoverflow.com/a/518232/2809427
def unicodeToAscii(s):
    return ''.join(
        c for c in unicodedata.normalize('NFD', s)
        if unicodedata.category(c) != 'Mn'
    )

# Lowercase, trim, and remove non-letter characters
def normalizeString(s):
    s = unicodeToAscii(s.lower().strip())
    s = re.sub(r"([.!?])", r" \1", s)
    s = re.sub(r"[^a-zA-Z.!?]+", r" ", s)
    return s

#读取文件中的内容，形成一系列语句对，并构建两个Lang对象
def readLangs(lang1, lang2, reverse=False): # lang1,lang2仅是字符串，代表对应的语言
    print("Reading lines...")
    # Read the file and split into lines
    lines = open('data/%s-%s.txt' % (lang1, lang2), encoding='utf-8').\
        read().strip().split('\n')
    # 把文本文件变为语句对列表
    # Split every line into pairs and normalize ,这里的结果是，将英文 和 法文 分开成对pair，然后构建一个元素是pair的列表叫“pairs”
    pairs = [[normalizeString(s) for s in l.split('\t')] for l in lines]

    # 提供一个反向的操作，即原来是英文->法语，使用reverse后则为法语->英语
    # Reverse pairs, make Lang instances
    if reverse:
        pairs = [list(reversed(p)) for p in pairs]
        input_lang = Lang(lang2)
        output_lang = Lang(lang1) 
    else:
        input_lang = Lang(lang1)
        output_lang = Lang(lang2)

    return input_lang, output_lang, pairs #返回一个lang1和lang2对象，以及生成的语句对pairs

#以下提供了一些辅助方法，用于从总的文本数据中筛选出感兴趣的数据来进行训练，
#读者可以根据自己的兴趣决定是否使用下面这两个方法：

MAX_LENGTH = 10

eng_prefixes = (
    "i am ", "i m ",
    "he is", "he s ",
    "she is", "she s",
    "you are", "you re ",
    "we are", "we re ",
    "they are", "they re "
)

#过滤pair的函数p[0] 和 p[1]的长度 都要 <10 , 且 p[1]????（我感觉是p[0]）必须以上面这些英语句子开头 ,如果reverse了，就没问题
def filterPair(p): # 作者仅对训练数据中句子长度都小于10，且以一定字符串开头的英文句子感兴趣
    return len(p[0].split(' ')) < MAX_LENGTH and len(p[1].split(' ')) < MAX_LENGTH and \
        p[1].startswith(eng_prefixes)

def filterPairs(pairs): # 从所有pairs中选出作者感兴趣的pair
    return [pair for pair in pairs if filterPair(pair)]

#开始准备数据:

def prepareData(lang1, lang2, reverse=False): #传递2个语言的string参数， 以及是否reverse

    # 构建两个语料库
    input_lang, output_lang, pairs = readLangs(lang1, lang2, reverse) #调用上述的readLangs得到 pairs数组

    print("Read %s sentence pairs" % len(pairs)) #输出总共多少个pair对

    pairs = filterPairs(pairs) # 筛选感兴趣的语句对  

    print("Trimmed to %s sentence pairs" % len(pairs)) #筛选之后 剩下的pair对数目

    print("Counting words...") # 统计词频
    for pair in pairs:
        input_lang.addSentence(pair[0])  #pair[0]应该是输入的，也就是英文，添加到input_lang这个对象中，之后也处理了word
        output_lang.addSentence(pair[1]) #感觉这样的话，句子和句子之间的关系就对不上了，，，？？？只是挨个将词放进去
    print("Counted words:")
    print(input_lang.name, input_lang.n_words) #输出input_lang 和 output_lang中的word数目
    print(output_lang.name, output_lang.n_words)
    return input_lang, output_lang, pairs #返回input_lang和 out_lang对象，以及这个pairs数组

input_lang, output_lang, pairs = prepareData('eng', 'fra', True) #创建lang1，lang2，pairs，原来是进行了reverse反转
print(random.choice(pairs)) #随机输出pairs中的一个pair对

#定义RNN类型的 Encoder
class EncoderRNN(nn.Module):
    def __init__(self, input_size, hidden_size, n_layers=1):
        super(EncoderRNN, self).__init__()
        self.n_layers = n_layers # 可以使用多层gru操作，默认只使用一层
        self.hidden_size = hidden_size # 隐藏层的尺寸，如何设定参考后续代码

        self.embedding = nn.Embedding(input_size, hidden_size) #input_size个词汇，每个词汇用hidden_size维度的向量表示 
        self.gru = nn.GRU(hidden_size, hidden_size) # 记忆结构

    def forward(self, input, hidden):
        embedded = self.embedding(input).view(1, 1, -1)  #先将输入embedding到embedded。然后调整形状为3维的tensor -1*1*all
        output = embedded  #将embedded传给output
        for i in range(self.n_layers):
            output, hidden = self.gru(output, hidden) #通过n_layers层的gru，然后得到输出output 和 状态hidden
        return output, hidden  #参看那个博客的gru参数以及用法，你就明白了，
    #参数embedded 1*1*all , hidden _就是那个h_0 1*1*hidden_size
    #参数output   1*1*hidden_size , hidden 1*1*hidden_size

    def initHidden(self):
        result = Variable(torch.zeros(1, 1, self.hidden_size)) #就是得到上面的那个1*1*hidden_size -？上面没有调用？还是之后调用？下面有说
        if use_cuda:
            return result.cuda()
        else:
            return result

#Decoder_version1 __普通版本的RNN_decoder_model
class DecoderRNN(nn.Module):
    def __init__(self, hidden_size, output_size, n_layers=1):
        super(DecoderRNN, self).__init__() 
        self.n_layers = n_layers
        self.hidden_size = hidden_size

        self.embedding = nn.Embedding(output_size, hidden_size) #定义embedding函数，词汇表的大小output_size,每个词汇的向量长度hidden_size
        self.gru = nn.GRU(hidden_size, hidden_size) #gru的input参数 和 h_0参数
        self.out = nn.Linear(hidden_size, output_size) #从hidden_size维度 到 output_size维度的Linear层
        # 由于输出是语料库中词语的概率，选最大概率的索引对应的词，
        # 所以需要一个类softmax操作
        self.softmax = nn.LogSoftmax() #由于是一个多分类问题，最后通过一次softmax(前面还有一个log操作)

    def forward(self, input, hidden): #具体的Decoder运行过程
        output = self.embedding(input).view(1, 1, -1) #还是将input转化为1*1*all的3维空间
        for i in range(self.n_layers): #多少层捏
            output = F.relu(output) #通过1个relu
            output, hidden = self.gru(output, hidden) #再和h_0一起通过gru
        output = self.softmax(self.out(output[0])) #最后对output的有用的那层数据进行Linear+softmax
        return output, hidden #返回output 和 h_n

    def initHidden(self): #我甚至怀疑这个函数是自动调用的了，产生了一个1*1*hidden_size作为h_0输入量
        result = Variable(torch.zeros(1, 1, self.hidden_size))
        if use_cuda:
            return result.cuda()
        else:
            return result

#加上self_attention版本的RNN_Decoder
class AttnDecoderRNN(nn.Module):
    def __init__(self, hidden_size, output_size, n_layers=1, dropout_p=0.1, max_length=MAX_LENGTH):

        #对于解码器来说，最重要的两个参数是 隐藏状态的尺寸 和 输出的尺寸大小，这两者主要决定了解码器的参数规模
        super(AttnDecoderRNN, self).__init__()
        self.hidden_size = hidden_size #先把参数传进去
        self.output_size = output_size
        self.n_layers = n_layers
        self.dropout_p = dropout_p
        self.max_length = max_length # 还有一个句子最大长度参数

        self.embedding = nn.Embedding(self.output_size, self.hidden_size)    #设置embedding函数
        self.attn = nn.Linear(self.hidden_size * 2, self.max_length)         #设置attn这个linear函数
        self.attn_combine = nn.Linear(self.hidden_size * 2, self.hidden_size)#设置attn_combine这个linear函数
        self.dropout = nn.Dropout(self.dropout_p)                            #设置dropout函数
        self.gru = nn.GRU(self.hidden_size, self.hidden_size)                #设置gru函数
        self.out = nn.Linear(self.hidden_size, self.output_size)             #设置out输出linear函数

    def forward(self, input, hidden, encoder_output, encoder_outputs):#整个Decoder运行过程
        embedded = self.embedding(input).view(1, 1, -1) #进行embedding将词汇转换为向量序列后，准换为1*1*all的形状
        embedded = self.dropout(embedded)               #调用一次dropout

        attn_weights = F.softmax(
            self.attn(torch.cat((embedded[0], hidden[0]), 1)))  #attn_weights得到的过程：通过embedded和h_n的cat后通过attn线性层+softmax
        attn_applied = torch.bmm(attn_weights.unsqueeze(0),
                                 encoder_outputs.unsqueeze(0)) #通过bmm对attn_weights 和 encoder_outputs这2批矩阵进行对应相乘

        output = torch.cat((embedded[0], attn_applied[0]), 1) #将embedded和attn_applied相连
        output = self.attn_combine(output).unsqueeze(0) #通过线性层

        for i in range(self.n_layers):
            output = F.relu(output)
            output, hidden = self.gru(output, hidden) #通过n_layers次的relu和gru

        output = F.log_softmax(self.out(output[0])) #通过log_softmax
        return output, hidden, attn_weights #返回output 和 h_n 还有attn_weights

    def initHidden(self): #自动生成h_0，嘻嘻
        result = Variable(torch.zeros(1, 1, self.hidden_size))
        if use_cuda:
            return result.cuda()
        else:
            return result

#数据准备部分：
def indexesFromSentence(lang, sentence): #这里应该是输入一个lang的句子，然后返回这个句子的index序列
    return [lang.word2index[word] for word in sentence.split(' ')]


def variableFromSentence(lang, sentence):
    indexes = indexesFromSentence(lang, sentence) #调用上面那个函数，获得这个句子的序列
    indexes.append(EOS_token)  #在这个句子的最后加上EOS_token(1还是0来着。。。)这个值
    result = Variable(torch.LongTensor(indexes).view(-1, 1)) #将这个indexes序列转换为all*1维的数据
    if use_cuda:
        return result.cuda()
    else:
        return result

def variablesFromPair(pair): #输入pair对,一个句子 -vs- 一个句子的那种
    input_variable = variableFromSentence(input_lang, pair[0])
    target_variable = variableFromSentence(output_lang, pair[1])
    return (input_variable, target_variable) #调用上面的那个函数，返回该种数据对

#模型训练部分的代码- 阅读详细的注释：
teacher_forcing_ratio = 0.5     #解释见后

def train(input_variable, target_variable, encoder, decoder, encoder_optimizer, decoder_optimizer, criterion, max_length=MAX_LENGTH):
    # 初始化编码器的隐藏层状态    
    encoder_hidden = encoder.initHidden() #果然，这个函数是用来初始化h_0的，嘻嘻
    # 清除编码器、解码器的梯度数据，准备接受下一次的梯度数据
    encoder_optimizer.zero_grad()
    decoder_optimizer.zero_grad()
    # 待翻译句子和已翻译句子的长度（即组成句子的词语的数量）
    input_length = input_variable.size()[0]
    target_length = target_variable.size()[0]
    # 建立一个编码器输出的PyTorch变量，注意命名是-s结尾，表示
    # 该变量保存了Encoder每一次中间状态数据，而不是最后一次中间状态。
    encoder_outputs = Variable(torch.zeros(max_length, encoder.hidden_size))
    # 如果使用cuda，则再包装一下
    encoder_outputs = encoder_outputs.cuda() if use_cuda else encoder_outputs

    loss = 0
    # 编码器的编码过程
    for ei in range(input_length):
        encoder_output, encoder_hidden = encoder(
            input_variable[ei], encoder_hidden)
        encoder_outputs[ei] = encoder_output[0][0]
    # 通过编码过程，得到了编码器的每一次中间状态数据

    # 给解码器准备最初的输入，是一个开始占位符
    decoder_input = Variable(torch.LongTensor([[SOS_token]]))
    decoder_input = decoder_input.cuda() if use_cuda else decoder_input

    # 解码器初始的输入就是编码器最后一次中间层状态数据
    decoder_hidden = encoder_hidden
    
    #终于明白下面的这个过程了，就是李宏毅上课讲到的，如果decoder中某个字符翻译错了，
    #到底下一次是用 正确的作为token输入呢 还是将错就错用 这个错误的输出作为输入呢？
    #下面是按照概率进行分2种进行的

    # 该变量表明是否在每一次输出时都是用目标正确输出来计算损失
    use_teacher_forcing = True if random.random() < teacher_forcing_ratio else False

    if use_teacher_forcing:
        # 条件为真时，使用正确的输出作为下一时刻解码器的输入来循环计算
        # Teacher forcing: Feed the target as the next input
        for di in range(target_length): #反正就是1个词的翻译，然后指导这个target这个label的长度 或者 输出得到EOS_token才退出decoder
            # decoder解码器具体实施的过程，确定其输出、隐藏层状态、以及注意力数据
            # decoder的forward方法会动态的确定decoder_attention数据
            decoder_output, decoder_hidden, decoder_attention = decoder(
                decoder_input, decoder_hidden, encoder_output, encoder_outputs)
            # 更新损失
            loss += criterion(decoder_output, target_variable[di])
            # 确定下一时间步的解码器输入
            decoder_input = target_variable[di]  # Teacher forcing -这里就是用target作为下一次decoder的输入了

    else:
        # 条件不为真时，使用解码器自身预测的输出来作为下一时刻解码器的输入来循环计算
        # Without teacher forcing: use its own predictions as the next input
        for di in range(target_length): 
            decoder_output, decoder_hidden, decoder_attention = decoder(
                decoder_input, decoder_hidden, encoder_output, encoder_outputs)
            #这里肯定就是获取到最大的概率的那个 位置的索引值
            topv, topi = decoder_output.data.topk(1)  #获取前k个（前1）个元素的数值和位置索引
            ni = topi[0][0] #得到这个位置索引就是预测的词汇

            decoder_input = Variable(torch.LongTensor([[ni]])) #这里就是利用这次的预测 输出 作为下一次decoder的输入了
            decoder_input = decoder_input.cuda() if use_cuda else decoder_input

            loss += criterion(decoder_output, target_variable[di])
            if ni == EOS_token: #如果ni就是 EOS_token值了，就可以直接退出了
                break
    # 反向传递损失
    loss.backward()
    # 更新整个网络模型的参数
    encoder_optimizer.step()
    decoder_optimizer.step()
    # 该方法是训练过程，训练过程仅输出了训练的损失，并不提供翻译得到的句子，会有专门
    # 的方法来实施翻译过程。
    return loss.item() / target_length #返回训练中的平均loss数值

#下面是2个用来计时的辅助函数：
import time
import math

def asMinutes(s): #将输入数值转换为 几分 几秒返回
    m = math.floor(s / 60)
    s -= m * 60
    return '%dm %ds' % (m, s)  

def timeSince(since, percent): #
    now = time.time()  #现在的时间
    s = now - since    #相对的时间
    es = s / (percent) #。。。算了，先不管了，回头来看看
    rs = es - s
    return '%s (- %s)' % (asMinutes(s), asMinutes(rs))

#这里才是正真的 train多次的 情况：
def trainIters(encoder, decoder, n_iters, print_every=1000, plot_every=100, learning_rate=0.01): #每隔1000print一次，每隔100话一次
    start = time.time()   #启动计时
    plot_losses = []      #保存需要绘制的loss
    print_loss_total = 0  #Reset every print_every 设置loss采样频率
    plot_loss_total = 0   #Reset every plot_every
    # 声明两个RNN的优化器
    encoder_optimizer = optim.SGD(encoder.parameters(), lr=learning_rate)
    decoder_optimizer = optim.SGD(decoder.parameters(), lr=learning_rate)
    # 得到训练使用的数据
    training_pairs = [variablesFromPair(random.choice(pairs))
                      for i in range(n_iters)] #获取pairs总共多少对，然后每一对拆分为2个数组-感觉training_pair[2][n_iters][-]
    # 损失计算方法
    criterion = nn.NLLLoss() #一个少了softmax、log的crossEntropy

    # 循环训练，迭代的次数
    for iter in range(1, n_iters + 1): #总共n_iters对句子 ， 果然之前定义的那个train函数只能用在1个train循环种
        training_pair = training_pairs[iter - 1] #获取输入句子的词汇数组 和 输出label的词汇数组
        input_variable = training_pair[0]
        target_variable = training_pair[1]

        loss = train(input_variable, target_variable, encoder,
                     decoder, encoder_optimizer, decoder_optimizer, criterion) #对这一对句子input 和 label调用train得到loss
        print_loss_total += loss #总print_loss+total加上
        plot_loss_total += loss

        #每隔1000输出一次平均loss
        if iter % print_every == 0:
            print_loss_avg = print_loss_total / print_every #计算这一轮（1000个句子对）的平均loss
            print_loss_total = 0 #置零
            print('%s (%d %d%%) %.4f' % (timeSince(start, iter / n_iters),
                                         iter, iter / n_iters * 100, print_loss_avg)) #用来多少时间，计算了多少对，完成了百分之几，平均loss
        
        #每个100输出一次平均loss
        if iter % plot_every == 0:
            plot_loss_avg = plot_loss_total / plot_every #计算平均loss
            plot_losses.append(plot_loss_avg)  #加到plot_loss_avg数组种，用于绘制 折线图
            plot_loss_total = 0 #置零，等下一轮用

    showPlot(plot_losses) #这个画图函数在下面会进行定义的

import matplotlib.pyplot as plt
import matplotlib.ticker as ticker
import numpy as np

def showPlot(points):
    plt.figure()   
    fig, ax = plt.subplots()
    # this locator puts ticks at regular intervals
    loc = ticker.MultipleLocator(base=0.2)
    ax.yaxis.set_major_locator(loc)
    plt.plot(points)   #反正就是绘制折线图，先不管了这里

#evaluate 部分的代码：
def evaluate(encoder, decoder, sentence, max_length=MAX_LENGTH):
    # 把sentence转化为网络可以接受的输入，同时初始化编码器的隐藏状态
    input_variable = variableFromSentence(input_lang, sentence) #获取输入句子的词汇数组 ，
    input_length = input_variable.size()[0]
    encoder_hidden = encoder.initHidden()
    # 准备编码器输出变量
    encoder_outputs = Variable(torch.zeros(max_length, encoder.hidden_size)) #获取一个max_length*hidden_size的数组
    encoder_outputs = encoder_outputs.cuda() if use_cuda else encoder_outputs

    # 得到编码的输出 
    for ei in range(input_length):  #？？？为什么，难道有多个是1个个词汇进行的encoder,what
        encoder_output, encoder_hidden = encoder(input_variable[ei],
                                                 encoder_hidden)   
        encoder_outputs[ei] = encoder_outputs[ei] + encoder_output[0][0]

    # 准备解码器输出的变量
    decoder_input = Variable(torch.LongTensor([[SOS_token]]))  # SOS
    decoder_input = decoder_input.cuda() if use_cuda else decoder_input

    # 编码器和解码器之间的桥梁:Context
    decoder_hidden = encoder_hidden
    # 准备一个列表来保存网络预测的词语
    decoded_words = []
    # 准备一个变量保存解码过程中产生的注意力数据
    decoder_attentions = torch.zeros(max_length, max_length)

    # 解码过程，有一个最大长度限制
    for di in range(max_length):
        decoder_output, decoder_hidden, decoder_attention = decoder(
            decoder_input, decoder_hidden, encoder_output, encoder_outputs)
        
        decoder_attentions[di] = decoder_attention.data
        topv, topi = decoder_output.data.topk(1)
        ni = topi[0][0]
        if ni == EOS_token:
            decoded_words.append('')
            break
        else:
            decoded_words.append(output_lang.index2word[ni])
        # 解码器的输出作为其输入 , 这里就不用 teacher forcing了
        decoder_input = Variable(torch.LongTensor([[ni]]))
        decoder_input = decoder_input.cuda() if use_cuda else decoder_input
    # 返回预测的单词，以及注意力机制（供分析注意力机制）
    return decoded_words, decoder_attentions[:di + 1]

#观察其中某10个句子的预测情况
def evaluateRandomly(encoder, decoder, n=10):
    for i in range(n):
        pair = random.choice(pairs) #随机选1对句子
        print('>', pair[0])
        print('=', pair[1])
        output_words, attentions = evaluate(encoder, decoder, pair[0]) #对pair进行evalute预测
        output_sentence = ' '.join(output_words) #输出的翻译结果存到output_sentence,并输出
        print('<', output_sentence)
        print('')

    #下面的三行代码在之前介绍过
hidden_size = 256
encoder1 = EncoderRNN(input_lang.n_words, hidden_size)
attn_decoder1 = AttnDecoderRNN(hidden_size, output_lang.n_words,1, dropout_p=0.1)
# 支持cuda计算
if use_cuda:
    encoder1 = encoder1.cuda()
    attn_decoder1 = attn_decoder1.cuda()

# 核心的训练代码仅此一句
trainIters(encoder1, attn_decoder1, 75000, print_every=5000)
#自己笔记本的cpu上面根本跑不动，还是用kaggle试一试
#之前在这里发生错误的原因，就是他们老是使用 老版本的loss.data[0]这个已经不能用了，而应该改用loss.item()

#查看随机翻译10个句子的结果
evaluateRandomly(encoder1, attn_decoder1)
#这里有点奇怪，明明应该用test_Data,不过它还是在用同一个train_data

三、实验结果：

1.这就是在train上面的loss的变化结果了：（这个代码有值得后期继续改进的地方就是，整个data没有分出一部分来作为 validation，也没有利用validation进行翻译）

后期继续改进吧，。。。。。。

你可能感兴趣的:(人工智能,机器翻译,人工智能,自然语言处理)

2025年AI免费大战：从DeepSeek到GPT-5的商业逻辑与行业变革听吉米讲故事人工智能 gpt deepseek 开源
引言：人工智能行业的2025年重大转折2025年伊始，人工智能行业的竞争格局发生了深刻变化，尤其是以DeepSeek为代表的新兴力量，通过低成本开源策略迅速崛起，迫使OpenAI、百度文心一言等人工智能巨头纷纷调整策略，甚至开放免费服务。这场"AI免费大战"不仅重新定义了人工智能行业的商业逻辑，也对企业的技术研发和商业化提出了全新的挑战。本文将从DeepSeek的低成本策略入手，剖析AI免费模式背
快速入门 DeepSeek-R1 大模型米丝梨
国内最新的神级人工智能模型已经正式发布，没错，它就是备受瞩目的DeepSeek-R1大模型。今天，我们将对DeepSeek进行一个简单的了解，并探索如何快速使用和部署这个强大的工具。值得一提的是，DeepSeek已经开源，您可以随意下载和使用它。DeepSeek的官方网站地址如下：https://www.deepseek.com/API文档的详细地址请访问：https://api-docs.dee
人工智能之数学基础：线性空间每天五分钟玩转人工智能机器学习深度学习之数学基础人工智能深度学习线性代数线性空间神经网络
本文重点本文我们将讲解线性空间的知识，它不仅是数学中非常重要的知识点，它在机器学习和深度学习中的价值也是非常重要的，在机器学习和深度学习中是可以通过线性空间来进行解释的。线性空间的直观理解线性空间可以看作是一个多维的“宇宙”，其中的“点”由向量表示，而“运动”则通过向量的加法和数乘来实现。这个宇宙中的每一个向量都可以看作是从原点出发到该点的一条有向线段，而线性空间的维度则决定了这个宇宙的大小和复杂
deepseek与gpt，核心原理对比 test猿 gpt
DeepSeek与GPT作为AI大模型，在自然语言处理等领域展现出强大的能力，它们的核心原理对比主要体现在模型架构、训练策略、资源效率以及应用场景优化等方面。一、模型架构DeepSeek混合专家（MoE）框架：DeepSeek采用了混合专家框架，其内部包含多个“专家”子模块，每个子模块专注于不同的任务或数据领域。例如，DeepSeek-R1拥有6710亿参数，但每次仅激活约370亿参数，通过动态选
AI驱动的知识发现：程序员的新机遇 AI大模型应用之禅计算机软件编程原理与应用实践 java python javascript kotlin golang 架构人工智能
AI驱动的知识发现：程序员的新机遇关键词：知识发现,AI驱动,数据挖掘,数据分析,算法优化,数据可视化,机器学习1.背景介绍1.1问题由来在当今信息化时代，数据量呈爆炸性增长，各行各业都面临着海量数据挖掘和知识发现的巨大挑战。传统的统计分析方法已难以满足需求，而人工智能（AI）技术的兴起为这一问题提供了新的解决方案。AI驱动的知识发现，即利用机器学习、深度学习等技术手段，从海量数据中自动提取有用信
教育小程序+AI出题：如何通过自然语言处理技术提升题目质量万岳科技系统开发人工智能小程序自然语言处理
随着教育科技的飞速发展，教育小程序已经成为学生与教师之间互动的重要平台之一。与此同时，人工智能（AI）和自然语言处理（NLP）技术的应用正在不断推动教育内容的智能化。特别是在AI出题系统中，如何通过NLP技术提升题目质量，成为教育领域中的一个重要课题。本文将介绍如何利用自然语言处理技术，通过AI出题系统自动生成高质量、个性化的题目，提升教育小程序的交互性与教学效果。一、自然语言处理（NLP）概述自
【Python】解决PyTorch报错：PytorchStreamReader failed reading zip archive: failed finding central的解决方案 I'mAlex python pytorch 开发语言
在使用PyTorch时，遇到“PytorchStreamReaderfailedreadingziparchive:failedfindingcentral”错误通常是由于损坏的模型文件或不兼容的文件版本导致的。这种问题在加载模型或数据时比较常见。以下是一些排查和解决该问题的步骤。博主简介：现任阿里巴巴嵌入式技术专家，15年工作经验，深耕嵌入式+人工智能领域，精通嵌入式领域开发、技术管理、简历招聘
《DeepSeek Janus Pro 7B：多模态人工智能大模型部署全攻略》空云风语神经网络人工智能深度学习人工智能
《DeepSeekJanusPro7B：多模态人工智能大模型部署全攻略》引言：开启多模态AI新世界在科技飞速发展的当下，多模态AI已成为人工智能领域中最耀眼的明星，正以前所未有的速度改变着我们的生活与工作方式。从智能语音助手到图像识别系统，从自动驾驶汽车到智能医疗诊断，多模态AI的身影无处不在，它让机器能够理解和处理多种类型的信息，如文本、图像、音频等，从而实现更加智能、高效的交互。DeepSee
python 读取各类文件格式的文本信息:doc,html,mht,excel 北房有佳人手写功能 python读取doc文档 python读取mht python读取excel python读取html
引言众所周知,python最强大的地方在于，python社区汇总拥有丰富的第三方库，开源的特性，使得有越来越多的技术开发者来完善python的完美性。未来人工智能，大数据方向，区块链的识别和进阶都将以python为中心来展开。咳咳咳！好像有点打广告的嫌疑了。当前互联网信息共享时代，最重要的是什么?是数据。最有价值的是什么？是数据。最能直观体现技术水平的是什么?还是数据。所以，今天我们要分享的是：如
使用Python进行自然语言理解和意图识别毕业设计源码 sj52abcd python 课程设计开发语言毕业设计
博主介绍：✌专注于VUE,小程序，安卓，Java,python,物联网专业，有17年开发经验，长年从事毕业指导，项目实战✌选取一个适合的毕业设计题目很重要。✌关注✌私信我✌具体的问题，我会尽力帮助你。研究的背景:随着人工智能的发展，自然语言处理成为了人工智能领域的一个重要分支。在自然语言处理中，理解用户的意图是非常关键的一步。随着Python语言的广泛应用，Python成为了许多自然语言处理任务的
DeepSeek惊雷：一场席卷全球的AI产业变革正在上演 Light60 AI应用理念篇人工智能 DeepSeek 技术创新商业模式产业变革鲶鱼效应
摘要本文深入剖析了DeepSeek在全球人工智能领域引发的重大变革。从技术创新、商业模式到产业影响，全方位解读了这家中国AI企业如何通过颠覆性创新重塑产业格局。文章探讨了DeepSeek对全球AI竞争格局的影响，以及其在推动中国AI产业从"跟随创新"向"范式创新"转变过程中的关键作用。同时，结合最新市场动态，分析了这一"鲶鱼效应"对未来AI产业发展的深远影响。关键词：DeepSeek；人工智能；技
python做智能机器人客服_Python1707A学员感想：我还想做个人工智能客服机器人 DuckMan电板鸭 python做智能机器人客服
原标题：Python1707A学员感想：我还想做个人工智能客服机器人通过这次做项目，使我对编程有了进一步的认识。做项目的时候，最重要的不是自己如何快速地将自己分配的任务做完，而是要注重团队合作。一开始组内必须对这个项目的数据库的命名进行讨论，定义表的属性的数据类型，表与表之间会有关联，所以有的属性的类型与长度必须定义一致，这样访问数据库时才不会出错。如果一开始不将这些步骤统一下来的话，就会给后面的
【C语言】判断闰年由if()语句判断实现 | C语言面试：C语言中的浮点数如何存储和计算？| 浮点数的存储格式，浮点数的编码规则，浮点数的计算规则追光者♂ C语言 C++Java百宝书(实例+解析)c语言闰年 ifelse 判断闰年 C语言面试浮点数的存储和计算浮点数
“往往在逃避命运的路上，却与之不期而遇。”作者主页：追光者♂个人简介：[1]计算机专业硕士研究生[2]2023年城市之星领跑者TOP1(哈尔滨)[3]2022年度博客之星人工智能领域TOP4[4]阿里云社区特邀专家博主[5]CSDN-人工智能领域优质创作者
Node.js调用DeepSeek Api 实现本地智能聊天的简单应用 phper8 node.js
在人工智能快速发展的今天，如何快速构建一个智能对话应用成为了开发者们普遍关注的话题。本文将为大家介绍一个基于Node.js的命令行聊天应用，它通过调用硅基流动（SiliconFlow）的API接口，实现了与DeepSeek模型的智能对话功能。这个项目不仅实现了流式响应输出，还提供了对话记录的自动保存功能，是一个非常实用的AI对话工具。代码下载：https://gitee.com/phpervip/
大模型prompt实例：知识库信息质量校验模块写代码的中青年大模型 prompt 人工智能 python 大模型 LLM
大模型相关目录大模型，包括部署微调prompt/Agent应用开发、知识库增强、数据库增强、知识图谱增强、自然语言处理、多模态等大模型应用开发内容从0起步，扬帆起航。大模型应用向开发路径：AI代理工作流大模型应用开发实用开源项目汇总大模型问答项目问答性能评估方法大模型数据侧总结大模型token等基本概念及参数和内存的关系大模型应用开发-华为大模型生态规划从零开始的LLaMA-Factory的指令增
读懂AI Agent：基于大模型的人工智能代理姚瑞南 AI行业产品调研 AI行业资讯大模型落地探索及agent搭建人工智能机器人自然语言处理 AIGC chatgpt AI作画
本文原创作者：姚瑞南AI-agent大模型运营专家，先后任职于美团、猎聘等中大厂AI训练专家和智能运营专家岗；多年人工智能行业智能产品运营及大模型落地经验，拥有AI外呼方向国家专利与PMP项目管理证书。（转载需经授权）目录⼀、背景介绍⼆、Agent概述三、工作原理⼀、背景介绍⼤语⾔模型的浪潮推动了AIAgent相关研究快速发展，AIAgent是当前通往AGI的主要探索路线。⼤模型庞⼤的训练数据集中
3. 意图分类prompt优化项目（实操版）姚瑞南 prompt系列课程 prompt实战应用案例分类 prompt 人工智能 AIGC
本文原创作者：姚瑞南AI-agent大模型运营专家，先后任职于美团、猎聘等中大厂AI训练专家和智能运营专家岗；多年人工智能行业智能产品运营及大模型落地经验，拥有AI外呼方向国家专利与PMP项目管理证书。（转载需经授权）本文简介：意图分类prompt优化项目（实操版）项目背景项目现状和目标意图识别prompt分析制定优化策略prompt调优效果及收益评估目录1.项目背景2.指标现状3.业务目标4.问
Badcase归因分析“四部曲” 姚瑞南工作通用方法论算法人工智能机器学习
本文原创作者：姚瑞南AI-agent大模型运营专家，先后任职于美团、猎聘等中大厂AI训练专家和智能运营专家岗；多年人工智能行业智能产品运营及大模型落地经验，拥有AI外呼方向国家专利与PMP项目管理证书。（转载需经授权）目录一、什么是badcase？二、为什么要做badcase分析？三、如何做badcase分析？一、什么是badcase？badcase是业内的专业名词，简单解释一下。bad是坏，ca
【prompt示例】智能客服+智能质检业务模版姚瑞南 prompt实战应用案例 prompt 前端
本文原创作者：姚瑞南AI-agent大模型运营专家，先后任职于美团、猎聘等中大厂AI训练专家和智能运营专家岗；多年人工智能行业智能产品运营及大模型落地经验，拥有AI外呼方向国家专利与PMP项目管理证书。（转载需经授权）整体结构说明：序号结构说明备注1prompt主体提示词主体主要包含定义角色+背景描述+目标+输出内容2变量变量主要提取知识库文档流程里涉及的⼀些判断项，需要接口的部分3注意事项常规注
《深度Q网络优化：突破高维连续状态空间的束缚》人工智能深度学习
在人工智能的发展历程中，深度Q网络（DQN）作为强化学习与深度学习融合的关键成果，为解决复杂决策问题开辟了新路径。但当面对高维连续状态空间时，DQN会出现训练不稳定、收敛速度慢等问题，严重限制了其应用范围。如何优化DQN以适应高维连续状态空间，成为当下研究的热点。深度Q网络基础回顾深度Q网络结合了深度学习强大的特征提取能力与Q学习的决策优化思想。在传统强化学习中，Q学习通过Q表记录每个状态-动作对
智享AI直播三代系统，开启「机器人比人更会带货」时代！缘分开始t621238 人工智能机器人
智享AI直播三代系统，开启「机器人比人更会带货」时代！在当今数字化浪潮汹涌的时代，直播行业作为电商领域的重要驱动力，正经历着前所未有的变革。近日，智享AI直播三代系统的横空出世，宛如一颗重磅炸弹，在直播行业掀起了惊涛骇浪，正式开启了「机器人比人更会带货」的全新时代。一、技术革新，颠覆传统直播模式智享AI直播三代系统的诞生，标志着直播行业进入了智能化的新纪元。它融合了先进的人工智能技术，包括深度学习
【python语言应用】最新全流程Python编程、机器学习与深度学习实践技术应用（帮助你快速了解和入门 Python）赵钰老师 python 机器学习深度学习 python 机器学习深度学习数据分析人工智能
近年来，人工智能领域的飞速发展极大地改变了各个行业的面貌。当前最新的技术动态，如大型语言模型和深度学习技术的发展，展示了深度学习和机器学习技术的强大潜力，成为推动创新和提升竞争力的关键。特别是PyTorch，凭借其灵活性和高效性，成为科研人员和工程师的首选工具。理解和掌握深度学习的基础知识，深入了解其与经典机器学习算法的区别与联系，并系统掌握包括迁移学习、循环神经网络（RNN）、长短时记忆网络（L
人工智能爆火下，关于软件技术专业的发展思考 yzx991013 人工智能
软件技术专业作为信息技术领域的核心学科，其发展方向始终与技术进步和社会需求紧密相关。以下是软件技术专业未来发展的关键方向及学习建议：一、技术方向与前沿领域1.云原生与分布式架构方向：云原生技术（Kubernetes、Docker、Serverless）、微服务架构、分布式系统设计。原因：企业全面上云已成趋势，需要高效、弹性的云原生解决方案。学习建议：掌握AWS/Azure/GCP等云平台，学习服务
数字化转型三大核心要素：数据、技术、人才千千标寻大数据云计算人工智能 ai
数字化转型的三大核心要素——数据、技术和人才，是推动企业在数字经济时代取得成功的关键。数据数据是数字化转型的基础。高质量的数据能够为企业提供深刻的市场洞察和客户行为分析，帮助做出更明智的决策。通过有效管理和利用数据，企业可以优化运营流程，提升产品和服务质量，从而实现更高的效率和客户满意度。技术先进的技术支持是实现数字化转型的关键驱动力。无论是云计算、人工智能、大数据分析还是物联网，这些前沿技术的应
【Java】已解决：java.util.concurrent.ExecutionException 屿小夏 java 开发语言 android
个人简介：某不知名博主，致力于全栈领域的优质博客分享|用最优质的内容带来最舒适的阅读体验！文末获取免费IT学习资料！文末获取更多信息精彩专栏推荐订阅收藏专栏系列直达链接相关介绍书籍分享点我跳转书籍作为获取知识的重要途径，对于IT从业者来说更是不可或缺的资源。不定期更新IT图书，并在评论区抽取随机粉丝，书籍免费包邮到家AI前沿点我跳转探讨人工智能技术领域的最新发展和创新，涵盖机器学习、深度学习、自然
数字人技术在短视频中的应用 AGI大模型与大数据研究院 DeepSeek R1 &大数据AI人工智能 java python javascript kotlin golang 架构人工智能
数字人、短视频、人工智能、计算机视觉、自然语言处理、虚拟主播、内容创作1.背景介绍短视频作为一种新兴的传播媒介，其内容形式丰富、传播速度快、用户粘性强，已成为当今互联网领域最热门的应用之一。随着技术的不断发展，数字人技术逐渐成熟，并开始在短视频领域得到广泛应用。数字人是指利用计算机技术模拟真实人类形象和行为的虚拟角色，其具备逼真的外形、流畅的肢体动作和自然的语言表达能力。数字人技术在短视频领域的应
强化学习在机器人控制中的应用：从理论到实践 Echo_Wish 前沿技术人工智能机器人
强化学习在机器人控制中的应用：从理论到实践大家好，我是你们熟悉的人工智能与Python领域自媒体创作者Echo_Wish。今天我们来聊聊一个炙手可热的话题——强化学习在机器人控制中的应用。近年来，随着人工智能技术的飞速发展，机器人在各个领域的应用越来越广泛。而强化学习作为一种重要的机器学习方法，为机器人控制提供了强有力的技术支持。接下来，让我们一起探讨强化学习在机器人控制中的原理和实践，并通过具体
探索工业物联网平台：智能制造的未来 Echo_Wish Python进阶物联网制造
探索工业物联网平台：智能制造的未来大家好，我是你们熟悉的人工智能与Python领域自媒体创作者Echo_Wish。今天我们来聊聊一个热门话题：工业物联网平台（IndustrialInternetofThings,IIoT）。工业物联网平台在智能制造中的应用正日益广泛，帮助企业实现数据驱动的生产、优化运营效率，并推动工业4.0的发展。那么，工业物联网平台到底是什么，又该如何实现呢？今天就让我们一探究
本地部署的DeepSeek-R1-32B与DeepSeek-R1-7B模型效果对比 MaxCode-1 搭建本地gpt Deepseek
本地部署的DeepSeek-R1-32B与DeepSeek-R1-7B模型效果对比在当今人工智能快速发展的时代，大语言模型（LargeLanguageModel,LLM）的应用场景日益广泛。无论是企业级应用还是个人开发，本地部署大语言模型已经成为一种趋势。DeepSeek-R1-32B和DeepSeek-R1-7B作为DeepSeek系列中的两个重要版本，分别代表了不同规模和性能的模型。本文将从多
Apache Iceberg 与 Apache Hudi：数据湖领域的双雄对决夜里慢慢行456 大数据大数据
在数据存储和处理不断发展的领域中，数据湖仓的概念已经崭露头角，成为了一种变革性的力量。数据湖仓结合了数据仓库和数据湖的最佳元素，提供了一个统一的平台，支持数据科学、商业智能、人工智能/机器学习以及临时报告等多种关键功能。这种创新的方法不仅促进了实时分析，还显著降低了平台成本，增强了数据治理，并加速了用例的实现。数据存储和处理的演变催生了被称为数据湖仓的现代分析平台。这些平台旨在解决传统架构的局限性
java杨辉三角 3213213333332132 java基础
package com.algorithm; /** * @Description 杨辉三角 * @author FuJianyong * 2015-1-22上午10:10:59 */ public class YangHui { public static void main(String[] args) { //初始化二维数组长度 int[][] y
《大话重构》之大布局的辛酸历史白糖_ 重构
《大话重构》中提到“大布局你伤不起”，如果企图重构一个陈旧的大型系统是有非常大的风险，重构不是想象中那么简单。我目前所在公司正好对产品做了一次“大布局重构”，下面我就分享这个“大布局”项目经验给大家。背景公司专注于企业级管理产品软件，企业有大中小之分，在2000年初公司用JSP/Servlet开发了一套针对中
电驴链接在线视频播放源码 dubinwei 源码电驴播放器视频 ed2k
本项目是个搜索电驴（ed2k）链接的应用,借助于磁力视频播放器（官网： http://loveandroid.duapp.com/ 开放平台），可以实现在线播放视频，也可以用迅雷或者其他下载工具下载。项目源码： http://git.oschina.net/svo/Emule,动态更新。也可从附件中下载。项目源码依赖于两个库项目，库项目一链接： http://git.oschina.
Javascript中函数的toString()方法周凡杨 JavaScript js toString function object
简述 The toString() method returns a string representing the source code of the function. 简译之，Javascript的toString()方法返回一个代表函数源代码的字符串。句法 function.
struts处理自定义异常 g21121 struts
很多时候我们会用到自定义异常来表示特定的错误情况，自定义异常比较简单，只要分清是运行时异常还是非运行时异常即可，运行时异常不需要捕获，继承自RuntimeException，是由容器自己抛出，例如空指针异常。非运行时异常继承自Exception，在抛出后需要捕获，例如文件未找到异常。此处我们用的是非运行时异常，首先定义一个异常LoginException: /** * 类描述：登录相
Linux中find常见用法示例 510888780 linux
Linux中find常见用法示例 ·find path -option [ -print ] [ -exec -ok command ] {} \; find命令的参数；
SpringMVC的各种参数绑定方式 Harry642 springMVC 绑定表单
1. 基本数据类型(以int为例，其他类似)： Controller代码： @RequestMapping("saysth.do") public void test(int count) { } 表单代码： <form action="saysth.do" method="post&q
Java 获取Oracle ROWID aijuans java oracle
A ROWID is an identification tag unique for each row of an Oracle Database table. The ROWID can be thought of as a virtual column, containing the ID for each row. The oracle.sql.ROWID class i
java获取方法的参数名 antlove java jdk parameter method reflect
reflect.ClassInformationUtil.java package reflect; import javassist.ClassPool; import javassist.CtClass; import javassist.CtMethod; import javassist.Modifier; import javassist.bytecode.CodeAtt
JAVA正则表达式匹配查找替换提取操作百合不是茶 java 正则表达式替换提取查找
正则表达式的查找;主要是用到String类中的split(); String str; str.split();方法中传入按照什么规则截取,返回一个String数组常见的截取规则: str.split("\\.")按照.来截取 str.
Java中equals()与hashCode()方法详解 bijian1013 java set equals()hashCode()
一.equals()方法详解 equals()方法在object类中定义如下： public boolean equals(Object obj) { return (this == obj); } 很明显是对两个对象的地址值进行的比较（即比较引用是否相同）。但是我们知道，String 、Math、I
精通Oracle10编程SQL(4)使用SQL语句 bijian1013 oracle 数据库 plsql
--工资级别表 create table SALGRADE ( GRADE NUMBER(10), LOSAL NUMBER(10,2), HISAL NUMBER(10,2) ) insert into SALGRADE values(1,0,100); insert into SALGRADE values(2,100,200); inser
【Nginx二】Nginx作为静态文件HTTP服务器 bit1129 HTTP服务器
Nginx作为静态文件HTTP服务器在本地系统中创建/data/www目录，存放html文件(包括index.html) 创建/data/images目录，存放imags图片在主配置文件中添加http指令 http { server { listen 80; server_name
kafka获得最新partition offset blackproof kafka partition offset 最新
kafka获得partition下标，需要用到kafka的simpleconsumer import java.util.ArrayList; import java.util.Collections; import java.util.Date; import java.util.HashMap; import java.util.List; import java.
centos 7安装docker两种方式 ronin47
第一种是采用yum 方式 yum install -y docker
java-60-在O(1)时间删除链表结点 bylijinnan java
public class DeleteNode_O1_Time { /** * Q 60 在O(1)时间删除链表结点 * 给定链表的头指针和一个结点指针(!!)，在O(1)时间删除该结点 * * Assume the list is: * head->...->nodeToDelete->mNode->nNode->..
nginx利用proxy_cache来缓存文件 cfyme cache
user zhangy users; worker_processes 10; error_log /var/vlogs/nginx_error.log crit; pid /var/vlogs/nginx.pid; #Specifies the value for ma
[JWFD开源工作流]JWFD嵌入式语法分析器负号的使用问题 comsci 嵌入式
假如我们需要用JWFD的语法分析模块定义一个带负号的方程式，直接在方程式之前添加负号是不正确的，而必须这样做： string str01 = "a=3.14;b=2.71;c=0;c-((a*a)+(b*b))" 定义一个0整数c,然后用这个整数c去
如何集成支付宝官方文档 dai_lm android
官方文档下载地址 https://b.alipay.com/order/productDetail.htm?productId=2012120700377310&tabId=4#ps-tabinfo-hash 集成的必要条件 1. 需要有自己的Server接收支付宝的消息 2. 需要先制作app，然后提交支付宝审核，通过后才能集成调试的时候估计会真的扣款，请注意
应该在什么时候使用Hadoop datamachine hadoop
原帖地址：http://blog.chinaunix.net/uid-301743-id-3925358.html 存档，某些观点与我不谋而合，过度技术化不可取，且hadoop并非万能。 --------------------------------------------万能的分割线-------------------------------- 有人问我，“你在大数据和Hado
在GridView中对于有外键的字段使用关联模型进行搜索和排序 dcj3sjt126com yii
在GridView中使用关联模型进行搜索和排序首先我们有两个模型它们直接有关联: class Author extends CActiveRecord { ... } class Post extends CActiveRecord { ... function relations() { return array( '
使用NSString 的格式化大全 dcj3sjt126com Objective-C
格式定义The format specifiers supported by the NSString formatting methods and CFString formatting functions follow the IEEE printf specification; the specifiers are summarized in Table 1. Note that you c
使用activeX插件对象object滚动有重影蕃薯耀 activeX插件滚动有重影
使用activeX插件对象object滚动有重影 <object style="width:0;" id="abc" classid="CLSID:D3E3970F-2927-9680-BBB4-5D0889909DF6" codebase="activex/OAX339.CAB#
SpringMVC4零配置 hanqunfeng springmvc4
基于Servlet3.0规范和SpringMVC4注解式配置方式，实现零xml配置，弄了个小demo，供交流讨论。项目说明如下： 1.db.sql是项目中用到的表，数据库使用的是oracle11g 2.该项目使用mvn进行管理，私服为自搭建nexus,项目只用到一个第三方 jar，就是oracle的驱动； 3.默认项目为零配置启动，如果需要更改启动方式，请
《开源框架那点事儿16》：缓存相关代码的演变 j2eetop 开源框架
问题引入上次我参与某个大型项目的优化工作，由于系统要求有比较高的TPS，因此就免不了要使用缓冲。该项目中用的缓冲比较多，有MemCache，有Redis，有的还需要提供二级缓冲，也就是说应用服务器这层也可以设置一些缓冲。当然去看相关实现代代码的时候，大致是下面的样子。 [java] view plain copy print ? public vo
AngularJS浅析 kvhur JavaScript
概念 AngularJS is a structural framework for dynamic web apps. 了解更多详情请见原文链接：http://www.gbtags.com/gb/share/5726.htm Directive 扩展html，给html添加声明语句，以便实现自己的需求。对于页面中html元素以ng为前缀的属性名称，ng是angular的命名空间
架构师之jdk的bug排查(一)---------------split的点号陷阱 nannan408 split
1.前言. jdk1.6的lang包的split方法是有bug的,它不能有效识别A.b.c这种类型,导致截取长度始终是0.而对于其他字符,则无此问题.不知道官方有没有修复这个bug. 2.代码 String[] paths = "object.object2.prop11".split("'"); System.ou
如何对10亿数据量级的mongoDB作高效的全表扫描 quentinXXZ mongodb
本文链接: http://quentinXXZ.iteye.com/blog/2149440 一、正常情况下，不应该有这种需求首先，大家应该有个概念，标题中的这个问题，在大多情况下是一个伪命题，不应该被提出来。要知道，对于一般较大数据量的数据库，全表查询，这种操作一般情况下是不应该出现的，在做正常查询的时候，如果是范围查询，你至少应该要加上limit。说一下，
C语言算法之水仙花数 qiufeihu c 算法
/** * 水仙花数 */ #include <stdio.h> #define N 10 int main() { int x,y,z; for(x=1;x<=N;x++) for(y=0;y<=N;y++) for(z=0;z<=N;z++) if(x*100+y*10+z == x*x*x
JSP指令 wyzuomumu jsp
jsp指令的一般语法格式： <%@ 指令名属性 =”值 ” %> 常用的三种指令： page,include,taglib page指令语法形式： <%@ page 属性 1=”值 1” 属性 2=”值 2”%> include指令语法形式： <%@include file=”relative url”%> (jsp可以通过 include