算法菜鸟飞高高

show,attend and tell(image caption论文复现总结)

论文中的核心思想

GitHub上的Image-Caption项目https://github.com/sgrvinod/a-PyTorch-Tutorial-to-Image-Captioning

研究的问题—Image Caption

为图片自动生成caption的任务类似于场景理解，这是cv领域的一个核心问题。要想解决这个问题，不仅要求你的模型能够识别出图片中有什么物体，还得能够将图片中出现的场景与自然语言相联系。问题的核心是模仿人类将大量重要的视觉信息压缩成一句抽象的描述性语言。

解决问题的思路

2014年左右由于AlexNet,VGGNet等深度卷积神经网络的出现，使得Image Caption成为了一项研究的热点。一种新的解决问题的范式是，利用CNN当作提取图像特征向量的Encoder，RNN通过传递过来的特征向量decode出自然语言序列。本篇论文这种解决问题的思路之上增加了attention机制，对feature map每个像素点进行概率的估计，再进行加权求和。这种思想来自于，人们在观察图像中倾向于关注那些有用的信息，而忽略掉大量无用的信息。
至此我们确定复现该论文的基本思想是CNN + LSTM （RNN的变体）+ Attention.

本篇文章的主要贡献

提出了两种基于attention的Image Caption生成器，本篇博文介绍的是能够利用BP算法训练的确定性的attention机制
可视化了attention在每个time step上focus的点
量化了加入attention机制以后网络在Flickr8k,Flickr30k,MS COCO的性能

模型细节

Encoder

使用CNN来提取出L个的特征向量 $\bold a$ ，每个向量都代表了一个feature map:
$\bold a = \{a_1,a_2,...,a_L\},a_i ∈R^D$
这一部分很容易实现，我们可以利用VGGNet，Inception等已经在ImageNet上预训练好的CNN，将最后的flatten操作和全连接层去掉，直接得到一个feature map set。

Decoder

使用了LSTM来在每个time step上生成一个word，LSTM的输入是被上一个time step的hidden state和cell state以及当前的context向量，而LSTM的输出是这一时刻的hidden_state和cell_state。

Attention

attention在这个模型中的作用就是生成Decoder每一个time step的context向量。利用CNN提取出来的L个特征向量 $\bold a$ 以及LSTM输出的 $\bold h_{t-1}$ 通过三个线性层以及一个softmax操作算出每一个像素点成为预测这个time step word的概率，再利用这个概率值对 $\bold a$ 加权求和输出。输出的向量与上一个time step的词向量进行拼接操作，作为这一时刻的context向量

模型代码的复现

Encoder的实现

这里的Encoder中使用的是预训练好的resnet101，去除了最后两层的flatten，fully_connected_network,最后得到了2048个特征图

# models.py
import torch
from torch import nn
import torchvision
class Encoder(nn.Module):
	def __init__(self,img_size=14):
		#img_size决定了最后feature map的宽高是多少，这里默认是 14 * 14
		super().__init__()
		resnet = torchvision.models.resnet101(pretrained=True)#加载预训练的模型
		modules = list(resnet.children())[:-2] #children本身对应的是个generator，转换成list之后丢弃最后的两项
		self.resnet = nn.Sequential(*modules) #利用自带的序列容器将modules逐个装入
		self.adaptive_pool = nn.AdaptiveAvgPool2d((img_size,img_size))#因为不确定输入图片的大小，使用自适应的池化层将特征图转化成固定的大小
	def forward(self,images):
		#images:shape[batch_size,3,height,width]
		out = self.resnet(images)
		out = self.adaptive_pool(out) #[batch_size,2048,img_size,img_size]
		out = out.permute(0,2,3,1)#将轴的顺序做下调整，方便后面的计算#[batch_size,img_size,img_size,2048]
		return out

这里随机生成了一个batch的数据，输出的数据的shape与一开始的推测是一致的

Attention的实现

# models.py
class Attention(nn.Module):
	def __init__(self,encode_dim,decode_dim,attention_dim):
		super().__init__()
		#对象属性的初始化
		self.encode_dim = encode_dim
		self.decode_dim = decode_dim
		self.attention_dim = attention_dim
		
		self.e_att = nn.Linear(encode_dim,attention_dim)#将cnn输出的feature转换成特定维度的线性层
		self.d_att = nn.Linear(decode_dim,attention_dim) #将decode输出的hidden_state转换成特定维度的线性层
		self.ful_att = nn.Linear(attention_dim,1)
		self.softmax = nn.Softmax(dim=1)
		self.relu = nn.ReLU()
	def forward(self,encoder_out,hidden_state):
		#encoder_out [batch_size,196,encoder_dim],196代表特征图上的196个像素点
		att1 = self.e_att(encoder_out) #[batch_size 196,attention_dim]
		att2 = self.d_att(hidden_state)#[batch_size,attention_dim]
		att = self.ful_att(self.relu(att1 + att2.unsqueeze(1)))#[batch_size,196,1]
		att = att.squeeze(2)
		alpha = self.softmax(att)#[batch_size,196] #每个像素的概率被计算出来了
		awe = (encoder_out * alpha.unsqueeze(2)).sum(dim=1)#每个像素点加权求和
		return awe,alpha

Decoder的实现

# models.py
class Decoder(nn.Module):
    def __init__(self,encode_dim,decode_dim,attention_dim,embed_dim,vocab_size,dropout):
        super().__init__()
        self.encode_dim = encode_dim #feature map的个数
        self.decode_dim = decode_dim #decoder的向量维数
        self.attention_dim = attention_dim #设计的神经网络神经元的个数
        self.vocab_size = vocab_size #词典的大小
        self.embed_dim = embed_dim #每个词向量的维度大小
        
        self.attention = Attention(encode_dim,decode_dim,attention_dim)
        self.embeddings = nn.Embedding(vocab_size,embed_dim)
        self.dropout = nn.Dropout(p=dropout)
        self.sigmoid = nn.Sigmoid()
        self.fc = nn.Linear(decode_dim,vocab_size)
        self.f_beta = nn.Linear(decode_dim,encode_dim)
        self.init_h = nn.Linear(encode_dim,decode_dim)
        self.init_c = nn.Linear(encode_dim,decode_dim)
        self.lstm = nn.LSTMCell((encode_dim + embed_dim),decode_dim)
        self.init_weight() #对一些参数进行初始化
        pass
    def init_weight(self):
        self.embeddings.weight.data.uniform_(-0.1, 0.1)
        self.fc.bias.data.fill_(0)
        self.fc.weight.data.uniform_(-0.1, 0.1)

    def init_hidden(self,encoder_out):
        #encoder_out[batch_size,num_pixels,encode_dim]
        mean_encoder_out = encoder_out.sum(dim=1)#shape [batch_size,encode_dim]
        h = self.init_h(mean_encoder_out)
        c = self.init_c(mean_encoder_out)
        return h, c
    def forward(self,encoder_out,encode_captions,caplens):
        """
        encoder_out:shape[batch_size,img_size,img_size,encoder_dim]
        encoder_captions是被序列化的caption[batch_size,max_len] max_len表示所有caption被填充到统一长度
        caplens [batch_size,1]每个caption对应的长度
        """
        #将高和宽的轴展开，看作height * width个像素点
        batch_size = encoder_out.size(0)
        encoder_out = encoder_out.reshape(batch_size,-1,self.encode_dim) #[batch_size,num_pixels,encoder_dim]
        num_pixels = encoder_out.size(1)
        #将输入数据进行降序排序,这里排序的目的是为了后面在每个时间步进行decode时方便，具体作用在后面代码解释
        caplens,sort_ind = caplens.view(-1).sort(dim = 0,descending=True)
        encoder_out = encoder_out[sort_ind]
        encode_captions = encode_captions[sort_ind]
        
        embeddings = self.embeddings(encode_captions)#shape[batch_size,max_len,embed_dim]
        #hidden_state和cell_state的初始状态由encoder_out通过两个全连接神经网络来获得
        h,c = self.init_hidden(encoder_out)
        
        #这里经过编码的caption是 《start》 + 原先序列长度 + 《end》，而我们decode的时候start不需要，所以需要的时间步减1
        decode_length = (caplens - 1).tolist()
        
        predictions = torch.ones(batch_size,max(decode_length),self.vocab_size)
        alphas = torch.ones(batch_size,max(decode_length),num_pixels)
        for t in range(max(decode_length)):
            """
            这里说明一下前面进行降序排列的原因，因为每个caption的实际长度不一样（caplens中进行了记录），所以decode的长度也不一样，
            显然，caption越长，decode的长度就越长，下面的batch_size_t就是统计本次时间步还有多少需要decode，而需要decode都在序列的    前面
            """
            batch_size_t = sum([l > t for l in decode_length])#统计本次时间步前多少需要decode
            awe,alpha = self.attention(encoder_out[:batch_size_t],h[:batch_size_t])
            gate = self.sigmoid(self.f_beta(h[:batch_size_t]))#[batch_size,encode_dim] 门单元，决定awe那些像素点本次被需要
            awe = awe * gate
            context = torch.cat([awe,embeddings[:batch_size_t,t,:]],dim=1)#[batch_size,encode_dim + embed_dim]
            h,c = self.lstm(
                context,(h[:batch_size_t],c[:batch_size_t])
            )
            preds = self.fc(self.dropout(h)) #[batch_size,vocab_size]本次预测的结果，词表中的每一个单词都有一个对应的概率
            predictions[:batch_size_t,t,:] = preds
            alphas[:batch_size_t,t,:] = alpha
        return predictions,encode_captions,decode_length,alphas,sort_ind
        pass

所用数据集的介绍

论文中提到了三个标准数据集Flickr8k,Flickr30k,MS COCO,为了方便起见，我使用的是较小的Flickr8k数据集
Flickr8k的图片文件名和所对应的caption用一个json文件保存了起来，json文件大概格式如下

”“”
json文件中除了images以外的字段这个项目用不到就没有列出，images中sentences和split以及filename字段比较重要
split表示的是数据集划分{'train','val','test'}
{
    "images":[
        {
            "sentids":[0,1,2,3,4],
            "imgid":0,
            "sentences":[
                {
                    "tokens":["a","black","dog"],
                    "raw":...,
                    "imgid":0,
                    "sentid":0
                }
            ]，
            "split":"train",
            "filename":"...."
        },

    ]，
    
}

“”“

接下来我们处理文件需要完成下面几个目标：
1.将所有图片通过文件名读入并保存成一个hdf5文件，这么做的原因是从磁盘中读入一个整体的文件效率更高，而一张张从文件夹中读取图片效率太低了。
2.遍历每张图片对应的sentences数组，其中的token是已经做了分词的caption，如果caption的长度小于最大长度（如我们不能让caption的长度超过100），我们将其保存到该图片对应的caption数组中。最后保证每个image都有对应的5个caption，如果不够就随机重复，如果超过就sample来随机抽取5个。
3.在读入caption构建一个词频表，最后将词频低于最小阈值的单词删除，并建立一张word_map的字典
4.将caption数组，word_map,caplens用json格式进行保存

# utils.py
from imageio import imread
from PIL import Image
def create_input_file(image_folder,json_path,out_folder,cap_per_image = 5,min_word_freq = 5,max_len = 48):
    """
    image_folder:image文件夹所在的路径
    json_path json文件的完整路径
    out_folder输出的文件保存在哪儿
    cap_per_image 每张图片应该有多少caption
    min_word_freq最小词频
    max_len caption中token最多数
    """
    #把所需要的json格式文件加载进来
    with open(json_path,'r') as j:
        data = json.load(j)
    images = data['images']
    train_images_list = []
    train_captions_list = []
    val_images_list = []
    val_captions_list = []
    test_images_list = []
    test_captions_list = []
    word_freq = Counter() #counter是一个字典，不过有个方便更新词频的方法update
    for img in images:
        captions = [] #用于保存每个对应image的caption
        for sentence in img['sentences']:
            word_freq.update(sentence['tokens'])
            if len(sentence['tokens'])<= max_len:
                captions.append(sentence['tokens'])#如果这个caption比最大长度短就增加
        if len(captions) == 0:continue
        if len(captions) < cap_per_image:
            captions = captions + [choice(captions) for _ in range(cap_per_image - len(captions))] #choice是从caption中随机取一个元素
        elif len(captions) > cap_per_image:
            captions = sample(captions,k=cap_per_image) #超过了就进行随机取样
        assert len(captions) == cap_per_image
        if img['split'] in {'train','restval'}:
            train_images_list.append(img['filename'])
            train_captions_list.append(captions)
        elif img['split'] == 'val':
            val_images_list.append(img['filename'])
            val_captions_list.append(captions)
        elif img['split'] == 'test':
            test_images_list.append(img['filename'])
            test_captions_list.append(captions)
    assert len(train_images_list) == len(train_captions_list)
    assert len(val_images_list) == len(val_captions_list)
    assert len(test_images_list) == len(test_captions_list)
    word = [w for w in word_freq if word_freq[w] > min_word_freq] #根据词频来筛掉单词
    
    
    #构建一个word_map出来
    word_map = {w:i+1 for i,w in enumerate(word)}
    word_map[''] = len(word_map) + 1
    word_map[''] = len(word_map) + 1
    word_map[''] = len(word_map) + 1
    word_map[''] = 0
    
    base_name = str(cap_per_image) + '_cap_per_image_' + str(min_word_freq) + '_min_word_freq' #这里的base文件名可以自己随便定义

    seed(223)
    
    #下面开始保存image，captions和caplens
    for img_paths,img_caps,split in [
        (test_images_list,test_captions_list,'TEST'),
        (val_images_list,val_captions_list,'VAL'),
        (train_images_list,train_captions_list,'TRAIN')    
    ]:
        with h5py.File(os.path.join(out_folder,split + '_IMAGES_' + base_name + '.hdf5'),'a') as h:
            h.attrs['captions_per_image'] = cap_per_image
            images = h.create_dataset('images',(len(img_paths),3,256,256),dtype='uint8')
            enc_captions = list()
            caplens = list()
            print("start to store {0} images..." .format(split))
            for i,path in enumerate(tqdm(img_paths)):
                captions = img_caps[i] #注意这里要把第i个图片对应的caption取出来
                path = os.path.join(image_folder,path)
                img = imread(path) #拿到了第i个图片的数据，下面进行一些变形
                img = numpy.array(Image.fromarray(img).resize((256,256)))
                if len(img.shape) == 2:
                    img = img[:,:,numpy.newaxis]
                    img = numpy.concatenate([img,img,img],dim=2)
                img = img.transpose(2,0,1)#这几步的目的是将img转换成(3,256,256)
                images[i] = img #保存第i个图片
                
                for j,caption in enumerate(captions):
                    en_cap = [word_map['']] + [word_map.get(w,word_map['']) for w in caption]\
                    + [word_map['']] + [word_map['']] * (max_len - len(caption))
                    enc_captions.append(en_cap)
                    caplens.append(len(caption) + 2)
            assert images.shape[0] * cap_per_image == len(enc_captions) == len(caplens)
            with open(os.path.join(out_folder,split + '_CAPTIONS_' + base_name + '.json'),'w') as j:
                json.dump(enc_captions,j)
            with open(os.path.join(out_folder,split + '_CAPLENS_' + base_name + '.json'),'w') as j:
                json.dump(caplens,j)
    with open(os.path.join(out_folder,'WORDMAP_' + base_name +'.json'),'w') as j:
        json.dump(word_map,j)

创建我们实验所需要的dataset类

我们已经把所有图片文件保存在hdf5文件中，captions和caplens，word_map都保存在了对应json文件中，值得注意的一点是按照上面的代码逻辑，captions和caplens的长度是image数量的caption_per_image倍。
创建数据集的目标：

将所需要的三个文件加载进来
训练模式下每个getitem需要返回一张图片，一个caption和相对应的caplens
validate模式下需要将图像对应的所有caption全部返回

# dataset.py
from torch.utils.data import Dataset
class CaptionDataset(Dataset):
    def __init__(self,data_folder,base_name,split,transform=None):
        self.split = split
        self.transform = transform
        h = h5py.File(os.path.join(data_folder,split+ '_IMAGES_'  + base_name + '.hdf5'),'r')
        self.images = h['images']
        self.cpi = h.attrs['captions_per_image']
        with open(os.path.join(data_folder,split + '_CAPLENS_' + base_name + '.json'),'r') as j:
            self.caplens = json.load(j)
        with open(os.path.join(data_folder,split + '_CAPTIONS_' + base_name + '.json'),'r') as j:
            self.captions = json.load(j)
    def __getitem__(self,i):
        img = torch.tensor(self.images[i // self.cpi]/255.)
        if self.transform:
            img = self.transform(img)
        caplen = torch.tensor([self.caplens[i]])
        caption = torch.tensor(self.captions[i])
        if self.split == 'TRAIN':
            return img,caption,caplen
        else:
            all_captions = torch.tensor(self.captions[(i // self.cpi) * self.cpi: (i // self.cpi) * self.cpi + self.cpi])
            return img,caption,caplen,all_captions
    def __len__(self):
        return len(self.captions)

开始训练模型

截至目前为止，我们已经实现了需要的模型，将我们需要的数据集处理成了训练所需要的Dataset类型，在每个单元都进行了测试，保证在模型训练过程中不会发生意料之外的错误，下面开始设计训练评估模型所需要的一些函数.

#utils.py
#为了记录一些评价指标的变化而创建的类
class AverageMetric(object):
    def __init__(self):
        self.reset()
        pass
    def reset(self):
        self.val = 0
        self.count = 0 
        self.avg = 0
        self.sum = 0
    def update(self,val,n = 1):
        self.val = val
        self.sum += val * n
        self.count += n
        self.avg = self.sum / self.count

# utils.py
#为了计算top5的准确率
def accuracy(predict,targets,k):
    #predict:[num_words,vocab_size] 注意经过pack_padded_sequence处理后batch轴消失了，而是把decode的长度做了累和
    #targets:[num_words]
    num_words = predict.size(0)#看看一共需要比较多少个单词
    targets = targets.view(-1,1) #[num_words,1]
    _,ind = predict.topk(k,1,True,True) #这里的index就是对应word的索引 #[num_words,k]
    targets = targets.expand_as(ind) #[num_words,k]
    correct = targets.eq(ind).sum().item()
    return correct / num_words * 100.0

这里模拟了两个word的情况，第一个word中前5概率的索引是[1,6,3,5,4]包含了1，所以这个word被判定正确，第二个word中5概率的索引是
[4,2,0,1,3] 不包括7，所以被判定错误，最后的正确率是50%

from time import time
def train(train_loader,encoder,decoder,encoder_optimizer,decoder_optimizer,criterion,epoch):
    '''
    train_loader:在训练模式下，train_loader在每一次迭代过程中返回给我们的数据是：
        img:[batch_size,3,256,256]
        caption:[batch_size,max_len + 2]这里之所以加2是因为包含了和
        caplen:[batch_size,1]
    '''
    encoder.train()
    decoder.train()
    batch_time = AverageMetric() #为了记录一个batch的时间
    data_load = AverageMetric()  #记录加载一次数据所用的时间
    losses = AverageMetric()    #loss值
    top5acc = AverageMetric()   #top5准确度，就是每次预测概率最高的五个词与正确答案比对，有一个对了就算正确
    start = time()
    for i, (img,caption,caplen) in enumerate(train_loader):
        data_load.updata(time() - start)
        img = img.to(device)
        caption = caption.to(device)
        caplen = caplen.to(device)
        encoder_out = encoder(img)
        predict,encode_captions,decode_length,alphas,sort_ind = decoder(encoder_out,caption,caplen)
        #predict [batch_size,max(decode_length),vocab_size]
        #encode_captions:[batch_size,max_len + 2]
        predict_copy = predict.clone() #后面用来计算top5accuracy的使用
        predict = predict.argmax(dim=2) #拿到每个序列每个位置概率最大的那个单词，用于后面做cross_entropy
        targets = encode_captions[:,1:] #每个caption的第一个需要被去掉因为他不是被decode出来的
        
        predict = pack_padded_sequence(predict,decode_length,batch_first=True).data.to(device)
        targets = pack_padded_sequence(targets,decode_length,batch_first=True).data.to(device)
        loss = criterion(predict,targets)
        encoder_optimizer.zero_grad()
        decoder_optimizer.zero_grad()
        loss.backward()
        encoder_optimizer.step()
        decoder_optimizer.step()
        
        top5 = accuracy(predict_clone,targets)
        
        losses.update(loss.item(),sum(decode_length))
        top5acc.update(top5,sum(decode_length))
        batch_time.update(time() - start)
        start = time()
        if i % print_freq == 0 and i != 0:
            print('Epoch: [{0}][{1}/{2}]\t'
                  'Batch Time {batch_time.val:.3f} ({batch_time.avg:.3f})\t'
                  'Data Load Time {data_load.val:.3f} ({data_time.avg:.3f})\t'
                  'Loss {loss.val:.4f} ({loss.avg:.4f})\t'
                  'Top-5 Accuracy {top5.val:.3f} ({top5.avg:.3f})'.format(epoch, i, len(train_loader),
                                                                          batch_time=batch_time,
                                                                          data_load=data_load, loss=losses,
                                                                          top5=top5acc))
        
        """
        这里谈一下pack_padded_sequence的效果，对于rnn任务而言，一个batch中不同的序列，它们的实际长度可能并不相同，而是在序列的最后用(0)
        将它们补齐到了一样的长度，而在decode的过程中我们利用了batch_size_t的小trick避免了补齐的0被拿去decode的情况。
        现在的predict是我们的预测结果，targets是原始的标签，很显然它们的长度不一样，都存在着补0的情况，所以我们传入了一个decode_length，来表达
        一个batch中每个序列的实际编码长度,这样就可以使得二者长度对齐了。
        """


def validate(val_loader,encoder,decoder,criterion):
    encoder.eval()
    decoder.eval()
    #进入评估模式以后dropout会失效
    #定义了3个标准量
    batch_time = AverageMeter()
    losses = AverageMeter()
    top5accs = AverageMeter()

    start = time.time()
    #references里面是正确的caption，一般一张图片有五个正确的caption，hypotheses是模型做出的推断
    references = list()
    hypotheses = list()
    with torch.no_grad():
        for i,(imgs,caps,caplens,allcaps) in enumerate(val_loader):
            imgs = imgs.to(device)
            caps = caps.to(device)
            caplens = caplens.to(device)
            imgs = encoder(imgs)
            scores, caps_sorted,decode_lengths, alphas,sort_ind = decoder(imgs,caps,caplens)
            scores_copy = scores.clone()
            targets = caps_sorted[:,1:]
            scores = pack_padded_sequence(scores,decode_lengths,batch_first=True).data.to(device)
            targets = pack_padded_sequence(targets,decode_lengths,batch_first=True).data.to(device)
            loss = criterion(scores,targets)

            losses.update(loss.item(),sum(decode_lengths))
            top5 = accuracy(scores,targets,5)
            top5accs.update(top5,sum(decode_lengths))
            batch_time.update(time.time() - start)
            start = time.time()
            if i % print_freq == 0:
                print('Validation: [{0}/{1}]\t'
                      'Batch Time {batch_time.val:.3f} ({batch_time.avg:.3f})\t'
                      'Loss {loss.val:.4f} ({loss.avg:.4f})\t'
                      'Top-5 Accuracy {top5.val:.3f} ({top5.avg:.3f})\t'.format(i, len(val_loader),batch_time=batch_time,loss=losses, top5=top5accs))

            allcaps = allcaps[sort_ind]
            #这一部分是为了将start和pad去掉
            for j in range(allcaps.shape[0]):
                img_caps = allcaps[j].tolist()
                img_captions = list(
                    map(lambda c:[w for w in c if w not in {word_map[''],word_map['']}],img_caps)
                )
                references.append(img_captions)
			#这一部分拿到了一个batch所有推断出的句子
            _,preds = torch.max(scores_copy,dim=2)
            preds = preds.tolist()
            temp_preds = list()
            for j,p in enumerate(preds):
                temp = preds[j][:decode_lengths[j]]
                temp_preds.append(temp)
            preds = temp_preds
            hypotheses.extend(preds)
            assert len(references) == len(hypotheses)
        #计算bleu-4的分数
        bleu4 = corpus_bleu(references,hypotheses)

        print(
                '\n * LOSS - {loss.avg:.3f}, TOP-5 ACCURACY - {top5.avg:.3f}, BLEU-4 - {bleu}\n'.format(
                    loss=losses,
                    top5=top5accs,
                    bleu=bleu4))
    return bleu4

开始模型的训练

这一部分我做了简洁化处理，主要是为了帮助理解训练过程，数据从loss采用的cross_entropy，看作一个多分类问题。每次训练一个epoch后，用validate函数计算一些bleu4的分数，最后得出最好的分数。

import time
import torch.backends.cudnn as cudnn
import torch.optim
import torch.utils.data
import torchvision.transforms as transforms
from torch import nn
from torch.nn.utils.rnn import pack_padded_sequence
from models import Encoder,Decoder
from datasets import *
from utils import *
from nltk.translate.bleu_score import corpus_bleu

data_folder = '/mnt/hdd3/std2021/xiejun/datasets/flickr8k'
base_name = '5_cap_per_img_5_min_word_freq'

emb_dim = 512
attention_dim = 512
decode_dim = 512
dropout = 0.5
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
cudnn.benchmark = True

start_epoch = 0
epochs = 10
epochs_since_improvement = 0
batch_size = 32
encoder_lr = 1e-4
decoder_lr = 4e-4
alpha_c = 1.
best_bleu4 = 0.
print_freq = 100
checkpoint = None

def main():
    global best_bleu4,checkpoint,start_epoch,base_name,word_map,epoch,epochs_since_improvement,reversed_map
    with open(os.path.join(data_folder,'WORDMAP_' + base_name + '.json')) as j:
        word_map = json.load(j)
    decoder = Decoder(attention_dim=attention_dim,
                     decode_dim=decode_dim,
                     embed_dim=emb_dim,
                     vocab_size=len(word_map),
                     dropout=dropout,
                      encode_dim= 2048
                     )
    decoder_optimizer = torch.optim.Adam(decoder.parameters(),lr=decoder_lr)
    encoder = Encoder()
    encoder_optimizer = torch.optim.Adam(params=encoder.parameters(),lr=encoder_lr)
    decoder = decoder.to(device)
    encoder = encoder.to(device)

    criterion = nn.CrossEntropyLoss().to(device)

    normalize = transforms.Normalize(mean=[0.485, 0.456, 0.406],
                                     std=[0.229, 0.224, 0.225])
    train_loader = torch.utils.data.DataLoader(
        CaptionDataset(data_folder,base_name,'TRAIN',transform=transforms.Compose([normalize])),
        batch_size=batch_size,shuffle=True,pin_memory=True
    )
    val_loader = torch.utils.data.DataLoader(
        CaptionDataset(data_folder,base_name,'VAL',transform=transforms.Compose([normalize])),
        batch_size=batch_size,shuffle=True,pin_memory=True
    )

    for epoch in range(start_epoch,epochs):
        train(train_loader=train_loader,
               decoder=decoder,
               criterion=criterion,
               encoder=encoder,
               encoder_optimizer=encoder_optimizer,
               decoder_optimizer=decoder_optimizer,
               epoch=epoch)
        recent_bleu4 = validate(val_loader=val_loader,
                                encoder=encoder,
                                decoder=decoder,
                                criterion=criterion,
                                )
        is_best = recent_bleu4 > best_bleu4
        best_bleu4 = max(recent_bleu4,best_bleu4)

MySQL中TINYINT/INT/BIGINT的典型应用场景及实例 jiedaodezhuti mysql 数据库
以下是MySQL中TINYINT/INT/BIGINT的典型应用场景及实例说明：一、TINYINT（1字节）1.状态标识--用户激活状态（0未激活/1已激活）ALTERTABLEusersADDis_activeTINYINT(1)DEFAULT0;适用于布尔值存储和状态码标记。2.评分系统--五星好评系统（1-5分）ALTERTABLEproduct_reviewsADDratingTINYIN
瑞•达利欧《原则》（三）瑜宁Sarah
《原则》第一章6.回报恩惠1.原文：在我看来人生有三个阶段组成。在一个第一个阶段，我们依赖他人我们学习；在第二个阶段，其他人依赖我们，我们工作；在第三个阶段，当其他人不再依赖我们，我们也不在工作时，我们就可以自由的体验生活了。感受：看到这句话，我想到了我的大学老师，尽管已经毕业多年，仍然在为我们提供帮助。我很感谢我的老师们。而自己同时似乎处在第一和第二个阶段。希望自己能够更多地为他人提供帮助，走上
【亲测免费】 PyPandoc 项目常见问题解决方案
PyPandoc项目常见问题解决方案基础介绍PyPandoc是一个为Pandoc提供的Python薄壳包装器。Pandoc是一个通用的文档转换工具，能够将标记格式的文档转换为多种格式。PyPandoc主要使用Python编程语言，旨在简化Pandoc在Python项目中的使用。新手常见问题及解决步骤问题1：如何安装PyPandoc问题描述：新手在使用PyPandoc时，首先需要了解如何正确安装。解
2020-4-30晨间日记迷糊人设
今天是什么日子起床：10:30就寝：4:30天气：太阳心情：平常纪念日：无任务清单昨日完成的任务，最重要的三件事：改进：习惯养成：周目标·完成进度学习·信息·阅读昨天开始看了儒林外史，看惯现代文，真的文言文都不太懂了，前段时间本来想看山海经，想说还没看过这重来都只是听说山海经里的些许故事，未曾看过山海经，而且以为神话故事，应该蛮有意思的，可是看着通篇的文言文，突然觉得自己是外国人吧，看不懂呀，就放
探索图形知识梳理[3.29] 虫zi
【课题名称】人教版数学五年级下册第三单元——探索图形【学习时间】2022年3月29日上午8：30-9：10【学习平台】国家中小学网络云平台(https://ykt.eduyun.cn/)【学习准备】准备笔记本和草稿本，边观看边记录。适时控制播放，按老师指令完成相应的课上练习。【学习任务】（1）进一步认识和理解正方体的特征。（2）通过观察、列表、想象等活动，经历发现正方体涂色和位置的规律的全过程，获
Kubernetes 高级调度 02 别骂我h kubernetes 容器云原生
一、Taint（污点）和Toleration（容忍）在生产环境中，经常会有这样的需求：master节点只部署系统组件容器，比如Calico、MetricsServer、Dashboard等，不应该部署业务应用。新添加节点不应该立即就允许部署业务容器，也就是新节点需要经过完整性及稳定性测试才可以被允许调度。某些节点可能需要进行系统升级或者其他维护，可能会引起节点上的容器不可用，此时需要将该节点上的P
EFK架构日志采集系统
以下是基于‌Filebeat+Elasticsearch+Kibana（EFK）‌构建日志采集系统的核心要点及部署指南，综合多来源最佳实践整理：一、架构核心要点‌组件角色‌‌Filebeat‌：轻量级日志采集器，实时监控文件/目录变化，高效转发日志数据（资源占用仅为Logstash的1/10）。‌Elasticsearch‌：分布式搜索引擎，存储日志并提供实时检索与分析能力。‌Kibana‌：可视
穿越日记第208天蔚之蓝
2020年1月20日一、365天穿越日记第208天1、家名：幸福圆满之家。2、家风：健康和睦。3、家规：（1）每天表达感恩3条以上。（2）承诺的事情坚持做到。（3）每天表达对家人和他人的看见及爱。4、使命：自我觉醒，引领家族，圆满精进。5、愿景：子女孝顺安康，兄姐情深圆融，家族圆满。6、身份：我是贤淑善解人意的妻子，我是孝顺的女儿，我是智慧的母亲，我是家庭圆满的引领者，我是有责任有担当的员工。7、
36岁郭碧婷产女，却至今未领证，为啥这么多女星想挤进豪门？麦大人
01重磅消息，郭碧婷终于生产了。在中秋及国庆当天，女儿出生，重7磅，合3180克，我们的清纯女神终于长大了。豪门家的喜事，自然是不同于平常人家，传闻向太赠与郭碧婷一套别墅，但并未得到向家人的证实。然而，以前一向高调的向太却失了声。有网友担忧，向家人是在意郭碧婷生的是女儿。毕竟，到现在为止，向家人没有一个人来表示庆祝，以前可是高调的不得了，恨不得立马和郭碧婷白头偕老。而现在，向左倒是失了声，不见下文
Python 基础（十四）：错误和异常
目录1错误2异常2.1内置异常2.2异常处理2.3抛出异常2.4自定义异常程序中的错误我们通常称为bug，工作中我们不仅需要改自己程序中的bug，还需要改别人程序中的bug，新项目有bug要改，老项目也有bug要改，可以说bug几乎贯穿一个程序员的职业生涯…我们通常将bug分为Error（错误）和Exception（异常），我们下面来具体学习下Python中的错误和异常。1错误错误通常是指程序中的
0106晨间日记我是彩虹小姐
【今日完成】1.读《掌控习惯》，完成财富共创打卡2.英语学习记单词30个3.看完文案书籍《非常文案》4.看综艺节目，触及人性问题，不免有些感伤5.文案抄写5则6.写文7.看牙8.boss直聘沟通【今日心得】学习比较专注，不错【今日见识】生活就是一连串选择的集合文案的框架设计，顿时觉得万物相通，都有一个可普适的框架【需要改进】5秒停止瞎想【明日目标】1.阅读文案相关书籍2.英语打卡30个单词3.阅读
T7D12 营业利润率与营业费用率吴佩在天涯
1、营业利润率营业利润率说明的是公司是否有赚钱的真本事。昨天学习到毛利率。毛利=营业收入-营业成本毛利率=毛利/营业收入营业利润=毛利-营业费用营业利润率=营业利润/营业收入营业费用率=毛利率-营业利润率上面的四个公式可以看到，营业利润率更能准确的反映一个公司的赚钱的真本事。因为最后留下来的营业利润。才是公司最后真正到手的现金。营业成本的大小会极大的影响营业利润。2、片仔癀的营业利润率和营业费用率
日精进第156天魏光付
敬爱的老师，智慧的班主任，亲爱的学兄们：大家好！我是枣庄庆源汽修魏光付。今天2019.02.07.是我的日精进行动第156天，我的预期寿命还有9976天。给大家分享我今天的进步，我们互相勉励，携手前行。每天进步一点点，距离成功便不远。1.比学习：读《营销的十六个关键词》学到∶市场营销中最本质、最核心的也是最关键的工作就是产品创新。创新的产品，一定要去匹配消费者现有或将有的需求，否则就是无意义的创新
Word文档乱码恢复方法详解 nntxthml word c#开发语言 windows
Word文档乱码恢复方法详解在日常办公中，Word文档乱码问题堪称最令人头痛的故障之一。面对满屏毫无规律的字符，许多用户的第一反应是文件损坏导致数据丢失。实际上，通过合理的修复方法，90%以上的乱码文档都能恢复原状。本文将系统讲解Word文档乱码的成因及多种修复方案，帮助读者建立完整的故障处理体系。一、乱码产生的四大核心原因编码格式冲突：不同系统（Windows/Mac）或不同语言环境下，文档的默
鸿蒙实战开发（HarmonyOS ）网络连接管理
鸿蒙NEXT开发实战往期必看文章：一分钟了解”纯血版！鸿蒙HarmonyOSNext应用开发！“非常详细的”鸿蒙HarmonyOSNext应用开发学习路线！（从零基础入门到精通）HarmonyOSNEXT应用开发案例实践总结合（持续更新......）HarmonyOSNEXT应用开发性能优化实践总结（持续更新......）简介网络连接管理提供管理网络一些基础能力，包括WiFi/蜂窝/Etherne
鸿蒙开发进阶（HarmonyOS ）应用启动框架AppStartup应用实践案例你我皆是牛马星人鸿蒙开发 HarmonyOS OpenHarmony 1024程序员节 harmonyos 华为鸿蒙前端 android 鸿蒙系统
鸿蒙NEXT开发实战往期必看文章：一分钟了解”纯血版！鸿蒙HarmonyOSNext应用开发！“非常详细的”鸿蒙HarmonyOSNext应用开发学习路线！（从零基础入门到精通）HarmonyOSNEXT应用开发案例实践总结合（持续更新......）HarmonyOSNEXT应用开发性能优化实践总结（持续更新......）启动框架应用场景大型应用在启动过程中会加载大量的模块或SDK，各个模块或SD
MySQL索引深度解析：从原理到实战优化
本文将深入探讨MySQL索引的核心机制、工作原理及高级优化技巧，通过原理分析、实战案例和可视化演示，帮助您全面掌握索引这一数据库性能优化的关键利器。一、索引的本质与重要性1.1什么是索引？索引是数据库中用于快速查找数据的数据结构，类似于书籍的目录。MySQL索引基于B+树数据结构实现，这种设计使数据库能够高效地执行数据检索操作，避免全表扫描。1.2索引的重要性查询性能提升：合理使用索引可将查询速度
工作室线下培训余清华乐平一小
今天上午八点左右，在乐平市第十一小学进行了＂名师工作室线下培训会＂。会议主要由蒋铭国老师和杨晓玲校长组织起来的活动。会议一共有四个阶段：第一阶段互相认识大家坐在一起自我介绍，许多老师介绍的非常好，我比较腼腆简单地说了学校和名字。杨校长说我讲的太快了连照片都来不及拍呢！第二阶段拍照留念杨校长找来了专业的摄影师给大家拍团队照、小组照及个人照，作为工作室里的图片资料。在这个阶段里，大家进一步互相认识有说
Linux笔记8 web服务器的部署及优化月熊笔记 linux
用户常用关于web的信息www概念www是worldwideweb的缩写，及万维网，也就是全球信息广播的意思通常说的上网就是使用www来查询用户所需要的信息。www可以结合文字、图形、影像以及声音等多媒体，超链接的方式将信息以Internet传递到世界各处去。当你连接www网站，该网站会提供一些数据，客户端要使用可以解析这些数据的软件来处理，那就是浏览器网址URI：UniformResourceI
顾华往事四：农庄之高血压及农庄的终结（2）危微
看到多数女生紧张兮兮的惨相，男孩们充分表现出了男子汉气概。他们胳膊里压着棉签，一脸轻松地特地到李芳面前说上一两句：“老师，一点都不痛。”“老师，我都还没有感觉到，医生就说‘好了’。”“老师，我被医生扎了三次才抽到血。”李芳面前出现的是一条肥肥的胳膊，胳膊主人屠文胖嘟嘟的脸蛋含着骄傲的微笑，凸出身体的大肚子也似乎更加自豪地往外挺。李芳关切：“你不痛吗？这么可怜啊，扎了三次！”“是啊，比去年好多了，去
随感蔷薇花开我最爱
中原焦点团队--欧阳小兰焦点中26期分享235天20210726本周约练0次，来51观12咨31案例分析4BOX练习14读书1次总117次。今天白天扎扎实实做了一天的工作，晚上回来，读书会也不参加了，认认真真学习社工的中级证的法律与法规，一晚上几个小时做30道题目，然后重做错题，用时长，但扎实，基本上把第一章一些概念性的知识搞清楚了。白天空闲的时候，突然觉得说话很慢是一种特别舒服的感觉，要知道以前
2023-08-21 de5ea6d11ab2
易佳npdp学习笔记NPDP（NewProductDevelopmentProfessional）是产品经理国际资格认证。NPDP由美国产品开发与管理协会（PDMA）所发起，是国际公认的唯一的新产品开发专业认证，集理论、方法与实践为一体的全方位知识体系，为公司组织层级进行规划、决策、执行提供良好的方法体系支撑。经IBM采用后来被华为公司引入并取得巨大商业成功的IPD（IntegratedProdu
Java String 正则表达式设计模式包装类 Object类自动拆箱额么么么么 java 正则表达式设计模式
其它API（ApplicationProgramingInterface）应用程序接口（功能）,我们java讲解最常用的一些功能。API作用：API表示的是功能,学习API可以快速进行编程开发。API设计初衷,设计者将复杂的业务逻辑,封装成方法,供调用者更好的使用。对于开发者而言,不需要关注功能的具体逻辑实现,只需要知道如何使用即可。Java提供了很多的包,有一些包需要导入，有一些不需要导入:1.
本地常熟12家亲子鉴定机构一览(附2024年9月汇总鉴定) 国医基因铬主任
常熟市亲子鉴定机构1、常熟市国医基因DNA亲子鉴定中心机构地址：苏州市姑苏区平海路业务范围：个人（隐私）亲子鉴定、司法亲子鉴定咨询预约、胎儿产前亲子鉴定、亲缘关系鉴定、上户口及移民等DNA鉴定咨询服务。亲子鉴定服务范围：江苏省；苏州市（姑苏区、相城区、虎丘区、吴江区、吴中区、张家港市、常熟市、太仓市、昆山市）、南京市、无锡市、徐州市、常州市、南通市、连云港市、淮安市、盐城市、扬州市、镇江市、泰州市
百日成长计划第52天阅己阅人
百日成长计划2期组号11529：日期：2020.8.26学习第52天：今日感悟：孔子教导学生不要随意议论别人，“君子慎独”是儒家自我修养的方法，提倡“静坐常思己过，闲谈莫论人非”，反求诸己，“反省”是成本很低又能开发心中宝藏的提升心灵品质的途径。论人是非坏处多多，那么多的负能量容易污染自己的心灵。谨记。“以约失之者，鲜矣。”一个能约束自己的人犯错误很少。约束有外在约束（礼制、制度）和内在约束（良知
uView UI 组件大全
uViewUI是一个基于uni-app的高质量UI组件库，提供丰富的跨平台组件（支持H5、小程序、App等）。以下是其核心组件的分类大全及功能说明，结合最新版本（1.2.10）整理：一、基础组件按钮(Button)支持主题色、镂空、禁用等样式，可设置openType（如微信小程序授权）和回调事件。图标(Icon)内置多种图标，支持自定义颜色、大小、背景色和渐变色。布局(Layout)提供栅格系统（
Android-skin-support换肤原理详解 CurtainSystem android
一.背景公司业务上需要用到换肤.为了不重复造轮子,并且快速实现需求,并且求稳,于是到Github上找了一个star数比较多的换肤框架-Android-skin-support(一款用心去做的Android换肤框架,极低的学习成本,极好的用户体验.一行代码就可以实现换肤,你值得拥有!!!).简单了解之后,可以快速上手,并且侵入性很低.作为一名合格的程序员,当然需要了解其背后的原理才能算是真正的灵活运
勇气读书会——《论语》打卡（第一百三十天）于杰雄
这是我参加勇气读书会打卡第一百三十天我阅读的书籍：《论语》出发日期：2019.11.4/2019.11.24/2019.12.15/2020.01.10/2020.1.31/2020.2.22期待的收获：希望了解怎么解决教学问题一句标语：爱我所爱，尽我所能。小想法：相信明天会更好，我们会战胜困难，迈向更美好的未来。不要放弃每一天的学习，让自己充实起来，加油！勇气读书会，第六期，我已出发。孔子说：“
在职四战考研102day MM加油女孩
已完成今日想做之事：政治内容理解；英语研词学习；专业课划重点并进行绘制思维导图；听书《我不要稳定的活着》反思：通过近几天的学习，感觉自己的进度还是很慢的，尤其是英语跟专业课这一块，它们是必不可少而且最耗时的科目，通过自己的思考，我再次对自己的计划作出调整：第一，晚上进行第二天内容的听课，截屏下来，尤其是政治、研词、真题讲解都利用晚上时间来听完，还有就是划专业课的笔记；第二，次日，上午进行一个英语真
2021-03-15成长 TCZ晨妈
成长幸福的家庭是相似的，不幸的家庭各有不同。妈妈在家庭关系里是重中之重，上有婆媳，下有亲子，中有夫妻。要怎么样才能获得幸福，过上自己想要的生活？要怎么样才能更好？那只有学习，也唯有学习，才能成长。在成长过程中，不仅提高经济地位、家庭地位，甚至话语权，更重要的是内心丰盈、精神富足，有睿智的头脑、坦荡的心胸；有足够的能力，将有些事放下，因为还有明天；不拿自己的情绪责怪别人，也不拿别人的错误惩罚自己；做
插入表主键冲突做更新 a-john
有以下场景：用户下了一个订单，订单内的内容较多，且来自多表，首次下单的时候，内容可能会不全（部分内容不是必须，出现有些表根本就没有没有该订单的值）。在以后更改订单时，有些内容会更改，有些内容会新增。问题：如果在sql语句中执行update操作，在没有数据的表中会出错。如果在逻辑代码中先做查询，查询结果有做更新，没有做插入，这样会将代码复杂化。解决： mysql中提供了一个sql语
Android xml资源文件中@、@android:type、@*、？、@+含义和区别 Cb123456 @+@?@*
一.@代表引用资源 1.引用自定义资源。格式：@[package:]type/name android：text="@string/hello" 2.引用系统资源。格式：@android:type/name android:textColor="@android:color/opaque_red"
数据结构的基本介绍天子之骄数据结构散列表树、图线性结构价格标签
数据结构的基本介绍数据结构就是数据的组织形式，用一种提前设计好的框架去存取数据，以便更方便，高效的对数据进行增删查改。正确选择合适的数据结构，对软件程序的高效执行的影响作用不亚于算法的设计。此外，在计算机系统中数据结构的作用也是非同小可。例如常常在编程语言中听到的栈，堆等，就是经典的数据结构。经典的数据结构大致如下：一：线性数据结构 (1)：列表 a
通过二维码开放平台的API快速生成二维码一炮送你回车库 api
现在很多网站都有通过扫二维码用手机连接的功能，联图网(http://www.liantu.com/pingtai/)的二维码开放平台开放了一个生成二维码图片的Api,挺方便使用的。闲着无聊，写了个前台快速生成二维码的方法。 html代码如下:(二维码将生成在这div下) ? 1 &nbs
ImageIO读取一张图片改变大小 3213213333332132 java IO image BufferedImage
package com.demo; import java.awt.image.BufferedImage; import java.io.File; import java.io.IOException; import javax.imageio.ImageIO; /** * @Description 读取一张图片改变大小 * @author FuJianyon
myeclipse集成svn（一针见血） 7454103 eclipse SVN MyEclipse
&n
装箱与拆箱----autoboxing和unboxing darkranger J2SE
4.2　自动装箱和拆箱基本数据(Primitive)类型的自动装箱(autoboxing)、拆箱(unboxing)是自J2SE 5.0开始提供的功能。虽然为您打包基本数据类型提供了方便，但提供方便的同时表示隐藏了细节，建议在能够区分基本数据类型与对象的差别时再使用。 4.2.1　autoboxing和unboxing 在Java中，所有要处理的东西几乎都是对象(Object)
ajax传统的方式制作ajax aijuans Ajax
//这是前台的代码 <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <% String path = request.getContextPath(); String basePath = request.getScheme()+
只用jre的eclipse是怎么编译java源文件的？ avords java eclipse jdk tomcat
eclipse只需要jre就可以运行开发java程序了，也能自动编译java源代码，但是jre不是java的运行环境么，难道jre中也带有编译工具？还是eclipse自己实现的？谁能给解释一下呢问题补充：假设系统中没有安装jdk or jre，只在eclipse的目录中有一个jre，那么eclipse会采用该jre，问题是eclipse照样可以编译java源文件，为什么呢？ &nb
前端模块化 bee1314 模块化
背景：前端JavaScript模块化，其实已经不是什么新鲜事了。但是很多的项目还没有真正的使用起来，还处于刀耕火种的野蛮生长阶段。 JavaScript一直缺乏有效的包管理机制，造成了大量的全局变量，大量的方法冲突。我们多么渴望有天能像Java（import），Python (import)，Ruby(require)那样写代码。在没有包管理机制的年代，我们是怎么避免所
处理百万级以上的数据处理 bijian1013 oracle sql 数据库大数据查询
一.处理百万级以上的数据提高查询速度的方法： 1.应尽量避免在 where 子句中使用!=或<>操作符，否则将引擎放弃使用索引而进行全表扫描。 2.对查询进行优化，应尽量避免全表扫描，首先应考虑在 where 及 o
mac 卸载 java 1.7 或更高版本征客丶 java OS
卸载 java 1.7 或更高 sudo rm -rf /Library/Internet\ Plug-Ins/JavaAppletPlugin.plugin 成功执行此命令后，还可以执行 java 与 javac 命令 sudo rm -rf /Library/PreferencePanes/JavaControlPanel.prefPane 成功执行此命令后，还可以执行 java
【Spark六十一】Spark Streaming结合Flume、Kafka进行日志分析 bit1129 Stream
第一步，Flume和Kakfa对接，Flume抓取日志，写到Kafka中第二部，Spark Streaming读取Kafka中的数据，进行实时分析本文首先使用Kakfa自带的消息处理（脚本）来获取消息，走通Flume和Kafka的对接 1. Flume配置 1. 下载Flume和Kafka集成的插件，下载地址：https://github.com/beyondj2ee/f
Erlang vs TNSDL bookjovi erlang
TNSDL是Nokia内部用于开发电信交换软件的私有语言，是在SDL语言的基础上加以修改而成，TNSDL需翻译成C语言得以编译执行，TNSDL语言中实现了异步并行的特点，当然要完整实现异步并行还需要运行时动态库的支持，异步并行类似于Erlang的process（轻量级进程），TNSDL中则称之为hand，Erlang是基于vm(beam)开发，
非常希望有一个预防疲劳的java软件, 预防过劳死和眼睛疲劳,大家一起努力搞一个 ljy325 企业应用
　非常希望有一个预防疲劳的java软件，我看新闻和网站，国防科技大学的科学家累死了，太疲劳，老是加班，不休息，经常吃药，吃药根本就没用，根本原因是疲劳过度。我以前做java,那会公司垃圾，老想赶快学习到东西跳槽离开，搞得超负荷，不明理。深圳做软件开发经常累死人，总有不明理的人，有个软件提醒限制很好，可以挽救很多人的生命。相关新闻：（1）IT行业成五大疾病重灾区：过劳死平均37.9岁
读《研磨设计模式》-代码笔记-原型模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * Effective Java 建议使用copy constructor or copy factory来代替clone()方法： * 1.public Product copy(Product p){} * 2.publi
配置管理---svn工具之权限配置 chenyu19891124 SVN
今天花了大半天的功夫，终于弄懂svn权限配置。下面是今天收获的战绩。安装完svn后就是在svn中建立版本库，比如我本地的是版本库路径是C:\Repositories\pepos。pepos是我的版本库。在pepos的目录结构 pepos component webapps 在conf里面的auth里赋予的权限配置为 [groups]
浅谈程序员的数学修养 comsci 设计模式编程算法面试招聘
浅谈程序员的数学修养
批量执行 bulk collect与forall用法 daizj oracle sql bulk collect forall
BULK COLLECT 子句会批量检索结果，即一次性将结果集绑定到一个集合变量中，并从SQL引擎发送到PL/SQL引擎。通常可以在SELECT INTO、 FETCH INTO以及RETURNING INTO子句中使用BULK COLLECT。本文将逐一描述BULK COLLECT在这几种情形下的用法。有关FORALL语句的用法请参考：批量SQL之 F
Linux下使用rsync最快速删除海量文件的方法 dongwei_6688 OS
1、先安装rsync：yum install rsync 2、建立一个空的文件夹：mkdir /tmp/test 3、用rsync删除目标目录：rsync --delete-before -a -H -v --progress --stats /tmp/test/ log/这样我们要删除的log目录就会被清空了，删除的速度会非常快。rsync实际上用的是替换原理，处理数十万个文件也是秒删。
Yii CModel中rules验证规格 dcj3sjt126com rules yii validate
Yii cValidator主要用法分析： yii验证rulesit 分类： Yii yii的rules验证 cValidator主要属性 attributes ,builtInValidators,enableClientValidation,message,on,safe,skipOnError
基于vagrant的redis主从实验 dcj3sjt126com vagrant
平台: Mac 工具: Vagrant 系统: Centos6.5 实验目的: Redis主从实现思路制作一个基于sentos6.5, 已经安装好reids的box, 添加一个脚本配置从机, 然后作为后面主机从机的基础box 制作sentos6.5+redis的box mkdir vagrant_redis cd vagrant_
Memcached(二)、Centos安装Memcached服务器 frank1234 centos memcached
一、安装gcc rpm和yum安装memcached服务器连接没有找到，所以我使用的是make的方式安装，由于make依赖于gcc，所以要先安装gcc 开始安装，命令如下，[color=red][b]顺序一定不能出错[/b][/color]：建议可以先切换到root用户，不然可能会遇到权限问题：su root 输入密码...... rpm -ivh kernel-head
Remove Duplicates from Sorted List hcx2013 remove
Given a sorted linked list, delete all duplicates such that each element appear only once. For example,Given 1->1->2, return 1->2.Given 1->1->2->3->3, return&
Spring4新特性——JSR310日期时间API的支持 jinnianshilongnian spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
浅谈enum与单例设计模式 247687009 java 单例
在JDK1.5之前的单例实现方式有两种(懒汉式和饿汉式并无设计上的区别故看做一种)，两者同是私有构造器，导出静态成员变量，以便调用者访问。第一种 package singleton; public class Singleton { //导出全局成员 public final static Singleton INSTANCE = new S
使用switch条件语句需要注意的几点 openwrt c break switch
1. 当满足条件的case中没有break，程序将依次执行其后的每种条件（包括default）直到遇到break跳出 int main() { int n = 1; switch(n) { case 1: printf("--1--\n"); default: printf("defa
配置Spring Mybatis JUnit测试环境的应用上下文 schnell18 spring mybatis JUnit
Spring-test模块中的应用上下文和web及spring boot的有很大差异。主要试下来差异有：单元测试的app context不支持从外部properties文件注入属性 @Value注解不能解析带通配符的路径字符串解决第一个问题可以配置一个PropertyPlaceholderConfigurer的bean。第二个问题的具体实例是：
Java 定时任务总结一 tuoni java spring timer quartz timertask
Java定时任务总结一.从技术上分类大概分为以下三种方式： 1.Java自带的java.util.Timer类，这个类允许你调度一个java.util.TimerTask任务; 说明： java.util.Timer定时器，实际上是个线程，定时执行TimerTask类 &
一种防止用户生成内容站点出现商业广告以及非法有害等垃圾信息的方法 yangshangchuan rank 相似度计算文本相似度词袋模型余弦相似度
本文描述了一种在ITEYE博客频道上面出现的新型的商业广告形式及其应对方法，对于其他的用户生成内容站点类型也具有同样的适用性。最近在ITEYE博客频道上面出现了一种新型的商业广告形式，方法如下： 1、注册多个账号（一般10个以上）。 2、从多个账号中选择一个账号，发表1-2篇博文