Real_Myth

使用Caffe复现DeepID实验

本实验使用Casia-Webface part2的切图来复现DeepID实验结果。

DeepID网络配置文件
训练验证数据组织
实验结果
结果分析

DeepID网络配置文件

-下面给出deepId_train_test.prototxt的内容

name: "deepID_network"
layer {
  name: "input_data"
  top: "data"
  top: "label"
  type: "Data"
  data_param {
    source: "dataset/deepId_train_lmdb"
    backend: LMDB
    batch_size: 128
  }
  transform_param {
    mean_file: "dataset/deepId_mean.proto"
  }
  include {
    phase: TRAIN
  }
}
layer {
  name: "input_data"
  top: "data"
  top: "label"
  type: "Data"
  data_param {
    source: "dataset/deepId_test_lmdb"
    backend: LMDB
    batch_size: 128 
  }
  transform_param {
    mean_file: "dataset/deepId_mean.proto"
  }
  include {
    phase: TEST
  }
}
layer {
  name: "conv1"
  type: "Convolution"
  bottom: "data"
  top: "conv1"
  param {
    name: "conv1_w"
    lr_mult: 1
    decay_mult: 0
  }
  param {
    name: "conv1_b"
    lr_mult: 2
    decay_mult: 0
  }
  convolution_param {
    num_output: 20
    kernel_size: 4
    stride: 1
    weight_filler {
      type: "gaussian"
      std: 0.01
    }
    bias_filler {
      type: "constant"
    }
  }
}

layer {
  name: "relu1"
  type: "ReLU"
  bottom: "conv1"
  top: "conv1"
}
layer {
  name: "pool1"
  type: "Pooling"
  bottom: "conv1"
  top: "pool1"
  pooling_param {
    pool: MAX
    kernel_size: 2
    stride: 2
  }
}
layer {
  name: "conv2"
  type: "Convolution"
  bottom: "pool1"
  top: "conv2"
  param {
    name: "conv2_w"
    lr_mult: 1
    decay_mult: 0
  }
  param {
    name: "conv2_b"
    lr_mult: 2
    decay_mult: 0
  }
  convolution_param {
    num_output: 40
    kernel_size: 3
    stride: 1
    weight_filler {
      type: "gaussian"
      std: 0.01
    }
    bias_filler {
      type: "constant"
    }
  }
}

layer {
  name: "relu2"
  type: "ReLU"
  bottom: "conv2"
  top: "conv2"
}
layer {
  name: "pool2"
  type: "Pooling"
  bottom: "conv2"
  top: "pool2"
  pooling_param {
    pool: MAX
    kernel_size: 2
    stride: 1
  }
}
layer {
  name: "conv3"
  type: "Convolution"
  bottom: "pool2"
  top: "conv3"
  param {
    name: "conv3_w"
    lr_mult: 1
    decay_mult: 0
  }
  param {
    name: "conv3_b"
    lr_mult: 2
    decay_mult: 0
  }
  convolution_param {
    num_output: 60
    kernel_size: 3
    stride: 1
    weight_filler {
      type: "gaussian"
      std: 0.01
    }
    bias_filler {
      type: "constant"
    }
  }
}

layer {
  name: "relu3"
  type: "ReLU"
  bottom: "conv3"
  top: "conv3"
}
layer {
  name: "pool3"
  type: "Pooling"
  bottom: "conv3"
  top: "pool3"
  pooling_param {
    pool: MAX
    kernel_size: 2
    stride: 2
  }
}
layer {
  name: "conv4"
  type: "Convolution"
  bottom: "pool3"
  top: "conv4"
  param {
    name: "conv4_w"
    lr_mult: 1
    decay_mult: 0
  }
  param {
    name: "conv4_b"
    lr_mult: 2
    decay_mult: 0
  }
  convolution_param {
    num_output: 80
    kernel_size: 2
    stride: 1
    weight_filler {
      type: "gaussian"
      std: 0.01
    }
    bias_filler {
      type: "constant"
    }
  }
}
layer {
  name: "relu4"
  type: "ReLU"
  bottom: "conv4"
  top: "conv4"
}
layer {
  name: "fc160_1"
  type: "InnerProduct"
  bottom: "pool3"
  top: "fc160_1"
  param {
    name: "fc160_1_w"
    lr_mult: 1
    decay_mult: 1
  }
  param {
    name: "fc160_1_b"
    lr_mult: 2
    decay_mult: 1
  }
  inner_product_param {
    num_output: 160
    weight_filler {
      type: "gaussian"
      std: 0.01
    }
    bias_filler {
      type: "constant"
    }
  }
}

layer {
  name: "fc160_2"
  type: "InnerProduct"
  bottom: "conv4"
  top: "fc160_2"
  param {
    name: "fc160_2_w"
    lr_mult: 1
    decay_mult: 1
  }
  param {
    name: "fc160_2_b"
    lr_mult: 2
    decay_mult: 1
  }
  inner_product_param {
    num_output: 160
    weight_filler {
      type: "gaussian"
      std: 0.01
    }
    bias_filler {
      type: "constant"
    }
  }
}

layer {
  name: "fc160"
  type: "Eltwise"
  bottom: "fc160_1"
  bottom: "fc160_2"
  top: "fc160"
  eltwise_param {
    operation: SUM
  }
}
layer {
  name: "dropout"
  type: "Dropout"
  bottom: "fc160"
  top: "fc160"
  dropout_param {
    dropout_ratio: 0.4
  }
}

layer {
  name: "fc_class"
  type: "InnerProduct"
  bottom: "fc160"
  top: "fc_class"
  param {
    name: "fc_class_w"
    lr_mult: 1
    decay_mult: 1
  }
  param {
    name: "fc_class_b"
    lr_mult: 2
    decay_mult: 1
  }
  inner_product_param {
    num_output: 10499
    weight_filler {
      type: "gaussian"
      std: 0.01
    }
    bias_filler {
      type: "constant"
    }
  }
}
layer {
  name: "loss"
  type: "SoftmaxWithLoss"
  bottom: "fc_class"
  bottom: "label"
  top: "loss"
}
layer {
  name: "accuracy"
  type: "Accuracy"
  bottom: "fc_class"
  bottom: "label"
  top: "accuracy"
  include {
    phase: TEST
  }
}
#这里注意fc160维之后不接ReLU,个人在这里吃了亏，因为拿fc160做特征时，用了ReLU就将负数信息删除了，而存在于这一层的负数特征可能对分类有帮助。

下面是deepId_solver.prototxt

net: "deepId_train_test.prototxt"
# conver the whole test set. 484 * 128 = 62006 images.
test_iter: 484 
# Each 6805 is one epoch, test after each epoch
test_interval: 6805 
base_lr: 0.01
momentum: 0.9
weight_decay: 0.005
lr_policy: "step"
# every 30 epochs, decrease the learning rate by factor 10.
stepsize: 204164
gamma: 0.1
# power: 0.75
display: 200
max_iter: 816659 # 120 epochs.
snapshot: 10000
snapshot_prefix: “trained_model/deepId"
solver_mode: GPU

</pre><pre>

训练数据组织

数据来自CASIA-Webface的切图（人脸对齐，缩放到一个固定的比例，比如55*55），CASIA-Webface共10575个人，每个人的图片数量从几十到几百不等。类别数量之间严重不平衡，这里，我试验了两个方式(没有用全部的10575类，如deepId_train_test.prototxt定义的那样，只使用了10499类，如果某类别的图片数目过少，就不使用它)：
1. 让训练集的每一类数目完全一样，比如我的实验中为训练集每个人50张图片。
2. 图片数目最多的那一类于最少的哪一类的数目比例不超过3：1（个人愚见，不知是否有道理，请高手指点一二）。
验证集是从每一类别的都随机挑选一部分不在训练集中的图片来做验证。

-下面的prepare_deepId_data.py是我组织训练测试数据的Python代码，仅供参考（高手请拍砖）。

import os
from random import shuffle
import cPickle
def check_parameter(param, param_type, create_new_if_missing=False):
    assert param_type == 'file' or param_type == 'directory'
    if param_type == 'file':
        assert os.path.exists(param)
        assert os.path.isfile(param)
    else:
        if create_new_if_missing is True:
            if not os.path.exists(param):
                os.makedirs(param)
            else:
                assert os.path.isdir(param)
        else:
            assert os.path.exists(param)
            assert os.path.isdir(param)


def listdir(top_dir, type='image'):
    # type_len = len(type)
    tmp_file_lists = os.listdir(top_dir)
    file_lists = []
    if type == 'image':
        for e in tmp_file_lists:
          if e.endswith('.jpg') or e.endswith('.png') or e.endswith('.bmp'):
              file_lists.append(e)
    elif type == 'dir':
        for e in tmp_file_lists:
          if os.path.isdir(top_dir + e):
              file_lists.append(e)
    else:
        raise Exception('Unknown type in listdir')
    return file_lists


def prepare_deepId_data_eq(src_dir, tgt_dir, num_threshold=50):
    check_parameter(src_dir, 'directory')
    check_parameter(tgt_dir, 'directory', True)
    if src_dir[-1] != '/':
        src_dir += '/'
    if tgt_dir[-1] != '/':
        tgt_dir += '/'
    class_lists = listdir(src_dir, 'dir')
    print '# class is : %d' % len(class_lists)
    class_table = {}

    num = 0

    for e in class_lists:
        assert e not in class_table
        class_table[e] = listdir(''.join([src_dir, e]), 'image')
        if len(class_table[e]) > num_threshold:
            num += 1
    print 'There are %d people whose number of images is greater than %d.' % (num, num_threshold)
    print 'Use %d num people to train the deepId net..' % num
    train_set = []
    test_set = []
    label = 0
    dirname2label = {}
    for k, v in class_table.iteritems():
        if len(v) >= num_threshold:
            shuffle(v)
            assert k not in dirname2label
            dirname2label[k] = label
            i = 0
            for i in xrange(num_threshold):
                train_set.append((k + '/' + v[i], label))
            i += 1
            num_test_images = min(num_threshold / 3, len(v) - num_threshold)
            for j in xrange(num_test_images):
                test_set.append((k + '/' + v[i + j], label))
            label += 1
    f = open(tgt_dir + 'dirname2label.pkl', 'wb')
    cPickle.dump(dirname2label, f, 0)
    f.close()
    f = open(tgt_dir + 'deepId_train_lists.txt', 'w')
    for e in train_set:
        print >> f, e[0], ' ', e[1]
    f.close()
    f = open(tgt_dir + 'deepId_test_lists.txt', 'w')
    for e in test_set:
        print >> f, e[0], ' ', e[1]
    f.close()


def prepare_deepId_data_dif(src_dir, tgt_dir, num_threshold=20, add_all=False):
    check_parameter(src_dir, 'directory')
    check_parameter(tgt_dir, 'directory', True)
    if src_dir[-1] != '/':
        src_dir += '/'
    if tgt_dir[-1] != '/':
        tgt_dir += '/'
    class_lists = listdir(src_dir, 'dir')
    print '# class is : %d' % len(class_lists)
    class_table = {}

    num = 0

    for e in class_lists:
        assert e not in class_table
        class_table[e] = listdir(''.join([src_dir, e]), 'image')
        if len(class_table[e]) > num_threshold:
            num += 1
    print 'There are %d people whose number of images is greater than %d.' % (num, num_threshold)
    print 'Use %d num people to train the deepId net, we do not care the validation set result...' % num
    train_set = []
    test_set = []
    label = 0
    dirname2label = {}
    for k, v in class_table.iteritems():
        if len(v) >= num_threshold:
            shuffle(v)
            assert k not in dirname2label
            dirname2label[k] = label
            i = 0
            for i in xrange(num_threshold):
                train_set.append((k + '/' + v[i], label))
            i += 1
            j = 0
            num_test_images = min(int(num_threshold / 3), len(v) - num_threshold)
            for j in xrange(num_test_images):
                test_set.append((k + '/' + v[i + j], label))

            if len(v) > num_threshold + num_test_images:
                offset = j + 1 + i
                if add_all is False:
                    # add the rest of all images or 3 times the num_threshold images to the training set....
                    num_left = len(v) - num_threshold - num_test_images
                    num_left = min(num_left, num_threshold)

                    for ii in xrange(num_left):
                        train_set.append((k + '/' + v[ii + offset], label))
                else:
                    # print 'Adding the rest of all data into training set.'
                    while offset < len(v):
                        train_set.append((k + '/' + v[offset], label))
                        offset += 1
            label += 1
    f = open(tgt_dir + 'dirname2label.pkl', 'wb')
    cPickle.dump(dirname2label, f, 0)
    f.close()
    f = open(tgt_dir + 'deepId_train_lists.txt', 'w')
    for e in train_set:
        print >> f, e[0], ' ', e[1]
    f.close()
    f = open(tgt_dir + 'deepId_test_lists.txt', 'w')
    for e in test_set:
        print >> f, e[0], ' ', e[1]
    f.close()

if __name__ == '__main__':
    prepare_deepId_data_eq('CASIA-Webface/','dataset', 50)
    prepare_deepId_data_dif('CASIA-Webface/','dataset', 20, True)
#后缀eq表示每一类数目一样，50表示希望每一类都有50幅图片，dif每一类数目不一样。

实验结果

实验过程是抽取已经训练好了的模型，将lfw的测试数据抽取特征fc160维的特征，然后对特征用cos距离或者joint bayesian距离来做人脸验证。

-训练过程loss曲线如下:

-训练过程的accuracy曲线如下:

-使用cos距离度量在LFW上的roc曲线以及正负样本分布图

-使用joint bayesian在LFW上的roc曲线以及正负样本分布图

-在LFW上的单part模型结果如下：

metric	mean accuracy	std
cos	0.9395	0.0035
joint bayesian	0.9545	0.0045

实验结果分析说明

本实验单模型只有95.45%的准确率，没有到97%左右（实验室师兄用convnet复现得到的单part的准确率），存在如此大的差距。一方面还是参数没调好，训练的不够好，数据组织欠妥，另一方面也许是deepID的第3个conv层和第4个conv层用的local卷积，人脸不同区域用不同filter来提取特征能得到更加丰富的特征？
ps: caffe的local卷积太慢了，有点不能忍。话说happynear大神deepID的LFW上了97.17，不得不佩服大神调参能力,还是自己太菜了。

*******************************************************************************************************************************************

34楼小娃娃妮 2016-09-09 15:20发表 [回复]: 你好，我的数据是CASIA-WEBface人脸对齐过后的，输入的图像crop成80*80灰度图进行训练，每一类使用两个样本进行测试，其余全部用来训练，网络结构和训练参数和提供的网络的一样，但是我的测试集合上的准确率只到68% ，loss也一直都是在2.0上下，到达65%以上保存了model,在调低了学习率之后，fixed学习20W次以上也只提高到68%，我想请问准确率的提升是调整学习率一个参数，还是其他参数都要调整吗？谢谢！

33楼 lyf5oo 2016-09-03 20:53发表 [回复]: 我看图片集中的人脸都是对齐的啊（鼻子都在中间），还需要用什么工具来对齐吗？对齐指的是把人脸扣出来吗？谢谢。

32楼姜鱼 2016-08-26 10:26发表 [回复]

楼主CASIA-Webface样本库方便共享一下吗？Google下着下着就断了，毕设需要用这个，可以的话加我qq呗，qq号：348132030。

Re: 天妒WS 2016-09-01 18:15发表 [回复]: 回复jianliuyu：这个数据库需要申请。不能私自传哦。你可以让你让老师申请吧。

31楼 yueyuecsdn 2016-08-22 14:32发表 [回复]

楼主你好，我用的是caffe在训练数据，然后需要train文件夹和test文件夹及其levdel文件，那么由原始的数据集怎样生成这两个文件夹呢，求楼主

Re: 天妒WS 2016-08-22 20:03发表 [回复]

回复yueyuecsdn：说实话，不是特别能够理解你的问题。你是说如何划分训练测试还是指怎么用程序生成呢？

Re: yueyuecsdn 2016-08-23 14:53发表 [回复]: 回复a_1937：问题已经解决，么么哒

30楼 wjxzju 2016-07-24 21:35发表 [回复]

您好，很感谢这篇文章的指导，我在复现时，采用的是CASIA_WEBFACE的数据库，我对CASIA_WEBFACE进行过crop处理，将图像归一化为55x47大小，利用您的网络训练时，test_accuracy一直不高，目前在60%-70%左右，跟您的结果相比差了10%，利用lfw数据库进行测试，效果也不是很好，我对您文中提到的让训练集每一类数目完全一样有点疑问，因为数据库中有相当一部分人的图片数目少于50张，我统计过大约有快一半的人数，那么怎么对这些人进行扩充满足条件呢，我在训练的时候并没有进行这种保证每人图片数均衡的操作，只是简单的划分训练集和验证集时采用了9:1的比例（另外我还去除了图片数目太少，<10张的人数），是不是每人图片均衡一点，效果会更好呢? 还望您能解答一下，谢谢！

Re: 天妒WS 2016-07-27 23:33发表 [回复]: 回复wjxzju：1、确保你的训练数据的人脸是对齐的；2、组织数据时，不必按照这篇博客的来，这个实验是我做了比较久了，后来又实验时，直接每一类取1~2张人脸作为验证集，其余的全部作为训练集。3、对齐后的人脸一般不要按照分类任务那样crop做数据增强，仅仅做个水平镜像即可。

29楼 lyf5oo 2016-07-21 22:39发表 [回复]

感谢！这片文章对我帮助很大！但当我用这个网络实际训练时却是如下的输出：

Solving deepID_network
Learning Rate Policy: step
Iteration 0, Testing net (#0)
Test net output #0: accuracy = 0
Test net output #1: loss = 9.26645 (* 1 = 9.26645 loss)
Iteration 0, loss = 9.26654
Train net output #0: loss = 9.26654 (* 1 = 9.26654 loss)
Iteration 0, lr = 0.001
Iteration 50, loss = -8.41308e-08
Train net output #0: loss = 0 (* 1 = 0 loss)
Iteration 50, lr = 0.001
Iteration 100, loss = -8.41308e-08
。。。
Iteration 2000, loss = -8.41308e-08
然后一只是这样，loss = -8.41308e-08

不知为啥这样，请指教，谢谢！

Re: 天妒WS 2016-07-27 23:29发表 [回复]: 回复lyf5oo：CNN一般是需要大量数据才能训练好的，如果针对一个特定任务可用数据量太小的话，可以考虑在另一个较为相似的较大规模的数据库上预训练，然后Finetune这个小数据库。

Re: 天妒WS 2016-07-22 13:30发表 [回复]

回复lyf5oo：lfw人脸太少了吧，CNN需要大数据量的，建议使用CASIA-Webface

Re: lyf5oo 2016-07-23 07:17发表 [回复]: 回复a_1937：就是CASIA-Webface下不到，看页面上说需要大学申请，不对个人:(

Re: lyf5oo 2016-07-21 22:40发表 [回复]: 回复lyf5oo：我用的是lfw的人脸库训练的。

28楼 qq_34896051 2016-07-16 14:42发表 [回复]

请问博主使用的是什么型号的GPU 迭代训练一共花了多长时间我用Titian X迭代30万次预估时间要200多天。。。。。。请问调整哪些系数能加快训练谢谢

Re: 天妒WS 2016-07-17 11:08发表 [回复]: 回复qq_34896051：你一定是哪里搞错了吧，我用的也是titanx，训练3个多小时就完成了。

27楼纪阴阳 2016-07-14 13:49发表 [回复]

楼主你好，我又继续来烦你了，不好意思。。
关于LFW的测试过程，博文里提的不多，楼主简要说一下可以么？主要是测试数据怎么组织的？谢谢！

Re: 天妒WS 2016-07-15 15:52发表 [回复]

回复u012490753：测试数据就是LFW的View2协议吧，10折交叉验证，评估算法效果。

Re: yueyuecsdn 2016-08-23 21:35发表 [回复]: 回复a_1937：楼主，有关这个view2协议，有什么相关文档和实现代码可以参考吗？

Re: 纪阴阳 2016-07-18 12:38发表 [回复]: 回复a_1937：多谢楼主哈，我还想再请教一下，lfw的pair comparison测试，楼主是用pycaffe或者matcaffe自己写的么？如果是的话，图片的读取和预处理应该也是自己做的吧？请问除了减去mean face还需要什么预处理操作呢。。

如果不是用pycaffe自己写的，那是怎么做的呢？我之前train是用的digits，不过看来它应该没法搞pair comparison。楼主是又自己写了一个test的prototxt吗?

多谢了！

26楼 bomberggggg 2016-07-11 10:05发表 [回复]

楼主你好，你说的55*47不太明确，是高55，宽47吗？另外，我用webface对齐加裁剪后的图片训练，lfw测试精度只有82%，训练的精度只有50%多，和你的结果差别很大，我估计是样本有问题，我想楼主能不能把你用于训练的样本（对齐裁剪后的）打包成百度云发给大家，多谢了！

Re: 纪阴阳 2016-07-14 10:17发表 [回复]: 回复bomberggggg：层主你好，我情况跟你差不多啊，我是912个类，每个类60-100张不等，尺寸250*250（filter size跟着相应调整），但是调了很久参数准确率也只有62%……

而且我非常不能理解博主的loss/accuracy曲线为什么会有那种突降，是个step down的学习率相关吗还是为什么

25楼 bomberggggg 2016-07-11 10:05发表 [回复]: 楼主你好，你说的55*47不太明确，是高55，宽47吗？另外，我用webface对齐加裁剪后的图片训练，lfw测试精度只有82%，训练的精度只有50%多，和你的结果差别很大，我估计是样本有问题，我想楼主能不能把你用于训练的样本（对齐裁剪后的）打包成百度云发给大家，多谢了！

24楼 qq_34896051 2016-07-07 15:27发表 [回复]

你好，请问训练好model后如何计算余弦距离或者贝叶斯距离来测试？

Re: 天妒WS 2016-07-09 23:09发表 [回复]: 回复qq_34896051：你训练好了模型，然后将两幅待比对的人脸图片进行特征提取，比如deepID的160维特征向量，你就得到了两个160维特征向量，这两个特征向量就可以计算cos距离了。

23楼纪阴阳 2016-07-01 11:28发表 [回复]

楼主你好，我对你的文章的理解是这样的，不知道对不对
你的95%的正确率是verification的正确率，也就是说任务是给两张一个人或者不同人的照片然后判断是否是一个人。
但是之前训练模型时是按照分类任务进行训练的，这个训练的准确率应该没有95%这么高吧？请问大概是多少？

Re: 天妒WS 2016-07-04 13:10发表 [回复]: 回复u012490753：训练的准确率也只有70~80%

22楼 qq_32196403 2016-06-27 10:43发表 [回复]

请问博主，你的卷积核大小和stride以及pooling的size和stride是怎么选择的？

Re: 天妒WS 2016-06-28 10:30发表 [回复]: 回复qq_32196403：pooling的size和大小一般都是按照将feature map的大小减半来设计的吧，参考了vgg的，这个实验除了pooling2以外，基本与deepID1的论文结构保持一致。

21楼小古东阿杜 2016-06-23 09:45发表 [回复]

你好，请问最后用于分类的160特征保存在哪边，如何提取出来进行分类呢，非常感谢！

Re: 天妒WS 2016-06-28 10:32发表 [回复]: 回复u014661462：那个你看看tools/extract_features.cpp的源代码就清楚了吧。

Re: 天妒WS 2016-06-24 10:02发表 [回复]

回复u014661462：提取特征你可以用tools文件夹下面的extract_features.cpp或者自己写一个。特征提取过程就是网络在测试状态下的一次前向传播过程。

Re: 小古东阿杜 2016-06-24 16:07发表 [回复]: 回复a_1937：能说的再详细一点吗，刚接触caffee，还不是太熟悉，怎么利用您说的.cpp文件提取网络的特征向量呢，谢谢！

20楼 qq_32196403 2016-05-27 15:56发表 [回复]

就是楼主有像DeepID论文里将脸按照不同特征点对齐裁剪出来再训练吗？

Re: 天妒WS 2016-05-30 13:48发表 [回复]: 回复qq_32196403：这个数据库得向CASIA申请，对齐是用SDM检测关键点然后根据相似变换做的。具体的SDM算法可以参见网址http://www.cnblogs.com/cv-pr/p/4797823.html

19楼 qq_32196403 2016-05-27 15:55发表 [回复]: 或者楼主能给个数据链接吗？这个数据还得交申请，网上下载的就是一堆z01,z02什么的

18楼 qq_32196403 2016-05-27 15:51发表 [回复]: 请问楼主，那个casia_webface数据库里面webface.z01,z02是啥意思？跟那个casia_webface.zip有啥关系？还有楼主你是怎么对齐的人脸，预处理有同时对lfw和casia_webface裁剪并对齐脸吗？

17楼刘春水 2016-05-14 18:16发表 [回复]

博主您好，我最近也在复现deepid，目前还没训练完，但是发现准确率在相当长的时间停在0.5左右，我发现你给出的准确率曲线图有一个骤升的过程，这是为什么呢？

Re: 天妒WS 2016-05-16 13:25发表 [回复]

回复TeaBottle600ml：曲线突变处是因为学习补偿降低了。

Re: 纪阴阳 2016-07-14 10:19发表 [回复]: 回复a_1937：这点不太明白，google了一下也没有找到相关解释，能烦请博主多解释一下吗？

16楼 gongxuchao001 2016-05-07 10:42发表 [回复]

感谢您的回复，是这样的，我直接作cos距离的时候统计了一下，相同人脸的相似度有很多比不同人脸的还低，整体准确率也就在50%左右，我也试过别人训练的模型也都差不多是这个准确率，这是啥原因呢？是不是简单的特征比对有问题？多谢了！

Re: K3832127 2016-05-12 14:47发表 [回复]: 回复gongxuchao001：胸弟，你叼。你要知道随便设阈值做分割时，都至少有50%

Re: 天妒WS 2016-05-09 18:31发表 [回复]: 回复gongxuchao001：我猜可能的原因：1、模型没训练好，以LFW为测试基准，看看你的模型在LFW上的准确率； 2、测试的时候，训练数据是怎么预处理的，测试数据也怎么预处理；3、画出ROC曲线，选取一个最好的阈值。

15楼 gongxuchao001 2016-05-06 17:33发表 [回复]

您好我最近在复现deepid，已经训练完成，比对的时候我按照您博客里的方式提取了160维特征，直接用cos距离做的匹配，不是同一张人脸的相似度也都很高，请问是我度量的方式有问题么？

Re: 天妒WS 2016-05-06 20:01发表 [回复]: 回复gongxuchao001：不是同一个人的分数也很高这很正常，本身这个deepID网络训练好后在LFW上的识别率也才96左右，也就是说还是有那么一些不是同一个人的人脸图片被当成同一个人脸的图片，度量方式并没有任何问题。而且你还得选择一个阈值，使得在LFW上的识别率最高，也就是那个ROC曲线中你选取的阈值。当两张人脸分数大于这个阈值为同一个人，小于时为不同的人。这个结果告诉你你大概有96%的信心相信预测结果是正确的。

14楼 zeromike 2016-05-03 19:28发表 [回复]: 楼主你好，我最近第一次接触caffe，图片的预处理，lmdb转换，caffe的一些细节都不太熟练，不知如何下手，楼主可不可以发我一份完整code让我参考一下

13楼 Sunshine_in_Moon 2016-05-03 10:33发表 [回复]

楼主你好，我看到你的test精度没有达到80%，为什么在lFW上测试能达到90%以上呢？差别为什么这么大？

Re: 天妒WS 2016-05-03 10:40发表 [回复]

回复Sunshine_in_Moon：那个test是在CASIA上的准确率，其实就是用来指示什么时候训练可以结束的标识而已。跟LFW上的准确率并无任何关系。

Re: Sunshine_in_Moon 2016-05-04 10:20发表 [回复]: 回复a_1937：谢谢！

12楼 xubokun1992 2016-04-11 09:48发表 [回复]

 
      [html] 
        view plain 
       copy 
       print ? 
     
 楼主你好，我最近也在学习研究deepid。我目前也在caffe的平台上做这个，关于deepid1的版本论文：Deep learning face representation from predicting 10000 class，这个应该是你复现的版本。我想请教一下，论文中提到的在第三层卷积层的的权值局部共享(locally shared in every 2*2 regions)，然后在第四层全部不共享（totally unshared），您是怎么实现的？我看您在con3、con4的定义中没有什么特别的地方，还是说您在pathon代码中实习的？  
 还是说您没有加这两个特性，发现跑出来的结果也还不错？  

Re: 天妒WS 2016-04-11 10:25发表 [回复]: 回复xubokun1992：第3，4个卷积层我用的就是普通的卷积，没有用局部权值不共享的那种卷积层，caffe里面有那种局部权重不共享的那种卷积，叫做local卷积，但是local卷积实现得不好，速度非常慢，而且大大增加了参数量，所以我没有用，我发现用普通的卷积效果就不错额

11楼 xubokun1992 2016-04-11 09:46发表 [回复]: 楼主你好，我最近也在学习研究deepid。我目前也在caffe的平台上做这个，关于deepid1的版本论文：Deep learning face representation from predicting 10000 class，这个应该是你复现的版本。我想请教一下，论文中提到的在第三层卷积层的的权值局部共享(locally shared in every 2*2 regions)，然后在第四层全部不共享（totally unshared），您是怎么实现的？我看您在con3、con4的定义中没有什么特别的地方，还是说您在pathon代码中实习的？
还是说您没有加这两个特性，发现跑出来的结果也还不错？

10楼 csuwujiyang 2016-04-05 15:25发表 [回复]

博主您好，看评论中您说输入的图像是55x47，那这个尺寸是如何计算得到的呢？谢谢！

Re: 天妒WS 2016-04-06 09:58发表 [回复]

回复u013078356：CASIA-Webface的人脸尺寸大约在55像素左右，考虑到人脸是类似矩形的，而且DeepID论文中也是55*47的，所以这里就用的55*47，这种尺寸的人脸包含的背景较少哦。

Re: csuwujiyang 2016-04-06 14:30发表 [回复]

回复a_1937：还有一个问题就是，我看了一下您的网络结构定义，应该就是deepid2论文中的定义结构吧，那么第二个池化层pool2的stride不应该也是2吗，为什么你的是1呢？

Re: 天妒WS 2016-04-06 14:36发表 [回复]: 回复u013078356：原始论文中,pooling层的stride的确全部是2，这里是因为当时一时疏忽，而且，我自己做实验发现，pool2得stride设为1要比stride2的识别率高，这应该是因为增加了网络参数所致的吧。你也可以直接设为2呢。

9楼 qq_31557779 2016-03-29 14:44发表 [回复]

您好我做完了对齐，在将图像数据转换为lmdb的时候我有10575类人的图像，难道要针对每一个人都写一条语句吗？有没有批量转换的方法？

Re: 天妒WS 2016-03-30 21:09发表 [回复]

回复qq_31557779：转化lmdb有现成的转化程序啊/

Re: qq_31557779 2016-04-06 09:10发表 [回复]

回复a_1937：您好，能加一下您的QQ吗？有些问题还想向您请教，麻烦您了。

Re: 天妒WS 2016-04-06 14:38发表 [回复]

回复qq_31557779：什么问题，请说吧，我晓得的一定及时回复。

Re: 天妒WS 2016-04-06 14:39发表 [回复]: 回复a_1937：1207991086

8楼班长管班干部 2016-03-25 20:51发表 [回复]

请问博主的prepare_deepId_data_dif('CASIA-Webface/','dataset', 20, True)中的20指什么

Re: 天妒WS 2016-03-28 13:23发表 [回复]: 回复xuhang0910：20指的是确保每类图片不得少于20张

7楼 qq_31557779 2016-03-24 10:30发表 [回复]

您好，我是一名本科生，本科毕业设计要做这个东西，我现在caffe配置好了，也申请到了李子青团队的人脸数据，但是现在很迷茫，不知道接下来该怎么做，能给些意见吗？

Re: 天妒WS 2016-03-24 11:24发表 [回复]: 回复qq_31557779：先按照deepID论文用sdm进行人脸对齐，然后可以参考本文给出的网络结构进行训练。然后就可以得出一个还算过得去的识别率。

6楼 qq_31557779 2016-03-24 10:29发表 [回复]: 您好，我是一名本科生，本科毕业设计要做这个东西，我现在caffe配置好了，也申请到了李子青团队的人脸数据，但是现在很迷茫，不知道接下来该怎么做，能给些意见吗？

5楼 qq_31557779 2016-03-24 10:28发表 [回复]: 您好，我是一名本科生，本科毕业设计要做这个东西，我现在caffe配置好了，也申请到了李子青团队的人脸数据，但是现在很迷茫，不知道接下来该怎么做，能给些意见吗？

4楼班长管班干部 2016-03-21 00:17发表 [回复]

请问博主的prepare_deepId_data.py是干什么的？就是生成train.txt和val.txt的吗？
第2个问题是，我一直不明白DeepID产生的特征后训练分类器的是哪部分代码？

Re: 天妒WS 2016-03-23 16:37发表 [回复]

回复xuhang0910：prepare_deepId_data.py就是用来划分训练集和验证集的，deepID产生的特征你可以直接计算余弦距离或者用该特征训练一个joiint Bayesian分类器。我没有贴出joint Bayesian的代码，网上有相关的matlab和python代码。

Re: 班长管班干部 2016-03-24 23:35发表 [回复]: 回复a_1937：那么deepid得到的特征保存在哪里？

3楼 Nan_cy 2016-03-07 16:53发表 [回复]

你好，我用的是CASIA-Webface，这个数据库共10575类，人脸数据是自己对齐成55x47大小的RGB图像，按照楼主的网络结构训练，但不收敛，不知道为什么，望赐教,在此谢谢了！

Re: qq_31557779 2016-03-29 14:52发表 [回复]: 回复shixiaoli1094：您好我也在做这方面的东西，有些不懂的可以向您请教一下吗？我做完图像对齐后，要将图像数据转换为lmdb的时候我有10575类人的图像，难道要针对每一个人都写一条语句吗？有没有批量转换的方法？

Re: 天妒WS 2016-03-09 09:56发表 [回复]

回复shixiaoli1094：你试着确保你减了均值，然后，你试着将初始的学习率降低，比如base_lr=0.001,一般这样会收敛。

Re: Nan_cy 2016-03-16 10:31发表 [回复]: 回复a_1937：好的，我试试，非常感谢

2楼 xgbhk2 2016-02-26 09:10发表 [回复]

你好，文中说到：
让训练集的每一类数目完全一样，比如我的实验中为训练集每个人50张图片。
怎么我拿到的数据集里只有2500个人左右有超过50张图片？你用的是webface里面的normalize face中扩展加入mirror的那一部分吗？即便用那个翻倍了之后我用你的程序跑也没有10499类，是我哪里搞错了吗？

Re: 天妒WS 2016-03-01 18:24发表 [回复]: 回复xgbhk2：我用的是CASIA-Webface，这个数据库共10575类，每一类很不均衡，当时我训练的时候，没有多少经验，所以训练的时候训练集的类别不至于数量太不均衡。其实你可以忽略这篇博客的数据组织方式。我后来的数据组织方式是，将10575类中每一类随机拿出2张图片作为验证集，然后其余的全部作为训练集，然后训练，然后在lfw上的结果是（joint bayesian）96.22%。

1楼 nuohanfengyun 2016-01-21 09:29发表 [回复] [引用] [举报]

你好，我使用你搭建的网络进行训练，为什么训练不收敛呢？麻烦大神不吝赐教，谢谢！

Re: 天妒WS 2016-01-25 10:52发表 [回复] [引用] [举报]

回复nuohanfengyun：你的数据是人脸数据是对齐了的么，输入图像是55x47大小的RGB

Re: 落目白昨天 19:55发表 [回复] [引用] [举报]: 回复a_1937：你好，请问你的切图是按照论文上的还是每个人脸切割一张的呢？

你可能感兴趣的:(使用Caffe复现DeepID实验)

使用 Path 对象来定义路径 kimi-222 人工智能机器学习算法
1.relative_to方法用于获取一个路径相对于另一个路径的相对路径。下面是一个详细的示例，帮助你更好地理解relative_to的用法。示例假设我们有以下路径结构：base_dir/subdir1/file1.txtsubdir2/file2.txt代码示例frompathlibimportPath#定义基础路径base_dir=Path('/path/to/base_dir')#定义子路径
Apache Storm：实时数据处理的闪电战 Aaron_945 Java apache storm 大数据
文章目录ApacheStorm原理拓扑结构数据流处理容错机制官网链接基础使用安装与配置编写拓扑提交与运行高级使用状态管理窗口操作多语言支持优点高吞吐量低延迟可扩展性容错性总结ApacheStorm是一个开源的分布式实时计算系统，它允许你以极高的吞吐量处理无界数据流。Storm被广泛用于实时分析、在线机器学习、连续计算等多种场景。本文将深入探讨ApacheStorm的原理、基础使用、高级特性及其优点
计算机毕业设计之基于Hadoop的热点新闻分析系统的设计与实现微信bishe69 课程设计 python django mysql
近些年来，随着科技的飞速发展，互联网的普及逐渐延伸到各行各业中，给人们生活带来了十分的便利，热点新闻分析系统利用计算机网络实现信息化管理，使整个热点新闻分析的发展和服务水平有显著提升。本文拟采用PyCharm开发工具，django框架、Python语言、Hadoop大数据处理技术进行开发，后台使用MySQL数据库进行信息管理，设计开发的热点新闻分析系统。通过调研和分析，系统拥有管理员和用户两个模块
css动画详解丸子猪的dady css 前端 html
过渡：transitiontransition的中文含义是过渡。过渡是CSS3中具有颠覆性的一个特征，可以实现元素不同状态间的平滑过渡（补间动画），经常用来制作动画效果。transition包括以下属性：transition-property:all;如果希望所有的属性都发生过渡，就使用all。transition-property:width，意思是只让盒子的宽度在变化时进行过渡transiti
【一起学Rust | Tauri2.0框架】基于 Rust 与 Tauri 2.0 框架实现生物识别（指纹识别）应用广龙宇 Tauri2应用开发一起学Rust rust 开发语言后端
前言Tauri，作为一个新兴的跨平台应用开发框架，允许开发者使用Web前端技术构建界面，并利用Rust的高性能和安全性编写后端逻辑。这种架构巧妙地结合了Web的灵活性和原生应用的性能，为开发者提供了一种构建高效、跨平台应用的全新选择。而生物识别技术，如指纹识别、面部识别等，则为应用安全提供了更高级别的保障。将生物识别技术集成到Tauri应用中，可以提升用户体验，增强应用安全性。试想一下，用户只需轻
阿里云ECS服务器挂载数据盘教程（Linux） A5云服务商服务器阿里云 linux 云计算运维运维开发
阿里云ECS服务器挂载数据盘教程（Linux）在阿里云上挂载磁盘的过程可以分为几个步骤。以下是一个详细的教程，帮助你在阿里云的云服务器（ECS）上挂载磁盘。如需要阿里云的代理商可以联系我，主页有信息，阿里云可返20个点。步骤1：创建并挂载云盘登录阿里云控制台访问阿里云控制台并使用你的账号登录。创建云盘在控制台左侧菜单中，选择“云服务器ECS”。找到并选择你要挂载磁盘的实例。在实例详情页面，点击“云
开源的 AntDesignVue 表单设计器使用教程低代码研究员 FormCreate 开源 FormCreate vue.js 表单设计器 ant-design-vue
FcDesigner版是一款基于Vue3.0的低代码可视化表单设计器工具，通过数据驱动表单渲染。可以通过拖拽的方式快速创建表单，提高开发者对表单的开发效率，节省开发者的时间。并广泛应用于在政务系统、OA系统、ERP系统、电商系统、流程管理等领域。源码地址:Github|Gitee|文档|在线演示本项目采用Vue3.0和AntDesignVue进行页面构建，内置多语言解决方案，支持二次扩展开发，支持
vue2 el-table跨分页多选以及多选回显 snows_l 前端开发 element-ui vue2 前端 elementui vue.js
个人博客|snows_l.sBLIOGhttp://snows-l.site一、多选1、特别注意的属性以及方法：:row-key="(_)=>_.mac":reserve-selection="true"@select="handleSelectionChange"@select-all="handleSelectionChangeAll"详情以及使用方法位置请查看代码2、代码：1）、templa
Spring Boot 整合 Elasticsearch 实践：从入门到上手遇见伯灵说 mysql Spring elasticsearch jenkins springboot
引言Elasticsearch是一个开源的分布式搜索引擎，广泛用于日志分析、搜索引擎、数据分析等场景。本文将带你通过一步步的教程，在SpringBoot项目中整合Elasticsearch，轻松实现数据存储与查询。1.创建SpringBoot项目首先，你需要创建一个SpringBoot项目。如果你还没有创建，可以使用SpringInitializr快速生成一个项目。在生成项目时，确保选择了以下依赖
6-NBDG 葡萄糖摄取荧光探针，使用方法和注意事项强化生物实验室 leetcode 决策树最小二乘法散列表逻辑回归启发式算法支持向量机
一、试剂描述6-NBDG，一种非水解形式的脱氧葡萄糖类似物的荧光素，可用来监测分离活细胞和完整组织对葡萄糖的摄取和转运，判断细胞活力的指标之一。可用实时共聚焦、高分辨率或宽视野荧光显微镜，以及流式细胞仪来检测。尽管6-NBDG荧光对环境比较敏感，但约在465/540nm下表现出激发和发射波长，使用荧光素（如FITC）的光学滤片来进行结果观察即可。二、试剂信息英文名称：6-(N-(7-Nitrobe
【含文档+PPT+源码】基于SpringBoot+vue的疫苗接种系统的设计与实现小咕聊编程 spring boot 后端 java
项目介绍本课程演示的是一款基于SpringBoot+vue的疫苗接种系统的设计与实现，主要针对计算机相关专业的正在做毕设的学生与需要项目实战练习的Java学习者。1.包含：项目源码、项目文档、数据库脚本、软件工具等所有资料2.带你从零开始部署运行本套系统3.该项目附带的源码资料可作为毕设使用疫苗接种系统包括管理员登录、用户管理、疫苗信息管理、疫苗接种管理、接种管理、疫苗百科知识管理、消息通知管理、
告别繁琐！5分钟搞定Linux上MySQL 8安装，小白也能轻松上手！ IT_狂奔者 Databases linux mysql 运维
概述MySQL是一个广泛使用的开源关系型数据库管理系统，适用于各种规模的应用程序。MySQL8引入了许多新特性和性能改进，因此在Linux服务器上安装MySQL8是一个常见的需求。本文将指导大家如何在Linux系统上安装MySQL8，并假设已经完成了安装过程。我们将重点放在安装后的配置和使用上。目录概述一、安装MySQL8.x及配置1.1安装1.2使用方法1.2.1赋予执行权限1.2.2运行脚本1
嵌入式软件开发常用的3种架构 an520_ stm32 智能家居嵌入式开发 stm32 单片机 arm 学习嵌入式硬件
摘要：对于单片机程序来说，大家都不陌生，但是真正使用架构，考虑架构的恐怕并不多，随着程序开发的不断增多，架构是非常必要的。应用程序的架构大致有三种：1、简单的前后台顺序执行程序，这类写法是大多数人使用的方法，不需用思考程序的具体架构，直接通过执行顺序编写应用程序即可。2、时间片轮询法，此方法是介于顺序执行与操作系统之间的一种方法。3、操作系统，此法应该是应用程序编写的最高境界。一、程序框架设计1、
DeepSeek从入门到精通「清华团队」 YuKeeHgg DeepSeek 人工智能 ai
由清华大学新闻与传播学院新媒体研究中心元宇宙文化实验室的余梦珑博士后及其团队撰写文档的核心内容围绕DeepSeek的技术特点、应用场景、使用方法以及如何通过提示语设计提升AI使用效率等方面展开，帮助用户从入门到精通DeepSeek的使用。「文末附下载方式」第一部分：DeepSeek基础概念1.1DeepSeek简介定义：专注通用人工智能（AGI）的中国科技公司，主攻大模型研发与应用。核心产品：开源
2.git和github操作：diff链接 MY Daisy 工具 git github
目录1.获取差异链接的核心方法方法1：通过分支/提交比较生成链接（适用于GitHub/GitLab/Bitbucket）方法2：使用单次提交的差异链接（查看某次提交的改动）方法3：通过PullRequest（PR）/MergeRequest（MR）2.快速生成diff链接的步骤Step1.获取提交哈希（或分支名称）Step2.拼接平台URLStep3.直接访问链接3.各平台差异链接格式对照表4.自
PyArmor：一个超级厉害的 Python 库！一只蜗牛儿 python 开发语言
在Python的世界里，如何保护我们的代码不被轻易盗用或者破解，一直是开发者们关注的问题。尤其是在发布软件时，如何有效防止源代码泄漏或者被逆向工程分析，成为了一个重要课题。PyArmor作为一款强大的Python加密工具，能够帮助开发者对Python源代码进行加密保护，防止非法复制和破解。本文将全面介绍PyArmor，并通过代码示例展示如何使用它对Python脚本进行加密、打包和保护。1.PyAr
「清华大学、北京大学」DeepSeek 课件PPT专栏 YuKeeHgg DeepSeek AI 华彬智融知识库 DeepSeek ai 华彬智融
你要的这里都打包好啦，快快收藏起来！名称链接团队简介类型DeepSeek——从入门到精通1️⃣DeepSeek从入门到精通「清华团队」清华大学新闻与传播学院新媒体研究中心元宇宙文化实验室PPT课件DeepSeek如何赋能职场应用?——从提示语技巧到多场景应用2️⃣DeepSeek赋能职场应用「清华团队」中央民族大学新闻与传播学院清华大学@新媒沈阳团队向安玲PPT课件普通人如何抓住DeepSeek红
Yolov8训练自己的数据集(脱离ultralytics库) 爱吃肉的鹏 YOLO
最近在整理关于yolov8的相关内容，有个很大的问题，抛开yolov8性能不谈，yolov8代码的使用灵活性不如yolov5，尤其是对于一些新手或者对yolo框架不是很熟悉的人(这也是因人而异，有些人可能会喜欢v8代码的使用方式)。比如在使用v8的时候需要安装ultralytics库，然后再调用YOLO进行训练或者预测，那么就有这几个问题：问题1：安装了ultralytics库后如何使用YOLO呢
使用AI python实现将前端angularjs工程转换成vue工程案例银行金融科技前端人工智能 python
以下是一个结合Python和AI技术实现AngularJS到Vue工程迁移的完整案例，包含关键转换策略和代码实现：案例背景目标：将使用AngularJS1.x的电商后台管理系统转换为Vue3工程，主要转换以下部分：模板语法控制器逻辑服务依赖路由配置状态管理原始AngularJS代码片段：javascript//app.jsangular.module('app',['ui.router']).co
【从零开始：如何用Vue3打造响应式个人博客网站】小怪兽9699 vue.js javascript ecmascript
前言在前端开发领域，Vue.js是一个非常流行且强大的框架。本文将详细介绍如何使用Vue3构建一个完整的响应式个人博客网站。无论你是初学者还是有一定经验的开发者，本文都将为你提供详细的步骤和代码示例。1.环境搭建首先，确保你已经安装了Node.js和npm。然后，全局安装VueCLI：npminstall-g@vue/cli2.项目初始化使用VueCLI创建一个新的Vue项目：vuecreatem
HTTPS通信（握手）过程 IT运维成长心得 https 网络协议
HTTPS通信（即超文本传输安全协议）的握手过程是确保通信双方安全交换数据的关键步骤。以下是HTTPS握手过程的详细步骤：客户端发起请求：客户端（通常是浏览器）向服务器发起HTTPS请求。服务器响应：服务器收到请求后，会回应一个数字证书。这个证书是由一个受信任的第三方（证书颁发机构，CA）签发的，包含了服务器的公钥、服务器信息以及CA的签名。客户端验证证书：客户端使用内置的CA证书库来验证服务器的
python反爬虫处理--处理验证码（Tesseract 库）的安装与使用范哥来了 python 爬虫开发语言
处理验证码是反爬虫策略中常见的挑战之一。在Python中，可以采用多种方法来解决这一问题，具体取决于验证码的类型（如文本、图像或滑块验证等）。以下是一些常用的解决方案：对于简单的文字或数字验证码：如果网站使用的是相对简单的验证码形式，您可以尝试使用OCR(OpticalCharacterRecognition,光学字符识别)技术来自动识别这些验证码。Python中有一个叫做Tesseract的库，
python爬虫 Selenium库安装与使用范哥来了 python 爬虫 selenium
Selenium是一个强大的自动化测试工具，它也可以用来进行网页抓取。与传统的请求库（如requests）不同，Selenium可以模拟真实用户的行为，比如点击按钮、填写表单等，这对于那些依赖于JavaScript动态加载内容的网站来说非常有用。安装Selenium首先确保你的环境中已经安装了Python和pip。然后通过pip安装Selenium：pipinstallselenium如果你使用的
python爬虫项目范哥来了 python 爬虫开发语言
项目名称：国家自然科学基金大数据知识管理服务门户爬取项目爬取内容：爬取内容：资助项目爬取链接：HTTP://KD.NSFC.GOV.CN/BASEQUERY/SUPPORTQUERY为了完成“国家自然科学基金大数据知识管理服务门户”的资助项目信息爬取任务，我们需要设计一个网络爬虫。考虑到目标网站的具体情况，我们将采用Python语言结合requests库来处理HTTP请求，以及使用Beautifu
Spring Boot项目如何使用MyBatis实现分页查询 m0_74825003 面试学习路线阿里巴巴 spring boot mybatis 数据库
写在前面：大家好！我是。如果博客中有不足或者的错误的地方欢迎在评论区或者私信我指正，感谢大家的不吝赐教。我的唯一博客更新地址是：https://ac-fun.blog.csdn.net/。非常感谢大家的支持。一起加油，冲鸭！用知识改变命运，用知识成就未来！加油(???o??)?(???o??)?文章目录为什么需要分页查询减少数据库压力减少网络传输数据量提高系统的稳定性提升用户体验原始的实现方式计算
表格的属性花林似霰f html 前端
表格标签属性实际开发并不使用，仅做了解，实际开发会使用CSS。属性名·属性值描述alignleftcenterrightborder1或""规定表格单元是否有边框，默认为无cellpadding像素值规定单元格与其内容之间的空白，默认1像素cellspacing像素值规定单元格之间的距离width/height像素值或百分比规定表格宽度/高度
PostgreSQL 数据库简介 dazhong2012 数据库数据库 postgresql
一、PostgreSQL简介PostgreSQL（通常简称为Postgres）是一种功能强大的开源对象关系型数据库系统。它以其高度的可靠性和灵活性而闻名，支持复杂的查询、数据完整性、可扩展性以及对多种数据类型的处理。主要特点：开源和免费：PostgreSQL是完全开源的，采用PostgreSQLLicense，允许用户免费使用、修改和分发。对象关系型数据库：它不仅支持传统的关系型数据库功能，还支持
如何针对大Excel做文件读取？ F_windy excel
针对大Excel文件（如超过百万行）的读取，传统的一次性加载到内存的方式会导致内存溢出（OOM），需采用流式读取（Streaming）或分块读取（Chunk）的策略。以下是具体方案及优化建议：一、核心解决方案1.使用ApachePOI的SAX模式（事件驱动）适用场景：处理.xlsx文件（不支持.xls），逐行解析避免内存溢出。代码示例（Java）：importorg.apache.poi.open
Transformer精选问答 EmbodiedTech 大模型人工智能 transformer 深度学习人工智能
Transformer精选问答1Transformer各自模块作用Encoder模块经典的Transformer架构中的Encoder模块包含6个EncoderBlock.每个EncoderBlock包含两个子模块,分别是多头自注意力层,和前馈全连接层.多头自注意力层采用的是一种ScaledDot-ProductAttention的计算方式,实验结果表明,Multi-head可以在更细致的层面上提
C++ 树状数组 LIUJH1233 c++开发语言
一.树状数组是什么?二.树状数组的特性？可以解决大部分区间上面的修改以及查询的问题，例如1.单点修改，单点查询，2.区间修改，单点查询，3.区间查询，区间修改等问题；三.树状数组讲解lowbit的使用如何计算一个非负整数n在二进制下的最低为1及其后面的0构成的数？答案就是lowbit(x)。那么lowbit运算时怎么实现的呢？44的二进制=(101100)，我们对44的二进制数取反+1，也即~44
矩阵求逆（JAVA）利用伴随矩阵 qiuwanchi 利用伴随矩阵求逆矩阵
package gaodai.matrix; import gaodai.determinant.DeterminantCalculation; import java.util.ArrayList; import java.util.List; import java.util.Scanner; /** * 矩阵求逆(利用伴随矩阵) * @author 邱万迟
单例（Singleton）模式 aoyouzi 单例模式 Singleton
3.1 概述如果要保证系统里一个类最多只能存在一个实例时，我们就需要单例模式。这种情况在我们应用中经常碰到，例如缓存池，数据库连接池，线程池，一些应用服务实例等。在多线程环境中，为了保证实例的唯一性其实并不简单，这章将和读者一起探讨如何实现单例模式。 3.2
[开源与自主研发]就算可以轻易获得外部技术支持,自己也必须研发 comsci 开源
现在国内有大量的信息技术产品，都是通过盗版，免费下载，开源，附送等方式从国外的开发者那里获得的。。。。。。虽然这种情况带来了国内信息产业的短暂繁荣，也促进了电子商务和互联网产业的快速发展，但是实际上，我们应该清醒的看到，这些产业的核心力量是被国外的
页面有两个frame,怎样点击一个的链接改变另一个的内容 Array_06 UI XHTML
<a src="地址" targets="这里写你要操作的Frame的名字" />搜索然后你点击连接以后你的新页面就会显示在你设置的Frame名字的框那里 targerts="",就是你要填写目标的显示页面位置 ===================== 例如： <frame src=&
Struts2实现单个/多个文件上传和下载 oloz 文件上传 struts
struts2单文件上传：步骤01:jsp页面  　　<form action="fileUplo
推荐10个在线logo设计网站 362217990 logo
在线设计Logo网站。 1、http://flickr.nosv.org（这个太简单） 2、http://www.logomaker.com/?source=1.5770.1 3、http://www.simwebsol.com/ImageTool 4、http://www.logogenerator.com/logo.php?nal=1&tpl_catlist[]=2 5、ht
jsp上传文件香水浓 jsp fileupload
1. jsp上传 Notice： 1. form表单 method 属性必须设置为 POST 方法，不能使用 GET 方法 2. form表单 enctype 属性需要设置为 multipart/form-data 3. form表单 action 属性需要设置为提交到后台处理文件上传的jsp文件地址或者servlet地址。例如 uploadFile.jsp 程序文件用来处理上传的文
我的架构经验系列文章 - 前端架构 agevs JavaScript Web 框架 UI jQuer
框架层面：近几年前端发展很快，前端之所以叫前端因为前端是已经可以独立成为一种职业了，js也不再是十年前的玩具了，以前富客户端RIA的应用可能会用flash/flex或是silverlight，现在可以使用js来完成大部分的功能，因此js作为一门前端的支撑语言也不仅仅是进行的简单的编码，越来越多框架性的东西出现了。越来越多的开发模式转变为后端只是吐json的数据源，而前端做所有UI的事情。MVCMV
android ksoap2 中把XML(DataSet) 当做参数传递 aijuans android
我的android app中需要发送webservice ，于是我使用了 ksop2 进行发送，在测试过程中不是很顺利,不能正常工作.我的web service 请求格式如下 [html] view plain copy <Envelope xmlns="http://schemas.
使用Spring进行统一日志管理 + 统一异常管理 baalwolf spring
统一日志和异常管理配置好后，SSH项目中，代码以往散落的log.info() 和 try..catch..finally 再也不见踪影！统一日志异常实现类： [java] view plain copy package com.pilelot.web.util; impor
Android SDK 国内镜像 BigBird2012 android sdk
一、镜像地址： 1、东软信息学院的 Android SDK 镜像，比配置代理下载快多了。配置地址， http://mirrors.neusoft.edu.cn/configurations.we#android 2、北京化工大学的： IPV4:ubuntu.buct.edu.cn IPV4:ubuntu.buct.cn IPV6:ubuntu.buct6.edu.cn
HTML无害化和Sanitize模块 bijian1013 JavaScript AngularJS Linky Sanitize
一.ng-bind-html、ng-bind-html-unsafe AngularJS非常注重安全方面的问题，它会尽一切可能把大多数攻击手段最小化。其中一个攻击手段是向你的web页面里注入不安全的HTML，然后利用它触发跨站攻击或者注入攻击。考虑这样一个例子，假设我们有一个变量存
[Maven学习笔记二]Maven命令 bit1129 maven
mvn compile compile编译命令将src/main/java和src/main/resources中的代码和配置文件编译到target/classes中，不会对src/test/java中的测试类进行编译 MVN编译使用 maven-resources-plugin:2.6:resources maven-compiler-plugin:2.5.1:compile &nbs
【Java命令二】jhat bit1129 Java命令
jhat用于分析使用jmap dump的文件，，可以将堆中的对象以html的形式显示出来，包括对象的数量，大小等等，并支持对象查询语言。 jhat默认开启监听端口7000的HTTP服务，jhat是Java Heap Analysis Tool的缩写 1. 用法： [hadoop@hadoop bin]$ jhat -help Usage: jhat [-stack <bool&g
JBoss 5.1.0 GA:Error installing to Instantiated: name=AttachmentStore state=Desc ronin47
进到类似目录 server/default/conf/bootstrap，打开文件 profile.xml找到： Xml代码<bean name="AttachmentStore" class="org.jboss.system.server.profileservice.repository.AbstractAtta
写给初学者的6条网页设计安全配色指南 brotherlamp UI ui自学 ui视频 ui教程 ui资料
网页设计中最基本的原则之一是，不管你花多长时间创造一个华丽的设计，其最终的角色都是这场秀中真正的明星——内容的衬托我仍然清楚地记得我最早的一次美术课，那时我还是一个小小的、对凡事都充满渴望的孩子，我摆放出一大堆漂亮的彩色颜料。我仍然记得当我第一次看到原色与另一种颜色混合变成第二种颜色时的那种兴奋，并且我想，既然两种颜色能创造出一种全新的美丽色彩，那所有颜色
有一个数组，每次从中间随机取一个，然后放回去，当所有的元素都被取过，返回总共的取的次数。写一个函数实现。复杂度是什么。 bylijinnan java 算法面试
import java.util.Random; import java.util.Set; import java.util.TreeSet; /** * http://weibo.com/1915548291/z7HtOF4sx * #面试题#有一个数组，每次从中间随机取一个，然后放回去，当所有的元素都被取过，返回总共的取的次数。 * 写一个函数实现。复杂度是什么
struts2获得request、session、application方式 chiangfai application
1、与Servlet API解耦的访问方式。 a.Struts2对HttpServletRequest、HttpSession、ServletContext进行了封装，构造了三个Map对象来替代这三种对象要获取这三个Map对象，使用ActionContext类。 -----> package pro.action; import java.util.Map; imp
改变python的默认语言设置 chenchao051 python
import sys sys.getdefaultencoding() 可以测试出默认语言，要改变的话，需要在python lib的site-packages文件夹下新建： sitecustomize.py，这个文件比较特殊，会在python启动时来加载，所以就可以在里面写上： import sys sys.setdefaultencoding('utf-8') &n
mysql导入数据load data infile用法 daizj mysql 导入数据
我们常常导入数据！mysql有一个高效导入方法，那就是load data infile 下面来看案例说明基本语法： load data [low_priority] [local] infile 'file_name txt' [replace | ignore] into table tbl_name [fields [terminated by't'] [OPTI
phpexcel导入excel表到数据库简单入门示例 dcj3sjt126com PHP Excel
跟导出相对应的，同一个数据表，也是将phpexcel类放在class目录下，将Excel表格中的内容读取出来放到数据库中 <?php error_reporting(E_ALL); set_time_limit(0); ?> <html> <head> <meta http-equiv="Content-Type"
22岁到72岁的男人对女人的要求 dcj3sjt126com
22岁男人对女人的要求是：一，美丽，二，性感，三，有份具品味的职业，四，极有耐性，善解人意，五，该聪明的时候聪明，六，作小鸟依人状时尽量自然，七，怎样穿都好看，八，懂得适当地撒娇，九，虽作惊喜反应，但看起来自然，十，上了床就是个无条件荡妇。 32岁的男人对女人的要求，略作修定，是：一，入得厨房，进得睡房，二，不必服侍皇太后，三，不介意浪漫蜡烛配盒饭，四，听多过说，五，不再傻笑，六，懂得独
Spring和HIbernate对DDM设计的支持 e200702084 DAO 设计模式 spring Hibernate 领域模型
A：数据访问对象 DAO和资源库在领域驱动设计中都很重要。DAO是关系型数据库和应用之间的契约。它封装了Web应用中的数据库CRUD操作细节。另一方面，资源库是一个独立的抽象，它与DAO进行交互，并提供到领域模型的“业务接口”。资源库使用领域的通用语言，处理所有必要的DAO，并使用领域理解的语言提供对领域模型的数据访问服务。
NoSql 数据库的特性比较 geeksun NoSQL
Redis 是一个开源的使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库，并提供多种语言的API。目前由VMware主持开发工作。 1. 数据模型作为Key-value型数据库，Redis也提供了键（Key）和值（Value）的映射关系。除了常规的数值或字符串，Redis的键值还可以是以下形式之一： Lists （列表） Sets
使用 Nginx Upload Module 实现上传文件功能 hongtoushizi nginx
转载自： http://www.tuicool.com/wx/aUrAzm 普通网站在实现文件上传功能的时候，一般是使用Python，Java等后端程序实现，比较麻烦。Nginx有一个Upload模块，可以非常简单的实现文件上传功能。此模块的原理是先把用户上传的文件保存到临时文件，然后在交由后台页面处理，并且把文件的原名，上传后的名称，文件类型，文件大小set到页面。下
spring-boot-web-ui及thymeleaf基本使用 jishiweili spring thymeleaf
视图控制层代码demo如下： @Controller @RequestMapping("/") public class MessageController { private final MessageRepository messageRepository; @Autowired public MessageController(Mes
数据源架构模式之活动记录 home198979 PHP 架构活动记录数据映射
hello!架构一、概念活动记录（Active Record）：一个对象，它包装数据库表或视图中某一行，封装数据库访问，并在这些数据上增加了领域逻辑。对象既有数据又有行为。活动记录使用直截了当的方法，把数据访问逻辑置于领域对象中。二、实现简单活动记录活动记录在php许多框架中都有应用，如cakephp。 <?php /** * 行数据入口类 *
Linux Shell脚本之自动修改IP pda158 linux centos Debian 脚本
作为一名 Linux SA，日常运维中很多地方都会用到脚本，而服务器的ip一般采用静态ip或者MAC绑定，当然后者比较操作起来相对繁琐，而前者我们可以设置主机名、ip信息、网关等配置。修改成特定的主机名在维护和管理方面也比较方便。如下脚本用途为：修改ip和主机名等相关信息，可以根据实际需求修改，举一反三！ #!/bin/sh #auto Change ip netmask ga
开发环境搭建独浮云 eclipse jdk tomcat
最近在开发过程中，经常出现MyEclipse内存溢出等错误，需要重启的情况，好麻烦。对于一般的JAVA+TOMCAT项目开发，其实没有必要使用重量级的MyEclipse，使用eclipse就足够了。尤其是开发机器硬件配置一般的人。 &n