风翼冰舟

卷积RBM源码解读

前言

卷积RBM相对RBM来说具有很多优势，详细的我也不说了，看文章就行。主要还是为了加深自己对细节部分的理解吧。

国际惯例，贴几个链接

卷积RBM的创始人Honglak Lee：http://web.eecs.umich.edu/~honglak/hl_publications.html#embc15

可以从他的主页上找到两篇与卷积RBM相关的文献，我也顺便传到CSDN上了，赚两个积分，嘿嘿：

第一篇：在2010年的那一栏的《Convolutional deep belief networks for scalable unsupervised learning of hierarchical representations》

文章及代码下载：http://download.csdn.net/detail/zb1165048017/9683175

第二篇：在2010年的那一栏的《Unsupervised feature learning for audio classification using convolutional deep belief networks》

文章及代码下载：http://download.csdn.net/detail/zb1165048017/9683181

本片博客所解读的源码地址：https://github.com/lonl/CDBN

【注】此代码目前不支持步长大于1的卷积，因为matlab自带的conv卷积函数未提供对不同步长的卷积操作，需要自己修改。

卷积RBM的模型与CNN的模型结构很类似：

第一步

分析主函数，主要是读取数据集，总共9张图片，这里训练的时候采用第一张图片，也可以同时读入两张图片进行重构。无需随机打乱图片，看到后面会发现有随机打乱zheyibuzhou

for i = 1:9
    str = ['./data/MITcoast/image_000',num2str(i)];
    str1  = strcat(str,'.jpg');
    image = imread(str1);
    image = double(image)/255;
    train_data(:,:,i) = image;
end

train_data = reshape(train_data,[256,256,1,9]);
train_data = train_data(:,:,:,1:1);

这里注意一下train_data的每个维度分别代表什么，前面两维表示输入图片的大小，第三个维度是通道数(比如彩色图片的通道就是3)，第四个维度是输入的图片的个数(如果是输入两张，那么就可以写成"1:2")。然后初始化两层CRBM对应的参数(这里面重点注意n_map_v是指的通道数，而非图片个数)：

layer{1} = default_layer2D();  % DEFAULT PARAMETERS SETTING, 
                               % YOU CAN CHANGE THE PARAMETERS IN THE FOLLOWING LINES

layer{1}.inputdata      = train_data;%输入数据
layer{1}.n_map_v        = 1;%每张图片的通道数，可以根据train_data的第三个维度调整
layer{1}.n_map_h        = 9;%卷积核个数
layer{1}.s_filter       = [7 7];%卷积核大小
layer{1}.stride         = [1 1];  %卷积步长，行方向和列方向
layer{1}.s_pool         = [2 2];%池化
layer{1}.n_epoch        = 10;%迭代次数
layer{1}.learning_rate  = 0.05;%学习率
layer{1}.sparsity       = 0.03;%稀疏化
layer{1}.lambda1        = 5;
layer{1}.lambda2        = 0.05;
layer{1}.whiten         = 1;%是否进行白化处理
layer{1}.type_input     = 'Gaussian'; % OR 'Gaussian' 'Binary'输入的是高斯还是二值数据

% SECOND LAYER SETTING
layer{2} = default_layer2D();  % DEFAULT PARAMETERS SETTING, 
                               % YOU CAN CHANGE THE PARAMETERS IN THE FOLLOWING LINES

layer{2}.n_map_v        = 9;
layer{2}.n_map_h        = 16;
layer{2}.s_filter       = [5 5];
layer{2}.stride         = [1 1];
layer{2}.s_pool         = [2 2];
layer{2}.n_epoch        = 10;
layer{2}.learning_rate  = 0.05;
layer{2}.sparsity       = 0.02;
layer{2}.lambda1        = 5;
layer{2}.lambda2        = 0.05;
layer{2}.whiten         = 1;
layer{2}.type_input     = 'Gaussian';

关于白化处理的作用，请参考这篇博客： http://blog.csdn.net/whiteinblue/article/details/36171233
接下来便是根据设置的参数去训练卷积DBN

tic;

[model,layer] = cdbn2D(layer);
save('./model/model_parameter','model','layer');

toc;

后面就是画两层C-DBN分别得到的重构图

%  THE FIRST LAYER POOLING MAPS
figure(1);
[r,c,n] = size(model{1}.output(:,:,:,1));
visWeights(reshape(model{1}.output(:,:,:,1),r*c,n)); colormap gray
title(sprintf('The first Pooling output'))
drawnow

%  THE SECOND LAYER POOLING MAPS
figure(2);
[r,c,n] = size(model{2}.output(:,:,:,1));
visWeights(reshape(model{2}.output(:,:,:,1),r*c,n)); colormap gray
title(sprintf('The second Pooling output'))
drawnow

% ORIGINAL SAMPLE
figure(3);
imagesc(layer{1}.inputdata(:,:,:,1)); colormap gray; axis image; axis off
title(sprintf('Original Sample'));

重点就是关注训练函数cdbn2D.m

第二步

主函数中调用的的cdbn2D函数解读

首先就是去训练第一层

    layer{1} = preprocess_train_data2D(layer{1});
    fprintf('layer 1:\n');
    model{1} = crbm2D(layer{1});
    str1 = sprintf('./model/model_%s_%s_%d',layer{1}.type_input,layer{1}.cpu,1);
    save(str1,'model','layer');

然后训练第二层及以后的层数

    for i = 2:length(layer)
        fprintf('layer %d:\n',i);
        layer{i}.inputdata = model{i-1}.output;
        layer{i} = preprocess_train_data2D(layer{i});
        model{i} = crbm2D(layer{i});
        str1 = sprintf('./model/model_%s_%s_%d',layer{i}.type_input,layer{i}.cpu,i);
        save(str1,'model','layer');
    end

可以发现，最重要的函数包含两部分：

第一部分是白化函数preprocess_train_data2D，第二部分是训练函数crbm2D

第三步

白化函数的解读：首先对输入数据进行裁剪，使得运动在经过卷积池化以后认为整数的大小，所以前面几行代码就是对图片长宽裁剪

mod_1 = mod((size(layer.inputdata,1)-layer.s_filter(1))/layer.stride(1)+1,layer.s_pool(1));
if mod_1~=0
   layer.inputdata(1:floor(mod_1/2),:,:,:) =[];
   layer.inputdata(end-ceil(mod_1/2)+1:end,:,:,:) =[];
end

mod_2 = mod((size(layer.inputdata,2)-layer.s_filter(2))/layer.stride(2)+1,layer.s_pool(2));
if mod_2~=0
   layer.inputdata(:,1:floor(mod_2/2),:,:) =[];
   layer.inputdata(:,end-ceil(mod_2/2)+1:end,:,:) =[];
end

然后进入白化处理阶段，两个for循环，外层的控制选取图片，内层的控制通道。也就是说对每一张图片的每一个通道单独进行白化处理。

if layer.whiten
if strcmp(layer.type_input, 'Gaussian')
    m = size(layer.inputdata,4);
    n = size(layer.inputdata,3);
    for i = 1 : m
        for j =1 : n
            layer.inputdata(:,:,j,i) = crbm_whiten(layer.inputdata(:,:,j,i));
        end
    end
    
end
end

具体的白化方法如下：

function im_out = crbm_whiten(im)

if size(im,3)>1
    im = rgb2gray(im); 
end

im = double(im);
im = im - mean(im(:));
im = im./std(im(:));

N1 = size(im, 1);
N2 = size(im, 2);

[fx fy]=meshgrid(-N1/2:N1/2-1, -N2/2:N2/2-1);
rho=sqrt(fx.*fx+fy.*fy)';

f_0=0.4*mean([N1,N2]);
filt=rho.*exp(-(rho/f_0).^4);

If=fft2(im);
imw=real(ifft2(If.*fftshift(filt)));

im_out = 0.1*imw/std(imw(:)); % 0.1 is the same factor as in make-your-own-images

end

首先归一化，然后傅里叶变换、反傅里叶变换等。具体过程以及函数可以去matlab论坛中找到相关使用方法。我们主要关注下一个函数crbm2D

第四步

核心部分crbm2D函数的解读。跟RBM一样，首先一堆初始化

cpu               = layer.cpu;
batchsize         = layer.batchsize;
model.n_cd        = layer.n_cd;
model.momentum    = layer.momentum;
model.start_gau   = layer.start_gau;
model.stop_gau    = layer.stop_gau;
model.beginAnneal = Inf;
layer.s_inputdata = [size(layer.inputdata,1),size(layer.inputdata,2)];

% INITIALIZE THE WEIGHTS
model.W           = 0.01*randn(layer.s_filter(1), layer.s_filter(2), layer.n_map_v, layer.n_map_h);%卷积核大小*卷积核个数*输入图个数
model.dW          = zeros(size(model.W));
model.v_bias      = zeros(layer.n_map_v, 1);%输入层偏置，就一个1*1的值
model.dV_bias     = zeros(layer.n_map_v, 1);
model.h_bias      = zeros(layer.n_map_h, 1);%隐藏层偏置是对每一个特征图都是1*1的值，所以总共是卷积核个数*1个偏置
model.dH_bias     = zeros(layer.n_map_h, 1);
model.v_size      = [layer.s_inputdata(1), layer.s_inputdata(2)];
model.v_input     = zeros(layer.s_inputdata(1), layer.s_inputdata(2), layer.n_map_v,batchsize);%输入层大小是图片大小*输入图片个数*批大小        
model.h_size      = (layer.s_inputdata - layer.s_filter)./(layer.stride) + 1;
model.h_input     = zeros(model.h_size(1), model.h_size(2), layer.n_map_h, batchsize);%隐层特征图大小*卷积核个数*每批数据个数
model.error       = zeros(layer.n_epoch,1);


% ADD SOME OTHER PARAMETERS FOR TEST
model.winc = 0;
model.hinc = 0;
model.vinc = 0;

% NEED TO FIX THE STRIDE HERE
H_out             = ((size(layer.inputdata,1)-layer.s_filter(1))/layer.stride(1)+1)/layer.s_pool(1);
W_out             = ((size(layer.inputdata,2)-layer.s_filter(2))/layer.stride(2)+1)/layer.s_pool(2);
model.output      = zeros([H_out, W_out,layer.n_map_h,size(layer.inputdata,4)]);%模型的输出就是特征图大小*卷积核个数*(所有批合起来的)总图片张数

% CREATING BATCH DATA
N                 = size(layer.inputdata,4);%总图片张数
numcases          = size(layer.inputdata,4);
numbatches        = ceil(N/batchsize);%分批以后的批数目
groups            = repmat(1:numbatches, 1, batchsize);
groups            = groups(1:N);
perm              = randperm(N);
groups            = groups(perm);%每次训练都会随机打乱输入图片
dW                = zeros(size(model.dW));

然后就可以获得每次训练所取的被随机打乱的图片了，上面的creating batch data的部分是对每一个数据都分组编号，假设有90张图片，分为9批，每批10张图片，那么每一张图片的编号就是0~9，然后利用下面这个for循环分别取出隶属于每一个编号的所有数据。我想说，好机智哇，我每次都是直接用一个随机数，来打乱，都没考虑这么多。o(╯□╰)o

for i = 1:numbatches
    batchdata{i}  = layer.inputdata(:,:,:,groups == i);
end

再对数据以及网络参数都进行预处理以后，就正式进入训练过程，正常训练方法：两个for循环，外层循环控制训练次数，内层循环控制每次训练所使用的分批数据集。而且这里我们只对matlab版本进行解读，有兴趣的也可以看看mex和cuda版本

for epoch = 1:layer.n_epoch
    err = 0;
    original_err=0;
    sparsity = zeros(1,numbatches);
   
    tic;
    % FOR EACH EPOCH, ALL SAMPLES ARE COMPUTED
    for i = 1:numbatches
        
        batch_data  = batchdata{i};
        
        
        %-----------------------------------------------------------------%
        switch cpu
            case 'mex'
            %----------------- HERE COMPLETE WITH MEX FUNCTION -----------%
                [model_new] = crbm2D_batch_mex(model,layer,batch_data);

                dW                  = model_new.dW;
                model.v_sample      = model_new.v_sample;
                model.h_sample      = model_new.h_sample;
                model.h_sample_init = model_new.h_sample_init;
        
            case 'cuda'
                %-------------- HERE COMPLETE WITH CUDA FUNCTION ---------%
                [model_new] = crbm2D_mex_cuda(model,layer,batch_data);

                dW                  = model_new.dW;
                model.v_sample      = model_new.v_sample;
                model.h_sample      = model_new.h_sample;
                model.h_sample_init = model_new.h_sample_init;        
        
            case 'matlab'
                %-------------- HERE COMPLETE WITH MATLAB FUNCTION -------%
                [model, dW] = calc_gradient2D(model,layer,batch_data);
        end % switch

好了，进入核心函数的核心部分calc_gradient2D，就是利用对比散度去计算参数更新的梯度了

第五步

前向推断部分，在RBM中经常称为positive phase，直白点就是利用可见层计算隐层的激活状态，函数名：crbm_inference2D

先回看一下model.h_input这个变量代表的是什么：

model.h_input     = zeros(model.h_size(1), model.h_size(2), layer.n_map_h, batchsize);%隐层特征图大小*卷积核个数*每批数据个数

意思就是对于每批数据中的每一张图片都有 (卷积核个数) 张特征图。
首先是将所有的特征图初始化为0，并且记录下当前处理的批的数据量，也就是图片张数

model.h_input = zeros(size(model.h_input));
N = size(model.h_input,4);

接下来进入三个嵌套的for循环，外层代表当前需要处理的批的数据个数，中层代表卷积核个数，内层代表每张图片的通道数，文章采用的是灰度图，所以内层循环可有可无，但是如果对于彩色图的话，那就是三个通道了，彩色图像的卷积我前面有篇博客提到过一个比较好的博客，o(╯□╰)o突然我也找不到了，回头找到了再贴过来。反正就是对于三个通道分别进行卷积核的卷积，最后加和起来就行了。看看代码也是这样：

for k = 1:N
    for i = 1 : layer.n_map_h
        for j = 1 : layer.n_map_v
            model.h_input(:,:,i,k) = model.h_input(:,:,i,k) + conv2(data(:,:,j,k),model.W(end:-1:1,end:-1:1,j,i),'valid');
        end
        
        model.h_input(:,:,i,k) = model.h_input(:,:,i,k) + model.h_bias(i);
    end
end

这里注意一下，matlab的卷积会自动对卷积核进行180°的翻转，有兴趣可以去知乎上看看卷积和相干这两个比较相似的概念。是不是因为这个原因所以在这里进行了类似的翻转，其实matlab里面自带了翻转90°的方法，叫rot90(X,90)。验证一下看看是不是一样的。

>> A=[1 2 3 4;5 6 7 8]

A =

     1     2     3     4
     5     6     7     8

>> A(end:-1:1,end:-1:1)

ans =

     8     7     6     5
     4     3     2     1

>> rot90(A,2)

ans =

     8     7     6     5
     4     3     2     1

在得到当前批的所有数据的卷积特征图以后，进入池化相关的函数crbm_blocksum2D

首先判断隐层是要求二值形式还是高斯形式，有不同的处理

if strcmp(layer.type_input, 'Binary')
    h_input = exp(model.h_input);
else
    h_input = exp(1.0/(model.start_gau^2).*model.h_input);
end

接下来就是对每一张特征图进行池化了，可以发现有三个for循环，外层是取出每个图片对应的(卷积核个数张)特征图，中层循环是提取出每次被池化的部分的行，比如特征图大小是row*col，用[2 2]的卷积核，中层循环就是吧row*col切成row/2个2*col的特征图，这样内层循环不言而喻，就是将2*col的特征图切成col/2个2*2大小的特征图，这样就能提出来每次需要被池化的2*2块

for k = 1:N
    for i = 1:floor(row/y_stride)
        offset_r = ((i-1)*y_stride+1):(i*y_stride);
        if length(offset_r)==1	% for extreme size like [1,1]
            offset_r = [offset_r, offset_r];
        end
        for j = 1:floor(col/x_stride)
            offset_c = ((j-1)*x_stride+1):(j*x_stride);
            if length(offset_c)==1
                offset_c = [offset_c, offset_c];
            end

接下来就是采用一种池化方法去进行池化操作，池化方法有很多种，比如均值池化，最大值池化，中值池化等，这里采用加和池化，将2*2块中的所有元素加起来

block_val = squeeze(sum(sum(h_input(offset_r,offset_c,:,k))));

注意一下这里控制住sum加和的个数，两个sum函数的调用，刚好能保证对每张图的每个特征图分别加和，得到的block_val第一个维度是1(2*2的池化块被加和的结果)，第二个维度是卷积核个数(池化后特征图的数目是不变的)，第三个维度是1(当前选中的输入图片)，被squeeze以后去掉维度为1的维度，其实就是得到了9个值。然后再恢复2*2大小的特征，但是每个特征图2*2块里面的数据是一样的，都是原来的2*2的加和。看看效果，我随便输出了其中一块，改改代码就能看到结果，调试的时候这样改

            block_val = squeeze(sum(sum(h_input(offset_r,offset_c,:,k))));
            block_val
            block(offset_r,offset_c,:,k) = repmat(permute(block_val, [2,3,1]), numel(offset_r),numel(offset_c));
            block(offset_r,offset_c,:,k)

然后便可以看到效果，窗口会弹出很多结果，这里就截取其中一部分：

block_val =

    3.9984
    3.9621
    4.0169
    4.0007
    3.9849
    3.9979
    3.9665
    4.0175
    3.9813


ans(:,:,1) =

    3.9984    3.9984
    3.9984    3.9984


ans(:,:,2) =

    3.9621    3.9621
    3.9621    3.9621


ans(:,:,3) =

    4.0169    4.0169
    4.0169    4.0169


ans(:,:,4) =

    4.0007    4.0007
    4.0007    4.0007


ans(:,:,5) =

    3.9849    3.9849
    3.9849    3.9849


ans(:,:,6) =

    3.9979    3.9979
    3.9979    3.9979


ans(:,:,7) =

    3.9665    3.9665
    3.9665    3.9665


ans(:,:,8) =

    4.0175    4.0175
    4.0175    4.0175


ans(:,:,9) =

    3.9813    3.9813
    3.9813    3.9813

至此，池化部分搞定。回到调用池化的函数crbm_inference2D中来，文章计算了一下一个分数，个人感觉这样是计算了一种概率，与最后附录介绍的最大概率池化方法很像，额。其实我想说好像就是概率最大池化方法，但是和最大概率池化方法最开始提出的作者的论文的代码不一样，所以说好像是。

if strcmp(layer.type_input, 'Binary')
    model.h_sample = exp(model.h_input)./(1+block);
else
    model.h_sample = exp(1.0/(model.start_gau^2).*model.h_input)./(1+block);
end

按照代码可以发现对于每一个池化块的隐层输出应该是这样计算，对于二值情况下，假设

代表其中一个特征图中2*2的被池化块block，那么新的

计算方法如下：

第六步

进入对比散度算法中的采样阶段。首先是利用隐层重构可见层crbm_reconstruct2D。

一开始就先计算一下隐层的激活状态

h_state = double(rand(size(model.h_sample)) < model.h_sample);

初始化可见单元v_input和记录下当前批需要处理的图片个数N。

model.v_input = zeros(size(model.v_input));
N = size(model.v_input,4);

然后利用conv2进行反卷积，具体调用方法可以看我前面关于 conv2，filter2，imfilter区别的转载，利用隐层状态和权重来反推可见层数据

for k = 1:N
    for i = 1:layer.n_map_v
        for j = 1:layer.n_map_h
            
            model.v_input(:,:,i,k) = model.v_input(:,:,i,k) + conv2(h_state(:,:,j,k),model.W(:,:,i,j),'full');
        end
        model.v_input(:,:,i,k) = model.v_input(:,:,i,k) + model.v_bias(i);
    end
end

三个循环，分别控制第几张图片的第几个特征图的重构是利用的第几个卷积核。h_state的四个维度分别是特征图大小*特征图个数*输入图片个数，其中每一个通道的重构就是利用每个卷积核与当前特征图连接权重的乘积的和来推理的，与彩色图像卷积一样，最后不要忘记了加上偏置项。这里再提示一下有心人有兴趣可以看看偏置，误差，方差的区别。

最后就是如果我们需要二值的可见单元，就用sigmoid函数激活一下，如果是高斯单元，就是直接将反卷积的输出当做可见单元值即可

if strcmp(layer.type_input, 'Binary')
    model.v_sample = sigmoid(model.v_input);
    
else
    model.v_sample = model.v_input;
    
end

第七步

就是反复进行吉布斯采样，简单点说就是不断重复第五步、第六步，知道达到设置的k步对比散度算法的值。

至此我们能够得到第一次进入模型时候的模型状态和第k次采样以后的模型状态。利用这两种状态计算一下权重的更新梯度。需要注意的是计算的时候要先将隐单元的卷积核旋转180°，原因是在positive phase阶段，利用可见层推导隐藏层单元值的时候，对卷积核进行过旋转。

dW = zeros(size(model.W));
for i = 1 : layer.n_map_h
    for j = 1 : layer.n_map_v
        dW(:,:,j,i) = conv2(data(:,:,j,1),model.h_sample_init(end:-1:1,end:-1:1,i,1),'valid') ...
                    - conv2(model.v_sample(:,:,j,1),model.h_sample(end:-1:1,end:-1:1,i,1),'valid');
        
    end
end

第八步

更新模型参数，主要包含权重，可见层偏置，隐藏层偏置，对于高斯形式和二值形式都有不同的计算公式，先计算一下偏置更新梯度(权重更新梯度上一步计算了)

N       = size(data,4);
dV_bias = squeeze(sum(sum(sum(data - model.v_sample,1),2),4));
dH_bias = squeeze(sum(sum(sum(model.h_sample_init - model.h_sample,1),2),4));

可以发现，更新方法和RBM基本一模一样。来一个小插曲，先看看matlab的sum函数是如何对一个高维矩阵进行工作的。

A(:,:,1)=[1 2 3;4 5 6]
A(:,:,2)=[7 8 9;10 11 12]
A(:,:,3)=[13 14 15;16 17 18]

建立一个三维矩阵，先计算一次加和

sum(A)

ans(:,:,1) =

     5     7     9


ans(:,:,2) =

    17    19    21


ans(:,:,3) =

    29    31    33

>> sum(A,2)

ans(:,:,1) =

     6
    15


ans(:,:,2) =

    24
    33


ans(:,:,3) =

    42
    51

>> sum(A,3)

ans =

    21    24    27
    30    33    36

可以发现这个sum函数与第二个参数的选择是有关的。如果是1，那么就行+行；如果3，列就列+列，如果是3，就第三维+第三维

回到程序中偏置的更新，都是对四维矩阵加和，对dV_bias分析一下(对于dH_bias的分析是一样的)：

假设输入的data是256*256*3*10，意思是输入了10张图片，每张图片大小是256*256，且为三通道RGB彩色图像

首先是计算一下原始图与重构图的差值，并进行加和，得到的矩阵应该是256*1*3*10：

sum(data - model.v_sample,1)

然后进行第二个加和处理，应该是得到一个1*1*3*10大小的矩阵：

sum(sum(data - model.v_sample,1),2)

继续进行第三个加和处理：

sum(sum(sum(data - model.v_sample,1),2),4)

这里的维度变成第四维了，为什么不是第三维呢？回想前面的理解中说过每一个特征图都有一个偏置项，且每个偏置的值是1*1大小的共享偏置，也就是说有几个特征图就有几个1*1的偏置值。那么对应到输入的彩色图像中来，只有三个通道(RGB)对应有偏置值，而不是对每一个样本的每个通道都有一个不同的偏置。因此进行加和的维度分别是第一维、第二维、第四维，分别代表输入图像大小，每次批处理的输入图像的个数。

接下来看看对于二值情况的更新方法：

if strcmp(layer.type_input, 'Binary')
    
    dW            = dW/N;
    dH_bias       = dH_bias/N;
    dV_bias       = dV_bias/N;
    
    model.dW      = model.momentum*model.dW + (1-model.momentum)*dW;
    model.W       = model.W + layer.learning_rate*(model.dW - layer.lambda2*model.W);
    
    penalty       = 0;
    model.dV_bias = model.momentum*model.dV_bias + (1-model.momentum)*dV_bias;
    model.v_bias  = model.v_bias + layer.learning_rate*(model.dV_bias - penalty*model.v_bias);
    
    model.dH_bias = model.momentum*model.dH_bias + (1-model.momentum)*dH_bias;
    model.h_bias  = model.h_bias + layer.learning_rate*(model.dH_bias - penalty*model.h_bias);
    
    model.h_bias  = model.h_bias + layer.learning_rate*layer.lambda1*...
        (squeeze(layer.sparsity-mean(mean(mean(model.h_sample_init,1),2),4)));
end

处理步骤就是：

①计算完毕加和以后，除以每批样本总数

②针对权重和偏置需要更新的梯度都是利用“动量项*①中的梯度+(1-动量项)*①中的梯度”进行计算的
③然后计算最终投入到下次迭代的模型参数：

首先是权重(有梯度惩罚项)，计算方法是：

下次迭代需要的权重=当前迭代使用的权重+学习率*(上一步计算的权重梯度 - 梯度惩罚率*当前迭代使用的权重)

然后是可见层偏置(简单计算)，计算方法是：

下次迭代的可见层偏置=当前迭代使用的可见层偏置+学习率*(上一步计算的可见偏置梯度)

最后是隐藏层偏置(有稀疏项)，计算方法是：

中间变量=当前迭代使用的隐藏层偏置+学习率*(上一步计算的隐层偏置梯度)

下次迭代的隐藏层偏置=中间变量+学习率*稀疏惩罚*(稀疏项-原始输入重构得到的隐层单元值的均值)

最后看看对于高斯输入的梯度更新

if strcmp(layer.type_input, 'Gaussian')
    
    N            = size(model.h_sample_init,1) * size(model.h_sample_init,2) * layer.batchsize;
    dW           = dW/N - 0.01*model.W;
    %dh           = (squeeze(sum(sum(model.h_sample_init,1),2)) - squeeze(sum(sum(model.h_sample,1),2)))/N - 0.05*(squeeze(mean(mean(model.h_sample_init,1),2)) - 0.002);
    dh           = (squeeze(sum(sum(sum(model.h_sample_init,1),2),4)) - squeeze(sum(sum(sum(model.h_sample,1),2),4)))/N;
    dv           = 0;
    
    model.winc   = model.winc*model.momentum + layer.learning_rate*dW;
    model.W      = model.winc + model.W;
    
    model.hinc   = model.hinc*model.momentum + layer.learning_rate*dh;
    model.h_bias = model.hinc + model.h_bias;
    
    model.vinc   = model.vinc*model.momentum + layer.learning_rate*dv;
    model.v_bias = model.vinc + model.v_bias;
end

分母除的不再是每批输入样本的个数了，而是采用另一种计算方法

N= size(model.h_sample_init,1) * size(model.h_sample_init,2) * layer.batchsize;

代表的是隐单元每个特征图单元数*每批的输入数据数目

权重的更新也同样是先计算被惩罚以后的梯度，然后直接计算被更新的最终权重

dW= dW/N - 0.01*model.W;
model.winc= model.winc*model.momentum + layer.learning_rate*dW;
model.W= model.winc + model.W;

隐藏层偏置同样也是计算对比散度算法前后的隐单元差值，感觉和上面一样，没什么变化，但是换了一种写法，以及分母变化了而已

dh= (squeeze(sum(sum(sum(model.h_sample_init,1),2),4)) - squeeze(sum(sum(sum(model.h_sample,1),2),4)))/N;
model.hinc= model.hinc*model.momentum + layer.learning_rate*dh;
model.h_bias= model.hinc + model.h_bias;

对于可见层偏置的梯度，直接置零了，用学习率多余计算了一下，可以删掉学习率这一部分，直接把需要更新的梯度设置为动量项倍即可。

dv = 0;
model.vinc   = model.vinc*model.momentum + layer.learning_rate*dv;
model.v_bias = model.vinc + model.v_bias;

第九步

输出每次迭代的信息看看，包括稀疏程度、重构误差

sparsity(i) = mean(model.h_sample_init(:));     
err1= (batch_data - model.v_sample).^2;
err= err + sum(sum(sum(sum(err1))));

后面那个gau是控制如果隐层不是二值单元而是高斯单元的时候，进行隐层计算时候需要的高斯项，具体调用地方查看crbm_inference2D最好一行代码。这里主要控制高斯项逐渐递减，因为初始化时设置的(查看default_layer2D函数)

layer.start_gau     = 0.2;      % GAUSSIAN START
layer.stop_gau      = 0.1;      % GAUSSIAN END

所以每次迭代完毕递减一下：

  if (model.start_gau > model.stop_gau)
        model.start_gau = model.start_gau*0.99;
    end

第十步

完成第一层卷积RBM的参数更新以后，计算一下进入下一层卷积RBM的输入值。同样只关注"matlab"部分，利用函数crbm_forward2D

很简单就是，与crbm_inference2D处理方法类似，都是利用positive phase的计算流程，唯一不同的是，这里需要考虑到批数据的批数，而在crbm_inference2D中每次迭代已经选定批数了。

先初始化相关参数，记录一下所有训练集的数量大小，当前层池化大小，以及隐层的特征大小。

n = size(data,4);
x_stride = layer.s_pool(2);
y_stride = layer.s_pool(1);
row = size(model.h_sample,1);
col = size(model.h_sample,2);

然后由于上面介绍过隐层每个单元2*2，也就是被池化块的部分元素都是一样的，因为采用的是加和池化方法。所以输入到下一层CRBM的数据大小是当前层隐层大小/池化大小，即：

output = zeros(floor(row/y_stride),floor(col/x_stride),layer.n_map_h,n);

对应的分别是输入大小*特征图个数*原始图片总数

初始化完毕以后就需要进行计算了，按照彩色图像的计算方法，对每个通道卷积，然后求和

for i = 1:layer.n_map_h
for j =1:layer.n_map_v
    model.h_input(:,:,i,1) = model.h_input(:,:,i,1) + conv2(batch_data(:,:,j,1),model.W(end:-1:1,end:-1:1,j,i),'valid');
end
   model.h_input(:,:,i,1) = model.h_input(:,:,i,1) + model.h_bias(i);
end

然后利用求和方法计算池化单元的值，利用公式计算单元值，但是在每个池化块的重复元素中取一个，采用的方法是间隔采样。

block = crbm_blocksum2D(model,layer);
h_sample = 1-(1./(1+block));
output(:,:,:,k) = h_sample(1:y_stride:row, 1:x_stride:col,:);

这里的output就是即将丢入到下一层训练的输入层的数值。

再后面就是DemoCDBN_Gaussian_2D.m主函数对每一层得到的特征图可视化的方法啦，与卷积RBM关系不大，就不写咯。

其实个人感觉这个第十步的核心部分(隐单元计算和池化层计算就是下面附录介绍的最大池化方法)

附录概率最大池化的理解

关于大牛Honglak Lee 提出的论文主要采用了一种概率最大池化的方法，表示看了代码以后和原文可能有点对不上号，按照代码说一下吧

主要函数就是multrand2.m，比较短，可以去开头提供的地址下载，我这里也直接粘贴出来

function [S P] = multrand2(P)
% P is 2-d matrix: 2nd dimension is # of choices概率最大池化的方法
%P是除以均值了
%S是进行激活以后的值，为0或者1
% sumP = row_sum(P); 
sumP = sum(P,2);
P = P./repmat(sumP, [1,size(P,2)]);

cumP = cumsum(P,2);%计算各行累加值
% rand(size(P));
unifrnd = rand(size(P,1),1);
temp = cumP > repmat(unifrnd,[1,size(P,2)]);%输出0,1
%发现很神奇的地方，Sindx每一行4个单元至多有一个为1
Sindx = diff(temp,1,2);%对列求一阶偏导diff(A,m,n)对A按照n(1为列，2为行)求m阶导数
S = zeros(size(P));
S(:,1) = 1-sum(Sindx,2);%sum(A,2)是对行求和，得到一列数据
S(:,2:end) = Sindx;
%最终得到的S矩阵每一行有且仅有一个1
end

简要摘取一下文章中关于概率最大池化(probabilistic max-pooling)方法的介绍吧。
一般来说高层特征的检测需要逐步包含逐步增大的输入区域的信息。现有的转移不变性表示方法比如卷积神经网络经常包含两个步骤：

“检测层“”对之前层进行卷积得到一个特征检测器

“池化层”通过常数因子缩小检测层的表示。

具体来说就是，每个池化层单元计算的是检测层的一个小区域的最大激活值。利用最大池化方法可以使得高层的特征表示对于输入的小变动具有不变性，并且降低了计算负担。

最大池化一般用于前馈网络。相反这里对一个图片的生成模型比较感兴趣，支持从上往下和从下往上的推断。因此设计了一个生成模型，利用类似最大池化的推断方法。

假设可见层是V，检测层是H，池化层是P。那么H和P都有k个单元组，每个池化单元组大小是大小。

探测层的被池化块和对应的池化单元有一个潜在约束：探测层至多有一个单元被打开(激活)，池化单元当且仅当一个探测单元激活的时候被激活。

另一种等价说法就是，我们可以考虑有个单元(被池化单元+对应的池化单元)作为一个独立随机变量：一个值代表所有探测单元被开启，还有一个值代表所有的单元被关闭。

简单地创建最大池化CRBM的能量函数就是：

约束条件里面的代表的是在探测层H中被池化的一个小块，至多只有一个被激活为1。

探测层的第k组接受的输入是从V由下往上的输入信号，其实就是v乘以权重加上隐层偏置，没啥好理解的：

然后就是对这个隐层单元分块进行池化，假设是一个包含在块α中的隐单元，条件概率就是这样计算的

第一个公式就是利用可见层得到隐层的激活概率，第二个是计算对应的池化单元被抑制的概率。其实这个第二个公式很好理解，按照可见层被池化块的几个单元有任意一个单元没激活的概率来计算。也就是说，第一个公式计算了其中一个单元被激活的概率，那么整个被池化块的探测层单元至少有一个被激活的概率就是

这样就计算出来了池化层被激活的概率，看看这个式子和上面第二个式子的和是等于1吧，代表被激活的概率加上被抑制的概率的和是1，因为只存在被激活和被抑制两种状态嘛。

然后看看代码，发现，好像并没有第一个公式提到的分母加1的情况。代码先将隐单元均值化，然后依次计算累加值，这样最后一行值就是1了，

sumP = sum(P,2);
P = P./repmat(sumP, [1,size(P,2)]);

cumP = cumsum(P,2);%计算各行累加值

这个累加函数cumsum类似于这样

>> B=[1 2 3;4 5 6]

B =

     1     2     3
     4     5     6

>> cumsum(B,2)

ans =

     1     3     6
     4     9    15

>>

回到cump就会发现，每行的值都是依次增大的，然后在每一行利用一个概率去激活，可以得到在某个位置左边的值全是0，右边全是1，因为数值是依次增大。然后计算梯度，刚好在分界处得到一个1，其它地方都是0。

还是利用上面这个cumsum的例子，假设我们对结果的第一行用阈值2激活，第二行用阈值10激活，得到的结果就是

0 1 1
0 0 1

接下来计算每行的梯度就是，而且总能确保每行至多只有一个值为1

1 0
0 1

然后计算将每行加和起来，去判断到底这一行是有一个1还是全0，对于全0的情况。

最后问题又来了，按照文章描述，隐层至少有一个单元为1的时候，池化单元才被激活，也就是说在这个包含C*C的被池化部分和对应的池化单元的个单元里面，要么有两个1，要么全0，然而按照代码

S(:,1) = 1-sum(Sindx,2);%sum(A,2)是对行求和，得到一列数据
S(:,2:end) = Sindx;

可以发现这两句话控制了每行有且仅有一个1，与原文的限制条件有点区别。

用一个实例来体现这个最大池化函数multrand2的效用

>> A=rand(10,5)

A =

    0.9604    0.3956    0.2853    0.3660    0.0691
    0.7845    0.4872    0.2348    0.0293    0.3241
    0.0900    0.3473    0.8310    0.2054    0.8044
    0.5143    0.5906    0.9595    0.4494    0.6429
    0.3923    0.7827    0.4778    0.3040    0.4732
    0.9238    0.5114    0.5506    0.7581    0.0027
    0.2364    0.5663    0.1936    0.4560    0.0749
    0.2861    0.0362    0.5895    0.5049    0.2997
    0.2368    0.1295    0.7861    0.6929    0.8848
    0.3697    0.6487    0.8074    0.0170    0.7988

>> S=multrand2(A)

S =

     1     0     0     0     0
     0     1     0     0     0
     0     0     0     1     0
     0     0     0     0     1
     0     1     0     0     0
     1     0     0     0     0
     0     0     0     1     0
     0     0     0     1     0
     0     0     1     0     0
     0     0     0     0     1

>>

【结论】讲道理的话，上面第十步的处理方法与最大概率池化的公式最近似，基本一样。而原作者提供的代码与论文描述稍微有点区别。读者若有任何见解，请在评论区写出，大家一起讨论讨论，谢谢。额，脖子、脖子，疼啊o(╯□╰)o

你可能感兴趣的:(玻尔兹曼机)

Java内存区域划分及各区域作用
Java虚拟机内存区域示意图：各分区都有什么特点，他们的作用是什么呢？1.程序计数器（ProgramCounterRegister）线程私有。程序计数器是一块较小的空间，它可以看做是当前线程所执行的字节码的行号指示器。2.Java虚拟机栈线程私有。Java虚拟机栈的生命周期与线程相同。虚拟机栈描述的是Java方法执行的内存模型：每个方法在执行的同时都会创建一个栈帧（StackFrame）用于存储局
Java内存区域(运行时数据区域)怎么划分的？
1、Java内存区域（运行时数据区域）怎么划分的？程序计数器，Java虚拟机栈，本地方法栈，堆，方法区2、线程私用的部分(程序计数器，Java虚拟机栈，本地方法栈)程序计数器程序计数器存储了当前线程正在执行的字节码指令的地址（如果是当前执行的是Native方法，那么计数器为空），字节码解释器就是通过改变计数器的值来选取下一条需要执行的字节码指令。程序计数器是线程私有的，便于各个线程切换后，可以恢复
JAVA内存区域划分 weixin_44612246 java 开发语言 redis
根据《JAVA虚拟机规范》的规定，JAVA虚拟机在执行JAVA程序的过程中会把内存划分为不同的数据区域。不同类型的数据会存储在不同的区域，理解JAVA内存区域的工作细节对理解JAVA多线程、线程安全性有着重要意义。注意，JAVA内存区域的划分与我们常说的java内存模型JMM(JavaMemeryModel)是两个互不交叉的维度的概念，两者没有任何关系。JMM主要是将主内存和工作内存的关系、数据从
java中agent的作用
一java中agent1.1agent-javaagent是Java虚拟机(JVM)提供的一个启动参数，用于在Java程序main方法执行之前，加载一个特殊的Java代理程序（JavaAgent）。它的核心作用是对运行中的Java程序进行字节码层面的动态修改、监控和增强。如安全审计/漏洞检测。-javaagent:/bankapp/deploy/raspant/raspant.jar
玄机-linux实战-挖矿无中生章 linux 运维服务器
玄机-linux实战-挖矿一，前言应急响应工程师在内网服务器发现有台主机cpu占用过高，猜测可能是中了挖矿病毒，请溯源分析，提交对应的报告给应急小组虚拟机账号密码rootwebsecyjxyweb端口为8081二，介绍1、黑客的IP是？flag格式：flag{黑客的ip地址}，如：flag{127.0.0.1}2、黑客攻陷网站的具体时间是？flag格式：flag{年-月-日时:分:秒}，如：fla
C#上位机的通信接口田猿笔记 ASP.NET MVC c#上位机
上位机通信接口是指上位机与下位机之间的数据传输方式。下位机可以是PLC、单片机、传感器、仪表等，上位机通信接口通常有以下几种：1.串口通信接口（RS232/RS485）：串口通信接口是较为常用的通信接口之一，通过口可以实现双向传输。串口通信接口的优点是通信速率稳定、传输距离较短；缺点是传输速率较慢、容易受干扰。串信协议，在计算机和外部设备之间传输数据位。串口通信接口使用的传输协议是RS-232C。
C#上位机串口接口 weixin_44710358 上位机通信上位机通信
文章目录前言C#上位机串口接口特点：数据一位接一位地依次传输，具有简单、通用性强等优点，但传输速度相对较慢。一串口概述二、使用步骤前言C#上位机串口接口特点：数据一位接一位地依次传输，具有简单、通用性强等优点，但传输速度相对较慢。一串口概述串口参数串口号：标识设备连接的串行端口，如“COM1”“COM3”等。波特率：衡量数据传输速率的指标，单位是比特/秒（bps），常见的有9600、115200等
在 Windows 上运行 Linux 程序 shanql windows linux
要在Windows上运行Linux程序，您有以下选项：在适用于Linux的Windows子系统（WSL）上按原样运行程序。在WSL中，程序直接在计算机硬件上执行，而不是在虚拟机中执行。WSL还支持在Windows和Linux系统之间直接调用文件系统，无需SSL传输。WSL设计为命令行环境，不建议用于图形密集型应用程序。有关更多信息，请参阅适用于Linux的Windows子系统文档。在本地计算机或A
Docker 跨平台支持：从 Linux 到 macOS 的容器化开发实践 you的日常容器技术 Docker 性能优化实践 docker linux macos 容器运维
Docker容器的理念是“一次构建，处处运行”，旨在解决应用程序在不同环境中部署的兼容性问题。然而，这一承诺的实现，在非原生Linux系统（如macOS和Windows）上，需要巧妙的底层机制来支撑。对于开发者而言，理解DockerDesktop在这些操作系统上的工作原理，特别是其虚拟机机制和文件共享策略，对于优化开发体验和解决潜在性能问题至关重要。本文将深入探讨Docker如何在macOS和Wi
大模型算法工程师面试宝典：精选面试题及参考答案全解析，助你备战AI算法工程师岗位！大模型入门学习人工智能产品经理大数据机器学习程序员大模型大模型学习
大模型应该算是目前当之无愧的最有影响力的AI技术。它正在革新各个行业，包括自然语言处理、机器翻译、内容创作和客户服务等，正成为未来商业环境的重要组成部分。截至目前大模型已超过200个，在大模型纵横的时代，不仅大模型技术越来越卷，就连大模型相关面试也是越来越卷。我今天给大家分享一篇大模型的面试题总结，内容较长，喜欢记得收藏、关注、点赞。ii.为什么会出现LLMs复读机问题？出现LLMs复读机问题可能
秋招Day6 - Java并发（上） - 线程 Java初学者小白八股 #并发 java
线程VS进程什么是进程？进程就是程序的执行过程，是程序执行的基本单位，一个程序的执行就是进程从创建、运行到消亡的过程。什么是线程？线程是比进程更小的单位，一个进程由许多个线程组成。同一个进程的多个线程共享堆和方法区（JDK1.8之后是元空间）资源，但是却有各自的程序计数器、虚拟机栈、本地方法栈。在线程之间切换比在进程之间切换的负担小得多。一个Java程序的运行是main线程和多个其他线程同时运行。
Docker-compose搭建（单机/多机）RabbitMQ集群 Ennis.Zhou docker docker rabbitmq 容器
一、（单台服务器）docker-compose搭建RabbitMQ集群这里我们提到的是用一台Centos7服务器上用docker搭建的RabbitMQ集群，只能用作测试和练手用。1.环境准备服务器IP容器分配网段容器hostname容器的IP172.17.202.82172.24.0.0/16rabbit1172.24.0.5rabbit2172.24.0.6rabbit3172.24.0.72.
Linux 虚拟机里面系统自动校准时间， wushuang443 linux
首先查看下系统时间：输入date或者timedatectlstatus查看时间信息先启用NTP(网络时间协议)timedatectlset-ntptrue1现在发现日期对上了，但是准确的时钟分钟没对上，输入：这点时区的设置很重要timedatectlset-timezone"Asia/Shanghai"1修改时区为上海注意：若提示权限不足可以加上sudo提权或者使用root账户
Tensorflow 回归模型 FLASK + DOCKER 部署至 Ubuntu 虚拟机
准备工作：安装虚拟机，安装ubuntu，安装python3.x、pip和对应版本的tensorflow和其他库文件,安装docker。注意事项：1.windows系统运行的模型文件不能直接运行到虚拟机上，需在虚拟机上重新运行并生成模型文件2.虚拟机网络状态改为桥接Flask代码如下：fromflaskimportFlask,request,jsonifyimportpickleimportnump
欧标TH-307EV3.41对讲机写频软件详解侯昂
本文还有配套的精品资源，点击获取简介：对讲机在多个领域中有着广泛应用，欧标TH-307EV3.41是一款针对特定型号对讲机进行频率配置和功能设置的软件工具。它允许用户自定义工作频率、频道管理、功能配置，并执行数据备份与恢复、固件更新等功能。本软件是无线电爱好者和专业用户的实用工具，需在遵守无线电法规的前提下使用。1.欧标TH-307EV3.41对讲机概述1.1对讲机的技术演进对讲机自问世以来，经历
代理导致虚拟机无法连接网络解决办法
虚拟机使用代理科学上网后，当关闭代理，虚拟机无法连接原来的网络解决方法重启虚拟机网络服务器：ctrl+alt+t打开虚拟机命令终端，依次输入以下指令：sudoservicenetwork-managerstopsudorm/var/lib/NetworkManager/NetworkManager.statesudoservicenetwork-managerstart注：若network-man
【jetson】Linux下nvidia Jetson烤机程序（CPU+GPU）
前言烤机程序用于把设备的使用率拉满，进行可靠性测试。这里主要贴一下cpu和gpu的烤机程序。cpu为arm64，gpu是orinnano的模组。烤机的jetson设备为如下，输入54v：reComputerMiniJ3011-IntelligentEdgeAIComputerwithNVIDIA®Jetson™Orin™Nano8GBCPU-burn终端安装测试工具:sudoaptinstalls
CAN转Modbus TCP网关赋能食品搅拌机智能协同控制 JIANGHONGZN 工业通讯协议网关 CAN MODBUS MODBUS TCP
在食品搅拌机的自动化控制系统中，设备通信协议的多样性给系统集成带来挑战。JH-CAN-TCP疆鸿智能CAN主站转ModbusTCP从站的网关，成为连接西门子PLC与伺服系统的关键桥梁。西门子PLC常采用ModbusTCP协议，用于实现与上位机、人机界面等设备的数据交互。而伺服系统多使用CAN协议，因其具备高速、可靠、抗干扰能力强等特点，能精准控制电机运行。该网关可将西门子PLC发出的ModbusT
jvm 锁升级机制 @ chen Java基础 jvm java 多线程
Java虚拟机（JVM）中的锁升级机制（也称为锁膨胀）是HotSpot虚拟机为了优化synchronized关键字的性能而引入的一项重要技术。它的核心思想是：根据实际遇到的竞争激烈程度，动态地将锁从开销最小的状态逐步升级到开销更大的状态，从而在无竞争或低竞争时减少锁操作的开销，而在高竞争时保证必要的互斥性和线程调度能力。锁的状态主要有四种，升级路径如下：无锁->偏向锁->轻量级锁->重量级锁锁
创建对象的步骤玩代码 jvm
以下是创建对象的具体步骤及详细说明，结合关键流程与原理分析：1.判断对象是否加载、链接阶段、初始化阶段类加载检查是对象创建的第一步。当遇到new指令时，虚拟机会检查该指令的参数是否能在常量池中定位到类的符号引用，并检查该类是否已被加载、解析和初始化。若未加载，需先执行类加载过程。链接分为三个子步骤：验证：确保类信息符合虚拟机规范，避免安全问题。准备：为类的静态变量分配内存并设置默认初始值（如int
python 函数的定义 SFH-松风寒 python 开发语言后端
#函数的定义#定义一个函数#def表示定义函数的关键字#msg表示函数的名称#()里面放置参数可以为空#：函数的固定格式defmsg():#函数体函数里面的代码用于实现函数的特定功能print('Helloworld')#msg（）函数的调用调用函数之后函数中的代码就会被执行#msg是函数本身msg()#函数的简单用法#打印ATM机的提示defselect_func():print('-----请
脑机新手指南（二十）BCI2000 新手入门指南（下篇） Brduino脑机接口技术答疑脑机新手指南人工智能算法大数据
一、引言在上篇文章中，我们介绍了BCI2000的基本概念、特点和优势，以及安装、配置和基本使用流程。在本篇文章中，我们将深入探讨BCI2000的信号处理和分类算法，并提供一些实操的代码教程，帮助新手更好地掌握BCI2000的使用方法。二、BCI2000的信号处理（一）信号处理的基本概念在脑机接口系统中，信号处理是一个非常重要的环节，它的主要目的是从原始的脑电信号中提取有用的信息，并去除噪声和干扰。
脑机新手指南（十七）EEG-ExPy 新手入门教程（上篇）：基础概念与环境搭建 Brduino脑机接口技术答疑脑机新手指南新手入门算法脑机接口
一、EEG-ExPy是什么？EEG-ExPy是一个基于Python的开源工具包，专为脑电（EEG）实验设计、数据采集和实时分析而开发。它的核心优势在于低门槛易用性和模块化设计，即使是没有编程基础的新手，也能通过简单的代码或图形界面快速搭建EEG实验流程。其功能覆盖：1.自定义实验范式设计（如视觉刺激、运动想象任务）2.实时EEG信号采集与预处理3.简单的脑机接口（BCI）应用开发4.实验数据的存储
脑机新手指南（十五）speechBCI 项目新手入门指南（上）：项目概述、代码结构与环境搭建 Brduino脑机接口技术答疑脑机新手指南 python 脑机接口新手入门
一、引言在脑机接口（BCI）领域，语音相关的研究正不断取得突破。speechBCI项目为语音脑机接口的研究提供了一个优秀的开源代码库。该项目与前沿的学术研究、丰富的数据集以及具有挑战性的机器学习竞赛紧密相连。本指南将分上下两篇，详细引导新手深入了解和使用speechBCI项目。二、项目概述speechBCI项目不仅仅是一个代码集合，它背后有着深厚的学术背景和实际应用价值。它与一篇发表在[Natur
脑机新手指南（十二）：BciPy 脑机接口工具入门（下篇）：核心功能与实践应用 Brduino脑机接口技术答疑脑机新手指南人工智能算法机器学习
一、BciPy核心模块深度解析（一）信号采集与处理模块（acquisition&signal）1.信号采集流程BciPy通过LabStreamingLayer（LSL）协议实现多设备同步采集：frombcipy.acquisitionimportLslStreamer # 初始化LSL流采集器 streamer=LslStreamer() streamer.connect() # 连接到EEG设
脑机新手指南（七）：OpenBCI_GUI：从环境搭建到数据可视化（上） Brduino脑机接口技术答疑脑机新手指南脑机接口算法人工智能新手入门
一、OpenBCI_GUI项目概述（一）项目背景与目标OpenBCI是一个开源的脑电信号采集硬件平台，其配套的OpenBCI_GUI则是专为该硬件设计的图形化界面工具。对于研究人员、开发者和学生而言，首次接触OpenBCI设备时，往往面临数据可视化、实时处理及跨平台兼容性等挑战。OpenBCI_GUI的核心目标是为所有OpenBCI设备（包括Ganglion、Cyton及CytonwithDais
脑机新手指南（三）：新手小白入门 BCI-从认识到初体验（上）
一、引言脑机接口（Brain-ComputerInterface，简称BCI）作为一项前沿科技，正逐渐改变我们对大脑与外部设备交互方式的认知。本教程旨在为完全不了解BCI的新手提供一个全面且系统的入门指南，帮助大家开启在BCI领域的学习之旅。二、认识BCIBCI的定义BCI是一种能够实现大脑与外部设备直接通信的技术。它通过检测大脑活动产生的电信号、磁信号或其他生理信号，并将这些信号转化为计算机能够
Brduino脑机连载（四）脑电范式软件大全（附源网页）
Psychopy（点击查看源网址）特点：是一款免费的心理学实验设计软件，可用于创建各种脑电实验范式，如视觉、听觉、认知等任务。它具有强大的图形界面和丰富的刺激呈现功能，能够精确控制刺激的时间、位置、强度等参数，并且支持多种数据格式的输出，方便与其他脑电分析软件进行集成.适用场景：适用于心理学、神经科学等领域的研究人员进行各种认知、感知、情感等方面的脑电实验研究，尤其是对于需要复杂刺激呈现和精确时间
脑机新手指南（二十一）基于 Brainstorm 的 MEG/EEG 数据分析（上篇） Brduino脑机接口技术答疑脑机新手指南数据分析数据挖掘
一、脑机接口与神经电生理技术概述脑机接口（Brain-ComputerInterface,BCI）是一种在大脑与外部设备之间建立直接通信通道的技术，它通过采集和分析大脑信号来实现对设备的控制或信息的输出。神经电生理信号作为脑机接口的重要数据来源，主要包括以下几种类型：MEG（脑磁图）：通过测量大脑神经元电活动产生的磁场变化来反映脑功能，具有极高的时间分辨率。EEG（脑电图）：通过头皮电极记录大脑皮
Orangepi Zero2 全志H616开发学习会学嵌入式 ARM Linux全志平台开发学习 linux 开发语言服务器
一.简介1.1为什么学学习目标依然是Linux系统，平台是ARM架构·蜂巢快递柜，配送机器人，这些应用场景用C51,STM32单片机无法实现·第三方介入库的局限性，比如刷脸支付和公交车收费设备需要集成支付宝SDK，提供的libalipay.so是Linux的库，设备必须跑Linux系统·图像识别，音频，视频等领域的技术支撑也无法脱离Linux系统·人工智能型设备通常需要更好的系统和更高的算力，所以
eclipse maven IXHONG eclipse
eclipse中使用maven插件的时候，运行run as maven build的时候报错 -Dmaven.multiModuleProjectDirectory system propery is not set. Check $M2_HOME environment variable and mvn script match. 可以设一个环境变量M2_HOME指
timer cancel方法的一个小实例 alleni123 多线程 timer
package com.lj.timer; import java.util.Date; import java.util.Timer; import java.util.TimerTask; public class MyTimer extends TimerTask { private int a; private Timer timer; pub
MySQL数据库在Linux下的安装 ducklsl mysql
1.建好一个专门放置MySQL的目录 /mysql/db数据库目录 /mysql/data数据库数据文件目录 2.配置用户，添加专门的MySQL管理用户 >groupadd mysql ----添加用户组 >useradd -g mysql mysql ----在mysql用户组中添加一个mysql用户 3.配置，生成并安装MySQL >cmake -D
spring------>>cvc-elt.1: Cannot find the declaration of element Array_06 spring bean
将-------- <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http://www.w3
maven发布第三方jar的一些问题 cugfy maven
maven中发布第三方jar到nexus仓库使用的是 deploy:deploy-file命令有许多参数，具体可查看 http://maven.apache.org/plugins/maven-deploy-plugin/deploy-file-mojo.html 以下是一个例子： mvn deploy:deploy-file -DgroupId=xpp3
MYSQL下载及安装 357029540 mysql
好久没有去安装过MYSQL，今天自己在安装完MYSQL过后用navicat for mysql去厕测试链接的时候出现了10061的问题，因为的的MYSQL是最新版本为5.6.24，所以下载的文件夹里没有my.ini文件，所以在网上找了很多方法还是没有找到怎么解决问题，最后看到了一篇百度经验里有这个的介绍，按照其步骤也完成了安装，在这里给大家分享下这个链接的地址
ios TableView cell的布局张亚雄 tableview
cell.imageView.image = [UIImage imageNamed:[imageArray objectAtIndex:[indexPath row]]]; CGSize itemSize = CGSizeMake(60, 50); &nbs
Java编码转义 adminjun java 编码转义
import java.io.UnsupportedEncodingException; /** * 转换字符串的编码 */ public class ChangeCharset { /** 7位ASCII字符，也叫作ISO646-US、Unicode字符集的基本拉丁块 */ public static final Strin
Tomcat 配置和spring aijuans spring
简介 Tomcat启动时，先找系统变量CATALINA_BASE，如果没有，则找CATALINA_HOME。然后找这个变量所指的目录下的conf文件夹，从中读取配置文件。最重要的配置文件：server.xml 。要配置tomcat，基本上了解server.xml，context.xml和web.xml。 Server.xml -- tomcat主
Java打印当前目录下的所有子目录和文件 ayaoxinchao 递归 File
其实这个没啥技术含量，大湿们不要操笑哦，只是做一个简单的记录，简单用了一下递归算法。 import java.io.File; /** * @author Perlin * @date 2014-6-30 */ public class PrintDirectory { public static void printDirectory(File f
linux安装mysql出现libs报冲突解决 BigBird2012 linux
linux安装mysql出现libs报冲突解决安装mysql出现 file /usr/share/mysql/ukrainian/errmsg.sys from install of MySQL-server-5.5.33-1.linux2.6.i386 conflicts with file from package mysql-libs-5.1.61-4.el6.i686
jedis连接池使用实例 bijian1013 redis jedis连接池 jedis
实例代码： package com.bijian.study; import java.util.ArrayList; import java.util.List; import redis.clients.jedis.Jedis; import redis.clients.jedis.JedisPool; import redis.clients.jedis.JedisPoo
关于朋友 bingyingao 朋友兴趣爱好维持
成为朋友的必要条件：志相同，道不合，可以成为朋友。譬如马云、周星驰一个是商人，一个是影星，可谓道不同，但都很有梦想，都要在各自领域里做到最好，当他们遇到一起，互相欣赏，可以畅谈两个小时。志不同，道相合，也可以成为朋友。譬如有时候看到两个一个成绩很好每次考试争做第一，一个成绩很差的同学是好朋友。他们志向不相同，但他
【Spark七十九】Spark RDD API一 bit1129 spark
aggregate package spark.examples.rddapi import org.apache.spark.{SparkConf, SparkContext} //测试RDD的aggregate方法 object AggregateTest { def main(args: Array[String]) { val conf = new Spar
ktap 0.1 released bookjovi kernel tracing
Dear, I'm pleased to announce that ktap release v0.1, this is the first official release of ktap project, it is expected that this release is not fully functional or very stable and we welcome bu
能保存Properties文件注释的Properties工具类 BrokenDreams properties
今天遇到一个小需求：由于java.util.Properties读取属性文件时会忽略注释，当写回去的时候，注释都没了。恰好一个项目中的配置文件会在部署后被某个Java程序修改一下，但修改了之后注释全没了，可能会给以后的参数调整带来困难。所以要解决这个问题。 &nb
读《研磨设计模式》-代码笔记-外观模式-Facade bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* * 百度百科的定义： * Facade（外观）模式为子系统中的各类（或结构与方法）提供一个简明一致的界面， * 隐藏子系统的复杂性，使子系统更加容易使用。他是为子系统中的一组接口所提供的一个一致的界面 * * 可简单地
After Effects教程收集 cherishLC After Effects
1、中文入门 http://study.163.com/course/courseMain.htm?courseId=730009 2、videocopilot英文入门教程（中文字幕） http://www.youku.com/playlist_show/id_17893193.html 英文原址： http://www.videocopilot.net/basic/ 素
Linux Apache 安装过程 crabdave apache
Linux Apache 安装过程下载新版本： apr-1.4.2.tar.gz（下载网站：http://apr.apache.org/download.cgi） apr-util-1.3.9.tar.gz（下载网站：http://apr.apache.org/download.cgi） httpd-2.2.15.tar.gz（下载网站：http://httpd.apac
Shell学习之变量赋值和引用 daizj shell 变量引用赋值
本文转自：http://www.cnblogs.com/papam/articles/1548679.html Shell编程中，使用变量无需事先声明，同时变量名的命名须遵循如下规则：首个字符必须为字母（a-z，A-Z）中间不能有空格，可以使用下划线（_）不能使用标点符号不能使用bash里的关键字（可用help命令查看保留关键字）需要给变量赋值时，可以这么写：
Java SE 第一讲（Java SE入门、JDK的下载与安装、第一个Java程序、Java程序的编译与执行） dcj3sjt126com java jdk
Java SE 第一讲： Java SE：Java Standard Edition Java ME: Java Mobile Edition Java EE：Java Enterprise Edition Java是由Sun公司推出的（今年初被Oracle公司收购）。收购价格：74亿美金 J2SE、J2ME、J2EE JDK：Java Development
YII给用户登录加上验证码 dcj3sjt126com yii
1、在SiteController中添加如下代码： /** * Declares class-based actions. */ public function actions() { return array( // captcha action renders the CAPTCHA image displ
Lucene使用说明 dyy_gusi Lucene search 分词器
Lucene使用说明 1、lucene简介 1.1、什么是lucene Lucene是一个全文搜索框架，而不是应用产品。因此它并不像baidu或者googleDesktop那种拿来就能用，它只是提供了一种工具让你能实现这些产品和功能。 1.2、lucene能做什么要回答这个问题，先要了解lucene的本质。实际
学习编程并不难,做到以下几点即可! gcq511120594 数据结构编程算法
不论你是想自己设计游戏，还是开发iPhone或安卓手机上的应用，还是仅仅为了娱乐，学习编程语言都是一条必经之路。编程语言种类繁多，用途各异，然而一旦掌握其中之一，其他的也就迎刃而解。作为初学者，你可能要先从Java或HTML开始学，一旦掌握了一门编程语言，你就发挥无穷的想象，开发各种神奇的软件啦。 1、确定目标学习编程语言既充满乐趣，又充满挑战。有些花费多年时间学习一门编程语言的大学生到
Java面试十问之三：Java与C++内存回收机制的差别 HNUlanwei java C++finalize()堆栈内存回收
大家知道， Java 除了那 8 种基本类型以外，其他都是对象类型（又称为引用类型）的数据。 JVM 会把程序创建的对象存放在堆空间中，那什么又是堆空间呢？其实，堆（ Heap）是一个运行时的数据存储区，从它可以分配大小各异的空间。一般，运行时的数据存储区有堆（ Heap）和堆栈（ Stack），所以要先看它们里面可以分配哪些类型的对象实体，然后才知道如何均衡使用这两种存储区。一般来说，栈中存放的
第二章 Nginx+Lua开发入门 jinnianshilongnian nginx lua
Nginx入门本文目的是学习Nginx+Lua开发，对于Nginx基本知识可以参考如下文章： nginx启动、关闭、重启 http://www.cnblogs.com/derekchen/archive/2011/02/17/1957209.html agentzh 的 Nginx 教程 http://openresty.org/download/agentzh-nginx-tutor
MongoDB windows安装基本命令 liyonghui160com
windows安装安装目录： D:\MongoDB\ 新建目录 D:\MongoDB\data\db 4.启动进城： cd D:\MongoDB\bin mongod -dbpath D:\MongoDB\data\db &n
Linux下通过源码编译安装程序 pda158 linux
一、程序的组成部分　　Linux下程序大都是由以下几部分组成：　　二进制文件：也就是可以运行的程序文件　　库文件：就是通常我们见到的lib目录下的文件　　配置文件：这个不必多说，都知道　　帮助文档：通常是我们在linux下用man命令查看的命令的文档　　二、linux下程序的存放目录　　linux程序的存放目录大致有三个地方：　　/etc, /b
WEB开发编程的职业生涯４个阶段 shw3588 编程 Web 工作生活
觉得自己什么都会 2007年从学校毕业，凭借自己原创的ASP毕业设计，以为自己很厉害似的，信心满满去东莞找工作，找面试成功率确实很高，只是工资不高，但依旧无法磨灭那过分的自信，那时候什么考勤系统、什么OA系统、什么ERP，什么都觉得有信心，这样的生涯大概持续了约一年。根本不是自己想的那样 2008年开始接触很多工作相关的东西，发现太多东西自己根本不会，都需要去学，不管是asp还是js，
遭遇jsonp同域下变作post请求的坑 vb2005xu jsonp 同域post
今天迁移一个站点时遇到一个坑爹问题,同一个jsonp接口在跨域时都能调用成功,但是在同域下调用虽然成功,但是数据却有问题. 此处贴出我的后端代码片段 $mi_id = htmlspecialchars(trim($_GET['mi_id '])); $mi_cv = htmlspecialchars(trim($_GET['mi_cv '])); 贴出我前端代码片段: $.aj