xulinshadow701

DeepLearnToolbox_NN notes

DeepLearnToolbox usage：matlab->set path->add with subfloders

DeepLearnToolbox_NN (collated According to the function called order)

ex1 vanilla（香草） neural net
ex2 neural net with L2 weight decay
ex3 neural net with dropout
ex4 neural net with sigmoid activation function
ex5 plotting functionality
ex6 neural net with sigmoid activation and plotting of validation and training error

function test_example_NN

%rewritten and noted by Kylin 2013/12/11
load mnist_uint8;

ex_choise=5;%选择做第几个实验（1—6）
%将数据缩放到（0,1）
train_x = double(train_x) / 255;
test_x  = double(test_x)  / 255;
train_y = double(train_y);
test_y  = double(test_y);

% normalize
%标准化，均值0，标准差为1
[train_x, mu, sigma] = zscore(train_x);
test_x = normalize(test_x, mu, sigma);

ex1 vanilla（香草） neural net

if (ex_choise==1)
    rand('state',0)
    nn = nnsetup([784 100 10]);%构造一个ANN，784-100-10
    opts.numepochs =  1;   %  Number of full sweeps through data，扫描整个样本的次数
    opts.batchsize = 100;  %  Take a mean gradient step over this many samples
    [nn, L] = nntrain(nn, train_x, train_y, opts);

    [er, bad] = nntest(nn, test_x, test_y);

    assert(er < 0.08, 'Too big error');%er>0.08时警告
end

ex2 neural net with L2 weight decay

if ex_choise==2
    rand('state',0)
    nn = nnsetup([784 100 10]);

    nn.weightPenaltyL2 = 1e-4;  %  L2 weight decay
    opts.numepochs =  1;        %  Number of full sweeps through data
    opts.batchsize = 100;       %  Take a mean gradient step over this many samples

    nn = nntrain(nn, train_x, train_y, opts);

    [er, bad] = nntest(nn, test_x, test_y);
    assert(er < 0.1, 'Too big error');
end

ex3 neural net with dropout

if ex_choise==3
    rand('state',0)
    nn = nnsetup([784 100 10]);

    nn.dropoutFraction = 0.5;   %  Dropout fraction
    opts.numepochs =  1;        %  Number of full sweeps through data
    opts.batchsize = 100;       %  Take a mean gradient step over this many samples

    nn = nntrain(nn, train_x, train_y, opts);

    [er, bad] = nntest(nn, test_x, test_y);
    assert(er < 0.1, 'Too big error');
end

ex4 neural net with sigmoid activation function

if ex_choise==4
    rand('state',0)
    nn = nnsetup([784 100 10]);

    nn.activation_function = 'sigm';    %  Sigmoid activation function
    nn.learningRate = 1;                %  Sigm require a lower learning rate
    opts.numepochs =  1;                %  Number of full sweeps through data
    opts.batchsize = 100;               %  Take a mean gradient step over this many samples

    nn = nntrain(nn, train_x, train_y, opts);

    [er, bad] = nntest(nn, test_x, test_y);
    assert(er < 0.1, 'Too big error');
end

ex5 plotting functionality

if ex_choise==5
    rand('state',0)
    nn = nnsetup([784 20 10]);
    opts.numepochs         = 5;            %  Number of full sweeps through data
    nn.output              = 'softmax';    %  use softmax output
    opts.batchsize         = 1000;         %  Take a mean gradient step over this many samples
    opts.plot              = 1;            %  enable plotting

    nn = nntrain(nn, train_x, train_y, opts);

    [er, bad] = nntest(nn, test_x, test_y);
    assert(er < 0.1, 'Too big error');
end

epoch 1/5. Took 1.2234 seconds. Mini-batch mean squared error on training set is 0.94451; Full-batch train err = 0.387429
epoch 2/5. Took 1.2288 seconds. Mini-batch mean squared error on training set is 0.35993; Full-batch train err = 0.310213
epoch 3/5. Took 1.2134 seconds. Mini-batch mean squared error on training set is 0.30622; Full-batch train err = 0.279947
epoch 4/5. Took 1.2075 seconds. Mini-batch mean squared error on training set is 0.27597; Full-batch train err = 0.249559
epoch 5/5. Took 1.2745 seconds. Mini-batch mean squared error on training set is 0.25535; Full-batch train err = 0.234196

ex6 neural net with sigmoid activation and plotting of validation and training error

if ex_choise==6
    % split training data into training and validation data
    vx   = train_x(1:10000,:);
    tx = train_x(10001:end,:);
    vy   = train_y(1:10000,:);
    ty = train_y(10001:end,:);

    rand('state',0)
    nn                      = nnsetup([784 20 10]);
    nn.output               = 'softmax';                   %  use softmax output
    opts.numepochs          = 5;                           %  Number of full sweeps through data
    opts.batchsize          = 1000;                        %  Take a mean gradient step over this many samples
    opts.plot               = 1;                           %  enable plotting
    nn = nntrain(nn, tx, ty, opts, vx, vy);                %  nntrain takes validation set as last two arguments (optionally)

    [er, bad] = nntest(nn, test_x, test_y);
    assert(er < 0.1, 'Too big error');
end

function [x, mu, sigma] = zscore(x)
    mu=mean(x);
    sigma=max(std(x),eps);
	x=bsxfun(@minus,x,mu);
	x=bsxfun(@rdivide,x,sigma);
end

function x = normalize(x, mu, sigma)
    x=bsxfun(@minus,x,mu);
	x=bsxfun(@rdivide,x,sigma);
end
function nn = nnsetup(architecture)
%NNSETUP creates a Feedforward Backpropagate Neural Network
% nn = nnsetup(architecture) returns an neural network structure with n=numel(architecture)
% layers, architecture being a n x 1 vector of layer sizes e.g. [784 100 10]

nn.size   = architecture;
nn.n      = numel(nn.size);

nn.activation_function              = 'tanh_opt';   %  Activation functions of hidden layers: 'sigm' (sigmoid) or 'tanh_opt' (optimal tanh).
nn.learningRate                     = 2;            %  learning rate Note: typically needs to be lower when using 'sigm' activation function and non-normalized inputs.
nn.momentum                         = 0.5;          %  Momentum
nn.scaling_learningRate             = 1;            %  Scaling factor for the learning rate (each epoch)
nn.weightPenaltyL2                  = 0;            %  L2 regularization
nn.nonSparsityPenalty               = 0;            %  Non sparsity penalty 非稀疏性惩罚参数
nn.sparsityTarget                   = 0.05;         %  Sparsity target
nn.inputZeroMaskedFraction          = 0;            %  Used for Denoising AutoEncoders
nn.dropoutFraction                  = 0;            %  Dropout level (http://www.cs.toronto.edu/~hinton/absps/dropout.pdf)
nn.testing                          = 0;            %  Internal variable（内部变量）. nntest sets this to one.
nn.output                           = 'sigm';       %  output unit 'sigm' (=logistic), 'softmax' and 'linear'

for i = 2 : nn.n
    %初始化weights and weight momentum（eg：W1 100*785）
    nn.W{i - 1} = (rand(nn.size(i), nn.size(i - 1)+1) - 0.5) * 2 * 4 * sqrt(6 / (nn.size(i) + nn.size(i - 1)));
    nn.vW{i - 1} = zeros(size(nn.W{i - 1}));% VW 100*785

    % average activations (for use with sparsity，eg：sparseAE KL散度约束)
    nn.p{i}     = zeros(1, nn.size(i));
end
end
function [nn, L]  = nntrain(nn, train_x, train_y, opts, val_x, val_y)
%NNTRAIN trains a neural net
% [nn, L] = nnff(nn, x, y, opts) trains the neural network nn with input x and
% output y for opts.numepochs epochs, with minibatches of size
% opts.batchsize. Returns a neural network nn with updated activations,
% errors, weights and biases, (nn.a, nn.e, nn.W, nn.b) and L, the sum
% squared error for each training minibatch.

assert(isfloat(train_x), 'train_x must be a float');
assert(nargin == 4 || nargin == 6,'number ofinput arguments must be 4 or 6')

loss.train.e               = [];
loss.train.e_frac          = [];
loss.val.e                 = [];
loss.val.e_frac            = [];
opts.validation = 0;
if nargin == 6
    opts.validation = 1;
end

fhandle = [];
if isfield(opts,'plot') && opts.plot == 1
    fhandle = figure();
end

m = size(train_x, 1); %m为训练样本的数量（60000）

%设置opt参数
batchsize = opts.batchsize;%batch的大小，100.实验ex5画图时为1000
numepochs = opts.numepochs;%扫描次数，1。实验5，迭代5次

numbatches = m / batchsize;%batch的个数，600。ex5：1000

assert(rem(numbatches, 1) == 0, 'numbatches must be a integer');

L = zeros(numepochs*numbatches,1);%L为batch数量和扫描样本次数的乘积 600。
                                  %ex5,300*1
n = 1;
for i = 1 : numepochs
    tic;

    kk = randperm(m);%生成一个和整个样本大小的随机向量 1*60000
    for l = 1 : numbatches%1-600
        %取出一个batch（100个）大小的训练样本
        batch_x = train_x(kk((l - 1) * batchsize + 1 : l * batchsize), :);

        %Add noise to input (for use in denoising autoencoder)
        if(nn.inputZeroMaskedFraction ~= 0)
            %将样本中小于nn.inputZeroMaskedFraction水平的元素置为0
            batch_x = batch_x.*(rand(size(batch_x))>nn.inputZeroMaskedFraction);
        end
        %batch的标签
        batch_y = train_y(kk((l - 1) * batchsize + 1 : l * batchsize), :);
        %前向传播
        %NNFF performs a feedforward pass
        % nn = nnff(nn, x, y) returns an neural network structure with updated
        % layer activations, error and loss (nn.a, nn.e and nn.L)
        nn = nnff(nn, batch_x, batch_y);
        %误差反传
        %NNBP performs backpropagation
        % nn = nnbp(nn) returns an neural network structure with updated weights
        nn = nnbp(nn);
        %梯度下降（SGD）
        %NNAPPLYGRADS updates weights and biases with calculated gradients
        % nn = nnapplygrads(nn) returns an neural network structure with updated
        % weights and biases
        nn = nnapplygrads(nn);
        %600*1向量，每一个元素表示一个mini-batch梯度下降一次得到的误差值
        L(n) = nn.L;%600个batch，扫描（迭代）一次，L为每一次batch迭代的损失函数值

        n = n + 1;
    end

    t = toc;

    if opts.validation == 1
        loss = nneval(nn, loss, train_x, train_y, val_x, val_y);
        str_perf = sprintf('; Full-batch train mse = %f, val mse = %f', loss.train.e(end), loss.val.e(end));
    else
        loss = nneval(nn, loss, train_x, train_y);% 用Full-batch train，来得到一个误差
        str_perf = sprintf('; Full-batch train err = %f', loss.train.e(end));
    end
    if ishandle(fhandle)
        nnupdatefigures(nn, fhandle, loss, opts, i);
    end

    disp(['epoch ' num2str(i) '/' num2str(opts.numepochs) '. Took ' num2str(t) ' seconds' '. Mini-batch mean squared error on training set is ' num2str(mean(L((n-numbatches):(n-1)))) str_perf]);
    nn.learningRate = nn.learningRate * nn.scaling_learningRate;%scaling_learningRate，学习率调整参数
end
end
function nn = nnff(nn, x, y)
%NNFF performs a feedforward pass
% nn = nnff(nn, x, y) returns an neural network structure with updated
% layer activations, error and loss (nn.a, nn.e and nn.L)

    n = nn.n;
    m = size(x, 1);%batch样本大小，测试时为10000个样本

    x = [ones(m,1) x];
    nn.a{1} = x;%这里用a1表示输入x，也就是输入层的输出

    %feedforward pass
    for i = 2 : n-1
        switch nn.activation_function
            case 'sigm'
                % Calculate the unit's outputs (including the bias term)
                nn.a{i} = sigm(nn.a{i - 1} * nn.W{i - 1}');
            case 'tanh_opt'
                nn.a{i} = tanh_opt(nn.a{i - 1} * nn.W{i - 1}');
        end

        %dropout
        if(nn.dropoutFraction > 0)
            if(nn.testing)% at testing time，在测试时用
                nn.a{i} = nn.a{i}.*(1 - nn.dropoutFraction);%测试时这样做.*(1-p)
            else
                %rand(size(nn.a{i}))产生一个100*100的（0,1）随机矩阵，大于0.5的置为1,否则为0
                nn.dropOutMask{i} = (rand(size(nn.a{i}))>nn.dropoutFraction);
                nn.a{i} = nn.a{i}.*nn.dropOutMask{i};%保留a（i）矩阵中大于1的元素
            end
        end

        %calculate running exponential activations for use with sparsity
        %计算Sparsity，nonSparsityPenalty是对没达到SparsityTarget参数的惩罚系数？？？
        if(nn.nonSparsityPenalty>0)
            nn.p{i} = 0.99 * nn.p{i} + 0.01 * mean(nn.a{i}, 1);%P表示？
        end

        %Add the bias term
        nn.a{i} = [ones(m,1) nn.a{i}];%100*100变成100*101，增加一列
    end
    switch nn.output
        case 'sigm'
            nn.a{n} = sigm(nn.a{n - 1} * nn.W{n - 1}');
        case 'linear'
            nn.a{n} = nn.a{n - 1} * nn.W{n - 1}';
        case 'softmax'
            nn.a{n} = nn.a{n - 1} * nn.W{n - 1}';
            nn.a{n} = exp(bsxfun(@minus, nn.a{n}, max(nn.a{n},[],2)));
            nn.a{n} = bsxfun(@rdivide, nn.a{n}, sum(nn.a{n}, 2));
    end

    %error and loss
    nn.e = y - nn.a{n};

    switch nn.output
        case {'sigm', 'linear'}
            nn.L = 1/2 * sum(sum(nn.e .^ 2)) / m;
        case 'softmax'
            nn.L = -sum(sum(y .* log(nn.a{n}))) / m;
    end
end
function nn = nnbp(nn)
%NNBP performs backpropagation
% nn = nnbp(nn) returns an neural network structure with updated weights

    n = nn.n;
    sparsityError = 0;
    switch nn.output%输出层
        case 'sigm'
            d{n} = - nn.e .* (nn.a{n} .* (1 - nn.a{n}));%-（y-a(n)）.*f'(z(n))
        case {'softmax','linear'}
            d{n} = - nn.e;
    end
    for i = (n - 1) : -1 : 2%倒数第二层到第二层
        % Derivative of the activation function
        switch nn.activation_function
            case 'sigm'
                d_act = nn.a{i} .* (1 - nn.a{i});%f'(z(i))
            case 'tanh_opt'
                d_act = 1.7159 * 2/3 * (1 - 1/(1.7159)^2 * nn.a{i}.^2);
        end

        if(nn.nonSparsityPenalty>0)
            pi = repmat(nn.p{i}, size(nn.a{i}, 1), 1);
            sparsityError = [zeros(size(nn.a{i},1),1) nn.nonSparsityPenalty * (-nn.sparsityTarget ./ pi + (1 - nn.sparsityTarget) ./ (1 - pi))];
        end

        % Backpropagate first derivatives
        if i+1==n % in this case in d{n} there is not the bias term to be removed，最后一层没有偏置
            d{i} = (d{i + 1} * nn.W{i} + sparsityError) .* d_act; % Bishop (5.56)%delta(L),also called residual
        else % in this case in d{i} the bias term has to be removed，偏置不参与误差反传
            d{i} = (d{i + 1}(:,2:end) * nn.W{i} + sparsityError) .* d_act;
        end

        if(nn.dropoutFraction>0)%i从2开始，ones(size(d{i},1),1)=100*1
            d{i} = d{i} .* [ones(size(d{i},1),1) nn.dropOutMask{i}];%这里delta(L)也得dropout
        end

    end

    for i = 1 : (n - 1)%计算偏导数（关于W的）delta（W)
        if i+1==n
            nn.dW{i} = (d{i + 1}' * nn.a{i}) / size(d{i + 1}, 1);
        else
            nn.dW{i} = (d{i + 1}(:,2:end)' * nn.a{i}) / size(d{i + 1}, 1);
        end
    end
end
function nn = nnapplygrads(nn)
%NNAPPLYGRADS updates weights and biases with calculated gradients
% nn = nnapplygrads(nn) returns an neural network structure with updated
% weights and biases

    for i = 1 : (nn.n - 1)%nn.n表示层数
        if(nn.weightPenaltyL2>0)%weightPenaltyL2权值L2正则化参数
            dW = nn.dW{i} + nn.weightPenaltyL2 * [zeros(size(nn.W{i},1),1) nn.W{i}(:,2:end)];
        else
            dW = nn.dW{i};
        end

        dW = nn.learningRate * dW;

        if(nn.momentum>0)%动量项
            nn.vW{i} = nn.momentum*nn.vW{i} + dW;
            dW = nn.vW{i};
        end

        nn.W{i} = nn.W{i} - dW;%权值更新（这里阈值包含在权值矩阵中，为新加的一列）
    end
end
function nnupdatefigures(nn,fhandle,L,opts,i)
%NNUPDATEFIGURES updates figures during training
if i > 1 %don't plot first point, its only a point
    x_ax = 1:i;
    % create legend
    if opts.validation == 1
        M            = {'Training','Validation'};
    else
        M            = {'Training'};
    end

    %create data for plots
    if strcmp(nn.output,'softmax')%Compare strings (case sensitive)
        plot_x       = x_ax';
        plot_ye      = L.train.e';
        plot_yfrac   = L.train.e_frac';

    else
        plot_x       = x_ax';
        plot_ye      = L.train.e';
    end

    %add error on validation data if present
    if opts.validation == 1
        plot_x       = [plot_x, x_ax'];
        plot_ye      = [plot_ye,L.val.e'];
    end


    %add classification error on validation data if present
    if opts.validation == 1 && strcmp(nn.output,'softmax')
        plot_yfrac   = [plot_yfrac, L.val.e_frac'];
    end

%    plotting
    figure(fhandle);
    if strcmp(nn.output,'softmax')  %also plot classification error
        %subplot(m,n,p) breaks the figure window into an m-by-n grid and creates an axes object in the pth location
        %for the current plot, and returns the axes handle.
        p1 = subplot(1,2,1);%P1为第一个图句柄
        plot(plot_x,plot_ye);
        xlabel('Number of epochs'); ylabel('Error');title('Error');
        title('Error')
        legend(p1, M,'Location','NorthEast');%加上“training”的标注
        set(p1, 'Xlim',[0,opts.numepochs + 1])%为x轴设置范围

        p2 = subplot(1,2,2);
        plot(plot_x,plot_yfrac);
        xlabel('Number of epochs'); ylabel('Misclassification rate');
        title('Misclassification rate')
        legend(p2, M,'Location','NorthEast');
        set(p2, 'Xlim',[0,opts.numepochs + 1])

    else

        p = plot(plot_x,plot_ye);
        xlabel('Number of epochs'); ylabel('Error');title('Error');
        legend(p, M,'Location','NorthEast');
        set(gca, 'Xlim',[0,opts.numepochs + 1])

    end
    drawnow;%刷新图
end
end
function [er, bad] = nntest(nn, x, y)
    labels = nnpredict(nn, x);
    [~, expected] = max(y,[],2);%目标lable
    bad = find(labels ~= expected);
    er = numel(bad) / size(x, 1);
end

2024年人工智能领域发生了哪些事儿？全球AI大事件1至12月盘点人工智能aigc
2024年，对人工智能（AI）而言是激动人心的一年。这一年不仅见证了AI技术的全面突破，也深刻改变了社会生活的方方面面。从金融到医疗、从教育到娱乐，AI的深度渗透无处不在。显然，这项技术已经从概念走向普及，并开始重新定义我们的未来。一月：人机交互技术的崭新开端2024年1月30日：Neuralink脑机接口植入Neuralink宣布，首名人类成功接受脑机接口芯片植入手术。这项手术由机器人完成，芯片
开源生态发展合作倡议操作系统
在信息技术发展的浪潮中，开源已成为全球创新的强劲引擎，深刻影响着各行各业的发展。今天，我们站在新的历史起点上，肩负着推动开源生态发展的重任。在此，开源欧拉（openEuler）、龙蜥（OpenAnolis）、鸥栖（OpenCloudOS）、开放麒麟（openKylin）、深度（deepin）五大操作系统开源社区携手并进，共同发起开源生态发展合作倡议，旨在书写开源生态繁荣的新篇章。在此，我们提出三点
DeepSeek 公开新的模型权重数据分析能量站机器学习人工智能
DeepSeek-V3是一款开源大语言模型，在关键基准测试中超越了Llama3.1405B和GPT-4o，尤其在编码和数学任务中成绩优异。除特定受限应用（军事、伤害未成年人、生成虚假信息等）外，模型权重开源，可在线下载。工作原理混合专家架构（MoE）：DeepSeek-V3是MoE型Transformer模型，有6710亿个参数，运行时370亿参数激活。相比Llama3.1405B，训练时间大幅缩
深度探索 DeepSeek-R1：国产大模型的AGI雏形与创新进展微凉的衣柜科技头条 agi 人工智能
随着人工智能技术的飞速发展，国内外企业纷纷发布了一系列创新的大模型，推动了AGI（通用人工智能）领域的探索。近期，DeepSeek-R1这一模型的发布引起了广泛关注，它不仅标志着国产大模型在智能化上的一次重大突破，还提出了全新的训练方法，解决了过去依赖大量人类数据的问题。本篇文章将详细介绍DeepSeek-R1的核心优势、技术创新以及实际应用案例，揭示它在AGI领域的潜力。1.DeepSeek-R
AI界的拼多多-中国人工智能初创公司DeepSeek如何与硅谷巨头竞争 xidianjiapei001 AI-人工智能与大模型人工智能 AI DeepSeek 大模型
这家公司打造出了一款成本更低且颇具竞争力的聊天机器人，其使用的高端计算机芯片数量少于谷歌和OpenAI等美国巨头企业，这凸显出芯片出口管制的局限性。圣诞节次日，一家名为DeepSeek的中国小型初创公司推出了一款新的人工智能系统，其性能可与OpenAI和谷歌等公司的尖端聊天机器人相媲美。仅此一点就堪称一个里程碑。但这个名为DeepSeek-V3系统的研发团队称，他们迈出了更大的一步。在一篇解释该技
tensorlow中tensorboard可视化展示训练过程张登杰踩 tensorflow tensorboard tensorflow mnist 神经网络
importtensorflowastffromtensorflow.examples.tutorials.mnistimportinput_datamax_steps=1000#训练步数learning_rate=0.001#设置学习率dropout=0.9#神经元保留比例data_dir='./MNIST_data'#数据存放路径#minist数据集下载链接:https://pan.baidu
Linux dirname、basename 指令 weixin_30457465 操作系统
Linuxdirname、basename指令(2012-04-3021:44:53)转载▼标签：杂谈分类：linux一、dirname指令1、功能：从给定的包含绝对路径的文件名中去除文件名（非目录的部分），然后返回剩下的路径（目录的部分）2、用法：dirnamefilename例如下面几个例子（1）#dirname/etc/sysconfig/network-scripts/ifcfg-eth0
AAAI2024论文解读|Memory-Efficient Reversible Spiking Neural Networks-water-merged paixiaoxin 文献阅读论文合集脉冲神经网络可逆架构内存效率深度学习训练优化 AAAI
论文标题Memory-EfficientReversibleSpikingNeuralNetworks内存高效可逆脉冲神经网络论文链接Memory-EfficientReversibleSpikingNeuralNetworks论文下载论文作者HongZhang,YuZhang内容简介本文提出了一种可逆脉冲神经网络（RevSNN），旨在降低脉冲神经网络（SNNs）在训练过程中对中间激活和膜电位的内
深入详解神经网络的基础知识、工作原理以及应用【一】猿享天开人工智能基础知识学习深度学习神经网络人工智能
目录引言1.神经网络基础1.1感知器模型1.2多层感知器（MLP）示例：2.前馈神经网络（FeedforwardNeuralNetworks,FFNN）2.1结构与特点2.2训练过程2.3优化方法3.卷积神经网络（CNN）3.1基本概念3.2层类型3.3网络架构3.4应用领域3.5示例代码示例描述：4.循环神经网络（RNN）4.1基本概念4.2RNN结构4.3应用领域4.4示例代码示例描述：5.深
6. 马科维茨资产组合模型+政策意图AI金融智能体(DeepSeek-V3)增强方案（理论+Python实战） AI量金术师金融资产组合模型进化论人工智能金融 python 机器学习算法大数据数学建模
目录0.承前1.幻方量化&DeepSeek1.1Whatis幻方量化1.2WhatisDeepSeek2.重写AI金融智能体函数3.汇总代码4.反思4.1不足之处4.2提升思路5.启后0.承前本篇博文是对上一篇文章，链接:5.马科维茨资产组合模型+政策意图AI金融智能体(Qwen-Max)增强方案（理论+Python实战）的AI金融智能体更改为幻方量化DeepSeek-V3的尝试。唯一区别之处在于
docker-compose 部署Kong、PG、Konga qiandeqiande docker kong 容器
version:'2'networks:kong-net:driver:bridgeservices:kong-database:image:postgres:9.6container_name:kong-databaserestart:alwaysnetworks:-kong-netenvironment:POSTGRES_USER:kongPOSTGRES_DB:kongPOSTGRES_PA
Windows10环境vagrant+VirtualBox虚拟机无法创建私有网络的解决方案。 XiaoYu_3328 运维操作系统
报错信息==>default:Clearinganypreviouslysetnetworkinterfaces...Therewasanerrorwhileexecuting`VBoxManage`,aCLIusedbyVagrantforcontrollingVirtualBox.Thecommandandstderrisshownbelow.Command:["hostonlyif","cr
自动驾驶中的虚实迁移学习:降低对真实世界数据的依赖 AI架构设计之禅计算机软件编程原理与应用实践 java python javascript kotlin golang 架构人工智能
自动驾驶,迁移学习,虚实环境,数据效率,深度学习,强化学习1.背景介绍自动驾驶技术作为人工智能领域的重要应用之一，其发展离不开海量真实世界驾驶数据。然而，收集和标注真实世界驾驶数据成本高昂，且存在安全隐患。因此，如何降低对真实世界数据的依赖，提高自动驾驶系统的训练效率和安全性，成为一个亟待解决的关键问题。虚实迁移学习(Virtual-to-RealTransferLearning)作为一种新兴的机
千万年薪招揽AI大牛！罗福莉加盟小米，将如何改变其大模型战略？前端
近年来，人工智能(AI)领域发展迅速，其中大模型技术的突破更是引领着新一轮科技浪潮。AI代码生成器作为AI技术的重要应用，也正逐渐改变着软件开发的模式。1月18日，一则重磅消息震惊业界：DeepSeek开源大模型DeepSeek-V2的关键开发者之一罗福莉将加入小米，并可能领导小米大模型团队，年薪高达千万级别。这一举动不仅体现了小米对AI大模型技术的重视，也预示着小米在大模型领域的战略布局将迎来新
VLAN间路由配置实战 wespten 网络协议栈网络设备 5G 物联网网络工具开发网络
一、VLAN间路由1、VLAN隔离技术1.传统网络类型传统网络有三种类型：LAN–LocalAreaNetwork局域网；MAN–城域网；WAN–WideAreaNetwork广域网-internet；2.VLAN技术随着网络中计算机的数量越来越多，传统的以太网络开始面临广播泛滥以及安全性无法保障等各种问题。VLAN(VirtualLocalAreaNetwork)即虚拟局域网，是将一个物理的局域
在WSL 2 (Ubuntu 22.04)安装Docker Ce 启动错误解决梦想画家云原生工具软件 ubuntu docker linux wsl2
查看WSL版本在Windows命令提示符（CMD）或PowerShell中，你可以使用以下命令来查看已安装的WSL发行版及其版本信息：wsl-l-v(base)PSC:\Users\Lenovo>wsl-l-vNAMESTATEVERSION*Ubuntu-22.04Running2docker启动报错failedtostartdaemon:Errorinitializingnetworkcont
Java入门笔记（1）王磊鑫 java 笔记开发语言
引言在计算机编程的广袤宇宙中，Java无疑是一颗格外耀眼的恒星。那么，Java究竟是什么呢？Java是美国Sun公司（StanfordUniversityNetwork）在1995年推出的一门计算机高级编程语言。曾经辉煌的Sun公司在2009年被Oracle（甲骨文）公司收购，但Java的影响力并未因此而衰减。普遍认同Java的联合创始人之一詹姆斯·高斯林（JamesGosling）为“Java之
自学成才之路，DeepSeek R1 论文解读智识世界Intelligence 神经网络深度学习自然语言处理课程设计学习方法
DeepSeekR1的论文看完后，后劲很大。虽然我推荐所有人都去阅读一下，但我估计实际去读的人应该很少。今天把论文里的三个亮点，用通俗易懂地方式写出来，希望能让更多人了解这篇论文有多么重要。亮点一：告别“刷题班”，纯“实战”也能练出推理大神！我们平时学习，是不是经常要“刷题”？做大量的练习题，才能巩固知识，提高解题能力。以前训练AI模型，也差不多是这个套路，要先给AI“喂”大量的“习题”（监督数据
在docker中安装FastDFS容器，并且阿里云服务器配置童小纯项目部署(阿里云版)中间件大全---全面详解 docker 阿里云容器
1、拉取FastDFS镜像dockerpulldelron/fastdfs2、创建tracker容器dockerrun-dti--network=host--nametracker--privileged=true-v/var/fdfs/tracker:/var/fdfs-v/etc/localtime:/etc/localtimedelron/fastdfstracker3、创建storage容
【MotionCap】DROID-SLAM 1 ：介绍及安装等风来不如迎风去 AI入门与实战人工智能 SLAHMR DROID-SLAM
DROID-SLAM：DROID-SLAM:DeepVisualSLAMforMonocularDROID-SLAM：适用于单目、立体和RGB-D相机的深度视觉SLAMStereo,andRGB-DCamerashttps://arxiv.org/abs/2108.10869DROID-SLAM:DeepVisualSLAMforMonocular,Stereo,andRGB-DCamerasfi
DeepMind的新突破：GenCast 新加坡内哥谈技术人工智能大数据语言模型
每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同行！订阅：https://rengongzhineng.io/如今，人工智能（AI）在天气预报领域的表现已经可以与传统计算方法媲美。然而，AI模型的训
Linux 时间同步服务不想起昵称929 linux
时间同步:多主机协作工作时，各个主机的时间同步很重要，时间不一致会造成很多重要应用的故障，如:加密协议，日志，集群等，利用NTP(NetworkTimeProtocol)协议使网络中的各个计算机时间达到同步。目前NTP协议属于运维基础架构中必备的基本服务之一时间同步实现:ntp，chrony//关闭系统同步时间服务timedatectlstopchronyd.servicentp:将系统时钟和世界
Neural Architecture Search (NAS) 原理和应用 weixin_58349913 python
NeuralArchitectureSearch(NAS)原理和应用NeuralArchitectureSearch(NAS)是一种自动化设计神经网络架构的技术。它通过搜索空间中的不同架构配置来找到最优或接近最优的神经网络结构，从而减少人工设计网络结构的工作量。NAS的目标是通过自动化的方式获得比手工设计更高效、准确的模型架构，特别适用于对网络架构要求较高的任务。1.NAS的基本原理NAS的核心思
用GANs生成艺术作品的创新探索：人工智能与艺术的奇妙碰撞 Echo_Wish 前沿技术人工智能人工智能 gan python
用GANs生成艺术作品的创新探索：人工智能与艺术的奇妙碰撞随着人工智能技术的飞速发展，生成对抗网络（GenerativeAdversarialNetworks，GANs）在图像生成、视频生成、音频合成等领域展现出了惊人的创造力。特别是在艺术创作方面，GANs以其独特的生成能力，为艺术家和创作者提供了新的灵感和工具。本文将探讨GANs在艺术作品生成中的应用与创新，并通过具体代码示例展示其实现过程。一
【linux 时间同步】星辰&与海 linux 运维
文章目录1.使用NTP(NetworkTimeProtocol)2.使用Chrony3.使用timedatectl配置时间和时区4.手动设置时间5.检查时间同步状态6.总结.适用场景在Linux系统中，时间同步通常用于确保系统的时钟与标准时间源（如NTP服务器）保持一致。通过时间同步，可以避免系统时钟漂移导致的问题，特别是在分布式系统、日志记录和任务调度等场景中。以下是常见的Linux时间同步方法
模型压缩与优化技术——神经架构搜索（Neural Architecture Search, NAS） DuHz 轻量化模型机器学习计算机视觉人工智能神经网络深度学习数据挖掘语音识别
模型压缩与优化技术中的神经架构搜索（NeuralArchitectureSearch,NAS）技术1.引言在深度学习领域，神经网络的架构设计对模型的性能至关重要。传统的手动设计网络架构的过程费时费力，且通常依赖于经验和直觉。为了提升效率与效果，神经架构搜索（NeuralArchitectureSearch,NAS）作为一种自动化的方法，能够通过算法寻找和优化最佳的神经网络架构。NAS可以在图像识别
Element修改表格结构样式集合（后续实时更新）白嫖叫上我 element-ui vue.js elementui 前端
场景修改前端Element组件el-table样式实现线表格-->-->执行-->轨迹轨迹-->.guiji-pop{height:100%;width:100%;.tablepro{width:100%;height:calc(100%-0.82rem);margin-top:0.16rem;::v-deep.el-table__body-wrapper{height:calc(100%-0.4
从零开始：使用FunC编写TON智能合约之计数器篇 web3func区块链
在区块链技术的广泛应用中，智能合约无疑是最具前景的领域之一。智能合约允许我们在去中心化的环境中执行可信的交易和协议。TON（TheOpenNetwork）作为新兴的区块链平台，以其高效、可扩展的特性吸引了众多开发者的关注。本文将带你入门TON智能合约的编写，通过实现一个简单的计数器合约，让你掌握使用FunC语言编写智能合约的基本技巧。了解TON与FunC在开始编写智能合约之前，我们需要对TON和F
SGLang安装教程，部署你的大模型，性能比vllm好，实现张量并行，数据并行，加快推理速度，亲测效果好。张登杰踩人工智能结对编程 python
目前大模型部署工具主要是vllm，最近出现了SGLang，很多新开源大模型都支持SGLang的部署推理，例如deepseek-R1，Qwen2.5，Mistral，GLM-4，MiniCPM3，InternLM2，Llama3.2等。代码：GitHub-sgl-project/sglang:SGLangisafastservingframeworkforlargelanguagemodelsand
deepin 下如何实现一个文件即可读写又可只读 deepin
在Linux系统的运维过程中，我们常常会遇到需要对文件或目录进行灵活权限管理的场景。例如，某个应用的存储目录空间不足，或者需要为开发人员提供只读访问权限，同时又不影响原有配置文件的写入权限。本文将介绍如何通过mount--bind和相关选项来实现这些需求。问题背景在实际工作中，我们可能会遇到以下场景：应用程序的存储目录空间不足，但无法直接扩容。需要为开发人员提供配置文件的只读权限，同时保留原有文件
统一思想认识永夜-极光思想
1.统一思想认识的基础,才能有的放矢原因: 总有一种描述事物的方式最贴近本质,最容易让人理解. 如何让教育更轻松,在于找到最适合学生的方式. 难点在于,如何模拟对方的思维基础选择合适的方式. &
Joda Time使用笔记 bylijinnan java joda time
Joda Time的介绍可以参考这篇文章： http://www.ibm.com/developerworks/cn/java/j-jodatime.html 工作中也常常用到Joda Time，为了避免每次使用都查API，记录一下常用的用法： /** * DateTime变化（增减） */ @Tes
FileUtils API eksliang FileUtils FileUtils API
转载请出自出处：http://eksliang.iteye.com/blog/2217374 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
各种新兴技术不懂事的小屁孩技术
1:gradle Gradle 是以 Groovy 语言为基础，面向Java应用为主。基于DSL（领域特定语言）语法的自动化构建工具。现在构建系统常用到maven工具，现在有更容易上手的gradle，搭建java环境: http://www.ibm.com/developerworks/cn/opensource/os-cn-gradle/ 搭建android环境： http://m
tomcat6的https双向认证酷的飞上天空 tomcat6
1.生成服务器端证书 keytool -genkey -keyalg RSA -dname "cn=localhost,ou=sango,o=none,l=china,st=beijing,c=cn" -alias server -keypass password -keystore server.jks -storepass password -validity 36
托管虚拟桌面市场势不可挡蓝儿唯美
用户还需要冗余的数据中心，dinCloud的高级副总裁兼首席营销官Ali Din指出。该公司转售一个MSP可以让用户登录并管理和提供服务的用于DaaS的云自动化控制台，提供服务或者MSP也可以自己来控制。在某些情况下，MSP会在dinCloud的云服务上进行服务分层，如监控和补丁管理。 MSP的利润空间将根据其参与的程度而有所不同，Din说。 “我们有一些合作伙伴负责将我们推荐给客户作为个
spring学习——xml文件的配置 a-john spring
在Spring的学习中，对于其xml文件的配置是必不可少的。在Spring的多种装配Bean的方式中，采用XML配置也是最常见的。以下是一个简单的XML配置文件： <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.or
HDU 4342 History repeat itself 模拟 aijuans 模拟
来源：http://acm.hdu.edu.cn/showproblem.php?pid=4342 题意：首先让求第几个非平方数，然后求从1到该数之间的每个sqrt(i)的下取整的和。思路：一个简单的模拟题目，但是由于数据范围大，需要用__int64。我们可以首先把平方数筛选出来，假如让求第n个非平方数的话，看n前面有多少个平方数，假设有x个，则第n个非平方数就是n+x。注意两种特殊情况，即
java中最常用jar包的用途 asia007 java
java中最常用jar包的用途 jar包用途axis.jarSOAP引擎包commons-discovery-0.2.jar用来发现、查找和实现可插入式接口，提供一些一般类实例化、单件的生命周期管理的常用方法.jaxrpc.jarAxis运行所需要的组件包saaj.jar创建到端点的点到点连接的方法、创建并处理SOAP消息和附件的方法，以及接收和处理SOAP错误的方法. w
ajax获取Struts框架中的json编码异常和Struts中的主控制器异常的解决办法百合不是茶 js json编码返回异常
一:ajax获取自定义Struts框架中的json编码出现以下问题: 1,强制flush输出 json编码打印在首页 2, 不强制flush js会解析json 打印出来的是错误的jsp页面却没有跳转到错误页面 3, ajax中的dataType的json 改为text 会
JUnit使用的设计模式 bijian1013 java 设计模式 JUnit
JUnit源代码涉及使用了大量设计模式 1、模板方法模式（Template Method）定义一个操作中的算法骨架，而将一些步骤延伸到子类中去，使得子类可以不改变一个算法的结构，即可重新定义该算法的某些特定步骤。这里需要复用的是算法的结构，也就是步骤，而步骤的实现可以在子类中完成。
Linux常用命令（摘录） sunjing crond chkconfig
chkconfig --list 查看linux所有服务 chkconfig --add servicename 添加linux服务 netstat -apn | grep 8080 查看端口占用 env 查看所有环境变量 echo $JAVA_HOME 查看JAVA_HOME环境变量安装编译器 yum install -y gcc
【Hadoop一】Hadoop伪集群环境搭建 bit1129 hadoop
结合网上多份文档，不断反复的修正hadoop启动和运行过程中出现的问题，终于把Hadoop2.5.2伪分布式安装起来，跑通了wordcount例子。Hadoop的安装复杂性的体现之一是，Hadoop的安装文档非常多，但是能一个文档走下来的少之又少，尤其是Hadoop不同版本的配置差异非常的大。Hadoop2.5.2于前两天发布，但是它的配置跟2.5.0，2.5.1没有分别。 &nb
Anychart图表系列五之事件监听白糖_ chart
创建图表事件监听非常简单：首先是通过addEventListener('监听类型',js监听方法)添加事件监听，然后在js监听方法中定义具体监听逻辑。以钻取操作为例，当用户点击图表某一个point的时候弹出point的name和value，代码如下： <script> //创建AnyChart var chart = new AnyChart(); //添加钻取操作&quo
Web前端相关段子 braveCS web前端
Web标准：结构、样式和行为分离使用语义化标签 0）标签的语义：使用有良好语义的标签，能够很好地实现自我解释，方便搜索引擎理解网页结构，抓取重要内容。去样式后也会根据浏览器的默认样式很好的组织网页内容，具有很好的可读性，从而实现对特殊终端的兼容。 1）div和span是没有语义的：只是分别用作块级元素和行内元素的区域分隔符。当页面内标签无法满足设计需求时，才会适当添加div
编程之美-24点游戏 bylijinnan 编程之美
import java.util.ArrayList; import java.util.Arrays; import java.util.HashSet; import java.util.List; import java.util.Random; import java.util.Set; public class PointGame { /**编程之美
主页面子页面传值总结 chengxuyuancsdn 总结
1、showModalDialog returnValue是javascript中html的window对象的属性,目的是返回窗口值,当用window.showModalDialog函数打开一个IE的模式窗口时,用于返回窗口的值主界面 var sonValue=window.showModalDialog("son.jsp"); 子界面 window.retu
[网络与经济]互联网+的含义 comsci 互联网+
互联网+后面是一个人的名字 = 网络控制系统互联网+你的名字 = 网络个人数据库每日提示:如果人觉得不舒服,千万不要外出到处走动,就呆在床上,玩玩手游,更不能够去开车,现在交通状况不
oracle 创建视图 with check option daizj 视图 view oralce
我们来看下面的例子： create or replace view testview as select empno,ename from emp where ename like ‘M%’ with check option; 这里我们创建了一个视图，并使用了with check option来限制了视图。然后我们来看一下视图包含的结果： select * from testv
ToastPlugin插件在cordova3.3下使用 dibov Cordova
自己开发的Todos应用，想实现“ 再按一次返回键退出程序 ”的功能，采用网上的ToastPlugins插件，发现代码或文章基本都是老版本，运行问题比较多。折腾了好久才弄好。下面吧基于cordova3.3下的ToastPlugins相关代码共享。 ToastPlugin.java package&nbs
C语言22个系统函数 dcj3sjt126com c function
C语言系统函数一、数学函数下列函数存放在math.h头文件中Double floor(double num) 求出不大于num的最大数。Double fmod(x, y) 求整数x/y的余数。Double frexp(num, exp); double num; int *exp; 将num分为数字部分（尾数）x和以2位的指数部分n，即num=x*2n，指数n存放在exp指向的变量中，返回x。D
开发一个类的流程 dcj3sjt126com 开发
本人近日根据自己的开发经验总结了一个类的开发流程。这个流程适用于单独开发的构件，并不适用于对一个项目中的系统对象开发。开发出的类可以存入私人类库，供以后复用。以下是开发流程： 1. 明确类的功能，抽象出类的大概结构 2. 初步设想类的接口 3. 类名设计（驼峰式命名） 4. 属性设置(权限设置) 判断某些变量是否有必要作为成员属
java 并发 shuizhaosi888 java 并发
能够写出高伸缩性的并发是一门艺术在JAVA SE5中新增了3个包 java.util.concurrent java.util.concurrent.atomic java.util.concurrent.locks 在java的内存模型中，类的实例字段、静态字段和构成数组的对象元素都会被多个线程所共享，局部变量与方法参数都是线程私有的，不会被共享。
Spring Security（11）——匿名认证 234390216 Spring Security ROLE_ANNOYMOUS 匿名
匿名认证目录 1.1 配置 1.2 AuthenticationTrustResolver 对于匿名访问的用户，Spring Security支持为其建立一个匿名的AnonymousAuthenticat
NODEJS项目实践0.2[ express,ajax通信...] 逐行分析JS源代码 Ajax nodejs express
一、前言通过上节学习，我们已经 ubuntu系统搭建了一个可以访问的nodejs系统，并做了nginx转发。本节原要做web端服务及 mongodb的存取，但写着写着，web端就
在Struts2 的Action中怎样获取表单提交上来的多个checkbox的值 lhbthanks java html struts checkbox
第一种方法：获取结果String类型在 Action 中获得的是一个 String 型数据，每一个被选中的 checkbox 的 value 被拼接在一起，每个值之间以逗号隔开(,)。所以在 Action 中定义一个跟 checkbox 的 name 同名的属性来接收这些被选中的 checkbox 的 value 即可。以下是实现的代码：前台 HTML 代码：
003.Kafka基本概念 nweiren hadoop kafka
Kafka基本概念：Topic、Partition、Message、Producer、Broker、Consumer。 Topic：消息源（Message）的分类。 Partition： Topic物理上的分组，一
Linux环境下安装JDK roadrunners jdk linux
1、准备工作创建JDK的安装目录： mkdir -p /usr/java/ 下载JDK，找到适合自己系统的JDK版本进行下载： http://www.oracle.com/technetwork/java/javase/downloads/index.html 把JDK安装包下载到/usr/java/目录，然后进行解压： tar -zxvf jre-7
Linux忘记root密码的解决思路 tomcat_oracle linux
1：使用同版本的linux启动系统，chroot到忘记密码的根分区passwd改密码　　2：grub启动菜单中加入init=/bin/bash进入系统，不过这时挂载的是只读分区。根据系统的分区情况进一步判断. 　　3: grub启动菜单中加入 single以单用户进入系统. 　　4:用以上方法mount到根分区把/etc/passwd中的root密码去除　　例如: 　　ro
跨浏览器 HTML5 postMessage 方法以及 message 事件模拟实现 xueyou jsonp jquery 框架 UI html5
postMessage 是 HTML5 新方法，它可以实现跨域窗口之间通讯。到目前为止，只有 IE8+, Firefox 3, Opera 9, Chrome 3和 Safari 4 支持，而本篇文章主要讲述 postMessage 方法与 message 事件跨浏览器实现。postMessage 方法 JSONP 技术不一样，前者是前端擅长跨域文档数据即时通讯，后者擅长针对跨域服务端数据通讯，p

DeepLearnToolbox_NN notes

DeepLearnToolbox usage：matlab->set path->add with subfloders

DeepLearnToolbox_NN (collated According to the function called order)

Contents

ex1 vanilla（香草） neural net

ex2 neural net with L2 weight decay

ex3 neural net with dropout

ex4 neural net with sigmoid activation function

ex5 plotting functionality

ex6 neural net with sigmoid activation and plotting of validation and training error

你可能感兴趣的:(NetWork,deep,learning,Neural)