CaiziLee

BP神经网络的实现详解

本文主要详解BP神经网络编程实现，旨在一步一步解析BP神经网络细节，希望能形象明了的阐述BP神经网络，实现原理源自于斯坦福UFLDL教程，原理公式推导不再赘述，但会有些说明，本文程序由C++11实现，矩阵计算基于Eigen3(不熟悉的可以去网上搜索Eigen的使用方法，本文不做叙述)，那么我们开始吧！
为了给算法列一个提纲，首先截一个UFLDL教程上关于BP算法的步骤，做个引导：

下面是神经网络一次批量迭代的过程：

为了形象的表明这里的参数含义，请看下图列举了一个[4, 4, 1]的神经网络结构(字和图很矬，请见谅，另外图中只绘制了单个样本下的情况，届时代码里会体现向量化的方式，神经网络的输入就是很多样本列向量组成的矩阵，而不是这里的单列向量了)：

那么为了实现这个[4, 4, 1]的神经网络，我们需要在代码里定义来描述这个结构，下面是神经网络类的定义：

class NeuralNetwork
{
public:
    NeuralNetwork(std::vector<int> _architecture
                    , const Eigen::MatrixXd _train_dataX
                    , const Eigen::MatrixXd _train_LabelY
                    , double _learning_rate = 0.5
                    , int _mini_batch_size = 30
                    , int _iteration_size = 1000
                    , double _lambda = 0.0);
    // 执行训练操作 
    void train();
    // 求解单个样本输出
    Eigen::MatrixXd predict(const Eigen::MatrixXd &_input);
    // 评估模型, 默认label为one_hot编码
    double evaluate(const Eigen::MatrixXd &_test_dataX, const Eigen::MatrixXd &_test_dataY, bool one_hot = true);
private:
    // _z为上层输出线性组合值:[z1, z2, z3, ...], 例如z1为一个样本的计算值
    Eigen::MatrixXd sigmoid(const Eigen::MatrixXd &_z);
    // 激励函数梯度计算,_a为激励函数输出值
    Eigen::MatrixXd sigmoid_grad(const Eigen::MatrixXd &_a);
    // 损失函数实现
    double loss(const Eigen::MatrixXd &pre_y, const Eigen::MatrixXd &ori_y, int m);
    // 前向传播, _x为样本矩阵[x1, x2, x3,...], 例如x1为一个样本
    Eigen::MatrixXd feedforword(const Eigen::MatrixXd &_x);
    // 反向传播, _x为训练样本，_y为样本与输出
    void backforward(const Eigen::MatrixXd &_x, const Eigen::MatrixXd &_y);
    // 得到列向量的最大值行号
    int argmax(const Eigen::MatrixXd &_y);
    // 返回将列向量_bias复制_m列的矩阵
    Eigen::MatrixXd replicate(const Eigen::MatrixXd &_bias, int _m);

private:
    std::vector<int> architecture;                  // 神经网络的结构（4， 4, 1） 表示有一个input layer(4个神经元, 和输入数据的维度一致), 
                                                    //一个hidden layer(4个神经元), 一个output layer(1个神经元)

    const Eigen::MatrixXd train_dataX;                  // 训练数据(n, m) 表示有m个训练样本， 每个样本是n维向量
    const Eigen::MatrixXd train_dataY;                  // 训练数据label
    std::vector train_weights;     // 训练权重
    std::vector train_weights_grad;// 权重梯度
    std::vector train_bias;        // 训练偏置
    std::vector train_bias_grad;   // 偏置梯度
    std::vector feedforword_a;     // 前向传播得到的激活值的中间输出
    std::vector error_term;        // 残差
    std::vector predict_a;         // 预测中间值, 用于单个样本的预测输出

    double learning_rate;                           // 反向传播学习率
    double lambda;                                  // 过拟合参数
    int mini_batch_size;                            // 批量梯度下降的一个批次数量
    int iteration_size;                             // 迭代次数
};

这里将神经网络的每一层都看成是一个矩阵或者说向量，所有的层都放在一个动态数组里，代码中的mini_batch_size就是一次批量处理的样本量，下面就要初始化这个神经网络：

NeuralNetwork::NeuralNetwork(std::vector<int> _architecture
                    , const Eigen::MatrixXd _train_dataX
                    , const Eigen::MatrixXd _train_LabelY
                    , double _learning_rate
                    , int _mini_batch_size
                    , int _iteration_size
                    , double _lambda)
                    :architecture(_architecture)
                    ,train_dataX(_train_dataX)
                    ,train_dataY(_train_LabelY)
                    ,learning_rate(_learning_rate)
                    ,mini_batch_size(_mini_batch_size)
                    ,iteration_size(_iteration_size)
                    ,lambda(_lambda)
{
    // 构建神经网络
    for (int i = 1; i < architecture.size(); ++i)
    {
        // 权重初始化较小随机值
        Eigen::MatrixXd w(architecture[i], architecture[i - 1]);
        w.setRandom();
        train_weights.push_back(w);
        // 初始化梯度
        Eigen::MatrixXd wd(architecture[i], architecture[i - 1]);
        wd.setZero();
        train_weights_grad.push_back(wd);
        // 偏置初始化为随机值
        Eigen::MatrixXd b(architecture[i], 1);
        b.setRandom();
        train_bias.push_back(b);
        // 初始化偏置梯度
        Eigen::MatrixXd bd(architecture[i], mini_batch_size);
        bd.setZero();
        train_bias_grad.push_back(bd);
        // 初始化激活值
        Eigen::MatrixXd a(architecture[i], mini_batch_size);
        a.setZero();
        feedforword_a.push_back(a);
        // 初始化残差
        Eigen::MatrixXd e(architecture[i], mini_batch_size);
        e.setZero();
        error_term.push_back(e);
        // 初始化预测中间值
        Eigen::MatrixXd pa(architecture[i], 1);
        pa.setZero();
        predict_a.push_back(pa);
    }// for
}// end

初始化过后，下面就要根据文章开头的反向传播算法的步骤，编写代码，上述的第一步是前馈传导，得到第2层到最后一层的激活值，得到的激活值存入feedforword_a数组中，代码如下：

// 前向传播, _x为样本矩阵[x1, x2, x3,...], 例如x1为一个样本
Eigen::MatrixXd NeuralNetwork::feedforword(const Eigen::MatrixXd &_x)
{
    for (int i = 0; i < feedforword_a.size(); ++i)
    {
        if (i == 0) // 输入值为样本
        {
            feedforword_a.at(i) = sigmoid(train_weights.at(i) * _x + replicate(train_bias.at(i), mini_batch_size));//偏置列数要与样本列数一致
        }// if
        else
        {
            feedforword_a.at(i) = sigmoid(train_weights.at(i) *
                feedforword_a.at(i - 1) + replicate(train_bias.at(i), mini_batch_size));
        }// else
    }// for
    return feedforword_a.at(feedforword_a.size() - 1);
}// end

// _z为上层输出线性组合值:[z1, z2, z3, ...], 例如z1为一个样本的计算值，_z.array()指的是逐元素操作
Eigen::MatrixXd NeuralNetwork::sigmoid(const Eigen::MatrixXd &_z)
{
    return 1.0 / (1.0 + (-_z.array()).exp());
}// end

// 返回将列向量_bias复制_m列的矩阵
Eigen::MatrixXd NeuralNetwork::replicate(const Eigen::MatrixXd &_bias, int _m)
{
    Eigen::MatrixXd ret_bias(_bias.rows(), _m);
    for (int i = 0; i < _m; ++i)
    {
        ret_bias.col(i) = _bias;
    }
    return ret_bias;
}

当前馈传导计算结束后，就要反向计算残差，进而计算梯度，代码如下：

// 反向传播, _x为训练样本，_y为样本与输出
void NeuralNetwork::backforward(const Eigen::MatrixXd &_x, const Eigen::MatrixXd &_y)
{
    // 1, 计算第2层到最后一层的激活值
    feedforword(_x);
    // 从后向前，一层层的计算
    for (int i = error_term.size() - 1; i >= 0; --i)
    {
        // 2, 反向计算残差
        if (i == error_term.size() - 1) // 输出层
        {
            error_term.at(i) = -(_y.array() - feedforword_a.at(i).array())
                * sigmoid_grad(feedforword_a.at(i)).array();
        }// if
        else
        {
            error_term.at(i) = (train_weights.at(i + 1).transpose()
                * error_term.at(i + 1)).array() *  sigmoid_grad(feedforword_a.at(i)).array();
        }// else

        // 3, 梯度计算,计算结果有mini_batch_size列，而后会在一次批量计算结束后进行累加
        train_bias_grad.at(i) = error_term.at(i);
        if (i > 0)
            train_weights_grad.at(i) = error_term.at(i) * feedforword_a.at(i - 1).transpose();
        else
            train_weights_grad.at(i) = error_term.at(i) * _x.transpose();
    }// for
}// end

// 激励函数梯度计算,_a为激励函数输出值
Eigen::MatrixXd NeuralNetwork::sigmoid_grad(const Eigen::MatrixXd &_a)
{
    return _a.array() * (1.0 - _a.array());
}// end

得到了梯度值后，下面就是传说中的训练了，看代码及注释：

// 执行训练操作
void NeuralNetwork::train()
{
    std::cout << "training..." << std::endl;
    for (int i = 0; i < train_weights.size(); ++i)
    {
        std::cout << "train_weights: " << train_weights.at(i) << std::endl;
        std::cout << "train_bias: " << train_bias.at(i) << std::endl;
    }// for
    // 批量梯度下降迭代
    for (int i = 0; i < iteration_size; ++i)
    {
        for (int k = 0; k < train_dataX.cols() - mini_batch_size; k += mini_batch_size)
        {
            // 获取一个mini_batch_size的样本集合
            Eigen::MatrixXd mini_train_x = train_dataX.middleCols(k, mini_batch_size);
            Eigen::MatrixXd mini_train_y = train_dataY.middleCols(k, mini_batch_size);

            // 计算梯度
            backforward(mini_train_x, mini_train_y);

            // 更新权重
            for (int j = 0; j < train_weights.size(); ++j)
            {
                // 权重的批量累计值实际上在反向传播过程中已经通过矩阵相乘得到了
                train_weights.at(j) = train_weights.at(j) -
                    learning_rate * (train_weights_grad.at(j) / mini_batch_size + lambda * train_weights.at(j));

                Eigen::MatrixXd tempBias(mini_batch_size, 1);// 这里的矩阵是为了求偏置累计和
                tempBias.setOnes();
                train_bias.at(j) = train_bias.at(j) -
                    learning_rate * (train_bias_grad.at(j) * tempBias / mini_batch_size);
            }// for
            std::cout << "iter " << i << "-->loss : " << loss(feedforword_a.at(feedforword_a.size() - 1), mini_train_y, mini_batch_size) << std::endl;
        }// for
    }// for
    for (int i = 0; i < train_weights.size(); ++i)
    {
        std::cout << "train_weights: " << train_weights.at(i) << std::endl;
        std::cout << "train_bias: " << train_bias.at(i) << std::endl;
    }// for
    std::cout << "trained..." << std::endl;
}// end

至此，神经网络的训练过程已经实现了，前面的类头文件中还有几个函数的实现，就贴上来了，代码中都有解释，没什么要说的，损失函数就照着UFLDL的公式写的：

// 损失函数实现，对着公式应该就能看懂
double NeuralNetwork::loss(const Eigen::MatrixXd &pre_y, const Eigen::MatrixXd &ori_y, int m)
{
    // 误差项
    double left_term = 0.0;
    for (int i = 0; i < m; ++i)
    {
        Eigen::MatrixXd temp_m = (pre_y.col(i) - ori_y.col(i)).transpose() * (pre_y.col(i) - ori_y.col(i)) / 2.0;
        left_term = temp_m(0, 0);
    }
    left_term /= m;
    // 正则化项
    double norm_term = 0.0;
    for (int i = 0; i < train_weights.size(); ++i)
    {
        Eigen::MatrixXd temp_m = train_weights.at(i);
        for (int j = 0; j < temp_m.cols(); ++j)
        {
            for (int k = 0; k < temp_m.rows(); ++k)
            {
                norm_term += temp_m(k, j) * temp_m(k, j);
            }// for
        }// for
    }// for
    norm_term *= (lambda / 2);
    return left_term + norm_term;
}// end

// 评估模型, 默认label为one_hot编码
double NeuralNetwork::evaluate(const Eigen::MatrixXd &_test_dataX, const Eigen::MatrixXd &_test_dataY, bool one_hot)
{
    int cnt = 0;
    for (int i = 0; i < _test_dataX.cols(); ++i)
    {
        // 获取一个测试样本
        Eigen::MatrixXd x = _test_dataX.col(i);
        // 送入神经网络
        Eigen::MatrixXd y_pre = predict(x);
        if (one_hot)
        {
            if (argmax(y_pre) == argmax(_test_dataY.col(i)))
            {
                ++cnt;
            }// if
        }// if
        else
        {
            if ((y_pre(0, 0) - _test_dataY(0, i)) < 0.1)
            {
                ++cnt;
            }// if
        }// if
    }// for
    return cnt * 1.0 / _test_dataX.cols();
}// end

// 得到列向量的最大值行号
int NeuralNetwork::argmax(const Eigen::MatrixXd &_y)
{
    double _max = _y(0, 0);
    int ret = 0;
    for (int i = 1; i < _y.rows(); ++i)
    {
        if (_y(i, 0) > _max)
        {
            _max = _y(i, 0);
            ret = i;
        }
    }
    return ret;
}

// 求解单个样本输出
Eigen::MatrixXd NeuralNetwork::predict(const Eigen::MatrixXd &_input)
{
    for (int i = 0; i < predict_a.size(); ++i)
    {
        if (i == 0)
        {
            predict_a.at(i) = sigmoid(train_weights.at(i) * _input + train_bias.at(i));
        }// if
        else
        {
            predict_a.at(i) = sigmoid(train_weights.at(i) * predict_a.at(i - 1) + train_bias.at(i));
        }// else
    }// for
    return predict_a.at(predict_a.size() - 1);
}// end

神经网络的过程实现完成后，我们还要准备数据，由于我的机器太挫，就没用Mnist数据进行训练，不过另一篇博客会给出Mnist数据获取方式（参照别人的，只是做了封装，归一化，ont_hot编码操作），下面的数据是随机生成的（这里的代码也并非原创，只是做了自己的封装，更好的用于我的代码里），数据为[1 0 0 0]->[1]，[0 1 0 0]->[2]， [0 0 1 0]->[3]，[0 0 0 1]->[4]，然后对训练样本进行随机化，比如[0.990, 0.002, 0.003, 0.00013]->[1]：

class CustomData
{
public:
    CustomData(int numberOfTrainData, int numberOfTestData);

    const Eigen::MatrixXd getTrainData() const;

    const Eigen::MatrixXd getTrainLabel() const;

    const Eigen::MatrixXd getTestData() const;

    const Eigen::MatrixXd getTestLabel() const;

private:
    void generatorData(int numberOfTrainData, int numberOfTestData);

private:
    Eigen::MatrixXd mtrain_x, mtrain_y, mtest_x, mtest_y;
};

CustomData::CustomData(int numberOfTrainData, int numberOfTestData)
{
    generatorData(numberOfTrainData, numberOfTestData);
}

const Eigen::MatrixXd CustomData::getTrainData() const
{
    return mtrain_x;
}

const Eigen::MatrixXd CustomData::getTrainLabel() const
{
    return mtrain_y;
}

const Eigen::MatrixXd CustomData::getTestData() const
{
    return mtest_x;
}

const Eigen::MatrixXd CustomData::getTestLabel() const
{
    return mtest_y;
}

void CustomData::generatorData(int numberOfTrainData, int numberOfTestData)
{
    mtrain_x.resize(4, numberOfTrainData);
    mtrain_x.setZero();
    mtrain_y.resize(1, numberOfTrainData);
    mtest_x.resize(4, numberOfTestData);
    mtest_x.setZero();
    mtest_y.resize(1, numberOfTestData);
    for (int i = 0; i < numberOfTrainData; ++i)
    {
        int index = i % 4;
        mtrain_x(index, i) = 1;
        for (size_t j = 0; j != mtrain_x.rows(); ++j)
        {
            mtrain_x(j, i) += (5e-3*rand() / RAND_MAX - 2.5e-3);
        }
        mtrain_y(0, i) = (index + 1) * 1.0 / 4;
    }
    for (int i = 0; i < numberOfTestData; ++i)
    {
        int index = i % 4;
        mtest_x(index, i) = 1;
        for (int j = 0; j < mtest_x.rows(); ++j)
        {
            mtest_x(j, i) += (5e-3*rand() / RAND_MAX - 2.5e-3);
        }
        mtest_y(0, i) = (index + 1) * 1.0 / 4;
    }
}

下面就是测试代码了：

int main(int argc, char **argv) {
    CustomData data(10000, 3000);
    vector<int> architecture = {4, 4, 1};
    NeuralNetwork network(architecture, data.getTrainData(), data.getTrainLabel());
    network.train();
    Eigen::MatrixXd input1(4, 1);
    input1 << 0.990, 0.002, 0.003, 0.00013;
    std::cout << "predict:" << network.predict(input1) << std::endl;
    Eigen::MatrixXd input2(4, 1);
    input2 << 0.0103, 0.987, 0.0006, 0.00014;
    std::cout << "predict:" << network.predict(input2) << std::endl;
    Eigen::MatrixXd input3(4, 1);
    input3 << 0.0201, 0.002, 0.9579, 0.00015;
    std::cout << "predict:" << network.predict(input3) << std::endl;
    Eigen::MatrixXd input4(4, 1);
    input4 << 0.004, 0.001, 0.005, 0.9399;
    std::cout << "predict:" << network.predict(input4) << std::endl;

    return 0;
}

以下是代码运行结果，这4个输出，如果损失为0的情况下，应该是0.25,0.5,0.75,1，而训练出的结果与实际输出基本一致。

到这里BP神经网络的实现就结束了，如果想跑这个代码，那么编译器应该设置为c++11，并且有Eigen矩阵的支持，另外头文件并没有展示。
这是我的第一篇关于神经网络的博客，要学的东西很多，前路艰难，应时常自省，若有不对的地方，也请看到这篇文章的人予以斧正，谢谢！

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
简单了解 JVM 记得开心一点啊 jvm
目录♫什么是JVM♫JVM的运行流程♫JVM运行时数据区♪虚拟机栈♪本地方法栈♪堆♪程序计数器♪方法区/元数据区♫类加载的过程♫双亲委派模型♫垃圾回收机制♫什么是JVMJVM是JavaVirtualMachine的简称，意为Java虚拟机。虚拟机是指通过软件模拟的具有完整硬件功能的、运行在一个完全隔离的环境中的完整计算机系统（如：JVM、VMwave、VirtualBox）。JVM和其他两个虚拟机
JVM、JRE和 JDK：理解Java开发的三大核心组件 Y雨何时停T Java java
Java是一门跨平台的编程语言，它的成功离不开背后强大的运行环境与开发工具的支持。在Java的生态中，JVM（Java虚拟机）、JRE（Java运行时环境）和JDK（Java开发工具包）是三个至关重要的核心组件。本文将探讨JVM、JDK和JRE的区别，帮助你更好地理解Java的运行机制。1.JVM：Java虚拟机（JavaVirtualMachine）什么是JVM？JVM，即Java虚拟机，是Ja
ai绘画工具midjourney怎么下载？附作品管理教程设计师早上好
Midjourney是一款功能强大的AI绘画工具，它使用机器学习技术和深度神经网络等算法，可以生成各种艺术风格的绘画作品。在创意设计、广告宣传等方面有着广泛的应用前景。那么，ai绘画工具midjourney怎么下载？本文将为您介绍Midjourney的下载以及作品的相关管理。一、Midjourney下载Midjourney的下载非常简单，只需打开Midjourney官网（点击“GetMidjour
深度 Qlearning：在直播推荐系统中的应用 AGI通用人工智能之禅程序员提升自我硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
深度Q-learning：在直播推荐系统中的应用关键词：深度Q-learning,强化学习,直播推荐系统,个性化推荐1.背景介绍1.1问题的由来随着互联网技术的飞速发展,直播平台如雨后春笋般涌现。面对海量的直播内容,用户很难快速找到自己感兴趣的内容。因此,个性化推荐系统在直播平台中扮演着越来越重要的角色。1.2研究现状目前,主流的个性化推荐算法包括协同过滤、基于内容的推荐等。这些方法在一定程度上缓
吴恩达深度学习笔记(30)-正则化的解释极客Array
正则化（Regularization）深度学习可能存在过拟合问题——高方差，有两个解决方法，一个是正则化，另一个是准备更多的数据，这是非常可靠的方法，但你可能无法时时刻刻准备足够多的训练数据或者获取更多数据的成本很高，但正则化通常有助于避免过拟合或减少你的网络误差。如果你怀疑神经网络过度拟合了数据，即存在高方差问题，那么最先想到的方法可能是正则化，另一个解决高方差的方法就是准备更多数据，这也是非常
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
计算机视觉中，Pooling的作用 Wils0nEdwards 计算机视觉人工智能
在计算机视觉中，Pooling（池化）是一种常见的操作，主要用于卷积神经网络（CNN）中。它通过对特征图进行下采样，减少数据的空间维度，同时保留重要的特征信息。Pooling的作用可以归纳为以下几个方面：1.降低计算复杂度与内存需求Pooling操作通过对特征图进行下采样，减少了特征图的空间分辨率（例如，高度和宽度）。这意味着网络需要处理的数据量会减少，从而降低了计算量和内存需求。这对大型神经网络
神经网络-损失函数红米煮粥神经网络人工智能深度学习
文章目录一、回归问题的损失函数1.均方误差（MeanSquaredError,MSE）2.平均绝对误差（MeanAbsoluteError,MAE）二、分类问题的损失函数1.0-1损失函数（Zero-OneLossFunction）2.交叉熵损失（Cross-EntropyLoss）3.合页损失（HingeLoss）三、总结在神经网络中，损失函数（LossFunction）扮演着至关重要的角色，它
管理员权限的软件不能开机自启动的解决方法 ss_ctrl
这是几种解决方法：1.将启动参数写入到32位注册表里面去在64位系统下我们64位的程序访问此HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Windows\CurrentVersion\Run注册表路径，是可以正确访问的，32位程序访问此注册表路径时，默认会被系统自动映射到HKEY_LOCAL_MACHINE\SOFTWARE\WOW6432Node\Microsoft
BP神经网络的传递函数大胜归来19 MATLAB
BP网络一般都是用三层的，四层及以上的都比较少用；传输函数的选择，这个怎么说，假设你想预测的结果是几个固定值，如1,0等，满足某个条件输出1，不满足则0的话，首先想到的是hardlim函数，阈值型的，当然也可以考虑其他的；然后，假如网络是用来表达某种线性关系时，用purelin---线性传输函数；若是非线性关系的话，用别的非线性传递函数，多层网络时，每层不一定要用相同的传递函数，可以是三种配合，可
神经网络传递函数sigmoid,神经网络传递函数作用快乐的小荣荣神经网络机器学习深度学习人工智能
神经网络传递函数选取不同会有特别大差别嘛？只是最后一层，但前面层是非线性，那么可能存在区别不大的情况。线性函数f(a*input)=af(input),一般来说，input为向量，最简化情况下，可以假设input的各个维度，a1=a2=a3。。。意味着你线性层只是简单的对输入做了scale~而神经网络能起作用的原因，在于通过足够复杂的非线性函数，来模拟任何的分布。所以，神经网络必须要用非线性函数。
golang学习笔记--MPG模型 xxzed golang #学习笔记学习笔记 golang
MPG模式：M（Machine）：操作系统的主线程P（Processor）：协程执行需要的资源（上下文context），可以看作一个局部的调度器，使go代码在一个线程上跑，他是实现从N：1到N：M映射的关键G（Goroutine）：协程，有自己的栈。包含指令指针（instructionpointer）和其它信息（正在等待的channel等等），用于调度。一个P下面可以有多个G1、当前程序有三个M,
Python和R均方根误差平均绝对误差算法模型亚图跨际 Python 交叉知识 R 回归模型误差指标归一化均方根误差生态状态指标神经网络成本误差气体排放气候模型多项式拟合
要点回归模型误差评估指标归一化均方根误差生态状态指标神经网络成本误差计算气体排放气候算法模型Python误差指标均方根误差和平均绝对误差均方根偏差或均方根误差是两个密切相关且经常使用的度量值之一，用于衡量真实值或预测值与观测值或估计值之间的差异。估计器θ^\hat{\theta}θ^相对于估计参数θ\thetaθ的RMSD定义为均方误差的平方根：RMSD⁡(θ^)=MSE⁡(θ^)=E((θ^−θ
【开发环境搭建】Macbook M1搭建Java开发环境 weixin_44329069 java 开发语言
JDK安装与配置下载并安装JDK：ARM64DMG安装包下载链接：JDK21forMac(ARM64)。双击下载的DMG文件，按照提示安装JDK。配置环境变量：打开终端，使用vim编辑.bash_profile文件：vim~/.bash_profile在文件中添加以下内容来设置JAVA_HOME：exportJAVA_HOME=/Library/Java/JavaVirtualMachines/j
云服务业界动态简报-20180128 Captain7
一、青云青云QingCloud推出深度学习平台DeepLearningonQingCloud，包含了主流的深度学习框架及数据科学工具包，通过QingCloudAppCenter一键部署交付，可以让算法工程师和数据科学家快速构建深度学习开发环境，将更多的精力放在模型和算法调优。二、腾讯云1.腾讯云正式发布腾讯专有云TCE(TencentCloudEnterprise)矩阵，涵盖企业版、大数据版、AI
机器学习VS深度学习 nfgo 机器学习
机器学习（MachineLearning,ML）和深度学习（DeepLearning,DL）是人工智能（AI）的两个子领域，它们有许多相似之处，但在技术实现和应用范围上也有显著区别。下面从几个方面对两者进行区分：1.概念层面机器学习：是让计算机通过算法从数据中自动学习和改进的技术。它依赖于手动设计的特征和数学模型来进行学习，常用的模型有决策树、支持向量机、线性回归等。深度学习：是机器学习的一个子领
ResNet的半监督和半弱监督模型 Valar_Morghulis
Billion-scalesemi-supervisedlearningforimageclassificationhttps://arxiv.org/pdf/1905.00546.pdfhttps://github.com/facebookresearch/semi-supervised-ImageNet1K-models/权重在timm中也有：https://hub.fastgit.org/r
联邦学习 Federated learning Google I/O‘19 笔记努力搬砖的星期五笔记联邦学习机器学习机器学习 tensorflow
FederatedLearning:MachineLearningonDecentralizeddatahttps://www.youtube.com/watch?v=89BGjQYA0uE文章目录FederatedLearning:MachineLearningonDecentralizeddata1.DecentralizeddataEdgedevicesGboard:mobilekeyboa
PCL 怎样可视化深度图像 LeonDL168 PCL 计算机视觉人工智能视觉检测图像处理算法
本小节讲解如何可视化深度图像的两种方法，在3D视窗中以点云形式进行可视化（深度图像来源于点云），另一种是，将深度值映射为颜色，从而以彩色图像方式可视化深度图像。代码首先，在PCL（PointCloudLearning）中国协助发行的书提供光盘的第7章例2文件夹中，打开名为range_image_visualization.cpp的代码文件，同文件夹下可以找到相关的测试点云文件room_scan1.
【NLP5-RNN模型、LSTM模型和GRU模型】一蓑烟雨紫洛 nlp rnn lstm gru nlp
RNN模型、LSTM模型和GRU模型1、什么是RNN模型RNN（RecurrentNeuralNetwork)中文称为循环神经网络，它一般以序列数据为输入，通过网络内部的结构设计有效捕捉序列之间的关系特征，一般也是以序列形式进行输出RNN的循环机制使模型隐层上一时间步产生的结果，能够作为当下时间步输入的一部分（当下时间步的输入除了正常的输入外还包括上一步的隐层输出）对当下时间步的输出产生影响2、R
基于深度学习的农作物病害检测 SEU-WYL 深度学习dnn 深度学习人工智能
基于深度学习的农作物病害检测利用卷积神经网络（CNN）、生成对抗网络（GAN）、Transformer等深度学习技术，自动识别和分类农作物的病害，帮助农业工作者提高作物管理效率、减少损失。1.农作物病害检测的挑战病害种类繁多：农作物病害的类型多样，不同病害在同一作物上的表现差异很大，同时同一种病害在不同生长阶段的症状也可能不同。环境影响：天气、光照、湿度等外部环境因素会影响农作物的表现，使得病害检
深度学习--对抗生成网络（GAN, Generative Adversarial Network） Ambition_LAO 深度学习生成对抗网络
对抗生成网络（GAN,GenerativeAdversarialNetwork）是一种深度学习模型，由IanGoodfellow等人在2014年提出。GAN主要用于生成数据，通过两个神经网络相互对抗，来生成以假乱真的新数据。以下是对GAN的详细阐述，包括其概念、作用、核心要点、实现过程、代码实现和适用场景。1.概念GAN由两个神经网络组成：生成器（Generator）和判别器（Discrimina
chatgpt赋能python：如何在Python中安装Keras库？ turensu ChatGpt python chatgpt keras 计算机
如何在Python中安装Keras库？Keras是一个简单易用的神经网络库，由FrançoisChollet编写。它在Python编程语言中实现了深度学习的功能，可以使您更轻松地构建和试验不同类型的神经网络。如果您是一名Python开发人员，肯定会想知道如何在您的Python项目中安装Keras库。在本文中，我们将向您展示如何安装和配置Keras库。步骤1：安装Python要使用Keras库，您需
如何理解深度学习的训练过程奋斗的草莓熊深度学习人工智能 python scikit-learn virtualenv numpy pandas
文章目录1.训练是干什么？2.预训练模型进行训练，主要更改的是预训练模型的什么东西？1.训练是干什么？以yolov5为例子，训练的目的是把一组输入猫狗图像放到神经网络中，得到一个输出模型，这个模型下次可以直接用来识别哪个是猫，哪个是狗2.预训练模型进行训练，主要更改的是预训练模型的什么东西？超参数（Hyperparameters）：这是模型结构中定义的参数，比如：卷积核大小（kernel_size
Keras深度学习框架入门及实战指南司莹嫣Maude
Keras深度学习框架入门及实战指南keraskeras-team/keras:是一个基于Python的深度学习库，它没有使用数据库。适合用于深度学习任务的开发和实现，特别是对于需要使用Python深度学习库的场景。特点是深度学习库、Python、无数据库。项目地址:https://gitcode.com/gh_mirrors/ke/keras一、项目介绍Keras简介Keras是一款高级神经网络
每天五分钟玩转深度学习PyTorch：模型参数优化器torch.optim 幻风_huanfeng 深度学习框架pytorch 深度学习 pytorch 人工智能神经网络机器学习优化算法
本文重点在机器学习或者深度学习中，我们需要通过修改参数使得损失函数最小化(或最大化)，优化算法就是一种调整模型参数更新的策略。在pytorch中定义了优化器optim，我们可以使用它调用封装好的优化算法，然后传递给它神经网络模型参数，就可以对模型进行优化。本文是学习第6步(优化器)，参考链接pytorch的学习路线随机梯度下降算法在深度学习和机器学习中，梯度下降算法是最常用的参数更新方法，它的公式
如何有效的学习AI大模型？ Python程序员罗宾学习人工智能语言模型自然语言处理架构
学习AI大模型是一个系统性的过程，涉及到多个学科的知识。以下是一些建议，帮助你更有效地学习AI大模型：基础知识储备：数学基础：学习线性代数、概率论、统计学和微积分等，这些是理解机器学习算法的数学基础。编程技能：掌握至少一种编程语言，如Python，因为大多数AI模型都是用Python实现的。理论学习：机器学习基础：了解监督学习、非监督学习、强化学习等基本概念。深度学习：学习神经网络的基本结构，如卷
【3.6 python中的numpy编写一个“手写数字识”的神经网络】 wang151038606 深度学习入门 python numpy 神经网络
3.6python中的numpy编写一个“手写数字识”的神经网络要使用Python中的NumPy库从头开始编写一个“手写数字识别”的神经网络，我们通常会处理MNIST数据集，这是一个广泛使用的包含手写数字的图像数据集。但是，完全用NumPy来实现神经网络（包括数据的加载、预处理、模型定义、前向传播、损失计算、反向传播和权重更新）是一个相当复杂的任务，因为NumPy本身不提供自动微分或高级优化算法（
yolov5单目测距+速度测量+目标跟踪 cv_2025 YOLO 目标跟踪人工智能计算机视觉机器学习图像处理 opencv
要在YOLOv5中添加测距和测速功能，您需要了解以下两个部分的原理：单目测距算法单目测距是使用单个摄像头来估计场景中物体的距离。常见的单目测距算法包括基于视差的方法（如立体匹配）和基于深度学习的方法（如神经网络）。基于深度学习的方法通常使用卷积神经网络（CNN）来学习从图像到深度图的映射关系。单目测距代码单目测距涉及到坐标转换，代码如下：defconvert_2D_to_3D(point2D,R,
linux系统服务器下jsp传参数乱码 3213213333332132 java jsp linux windows xml
在一次解决乱码问题中，发现jsp在windows下用js原生的方法进行编码没有问题，但是到了linux下就有问题， escape,encodeURI,encodeURIComponent等都解决不了问题但是我想了下既然原生的方法不行，我用el标签的方式对中文参数进行加密解密总该可以吧。于是用了java的java.net.URLDecoder,结果还是乱码，最后在绝望之际，用了下面的方法解决了
Spring 注解区别以及应用 BlueSkator spring
1. @Autowired @Autowired是根据类型进行自动装配的。如果当Spring上下文中存在不止一个UserDao类型的bean，或者不存在UserDao类型的bean，会抛出 BeanCreationException异常，这时可以通过在该属性上再加一个@Qualifier注解来声明唯一的id解决问题。 2. @Qualifier 当spring中存在至少一个匹
printf和sprintf的应用 dcj3sjt126com PHP sprintf printf
<?php printf('b: %b c: %c d: %d <bf>f: %f', 80,80, 80, 80); echo ' '; printf('%0.2f %+d %0.2f ', 8, 8, 1235.456); printf('th
config.getInitParameter 171815164 parameter
web.xml <servlet> <servlet-name>servlet1</servlet-name> <jsp-file>/index.jsp</jsp-file> <init-param> <param-name>str</param-name>
Ant标签详解--基础操作 g21121 ant
Ant的一些核心概念： build.xml：构建文件是以XML 文件来描述的，默认构建文件名为build.xml。 project：每个构建文
[简单]代码片段_数据合并 53873039oycg 代码
合并规则:删除家长phone为空的记录,若一个家长对应多个孩子,保留一条家长记录,家长id修改为phone,对应关系也要修改。代码如下:
java 通信技术云端月影 Java 远程通信技术
在分布式服务框架中，一个最基础的问题就是远程服务是怎么通讯的，在Java领域中有很多可实现远程通讯的技术，例如：RMI、MINA、ESB、Burlap、Hessian、SOAP、EJB和JMS等，这些名词之间到底是些什么关系呢，它们背后到底是基于什么原理实现的呢，了解这些是实现分布式服务框架的基础知识，而如果在性能上有高的要求的话，那深入了解这些技术背后的机制就是必须的了，在这篇blog中我们将来
string与StringBuilder 性能差距到底有多大 aijuans
之前也看过一些对string与StringBuilder的性能分析，总感觉这个应该对整体性能不会产生多大的影响，所以就一直没有关注这块！由于学程序初期最先接触的string拼接，所以就一直没改变过自己的习惯！
今天碰到 java.util.ConcurrentModificationException 异常 antonyup_2006 java 多线程工作 IBM
今天改bug，其中有个实现是要对map进行循环，然后有删除操作，代码如下： Iterator<ListItem> iter = ItemMap.keySet.iterator(); while(iter.hasNext()){ ListItem it = iter.next(); //...一些逻辑操作 ItemMap.remove(it); } 结果运行报Con
PL/SQL的类型和JDBC操作数据库百合不是茶 PL/SQL表标量类型游标 PL/SQL记录
PL/SQL的标量类型: 字符,数字,时间,布尔,%type五中类型的 --标量：数据库中预定义类型的变量 --定义一个变长字符串 v_ename varchar2(10); --定义一个小数,范围 -9999.99~9999.99 v_sal number(6,2); --定义一个小数并给一个初始值为5.4 :=是pl/sql的赋值号
Mockito：一个强大的用于 Java 开发的模拟测试框架实例 bijian1013 mockito 单元测试
Mockito框架： Mockito是一个基于MIT协议的开源java测试框架。 Mockito区别于其他模拟框架的地方主要是允许开发者在没有建立“预期”时验证被测系统的行为。对于mock对象的一个评价是测试系统的测
精通Oracle10编程SQL(10)处理例外 bijian1013 oracle 数据库 plsql
/* *处理例外 */ --例外简介 --处理例外-传递例外 declare v_ename emp.ename%TYPE; begin SELECT ename INTO v_ename FROM emp where empno=&no; dbms_output.put_line('雇员名：'||v_ename); exceptio
【Java】Java执行远程机器上Linux命令 bit1129 linux命令
Java使用ethz通过ssh2执行远程机器Linux上命令，封装定义Linux机器的环境信息 package com.tom; import java.io.File; public class Env { private String hostaddr; //Linux机器的IP地址 private Integer po
java通信之Socket通信基础白糖_ java socket 网络协议
正处于网络环境下的两个程序，它们之间通过一个交互的连接来实现数据通信。每一个连接的通信端叫做一个Socket。一个完整的Socket通信程序应该包含以下几个步骤： ①创建Socket； ②打开连接到Socket的输入输出流； ④按照一定的协议对Socket进行读写操作； ④关闭Socket。 Socket通信分两部分：服务器端和客户端。服务器端必须优先启动，然后等待soc
angular.bind boyitech AngularJS angular.bind AngularJS API bind
angular.bind 描述：上下文，函数以及参数动态绑定，返回值为绑定之后的函数. 其中args是可选的动态参数，self在fn中使用this调用。使用方法： angular.bind(se
java-13个坏人和13个好人站成一圈，数到7就从圈里面踢出一个来，要求把所有坏人都给踢出来，所有好人都留在圈里。请找出初始时坏人站的位置。 bylijinnan java
import java.util.ArrayList; import java.util.List; public class KickOutBadGuys { /** * 题目：13个坏人和13个好人站成一圈，数到7就从圈里面踢出一个来，要求把所有坏人都给踢出来，所有好人都留在圈里。请找出初始时坏人站的位置。 * Maybe you can find out
Redis.conf配置文件及相关项说明（自查备用） Kai_Ge redis
Redis.conf配置文件及相关项说明 # Redis configuration file example # Note on units: when memory size is needed, it is possible to specifiy # it in the usual form of 1k 5GB 4M and so forth: #
[强人工智能]实现大规模拓扑分析是实现强人工智能的前奏 comsci 人工智能
真不好意思,各位朋友...博客再次更新... 节点数量太少,网络的分析和处理能力肯定不足,在面对机器人控制的需求方面,显得力不从心.... 但是,节点数太多,对拓扑数据处理的要求又很高,设计目标也很高,实现起来难度颇大...
记录一些常用的函数 dai_lm java
public static String convertInputStreamToString(InputStream is) { StringBuilder result = new StringBuilder(); if (is != null) try { InputStreamReader inputReader = new InputStreamRead
Hadoop中小规模集群的并行计算缺陷 datamachine mapreduce hadoop 并行计算
注：写这篇文章的初衷是因为Hadoop炒得有点太热，很多用户现有数据规模并不适用于Hadoop，但迫于扩容压力和去IOE（Hadoop的廉价扩展的确非常有吸引力）而尝试。尝试永远是件正确的事儿，但有时候不用太突进，可以调优或调需求，发挥现有系统的最大效用为上策。 -----------------------------------------------------------------
小学4年级英语单词背诵第二课 dcj3sjt126com english word
egg 蛋 twenty 二十 any 任何 well 健康的，好 twelve 十二 farm 农场 every 每一个 back 向后，回 fast 快速的 whose 谁的 much 许多 flower 花 watch 手表 very 非常，很 sport 运动 Chinese 中国的
自己实践了github的webhooks, linux上面的权限需要注意 dcj3sjt126com github webhook
环境, 阿里云服务器 1. 本地创建项目, push到github服务器上面 2. 生成www用户的密钥 sudo -u www ssh-keygen -t rsa -C "[email protected]" 3. 将密钥添加到github帐号的SSH_KEYS里面 3. 用www用户执行克隆, 源使
Java冒泡排序蕃薯耀冒泡排序 Java冒泡排序 Java排序
冒泡排序 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月23日 10:40:14 星期二 http://fanshuyao.iteye.com/
Excle读取数据转换为实体List【基于apache-poi】 hanqunfeng apache
1.依赖apache-poi 2.支持xls和xlsx 3.支持按属性名称绑定数据值 4.支持从指定行、列开始读取 5.支持同时读取多个sheet 6.具体使用方式参见org.cpframework.utils.excelreader.CP_ExcelReaderUtilTest.java 比如： Str
3个处于草稿阶段的Javascript API介绍 jackyrong JavaScript
原文： http://www.sitepoint.com/3-new-javascript-apis-may-want-follow/?utm_source=html5weekly&utm_medium=email 本文中，介绍3个仍然处于草稿阶段，但应该值得关注的Javascript API. 1) Web Alarm API &
6个创建Web应用程序的高效PHP框架 lampcy Web 框架 PHP
以下是创建Web应用程序的PHP框架，有coder bay网站整理推荐： 1. CakePHP CakePHP是一个PHP快速开发框架，它提供了一个用于开发、维护和部署应用程序的可扩展体系。CakePHP使用了众所周知的设计模式，如MVC和ORM，降低了开发成本，并减少了开发人员写代码的工作量。 2. CodeIgniter CodeIgniter是一个非常小且功能强大的PHP框架，适合需
评"救市后中国股市新乱象泛起"谣言 nannan408
首先来看百度百家一位易姓作者的新闻：三个多星期来股市持续暴跌，跌得投资者及上市公司都处于极度的恐慌和焦虑中，都要寻找自保及规避风险的方式。面对股市之危机，政府突然进入市场救市，希望以此来重建市场信心，以此来扭转股市持续暴跌的预期。而政府进入市场后，由于市场运作方式发生了巨大变化，投资者及上市公司为了自保及为了应对这种变化，中国股市新的乱象也自然产生。首先，中国股市这两天
页面全屏遮罩的实现方式 Rainbow702 html css 遮罩 mask
之前做了一个页面，在点击了某个按钮之后，要求页面出现一个全屏遮罩，一开始使用了position:absolute来实现的。当时因为画面大小是固定的，不可以resize的，所以，没有发现问题。最近用了同样的做法做了一个遮罩，但是画面是可以进行resize的，所以就发现了一个问题，当画面被reisze到浏览器出现了滚动条的时候，就发现，用absolute 的做法是有问题的。后来改成fixed定位就
关于angularjs的点滴 tntxia AngularJS
angular是一个新兴的JS框架，和以往的框架不同的事，Angularjs更注重于js的建模，管理，同时也提供大量的组件帮助用户组建商业化程序，是一种值得研究的JS框架。 Angularjs使我们可以使用MVC的模式来写JS。Angularjs现在由谷歌来维护。这里我们来简单的探讨一下它的应用。首先使用Angularjs我
Nutz--->>反复新建ioc容器的后果 xiaoxiao1992428 DAO mvc IOC nutz
问题： public class DaoZ { public static Dao dao() { // 每当需要使用dao的时候就取一次 Ioc ioc = new NutIoc(new JsonLoader("dao.js")); return ioc.get(

BP神经网络的实现详解

你可能感兴趣的:(Machine,Learning,神经网络)