Andrea_K

关于图像处理——运用CNN实现数字手写体识别的调研

关于图像处理——运用CNN实现数字手写体识别的调研

电子科技大学格拉斯哥学院 2017级余尔聪

目录

关于图像处理——运用CNN实现数字手写体识别的调研

前言

关于图像处理
关于CNN

正文

数据处理
特征提取（Feature Extractor）

卷积层设计
池化层设计

分类器（Multi-classifier）

输入层设计
隐层设计
输出层设计

后向传播的实现（Backward）

算法实现

主程序部分
CNN-训练部分

前向传播（Forward）

特征提取（Feature Extractor）
分类器（Multi-classifier）

后向传播（Backward）

分类器（Multi-classifier）
特征提取（Feature Extractor）

结果检测

结语

结果分析
网络优化

前言

关于图像处理

当下的21世纪是一个充满信息的时代，图像作为人类感知世界的视觉基础，是人类获取信息、表达信息和传递信息的重要手段。数字图像处理技术，即用计算机对图像进行处理的技术，在当下被广泛地运用到医学，教育，军事等多个领域。受学校以图像处理为主题的新生研讨课的启发，在参加完深度学习课程后，希望通过此例对图像识别有更深入的了解。

关于CNN

卷积神经网络（Convolutional Neural Networks,CNN）是一类包含卷积或相关计算且具有深度结构的前馈神经网络（Feedforward Neural Networks），是深度学习（deep learning）的代表算法之一。由于卷积神经网络能够进行平移不变分类（shift-invariant classification），因此在文献中也被称为“平移不变人工神经网络（Shift-Invariant Artificial Neural Networks, SIANN）” 。
对卷积神经网络的研究始于二十世纪80至90年代，时间延迟网络和LeNet-5是最早被证实有效的卷积神经网络算法；在二十一世纪后，随着数值计算设备的改进，卷积神经网络得到了快速发展，并被大量应用于计算机视觉、自然语言处理等领域。
FROM 百度百科-卷积神经网络

本例将以CNN的学习规则为基础结合BP算法，参考数据库中的原始MNIST数据，实现简单的数字手写体的识别。

正文

程序架构

以CNN为基础的程序框架主要分为特征提取（Feature Extractor）和分类器（Multi-classifier）两个部分。通过训练数据的前向（Forward Algorithm）输入运算和误差的后向传播（BP Algorithm）运算，多轮训练获得合适的权值，使得输出逐步靠近真实输出。

数据处理

训练数据用0-1编码，以便进行矩阵运算。本例中单个输入样本为28×28矩阵。
输出结果采用单热编码（e.g. ‘1’=[1 0 0 0 0 0 0 0 0 0]，仅用于分类区分），以便于网络设计与统计。

特征提取（Feature Extractor）

这一部分分为卷积层和池化层两部分。通过设置滤波器，我们用卷积层提取图像中的特征。（值得注意的是，用大量数据训练提取出的图像特征大部分十分抽象而与人类肉眼判断的相差很大。）随后通过池化层池化降维以便于之后的运算（本例运用取平均值的方法降维）。

卷积层设计
卷积层采用20个9×9的滤波器，滤波结果选取valid部分。其后运用ReLU作为激活函数，传入池化层。
池化层设计
池化层输入为20个20×20的矩阵。本例池化层采用2×2平均池化，即每四个输出为一个单元，取这四个数的均值为新的输出。最后的池化结果为20个10×10的矩阵。

分类器（Multi-classifier）

这一部分的程序设计采用包含一个有100个节点的单隐层神经网络结构（输入层+隐层+输出层）。基于梯度下降算法和BP算法，用每一个输入调整层与层之间的权重矩阵达到训练网络的目的。

输入层设计

从特征提取网络传入的单组样本为20个10×10的矩阵（因为有20个滤波器，故而每一个输入样本有20组输出），为方便之后的分类训练，我们将其转化为一个2000×1的向量；
设置第一层权重矩阵大小为100×2000；
运用ReLU作为第一层的激活函数。

隐层设计

设置隐层权重矩阵大小为10×100；
设置激活函数为ReLU。

输出层设计

设置输出层激活函数为Softmax（用于多分类问题的激活函数）；
最终输出结果为10×1的向量，最大值对应表征为1，其余值表征为0。

后向传播的实现（Backward）

本例中，采用后向传播算法不断更新权值，使得最终输出逐步逼近真实值。而后后向传播的关键在于梯度下降的概念，通过从后往前传导误差，达到训练目的，在此不做赘述。
可参照公式：

（说明：J为代价函数；w为权重矩阵；e为误差；x为前层输出）

算法实现

主程序部分

% this is my main program for MNIST
% CNN and BP are used to build whole structure
% this is a basic one
% name: 余尔聪
% date: 2018-11-28

load('MNISTData.mat'); 
% import TRAINING and TESTING Data

% initiation of variables
X = X_Train; % training data-input
D = D_Train; % training data-output
W1 = randn(9,9,20); % 9×9 Convolution Matrix
W3 = (2*rand(100,2000)-1)/20; % 1st layer Weight Matrix 
W4 = (2*rand(10,100)-1)/10; % 2nd layer Weight Matrix

% Training for 1 time
    [W1,W3,W4] = CNN(X,D,W1,W3,W4);

% Show Accuracy
acc = ACC(D_Test,X_Test,W1,W3,W4);
fprintf('Accuracy is %f\n', acc);

本例只进行了一轮训练作为示例（也因为样本量足够大-60000个，但实际情况下多数需要多轮训练）。

CNN-训练部分

function [W1,W3,W4] = CNN(X,D,W1,W3,W4)
% this is the training function
% comprised of Feature Extractor and Multi-classifier
% inputs include Training input and output, W1, W2, W3
% aims to find proper W1, W2, W3 as output

    dW1 = zeros(9,9,20); % preallocating for being faster
    alpha = 0.01; % step length
    for k = 1:60000 % one epoch for one sample
        x = X(:,:,k); % initiate one epoch input
        d = D(:,k); % initiate one epoch output

前向传播（Forward）

特征提取（Feature Extractor）

        % Forward Algorithm
        
        % Feature Extractor 
        % comprised of Convolution and Pooling
        for m = 1:20
            V1(:,:,m) = conv2(x,rot90(W1(:,:,m),2),'valid'); % Convolution Algorithm
        end
        Y1 = max(0,V1); % Activation Function-ReLU
        Y2 = (Y1(1:2:end,1:2:end,:)+Y1(2:2:end,1:2:end,:)+Y1(1:2:end,2:2:end,:)+Y1(2:2:end,2:2:end,:))/4; 
        % Pooling by 2×2 Mean

分类器（Multi-classifier）

        % Multi-classifier
        y2 = reshape(Y2,[],1); % reshape Y2 into 2000×1 vector
        v3 = W3*y2; % 1st layer calculation
        y3 = max(0,v3); % ReLU
        v = W4*y3; % 2nd layer calculation
        y = Softmax(v); % Softmax-multiclassification

后向传播（Backward）

分类器（Multi-classifier）

        % BP Algorithm
        % Multi-classifier
        e = d-y; % error of output
        delta = e; % cross_entropy+Softmax
        e3 = W4'*delta; % error of 2nd layer
        delta3 = (v3>0).*e3; % ReLU
        e2 = W3'*delta3; % error of 1st layer

        dW4 = alpha*delta*y3'; % change in W4
        dW3 = alpha*delta3*y2'; % change in W3

        W3 = dW3+W3; % update W3
        W4 = dW4+W4; % update W4

特征提取（Feature Extractor）

        % Feature Extractor
        E2 = reshape(e2,size(Y2)); % reshape e2 into 10×10×20 matrix
        E1 = zeros(size(Y1));E2_4 = E2/4; % backward pooling
        E1(1:2:end,1:2:end,:) = E2_4;
        E1(1:2:end,2:2:end,:) = E2_4;
        E1(2:2:end,1:2:end,:) = E2_4;
        E1(2:2:end,2:2:end,:) = E2_4;
        delta1 = (V1>0).*E1; % ReLU
        for m = 1:20
            dW1(:,:,m) = alpha*conv2(x,rot90(delta1(:,:,m),2),'valid');
            % change in W1
        end
        W1 = W1+dW1; % update W1

结果检测

运用测试集（除训练集以外的样本）检测训练结果（三个权重矩阵）。

function acc = ACC(D_Test,X_Test,W1,W3,W4)
% This is Used to Show Accuracy
    N = length(D_Test);
    d_comp = zeros(1,N);
    for k = 1:N
        x = X_Test(:,:,k); % initiate one epoch input
        % Feature Extractor 
        % comprised of Convolution and Pooling
        for m = 1:20
            V1(:,:,m) = conv2(x,rot90(W1(:,:,m),2),'valid'); % Convolution Algorithm
        end
        Y1 = max(0,V1); % Activation Function-ReLU
        Y2 = (Y1(1:2:end,1:2:end,:)+Y1(2:2:end,1:2:end,:)+Y1(1:2:end,2:2:end,:)+Y1(2:2:end,2:2:end,:))/4; 
        % Pooling by 2×2 Average
        
        % Multi-classifier
        y2 = reshape(Y2,[],1); % reshape Y2 into 2000×1 vector
        v3 = W3*y2; % 1st layer calculation
        y3 = max(0,v3); % ReLU
        v = W4*y3; % 2nd layer calculation
        y = Softmax(v); % Softmax-multiclassification
        
        % Statistics Accuracy
        [~, i] = max(y);
        d_comp(k) = i;
    end
[~, d_true] = max(D_Test); % real output
correctMsk = (d_comp == d_true); % counting
acc = sum(correctMsk)/N; % rate calculation
end

结语

结果分析

运行时间

正确率

MAINPro
Accuracy is 0.975800

注：正确率会因为权重矩阵初始化的不同而有所差异。

网络优化

本例中的程序框架使用了CNN算法，其耗时283.148s（当然取决于自己的电脑了），正确率为97.58%左右。为了提高收敛速度，可以考虑使用批量算法，动量算法；为了提高正确率，可以考虑加深网络层数，使用Dropout，改变激活函数，代价函数……以改变网络性能。

写在最后
作为第一次写博客的新手、深度学习的初学者，希望大家多多包涵。
如有错误，望指正~

你可能感兴趣的:(深度学习入门)

Pytorch深度学习入门基础（二）：python 编辑器的选择、安装及配置（ pycharm、 jupyter）慕奕宸深度学习深度学习 python pytorch
目录一、下载pycharm1.下载pycharm2.pycharm配置3.检查pycharm环境是否配置好二、Jupyter安装三、常见问题：1.为什么torch.cuda.isavailable()为False2.无法定位程序输入点现在来开一个专栏，关于学习Pytorch深度学习的入门基础，分为好几期，我会慢慢更新，希望大家可以互相支持一下，相互学习，相互进步！下面是这个专栏的所有内容，大家可以
pytorch深度学习入门（12）之-神经网络导出onnx模型部署与应用码农呆呆深度学习深度学习 pytorch 神经网络
概述：ONNX（OpenNeuralNetworkExchange）是一种开放神经网络交换格式，它使得不同深度学习框架（如TensorFlow、PyTorch、MXNet等）之间的互操作成为可能。ONNX提供了一种标准化的方式，可以将训练好的模型导出并转换为ONNX格式，然后可以在其他支持ONNX的框架或工具中进行部署和推理。ONNX的主要优势在于它促进了深度学习模型在不同平台之间的互操作性和可移
AI人工智能深度学习入门指南：从基础到实践_副本 AI大模型应用实战 C 人工智能深度学习 ai
AI人工智能深度学习入门指南：从基础到实践关键词：人工智能、机器学习、深度学习、神经网络、梯度下降、反向传播、实战案例摘要：本文是为零基础或初级学习者打造的深度学习入门指南。我们将从“人工智能-机器学习-深度学习”的关系讲起，用“教机器人认猫”的故事串联核心概念，结合生活比喻（如“多层蛋糕”解释神经网络）、数学公式（如梯度下降的“下山游戏”）和Python实战代码（用Keras实现手写数字识别），
深度学习入门指南：从基础概念到代码实践软考和人工智能学堂人工智能 #深度学习 Python开发经验深度学习人工智能
深度学习入门指南：从基础概念到代码实践1.深度学习概述深度学习是机器学习的一个分支，它通过模拟人脑神经元的工作方式，构建多层次的神经网络模型来处理复杂的数据模式。与传统机器学习方法相比，深度学习能够自动从原始数据中学习特征表示，无需过多的人工特征工程。深度学习已经在计算机视觉、自然语言处理、语音识别等领域取得了突破性进展。例如，ImageNet竞赛中深度学习模型的识别准确率已经超过人类水平，而GP
深度学习入门（2）：alexnet qq_776882262 深度学习人工智能
引言主要讲下alexnet里的几个方法，后面深度学习的代码部分应该都是借用别人的，整体安排是从简单到难。本篇借鉴Pytorch之AlexNet花朵分类_基于alexnet的花卉分类识别系统-CSDN博客，如果需要学习直接参考这篇就好了，本文只是作为本人复习记录。正文AlexNet是深度学习时代的开端，它用一场决定性的胜利，证明了深度卷积神经网络在计算机视觉中的巨大潜力。单层alexnet网络架构：
深度学习入门（3）：vgg16 qq_776882262 深度学习人工智能
引言相比于alexnet，vgg16进一步优化了这个黑盒模型，用实验的方式证明了哪些模块有效，哪些模块对检测效果提升有限。奠基了卷积神经网络一些基础的模块。本文参考pytorch实战7：手把手教你基于pytorch实现VGG16_vgg16pytorch-CSDN博客，此处只做记录供本人复习记录。正文VGG16创新点：1.使用小卷积核堆叠代替大卷积核VGG16采用多个连续的3×3小卷积核堆叠，而不
深度学习入门：Python搭建简单神经网络模型缑宇澄 python
在人工智能浪潮中，深度学习凭借强大的特征提取与模式识别能力成为核心技术，而神经网络则是深度学习的基石。从图像识别到自然语言处理，神经网络以独特的结构和学习机制，让计算机能够模拟人类大脑处理复杂信息的过程。本文将带领你从基础理论出发，使用Python和Keras库搭建一个简单的神经网络模型，开启深度学习的探索之旅。一、神经网络基础理论1.1神经元与网络结构神经网络的基本单元是人工神经元（又称节点或单
【大模型入门指南 10】大模型推理部署：vLLM和llama.cpp 青松ᵃⁱ LLM入门系列 llama
【大模型入门指南】系列文章：【大模型入门指南01】深度学习入门【大模型入门指南02】LLM大模型基础知识【大模型入门指南03】提示词工程【大模型入门指南04】Transformer结构【大模型入门指南05】LLM技术选型【大模型入门指南06】LLM数据预处理【大模型入门指南07】量化技术解析【大模型入门指南08】微调和分布式训练【大模型入门指南09】LLM和多模态模型高效推理实践【大模型入门指南1
深度学习入门：从零搭建你的第一个神经网络 layneyao ai 深度学习神经网络人工智能
深度学习入门：从零搭建你的第一个神经网络系统化学习人工智能网站（收藏）：https://www.captainbed.cn/flu文章目录深度学习入门：从零搭建你的第一个神经网络摘要引言第一章：神经网络基础原理1.1神经元模型1.2反向传播算法1.3激活函数对比第二章：开发环境搭建指南2.1硬件要求2.2软件环境2.2.1Anaconda配置2.2.2PyTorch安装2.2.3TensorFlo
深度学习入门:如何从零开始搭建自己的深度学习模型? AI天才研究院 Python实战自然语言处理人工智能语言模型编程实践开发语言架构设计
作者：禅与计算机程序设计艺术1.简介深度学习（DeepLearning）近几年已经成为人们关注的热点话题。从2012年的ImageNet竞赛开始，激起了众多研究者的兴趣，也带来了越来越多的应用场景。随着技术的飞速发展，深度学习已经成为了各个领域最具潜力的技术。作为一名AI科研工作者，了解、掌握深度学习相关知识可以帮助你更好地理解并解决实际问题。本文将全面介绍深度学习的基础知识、技术要点及其应用。文
第6篇：深度学习入门——神经网络基础 CarlowZJ AI+Python 深度学习神经网络人工智能
目录一、前言二、概念讲解（一）深度学习：人工智能皇冠上的明珠（二）神经网络：深度学习的微观世界三、神经网络的基本组件：构建智能的积木（一）神经元：智能的基本单元（二）权重与偏置：连接的智慧（三）激活函数：非线性的魔法（四）损失函数：衡量差距的标尺（五）优化器：攀登优化高峰的向导四、前向传播与反向传播：神经网络的智慧流转（一）前向传播：信息的逐层传递（二）反向传播：误差的逆向追溯五、代码示例：搭建你
【深度学习入门篇 ②】Pytorch完成线性回归！小森( ﹡ˆoˆ﹡ ) 深度学习入门篇线性回归算法回归
嗨，大家好，我是小森(﹡ˆoˆ﹡)！易编橙·终身成长社群创始团队嘉宾，橙似锦计划领衔成员、阿里云专家博主、腾讯云内容共创官、CSDN人工智能领域优质创作者。易编橙：一个帮助编程小伙伴少走弯路的终身成长社群！上一部分我们自己通过torch的方法完成反向传播和参数更新，在Pytorch中预设了一些更加灵活简单的对象，让我们来构造模型、定义损失，优化损失等；那么接下来，我们一起来了解一下其中常用的API
day33 python深度学习入门 xiaohanbao09 py note python 深度学习机器学习 pandas 人工智能学习
目录深度学习入门：PyTorch实现鸢尾花分类一、环境搭建1.创建Python环境2.安装必要的库3.检查CUDA环境二、数据准备1.加载数据集2.数据预处理3.转换为PyTorch张量三、模型构建1.定义模型结构2.定义损失函数和优化器四、模型训练1.训练过程2.训练结果五、结果可视化六、总结在深度学习的旅程中，神经网络是不可或缺的核心工具之一。今天，我将通过一个简单的项目，使用PyTorch框
遥感深度学习——基于deeplabv3+和GID数据集（1）全域智图深度学习人工智能
博主最近准备进行深度学习入门，因为是做遥感方向的，经过多重考虑，算法最后选择了deeplabv3+。DeepLabV3+是由谷歌提出的一种用于图像语义分割的深度学习模型。它在DeepLabV3的基础上，加入了编码器-解码器结构，以提高分割结果的边缘细节和空间分辨率。以下是DeepLabV3+的主要特点：编码器-解码器结构：编码器部分提取图像的高层次语义特征，解码器部分逐步恢复图像的空间细节，提高分
深度学习入门：从理论到实战的详细指南人工智能教程深度学习人工智能算法目标跟踪机器学习 YOLO 线性回归
的高效学习和理解。对于初学者来说，深度学习的学习曲线可能会显得有些陡峭，但只要掌握正确的方法和步骤，就能轻松入门。本文将为你提供一份从理论到实战的详细指南，帮助你快速掌握深度学习的核心要点。一、深度学习是什么？（一）定义深度学习是机器学习的一个子领域，它通过构建多层的神经网络来学习数据中的复杂模式。与传统的机器学习算法相比，深度学习能够自动提取数据的特征，而不需要人工设计复杂的特征工程。这种自动特
深度学习入门：基于 Python 的理论与实现笔记 u013244720 深度学习 python 笔记
深度学习入门：基于Python的理论与实现笔记在VSCode中运行代码替换库搜索路径#sys.path.append(os.pardir)#为了导入父目录而进行的设定sys.path.append(os.getcwd())替换文件路径#withopen("sample_weight.pkl",'rb')asf:withopen(os.getcwd()+"/ch03/sample_weight.pk
pytorch深度学习入门（15）之-使用onnx模型量化码农呆呆深度学习人工智能 pytorch 深度学习 python 神经网络
量化ONNX模型内容量化概述ONNX量化表示格式量化ONNX模型基于变压器的模型Transformer基于变压器的模型GPU上的量化常问问题量化概述ONNX运行时中的量化是指ONNX模型的8位线性量化。在量化期间，浮点值被映射到以下形式的8位量化空间：val_fp32=scale*(val_quantized-zero_point)scale是一个正实数，用于将浮点数映射到量化空间。计算方法如下：
深度学习入门--基于Python的理论与实现--Python入门语文天才高斯 python 开发语言人工智能深度学习
第一章Python入门1.1Python是什么Python是一种高级编程语言，由GuidovanRossum于1989年创建，并在1991年正式发布。Python具有以下特点：易读易写：Python语法简洁，代码可读性强，使开发者能够更专注于问题本身。跨平台：Python可以在Windows、Linux和macOS上运行，具有良好的可移植性。丰富的库：Python生态系统中包含大量的第三方库，如N
【深度学习入门_NLP自然语言处理】序章沉默的舞台剧 AI 深度学习自然语言处理人工智能
本部分开始深度学习第二大部分NLP章节学习，找了好多资料，终于明确NLP的学习目标了，介于工作之余学习综合考量，还是决定以视频学习为主+后期自主实践为主吧。分享一个总图，其实在定位的时候很迷茫，单各章节领域其实都是很大的范畴，每个部分都是需要专精的，所以在做计划的时候很头大…千里之行始于足下吧，话不多数，直接上NLP的学习应用目标：学习教程的话参照B站实战结合的这个教程【2025NLP自然语言处理
具身智能零碎知识点（三）：深入解析 “1D UNet”：结构、原理与实战墨绿色的摆渡人具身智能零碎知识点 pytorch 人工智能 python transformer 具身智能
深入解析“1DUNet”：结构、原理与实战【深度学习入门】1DUNet详解：结构、原理与实战指南一、1DUNet是什么？二、核心结构与功能1.整体架构2.编码器（Encoder）3.解码器（Decoder）4.跳跃连接（SkipConnection）5.瓶颈层（Bottleneck）三、数学原理与数值示例1.1D卷积运算2.编码-解码流程四、PyTorch代码实现1.完整模型代码2.使用示例五、实
使用Python学习AI的学习攻略 liushangzaibeijing AI学习 python 学习人工智能
基于python的AI学习一、夯实基础二、数学基础三、机器学习基础四、深度学习入门五、进阶学习六、学习资源推荐七、实践项目一、夯实基础对于已经掌握Python基础语法的学习者来说，进一步利用Python学习AI需要夯实以下基础：变量和数据类型：包括整数、浮点数、字符串、列表、字典、元组等。条件语句和循环：熟练使用if-else语句和for、while循环。函数：理解函数的定义、调用以及参数传递。面
深度学习入门（三）：神经网络的学习 WhyNot? 深度学习深度学习神经网络学习
文章目录前言人类思考VS机器学习VS深度学习基础术语损失函数常用的损失函数均方误差MSE（MeanSquareError）交叉熵误差（CrossEntropyError）mini-batch学习为何要设定损失函数数值微分神经网络学习算法的实现两层神经网络的类参考资料前言机器学习的过程通常分为学习（从训练数据中自动获取权重参数的过程）和推理（利用学习到的权重参数对新的数据进行预测）两个环节。本文将主
深度学习入门：从神经网络基础到简单实现 Evaporator Core 人工智能 #深度学习 Python开发经验深度学习神经网络人工智能
深度学习作为人工智能领域最令人兴奋的技术之一，已经在图像识别、自然语言处理、语音识别等多个领域取得了突破性进展。本文将深入浅出地介绍深度学习的基本概念，并通过Python代码实现一个简单的神经网络模型，帮助读者建立直观理解并迈出实践第一步。神经网络的基本原理神经网络的核心思想源自对人类大脑工作方式的简化模拟。想象一下，当你第一次学习骑自行车时，大脑会不断接收来自视觉、平衡感等多方面的信号，经过一系
PyTorch深度学习入门与实战教程 openbiox
本文还有配套的精品资源，点击获取简介：深度学习是AI的核心技术，基于神经网络对数据建模以实现学习和预测。PyTorch是一个灵活易用的开源深度学习框架，适合初学者和研究人员进行实验开发。教程涵盖了从基础概念到模型训练、验证、测试的完整流程，包括张量操作、动态计算图、数据预处理、神经网络构建、优化器使用、训练循环、模型保存加载以及CNN和RNN等关键网络结构的应用实践。通过实例项目如文本分类、图像识
AI入门书籍推荐撬动未来的支点深度学习深度学习人工智能
漫画机械学习入门(（日）大关真之戴凤智张鸿涛孟宇（译）)深度学习入门：基于Python的理论与实现深度学习的数学：使用Python语言[转换版]([美]罗纳德·T.纽塞尔)
手写数字识别（深度学习小实践）我是来学习的你们要干什么深度学习人工智能 pycharm python 机器学习神经网络
小白学习ing文章目录前言一、神经网络学习与实践1.学习2.推理二、手写数字识别1、读入mnist数据集（学习）2、神经网络的推理改进→批处理前言非常简单的深度学习小实践，没有用框架，仅使用简单的Python。参考书籍《深度学习入门：基于Python的理论与实现》一、神经网络学习与实践1.学习训练数据进行权重参数的学习2.推理使用学习到的参数，对输入数据进行分类二、手写数字识别1、读入mnist数
计算机视觉深度学习入门（4） yyc_audio 计算机视觉人工智能计算机视觉深度学习神经网络
在小型数据集上从头开始训练一个卷积神经网络利用少量数据来训练图像分类模型，这是一种很常见的情况。如果你从事与计算机视觉相关的职业，那么很可能会在实践中遇到这种情况。“少量”样本既可能是几百张图片，也可能是上万张图片。我们来看一个实例——猫狗图片分类，数据集包含5000张猫和狗的图片（2500张猫的图片，2500张狗的图片）。我们将2000张图片用于训练，1000张用于验证，2000张用于测试。将介
Python第十六课：深度学习入门 | 神经网络解密程之编 Python全栈通关秘籍 python 神经网络青少年编程
本节目标理解生物神经元与人工神经网络的映射关系掌握激活函数与损失函数的核心作用使用Keras构建手写数字识别模型可视化神经网络的训练过程掌握防止过拟合的基础策略一、神经网络基础（大脑的数字化仿生）1.神经元对比生物神经元人工神经元树突接收信号输入层接收特征数据细胞体整合信号加权求和（∑(权重×输入)+偏置）轴突传递电信号激活函数处理输出2.核心组件解析激活函数：神经元的"开关"（如ReLU：max
大模型学习路线与资源推荐数字化转型2025 AI投资人工智能
以下是基于多篇参考资料整理的大模型学习路线，涵盖从基础到进阶的完整学习路径，帮助您系统掌握大模型核心技术并应用于实际场景：一、基础阶段：构建核心知识体系编程与数学基础编程语言：优先学习Python，掌握其语法、数据结构及常用库（如NumPy、Pandas、PyTorch）37。数学基础：线性代数、概率论与统计学、微积分是理解模型原理的基石，需重点掌握矩阵运算、概率分布等概念39。深度学习入门神经网
神经网络与深度学习入门：理解ANN、CNN和RNN shandianfk_com ChatGPT AI 神经网络深度学习 cnn
在现代科技日新月异的今天，人工智能已经成为了我们生活中的重要组成部分。无论是智能手机的语音助手，还是推荐系统，背后都有一项核心技术在支撑，那就是神经网络与深度学习。今天，我们就来聊一聊这个听起来高大上的话题，其实它也没那么难懂！什么是神经网络？首先，我们要了解什么是神经网络。神经网络（ArtificialNeuralNetwork，简称ANN）是模拟人脑神经元连接方式的一种算法。它由一层层的“神经
github中多个平台共存 jackyrong github
在个人电脑上，如何分别链接比如oschina,github等库呢，一般教程之列的，默认 ssh链接一个托管的而已，下面讲解如何放两个文件 1）设置用户名和邮件地址 $ git config --global user.name "xx" $ git config --global user.email "[email protected]"
ip地址与整数的相互转换(javascript) alxw4616 JavaScript
//IP转成整型 function ip2int(ip){ var num = 0; ip = ip.split("."); num = Number(ip[0]) * 256 * 256 * 256 + Number(ip[1]) * 256 * 256 + Number(ip[2]) * 256 + Number(ip[3]); n
读书笔记-jquey+数据库+css chengxuyuancsdn html jquery oracle
1、grouping ,group by rollup, GROUP BY GROUPING SETS区别 2、$("#totalTable tbody>tr td:nth-child(" + i + ")").css({"width":tdWidth, "margin":"0px", &q
javaSE javaEE javaME == API下载 Array_06 java
oracle下载各种API文档： http://www.oracle.com/technetwork/java/embedded/javame/embed-me/documentation/javame-embedded-apis-2181154.html JavaSE文档： http://docs.oracle.com/javase/8/docs/api/ JavaEE文档： ht
shiro入门学习 cugfy java Web 框架
声明本文只适合初学者，本人也是刚接触而已，经过一段时间的研究小有收获，特来分享下希望和大家互相交流学习。首先配置我们的web.xml代码如下，固定格式，记死就成 <filter> <filter-name>shiroFilter</filter-name> &nbs
Array添加删除方法 357029540 js
刚才做项目前台删除数组的固定下标值时，删除得不是很完整，所以在网上查了下，发现一个不错的方法，也提供给需要的同学。 //给数组添加删除 Array.prototype.del = function(n){
navigation bar 更改颜色张亚雄 IO
今天郁闷了一下午，就因为objective-c默认语言是英文，我写的中文全是一些乱七八糟的样子，到不是乱码，但是，前两个自字是粗体，后两个字正常体，这可郁闷死我了，问了问大牛，人家告诉我说更改一下字体就好啦，比如改成黑体，哇塞，茅塞顿开。翻书看，发现，书上有介绍怎么更改表格中文字字体的，代码如下
unicode转换成中文 adminjun unicode 编码转换
在Java程序中总会出现\u6b22\u8fce\u63d0\u4ea4\u5fae\u535a\u641c\u7d22\u4f7f\u7528\u53cd\u9988\uff0c\u8bf7\u76f4\u63a5这个的字符，这是unicode编码，使用时有时候不会自动转换成中文就需要自己转换了使用下面的方法转换一下即可。 /** * unicode 转换成中文
一站式 Java Web 框架 firefly aijuans Java Web
Firefly是一个高性能一站式Web框架。涵盖了web开发的主要技术栈。包含Template engine、IOC、MVC framework、HTTP Server、Common tools、Log、Json parser等模块。 firefly-2.0_07修复了模版压缩对javascript单行注释的影响，并新增了自定义错误页面功能。更新日志：增加自定义系统错误页面功能
设计模式——单例模式 ayaoxinchao 设计模式
定义 Java中单例模式定义：“一个类有且仅有一个实例，并且自行实例化向整个系统提供。” 分析从定义中可以看出单例的要点有三个：一是某个类只能有一个实例；二是必须自行创建这个实例；三是必须自行向系统提供这个实例。 &nb
Javascript 多浏览器兼容性问题及解决方案 BigBird2012 JavaScript
不论是网站应用还是学习js,大家很注重ie与firefox等浏览器的兼容性问题，毕竟这两中浏览器是占了绝大多数。一、document.formName.item(”itemName”) 问题问题说明：IE下，可以使用 document.formName.item(”itemName”) 或 document.formName.elements ["elementName&quo
JUnit-4.11使用报java.lang.NoClassDefFoundError: org/hamcrest/SelfDescribing错误 bijian1013 junit4.11 单元测试
下载了最新的JUnit版本，是4.11，结果尝试使用发现总是报java.lang.NoClassDefFoundError: org/hamcrest/SelfDescribing这样的错误，上网查了一下，一般的解决方案是，换一个低一点的版本就好了。还有人说，是缺少hamcrest的包。去官网看了一下，如下发现：
[Zookeeper学习笔记之二]Zookeeper部署脚本 bit1129 zookeeper
Zookeeper伪分布式安装脚本(此脚本在一台机器上创建Zookeeper三个进程，即创建具有三个节点的Zookeeper集群。这个脚本和zookeeper的tar包放在同一个目录下，脚本中指定的名字是zookeeper的3.4.6版本，需要根据实际情况修改)： #!/bin/bash #!!!Change the name!!! #The zookeepe
【Spark八十】Spark RDD API二 bit1129 spark
coGroup package spark.examples.rddapi import org.apache.spark.{SparkConf, SparkContext} import org.apache.spark.SparkContext._ object CoGroupTest_05 { def main(args: Array[String]) { v
Linux中编译apache服务器modules文件夹缺少模块(.so)的问题 ronin47 modules
在modules目录中只有httpd.exp，那些so文件呢？我尝试在fedora core 3中安装apache 2. 当我解压了apache 2.0.54后使用configure工具并且加入了 --enable-so 或者 --enable-modules=so (两个我都试过了) 去make并且make install了。我希望在/apache2/modules/目录里有各种模块，
Java基础-克隆 BrokenDreams java基础
Java中怎么拷贝一个对象呢？可以通过调用这个对象类型的构造器构造一个新对象，然后将要拷贝对象的属性设置到新对象里面。Java中也有另一种不通过构造器来拷贝对象的方式，这种方式称为克隆。 Java提供了java.lang.
读《研磨设计模式》-代码笔记-适配器模式-Adapter bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 适配器模式解决的主要问题是，现有的方法接口与客户要求的方法接口不一致 * 可以这样想，我们要写这样一个类（Adapter）: * 1.这个类要符合客户的要求 ---> 那显然要
HDR图像PS教程集锦&心得 cherishLC PS
HDR是指高动态范围的图像，主要原理为提高图像的局部对比度。软件有photomatix和nik hdr efex。一、教程叶明在知乎上的回答： http://www.zhihu.com/question/27418267/answer/37317792 大意是修完后直方图最好是等值直方图，方法是HDR软件调一遍，再结合不透明度和蒙版细调。二、心得 1、去除阴影部分的
maven-3.3.3 mvn archetype 列表 crabdave ArcheType
maven-3.3.3 mvn archetype 列表可以参考最新的：http://repo1.maven.org/maven2/archetype-catalog.xml [INFO] Scanning for projects... [INFO]
linux shell 中文件编码查看及转换方法 daizj shell 中文乱码 vim 文件编码
一、查看文件编码。在打开文件的时候输入:set fileencoding 即可显示文件编码格式。二、文件编码转换 1、在Vim中直接进行转换文件编码,比如将一个文件转换成utf-8格式 &
MySQL--binlog日志恢复数据 dcj3sjt126com binlog
恢复数据的重要命令如下 mysql> flush logs; 默认的日志是mysql-bin.000001，现在刷新了重新开启一个就多了一个mysql-bin.000002
数据库中数据表数据迁移方法 dcj3sjt126com sql
刚开始想想好像挺麻烦的，后来找到一种方法了，就SQL中的 INSERT 语句，不过内容是现从另外的表中查出来的，其实就是 MySQL中INSERT INTO SELECT的使用下面看看如何使用语法：MySQL中INSERT INTO SELECT的使用 1. 语法介绍有三张表a、b、c，现在需要从表b
Java反转字符串 dyy_gusi java 反转字符串
前几天看见一篇文章，说使用Java能用几种方式反转一个字符串。首先要明白什么叫反转字符串，就是将一个字符串到过来啦，比如"倒过来念的是小狗"反转过来就是”狗小是的念来过倒“。接下来就把自己能想到的所有方式记录下来了。 1、第一个念头就是直接使用String类的反转方法，对不起，这样是不行的，因为Stri
UI设计中我们为什么需要设计动效 gcq511120594 UI linux
随着国际大品牌苹果和谷歌的引领，最近越来越多的国内公司开始关注动效设计了，越来越多的团队已经意识到动效在产品用户体验中的重要性了，更多的UI设计师们也开始投身动效设计领域。但是说到底，我们到底为什么需要动效设计？或者说我们到底需要什么样的动效？做动效设计也有段时间了，于是尝试用一些案例，从产品本身出发来说说我所思考的动效设计。一、加强体验舒适度嗯，就是让用户更加爽更加爽的用
JBOSS服务部署端口冲突问题 HogwartsRow java 应用服务器 jboss server EJB3
服务端口冲突问题的解决方法，一般修改如下三个文件中的部分端口就可以了。 1、jboss5/server/default/conf/bindingservice.beans/META-INF/bindings-jboss-beans.xml 2、./server/default/deploy/jbossweb.sar/server.xml 3、.
第三章 Redis/SSDB+Twemproxy安装与使用 jinnianshilongnian ssdb reids twemproxy
目前对于互联网公司不使用Redis的很少，Redis不仅仅可以作为key-value缓存，而且提供了丰富的数据结果如set、list、map等，可以实现很多复杂的功能；但是Redis本身主要用作内存缓存，不适合做持久化存储，因此目前有如SSDB、ARDB等，还有如京东的JIMDB，它们都支持Redis协议，可以支持Redis客户端直接访问；而这些持久化存储大多数使用了如LevelDB、RocksD
ZooKeeper原理及使用 liyonghui160com
ZooKeeper是Hadoop Ecosystem中非常重要的组件，它的主要功能是为分布式系统提供一致性协调(Coordination)服务，与之对应的Google的类似服务叫Chubby。今天这篇文章分为三个部分来介绍ZooKeeper，第一部分介绍ZooKeeper的基本原理，第二部分介绍ZooKeeper
程序员解决问题的60个策略 pda158 框架工作单元测试
根本的指导方针 1. 首先写代码的时候最好不要有缺陷。最好的修复方法就是让 bug 胎死腹中。良好的单元测试强制数据库约束使用输入验证框架避免未实现的“else”条件在应用到主程序之前知道如何在孤立的情况下使用日志 2. print 语句。往往额外输出个一两行将有助于隔离问题。 3. 切换至详细的日志记录。详细的日
Create the Google Play Account sillycat Google
Create the Google Play Account Having a Google account, pay 25$, then you get your google developer account. References: http://developer.android.com/distribute/googleplay/start.html https://p
JSP三大指令 vikingwei jsp
JSP三大指令一个jsp页面中，可以有0~N个指令的定义！ 1. page --> 最复杂：<%@page language="java" info="xxx"...%> * pageEncoding和contentType： > pageEncoding：它

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他