jeanlu

Deep-Learning之卷积神经网络（小白入门）

一、初识卷积神经网络（CNNs / ConvNets）

卷积神经网络是一类包含卷积计算且具有深度结构的前馈神经网络，是深度学习的代表算法之一。卷积神经网络具有表征学习能力，能够按其阶层结构对输入信息进行平移不变分类，因此也被称为“平移不变人工神经网络” 。
~~emmm,这是百度百科的介绍，我他喵只想说：人言否？啥叫前馈神经网络？啥又叫表征学习？平移不变分类又是什么鬼？喵喵喵？~~
感觉好抽象，第一次看到的我有一种一脸懵逼，二脸茫然的感觉，感觉用更多生僻词汇 来解释 生僻词汇，结果还是不懂=_=。

what：是啥？干啥用的？

可以将卷积神经网络理解为一个黑盒，把数据（二位数组/阵列）全扔进去，不管数据是多不规范，它都能给你分类/识别出来（当然，前提是训练学习过cnn的啦）。

比如这个，可以识别出来相应的字母：

再举个例子，把一筐混合豆子（红豆，绿豆，黄豆）分出来，就把这些全倒进机器（类比cnn）里，最后得到三筐豆子，可能是因为大小，可能因为颜色（相应特征），原理下面再讲。

why：为啥用它？

有很大的抗干扰性和鲁棒性，像上面那张图，歪七倒八，大小/粗细不一的‘X’，‘O’，都可以识别出来。

when & where：啥时用？在哪用？

大多应用于计算机视觉，比如：手机上的人脸识别开锁，自动驾驶中的路况识别，美图秀秀以及抖音的人脸识别等等。
也可应用于音频，文本，所有可以转化为二维矩阵的数据，就比如密码学攻击中利用示波器波形图进行密钥位分类。

二、卷积神经网络的原理

CNN的构成：
输入层/ Input layer；卷积层/ CONV layer；激活函数 / ReLU layer；池化层 / Pooling layer；全连接层 / FC layer

如上图所示，卷积神经网络架构与常规人工神经网络架构非常相似，特别是在网络的最后一层，即全连接。此外，还注意到卷积神经网络能够接受多个特征图作为输入，而不是向量。

1.数据输入层

该层要做的处理主要是对原始图像数据进行预处理，其中包括：

去均值：把输入数据各个维度都中心化为0，如下图所示，其目的就是把样本的中心拉回到坐标系原点上。
归一化：幅度归一化到同样的范围，如下所示，即减少各维度数据取值范围的差异而带来的干扰，比如，我们有两个维度的特征A和B，A范围是0到10，而B范围是0到10000，如果直接使用这两个特征是有问题的，好的做法就是归一化，即A和B的数据都变为0到1的范围。
PCA/白化：用PCA(主成分分析)降维；白化是对数据各个特征轴上的幅度归一化

去均值与归一化效果图：

去相关与白化效果图：

2.卷积计算层

这一层就是卷积神经网络最重要的一个层次，也是“卷积神经网络”的名字来源。
在这个卷积层，有两个关键操作：

局部关联。每个神经元看做一个滤波器(filter)
窗口(receptive field)滑动， filter对局部数据计算

先介绍卷积层遇到的几个名词：

深度/depth（解释见下图）
步长/stride （窗口一次滑动的长度）
填充值/zero-padding

填充值是什么呢？以下图为例子，比如有这么一个5 * 5的图片（一个格子一个像素），我们滑动窗口取2*2，步长取2，那么我们发现还剩下1个像素没法滑完，那怎么办呢？

那我们在原先的矩阵加了一层填充值，使得变成6*6的矩阵，那么窗口就可以刚好把所有像素遍历完。这就是填充值的作用。

卷积的计算（注意，下面蓝色矩阵周围有一圈灰色的框，那些就是上面所说到的填充值）这里的蓝色矩阵就是输入的图像，粉色矩阵就是卷积层的神经元，这里表示了有两个神经元（w0,w1）。绿色矩阵就是经过卷积运算后的输出矩阵，这里的步长设置为2。

蓝色的矩阵(输入图像)对粉色的矩阵（filter）进行矩阵内积计算并将三个内积运算的结果与偏置值b相加（比如上面图的计算：2+（-2+1-2）+（1-2-2） + 1= 2 - 3 - 3 + 1 = -3），计算后的值就是绿框矩阵的一个元素。

下面的动态图形象地展示了卷积层的计算过程：

参数共享机制

在卷积层中每个神经元连接数据窗的权重是固定的，每个神经元只关注一个特性。神经元就是图像处理中的滤波器，比如边缘检测专用的Sobel滤波器，即卷积层的每个滤波器都会有自己所关注一个图像特征，比如垂直边缘，水平边缘，颜色，纹理等等，这些所有神经元加起来就好比就是整张图像的特征提取器集合。
需要估算的权重个数减少: AlexNet 1亿 => 3.5w
一组固定的权重和不同窗口内数据做内积: 卷积

3.激励层

把卷积层输出结果做非线性映射。

CNN采用的激励函数一般为ReLU(The Rectified Linear Unit/修正线性单元)，它的特点是收敛快，求梯度简单，但较脆弱，图像如下。

激励层的实践经验：
① 不要用sigmoid！不要用sigmoid！不要用sigmoid！
② 首先试RELU，因为快，但要小心点
③ 如果② 失效，请用Leaky ReLU或者Maxout
④ 某些情况下tanh倒是有不错的结果，但是很少

4.池化层

池化层夹在连续的卷积层中间，用于压缩数据和参数的量，减小过拟合。简而言之，如果输入是图像的话，那么池化层的最主要作用就是压缩图像。

这里再展开叙述池化层的具体作用。

特征不变性，也就是我们在图像处理中经常提到的特征的尺度不变性，池化操作就是图像的resize，平时一张狗的图像被缩小了一倍我们还能认出这是一张狗的照片，这说明这张图像中仍保留着狗最重要的特征，我们一看就能判断图像中画的是一只狗，图像压缩时去掉的信息只是一些无关紧要的信息，而留下的信息则是具有尺度不变性的特征，是最能表达图像的特征。
特征降维，我们知道一幅图像含有的信息是很大的，特征也很多，但是有些信息对于我们做图像任务时没有太多用途或者有重复，我们可以把这类冗余信息去除，把最重要的特征抽取出来，这也是池化操作的一大作用。
在一定程度上防止过拟合，更方便优化。
池化层用的方法有Max pooling 和 average pooling，用的较多的是Max pooling。

这里就说一下Max pooling，其实思想非常简单。

对于每个2 * 2的窗口选出最大的数作为输出矩阵的相应元素的值，比如输入矩阵第一个2 * 2窗口中最大的数是6，那么输出矩阵的第一个元素就是6，如此类推。

5.全连接层

两层之间所有神经元都有权重连接，通常全连接层在卷积神经网络尾部。

跟传统的神经网络神经元的连接方式是一样的：

批规范化

批规范化（Batch normalization）是深度学习中经常见到的一种训练trick，指在采用梯度下降法训练DNN（深度神经网络）时，对网络层中每个mini-batch的数据进行归一化，使其均值变为0，方差变为1，其主要作用是缓解DNN训练中的梯度消失/爆炸现象，加快模型的训练速度。

三、卷积神经网络之典型CNN & 常用框架

1.典型CNN

•LeNet，这是最早用于数字识别的CNN
•AlexNet， 2012 ILSVRC比赛远超第2名的CNN，比
•LeNet更深，用多层小卷积层叠加替换单大卷积层。
•ZF Net， 2013 ILSVRC比赛冠军
•GoogLeNet，2014 ILSVRC比赛冠军
•VGGNet， 2014 ILSVRC比赛中的模型，图像识别略差于GoogLeNet，但是在很多图像转化学习问题(比如object detection)上效果奇好

2.常用框架

Caffe
　•源于Berkeley的主流CV工具包，支持C++,python,matlab
　•Model Zoo中有大量预训练好的模型供使用
Torch
　•Facebook用的卷积神经网络工具包
　•通过时域卷积的本地接口，使用非常直观
　•定义新网络层简单
TensorFlow
　•Google的深度学习框架
　•TensorBoard可视化很方便
　•数据和模型并行化好，速度快

四、 fine-tuning

what？
fine-tuning就是使用已用于其他目标、预训练好模型的权重或者部分权重，作为初始值开始训练。
为什么不用随机选取选几个数作为权重初始值？
答：第一，自己从头训练卷积神经网络容易出现问题；
第二，fine-tuning能很快收敛到一个较理想的状态，省时省心。

how？
•复用相同层的权重，新定义层取随机权重初始值
•调大新定义层的的学习率，调小复用层学习率

五、一般结构 & 训练算法 & 优缺点 & 所遇问题

1.一般CNN结构依次为

1.INPUT
2.[[CONV -> RELU]N -> POOL?]M
3.[FC -> RELU]*K
4.FC

2.卷积神经网络之训练算法

1.同一般机器学习算法，先定义Loss function，衡量和实际结果之间差距。
2.找到最小化损失函数的W和b， CNN中用的算法是SGD（随机梯度下降）。

3.卷积神经网络之优缺点

优点
　　•共享卷积核，对高维数据处理无压力
　　•无需手动选取特征，训练好权重，即得特征分类效果好
缺点
　　•需要调参，需要大样本量，训练最好要GPU
　　•物理含义不明确（也就说，我们并不知道没个卷积层到底提取到的是什么特征，而且神经网络本身就是一种难以解释的“黑箱模型”）　　

4.问题

第一个问题：为什么不用BP神经网络去做呢？ 1.全连接，权值太多，需要很多样本去训练，计算困难
　　• 应对之道：减少权值的尝试，局部连接，权值共享

　　卷积神经网络有两种神器可以降低参数数目。
　　第一种神器叫做局部感知野，一般认为人对外界的认知是从局部到全局的，而图像的空间联系也是局部的像素联系较为紧密，而距离较远的像素相关性则较弱。因而，每个神经元其实没有必要对全局图像进行感知，只需要对局部进行感知，然后在更高层将局部的信息综合起来就得到了全局的信息。
　　第二级神器，即权值共享。

2.边缘过渡不平滑
　　• 应对之道：采样窗口彼此重叠

第二个问题：LeNet里的隐层的神经元个数怎么确定呢？
它和原图像，也就是输入的大小（神经元个数）、滤波器的大小和滤波器在图像中的滑动步长都有关！

LeNet-5共有7层，不包含输入，每层都包含可训练参数（连接权重）。输入图像为32*32大小。

例如，我的图像是1000x1000像素，而滤波器大小是10x10，假设滤波器没有重叠，也就是步长为10，这样隐层的神经元个数就是(1000x1000 )/ (10x10)=100x100个神经元了。

那重叠了怎么算？比如上面图的C2中28*28是如何得来的？这里的步长就是1，窗口大小是5*5，所以窗口滑动肯定发生了重叠。下图解释了28的由来。

第三个问题：S2层是一个下采样层是干嘛用的？为什么是下采样？
也就是上面所说的池化层，只是叫法不同而已。这层利用图像局部相关性的原理，对图像进行子抽样，可以减少数据处理量同时保留有用信息，相当于图像压缩。

六、总结

卷积网络在本质上是一种输入到输出的映射，它能够学习大量的输入与输出之间的映射关系，而不需要任何输入和输出之间的精确的数学表达式，只要用已知的模式对卷积网络加以训练，网络就具有输入输出对之间的映射能力。

CNN一个非常重要的特点就是头重脚轻（越往输入权值越小，越往输出权值越多），呈现出一个倒三角的形态，这就很好地避免了BP神经网络中反向传播的时候梯度损失得太快。

卷积神经网络CNN主要用来识别位移、缩放及其他形式扭曲不变性的二维图形。由于CNN的特征检测层通过训练数据进行学习，所以在使用CNN时，避免了显式的特征抽取，而隐式地从训练数据中进行学习；再者由于同一特征映射面上的神经元权值相同，所以网络可以并行学习，这也是卷积网络相对于神经元彼此相连网络的一大优势。卷积神经网络以其局部权值共享的特殊结构在语音识别和图像处理方面有着独特的优越性，其布局更接近于实际的生物神经网络，权值共享降低了网络的复杂性，特别是多维输入向量的图像可以直接输入网络这一特点避免了特征提取和分类过程中数据重建的复杂度。

参考资料

大白话讲解卷积神经网络工作原理
一文让你理解什么是卷积神经网络
有关CNN网络结构的总结

有关 d盘的windowsapps 文件夹是否可以删除？系着秋天的落叶� 电脑 windows
关于D:\WindowsApps文件夹1.是否可以直接删除？不能随便删除：WindowsApps文件夹受系统保护，其内容主要是UWP(UniversalWindowsPlatform)应用和微软商店安装的程序。如果你强行删除，可能导致某些应用无法正常运行。权限问题：即使你尝试删除，也可能会遇到权限不足的问题，因为系统默认不允许用户直接操作这个文件夹。2.如何判断是否可以删除？你知道该文件夹内容无用
GPT-2源码实现及GPT-3、GPT-3.5、GPT-4及GPT-5内幕解析(二) 段智华深入理解 ChatGPT ChatGPT国内 OpenAI GPT-3 GPT-4
GPT-2源码实现及GPT-3、GPT-3.5、GPT-4及GPT-5内幕解析(二)Gavin大咖微信：NLP_Matrix_Space5.2GPT-2源码实现逐行解析本节讲解GPT-2源码，gpt2.py是一个使用NumPy实现的代码，在代码中实现了GELU激活函数、softmax函数、层归一化、线性层、前馈神经网络、多头自注意力机制、Transformer块、GPT2模型以及文本生成函数，通过
PyTorch实现DARTS：可微分架构搜索指南余伊日Estra
PyTorch实现DARTS：可微分架构搜索指南pt.darts项目地址:https://gitcode.com/gh_mirrors/pt/pt.darts项目介绍PyTorchImplementationofDARTS（简称pt.darts）是一个基于PyTorch框架的DARTS算法实现库。DARTS（DifferentiableArchitectureSearch）是一种创新的神经网络架构
神经网络与深度学习入门：理解ANN、CNN和RNN shandianfk_com ChatGPT AI 神经网络深度学习 cnn
在现代科技日新月异的今天，人工智能已经成为了我们生活中的重要组成部分。无论是智能手机的语音助手，还是推荐系统，背后都有一项核心技术在支撑，那就是神经网络与深度学习。今天，我们就来聊一聊这个听起来高大上的话题，其实它也没那么难懂！什么是神经网络？首先，我们要了解什么是神经网络。神经网络（ArtificialNeuralNetwork，简称ANN）是模拟人脑神经元连接方式的一种算法。它由一层层的“神经
深度学习与搜索引擎优化的结合：DeepSeek的创新与探索 m0_74825634 面试学习路线阿里巴巴深度学习搜索引擎人工智能
目录引言1.传统搜索引擎的局限性2.深度学习在搜索引擎中的作用3.DeepSeek实现搜索引擎优化的关键技术3.1神经网络与搜索引擎优化3.2自然语言处理与查询理解3.3深度强化学习与搜索结果排序4.DeepSeek的深度学习架构4.1?查询解析与语义理解4.2?搜索排名与相关性排序4.3?个性化推荐与用户行为分析5、总结引言随着人工智能（AI）技术的迅速发展，深度学习（DeepLearning）
深度学习入门篇--来瞻仰卷积神经网络的鼻祖LeNet 智算学术深度学习图像分类篇深度学习
B站视频讲解:深度学习入门篇:使用pytorch搭建LeNet网络并代码详解实战前言大家在学习神经网络的时候肯定会有这样的感受,有很多的文章和视频,有的文章也很好,但是总是不成体系,总是学起来东一榔锤,西一棒槌的,在这种情况下,我会给大家更新深度学习系列的技术文章,轮椅级持续更新技术干货,别问为什么是轮椅级,因为保姆级已经过时了!前置基础知识储备:python/pytorch/神经网络基础知识概念
轻量级网络设计原理与代码实战案例讲解 AI天才研究院 AI大模型企业级应用开发实战 DeepSeek R1 &大数据AI人工智能大模型计算计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
轻量级网络设计原理与代码实战案例讲解作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着深度学习在各个领域的广泛应用，神经网络模型变得越来越庞大和复杂。然而，大规模模型在计算资源、存储空间以及推理速度方面提出了更高的要求，这在移动设备、嵌入式系统等资源受限的环境中尤为明显。为了解决这一问题，轻量级网络设计应运而生。1.2研
YOLOv12：以注意力为中心的物体检测那雨倾城 PiscTrace YOLO 机器学习目标检测深度学习图像处理
YOLOv12是YOLO系列中的最新版本，它引入了一种以注意力为中心的架构，旨在进一步提升物体检测的精度和速度。相比以往的YOLO模型，YOLOv12摒弃了传统基于卷积神经网络（CNN）的结构，采用了全新的方法，融合了自注意力机制和高效的网络架构优化，提供了一个高精度、低延迟的实时目标检测模型。1.主要功能YOLOv12在多个关键点进行了优化和创新，以下是它的主要功能：1.1区域注意机制(Regi
大模型学习完整路径（一站式汇总），从零基础到精通！新手友好级指南 Python程序员罗宾学习语言模型知识图谱人工智能数据库 java
如果读者朋友不想深入学习大模型，则了解提示词的使用原则也可以了。要是既不想深入学习，又要做大模型相关的项目，则对于工程同学来说，学习RAG也能把大模型玩转起来。前排提示，文末有大模型AGI-CSDN独家资料包哦！先来一张整体结构图，越是下面部分，越是基础：可以按以下步骤学习：1.理解基础概念需要了解深度学习的基本原理和常见术语，如神经网络、梯度下降、反向传播、监督学习、无监督学习、分类、回归、聚类
安全见闻8 2401_87248788 安全 sql
安全见闻8量子物理学基础了解量子力学的基本原理，如量子态、叠加态、纠缠等概念。学习量子力学的数学表达，包括波函数、算符等，以便更好地分析量子计算系统的特性。一、量子计算原理与技术掌握量子比特、量子门、量子电路等量子计算的核心概念。了解量子算法，特别是对传统密码学构成威胁的算法，如Shor算法。传统网络安全知识巩固传统加密算法、哈希函数、数字签名等网络安全技术。熟悉网络全架构、访问控制、漏洞管理等方
Python天梯赛10分题-念数字、求整数段和、比较大小、计算阶乘和重生之我要成为代码大佬 pythonPTA天梯赛算法 python 开发语言数据结构
007-念数字输入一个整数，输出每个数字对应的拼音。当整数为负数时，先输出fu字。十个数字对应的拼音如下：0:ling1:yi2:er3:san4:si5:wu6:liu7:qi8:ba9:jiu输入格式：输入在一行中给出一个整数，如：1234。提示：整数包括负数、零和正数。输出格式：在一行中输出这个整数对应的拼音，每个数字的拼音之间用空格分开，行末没有最后的空格。如yiersansi。输入样例：
SOUI基于Zint生成UPC码 ceffans windows c++
UPC码（UniversalProductCode，通用产品代码）是一种广泛使用的条形码系统，主要用于零售商品的标识和追踪。有两种主要格式：UPC-A和UPC-E。UPC-A长度12位数字。适用于大型商品UPC-E长度8位数字。UPC-E是UPC-A的压缩版本，适用于小型商品。校验码计算：UPC-A跟UPC-E的算法一样，从右往左将奇数位数据值3跟偶数位的值相加，10减去得到的值的个位数即为校验码
为什么词向量和权重矩阵dot运算就能得到想要的效果呢？ cjl30804 矩阵线性代数 nlp
最近在学习NLP算法的时候，进入到了深水区以后，发现了弄懂这个才是核心中的核心，抓住了主要矛盾了。特意拿出来跟大家分享。词向量（WordEmbeddings）和权重矩阵的点积运算之所以能够帮助我们实现特定的效果，主要是因为它们在神经网络架构中扮演的角色以及背后的数学原理。具体来说，在自然语言处理任务中，这种操作通常出现在如Transformer模型中的自注意力机制里。让我们深入探讨一下为什么这种方
浅显介绍图像识别的算法卷积神经网络（CNN）中的激活函数 cjl30804 算法 cnn 人工智能
激活函数的作用激活函数在神经网络中扮演着至关重要的角色，其主要作用包括但不限于以下几点：引入非线性：如果没有激活函数或仅使用线性激活函数，无论神经网络有多少层或多复杂，整个模型仍然只能表达线性映射。这意味着它无法学习和表示数据中的复杂模式。通过使用非线性的激活函数，如ReLU（修正线性单元）、Sigmoid、Tanh等，可以赋予神经网络学习复杂函数的能力。决定神经元是否被激活：激活函数根据输入信号
Engineering A Large Language Model From Scratch UnknownBody 语言模型人工智能自然语言处理
本文是LLM系列文章，针对《EngineeringALargeLanguageModelFromScratch》的翻译。从头开始设计一个大语言模型摘要1引言2Atinuke算法3结果4相关工作5讨论6结论摘要自然语言处理（NLP）中深度学习的激增导致了创新技术的发展和发布，这些技术能够熟练地理解和生成人类语言。Atinuke是一种基于Transformer的神经网络，通过使用独特的配置来优化各种语
深度学习（5）-卷积神经网络 yyc_audio 深度学习 cnn 人工智能
我们将深入理解卷积神经网络的原理，以及它为什么在计算机视觉任务上如此成功。我们先来看一个简单的卷积神经网络示例，它用干对MNIST数字进行分类。这个任务在第2章用密集连接网络做过，当时的测试精度约为97.8%。虽然这个卷积神经网络很简单，但其精度会超过第2章的密集连接模型。代码8-1给出了一个简单的卷积神经网络。它是conv2D层和MaxPooling2D层的堆叠，你很快就会知道这些层的作用。我们
深度学习（2)-深度学习关键网络架构 yyc_audio 人工智能机器学习深度学习
关键网络架构深度学习有4种类型的网络架构：密集连接网络、卷积神经网络、循环神经网络和Transformer。每种类型的模型都是针对特定的输入模式，网络架构包含了关于数据结构的假设，即模型搜索的假设空间。某种架构能否解决某个问题，完全取决于问题的数据结构与所选的网络架构假设之间是否匹配。这些不同类型的网络可以很容易组合起来，实现更大的多模式模型，就像拼乐高积木一样。某种程度上来说，深度学习的层就是信
Transformer大模型实战教师学生架构 AI智能涌现深度研究 DeepSeek R1 &大数据AI人工智能 Python入门实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
Transformer大模型实战教师学生架构作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来近年来，随着深度学习技术的飞速发展，自然语言处理（NLP）领域取得了显著的进步。其中，Transformer模型作为一种基于自注意力机制的深度神经网络结构，因其优越的性能和灵活的适用性，在NLP任务中得到了广泛应用。然而，Trans
LLM的MoE架构的“动态路由”为什么能训练出来？互联网之路. 知识点架构
互联网各领域资料分享专区(不定期更新)：Sheet正文大型语言模型（MoE）架构中的“动态路由”之所以能够被有效训练，关键在于其设计融合了可微分的路由机制、专家协同优化以及负载均衡约束。以下是具体原因和技术原理的解析：一、动态路由的可微分性与端到端优化门控网络的可训练性动态路由的核心是门控网络（GatingNetwork），它是一个可训练的神经网络，通过输入数据生成专家权重分布。例如，输入经过门控
解锁机器学习核心算法｜朴素贝叶斯：分类的智慧法则紫雾凌寒 AI 炼金厂 #机器学习算法机器学习算法分类朴素贝叶斯 python 深度学习人工智能
一、引言在机器学习的庞大算法体系中，有十种算法被广泛认为是最具代表性和实用性的，它们犹如机器学习领域的“十大神器”，各自发挥着独特的作用。这十大算法包括线性回归、逻辑回归、决策树、随机森林、K-近邻算法、K-平均算法、支持向量机、朴素贝叶斯算法、主成分分析（PCA）、神经网络。它们涵盖了回归、分类、聚类、降维等多个机器学习任务领域，是众多机器学习应用的基础和核心。而在这众多的算法中，朴素贝叶斯算法
Texas Instruments (TI) 系列：TIVA C 系列 (基于 ARM Cortex-M4)_（7）.TIVA C系列UART通信 kkchenkx 单片机开发 c语言 arm开发开发语言嵌入式硬件单片机
TIVAC系列UART通信1.UART通信原理UART（UniversalAsynchronousReceiver-Transmitter）是一种常见的串行通信接口，用于在两个设备之间传输数据。TIVAC系列单片机基于ARMCortex-M4内核，提供了多个UART模块，支持全双工通信。UART通信的基本原理如下：1.1异步通信UART通信是一种异步通信方式，这意味着发送方和接收方之间没有共享的时
深入探索连续变量量子神经网络：开启量子计算新纪元倪姿唯Kara
深入探索连续变量量子神经网络：开启量子计算新纪元quantum-neural-networksThisrepositorycontainsthesourcecodeusedtoproducetheresultspresentedinthepaper"Continuous-variablequantumneuralnetworks".Duetosubsequentinterfaceupgrades,
python-leetcode-二叉树的中序遍历 Joyner2018 leetcode 算法职场和发展
94.二叉树的中序遍历-力扣（LeetCode）方法1:递归实现#Definitionforabinarytreenode.#classTreeNode:#def__init__(self,val=0,left=None,right=None):#self.val=val#self.left=left#self.right=rightclassSolution:definorderTraversa
生成对抗网络(GAN)：从概念到代码实践(附代码) 全栈你个大西瓜人工智能计算机视觉人工智能 GAN 网络对抗学习手势识别生成器与鉴别器生成对抗网络
第一章：计算机视觉中图像的基础认知第二章：计算机视觉：卷积神经网络(CNN)基本概念(一)第三章：计算机视觉：卷积神经网络(CNN)基本概念(二)第四章：搭建一个经典的LeNet5神经网络(附代码)第五章：计算机视觉：神经网络实战之手势识别(附代码)第六章：计算机视觉：目标检测从简单到容易(附代码)第七章：MTCNN人脸检测技术揭秘：原理、实现与实战(附代码)第八章：探索YOLO技术：目标检测的高
MTCNN 人脸检测技术揭秘：原理、实现与实战(附代码) 全栈你个大西瓜人工智能计算机视觉人工智能 MTCNN 人脸检测卷积神经网络
第一章：计算机视觉中图像的基础认知第二章：计算机视觉：卷积神经网络(CNN)基本概念(一)第三章：计算机视觉：卷积神经网络(CNN)基本概念(二)第四章：搭建一个经典的LeNet5神经网络(附代码)第五章：计算机视觉：神经网络实战之手势识别(附代码)第六章：计算机视觉：目标检测从简单到容易(附代码)第七章：MTCNN人脸检测技术揭秘：原理、实现与实战(附代码)第八章：探索YOLO技术：目标检测的高
图解前馈神经网络（FNN） Zucker N 深度学习神经网络人工智能深度学习
目录编辑1.前馈神经网络介绍2.网络结构3.模型工作示例4.总结1.前馈神经网络介绍前馈神经网络（FeedforwardNeuralNetwork，FNN）是一种最简单、最经典的神经网络结构，它是人工神经网络的基础形式之一。前馈神经网络是一种信息只沿一个方向传播的神经网络。它由多个神经元（或称为节点）组成，这些神经元被组织成不同的层，包括输入层、隐藏层和输出层。信息从输入层开始，经过一层或多层隐藏
神经网络可视化工具 G鲲鹏展翅Y 神经网络人工智能深度学习
借鉴微信公众号：【超实用！】11款神经网络可视化工具，组会汇报、论文插图、科研学术必备01TensorSpace可以在网页上直接使用，是一种3D模型展示神经网络，适合给初学者或者科普的时候展示时使用，非常的直观，并且每一层的卷积层都可以展开，让你更加清晰的观察里面的内部结构地址：http://tensorspace.org02NN-SVG在它的主页上有三种神经网络，一种是FCNN，也就是全连接型的
对抗性提示（adversarial prompts） u013250861 LLM LLM
对抗性提示对抗性提示是提示工程中的一个重要主题，它可以帮助我们了解LLMs所涉及的风险和安全问题。对抗性提示也是一个重要的学科，可以识别这些风险并设计技术来解决这些问题。社区已经发现了许多不同类型的对抗性提示攻击，这些攻击涉及某种形式的提示注入。我们在下面提供这些示例的列表。当您构建LLMs时，重要的是要防止提示攻击，这些攻击可能会绕过安全防护栏并破坏模型的指导原则。我们将在下面介绍这方面的示例。
AI教父蒸馏论文曾被拒，如今DeepSeek引爆AI革命！极道Jdon javascript reactjs
蒸馏法最近上了新闻（！）是因为@deepseek_ai。其实蒸馏最初那篇论文《蒸馏神经网络中的知识》在2014年被NeurIPS拒了，理由是没啥新意（确实有点道理），还有就是觉得影响不大。附文：蒸馏神经网络中的知识作者：杰弗里·辛顿¹、奥里奥尔·维尼亚尔斯¹、杰夫·迪恩同行评审不同意见列表：这项工作与一般的投稿不同，可能会对NIPS社区的一部分产生重大影响。勉强低于接受门槛：这项工作是渐进式的，即
人工智能：从基础到前沿顾漂亮人工智能深度学习 windows
目录目录1.引言2.人工智能基础2.1什么是人工智能？2.2人工智能的历史2.3人工智能的分类3.机器学习3.1机器学习概述3.2监督学习3.3无监督学习3.4强化学习4.深度学习4.1深度学习概述4.2神经网络基础4.3卷积神经网络（CNN）4.4循环神经网络（RNN）5.自然语言处理（NLP）5.1NLP概述5.2文本预处理5.3词嵌入5.4语言模型6.计算机视觉6.1计算机视觉概述6.2图像
强大的销售团队背后竟然是大数据分析的身影蓝儿唯美数据分析
Mark Roberge是HubSpot的首席财务官，在招聘销售职位时使用了大量数据分析。但是科技并没有挤走直觉。大家都知道数理学家实际上已经渗透到了各行各业。这些热衷数据的人们通过处理数据理解商业流程的各个方面，以重组弱点，增强优势。 Mark Roberge是美国HubSpot公司的首席财务官，HubSpot公司在构架集客营销现象方面出过一份力——因此他也是一位数理学家。他使用数据分析
Haproxy+Keepalived高可用双机单活 bylijinnan 负载均衡 keepalived haproxy 高可用
我们的应用MyApp不支持集群，但要求双机单活（两台机器：master和slave）： 1.正常情况下，只有master启动MyApp并提供服务 2.当master发生故障时，slave自动启动本机的MyApp，同时虚拟IP漂移至slave，保持对外提供服务的IP和端口不变 F5据说也能满足上面的需求，但F5的通常用法都是双机双活，单活的话还没研究过服务器资源 10.7
eclipse编辑器中文乱码问题解决 0624chenhong eclipse乱码
使用Eclipse编辑文件经常出现中文乱码或者文件中有中文不能保存的问题，Eclipse提供了灵活的设置文件编码格式的选项，我们可以通过设置编码格式解决乱码问题。在Eclipse可以从几个层面设置编码格式：Workspace、Project、Content Type、File 本文以Eclipse 3.3（英文）为例加以说明： 1. 设置Workspace的编码格式： Windows-&g
基础篇--resources资源不懂事的小屁孩 android
最近一直在做java开发，偶尔敲点android代码，突然发现有些基础给忘记了，今天用半天时间温顾一下resources的资源。 String.xml 字符串资源涉及国际化问题 http://www.2cto.com/kf/201302/190394.html string-array
接上篇补上window平台自动上传证书文件的批处理问卷酷的飞上天空 window
@echo off : host=服务器证书域名或ip，需要和部署时服务器的域名或ip一致 ou=公司名称, o=公司名称 set host=localhost set ou=localhost set o=localhost set password=123456 set validity=3650 set salias=s
企业物联网大潮涌动：如何做好准备？蓝儿唯美企业
物联网的可能性也许是无限的。要找出架构师可以做好准备的领域然后利用日益连接的世界。尽管物联网（IoT）还很新，企业架构师现在也应该为一个连接更加紧密的未来做好计划，而不是跟上闸门被打开后的集成挑战。“问题不在于物联网正在进入哪些领域，而是哪些地方物联网没有在企业推进，” Gartner研究总监Mike Walker说。 Gartner预测到2020年物联网设备安装量将达260亿，这些设备在全
spring学习——数据库（mybatis持久化框架配置） a-john mybatis
Spring提供了一组数据访问框架，集成了多种数据访问技术。无论是JDBC，iBATIS(mybatis)还是Hibernate，Spring都能够帮助消除持久化代码中单调枯燥的数据访问逻辑。可以依赖Spring来处理底层的数据访问。 mybatis是一种Spring持久化框架，要使用mybatis，就要做好相应的配置： 1，配置数据源。有很多数据源可以选择，如：DBCP，JDBC，aliba
Java静态代理、动态代理实例 aijuans Java静态代理
采用Java代理模式，代理类通过调用委托类对象的方法，来提供特定的服务。委托类需要实现一个业务接口，代理类返回委托类的实例接口对象。按照代理类的创建时期，可以分为：静态代理和动态代理。所谓静态代理：　指程序员创建好代理类，编译时直接生成代理类的字节码文件。所谓动态代理：　在程序运行时，通过反射机制动态生成代理类。一、静态代理类实例： 1、Serivce.ja
Struts1与Struts2的12点区别 asia007 Struts1与Struts2
1) 在Action实现类方面的对比：Struts 1要求Action类继承一个抽象基类；Struts 1的一个具体问题是使用抽象类编程而不是接口。Struts 2 Action类可以实现一个Action接口，也可以实现其他接口，使可选和定制的服务成为可能。Struts 2提供一个ActionSupport基类去实现常用的接口。即使Action接口不是必须实现的，只有一个包含execute方法的P
初学者要多看看帮助文档不要用js来写Jquery的代码百合不是茶 jquery js
解析json数据的时候需要将解析的数据写到文本框中, 出现了用js来写Jquery代码的问题; 1, JQuery的赋值有问题代码如下: data.username 表示的是: 网易 $("#use
经理怎么和员工搞好关系和信任 bijian1013 团队项目管理管理
产品经理应该有坚实的专业基础，这里的基础包括产品方向和产品策略的把握，包括设计，也包括对技术的理解和见识，对运营和市场的敏感，以及良好的沟通和协作能力。换言之，既然是产品经理，整个产品的方方面面都应该能摸得出门道。这也不懂那也不懂，如何让人信服？如何让自己懂？就是不断学习，不仅仅从书本中，更从平时和各种角色的沟通
如何为rich:tree不同类型节点设置右键菜单 sunjing contextMenu tree Richfaces
组合使用target和targetSelector就可以啦，如下： <rich:tree id="ruleTree" value="#{treeAction.ruleTree}" var="node" nodeType="#{node.type}" selectionChangeListener=&qu
【Redis二】Redis2.8.17搭建主从复制环境 bit1129 redis
开始使用Redis2.8.17 Redis第一篇在Redis2.4.5上搭建主从复制环境，对它的主从复制的工作机制，真正的惊呆了。不知道Redis2.8.17的主从复制机制是怎样的，Redis到了2.4.5这个版本，主从复制还做成那样，Impossible is nothing! 本篇把主从复制环境再搭一遍看看效果，这次在Unbuntu上用官方支持的版本。 Ubuntu上安装Red
JSONObject转换JSON--将Date转换为指定格式白糖_ JSONObject
项目中，经常会用JSONObject插件将JavaBean或List<JavaBean>转换为JSON格式的字符串，而JavaBean的属性有时候会有java.util.Date这个类型的时间对象，这时JSONObject默认会将Date属性转换成这样的格式： {"nanos":0,"time":-27076233600000,
JavaScript语言精粹读书笔记 braveCS JavaScript
【经典用法】： //①定义新方法 Function .prototype.method=function(name, func){ this.prototype[name]=func; return this; } //②给Object增加一个create方法，这个方法创建一个使用原对
编程之美-找符合条件的整数用字符串来表示大整数避免溢出 bylijinnan 编程之美
import java.util.LinkedList; public class FindInteger { /** * 编程之美找符合条件的整数用字符串来表示大整数避免溢出 * 题目：任意给定一个正整数N，求一个最小的正整数M(M>1)，使得N*M的十进制表示形式里只含有1和0 * * 假设当前正在搜索由0，1组成的K位十进制数
读书笔记 chengxuyuancsdn 读书笔记
1、Struts访问资源 2、把静态参数传递给一个动作 3、<result>type属性 4、s:iterator、s:if c:forEach 5、StringBuilder和StringBuffer 6、spring配置拦截器 1、访问资源 (1)通过ServletActionContext对象和实现ServletContextAware,ServletReque
[通讯与电力]光网城市建设的一些问题 comsci 问题
信号防护的问题,前面已经说过了,这里要说光网交换机与市电保障的关系我们过去用的ADSL线路,因为是电话线,在小区和街道电力中断的情况下,只要在家里用笔记本电脑+蓄电池,连接ADSL,同样可以上网........
oracle 空间RESUMABLE daizj oracle 空间不足 RESUMABLE 错误挂起
空间RESUMABLE操作转 Oracle从9i开始引入这个功能，当出现空间不足等相关的错误时，Oracle可以不是马上返回错误信息，并回滚当前的操作，而是将操作挂起，直到挂起时间超过RESUMABLE TIMEOUT，或者空间不足的错误被解决。这一篇简单介绍空间RESUMABLE的例子。第一次碰到这个特性是在一次安装9i数据库的过程中，在利用D
重构第一次写的线程池 dieslrae 线程池 python
最近没有什么学习欲望,修改之前的线程池的计划一直搁置,这几天比较闲,还是做了一次重构,由之前的2个类拆分为现在的4个类. 1、首先是工作线程类:TaskThread,此类为一个工作线程,用于完成一个工作任务,提供等待(wait),继续(proceed),绑定任务(bindTask)等方法 #!/usr/bin/env python # -*- coding:utf8 -*-
C语言学习六指针 dcj3sjt126com c
初识指针，简单示例程序： /* 指针就是地址，地址就是指针地址就是内存单元的编号指针变量是存放地址的变量指针和指针变量是两个不同的概念但是要注意：通常我们叙述时会把指针变量简称为指针，实际它们含义并不一样 */ # include <stdio.h> int main(void) { int * p; // p是变量的名字， int *
yii2 beforeSave afterSave beforeDelete dcj3sjt126com delete
public function afterSave($insert, $changedAttributes) { parent::afterSave($insert, $changedAttributes); if($insert) { //这里是新增数据 } else { //这里是更新数据 } }
timertask shuizhaosi888 timertask
java.util.Timer timer = new java.util.Timer(true); // true 说明这个timer以daemon方式运行（优先级低， // 程序结束timer也自动结束），注意，javax.swing // 包中也有一个Timer类，如果import中用到swing包， // 要注意名字的冲突。 TimerTask task = new
Spring Security（13）——session管理 234390216 session Spring Security 攻击保护超时
session管理目录 1.1 检测session超时 1.2 concurrency-control 1.3 session 固定攻击保护
公司项目NODEJS实践0.3[ mongo / session ...] 逐行分析JS源代码 mongodb session nodejs
http://www.upopen.cn 一、前言书接上回，我们搭建了WEB服务端路由、模板等功能，完成了register 通过ajax与后端的通信，今天主要完成数据与mongodb的存取，实现注册 / 登录 /
pojo.vo.po.domain区别 LiaoJuncai java VO POJO javabean domain
　　POJO = "Plain Old Java Object"，是MartinFowler等发明的一个术语，用来表示普通的Java对象，不是JavaBean, EntityBean 或者 SessionBean。POJO不但当任何特殊的角色，也不实现任何特殊的Java框架的接口如，EJB， JDBC等等。　　　　即POJO是一个简单的普通的Java对象，它包含业务逻辑
Windows Error Code OhMyCC windows
0 操作成功完成. 1 功能错误. 2 系统找不到指定的文件. 3 系统找不到指定的路径. 4 系统无法打开文件. 5 拒绝访问. 6 句柄无效. 7 存储控制块被损坏. 8 存储空间不足, 无法处理此命令. 9 存储控制块地址无效. 10 环境错误. 11 试图加载格式错误的程序. 12 访问码无效. 13 数据无效. 14 存储器不足, 无法完成此操作. 15 系
在storm集群环境下发布Topology roadrunners 集群 storm topology spout bolt
storm的topology设计和开发就略过了。本章主要来说说如何在storm的集群环境中，通过storm的管理命令来发布和管理集群中的topology。 1、打包打包插件是使用maven提供的maven-shade-plugin，详细见maven-shade-plugin。 <plugin> <groupId>org.apache.maven.
为什么不允许代码里出现“魔数” tomcat_oracle java
　　在一个新项目中，我最先做的事情之一，就是建立使用诸如Checkstyle和Findbugs之类工具的准则。目的是制定一些代码规范，以及避免通过静态代码分析就能够检测到的bug。　　迟早会有人给出案例说这样太离谱了。其中的一个案例是Checkstyle的魔数检查。它会对任何没有定义常量就使用的数字字面量给出警告，除了-1、0、1和2。　　很多开发者在这个检查方面都有问题，这可以从结果
zoj 3511 Cake Robbery(线段树) 阿尔萨斯线段树
题目链接：zoj 3511 Cake Robbery 题目大意：就是有一个N边形的蛋糕，切M刀，从中挑选一块边数最多的，保证没有两条边重叠。解题思路：有多少个顶点即为有多少条边，所以直接按照切刀切掉点的个数排序，然后用线段树维护剩下的还有哪些点。 #include <cstdio> #include <cstring> #include <vector&

Deep-Learning之卷积神经网络（小白入门）

Deep-Learning之卷积神经网络（小白入门）

一、初识卷积神经网络（CNNs / ConvNets）

二、卷积神经网络的原理

1.数据输入层

2.卷积计算层

参数共享机制

3.激励层

4.池化层

5.全连接层

三、卷积神经网络之典型CNN & 常用框架

1.典型CNN

2.常用框架

四、 fine-tuning

五、一般结构 & 训练算法 & 优缺点 & 所遇问题

1.一般CNN结构依次为

2.卷积神经网络之训练算法

3.卷积神经网络之优缺点

4.问题

六、总结

参考资料

你可能感兴趣的:(神经网络+密码学（RSA）)