wffzxyl

【李宏毅ML笔记】19 CNN

CNN常被用于影像处理上，也可以用一般的Network来处理影像。

输入为图像转换而来的pixcel，输出可能为1000个类别，每一个neuro可以看做是一个classifier，层层进一步的判断当前是否是某种线条，纹理，图像片段等等，来做识别。

问题：当使用fully connected Network时，总会需要太多的参数。如100*100，彩色图像会有100*100*3个维度的图像，假设第一层hidden layer有1000个neutron，如何简化neutron来简化Network的架构，如某些weight就用不到，从一开始就删掉这neutron或权重。

为什么可以把一些参数拿掉，就可以做影像处理？

观察1 如果第一层layer就是侦测有没有某种pattern实现，大部分的pattern就比image小，只需要看imgae的一小部分就可以了。第一个hidden layer的某一个neutron侦测有没有鸟嘴的存在，只需要给neutron看红色小框框的一小部分就知道了。所以，每个neutron只需要连接到一小块区域就可以了。不需要链接完整的图。

观察2，同一个pattern，会出现在image中的不同的部分，但是代表不同的含义。如左上角的鸟嘴，中央的鸟嘴，其实只需要判断是否有鸟嘴即可。即不需要有两个neutron来对鸟嘴来判断出是左上角的鸟嘴还是中央的。所以，两个neutron使用共同的参数。

观察3，如对image可以做subsampling，即拿掉偶数列的pixel，不会影响判断。即减少image的pixel。

所以，如下，整个CNN架构，先通过Convolution，在做MaxPooling，再反复数次，即反复设置多个layer层次然后做flatten，然后丢到fully connected feedforword Network。

基于观察，作用Convolution和Max Pooling做左边如下几件事情：

下面介绍Convolution，

假设Network 的输入image为6*6,01代表是否有墨水，在convolution中有一堆filter，每一个都是一个Matrix，每个filter中的参数就是Network中的要学习的参数值parameters，类似于weight和bias。

假设每个filter都是3*3的黑白图片matrix（要学习的东西，类似于fully connected中的weight），则在图片中，只侦测3*3的部分的内容，判断是否出现某个pattern。即，使得pattern只看一部分图像，而不是全部，比如前面提到只看鸟嘴就可以了。

filter即感受视野，其中的权重w矩阵称为卷积核，stride叫做步长，感受视野越界时，需要对其做边界扩充。边界扩充值可以设置为0等。卷积核的权重w矩阵即神经网络layer的参数，卷积核可以附带一个便宜项b，初值可以随机初始化，在训练过程中会变化。

怎么做uperration？？呢？

将filter放到左上角（其实filter就是一个neutron，其中的9个值作为参数），需要做的，将0转为-1，将9个值做内积，

然后从左到右，从上到下，挪动filter的位置，挪动的距离叫做stride步幅，可以自己设定，可以计算得到多个filter与图像对应部分的内积。

这样，经过convolution的操作，将原先的6*6的matrix，转变为4*4的matrix。

如判断是否有pattern：斜线链接三个1，这样左上角和左下角位置都用一个pattern就可以侦测出来了。这样就考虑的propery2,

将filter1根imgae做匹配。

。

在convolution中，filter2与filter1有不同的参数，将filter2跟imgae从左到右，从上到下做convolution，做匹配，可以得到：

将底层红色的matrix，与上层蓝色的maxtrix合起来，当做feature map，有几个filter，如100个filter，就会得到100个image。

【feature map，特征映射图，为一个带有卷积核的感受视野扫描生成的下一层神经元矩阵，将原先的矩阵归纳并缩小了

一个feature map上的神经元使用的卷积核是相同的，共享卷积核的权重和偏置，一个feature map对应一个卷积核，即filter，若使用3个不同的卷积核，则得到3个feature map。因此训练的参数可以从6*6减少为4*4，如果有偏置，则加1，如果是3层的彩色，则乘以3倍

】

每个filtersize一样，如不同大小的鸟嘴，则不好处理。当你input一个image时，在cnn前面再做一个Network，可以处理数据，如将图像选装，处理。

如下，如果是彩色的matrix，则是好几个matrix叠加在一起，像一个立方体，此时，filter也是一个立方体，即其中一小部分。原input是3*3*6，则filte大小为3*3*3，则将每一部分的三层channel合并在一起看。

Convolution和fully connected的关系。

如下，convolution的事情，就是把fully connected的部分参数拿掉。一个filter就是一个fully connected拿掉一些weighted的结果。

具体，将6*6image拉直，有一个neutron的output是3，来源就是只只考虑了部分的左上角部分的pixel的值，并构成一个neutron。

x就是原图像左上角的值，weight就是filtter1的值（要学习的参数），neutron本来应该链接6*6=36个inputx值，但实际只链接9个只的pattern，此时就是用了前面提到的部分图像。

看上两幅图中的同样的weight代表同样的线条颜色，所以，右边3和-1，在原先的fullyconnected中有相同的weight。所以，使用Convolution之后，一方面只是用了部分的图像（部分输入input），而且不同的neutron实现了weights sharing

一般调用tookit，实际代码写法跟BP一样，有的位置的weight的值永远都是0，如何让不同的neutron的weights一样呢，即对不同的神经元，算出各自对应的gradient，然后将gradient平均，然后update所有的神经元的对应部分的weight的值。

然后是做Max Pooling，就是做subsampling。

接下来做的就是，对每个filter得到的feature map，将其中每一个进行分为4组，每一组可以选他们的平均，或最小或最大

实际Max后也可以微分，尽管是挑的最大、或最小，或平均。

所以，如下，对于原先的图像，做完一次convolution，和一次maxpolling，将6*6的变成了2*2的matrix，得到新的image，如下：

可以重复很多次，将小的，得到更小的image。

如果第一个CM，左上角有25个filter，做完一次convolution+MaxPooling，得到25个feature map，

如果第二层CM，也有25个filter，会不会得到25的平方的featuremap。因为feature map是cubic，第二层filter在考虑input时，会考虑input的深度的，不会分开考虑channel，会考虑所有的channel，所以前面输出25个feature map，后面输入25个feature map，并输出25个feature map。

最后flatten，将feature map拉直，可以丢到fully connected work。

在keras中如何使用CNN?

1 修改输入格式，从vector改为3-2tensor。Tensor就是高纬的vector/matrix。

2 修改网络结构，加入convolution和max pooling。

convolution2D(25,3,3)，25代表filter，3,3代表3*3的filter的matxi size。

input_shape(1,28,28),代表输入的是1黑白3彩色，28*28代表图像的打小，28*28个pixel。

Maxpooling2D((2,2))代表从feature map中拿出2*2的subsampling。

如下，

做convolution输出，建立25个filter（即神经元Neutron），得到的数目就是25个channel，因为filtersize是3*3，将原来的28*28变成了26*26，没有考虑成边边，也可以考虑，则自己补齐数据。

做激励层，因为卷积层的输出还是一个线性计算，一般使用relu函数将卷积层的输出进行一个非线性映射。

再做池化maxpooling，用来对卷积激励层的结果特征进行进一步的降维，输出深度不变。将每个filter分成2*2来做subsampling，做完之后变成25*13*13，池化视野即上文中的计算小矩阵值的方式，一般为max pooling或averagepooling。池化视野也会有步长stide。扫描方式一样。

【总结，卷积是用来获取部分特征矩阵，简化网络结构，简单化权重参数值，使其权重共享，激励层做非线性映射，池化层下采样做特征进一步的降维】

然后继续做convolution，可以设置不同的filter，如50个。13*13的matrix，通过3*3，则变成了2*2.可以继续做maxpoling。

则第一层convolution里有9个参数，第二层有3*3*25个参数，每个filter都是3*3的，高是25？？？？

最后拉直，addflatten，变成50*5*5维度的fully connected。

切分层，对图片进行切割，独立的对某一部分区域进行单独学习，可以对特定部分进行调整感受视野，进行力度更大的学习。

融合层，对且分层进行融合，也可以对不同大小的卷积核学到的特征进行融合。如在GoogleLeNet中。

全连接层：对特种进行重新拟合，减少特征信息的丢失。

输出层：做好最后目标结果的输出

Live Demo：

假设有25个filter？？，每个filter的size是3*3。1*28*28的维度的图像。经过3*3的方格选择，得到26*26的新的image，每个image的pixel都是由一个25维的vector来表示。即有25个filter，有25维的pixel。

在做subsampling变成13*13.....

dl就是黑盒子，intelligent就是你无法理解的，实际也可以分析。

下面讲CNN学到了什么？

第二层的CM，50*3*3，输入时上一次的输出，权重不知道是什么，也不知道它在做什么。其中的3*3的filter考虑的input不是原先的3*3的pixel，是之前的转换结果。分析方法：

问题：？filter是一层神经元的共享参数？那么设置多个filter用处是做什么？叠加feature map？

其中的每一个filter的convolution之后的output就是一个11*11的matrix。

判断第k个filter被启动激活的程度，使用11*11上的值的和来表示。

想找一个imgae，可以将第k个filter被activited的程度最大，即找x*。maxmize用gradient ascent，minsize用gradient descent做update。【没完全听懂】

以上是某种texture是在图上不断地反复，如第三个，是斜条纹在不停地反复，这是一个很小的范围。如果出现一个这样的一个值，这个filter就会被激活，degree就会变大。每个filter就是在detect某一种不同角度的线条或者纹路。

以上分析完convolution 和max Pooling

做flatten，丢到fully connected

下面分析fully connected【没完全明白】

定义第j个neutron，output为aj，找一个image x，将其丢入到fully Network中，可以将aj被maxmize。结果如下：

以上，刚才filter中观察到的是纹路，只是小小的一部分，在做flatten之后，每个neutron就是看整张图，所以，每个neutron最activited是一个完整的图形。

47分钟 - 54分钟没看懂，先略过。

Deep Dream

目标：夸大图像里面的内容，比如图像里有个石头，形状像狗熊，则经过训练好的神经网络以后，原先的图片里的石头会变成狗熊。

原理：利用CNN神经网络学习一系列图片时，将Network中的卷积层里的filter/全连接层里的隐藏层中的神经元的权重，大的变大，小的变小，这样可以夸大学到的东西。这样便可以将Network从狗熊的图像中中学到的东西，在输入带石头的图像时，会输出带狗熊的图像。

Deep Style，如下：左边是原先的图片，右边是参考的风格。

目标：input一张image，让machine去修改这张图片，使其拥有一种另外的风格，如梵高的风格。

原理：将原来的imgae丢给cnn，得到cnn的卷积核的output，该output代表这个image中有什么样的content。同理将呐喊这张图片也丢给cnn，此时考虑的不是卷积核的output，而是在意filter和filter之间output之间的correlation，这个相关性correlation代表这个哪行图片的style。最后，结合两张输入的相片输出一个新的相片，content（由卷积核output决定）像左边图，syle(不同卷积核之间的correlation)像右边图。即可以使得输入的左边图模仿了右边图的style。

CNN应用于Playing Go

实际上，任意一个Network，如fully-connected feedforward network，input是棋盘，output是下一步的落子位置。只是采用CNN的performance更好。

一般Net：input：19*19 vector，vector每一个dimension对应到棋盘上某一个位置，+1为白字，-1位黑子，0为无子，，一个19*19的vector，落子位置为1 。

若用CNN，则需要输入matrix，即将19*19的vector表示成19*19的matrix。类似于图像的形式。输入仍然为下一步的下子位置，一个19*19的matrix，落子位置为1 。

如AlphaGo的traing阶段：

这是supervized的阶段，实际还有增强学习的阶段。

什么时候可以用CNN呢？
存在image该有的特性架构，即三个观察，可以用CNN。围棋的特性跟image一样。

1. 在image上有些pattern比整张image小的多，但是起决定作用，Network只需要看到这部分内容即可做出判断。围棋一样，AlphaGo第一个filter就是5*5.

2. 同样的pattern会出现在不同的位置，但是他们会代表的是不同的信息意义。可以使用同一个detecter，来处理不同位置的pattern。

3. 对一个image做subsampling，从image中拿掉奇数列或者偶数列，仍然不会改变原样子。所以产生了max pooling. 但是对于AlphaGo怎么用怎么解释呢？在AlphaGo论文附录的CNN里，提到输入时19*19*48来表示的image，每个位置都是用48个value来描述。这些value包括dominant value，即这个位置是否处于 jiaochi的状态。19*19的image补上更多列，变成21*21个，用5*5的k个filter，stride设置为0，使用relu的activation，使用了2-12层，最后变为3*3的filter，步长依然为1......alphago没有用maxPooling

CNN用在语音识别中

将声音表示为Spectrogram，横轴是时间，纵轴是频率，即单位时间内的声音能量频率。通过频谱可以看出字来。可以将频谱作为图像，但是filter是长方形的，移动的时候，只移动竖着的方向，即频谱方向，因为在语音中，output会接LSTM、RNN等，无需再考虑时间了，用filter目的是为了同样的pattern出现在不同的位置，同样可以把它们识别出来。比如男生跟女生说的你好的pattern可能一样，但是时间频率长度不一样，所以，横坐标感觉意义不大。

所以在做CNN的应用时，要结合实际场景、特性去修订CNN。

自然语言处理。

输入一个word sequence，假设输出句子是积极的，还是消极的，则将每个单词改为一个vector，叫做word embeding，则将多个word的vector之后，则将其可以看错是一个矩阵，一个matrix，则制作一个filter，沿着句子方向移动，因为这个方向有意义，词与词之间有关联关系的，这里出现了一种pattern。在word embing上每个单词的含义是有意义的，所以无效。

PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
深度学习模型表征提取全解析 ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 深度学习人工智能 python embedding 语言模型
模型内部进行表征提取的方法在自然语言处理（NLP）中，“表征（Representation）”指将文本（词、短语、句子、文档等）转化为计算机可理解的数值形式（如向量、矩阵），核心目标是捕捉语言的语义、语法、上下文依赖等信息。自然语言表征技术可按“静态/动态”“有无上下文”“是否融入知识”等维度划分一、传统静态表征（无上下文，词级为主）这类方法为每个词分配固定向量，不考虑其在具体语境中的含义（无法解
【Qualcomm】高通SNPE框架简介、下载与使用 Jackilina_Stone 人工智能 Qualcomm SNPE
目录一高通SNPE框架1SNPE简介2QNN与SNPE3Capabilities4工作流程二SNPE的安装与使用1下载2Setup3SNPE的使用概述一高通SNPE框架1SNPE简介SNPE（SnapdragonNeuralProcessingEngine），是高通公司推出的面向移动端和物联网设备的深度学习推理框架。SNPE提供了一套完整的深度学习推理框架，能够支持多种深度学习模型，包括Pytor
深度学习篇---昇腾NPU&CANN 工具包 Atticus-Orion 上位机知识篇图像处理篇深度学习篇深度学习人工智能 NPU 昇腾 CANN
介绍昇腾NPU是华为推出的神经网络处理器，具有强大的AI计算能力，而CANN工具包则是面向AI场景的异构计算架构，用于发挥昇腾NPU的性能优势。以下是详细介绍：昇腾NPU架构设计：采用达芬奇架构，是一个片上系统，主要由特制的计算单元、大容量的存储单元和相应的控制单元组成。集成了多个CPU核心，包括控制CPU和AICPU，前者用于控制处理器整体运行，后者承担非矩阵类复杂计算。此外，还拥有AICore
深度学习图像分类数据集—桃子识别分类 AI街潜水的八角深度学习图像数据集深度学习分类人工智能
该数据集为图像分类数据集，适用于ResNet、VGG等卷积神经网络，SENet、CBAM等注意力机制相关算法，VisionTransformer等Transformer相关算法。数据集信息介绍：桃子识别分类：['B1','M2','R0','S3']训练数据集总共有6637张图片，每个文件夹单独放一种数据各子文件夹图片统计:·B1:1601张图片·M2:1800张图片·R0:1601张图片·S3:
NumPy-@运算符详解 GG不是gg numpy numpy
NumPy-@运算符详解一、@运算符的起源与设计目标1.从数学到代码：符号的统一2.设计目标二、@运算符的核心语法与运算规则1.基础用法：二维矩阵乘法2.一维向量的矩阵语义3.高维数组：批次矩阵运算4.广播机制：灵活的形状匹配三、@运算符与其他乘法方式的核心区别1.对比`np.dot()`2.对比元素级乘法`*`3.对比`np.matrix`的`*`运算符四、典型应用场景：从基础到高阶1.深度学习
NLP_知识图谱_大模型——个人学习记录 macken9999 自然语言处理知识图谱大模型自然语言处理知识图谱学习
1.自然语言处理、知识图谱、对话系统三大技术研究与应用https://github.com/lihanghang/NLP-Knowledge-Graph深度学习-自然语言处理(NLP)-知识图谱：知识图谱构建流程【本体构建、知识抽取（实体抽取、关系抽取、属性抽取）、知识表示、知识融合、知识存储】-元気森林-博客园https://www.cnblogs.com/-402/p/16529422.htm
解决 Python 包安装失败问题：以 accelerate 为例
在使用Python开发项目时，我们经常会遇到依赖包安装失败的问题。今天，我们就以accelerate包为例，详细探讨一下可能的原因以及解决方法。通过这篇文章，你将了解到Python包安装失败的常见原因、如何切换镜像源、如何手动安装包，以及一些实用的注意事项。一、问题背景在开发一个深度学习项目时，我需要安装accelerate包来优化模型的训练过程。然而，当我运行以下命令时：bash复制pipins
从RNN循环神经网络到Transformer注意力机制：解析神经网络架构的华丽蜕变熊猫钓鱼>_> 神经网络 rnn transformer
1.引言在自然语言处理和序列建模领域，神经网络架构经历了显著的演变。从早期的循环神经网络（RNN）到现代的Transformer架构，这一演变代表了深度学习方法在处理序列数据方面的重大进步。本文将深入比较这两种架构，分析它们的工作原理、优缺点，并通过实验结果展示它们在实际应用中的性能差异。2.循环神经网络（RNN）2.1基本原理循环神经网络是专门为处理序列数据而设计的神经网络架构。RNN的核心思想
如何使用Python实现交通工具识别
如何使用Python实现交通工具识别文章目录技术架构功能流程识别逻辑用户界面增强特性依赖项主要类别内容展示该系统是一个基于深度学习的交通工具识别工具，具备以下核心功能与特点：技术架构使用预训练的ResNet50卷积神经网络模型（来自ImageNet数据集）集成图像增强预处理技术（随机裁剪、旋转、翻转等）采用多数投票机制提升预测稳定性基于置信度评分的结果筛选策略功能流程用户通过GUI界面选择待识别图
Python OpenCV教程从入门到精通的全面指南【文末送书】一键难忘 python opencv 开发语言
文章目录PythonOpenCV从入门到精通1.安装OpenCV2.基本操作2.1读取和显示图像2.2图像基本操作3.图像处理3.1图像转换3.2图像阈值处理3.3图像平滑4.边缘检测和轮廓4.1Canny边缘检测4.2轮廓检测5.高级操作5.1特征检测5.2目标跟踪5.3深度学习与OpenCVPythonOpenCV从入门到精通【文末送书】PythonOpenCV从入门到精通OpenCV(Ope
第八周 tensorflow实现猫狗识别降花绘 365天深度学习 tensorflow系列 tensorflow 深度学习人工智能
本文为365天深度学习训练营内部限免文章（版权归K同学啊所有）**参考文章地址：[TensorFlow入门实战｜365天深度学习训练营-第8周：猫狗识别（训练营内部成员可读）]**作者：K同学啊文章目录一、本周学习内容:1、自己搭建VGG16网络2、了解model.train_on_batch（）3、了解tqdm，并使用tqdm实现可视化进度条二、前言三、电脑环境四、前期准备1、导入相关依赖项2、
深度学习实战-使用TensorFlow与Keras构建智能模型程序员Gloria Python超入门 TensorFlow python
深度学习实战-使用TensorFlow与Keras构建智能模型深度学习已经成为现代人工智能的重要组成部分，而Python则是实现深度学习的主要编程语言之一。本文将探讨如何使用TensorFlow和Keras构建深度学习模型，包括必要的代码实例和详细的解析。1.深度学习简介深度学习是机器学习的一个分支，使用多层神经网络来学习和表示数据中的复杂模式。其广泛应用于图像识别、自然语言处理、推荐系统等领域。
AI在垂直领域的深度应用：医疗、金融与自动驾驶的革新之路
AI在垂直领域的深度应用：医疗、金融与自动驾驶的革新之路一、医疗领域：AI驱动的精准诊疗与效率提升1.医学影像诊断AI算法通过深度学习技术，已实现对X光、CT、MRI等影像的快速分析，辅助医生检测癌症、骨折等疾病。例如，GoogleDeepMind的AI系统在乳腺癌筛查中，误检率比人类专家低9.4%；中国的推想医疗AI系统可在20秒内完成肺部CT扫描分析，为急诊救治争取黄金时间。2.药物研发传统药
专题：2025云计算与AI技术研究趋势报告|附200+份报告PDF、原数据表汇总下载
原文链接：https://tecdat.cn/?p=42935关键词：2025,云计算，AI技术，市场趋势，深度学习，公有云，研究报告云计算和AI技术正以肉眼可见的速度重塑商业世界。过去十年，全球云服务收入激增8倍，中国云计算市场规模突破6000亿元，而深度学习算法的应用量更是暴涨400倍。这些数字背后，是企业从“自建机房”到“云原生开发”的转型，是AI从“实验室”走向“产业级应用”的跨越。本报告
【深度学习解惑】在实践中如何发现和修正RNN训练过程中的数值不稳定？云博士的AI课堂大模型技术开发与实践哈佛博后带你玩转机器学习深度学习深度学习 rnn 人工智能 tensorflow pytorch 神经网络机器学习
在实践中发现和修正RNN训练过程中的数值不稳定目录引言与背景介绍原理解释代码说明与实现应用场景与案例分析实验设计与结果分析性能分析与技术对比常见问题与解决方案创新性与差异性说明局限性与挑战未来建议和进一步研究扩展阅读与资源推荐图示与交互性内容语言风格与通俗化表达互动交流1.引言与背景介绍循环神经网络(RNN)在处理序列数据时表现出色，但训练过程中常面临梯度消失和梯度爆炸问题，导致数值不稳定。当网络
【深度学习实战】当前三个最佳图像分类模型的代码详解云博士的AI课堂大模型技术开发与实践哈佛博后带你玩转机器学习深度学习深度学习人工智能分类模型机器学习 Transformer EfficientNet ConvNeXt
下面给出三个在当前图像分类任务中精度表现突出的模型示例，分别基于SwinTransformer、EfficientNet与ConvNeXt。每个模型均包含：训练代码（使用PyTorch）从预训练权重开始微调（也可注释掉预训练选项，从头训练）数据集目录结构：└──dataset_root├──buy#第一类图像└──nobuy#第二类图像随机拆分：80%训练，20%验证每个Epoch输出一次loss
第35周—————糖尿病预测模型优化探索
目录目录前言1.检查GPU2.查看数据编辑3.划分数据集4.创建模型与编译训练5.编译及训练模型6.结果可视化7.总结前言本文为365天深度学习训练营中的学习记录博客原作者：K同学啊1.检查GPUimporttorch.nnasnnimporttorch.nn.functionalasFimporttorchvision,torch#设置硬件设备，如果有GPU则使用，没有则使用cpudevice=
深度学习预备知识 AmazingMQ 深度学习人工智能
1.Tensor张量定义：张量（tensor）表示一个由数值组成的数组，这个数组可能有多个维度（轴）。具有一个轴的张量对应数学上的向量，具有两个轴的张量对应数学上的矩阵，具有两个以上轴的张量目前没有特定的数学名称。importtorch#arange创建一个行向量x，这个行向量包含以0开始的前12个整数。x=torch.arange(12)print("x=",x)#x=tensor([0,1,2
根茎式装配体（RA）作为下一代协同智能范式的理论、架构与应用由数入道人工智能思维框架软件工程智能体
一、引言——范式危机与新大陆的召唤1.1表征主义的黄昏：当前AI协同范式的认知天花板自艾伦·图灵在《计算机器与智能》中播下思想的种子以来，人工智能的漫长征途始终被一个强大而内隐的哲学范式所笼罩——我们称之为“表征主义”（Representationism）。这一范式，无论其外在形态如何演变，从早期的符号逻辑、专家系统，到如今风靡全球的深度学习神经网络，其核心信念从未动摇：智能的核心，在于构建一个关
Manus AI与多语言手写识别
ManusAI与多语言手写识别背景与概述手写识别技术的发展现状与挑战ManusAI的核心技术与应用场景多语言手写识别的市场需求与难点ManusAI的技术架构深度学习在手写识别中的应用多语言支持的模型设计数据预处理与特征提取方法多语言手写识别的关键挑战不同语言字符的多样性处理上下文语义与书写风格适应性低资源语言的训练数据获取解决方案与优化策略迁移学习在多语言任务中的应用端到端模型的优化与轻量化用户反
基于LIDC-IDRI肺结节肺癌数据集的人工智能深度学习分类良性和恶性肺癌（Python 全代码）全流程解析（二）
基于LIDC-IDRI肺结节肺癌数据集的人工智能深度学习分类良性和恶性肺癌（Python全代码）全流程解析（二）1环境配置和数据集预处理1.1环境配置1.1数据集预处理2深度学习模型训练和评估2.1深度学习模型训练2.1深度学习模型评估笑话一则开心一下喽完整代码如下：模型文件如下深度学习模型讲解---待续第一部分内容的传送门第三部分传送门1环境配置和数据集预处理1.1环境配置环境配置建议使用ana
深度学习交互式图像分割技术演进与突破 wang1776866571 深度学习交互式分割深度学习人工智能交互式分割
说明本文为作者读研期间基于交互式图像分割领域公开文献的系统梳理与个人理解总结，所有内容均为原创撰写（ai辅助创作），未直接复制或抄袭他人成果。文中涉及的算法、模型及实验结论均参考自领域内公开发表的学术论文（具体文献见文末参考文献列表）。本文旨在为交互式图像分割领域的学习者提供一份结构化的综述参考，内容涵盖技术演进、核心方法、关键技术优化及应用前景，希望能为相关研究提供启发。摘要：本文系统综述了基于
前沿交叉：Fluent与深度学习驱动的流体力学计算体系 m0_75133639 流体力学深度学习人工智能航空航天 fluent 流体力学材料科学 CFD
基础模块流体力学方程求解1、不可压缩N-S方程数值解法（有限差分/有限元/伪谱法）·Fluent工业级应用：稳态/瞬态流、两相流仿真（圆柱绕流、入水问题）·Tecplot流场可视化与数据导出2、CFD数据的AI预处理·基于PCA/SVD的流场数据降维·特征值分解与时空特征提取深度学习核心3.物理机理嵌入的神经网络架构·物理信息神经网络（PINN）：将N-S方程嵌入损失函数（JAX框架实现）·神经常
如何使用目标检测深度学习框架yolov8训练钢管管道表面缺陷VOC+YOLO格式1159张3类别的检测数据集步骤和流程 FL1623863129 深度学习目标检测深度学习 YOLO
【数据集介绍】数据集中有很多增强图片，大约300张为原图剩余为增强图片数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：1159标注数量(xml文件个数)：1159标注数量(txt文件个数)：1159标注类别数：3所在仓库：firc-dataset标注类别名称(注意yo
2025年人工智能、虚拟现实与交互设计国际学术会议学术小八学术人工智能 vr 交互
重要信息官网：www.aivrid.com时间：2025年10月17-19日地点：中国-东莞部分介绍征稿主题包括但不限于：生物特征模式识别机器视觉专家系统深度学习智能搜索自动编程智能控制智能机器人系统组件虚拟现实平台用于VR/AR的AI平台数据和生成、操作、分析和验证浸入式环境和虚拟世界的生成优化和现实的渲染人工智能与用户体验个性化推荐系统情感计算与用户响应虚拟现实与沉浸式技术沉浸式环境设计交互设
机器学习深度学习驱动在光子学设计中的应用与未来【专题培训会议邀您共探科技前沿】软研科技信息与通信信号处理量子计算人工智能
一、背景介绍在智能科技飞速发展的今天，光子学设计与智能算法的结合正成为科研创新的热点。深度学习、机器学习等算法在光子器件的逆向设计、超构表面材料设计、光学神经网络构建等方面展现出巨大潜力。二、会议亮点由北京软研国际信息技术研究院主办的“智能算法驱动的光子学设计与应用”专题培训会议，将深入探讨以下核心内容：光子器件的逆向设计：利用深度学习优化多参数光子器件设计。超构表面与超材料设计：智能算法在新型光
【第三章:神经网络原理详解与Pytorch入门】02.深度学习框架PyTorch入门-(4)Pytorch实战 IT古董人工智能课程深度学习神经网络 pytorch
第三章:神经网络原理详解与Pytorch入门第二部分：深度学习框架PyTorch入门第四节：Pytorch模型构建内容：如何搭建复杂网络以及如何修改模型与保存一、构建复杂神经网络结构在PyTorch中，构建复杂模型通常通过继承nn.Module类，分模块组织层与前向传播逻辑。示例：自定义一个卷积神经网络（CNN）importtorch.nnasnnimporttorch.nn.functional
探秘AI大模型：一键获取深度学习精华-PPT全面解读曹筱习Dwayne
探秘AI大模型：一键获取深度学习精华-PPT全面解读【下载地址】AI大模型PPT资源下载本仓库提供了一个名为“ai大模型ppt”的资源文件下载。该资源文件详细介绍了AI大模型的相关内容，包括但不限于AI大模型的定义、应用场景、技术架构、发展趋势等。通过这份PPT，您可以深入了解AI大模型的核心概念和实际应用，为您的学习和研究提供有力支持项目地址:https://gitcode.com/open-s
人工智能基础知识PPT课件智慧化智能化数字化方案方案解读馆人工智能入门人工智能学习人工智能课件人工智能PPT
人工智能基础知识定义与概念：人工智能是研究、开发用于模拟、延伸和扩展人类智能行为的综合性科学，其目的是让计算机系统具备执行人类智能任务的能力。涉及计算机科学、数学等多学科，研究对象是让系统具备智能，智能包括认知、适应和自主能力等维度。学派与方法学派：有符号主义、联结主义、行为主义等学派，分别从不同角度研究人工智能。方法：包括基于知识、学习和仿生的方法，如专家系统、机器学习、深度学习等。分类与发展分
Spring的注解积累 yijiesuifeng spring 注解
用注解来向Spring容器注册Bean。需要在applicationContext.xml中注册： <context:component-scan base-package=”pagkage1[,pagkage2,…,pagkageN]”/>。如：在base-package指明一个包 <context:component-sc
传感器百合不是茶 android 传感器
android传感器的作用主要就是来获取数据,根据得到的数据来触发某种事件下面就以重力传感器为例; 1,在onCreate中获得传感器服务 private SensorManager sm;// 获得系统的服务 private Sensor sensor;// 创建传感器实例 @Override protected void
[光磁与探测]金吕玉衣的意义 comsci
这是一个古代人的秘密:现在告诉大家信不信由你们: 穿上金律玉衣的人,如果处于灵魂出窍的状态,可以飞到宇宙中去看星星这就是为什么古代
精简的反序打印某个数沐刃青蛟打印
以前看到一些让求反序打印某个数的程序。比如：输入123，输出321。记得以前是告诉你是几位数的，当时就抓耳挠腮，完全没有思路。似乎最后是用到%和/方法解决的。而今突然想到一个简短的方法，就可以实现任意位数的反序打印（但是如果是首位数或者尾位数为0时就没有打印出来了）代码如下： long num, num1=0;
PHP：6种方法获取文件的扩展名 IT独行者 PHP 扩展名
PHP：6种方法获取文件的扩展名 1、字符串查找和截取的方法 1 $extension = substr ( strrchr ( $file , '.' ), 1); 2、字符串查找和截取的方法二 1 $extension = substr
面试111 文强chu 面试
1事务隔离级别有那些，事务特性是什么（问到一次） 2 spring aop 如何管理事务的，如何实现的。动态代理如何实现，jdk怎么实现动态代理的，ioc是怎么实现的，spring是单例还是多例，有那些初始化bean的方式，各有什么区别（经常问） 3 struts默认提供了那些拦截器（一次） 4 过滤器和拦截器的区别（频率也挺高） 5 final，finally final
XML的四种解析方式小桔子 dom jdom dom4j sax
在平时工作中，难免会遇到把 XML 作为数据存储格式。面对目前种类繁多的解决方案，哪个最适合我们呢？在这篇文章中，我对这四种主流方案做一个不完全评测，仅仅针对遍历 XML 这块来测试，因为遍历 XML 是工作中使用最多的（至少我认为）。　　预备　　测试环境：　　AMD 毒龙1.4G OC 1.5G、256M DDR333、Windows2000 Server
wordpress中常见的操作 aichenglong 中文注册 wordpress 移除菜单
1 wordpress中使用中文名注册解决办法 1)使用插件 2)修改wp源代码进入到wp-include/formatting.php文件中找到 function sanitize_user( $username, $strict = false
小飞飞学管理-1 alafqq 管理
项目管理的下午题，其实就在提出问题（挑刺），分析问题，解决问题。今天我随意看下10年上半年的第一题。主要就是项目经理的提拨和培养。结合我自己经历写下心得对于公司选拔和培养项目经理的制度有什么毛病呢？ 1，公司考察，选拔项目经理，只关注技术能力，而很少或没有关注管理方面的经验，能力。 2，公司对项目经理缺乏必要的项目管理知识和技能方面的培训。 3，公司对项目经理的工作缺乏进行指
IO输入输出部分探讨百合不是茶 IO
//文件处理在处理文件输入输出时要引入java.IO这个包； /* 1，运用File类对文件目录和属性进行操作 2，理解流，理解输入输出流的概念 3，使用字节/符流对文件进行读/写操作 4，了解标准的I/O 5，了解对象序列化 */ //1，运用File类对文件目录和属性进行操作 //在工程中线创建一个text.txt
getElementById的用法 bijian1013 element
getElementById是通过Id来设置/返回HTML标签的属性及调用其事件与方法。用这个方法基本上可以控制页面所有标签，条件很简单，就是给每个标签分配一个ID号。返回具有指定ID属性值的第一个对象的一个引用。语法： &n
励志经典语录 bijian1013 励志人生
经典语录1: 哈佛有一个著名的理论：人的差别在于业余时间，而一个人的命运决定于晚上8点到10点之间。每晚抽出2个小时的时间用来阅读、进修、思考或参加有意的演讲、讨论，你会发现，你的人生正在发生改变，坚持数年之后，成功会向你招手。不要每天抱着QQ/MSN/游戏/电影/肥皂剧……奋斗到12点都舍不得休息，看就看一些励志的影视或者文章，不要当作消遣；学会思考人生，学会感悟人生
[MongoDB学习笔记三]MongoDB分片 bit1129 mongodb
MongoDB的副本集(Replica Set)一方面解决了数据的备份和数据的可靠性问题，另一方面也提升了数据的读写性能。MongoDB分片(Sharding)则解决了数据的扩容问题，MongoDB作为云计算时代的分布式数据库，大容量数据存储，高效并发的数据存取，自动容错等是MongoDB的关键指标。本篇介绍MongoDB的切片(Sharding) 1.何时需要分片 &nbs
【Spark八十三】BlockManager在Spark中的使用场景 bit1129 manager
1. Broadcast变量的存储，在HttpBroadcast类中可以知道 2. RDD通过CacheManager存储RDD中的数据，CacheManager也是通过BlockManager进行存储的 3. ShuffleMapTask得到的结果数据，是通过FileShuffleBlockManager进行管理的，而FileShuffleBlockManager最终也是使用BlockMan
yum方式部署zabbix ronin47 yum方式部署zabbix
安装网络yum库#rpm -ivh http://repo.zabbix.com/zabbix/2.4/rhel/6/x86_64/zabbix-release-2.4-1.el6.noarch.rpm 通过yum装mysql和zabbix调用的插件还有agent代理#yum install zabbix-server-mysql zabbix-web-mysql mysql-
Hibernate4和MySQL5.5自动创建表失败问题解决方法 byalias J2EE Hibernate4
今天初学Hibernate4，了解了使用Hibernate的过程。大体分为4个步骤： ①创建hibernate.cfg.xml文件 ②创建持久化对象 ③创建*.hbm.xml映射文件 ④编写hibernate相应代码在第四步中，进行了单元测试，测试预期结果是hibernate自动帮助在数据库中创建数据表，结果JUnit单元测试没有问题，在控制台打印了创建数据表的SQL语句，但在数据库中
Netty源码学习-FrameDecoder bylijinnan java netty
Netty 3.x的user guide里FrameDecoder的例子，有几个疑问： 1.文档说：FrameDecoder calls decode method with an internally maintained cumulative buffer whenever new data is received. 为什么每次有新数据到达时，都会调用decode方法？ 2.Dec
SQL行列转换方法 chicony 行列转换
create table tb(终端名称 varchar(10) , CEI分值 varchar(10) , 终端数量 int) insert into tb values('三星' , '0-5' , 74) insert into tb values('三星' , '10-15' , 83) insert into tb values('苹果' , '0-5' , 93)
中文编码测试 ctrain 编码
循环打印转换编码 String[] codes = { "iso-8859-1", "utf-8", "gbk", "unicode" }; for (int i = 0; i < codes.length; i++) { for (int j
hive 客户端查询报堆内存溢出解决方法 daizj hive 堆内存溢出
hive> select * from t_test where ds=20150323 limit 2; OK Exception in thread "main" java.lang.OutOfMemoryError: Java heap space 问题原因： hive堆内存默认为256M 这个问题的解决方法为：修改/us
人有多大懒，才有多大闲 (评论『卓有成效的程序员』) dcj3sjt126com 程序员
卓有成效的程序员给我的震撼很大，程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可以那么勤奋，每天都孜孜不倦得做着重复单调的工作。在看这本书之前，我属于勤奋的人，而看完这本书以后，我要努力变成懒惰的人。不要在去庞大的开始菜单里面一项一项搜索自己的应用程序，也不要在自己的桌面上放置眼花缭乱的快捷图标
Eclipse简单有用的配置 dcj3sjt126com eclipse
1、显示行号 Window -- Prefences -- General -- Editors -- Text Editors -- show line numbers 2、代码提示字符 Window ->Perferences，并依次展开 Java -> Editor -> Content Assist，最下面一栏 auto-Activation
在tomcat上面安装solr4.8.0全过程 eksliang Solr solr4.0后的版本安装 solr4.8.0安装
转载请出自出处： http://eksliang.iteye.com/blog/2096478 首先solr是一个基于java的web的应用，所以安装solr之前必须先安装JDK和tomcat，我这里就先省略安装tomcat和jdk了第一步：当然是下载去官网上下载最新的solr版本，下载地址
Android APP通用型拒绝服务、漏洞分析报告 gg163 漏洞 android APP 分析
点评：记得曾经有段时间很多SRC平台被刷了大量APP本地拒绝服务漏洞，移动安全团队爱内测（ineice.com）发现了一个安卓客户端的通用型拒绝服务漏洞，来看看他们的详细分析吧。 0xr0ot和Xbalien交流所有可能导致应用拒绝服务的异常类型时，发现了一处通用的本地拒绝服务漏洞。该通用型本地拒绝服务可以造成大面积的app拒绝服务。针对序列化对象而出现的拒绝服务主要
HoverTree项目已经实现分层 hvt 编程 .net Web C#ASP.ENT
HoverTree项目已经初步实现分层，源代码已经上传到 http://hovertree.codeplex.com请到SOURCE CODE查看。在本地用SQL Server 2008 数据库测试成功。数据库和表请参考：http://keleyi.com/a/bjae/ue6stb42.htmHoverTree是一个ASP.NET 开源项目，希望对你学习ASP.NET或者C#语言有帮助，如果你对
Google Maps API v3: Remove Markers 移除标记天梯梦 google maps api
Simply do the following: I. Declare a global variable: var markersArray = []; II. Define a function: function clearOverlays() { for (var i = 0; i < markersArray.length; i++ )
jQuery选择器总结 lq38366 jquery 选择器
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40
基础数据结构和算法六：Quick sort sunwinner Algorithm Quicksort
Quick sort is probably used more widely than any other. It is popular because it is not difficult to implement, works well for a variety of different kinds of input data, and is substantially faster t
如何让Flash不遮挡HTML div元素的技巧_HTML/Xhtml_网页制作刘星宇 html Web
今天在写一个flash广告代码的时候，因为flash自带的链接，容易被当成弹出广告，所以做了一个div层放到flash上面，这样链接都是a触发的不会被拦截，但发现flash一直处于div层上面，原来flash需要加个参数才可以。让flash置于DIV层之下的方法，让flash不挡住飘浮层或下拉菜单，让Flash不档住浮动对象或层的关键参数：wmode=opaque。方法如下：
Mybatis实用Mapper SQL汇总示例 wdmcygah sql mysql mybatis 实用
Mybatis作为一个非常好用的持久层框架，相关资料真的是少得可怜，所幸的是官方文档还算详细。本博文主要列举一些个人感觉比较常用的场景及相应的Mapper SQL写法，希望能够对大家有所帮助。不少持久层框架对动态SQL的支持不足，在SQL需要动态拼接时非常苦恼，而Mybatis很好地解决了这个问题，算是框架的一大亮点。对于常见的场景，例如：批量插入/更新/删除，模糊查询，多条件查询，联表查询，

【李宏毅ML笔记】19 CNN

你可能感兴趣的:(深度学习)