weixin_33961829

AndrewNG Deep learning课程笔记 - CNN

参考，

An Intuitive Explanation of Convolutional Neural Networks

http://www.hackcv.com/index.php/archives/104/?hmsr=toutiao.io&utm_medium=toutiao.io&utm_source=toutiao.io

CNN基础

CNN网络主要用于compute vision

对于图片输入而言，是一种极高维度的数据，比如分辨率1000*1000*3的图，可能会产生3 billion的参数，这不太可行

所以我要使用convolutional NN来解决这种问题，

首先看看什么是卷积操作，

如下图，

原图片6*6

中间3*3的矩阵，称为filter或卷积核kernel，它表示你需要匹配的模式，这里detect edge，竖线

最右边4*4的矩阵，就是进行卷积操作后的结果

为何这个filter可以找出竖线，直观理解，filter找出左右存在色彩反差的区域或者找出由明转向暗的区域，如下图

实际中还有很多其他的filter，

但是其实在deep learning中，你不需要去手工设计或者选择filter，因为他们是学习的参数，可以通过模型学习到

可以看出用卷积可以大大减少需要学习的参数，

为什么卷积网络，可以用这么少的参数？

首先是参数共享

通过一个filter可以找出图片上任何位置的特征，如竖线

这样的好处是无论输入图片多大，参数size都是固定的，由filter本身决定

第二，稀疏链接

如果是全连接层，每个输出的每个维度都和输入的每个维度相关，所以需要很多的参数
而在卷积层，一个输出的某个维度如下图，是由输入中的9个feature算出的，而其他特征无关

这样需要的参数大大减少，同时也降低了过拟合

Padding

上面的卷积操作有两个问题，

每次卷积操作都会缩小图片的尺寸

会丢失边缘区域的特征

所以为了解决这些问题，padding就是把图片扩大一圈，用0填充

这样就有两种convolution操作，

valid就是no padding，结果大小的公式，n-f+1

same就是padding让输出结果大小不变，根据公式算，p=2的时候，就可以保证不变

这里描述filter一般都是odd，而不会是偶数，直观上讲，如果f是偶数，那么没法对称的padding，而且f是奇数是filter是有中心点的，这个很方便
所以filter一般都是3*3，5*5，7*7

strided convolution

对于convolution，除了调整filter size，padding，还可以调整stride的大小

可以每次滑动超过1步，那公式会变成如下，

cross-correlation VS convolution

在通信或数据中，convolution操作要先把filter，同时在横轴和竖轴上进行翻转，如图，

这样做的好处，是可以让convolution操作满足结合律

但是在DL中，我们其实没有做这种翻转，这种操作其实应该叫做cross-correlation

但是大家都习惯和默认称为convolution

convolutions on volumes

真实的图片有RBG三层，所以是立体的，这样如果进行convolution

输入数据的层数，称为depth或channel

当输入数据有3个channel，那么filter对应也需要有3个channel

如图，上面这个3*3*3的filter可以detect 红色的竖线

下面这个，可以detect 任意颜色的竖线

在实际使用中，需要同时detect多个feature，所以有多个filter，如下图

输出数据的channel数，取决于filter的数目

one layer of a convolutional network

那把卷积操作放到网络中的一层结构如下，

卷积再加上b，就完成了线性变换的部分，后面跟上非线性变换，就完成了一个神经单元

上图中的各个参数的表示如下，

给出一个完整的CNN的例子，

每层的结构，根据上面的公式很容易算出，卷积层只是做特征的提取和变换，最终输出前，还是需要fully connected，然后用logistics或softmax输出结果

CNN网络一般有三种layer组成，convolution层，pooling层，fully connected层

pooling layers

池化层，利用采样高效的降低维度和减少特征值

一般有最大和平均池化，这层是没有参数的

neural network example

卷积神经网络的结构比较复杂，而且超参数非常多，所以常用的方法是参考经典的网络结构

先看个例子，用于手写体数字识别，

如下图，总结下这个网络的结构，

能学到的规律，

首先，池化层没有参数，而卷积层的参数并不多，参数主要集中在全连接层

然后，CNN的经典结构就是，cov-pool-cov-pool-fc-fc-fc-softmax，几层cov和pool组合，加上几组fc层

再者，activation size是慢慢减少的，如果降低的太快会影响模型的性能

Case Studies

参考，https://zhuanlan.zhihu.com/p/22094600

比较直观看出各个网络的年代和性能差距

LeNet-5

该网络由作者名字LeCun命名，5代表五层模型

该网络，用于手写数字识别，用于灰度图片，所以图片channel为1

网络整体有60k的参数，比较小

用于当时没有padding技术，所以随着网络depth增加，size是不断变小，但是channel是不断变大的

网络结构被后续沿用，若干cov+pool + 若干fc + output

从原始图片1024个像素到最后一层FC的维度84，所以cnn关键就是抽象和提取特征

AlexNet

这个网络也是用作者名字命名的

AlexNet和LeNet其实比较像，就是规模大了许多，参数从60k到60m

只所以可以训练这么大的网络，是因为AlexNet在工程实践上利用的GPU

然后AlexNet，采用了Relu和dropout，最终把compute vision带到一个新世界

VGG

VGG网络是比AlexNet规模更大，更深的网络模型，参数达到138M之多

16表示有参数的layer有16层

VGG的特点是结构规整，工业化的思路，我们不去精巧的设计，依赖网络的规模和数据规模来解决问题

首先他用的Conv和Pool模块是固定的，

Conv是3*3，s=1，same

Pool是2*2，s=1

然后为了便于表示，在图中省略了Conv的参数，Conv 64 *2，表示2层卷积层，每层有64个filter

再者，

由于这里用same conv，所以conv是不会改变图片size的

全靠pooling层改变图片size，并且也很有规律

多个Same Conv后，会接一个Pool，这样picture的size减半，并且每个Pool后，加上的Conv层的channel都会double

所以还是符合size变小，channel变大的规律，只是更规整

Residual Networks（ResNets）

残差网络的本质是要解决网络太深后难以训练的问题，由于梯度消失或梯度爆炸

可以看到之前的网络也就十几层，而残差网络都是上百层，甚至上千层

所以残差网络效果好，不是有什么秘诀，因为更深的网络，更好的性能，这是理所当然的

只是之前的网络模型，在实践中无法训练到那么深

残差网络，是由residual block组成的，

residual block至少两层layer组成，

除了普通的main path，不同就是多了shotcut或skip connection

即，会把第一层的输入a1，叠加到第二层的激活函数前

所以第二层的输出，就从a2 = g(z2)，变成a2 = g(z2 + a1)

我们把很多的residual block 堆叠(stack)在一起，就形成residual network，如下图，

如图，把plain network变成ResNet，只需要给每两层加上shortcut，这样就可以解决plain network当layer数过大性能明显下降的问题

为什么残差网络可以帮助网络增加深度？

NG的观点是，因为residual block对网络是无副作用的

如下图，由于residual block的输出是a2 = g(z2 + a1)

那么只要让z2 = w2a1 + b2的参数，w2，b2趋于0(类似正则化)，那么a2=g(a1)，如果g是relu，那么g(a1)=a1，所以得到a2 = a1

而让参数为0这是很容易学习的

所以说residual block最差的情况就是，原封不动的传递输入，这样当然无论迭代多深都没有关系

但是，如果不是最差情况，能学到些东西，对网络就可以产生正向的帮助

这里residual block有个假设，就是z2 + a2，那么两者的size需要一样

如果不一样了？那这里需要增加一个参数，Ws用于把a2的size转成和z2一样

下图是个实际的例子，如何将一个plain的cnn，转化为一个ResNet网络

注意虚线的链接，表示经过pool，size变化后，需要进行size转换

Inception网络

inception各个版本对比

https://blog.csdn.net/xbinworld/article/details/61674836

inception的命名，是因为在盗梦空间，inception，中有一句台词，“we need to go to deeper”

所以可以看出，inception network或GoogleNet的主要目的，也是让网络更深

首先看下1*1 convolution，

1*1 convolution，其实就是单像素点，在各个channels上的线性组合

它的作用，

主要就是低成本的调节channel数，或depth；在不需要调整长宽的情况下，用3*3，5*5，比较耗费性能

再者，因为有relu输出，附带一层非线性效果

下面就看看啥是inception网络，

普通的convolution网络，你要选择用什么样的filter或是用pool层，选择困难怎么办？

Inception的思路就是，都用上，然后把结果stack在一起，让模型去决定

注意这里要保证输出的size一致，所以这里的pool是same pool，不会压缩尺寸，这是很特殊的pool用法

这个思路最大的问题就是计算量太大，那么这时我们的1*1 convolution就用上了

比如上面的例子，直接对输入做5*5 convolution，那么计算量120 million

用上1*1 convolution，先把depth降下来，再算5*5 convolution，这样计算量只有12 million左右，小十倍

可以看到，两个方法，输入和输出都是一样的，但用上1*1 convolution降低channel后，计算量大大降低

中间这层称为，bottleneck layer，使用恰当的情况下，降维优化并不会损失算法的performance

我个人的理解，由于1*1 convolution是各个channel的线性组合，加上适当数量的filter，并不会丢失太多的信息

Inception module

现在来看inception module就比较清楚了，

如图就是一个inception module，其中1*1 convolution都是用来调节depth的

比如MaxPool后面的，就把depth调节到32，避免pool的结果在最终stack中占太大的空间

而inception网络，就是inception module的堆叠，中间还会加上些红色的pool层来调节size

Object Detection

classification with localization

这个和普通图片分类的区别，就是除了给出类别，还要给出在图中的位置信息

看这个例子，除了要给出图片是哪一类，1，2，3，4，car是2

还要给出car的位置，bx，by，bh，bw

这里假设图片的坐标是，从(0,0)到(1,1)

这样就有5个输出，其他的和原来一样，还是交给模型去训练

具体实现如下，

这里的输出增加一个Pc，表示是否有object，0或1

bx到bw是代表object的位置

c1，c2，c3表示具体的类别

这里给出两个例子，一个是车的，一个是单纯背景无object的

注意，

loss function中，如果Pc=0，表示没有object，那么后面的值就没有意义，所以在算loss function的时候就不需要考虑，只需要算第一项的平方误差

上面是比较简单的位置的例子，还可以检测面部特征或体态特征这样的case，思路都是一样的，关键是定义清楚位置特征作为输出

当然关键是，你需要有相当的训练集

sliding windows object detection

如果一个图里面有多个对象怎么办，这个就是object detection

传统的方法就是，sliding windows object detection，很naive的方法

拿一个框去遍历裁剪图片，对每个裁剪下来的小图，做分类，是否有object，是什么object

这个方法的问题很明显，你如何定义裁剪尺寸，太大就没有意义，太小计算量就会非常大

传统的方法是用线性回归来做分类，性能还能接受，但是用cnn性能就不行了

上面的图，显示如何通过cnn进行分类，14*14*3是裁剪的小图片，通过conv层，pool层，然后FC层，最后softmax

为了优化，我们可以把整个分类的过程，都转化成conv层

比如，第一层FC，5*5*16，全连接到400的节点

我们也可以用400个5*5*16的filter，进行卷积，最终得到1*1*400，同样的效果

这样第二层FC，我们用400个1*1*16的filter来代替

最后softmax，用4个1*1*16的filter来代替

这称为，convolutional implementation

这样的好处，我们可以把遍历裁剪图片分类这个过程，通过一遍cnn计算搞定

比如，输入图片16*16*3，裁剪大小是14*14*3，如果遍历输入图片会产生4个小图片

这里我们不用对每个小图片分别采用conv计算，如果这样做会产生大量的重复计算

而只要整体的做一遍conv计算，如下图，最终得到2*2*4的输出，即一下输出4个裁剪小图片的结果，效率大大提高

但这个方法，我们仍然需要指定裁剪size，

但这样只能判断object是否在小图片中，无法给出更精确的位置信息；并且很有可能object无法完整的被任何裁剪小图包含

Yolo（you only look once）

Yolo的思路，既然上面单纯的分类无法找到精确边界，那我们加上classification and localization的部分

对每个图片同时给出分类和边界数据，

既然我们可以得到精确的边界，所以就没有必要用sliding window，直接用grid把图片切分就可以

对于下面的例子，我们把图片用3*3的grid划分，最终就得到3*3*8的结果

训练这个模型，我们也要按照这个格式给出训练集，比如上图中，给出绿色框和黄色框的数据作为实例

由于这里也用convolutional implementation的方式，使得计算非常高效，

所以训练集中，x表示输入图片，100*100*3，输出就是3*3*8

ok，这里明显的问题是

如果一个grid里面两个objects，怎么办？这个通过用小grid来降低概率，比如用19*19

反之，如果一个object比较大，占好几个grid怎么办？

我们只看，object的中心点，bx，by落在哪个grid，那么就认为object属于这个grid，即Pc为1，其他的grid仍然认为没有object

所以bx，by一定落在grid内，所以bx，by都是小于1的（grid的边界从0，0到1，1）

但是由于object是可能占多个格子的，所以bh，bw可能是大于1的

Intersection over union （IOU）

如何判断算出的bounding是否精确？

很简单，交并比

下图，红框是精确的bounding box，而紫色的算出的bounding box，想判断紫色的bounding box是否足够精确

Non-max suppression

用yolo算法的时候，

在准备训练集的时候，我们可以把一个车根据中心点放到一个grid中

但是在predict的时候，会有不止一个grid认为车在自己的grid中如图，并用Pc来表示概率

那么直接的想法，既然Pc表示概率，我们就选概率最大的，其他的都discard掉，就好了

如果图片中只有一个object，这个方法是可以的

但是如果有多辆车，我怎么知道哪些grid的bounding box是描述的同一辆车？

这里就要用到交并比，如果两个bounding box的IOU大于0.5，我们就认为是同一辆车

所以得到下面的方法，

首先discard掉所以Pc较小的grid

然后找到最大的Pc，然后删掉所有和它的IOU大于0.5的grid，这样一个object就保留了一个Pc最大的grid

如果还有grid剩下，说明有其他的object，再重复上面的过程一一找出

Anchor boxes

前面说了当用很小grid的时候，一个grid中有多个object的概率是很小的

但如果要在一个grid中detect两个object应该怎么做？

直接的想法是，我用8位的输出来detect一个object

那如果要detect两个，就用16位输出，分别表示两个object

比如下图，图片中人和车都在一个grid中，所以我们就用前8位表示人，后8位表示车

这样讲人可以理解，机器不行

所以我们要用机器可以理解的概念来定义人和车，

这里就是用anchor box，anchor box可以人手工设计，也可以用k-means去统计，比如人的平均边界，车的的平均边界

如下图，我们就用anchor box1代表人，anchor box2代表车

那么一个object到底是算哪个box？还是用交并比，和谁的交并比大就算谁

这个方法用起来比较麻烦，detect两个object就用16位输出，如果要detect多个object就要更多位的输出

而且还要指定和设计anchor box

然后如果grid中出现多于假设个数的object，就没办法处理

或者两个object的anchor box类似，也很难处理

Region proposals

除了，Yolo，还有另外一个思路来加速sliding windows object detection

region-cnn，思路就是对于sliding windows object detection，我们要遍历所有的裁剪图片去做分类，但是某些裁剪图片明显是没有任何东西的

所以，region-cnn会对图片做分块，segmentation，如最右图，这样只需要对不同的色块做分类即可

那么执行分类的candidate变少，性能就提高了

Face Recognition

Recognition可以分解成verification的问题，如果解决了verification的问题，那么Recognition只是遍历的问题

这里要注意的是，如果要在Recognition达到一定精度，verification的精度要提高几个量级

因为如果verification的精度99%，但库里面有100张图片，所以每次误差的叠加就会很高

One-shot training

在很多场景下，你不会有很多关于某个人的图片，可能只有一张图片作为训练集，当这个人再次出现时，你要能够认出他

这个用传统的cnn就无法解决，首先训练集太少，无法得到有效的网络

再者如果要识别的对象增加，比如新员工入职，你需要从新训练网络

所以采用的方法是，

Siamese network

具体的做法，就是通过cnn对图片进行encoding，比如下图，一张图片会编码成128位的向量（往往成为embedding）

那么训练目标，就是相同人的图片得到的embedding间的距离比较小，反之

Triplet loss

Triplet，顾名思义，一个训练集中有3个图片，anchor作为baseline，一个positive，和一个negative

很明显，

我们的目的就是，让d(A,P)小于d(A,N)，d是距离

光小于不够，要远小于，所以加上margin超参数alpha

形式化，

A和P的选择很简单，

对于N的选择，我们应该尽量选择和A相近的N，这样算法效率会更高，如果我们随机选择N，会让上面的约束很容易达到，会大大降低训练效率

除了triplet loss，也有其他的方法训练，siamese network ，比如下面的方法，把两个图片的embedding，作为logistics回归的输入，变成一个分类问题去训练

Neural sytle transfer

sytle transfer要做的如下图，

给出一张content图片C，一张style图片S，要的效果就是生成G

所以优化目标，J（G），由两部分组成，

J（C，G），表示G和C在content上的相似度

J（S，G），表示G和S在style上的相似度

下面就分别来定义这两个目标函数，

content cost function

判断内容是否相似比较直观，和前面脸部识别一样，我们只要把图片encoding成embedding，然后比较相似度就好

实际做，

找一个pre-trained的ConNet，选一层l的输出作为embedding，通常l不会太浅也不会太深，这样可以比较好的代表图片的内容

剩下的就是计算两个embedding的相似度

style cost function

关键是要找出，style是什么？

这里给出的定义是，对于某个layer，style是各个channel的相关系数

cnn中，某一层的各个channel是由不同的filter生成，filter可以理解代表某一种特征

直观理解，如果两个channel相关性高，说明其filters所代表的特征常常会同时出现，比如下图，中竖线和橘色两种特征

形式化定义，我们用style matrix，G[l]，来表示图片在第l层的风格，

G用来表示每个channel之间的关系，所以nc*nc大小的

k层channel和k‘层channel的相关系数，就是两层对应的每个位置数据的乘积和，也称为gram矩阵

直观上简化一下，如果数据只有0，1，如果两层不相干，乘积和会为0，只有相关才会同时出现1，这样相关系数才会大

那么上面就给出在l层上，S和G的style的cost function，其实就是计算S和G的style matrix的差异

最终J（S，G）会考虑所有layer上的风格矩阵的差异

你可能感兴趣的:(AndrewNG Deep learning课程笔记 - CNN)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
JavaScript 中，深拷贝（Deep Copy）和浅拷贝（Shallow Copy）跳房子的前端前端面试 javascript 开发语言 ecmascript
在JavaScript中，深拷贝（DeepCopy）和浅拷贝（ShallowCopy）是用于复制对象或数组的两种不同方法。了解它们的区别和应用场景对于避免潜在的bugs和高效地处理数据非常重要。以下是对深拷贝和浅拷贝的详细解释，包括它们的概念、用途、优缺点以及实现方式。1.浅拷贝（ShallowCopy）概念定义：浅拷贝是指创建一个新的对象或数组，其中包含了原对象或数组的基本数据类型的值和对引用数
100天持续行动—Day01 Richard_DL
今天开始站着学习，发现效率大幅提升。把fast.ai的Lesson1的后半部分和Lesson2看完了。由于Keras版本和视频中的不一致，运行notebook时经常出现莫名其妙的错误，导致自己只动手实践了视频中的一小部分内容。为了赶时间，我打算先把与CNN相关的视频过一遍。然后尽快开始做自己的项目。明天继续加油，争取把Lesson3和Lesson4看完。
yolov5＞onnx＞ncnn＞apk 图像处理大大大大大牛啊 opencv实战代码讲解 yolo onnx ncnn 安卓
一.yolov5pt模型转onnx条件：colabnotebookyolov51.安装环境!pipinstallonnx>=1.7.0#forONNXexport!pipinstallcoremltools==4.0#forCoreMLexport!pipinstallonnx-simplifier2.修改common.py在classFocus下面
深度 Qlearning：在直播推荐系统中的应用 AGI通用人工智能之禅程序员提升自我硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
深度Q-learning：在直播推荐系统中的应用关键词：深度Q-learning,强化学习,直播推荐系统,个性化推荐1.背景介绍1.1问题的由来随着互联网技术的飞速发展,直播平台如雨后春笋般涌现。面对海量的直播内容,用户很难快速找到自己感兴趣的内容。因此,个性化推荐系统在直播平台中扮演着越来越重要的角色。1.2研究现状目前,主流的个性化推荐算法包括协同过滤、基于内容的推荐等。这些方法在一定程度上缓
深度学习-点击率预估-研究论文2024-09-14速读 sp_fyf_2024 深度学习人工智能
深度学习-点击率预估-研究论文2024-09-14速读1.DeepTargetSessionInterestNetworkforClick-ThroughRatePredictionHZhong,JMa,XDuan,SGu,JYao-2024InternationalJointConferenceonNeuralNetworks,2024深度目标会话兴趣网络用于点击率预测摘要：这篇文章提出了一种新
计算机视觉中，Pooling的作用 Wils0nEdwards 计算机视觉人工智能
在计算机视觉中，Pooling（池化）是一种常见的操作，主要用于卷积神经网络（CNN）中。它通过对特征图进行下采样，减少数据的空间维度，同时保留重要的特征信息。Pooling的作用可以归纳为以下几个方面：1.降低计算复杂度与内存需求Pooling操作通过对特征图进行下采样，减少了特征图的空间分辨率（例如，高度和宽度）。这意味着网络需要处理的数据量会减少，从而降低了计算量和内存需求。这对大型神经网络
探索创新科技： Lite-Mono - 简约高效的小型化Mono框架杭律沛Meris
探索创新科技：Lite-Mono-简约高效的小型化Mono框架Lite-Mono[CVPR2023]Lite-Mono:ALightweightCNNandTransformerArchitectureforSelf-SupervisedMonocularDepthEstimation项目地址:https://gitcode.com/gh_mirrors/li/Lite-Mono如果你在寻找一个轻
探索未来，大规模分布式深度强化学习——深入解析IMPALA架构汤萌妮Margaret
探索未来，大规模分布式深度强化学习——深入解析IMPALA架构scalable_agent项目地址:https://gitcode.com/gh_mirrors/sc/scalable_agent在当今的人工智能研究前沿，深度强化学习（DRL）因其在复杂任务中的卓越表现而备受瞩目。本文要介绍的是一个开源于GitHub的重量级项目：“ScalableDistributedDeep-RLwithImp
云服务业界动态简报-20180128 Captain7
一、青云青云QingCloud推出深度学习平台DeepLearningonQingCloud，包含了主流的深度学习框架及数据科学工具包，通过QingCloudAppCenter一键部署交付，可以让算法工程师和数据科学家快速构建深度学习开发环境，将更多的精力放在模型和算法调优。二、腾讯云1.腾讯云正式发布腾讯专有云TCE(TencentCloudEnterprise)矩阵，涵盖企业版、大数据版、AI
机器学习VS深度学习 nfgo 机器学习
机器学习（MachineLearning,ML）和深度学习（DeepLearning,DL）是人工智能（AI）的两个子领域，它们有许多相似之处，但在技术实现和应用范围上也有显著区别。下面从几个方面对两者进行区分：1.概念层面机器学习：是让计算机通过算法从数据中自动学习和改进的技术。它依赖于手动设计的特征和数学模型来进行学习，常用的模型有决策树、支持向量机、线性回归等。深度学习：是机器学习的一个子领
ResNet的半监督和半弱监督模型 Valar_Morghulis
Billion-scalesemi-supervisedlearningforimageclassificationhttps://arxiv.org/pdf/1905.00546.pdfhttps://github.com/facebookresearch/semi-supervised-ImageNet1K-models/权重在timm中也有：https://hub.fastgit.org/r
联邦学习 Federated learning Google I/O‘19 笔记努力搬砖的星期五笔记联邦学习机器学习机器学习 tensorflow
FederatedLearning:MachineLearningonDecentralizeddatahttps://www.youtube.com/watch?v=89BGjQYA0uE文章目录FederatedLearning:MachineLearningonDecentralizeddata1.DecentralizeddataEdgedevicesGboard:mobilekeyboa
数据分析-24-时间序列预测之基于keras的VMD-LSTM和VMD-CNN-LSTM预测风速皮皮冰燃数据分析数据分析
文章目录1普通的LSTM模型1.1数据重采样1.2数据标准化1.3切分窗口1.4划分数据集1.5建立模型1.6预测效果2VMD-LSTM模型2.1VMD分解时间序列2.2对每一个IMF建立LSTM模型2.2.1IMF1—LSTM2.2.2IMF2-LSTM2.2.3统一代码2.3评估效果3CNN-LSTM模型3.1数据预处理3.2建立模型3.3效果预测4VMD-CNN-LSTM模型4.1VMD分解
PCL 怎样可视化深度图像 LeonDL168 PCL 计算机视觉人工智能视觉检测图像处理算法
本小节讲解如何可视化深度图像的两种方法，在3D视窗中以点云形式进行可视化（深度图像来源于点云），另一种是，将深度值映射为颜色，从而以彩色图像方式可视化深度图像。代码首先，在PCL（PointCloudLearning）中国协助发行的书提供光盘的第7章例2文件夹中，打开名为range_image_visualization.cpp的代码文件，同文件夹下可以找到相关的测试点云文件room_scan1.
基于深度学习的农作物病害检测 SEU-WYL 深度学习dnn 深度学习人工智能
基于深度学习的农作物病害检测利用卷积神经网络（CNN）、生成对抗网络（GAN）、Transformer等深度学习技术，自动识别和分类农作物的病害，帮助农业工作者提高作物管理效率、减少损失。1.农作物病害检测的挑战病害种类繁多：农作物病害的类型多样，不同病害在同一作物上的表现差异很大，同时同一种病害在不同生长阶段的症状也可能不同。环境影响：天气、光照、湿度等外部环境因素会影响农作物的表现，使得病害检
el-dialog高度设置夏之小星星前端 vue.js elementui css
el-dialog高度设置::v-deep.el-dialog{height:78vh;overflow:auto;}
elementuiPlus取消el-input的边框 qq_39016177 elementui
elementuiPlus取消el-input的边框1.通常取消边框的方法设置border为none2.还有其他类似边框的例如outlinebox-shadow这两个属性都是会产生边框效果3.el-input需要更改的话–如下需要修改box-shadow为空即可上代码:deep(.el-input__wrapper){align-items:center;background-color:#F7F
yolov5单目测距+速度测量+目标跟踪 cv_2025 YOLO 目标跟踪人工智能计算机视觉机器学习图像处理 opencv
要在YOLOv5中添加测距和测速功能，您需要了解以下两个部分的原理：单目测距算法单目测距是使用单个摄像头来估计场景中物体的距离。常见的单目测距算法包括基于视差的方法（如立体匹配）和基于深度学习的方法（如神经网络）。基于深度学习的方法通常使用卷积神经网络（CNN）来学习从图像到深度图的映射关系。单目测距代码单目测距涉及到坐标转换，代码如下：defconvert_2D_to_3D(point2D,R,
【双语新闻】AGI安全与对齐，DeepMind近期工作曲奇人工智能安全 agi 安全 llama 人工智能
我们想与AF社区分享我们最近的工作总结。以下是关于我们正在做什么，为什么会这么做以及我们认为它的意义所在的一些详细信息。我们希望这能帮助人们从我们的工作基础上继续发展，并了解他们的工作如何与我们相关联。byRohinShah,SebFarquhar,AncaDragan21stAug2024AIAlignmentForumWewantedtosharearecapofourrecentoutput
探索深度学习的奥秘：从理论到实践的奇幻之旅小周不想卷深度学习
目录引言：穿越智能的迷雾一、深度学习的奇幻起源：从感知机到神经网络1.1感知机的启蒙1.2神经网络的诞生与演进1.3深度学习的崛起二、深度学习的核心魔法：神经网络架构2.1前馈神经网络（FeedforwardNeuralNetwork,FNN）2.2卷积神经网络（CNN）2.3循环神经网络（RNN）及其变体（LSTM,GRU）2.4生成对抗网络（GAN）三、深度学习的魔法秘籍：算法与训练3.1损失
卷积神经网络（CNN）详细介绍及其原理详解（二） FFmpeg123 Pytorch cnn 深度学习人工智能
接上一文继续;五、全连接层假设还是上面人的脑袋的示例，现在我们已经通过卷积和池化提取到了这个人的眼睛、鼻子和嘴的特征，如果我想利用这些特征来识别这个图片是否是人的脑袋该怎么办呢？此时我们只需要将提取到的所有特征图进行“展平”，将其维度变为1×x1×x1×x，这个过程就是全连接的过程。也就是说，此步我们将所有的特征都展开并进行运算，最后会得到一个概率值，这个概率值就是输入图片是否是人的概率，这个过程
【AI大咖】再认识Yann LeCun，一个可能是拥有最多中文名的男人喜欢打酱油的老鸟再认识Yann LeCun 一个可能是拥有最多中文名的男人
https://www.toutiao.com/i6693678422733881860/上一期扒了扛起深度学习大旗的Hinton先生，今天聊一位他的学生，深度学习中CNN的崛起离不开的男人——YannLeCun。一位陪伴Hinton三十年磨一剑，最终笑傲AI界的法国人。让我们一起记住这张面孔。作者|小满言有三编辑|小满言有三130秒了解LeCunYannLeCun，CNN之父，纽约大学终身教授，
Awesome TensorFlow weixin_30594001 人工智能移动开发大数据
AwesomeTensorFlowAcuratedlistofawesomeTensorFlowexperiments,libraries,andprojects.Inspiredbyawesome-machine-learning.WhatisTensorFlow?TensorFlowisanopensourcesoftwarelibraryfornumericalcomputationusin
【ShuQiHere】探索人工智能核心：机器学习的奥秘 ShuQiHere 人工智能机器学习
【ShuQiHere】什么是机器学习？机器学习（MachineLearning,ML）是人工智能（ArtificialIntelligence,AI）中最关键的组成部分之一。它使得计算机不仅能够处理数据，还能从数据中学习，从而做出预测和决策。无论是语音识别、自动驾驶还是推荐系统，背后都依赖于机器学习模型。机器学习与传统的编程不同，它不再依赖于人类编写的固定规则，而是通过数据自我改进模型，从而更灵活
综述论文“A Survey of Zero-Shot Learning: Settings, Methods, and Applications” 硅谷秋水机器学习机器学习神经网络深度学习
该零样本学习综述，发表于ACMTrans.Intell.Syst.Technol.10,2,Article13(January2019)摘要：大多数机器学习方法着重于对已经在训练中看到其类别的实例进行分类。实际上，许多应用程序需要对实例进行分类，而这些实例的类以前没有见过。零样本学习（Zero-ShotLearning）是一种强大而有前途的学习范例，其中训练实例涵盖的类别与想分类的类别是不相交的。
机器学习 VS 表示学习 VS 深度学习 Efred.D 人工智能机器学习深度学习人工智能
文章目录前言一、机器学习是什么?二、表示学习三、深度学习总结前言本文主要阐述机器学习,表示学习和深度学习的原理和区别.一、机器学习是什么?机器学习(machinelearning),是从有限的数据集中学习到一定的规律,再把学到的规律应用到一些相似的样本集中做预测.机器学习的历史可以追溯到20世纪40年代McCulloch提出的人工神经元网络,目前学界大致把机器学习分为传统机器学习和机器学习两个类别
端到端的自动驾驶论文与代码整理大别山伧父自动驾驶
LearningbyCheatinggithubcodearxivpaperconferenceonrobotlearning最新进展(May2021)Checkoutourlatestfollow-upwork:WorldonRails(2020)Checkoutoursubmissiontothe2020CARLAChallenge!pass
TextCNN：文本卷积神经网络模型一只天蝎编程语言---Python cnn 深度学习机器学习
目录什么是TextCNN定义TextCNN类初始化一个model实例输出model什么是TextCNNTextCNN（TextConvolutionalNeuralNetwork）是一种用于处理文本数据的卷积神经网（CNN）。通过在文本数据上应用卷积操作来提取局部特征，这些特征可以捕捉到文本中的局部模式，如n-gram（连续的n个单词或字符）。定义TextCNN类importtorch.nnasn
影像设备国产替代究竟有多重要？这家企业提前布局8K时代 8K超高清科技媒体智能硬件人工智能
从过往看，国产替代不是一个新概念，更是一个从被动到主动的转变。1.“黑屏计划”与互联网2008年是特殊的一年。这一年，中国成为世界上最大的互联网国家。根据中国互联网络信息中心（CNNIC）统计数据显示，我国网民数达到2.98亿人，互联网普及率达22.6%。网民数量居世界第一位，平均每5个人中就有一个是网络公民。也是在PC互联网进入巅峰时期的这一年，中国网民们突然收到了一则通知，提及若Office用
怎么样才能成为专业的程序员？ cocos2d-x小菜编程 PHP
如何要想成为一名专业的程序员？仅仅会写代码是不够的。从团队合作去解决问题到版本控制，你还得具备其他关键技能的工具包。当我们询问相关的专业开发人员，那些必备的关键技能都是什么的时候，下面是我们了解到的情况。关于如何学习代码，各种声音很多，然后很多人就被误导为成为专业开发人员懂得一门编程语言就够了？！呵呵，就像其他工作一样，光会一个技能那是远远不够的。如果你想要成为
java web开发高并发处理 BreakingBad java Web 并发开发处理高
java处理高并发高负载类网站中数据库的设计方法（java教程,java处理大量数据，java高负载数据）一：高并发高负载类网站关注点之数据库没错,首先是数据库,这是大多数应用所面临的首个SPOF。尤其是Web2.0的应用，数据库的响应是首先要解决的。一般来说MySQL是最常用的，可能最初是一个mysql主机，当数据增加到100万以上，那么，MySQL的效能急剧下降。常用的优化措施是M-S（
mysql批量更新 ekian mysql
mysql更新优化：一版的更新的话都是采用update set的方式，但是如果需要批量更新的话，只能for循环的执行更新。或者采用executeBatch的方式，执行更新。无论哪种方式，性能都不见得多好。三千多条的更新，需要3分多钟。查询了批量更新的优化，有说replace into的方式，即： replace into tableName(id,status) values
微软BI（3） 18289753290 微软BI SSIS
1) Q：该列违反了完整性约束错误；已获得 OLE DB 记录。源:“Microsoft SQL Server Native Client 11.0” Hresult: 0x80004005 说明:“不能将值 NULL 插入列 'FZCHID'，表 'JRB_EnterpriseCredit.dbo.QYFZCH'；列不允许有 Null 值。INSERT 失败。”。 A：一般这类问题的存在是
Java中的List g21121 java
List是一个有序的 collection（也称为序列）。此接口的用户可以对列表中每个元素的插入位置进行精确地控制。用户可以根据元素的整数索引（在列表中的位置）访问元素，并搜索列表中的元素。与 set 不同，列表通常允许重复
读书笔记永夜-极光读书笔记
1. K是一家加工厂,需要采购原材料,有A,B,C,D 4家供应商,其中A给出的价格最低,性价比最高,那么假如你是这家企业的采购经理,你会如何决策? 传统决策: A:100%订单 B,C,D:0% &nbs
centos 安装 Codeblocks 随便小屋 codeblocks
1.安装gcc,需要c和c++两部分,默认安装下,CentOS不安装编译器的,在终端输入以下命令即可yum install gccyum install gcc-c++ 2.安装gtk2-devel,因为默认已经安装了正式产品需要的支持库,但是没有安装开发所需要的文档.yum install gtk2* 3. 安装wxGTK yum search w
23种设计模式的形象比喻 aijuans 设计模式
1、ABSTRACT FACTORY—追MM少不了请吃饭了，麦当劳的鸡翅和肯德基的鸡翅都是MM爱吃的东西，虽然口味有所不同，但不管你带MM去麦当劳或肯德基，只管向服务员说“来四个鸡翅”就行了。麦当劳和肯德基就是生产鸡翅的Factory 　　工厂模式：客户类和工厂类分开。消费者任何时候需要某种产品，只需向工厂请求即可。消费者无须修改就可以接纳新产品。缺点是当产品修改时，工厂类也要做相应的修改。如：
开发管理 CheckLists aoyouzi 开发管理 CheckLists
开发管理 CheckLists(23) -使项目组度过完整的生命周期开发管理 CheckLists(22) -组织项目资源开发管理 CheckLists(21) -控制项目的范围开发管理 CheckLists(20) -项目利益相关者责任开发管理 CheckLists(19) -选择合适的团队成员开发管理 CheckLists(18) -敏捷开发 Scrum Master 工作开发管理 C
js实现切换百合不是茶 JavaScript 栏目切换
js主要功能之一就是实现页面的特效,窗体的切换可以减少页面的大小,被门户网站大量应用思路: 1,先将要显示的设置为display:bisible 否则设为none 2,设置栏目的id ,js获取栏目的id,如果id为Null就设置为显示 3,判断js获取的id名字;再设置是否显示代码实现: html代码: <di
周鸿祎在360新员工入职培训上的讲话 bijian1013 感悟项目管理人生职场
这篇文章也是最近偶尔看到的，考虑到原博客发布者可能将其删除等原因，也更方便个人查找，特将原文拷贝再发布的。“学东西是为自己的，不要整天以混的姿态来跟公司博弈，就算是混，我觉得你要是能在混的时间里，收获一些别的有利于人生发展的东西，也是不错的，看你怎么把握了”，看了之后，对这句话记忆犹新。 &
前端Web开发的页面效果 Bill_chen html Web Microsoft
1.IE6下png图片的透明显示： <img src="图片地址" border="0" style="Filter.Alpha(Opacity)=数值(100),style=数值(3)"/> 或在<head></head>间加一段JS代码让透明png图片正常显示。 2.<li>标
【JVM五】老年代垃圾回收：并发标记清理GC(CMS GC) bit1129 垃圾回收
CMS概述并发标记清理垃圾回收(Concurrent Mark and Sweep GC）算法的主要目标是在GC过程中，减少暂停用户线程的次数以及在不得不暂停用户线程的请夸功能，尽可能短的暂停用户线程的时间。这对于交互式应用，比如web应用来说，是非常重要的。 CMS垃圾回收针对新生代和老年代采用不同的策略。相比同吞吐量垃圾回收，它要复杂的多。吞吐量垃圾回收在执
Struts2技术总结白糖_ struts2
必备jar文件早在struts2.0.*的时候，struts2的必备jar包需要如下几个： commons-logging-*.jar Apache旗下commons项目的log日志包 freemarker-*.jar
Jquery easyui layout应用注意事项 bozch jquery 浏览器 easyui layout
在jquery easyui中提供了easyui-layout布局，他的布局比较局限，类似java中GUI的border布局。下面对其使用注意事项作简要介绍：如果在现有的工程中前台界面均应用了jquery easyui，那么在布局的时候最好应用jquery eaysui的layout布局，否则在表单页面（编辑、查看、添加等等）在不同的浏览器会出
java-拷贝特殊链表：有一个特殊的链表，其中每个节点不但有指向下一个节点的指针pNext，还有一个指向链表中任意节点的指针pRand，如何拷贝这个特殊链表？ bylijinnan java
public class CopySpecialLinkedList { /** * 题目：有一个特殊的链表，其中每个节点不但有指向下一个节点的指针pNext，还有一个指向链表中任意节点的指针pRand，如何拷贝这个特殊链表？拷贝pNext指针非常容易，所以题目的难点是如何拷贝pRand指针。假设原来链表为A1 -> A2 ->... -> An，新拷贝
color Chen.H JavaScript html css
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <HTML> <HEAD>&nbs
[信息与战争]移动通讯与网络 comsci 网络
两个坚持:手机的电池必须可以取下来光纤不能够入户,只能够到楼宇建议大家找这本书看看:<&
oracle flashback query(闪回查询) daizj oracle flashback query flashback table
在Oracle 10g中，Flash back家族分为以下成员： Flashback Database Flashback Drop Flashback Table Flashback Query(分Flashback Query,Flashback Version Query，Flashback Transaction Query) 下面介绍一下Flashback Drop 和Flas
zeus持久层DAO单元测试 deng520159 单元测试
zeus代码测试正紧张进行中,但由于工作比较忙,但速度比较慢.现在已经完成读写分离单元测试了,现在把几种情况单元测试的例子发出来,希望有人能进出意见,让它走下去. 本文是zeus的dao单元测试: 1.单元测试直接上代码 package com.dengliang.zeus.webdemo.test; import org.junit.Test; import o
C语言学习三printf函数和scanf函数学习 dcj3sjt126com c printf scanf language
printf函数 /* 2013年3月10日20:42:32 地点：北京潘家园功能：目的：测试%x %X %#x %#X的用法 */ # include <stdio.h> int main(void) { printf("哈哈！\n"); // \n表示换行 int i = 10; printf
那你为什么小时候不好好读书? dcj3sjt126com life
dady, 我今天捡到了十块钱, 不过我还给那个人了 good girl! 那个人有没有和你讲thank you啊没有啦....他拉我的耳朵我才把钱还给他的, 他哪里会和我讲thank you 爸爸, 如果地上有一张5块一张10块你拿哪一张呢.... 当然是拿十块的咯... 爸爸你很笨的, 你不会两张都拿爸爸为什么上个月那个人来跟你讨钱, 你告诉他没
iptables开放端口 Fanyucai linux iptables 端口
1，找到配置文件 vi /etc/sysconfig/iptables 2，添加端口开放，增加一行，开放18081端口 -A INPUT -m state --state NEW -m tcp -p tcp --dport 18081 -j ACCEPT 3，保存 ESC :wq! 4，重启服务 service iptables
Ehcache（05）——缓存的查询 234390216 排序 ehcache 统计 query
缓存的查询目录 1. 使Cache可查询 1.1 基于Xml配置 1.2 基于代码的配置 2 指定可搜索的属性 2.1 可查询属性类型 2.2 &
通过hashset找到数组中重复的元素 jackyrong hashset
如何在hashset中快速找到重复的元素呢?方法很多，下面是其中一个办法： int[] array = {1,1,2,3,4,5,6,7,8,8}; Set<Integer> set = new HashSet<Integer>(); for(int i = 0
使用ajax和window.history.pushState无刷新改变页面内容和地址栏URL lanrikey history
后退时关闭当前页面 <script type="text/javascript"> jQuery(document).ready(function ($) { if (window.history && window.history.pushState) {
应用程序的通信成本 netkiller.github.com 虚拟机应用服务器陈景峰 netkiller neo
应用程序的通信成本什么是通信一个程序中两个以上功能相互传递信号或数据叫做通信。什么是成本这是是指时间成本与空间成本。时间就是传递数据所花费的时间。空间是指传递过程耗费容量大小。都有哪些通信方式全局变量线程间通信共享内存共享文件管道 Socket 硬件（串口，USB）等等全局变量全局变量是成本最低通信方法，通过设置
一维数组与二维数组的声明与定义恋洁e生二维数组一维数组定义声明初始化
/** * */ package test20111005; /** * @author FlyingFire * @date:2011-11-18 上午04:33:36 * @author ：代码整理 * @introduce :一维数组与二维数组的初始化 *summary： */ public c
Spring Mybatis独立事务配置 toknowme mybatis
在项目中有很多地方会使用到独立事务，下面以获取主键为例（1）修改配置文件spring-mybatis.xml  <tx:annotation-driven transaction-manager="transactionManager" /> &n
更新Anadroid SDK Tooks之后，Eclipse提示No update were found xp9802 eclipse
使用Android SDK Manager 更新了Anadroid SDK Tooks 之后，打开eclipse提示 This Android SDK requires Android Developer Toolkit version 23.0.0 or above, 点击Check for Updates 检测一会后提示 No update were found