鼎__

机器学习笔记（含图像处理）

一、回归

1. 梯度下降

梯度下降是通过不断更新各个变量的参数得到代价函数的全局最小值，更新方式为：原来的参数-步长×代价函数对参数的偏导。
注意：迭代次数和步长需要由自己设定。
越接近最小值时，代价函数对参数的偏导（即斜率）就越小，则达到最小值就越慢。

代码：

def gradientDescent(X, y, theta, alpha, iters):
    temp = np.matrix(np.zeros(theta.shape))
    parameters = int(theta.ravel().shape[1])
    cost = np.zeros(iters)
    
    for i in range(iters):
        error = (X * theta.T) - y
        for j in range(parameters):
            term = np.multiply(error, X[:,j])
            temp[0,j] = theta[0,j] - ((alpha / len(X)) * np.sum(term))
        theta = temp
        cost[i] = computeCost(X, y, theta)
    return theta, cost

2. 特征归一化

与正态分布的的标准化变形相似，因此可能与中心极限定理有关。
在概率论中，习惯于把和的分布收敛于正态分布这一类定理都叫做中心极限定理。
代码：

data2 = (data2 - data2.mean()) / data2.std()
data2.head()

3. 正规方程

公式：
代码：

# 正规方程
def normalEqn(X, y):
    theta = np.linalg.inv(X.T@X)@X.T@y#X.T@X等价于X.T.dot(X)
    return theta

梯度下降与正规方程的比较：
梯度下降：需要选择学习率 α，需要多次迭代，当特征数量 n 大时也能较好适用，适用于各种类型的模型。
正规方程：不需要选择学习率 α，一次计算得出，需要计算

如果特征数量 n 较大则运算代价大，因为矩阵逆的计算时间复杂度为

通常来说当小于 10000 时还是可以接受的，只适用于线性模型，不适合逻辑回归模型等其他模型。

二、逻辑回归

1. 代价函数

当标签值为1时，则只有当h(x)接近1时，代价函数才接近0；
当标签值为0时，则只有当h(x)接近0时，代价函数才接近0；
算法通过梯度下降，最终会选择代价函数值小的参数。

2. 正则化

线性回归
逻辑回归
正则化的基本方法是在一定程度上减小参数的值。我们需修改代价函数，在参数中设置一点惩罚，这样算法寻找最小化代价值时也需要将这个惩罚纳入考虑中，最终导致选择较小的参数值。
从梯度下降更新参数的步骤可直观发现参数还减去了额外的值，因此最后得到的参数值也会更小。
如果选择的正则化参数λ过大，则会把所有的参数都最小化了，θ（不包括θ0）都会趋近于 0，这样我们所得到的只能是一条平行于x轴的直线。导致模型变成

造成欠拟合。所以对于正则化，我们要取一个合理的 λ 值，这样才能更好的应用正则化。
代码：

def gradient(theta, X, y):
    theta = np.matrix(theta)
    X = np.matrix(X)
    y = np.matrix(y)

    parameters = int(theta.ravel().shape[1])
    grad = np.zeros(parameters)

    error = sigmoid(X * theta.T) - y

    for i in range(parameters):
        term = np.multiply(error, X[:,i])
        grad[i] = np.sum(term) / len(X)

    return grad

实际上我们没有在这个函数中执行梯度下降，而仅仅在计算一个梯度步长。我们可以用 SciPy 的“optimize”命名空间即 SciPy’s truncated newton（TNC）来实现寻找最优参数。

import scipy.optimize as opt
result = opt.fmin_tnc(func=cost, x0=theta, fprime=gradient, args=(X, y))
result

三、支持向量机

1. 代价函数

C=1/λ
C较大时，相当于λ较小，可能会导致过拟合，高方差。C较小时，相当于λ较大，可能会导致低拟合，高偏差。
有别于逻辑回归输出的概率，支持向量机最小化代价函数，获得参数时，所做的是用它来直接预测的值等于 1还是等于 0。

2.核函数

四、神经网络

1. 线性分类器

线性分类器是n维空间中的线性边界，在一维空间中是一个点，在二维空间中是一条直线，在三维空间中是一个平面，在高维空间中是超平面。是神经网络的第一个处理模块（每个神经元都会用到）。
对每个像素点有多少个权重，就表示有多少个不同的分类。
可以用交叉验证的方法对超参数进行评估。把训练集分成k折，分别把每一折单独作为验证集，其他折作为训练集，把在验证集上的准确率相加求平均，得到此超参数的准确率。遍历所有的K，找到准确率最高的点，便可找到最佳的模型超参数。如此可在较小的数据集上更准确地避免偶然误差，得到一个模型的评估性能。
线性分类器无法对非线性的数据分布进行拟合。如异或型，同心圆型，多峰型的分布。

2.铰链损失函数（hinge loss/svm loss）

合页损失函数（支持向量机的损失函数，没有正则化项）会惩罚与正确类别分数相近的错误类别，与正确类别分数较远的错误类别的分数对损失函数的结果没有影响。

3. softmax分类器

对铰链损失函数求指数，再归一化（各自分数/和，相当于概率）。
图形分类问题都是用softmax作为最终的分类结果。

4.交叉熵损失函数/对数似然函数

对分类正确的概率求对数。
凸函数只有一个全局最优解，无局部最优解
非凸函数，有许多局部最优解

5. 反向传播

反向传播实际上就是用复合函数的链式求导法则，求出损失函数对各个权重的偏导。
然后权重根据梯度更新参数。

五、卷积神经网络

1. 卷积层

卷积的作用是把原图中符合卷积核定义的特征提取出来。如果符合，则chmap的值就大。

2. 池化层

从chmap里选出某些值出来。（最大值或者平均值）
池化的作用：减少参数量，防止过拟合，使神经网络具备平移不变性。
不需要权重。

3. 全连接层

简单神经网络

4. 其他

卷积神经网络训练的参数包括卷积核的权重和偏置项目和全连接层权重和偏置项。
使用数据驱动的方法，使用梯度下降和反向传播的方法求得损失函数对每一个权重的梯度，更新优化梯度，使得损失函数最小化。
底层的卷积核关注的是底层的信息，如边缘、转角、颜色、斑点块，越高级的卷积核就进行了特征的融合和汇总，获取的信息就变得越来越高级，比如说纹理、人脸、眼睛、轮胎、圆形，到了高层，提取到什么特征，人类也无法解释清楚了，所以深度学习的一个弊端，就是可解释性不强。到分类层就完全进行了特化，神经网络正是因为我们神经科学和生物认知科学上的启发，视觉是分层的，同时每一个神经元只看图像中的一小部分区域，进行了仿生，最后得出了这么一个模型。

5. 深度学习与传统神经网络的区别

Adam

6. cnn网络进化

7. cnn结构的演化

每个卷积核都负责提取不同尺度不同样子的特征，总有一款特征能匹配得到。
平移不变形来自于下采样和池化
深度学习三巨头
- ACM（国际计算机学会）宣布，有“深度学习三巨头”之称的Yoshua Bengio、Yann LeCun、Geoffrey Hinton共同获得了2018年的图灵奖，这是图灵奖1966年建立以来少有的一年颁奖给三位获奖者。
- https://blog.csdn.net/zephyr_wang/article/details/105736103
ImageNet Large Scale Visual Recognition Challenge（imagenet大规模视觉识别挑战赛）
- 是近年来机器视觉领域最受追捧也是最具权威的学术竞赛之一，代表了图像领域的最高水平。
- AI研究员李飞飞从2006年开始研究ImageNet的想法。在大多数AI研究专注于模型和算法的时候，李飞飞则希望扩展和改进可用于训练AI算法的数据。2007年，李飞飞与普林斯顿大学教授克里斯蒂安·费尔鲍姆（Christiane Fellbaum）会面讨论了该项目，他是WordNet的创建者之一。之后李继续从WordNet的单词数据库开始构建ImageNet，并使用了其许多功能。作为普林斯顿大学的助理教授，李飞飞组建了一个研究团队，致力于ImageNet项目。他们使用Amazon Mechanical Turk来帮助分类图像。他们在2009年美国佛罗里达州举行的计算机视觉与模式识别会议（CVPR）上首次以学术海报的形式展示了自己的数据库
- ILSVRC旨在延续2005年起举办的较小规模的PASCAL VOC挑战赛，后者仅包含约2万张图像和20个对象类别。为了使ImageNet“民主化”，李飞飞向PASCAL VOC团队提出了一项合作，从2010年开始，研究团队将在给定的数据集上评估他们的算法，并在几项视觉识别任务上争夺更高的准确率。由此产生的年度竞赛现在称为ImageNet大规模视觉识别挑战赛（ILSVRC）。ILSVRC使用仅1000个“整理后的”图像类别，其中包括完整的ImageNet类别的120个犬种中的90个。
Alexnet
- 出现ReLuc和Dropout
VGG
- 用3个3×3卷积代替一个7×7卷积，减少参数量，且卷积核都是3×3，步长为1。有16层和19层的VGG，一张224×224×3的图片前向传播参数四亿多个，占内存96M。反向再×2=138M
- 参数量大
GoogleNet
- inception模块：用不同大小的卷积核可以提取到图片中不同大小的物体。
- 1×1卷积作用：升维或降维、跨通道信息交融、减少参数量、增加模型深度，提高非线性表示能力
- 22层，500万个参数，参数减少，AlexNet的1/12，VGG的1/27
ResNet
- 网络不是越深越好，越深会造成梯度小时，网络退化现象。
- 跨层传递。
- 首次超过人类水平。

8.反卷积

上采样
将缩小的图像像素进行线性组合。

六、pytorch框架

1. 什么是PyTorch?

PyTorch是一个基于Python的科学计算库，它有以下特点:
- 类似于NumPy，但是它可以使用GPU
- 可以用它定义深度学习模型，可以灵活地进行深度学习模型的训练和使用
Tensors
- Tensor类似与NumPy的ndarray，唯一的区别是Tensor可以在GPU上加速运算。

2. PyTorch常用函数

torch.utils.data.DataLoader使用方法
数据加载器，结合了数据集和取样器，并且可以提供多个线程处理数据集。
在训练模型时使用到此函数，用来把训练数据分成多个小组，此函数每次抛出一组数据。直至把所有的数据都抛出。就是做一个数据的初始化。
PyTorch提供了两个类来计算二分类交叉熵（Binary Cross Entropy），分别是BCELoss() 和BCEWithLogitsLoss()
在卷积神经网络的卷积层之后总会添加BatchNorm2d进行数据的归一化处理，这使得数据在进行Relu之前不会因为数据过大而导致网络性能的不稳定
optimizer.step()和scheduler.step()的区别
optimizer.step()通常用在每个mini-batch之中，而scheduler.step()通常用在epoch里面,但是不绝对，可以根据具体的需求来做。只有用了optimizer.step()，模型才会更新，而scheduler.step()是对lr进行调整。通常我们有

optimizer = optim.SGD(model.parameters(), lr = 0.01, momentum = 0.9)
scheduler = lr_scheduler.StepLR(optimizer, step_size = 100, gamma = 0.1)
model = net.train(model, loss_function, optimizer, scheduler, num_epochs = 100)

在scheduler的step_size表示scheduler.step()每调用step_size次，对应的学习率就会按照策略调整一次。所以如果scheduler.step()是放在mini-batch里面，那么step_size指的是经过这么多次迭代，学习率改变一次。

七、计算机图像

数字华包括采样和量化两个过程：
采样是将模拟图像中连续分布的图像元素转换成空间离散分布的像素的过程。
像素：数字图像是由有限个图像元素构成，数字图像中的图像元素称为像素（离散）/模拟图像
灰度：量化是用离散的数值来近似表示原来连续可变的像素明亮程度的过程，这个近似表示明亮程度的离散数值称为像素的灰度值。

1. 图像预处理

（1）图像的运算

图像的点运算
- 点运算是指，输出图像每个像素的灰度值仅仅取决于输入图像中相对应像素的灰度值。
图像的算术运算
图像的几何运算
图像的逻辑运算

（2）图像形态学处理

膨胀：膨胀是将图像中与目标物体接触的所有背景点合并到物体中的过程，结果是是目标增大、孔径缩小，可以增补目标中的空间，使其形成连通区域。（模板在边缘外侧滑动）
腐蚀：腐蚀具有使目标缩小、目标内孔径增大以及消除外部孤立噪声的效果。模板在边缘内侧滑动）
开运算：开运算操作通过去除边缘处细小的凹陷不平达到平滑边缘的目的。开运算具有消除图像中细小物体，并在物体影像纤细处分离物体和平滑较大物体边界的作用。
闭运算：闭运算通过去除边缘上细小的凸起达到平滑边缘的目的。闭运算具有填充物体影像内细小空间、连接邻近物体和平滑边界的作业。

（3）空间域处理

卷积/滤波
- 平滑高斯滤波，使图像变模糊，对缩放图像有用
- 均值滤波
- 中值滤波
金字塔

（4）频率域处理

傅里叶变换
小波变换

（5）图像增强

平滑、去噪（卷积的应用）
边缘检测（卷积的应用）
边缘锐化（卷积的应用）
灰度调整（对比度增强）
直方图增强
- 直方图
- 直方图均衡化
  - 图像均衡化是指利用图像直方图对对比度进行调整的方法

（6）图像分割

传统的图像分割方法

基于阈值
基于边缘
- 灰度
- 颜色
- 纹理
基于区域
- 区域生长法
- 区域分裂合并法
- 分水岭法
基于图论
- Graph Cuts分割
- GMM
- K-means

语义分割

FCN
DeepLab

2. 图像特征

（1）颜色特征

量化颜色正发图
聚类颜色直方图

（2）几何特征

边缘
- 边缘定义：像素值函数快速变化的区域-》一阶导数的极值区域
关键点
Harris角点
Fast角点检测算法
斑点

（3）局部特征

SIFT
SURF
ORB

（4）其他特征

LBP
Gabor

3. 图像分类

4. 目标检测

（1）区域卷积网络系列

模型进化

5. 医疗影像分割

Unet（是全卷积神经网络）
3D-Unet
Vnet
DenseNet

八、视频质量检测&&分析

https://blog.csdn.net/zhulong1984/article/details/78304907

1. 亮度异常检测

https://www.cnblogs.com/wqvbjhc/p/3768984.html

一般包括偏暗检测和偏亮检测，也有称过暗过亮检测。只需要一帧图像的亮度值作为判断。
原理
- 把彩色图像转化为灰度图像
- 求图像的平均灰度值G（整幅或ROI区域），该值就是图像的亮度值
- 定义阈值A，B。当G∈[0,A]认为图像偏暗，当G∈[B,255]认为图像偏亮

2. 偏色检测/色度异常检测

https://www.cnblogs.com/wqvbjhc/p/3768985.html

一般称为偏色检测。即图像为某一范围颜色值分布过多而导致图像整体偏色的情况。
原理
- 提取图像的色度分量H
- 计算色度分量H的直方图
- 求最方图（最优直方图）最大bin（组）占整个直方图的比例，该比例值就为偏色值
色三属性：色相、亮度和色度
- 色相（hue）：或称色彩、色泽。物体的颜色。白、灰、黑色没有色彩，称无彩色；黄色、绿色、红色等有色彩，称为彩色。颜色差别称为色相。
- 亮度（value）：颜色的明暗程度。由反射率100%的洁白色到完全没有反射的（反射率0%）的黑色之间分成亮度不同的等级。明亮的颜色亮度高，暗的颜色亮度低。白色与黑色中间的亮度称为中性灰，约18%的反射率，称为标准反射率。
- 色度（chroma）：颜色的鲜艳程度，又称色品度，色饱和度。同一色相中鲜艳的色度高，不鲜艳的色度低。
- 在色的分辨中色相容易区别，但亮度和色度容易弄错。色度随色相和亮度而变化，一般色度高的多为中间亮度的色。当然根据色相不同也不完全一样。亮度过高或过低的色，色度都低。
色度学基础知识

3.图像噪声检测：雪花噪声检测

https://www.cnblogs.com/wqvbjhc/p/3768994.html

雪花噪声即椒盐噪声，以前黑白电视常见的噪声现象。
原理
- 准备0°，45°，90°，135°4个方向的卷积模板。
- 用图像先和四个模板做卷积，用四个卷积绝对值最小值Min来检测噪声点。
- 求灰度图gray与其中值滤波图(median)。
- 判断噪声点：fabs(median-gray)>10 && min>0.1。
- 噪声点占整幅图像的比较即为雪花噪声率。

4.条纹噪声检测是带条状的噪声。

https://www.cnblogs.com/wqvbjhc/p/3768995.html

条纹噪声是带条状的噪声。
原理
- 提取彩色图像的色度分量。
- 对色度分量求DFT（离散傅里叶变换）频谱图。
- 计算频谱图的异常亮点数，若大于A则认为发生条纹检测。
- https://blog.csdn.net/qq295456059/article/details/50354222
- CTFS、DTFS、CTFT、DTFT公式

5. 清晰度检测/模糊检测

https://www.cnblogs.com/wqvbjhc/p/3768995.html

模糊一般是摄像头焦距没调好造成的画面模糊。
原理
- 把图像分割成N*M的区域。
- 求每个区域的对比度：(max-min)/max.
- 求总的平均对比度即为模糊率。

6.信号丢失检测

https://www.cnblogs.com/wqvbjhc/p/3769008.html

也称无信号检测，一般当DVR/NVR某些通道没接上摄像头时，会显示黑屏无信号。而IPC无信号里无法返回任何图像信息，也就无法通过图像算法检测到。
原理
- 把彩色图像二值化，偏黑的部分为前景，其他部分为背景。
- 对前景进行连通区域检测，求得最大连通区域面积。
- 该面积整幅图像面积的比较即为信号丢失率。

7. 视频抖动检测/遮挡检测

https://www.cnblogs.com/wqvbjhc/p/3768996.html

遮挡检测一般是摄像头被异物遮挡，呈现出整个场景或某一部分场景看不到的情况。被遮挡住的部分一般都呈偏黑色。
原理
把彩色图像二值化，偏黑的部分为前景，其他部分为背景。
对前景进行连通区域检测，求得最大连通区域面积。
该面积整幅图像面积的比较即为遮挡率。

8. 画面冻结检测

https://www.cnblogs.com/wqvbjhc/p/3769017.html

画面冻结是由于画面场景没有变化，而仅仅是画面中的时间有变化的情况。此现象需要多帧图像才能检测出来。
原理
每隔T帧从视频中取一帧（防止相邻帧太相似引起误检）。
对所取的每帧求直方图。
求相邻2帧直方图的相似度。
当相似度大于A时认为二帧一致，当一致的帧达到B时认为画面发生冻结

9. 视频滚动检测/PTZ云台运动检测

https://www.cnblogs.com/wqvbjhc/p/3769016.html

是通过配合云台运动的功能检测云台运动是否正常。
原理
取云台运动前N帧图像，进行背景建模，得到运动前背景A。
设备发送云台运动指令，让云台进行运动，改变场景。
取云台运动后N帧图像，进行背景建模，得到运动后背景B。
对比A,B颜色直方图的相似度，大于K时认为PTZ云台运动有故障

10. 画面抖动检测

https://www.cnblogs.com/wqvbjhc/p/3769018.html

当摄像头立杆不稳或因车辆引起地面振动时，视频画面就会发生抖动。
原理
每隔N帧取一帧。
对取到的每帧进行特征点提取。
对检测的相邻2帧进行特征点匹配。
得到匹配矩阵，当匹配矩阵大于A时认为这2帧画面有抖动。
当抖动帧数大于B时认为画面发生抖动。

Pad Token技术原理与实现指南 Takoony AI
目录概述理论基础：第一性原理分析技术实现机制工程最佳实践性能优化策略常见问题与解决方案技术发展趋势附录1.概述1.1文档目的本文档旨在深入阐述深度学习中PadToken的技术原理、实现机制及工程应用，为算法工程师提供全面的理论指导和实践参考。1.2适用范围自然语言处理模型开发序列数据批处理优化深度学习系统架构设计高性能计算资源管理1.3核心问题研究问题:为什么深度学习模型需要将变长序列统一到固定长
深度学习分布式训练：并行策略与通信机制的系统性分析 Takoony 深度学习分布式人工智能
1.引言随着深度学习模型规模的指数级增长，单一计算设备已无法满足训练需求。以GPT-3为例，其1750亿参数在FP16精度下需要约350GB存储空间（每个参数2字节），远超当前主流GPU的显存容量（如NVIDIAA100的80GB）。根据OpenAI的技术报告[1]，即使使用最先进的硬件，单卡训练GPT-3需要355年。这一计算瓶颈催生了分布式训练技术的快速发展。本文将从理论基础出发，系统性地分析
万字长文，解读大模型技术原理（非常详细）零基础入门到精通，收藏这一篇就够了
大模型是指具有大规模参数和复杂计算结构的机器学习模型。本文从大模型的发展历程出发，对大模型领域的各个技术细节进行详细解读，供大家在了解大模型基本知识的过程中起到一定参考作用。一、大模型的定义大语言模型作为一个被验证可行的方向，其“大”体现在训练数据集广，模型参数和层数大，计算量大，其价值体现在通用性上，并且有更好的泛化能力。这些模型通常由深度神经网络构建而成，拥有数十亿甚至数千亿个参数。大模型的设
TensorFlow为AI人工智能航空航天领域带来变革 AI原生应用开发人工智能 tensorflow python ai
TensorFlow为AI人工智能航空航天领域带来变革关键词：TensorFlow、人工智能、航空航天、机器学习、深度学习、神经网络、自主系统摘要：本文探讨了TensorFlow这一强大的机器学习框架如何推动航空航天领域的创新。我们将从基础概念入手，逐步深入分析TensorFlow在航天器导航、卫星图像处理、飞行器自主决策等关键应用场景中的实现原理。通过实际代码示例和架构图解，展示TensorFl
多语言文本分类在AI应用中的实践 AI原生应用开发人工智能分类数据挖掘 ai
多语言文本分类在AI应用中的实践关键词：多语言文本分类、自然语言处理、机器学习、深度学习、BERT、迁移学习、跨语言模型摘要：本文深入探讨多语言文本分类在AI领域的应用实践。我们将从基础概念出发，逐步讲解其核心原理、技术架构和实现方法，并通过实际案例展示如何构建一个高效的多语言文本分类系统。文章将涵盖从传统机器学习方法到最先进的深度学习技术，特别关注跨语言迁移学习在实际业务场景中的应用。背景介绍目
从零开始构建AI原生应用的认知架构 AI原生应用开发 AI-native 架构 ai
从零开始构建AI原生应用的认知架构关键词：AI原生应用、认知架构、机器学习、知识图谱、神经网络、智能决策、系统设计摘要：本文深入探讨如何从零开始构建AI原生应用的认知架构。我们将从基本概念出发，逐步解析认知架构的核心组件，包括知识表示、推理机制和学习能力等。通过生动的比喻和实际代码示例，帮助读者理解如何设计一个能够模拟人类认知过程的AI系统。文章还将介绍当前最先进的认知架构模型，并展望未来发展趋势
Orange3实战教程：图像分析---图像嵌入 err2008 Orange3 实战教程数据挖掘神经网络自然语言处理机器学习计算机视觉深度学习 orange3中文版
图像嵌入通过深度神经网络实现图像嵌入。输入图像：图像列表。输出嵌入向量：用数字向量表示的图像。跳过的图像：未计算嵌入向量的图像列表。图像嵌入功能读取图像并将其上传至远程服务器或本地计算。深度学习模型用于为每张图像计算特征向量。该功能返回一个增强的数据表，包含额外的列（图像描述符）。图像可以通过导入图像小部件导入，也可以通过电子表格中的图像路径导入。在这种情况下，包含图像路径的列需要一个三行表头，第
PyTorch生成式人工智能（18）——循环神经网络详解与实现盼小辉丶 pytorch rnn 自然语言处理
PyTorch生成式人工智能（18）——循环神经网络详解与实现0.前言1.文本生成的挑战2.循环神经网络2.1文本数据2.2循环神经网络原理3.长短期记忆网络3.自然语言处理基础3.1分词3.2词嵌入3.3词嵌入在自然语言处理中的应用小结系列链接0.前言我们已经学习了如何生成数字和图像等内容。从本节开始，我们将主要聚焦于文本生成。人类语言极其复杂且充满细微差别，不仅仅涉及语法和词汇的理解，还包括上
【人工智能99问】卷积神经网络（CNN）的结构和原理是什么？(10/99)
文章目录卷积神经网络（CNN）的结构及原理一、CNN的核心结构1.输入层（InputLayer）2.卷积层（ConvolutionalLayer）2.卷积层的核心机制：局部感受野与权值共享3.池化层（PoolingLayer）4.全连接层（FullyConnectedLayer）5.输出层（OutputLayer）6.辅助层二、CNN的工作原理三、CNN的使用场景1.计算机视觉（最核心场景）2.其
【CNN】卷积神经网络池化- part2
1.池化降采样，减少参数数量，避免过拟合，提高鲁棒性2.池化操作池化操作(也称为下采样，Subsampling)类似卷积操作，使用的也是一个很小的矩阵，叫做池化核，但是池化核本身没有参数，只是通过对输入特征矩阵本身进行运算，它的大小通常是2x2、3x3、4x4等，其中2x2使用频率最高。然后将池化核在卷积得到的输出特征图中进行池化操作，需要注意的是，池化的过程中也有Padding方式以及步长的概念
Deep Multi-scale Convolutional Neural Network for Dynamic Scene Deblurring 论文阅读钟屿论文阅读计算机视觉人工智能
用于动态场景去模糊的深度多尺度卷积神经网络摘要针对一般动态场景的非均匀盲去模糊是一个具有挑战性的计算机视觉问题，因为模糊不仅来源于多个物体运动，还来源于相机抖动和场景深度变化。为了去除这些复杂的运动模糊，传统的基于能量优化的方法依赖于简单的假设，例如模糊核是部分均匀或局部线性的。此外，最近的基于机器学习的方法也依赖于在这些假设下生成的合成模糊数据集。这使得传统的去模糊方法在模糊核难以近似或参数化的
基于Paillier同态加密算法的金融数据安全共享机制研究【附数据】
金融数据分析与建模专家金融科研助手|论文指导|模型构建✨专业领域：金融数据处理与分析量化交易策略研究金融风险建模投资组合优化金融预测模型开发深度学习在金融中的应用擅长工具：Python/R/MATLAB量化分析机器学习模型构建金融时间序列分析蒙特卡洛模拟风险度量模型金融论文指导内容：金融数据挖掘与处理量化策略开发与回测投资组合构建与优化金融风险评估模型期刊论文✅具体问题可以私信或查看文章底部二维码
吴恩达机器学习cs229-学习笔记-更新中是娜个二叉树！机器学习学习笔记
吴恩达机器学习cs22901基础概念语言：Matlab/python监督学习定义：获取一组数据集拟合数据从X到Y的映射回归问题：预测的Y是连续的，Y是实数分类问题：分类指的是Y取离散值，输出是离散的两组，正示例和负示例，把所有样本推到这条直线上，用0，1，标识逻辑回归算法，拟合直线区分正，负示例处理相对大量特征的回归算法或者分类算法支持向量机算法：它使用的不是1,2,3,10个输入特征，而是使用无
YOLOv8实现手写数字识别系统：从MNIST到实时摄像头检测
在深度学习领域，手写数字识别是一个经典问题，也是入门计算机视觉的重要案例。本文将介绍一个基于YOLOv8和MNIST数据集的手写数字识别系统，该系统不仅能识别静态图像中的数字，还能通过摄像头实时检测手写数字。个人博客：YOLOv8实现手写数字识别系统：从MNIST到实时摄像头检测-iDing's博客项目概述这个项目结合了传统的MNIST数据集和现代的目标检测算法YOLOv8，实现了以下功能：将MN
「日拱一码」033 机器学习——严格划分胖达不服输「日拱一码」机器学习人工智能严格划分组划分
目录简单随机划分（train_test_split）分组划分（GroupSplitting）简单分组划分(GroupSplitting)分层分组划分(StratifiedGroupSplitting)交叉验证法（Cross-Validation）分组K折交叉验证（GroupKFold）留一组法（LeaveOneGroupOut）简单随机划分（train_test_split）简单随机分组通过随机分
基于深度学习的手写数字和符号识别系统：YOLOv5/v6/v7/v8/v10模型实现与UI界面集成 YOLO实战营深度学习 YOLO ui 人工智能目标检测计算机视觉
1.引言随着人工智能和深度学习技术的发展，手写数字和符号识别已经成为计算机视觉领域的重要研究方向。手写识别在很多实际应用中扮演着关键角色，例如邮政编码识别、表单自动处理和智能教育系统等。传统的手写识别方法通常依赖于复杂的特征工程，而深度学习则能够自动从数据中学习到特征，极大地提高了识别精度和速度。本文将介绍如何构建一个基于YOLO系列模型（YOLOv5、YOLOv6、YOLOv7、YOLOv8、Y
从零开始：搭建你的人工智能开发环境人工智能教程人工智能 YOLO 机器学习 transformer 线性回归动态规划排序算法
前言在人工智能和机器学习的旅程中，一个稳定且高效的开发环境是成功的关键第一步。无论是初学者还是经验丰富的开发者，一个配置良好的开发环境都能大大提高工作效率，减少遇到的问题。本文将从零开始，逐步指导你如何搭建一个完整的人工智能开发环境，包括操作系统选择、Python安装、常用库的配置以及开发工具的选择。一、选择合适的操作系统（一）主流操作系统介绍在搭建人工智能开发环境时，首先需要选择一个合适的操作系
AI作画：AI人工智能激发艺术创作灵感 AGI大模型与大数据研究院 AI作画人工智能 ai
AI作画：AI人工智能激发艺术创作灵感关键词：AI作画、生成艺术、深度学习、神经网络、艺术创作、人工智能、创意工具摘要：本文深入探讨AI作画技术如何激发艺术创作灵感。我们将从基础概念出发，解释AI如何"学习"艺术风格并生成新作品，分析核心技术原理，提供实际应用案例，并展望这一领域的未来发展趋势。通过通俗易懂的讲解和实际代码示例，帮助读者理解这项融合科技与艺术的创新技术。背景介绍目的和范围本文旨在向
基于机器学习的加密货币资金费率预测与套利策略云梦量化科技 python
一、资金费率机制解析永续合约的资金费率是加密货币衍生品市场独有的机制，旨在使永续合约价格锚定现货价格。资金费率每8小时结算一次，结算时多空双方互相支付资金费用：费率为正时，多头支付给空头；费率为负时，空头支付给多头。此机制既促使永续合约价格回归现货价格，也反映市场多空情绪。某安永续合约资金费率计算公式通常为：资金费率 F = 平均溢价指数 P + Clamp(综合利率 I − 溢价指数 P, +0
Jetson平台编译Tengine space01 AIoT Jetson 人工智能深度学习计算机视觉
1.Tengine简介Tengine于2017年在GitHub（https://github.com/OAID/Tengine）开源，是OPENAILAB（开放智能）推出的自主知识产权的边缘AI计算框架，致力于解决AIoT产业链碎片化问题，加速AI产业化落地。Tengine兼容多种操作系统和深度学习算法框架，简化和加速面向场景的AI算法在嵌入式边缘设备上快速迁移，以及实际应用部署落地，可以十倍提升
机器人-组成结构-感知 - 决策 - 执行具身智能-查布嘎具身智能机器人人工智能
目录一、感知系统内部传感器：外部传感器：二、智能决策系统机器学习家族1.1机器学习2.1深度学习2.2深度学习模型(主要属于监督/强化学习范畴，但结构通用)：3.1监督学习3.2监督学习模型4.1半监督学习4.2无/半监督学习模型：5.1无监督学习5.2生成模型(可属于监督/无监督)：6.1强化学习7.1其他学习三、控制系统（运控）①对应小脑和脊柱一、感知系统①对应人体的五官。由具有不同功能的各种
深度学习篇---矩阵 Atticus-Orion 嵌入式知识篇上位机知识篇嵌入式硬件篇深度学习矩阵人工智能
在机械臂解算、深度学习网络等硬件和软件领域中，矩阵运算作为核心数学工具，承担着数据表示、变换、映射和优化的关键作用。以下从具体领域出发，详细总结涉及的矩阵运算及对应的核心知识：一、机械臂解算领域机械臂解算（运动学、动力学分析）的核心是描述“关节空间”与“操作空间”的映射关系，矩阵运算用于精准刻画坐标系转换、运动传递和力/力矩分析。1.运动学解算（正/逆运动学）核心目标：通过矩阵描述关节角度与末端执
飞算JavaAI：力臻开发之本真，破 AI 代码之繁琐，传统项目一键生成微学AI 人工智能 java javaAI
飞算JavaAI：力臻开发之本真，破AI代码之繁琐，传统项目一键生成文章目录飞算JavaAI：力臻开发之本真，破AI代码之繁琐，传统项目一键生成一、前言二、飞算JavaAI是什么？2.1背景与实力2.2飞算JavaAI的“独门绝技”三、飞算JavaAI实战体验3.1IDEA插件安装配置3.2Main中写一个简单的梯度下降算法3.3main函数搭建一个卷积神经网络网络3.4飞算JavaAI：需求分析
机器学习入门（五）：线性回归—从模型函数到目标函数米饭超人
从数据反推公式假设我们获得了这样一张表格，上面列举了美国纽约若干程序员职位的年薪：enterimagedescriptionhere大家可以看到，表格中列举了职位、经验、技能、国家和城市几项特征。除了经验一项，其他都是一样的。不同的经验（工作年限），薪水不同。而且看起来，工作年头越多，工资也就越高。那么我们把Experience与Salary抽取出来，用x和y来分别指代它们。enterimaged
AI驱动的电路仿真革命：从物理模型到智能学习的范式转移
AI驱动的电路仿真革命：从物理模型到智能学习的范式转移人工智能正颠覆传统电路仿真方法，本文将深入解析AI在电路建模、优化与故障诊断中的前沿应用，揭示智能仿真如何提升10倍效率并突破物理限制。一、AI电路仿真的数学基础1.1图神经网络建模电路拓扑电路可抽象为图结构G=(V,E)G=(V,E)G=(V,E)：VVV：节点（电子元件）EEE：边（连接关系）图卷积网络(GCN)更新公式：H(l+1)=σ(
Python深度学习实践：LSTM与GRU在序列数据预测中的应用 AI智能应用 Python入门实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
Python深度学习实践：LSTM与GRU在序列数据预测中的应用作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来序列数据预测是机器学习领域的一个重要研究方向，涉及时间序列分析、自然语言处理、语音识别等多个领域。序列数据具有时间依赖性，即序列中每个元素都受到前面元素的影响。传统的机器学习算法难以捕捉这种时间依赖性，而深度学习
一个例子带你入门机器学习
目录1.为建模选择数据2.选择预测目标3.选择“特征”4.构建您的模型（这篇文章将使用经典墨尔本房价数据集作为例子，引导机器学习的流程，数据集为melb_data.csv，请在csdn的下载区自行下载，运行代码时需要将数据集下载在同个目录下）1.为建模选择数据数据集有太多的变量，多到难以理解，甚至无法很好地打印出来。如何将这海量的数据削减为能够理解的内容？我们将首先凭借直觉选择几个变量。后续将介绍
初探机器学习与力学研究的交叉领域 faderbic 机器学习人工智能深度学习
目录关于如何踏入机器学习领域机器学习与力学研究的交叉方向1.使用机器学习加速有限元求解2.结合有限元计算和机器学习预测复杂材料结构与力学性能的关系3.结构健康检测4.疲劳寿命预测总结关于如何踏入机器学习领域因为我本科的专业是力学，所以当我开始关注机器学习领域时，首先考虑的是机器学习和力学的交叉领域。对于很多对人工智能感兴趣的朋友，想加入人工智能的潮流却不知道从何学起，我提供一个思路，我认为将自己学
[NIPST AI]对抗性机器学习攻击和缓解的分类和术语 Anooyman 人工智能网络安全人工智能大语言模型网络安全安全
原文link：https://nvlpubs.nist.gov/nistpubs/ai/NIST.AI.100-2e2025.pdfIntroduction人工智能（AI）系统在过去几年中持续全球扩展。这些系统正在被众多国家开发并广泛部署于各自的经济体系中，人们在生活的许多领域都获得了更多使用AI系统的机会。本报告区分了两大类AI系统：预测型AI（PredictiveAI，PredAI）和生成型A
Baumer工业相机堡盟工业相机如何通过YoloV8深度学习模型实现打架检测（C#代码，UI界面版）格林威工业相机机器视觉数码相机 YOLO 深度学习计算机视觉人工智能
Baumer工业相机堡盟工业相机如何通过YoloV8深度学习模型实现打架检测（C#代码，UI界面版）工业相机使用YoloV8模型实现打架检测工业相机通过YoloV8模型实现打架检测的技术背景在相机SDK中获取图像转换图像的代码分析工业相机图像转换Bitmap图像格式和Mat图像重要核心代码本地文件图像转换Bitmap图像格式和Mat图像重要核心代码Mat图像导入YoloV8模型重要核心代码代码实现
Java序列化进阶篇 g21121 java序列化
1.transient 类一旦实现了Serializable 接口即被声明为可序列化，然而某些情况下并不是所有的属性都需要序列化，想要人为的去阻止这些属性被序列化，就需要用到transient 关键字。
escape()、encodeURI()、encodeURIComponent()区别详解 aigo JavaScript Web
原文：http://blog.sina.com.cn/s/blog_4586764e0101khi0.html JavaScript中有三个可以对字符串编码的函数，分别是： escape,encodeURI,encodeURIComponent，相应3个解码函数：,decodeURI,decodeURIComponent 。下面简单介绍一下它们的区别 1 escape()函
ArcgisEngine实现对地图的放大、缩小和平移 Cb123456 添加矢量数据对地图的放大、缩小和平移 Engine
ArcgisEngine实现对地图的放大、缩小和平移: 个人觉得是平移，不过网上的都是漫游，通俗的说就是把一个地图对象从一边拉到另一边而已。就看人说话吧. 具体实现: 一、引入命名空间 using ESRI.ArcGIS.Geometry; using ESRI.ArcGIS.Controls; 二、代码实现.
Java集合框架概述天子之骄 Java集合框架概述
集合框架集合框架可以理解为一个容器，该容器主要指映射(map)、集合(set)、数组(array)和列表(list)等抽象数据结构。从本质上来说，Java集合框架的主要组成是用来操作对象的接口。不同接口描述不同的数据类型。简单介绍： Collection接口是最基本的接口，它定义了List和Set，List又定义了LinkLi
旗正4.0页面跳转传值问题何必如此 java jsp
跳转和成功提示 a) 成功字段非空forward 成功字段非空forward，不会弹出成功字段，为jsp转发，页面能超链接传值,传输变量时需要拼接。接拼接方式list.jsp?test="+strweightUnit+"或list.jsp?test="+weightUnit+&qu
全网唯一:移动互联网服务器端开发课程 cocos2d-x小菜 web开发移动开发移动端开发移动互联程序员
移动互联网时代来了！ App市场爆发式增长为Web开发程序员带来新一轮机遇，近两年新增创业者，几乎全部选择了移动互联网项目！传统互联网企业中超过98%的门户网站已经或者正在从单一的网站入口转向PC、手机、Pad、智能电视等多端全平台兼容体系。据统计，AppStore中超过85%的App项目都选择了PHP作为后端程
Log4J通用配置|注意问题笔记 7454103 DAO apache tomcat log4j Web
关于日志的等级那些去百度就知道了！这几天要搭个新框架配置了日志记下来！做个备忘！ #这里定义能显示到的最低级别,若定义到INFO级别,则看不到DEBUG级别的信息了~! log4j.rootLogger=INFO,allLog # DAO层 log记录到dao.log 控制台和总日志文件 log4j.logger.DAO=INFO,dao,C
SQLServer TCP/IP 连接失败问题 ---SQL Server Configuration Manager darkranger sql c windows SQL Server XP
当你安装完之后,连接数据库的时候可能会发现你的TCP/IP 没有启动.. 发现需要启动客户端协议 : TCP/IP 需要打开 SQL Server Configuration Manager... 却发现无法打开 SQL Server Configuration Manager..?? 解决方法: C:\WINDOWS\system32目录搜索framedyn.
[置顶] 做有中国特色的程序员 aijuans 程序员
从出版业说起网络作品排到靠前的，都不会太难看，一般人不爱看某部作品也是因为不喜欢这个类型，而此人也不会全不喜欢这些网络作品。究其原因，是因为网络作品都是让人先白看的，看的好了才出了头。而纸质作品就不一定了，排行榜靠前的，有好作品，也有垃圾。许多大牛都是写了博客，后来出了书。这些书也都不次，可能有人让为不好，是因为技术书不像小说，小说在读故事，技术书是在学知识或温习知识，有些技术书读得可
document.domain 跨域问题 avords document
document.domain用来得到当前网页的域名。比如在地址栏里输入：javascript:alert(document.domain); //www.315ta.com我们也可以给document.domain属性赋值，不过是有限制的，你只能赋成当前的域名或者基础域名。比如：javascript:alert(document.domain = "315ta.com");
关于管理软件的一些思考 houxinyou 管理
工作好多看年了,一直在做管理软件,不知道是我最开始做的时候产生了一些惯性的思维,还是现在接触的管理软件水平有所下降.换过好多年公司,越来越感觉现在的管理软件做的越来越乱. 在我看来,管理软件不论是以前的结构化编程,还是现在的面向对象编程,不管是CS模式,还是BS模式.模块的划分是很重要的.当然,模块的划分有很多种方式.我只是以我自己的划分方式来说一下. 做为管理软件,就像现在讲究MVC这
NoSQL数据库之Redis数据库管理(String类型和hash类型) bijian1013 redis 数据库 NoSQL
一.Redis的数据类型 1.String类型及操作 String是最简单的类型，一个key对应一个value，string类型是二进制安全的。Redis的string可以包含任何数据，比如jpg图片或者序列化的对象。 Set方法：设置key对应的值为string类型的value
Tomcat 一些技巧征客丶 java tomcat dos
以下操作都是在windows 环境下一、Tomcat 启动时配置 JAVA_HOME 在 tomcat 安装目录，bin 文件夹下的 catalina.bat 或 setclasspath.bat 中添加 set JAVA_HOME=JAVA 安装目录 set JRE_HOME=JAVA 安装目录/jre 即可；二、查看Tomcat 版本在 tomcat 安装目
【Spark七十二】Spark的日志配置 bit1129 spark
在测试Spark Streaming时，大量的日志显示到控制台，影响了Spark Streaming程序代码的输出结果的查看(代码中通过println将输出打印到控制台上)，可以通过修改Spark的日志配置的方式，不让Spark Streaming把它的日志显示在console 在Spark的conf目录下，把log4j.properties.template修改为log4j.p
Haskell版冒泡排序 bookjovi 冒泡排序 haskell
面试的时候问的比较多的算法题要么是binary search，要么是冒泡排序，真的不想用写C写冒泡排序了，贴上个Haskell版的，思维简单，代码简单，下次谁要是再要我用C写冒泡排序，直接上个haskell版的，让他自己去理解吧。 sort [] = [] sort [x] = [x] sort (x:x1:xs) | x>x1 = x1:so
java 路径配置文件读取 bro_feng java
这几天做一个项目，关于路径做如下笔记，有需要供参考。取工程内的文件，一般都要用相对路径，这个自然不用多说。在src统计目录建配置文件目录res,在res中放入配置文件。读取文件使用方式： 1. MyTest.class.getResourceAsStream("/res/xx.properties") 2. properties.load(MyTest.
读《研磨设计模式》-代码笔记-简单工厂模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 个人理解：简单工厂模式就是IOC; * 客户端要用到某一对象，本来是由客户创建的，现在改成由工厂创建，客户直接取就好了 */ interface IProduct {
SVN与JIRA的关联 chenyu19891124 SVN
SVN与JIRA的关联一直都没能装成功，今天凝聚心思花了一天时间整合好了。下面是自己整理的步骤：一、搭建好SVN环境，尤其是要把SVN的服务注册成系统服务二、装好JIRA，自己用是jira-4.3.4破解版三、下载SVN与JIRA的插件并解压，然后拷贝插件包下lib包里的三个jar，放到Atlassian\JIRA 4.3.4\atlassian-jira\WEB-INF\lib下，再
JWFDv0.96 最新设计思路 comsci 数据结构算法工作企业应用公告
随着工作流技术的发展，工作流产品的应用范围也不断的在扩展，开始进入了像金融行业(我已经看到国有四大商业银行的工作流产品招标公告了)，实时生产控制和其它比较重要的工程领域，而
vi 保存复制内容格式粘贴 daizj vi 粘贴复制保存原格式不变形
vi是linux中非常好用的文本编辑工具，功能强大无比，但对于复制带有缩进格式的内容时，粘贴的时候内容错位很严重，不会按照复制时的格式排版，vi能不能在粘贴时，按复制进的格式进行粘贴呢？答案是肯定的，vi有一个很强大的命令可以实现此功能。在命令模式输入:set paste，则进入paste模式，这样再进行粘贴时
shell脚本运行时报错误：/bin/bash^M: bad interpreter 的解决办法 dongwei_6688 shell脚本
出现原因：windows上写的脚本，直接拷贝到linux系统上运行由于格式不兼容导致解决办法： 1. 比如文件名为myshell.sh，vim myshell.sh 2. 执行vim中的命令 : set ff?查看文件格式，如果显示fileformat=dos，证明文件格式有问题 3. 执行vim中的命令 :set fileformat=unix 将文件格式改过来就可以了，然后:w
高一上学期难记忆单词 dcj3sjt126com word english
honest 诚实的；正直的 argue 争论 classical 古典的 hammer 锤子 share 分享；共有 sorrow 悲哀；悲痛 adventure 冒险 error 错误；差错 closet 壁橱；储藏室 pronounce 发音；宣告 repeat 重做；重复 majority 大多数；大半 native 本国的，本地的，本国
hibernate查询返回DTO对象，DTO封装了多个pojo对象的属性 frankco POJO hibernate查询 DTO
DTO-数据传输对象；pojo-最纯粹的java对象与数据库中的表一一对应。简单讲：DTO起到业务数据的传递作用，pojo则与持久层数据库打交道。有时候我们需要查询返回DTO对象，因为DTO
Partition List hcx2013 partition
Given a linked list and a value x, partition it such that all nodes less than x come before nodes greater than or equal to x. You should preserve the original relative order of th
Spring MVC测试框架详解——客户端测试 jinnianshilongnian
上一篇《Spring MVC测试框架详解——服务端测试》已经介绍了服务端测试，接下来再看看如果测试Rest客户端，对于客户端测试以前经常使用的方法是启动一个内嵌的jetty/tomcat容器，然后发送真实的请求到相应的控制器；这种方式的缺点就是速度慢；自Spring 3.2开始提供了对RestTemplate的模拟服务器测试方式，也就是说使用RestTemplate测试时无须启动服务器，而是模拟一
关于推荐个人观点 liyonghui160com 推荐系统关于推荐个人观点
回想起来，我也做推荐了3年多了，最近公司做了调整招聘了很多算法工程师，以为需要多么高大上的算法才能搭建起来的，从实践中走过来，我只想说【不是这样的】第一次接触推荐系统是在四年前入职的时候，那时候，机器学习和大数据都是没有的概念，什么大数据处理开源软件根本不存在，我们用多台计算机web程序记录用户行为，用.net的w
不间断旋转的动画 pangyulei 动画
CABasicAnimation* rotationAnimation; rotationAnimation = [CABasicAnimation animationWithKeyPath:@"transform.rotation.z"]; rotationAnimation.toValue = [NSNumber numberWithFloat: M
自定义annotation sha1064616837 java enum annotation reflect
对象有的属性在页面上可编辑，有的属性在页面只可读，以前都是我们在页面上写死的，时间一久有时候会混乱，此处通过自定义annotation在类属性中定义。越来越发现Java的Annotation真心很强大，可以帮我们省去很多代码，让代码看上去简洁。下面这个例子主要用到了 1.自定义annotation：@interface，以及几个配合着自定义注解使用的几个注解 2.简单的反射 3.枚举
Spring 源码 up2pu spring
1.Spring源代码 https://github.com/SpringSource/spring-framework/branches/3.2.x 注：兼容svn检出 2.运行脚本 import-into-eclipse.bat 注：需要设置JAVA_HOME为jdk 1.7 build.gradle compileJava { sourceCompatibilit
利用word分词来计算文本相似度 yangshangchuan word word分词文本相似度余弦相似度简单共有词
word分词提供了多种文本相似度计算方式：方式一：余弦相似度，通过计算两个向量的夹角余弦值来评估他们的相似度实现类：org.apdplat.word.analysis.CosineTextSimilarity 用法如下： String text1 = "我爱购物"; String text2 = "我爱读书"; String text3 =

机器学习笔记（含图像处理）

一、回归

1. 梯度下降

2. 特征归一化

3. 正规方程

二、逻辑回归

1. 代价函数

2. 正则化

三、支持向量机

1. 代价函数

2.核函数

四、神经网络

1. 线性分类器

2.铰链损失函数（hinge loss/svm loss）

3. softmax分类器

4.交叉熵损失函数/对数似然函数

5. 反向传播

五、卷积神经网络

1. 卷积层

2. 池化层

3. 全连接层

4. 其他

5. 深度学习与传统神经网络的区别

6. cnn网络进化

7. cnn结构的演化

8.反卷积

六、pytorch框架

1. 什么是PyTorch?

2. PyTorch常用函数

七、计算机图像

1. 图像预处理

（1）图像的运算

（2）图像形态学处理

（3）空间域处理

（4）频率域处理

（5）图像增强

（6）图像分割

2. 图像特征

（1）颜色特征

（2）几何特征

（3）局部特征

（4）其他特征

3. 图像分类

4. 目标检测

（1）区域卷积网络系列

5. 医疗影像分割

八、视频质量检测&&分析

1. 亮度异常检测

2. 偏色检测/色度异常检测

3.图像噪声检测：雪花噪声检测

4.条纹噪声检测是带条状的噪声。

5. 清晰度检测/模糊检测

6.信号丢失检测

7. 视频抖动检测/遮挡检测

8. 画面冻结检测

9. 视频滚动检测/PTZ云台运动检测

10. 画面抖动检测

你可能感兴趣的:(机器学习,机器学习,深度学习,神经网络)