来自边境的悍匪

边境的悍匪—机器学习实战：第十四章使用卷积神经网络的深度计算机视觉

第十四章使用卷积神经网络的深度计算机视觉

文章目录

第十四章使用卷积神经网络的深度计算机视觉
前言
一、思维导图
二、主要内容
- 1、视觉皮层的架构
- 2、卷积层
- 3、池化层
- 4、CNN架构
- 5、使用Keras实现RestNet-34 CNN
- 6、使用Keras的预训练模型
- 7、迁移学习的预训练模型
- 8、分类和定位
- 9、物体检测
- 10、语义分割
三、课后练习
四、总结

前言

神经网络除了基础的前馈神经网络，还有一些可以用于特殊场景的神经网络结构。这一章我们来了解一下常用于计算机视觉的神经网络结构——卷积神经网络（CNN）。受到生物视觉皮层的启发，科学家们提出了卷积神经网络的概念，使得网络中的神经元并不是一对一的全连接，而是使用一些特别的规则链接在一起，并且提出了两个概念：卷积层、池化层。随着时间的发证更多的科学家在原始CNN结构的基础上做出了很多的变体，并在各种赛事中取得了优异的成绩。下面就让我们来看一下吧。

一、思维导图

二、主要内容

1、视觉皮层的架构

科学家们在对动物的视觉皮层进行研究时发现，不同的神经元在大脑的皮层中起着不同的作用，并且每一个神经元只会与上一层的部分神经元连接。当这一发现应用到神经网络中并逐步发展到今天演变出了卷积神经网络（CNN），提出了卷积层与池化层两个概念来实现卷积神经网络的核心部分。

2、卷积层

卷积层
卷积层模仿视觉皮层的模式处理图像，卷积神经网络的第一层卷积层并不会与整个图像的像素全连接，而只会像接受野一样只与部分像素连接。这种架构允许在第一隐藏层中的低阶特征在下一隐藏层中组合成高维的特征。
滤波器
滤波器就是卷积层的核心，同时也是接受野的一种体现。文中提到垂直滤波器与水平滤波器两种，垂直滤波器会忽略除了垂直方向上的所有内容，同样水平滤波器也会忽略出来水平方向上的所有内容。所以当一个使用相同滤波器的层时会输出一个特征图，这个特征图主要体现的就是原始图像中最能激活滤波器的区域。
堆叠多个特征图
为了能够更加精准的以3D模式显示，我们一般会使用多个滤波器，然后将每个滤波器的输出特征图堆叠起来，同一个特征图中的神经元共享相同的参数。神经元的接受野与之前描述的是相同的，但是它拓展到了先前所有层的特征图，简而言之就是卷积层将多个可训练的滤波器同时应用于其输入，从而使其能够检测到输入中任何位置的多个特征。
TensorFlow的实现
我们在使用TnesorFlow来实现卷积层时，需要注意到很多的超参数。例如：滤波器的数据，滤波器的大小，步幅，填充方式。
内存需求
虽然卷积神经网络没有像深度神经网络那么使用全连接，但是同样有着很大的内存需求。我们在使用卷积神经网络预测的时候，我们可以在计算下一层隐藏层时就释放掉前一层的内存，所以只需要保证连续两层的内存。但是在训练神经网络的时候由于需要保存正向传播的所有内容，所以在训练需要保证所有层的内存。

3、池化层

池化层的工作原理与卷积层的大致相同，只不过池化层的目的是为了对图像进行缩小、减少计算量、减少内存使用量和减少参数。池化层的神经元都与接受野种的所有神经元连接，不同的是池化层的神经元没有权重，他的所有工作就是使用聚合函数聚合输入。

TenosrFlow的实现
TensorFlow实现池化层很简单，是需要使用keras.layers就可以创建很多的池化层。
池化层除了可以从空间维度进行操作，还可以从深度维度进行操作。虽然Kera没有提供创建深度池化层的方法，但是TenosrFlow 底层API提供了实现的方式。

4、CNN架构

经典架构
经典的CNN架构，堆叠了一些卷积层然后是池化层，然后又是几个卷积层和池化层，在结构的顶部是一个常规的全连接前馈神经网络加上一个输出层。随着时代的发展，很多科学家已经在这个经典架构的基础上开发了很多的变体，并取得了不错的成绩。
LeNet-5
LeNet-5是一个广为人知的CNN架构，1998年创建被广泛用于手写数字识别，特殊的是他的池化层使用了平均池化层，输出层输出的是输入向量和权重向量之间的欧几里得距离的平方，而不是计算输出和权重向量的矩阵乘法。
AlexNet
AlexNet CNN架构与LeNet-5架构相似，只是他更大更深，并且没有像LeNet-5一样将池化层放在卷积层之上，而是直接堆叠卷积层。为了减少过拟合作者使用了两种正则化技术，一是对部分全连接层的输出使用了dropout率为50％的dropout技术，二是通过随机转换图像来进行数据增强。
GoogLeNet
GoogLeNet架构由google研究院开发。与前两个CNN架构不同，比他们更深，添加了一种称为盗梦空间的模块来更有效的使用参数，这个模块可以输出各种比例大小的的复杂的特征图。
完整的GoogLeNet，有很深的层，是一个高堆叠包括9个inception的模块。
原始的GoogLeNet是有两个辅助分类器，但是后期因为发现作用很小而删除。后续也有研究员使用对盗梦空间模块进行微调提出了几个变体并取得了很好的性能。
VGGNet
VGGNet由牛津大学视觉几何组研究实验室开发，结构相对简单就是由两个或三个卷积层和一个池化层一直重复此结构总共有16到19个卷积层，还有两个隐藏层和一个输出层。并且他使用的滤波器只是3*3的。
ResNet
ResNet是一个有152层组成的非常深的CNN，它证实了一个趋势，当模型越来越深的时候参数会越来越少，能够训练这种深层神经网络的关键是使用跳过连接，及跳过一部分的层，直接将输入添加到网络的输出，这种方式成为残缺学习。
这个架构的完整结构的开始和结束与GoogLeNet完全相同，中间是由一堆刚刚提到的残缺单元组成，每个残缺单元由两个卷积层组成。
ResNet还有34层、50层、101层几个变体，每个变体在结构上都有微妙的差别。
Xception
Xception算是GoogLeNet的一个变体，他用可分离卷积层替换了盗梦空间的模块，构建了空间滤波器和跨通道滤波器两个部分，与常规的卷积层相比，可以分离卷积层使用了更少了的参数更少的内存和更少的计算。
SENet
SENet扩展了现有的架构，在原始的inception模块或者是残缺单元添加了一个成为SE块的小型神经网络。SE块的作用在于连接单元的输出对输出的特征图进行校验，降低无关的特征图。

5、使用Keras实现RestNet-34 CNN

我们可以从0开始使用Keras实现一个RestNet-34CNN架构，首选需要自定义一个ResidualUnit层，也就是架构中的残缺层，然后使用Sequential按照RestNet-34架构构建起来。虽然我们可以自己构建，方法也很简单，但是还有更简单的方法，Keras已经内置了一些常用的CNN架构。

6、使用Keras的预训练模型

在实际应用当我们完全可以不用像上一节提到的一样从无到有创建一个CNN架构，因为Keras已经为我们提供了一些标准的模型，只需要简单的几行代码就能够创建一个模型并且可以下载预训练的权重。

7、迁移学习的预训练模型

在上一节使用Keras预训练模型的基础上我们可以做迁移学习，使用原始架构的一部分层，加上自定义的层组合成一个完整模型后开始训练。然后再解冻部分层，再训练直到获得一个优秀的模型。

8、分类和定位

物体的分类我们已经通过迁移学习的方式来完成。物体的定位我们可以物体中心的水平坐标和垂直坐标，加上高度和宽度，然后使用MSE损失来进行训练。在评估模型的性能时我们可以使用交并比来评估及预测边界框和目标边界框之间的重叠面积除以他们的联合面积。

9、物体检测

物体检测的含义是在图像中对多个物体进行分类和定位的任务。一种复杂的实现方式是多次执行CNN，删除边界框。

全卷积网络
这个概念是将CNN顶部的密集层替换成卷积层。使得模型就像是拿了一个原始的CNN在图像上滑动。替换的约束是：卷积层中的滤波器数，必须等于密基层中的单元数，滤波器的大小必须等于输入特征图的大小，并且使用"valid"填充。
YOLO
YOLO是一种快速到可以使用在实时视频中的实现物体检测的CNN架构，并且在后续的几年又提出了几种优化后的变体。
均值平均精度
均值平均精度是物体检测中常用的指标。当需要用到多个类别来评估模型的性能时，我们需要一次计算每个类别的平均精度（AP），然后再计算均值（mAP）。

10、语义分割

语义分割是对图像中每个像素进行分类。但是常规的CNN会合并同一类的所有物品归为一个大块，不会更加精确。我们有几种方式解决这个问题，并且TensorFlow也提供了几种卷积层，在GitHub上也有语义分割的实现，甚至还能找到预训练的模型。

三、课后练习

与用于图像分类的全连接的DNN相比，CNN有什么优势？
在CNN连续的层只有一部分连接并且有大量的权重时复用的，所以CNN的参数要比全连接的少，加快了训练速度，降低了过拟合的风险，需要的需要的训练数据也少的多。
CNN学会了可以检测到特定特征的内核后，就可以在图像的任何角度检测到特征，但是DNN只能在学习到的位置检测到它。所以对于很多重复特征的图像，CNN可以作用使用很少的训练实例，就可以比DNN更好的泛化到图像处理任务。
DNN没有像素的排列方式的先验知识。它不知道附近的像素很近。CNN架构嵌入了此先验知识。较低的层通常在图像的较小区域中标识特征，而高层将较低层的特征组合为较大的特征。这对大多数自然图像都能很好的工作，所以使用CNN比DNN更具有领先优势。
考虑由三个卷积层组成的CNN，每个卷积层具有3×3内核，步幅为2和"same"填充。最低层输出100个特征图，中间层输出200个特征图，最顶层输出400个特征图。输入图像是200×300像素的RGB图像。CNN中的参数总数是多少？如果我们使用的是32位浮点数，那么在对单个实例进行预测时，至少该网络需要多少RAM？训练一个包含50个图像的小批量时会怎样？
由于第一个卷积层内核为33并且输入为三个通道，那么第一层每个特征图有333 + 1 = 28个权重参数，第一个卷积层有100个特征图一共是2800个权重参数。第二层内核也为33 输入为上一层的100个特征图的集合，那么一个特征图的权重参数为3*3 100 + 1（偏执项）= 901，第二层有200个特征图权重参数数量为 901 * 200 = 180200。以此类推第三层有720400个参数。所以三个卷积层加起来有903400个权重参数。
当我们对单个实例进行预测时。由于我们的填充方式为SAME步幅为2，输入的图像大小为200,300，因此我们第一层卷积层特征图大小为100150 第二层为50, 75 第三层为25 * 38。并且一个32为是4个字节，所以第一层是6M，第二层是3M，第三层是1.5M，由于预测时是需要同时使用两层，所以6+3=9。加上上一个问题的903400个参数每个参数四个字节，一共是3.6M。一共参数加上卷积层输出的特征图为12.6M内存。
上一个问题计算出，每个实例需要12.6M的内存，那么一个50个实例就为526M内存，加上输入图像的内存50 * 4 * 200 * 300 * 3= 3600万字节，36M，再加上上一个问题计算出来的参数内存3.6M。50个图形在训练时保守估计需要 525 + 36 + 3.6 = 564.6M内存。
如果训练CNN时GPU内存不足，可以尝试哪5种方法来解决这个问题？
如果在训练CNN时发现内存不够，可以使用以下几种方式来解决。1、减小小批量的大小。2、在一层或者多层中使用较大的步幅来降维。3、去除一层或者多层。4、使用16位浮点数而不是32位。5、在多个设备上分布CNN。
为什么要添加最大池化层而不是具有相同步幅的卷积层？
因为最大池化层没有参数，而卷积层是有参数的。
你何时要添加局部响应归一化层？
局部响应归一化层中使用最强烈激活的神经元一直在相同位置但在相邻特征图中的神经元，从而是不同的特征图有针对性并相互远离，使它们探索更为广泛的特征。它通常用于较低的层，以拥有更大的低层特征池。
与LeNet-5相比，你能说出AlexNet的主要创新之处吗？GoogLeNet、ResNet、SENet和Xception的主要创新是什么呢？
与LeNet-5相比，AlexNet的主要创新之处在于它更大、更深，并且将卷积层直接堆叠在彼此之上，而不是将池化层堆叠在每个卷积层之上。GoogLeNet的主要创新之处在于引入了inception模块，与以前的CNN架构相比，它具有更少的参数，从而可以有更深的网络。ResNet的主要创新是引入了链接跳跃，这使超过100层成为可能。可以说，其简单行和一致性也颇具创新新。SENet的主要创新是在inception网络中的每个inception模块或RestNet中的每一个残差但愿之后使用SE块来重新校准特征图的相对重要性。最后，Xception的主要创新是使用了深度可分离卷积层，他们可以各自识别空间模式和深度模式。
什么是全卷积网络？如何将密集层转换为卷积层？
完全卷积网络是由卷积层和池化层组成的神经网络。FCN可以有效的处理任何宽度和高度的图像。他们对于物体检测和语义分割最有用，因为他们只需要查看一次图像。如果你有CNN，则可以将这些密集层转换位卷积层来创建FCN：只需用内核大小等于该层输入大小的卷积层替换最低密集层，再密集层中每个神经元使用一个过滤器，并使用valid填充。通常，步幅应为1，但是你可以根据需要将其设置为更高的值，但是要使用1X1的内核。实际上可以通过适当的重排密集层的权重矩阵这种方式来转换经过训练的CNN。
语义分割的主要技术困难是什么？
语义分割的主要技术难点是，当信息经过每一层时许多空间信息会在CNN中丢失，这个空间信息需要被恢复才能准确的预测出每个像素的类别。

四、总结

这一章节从计算机视觉的角度讲解了卷积神经网络（CNN），包括卷积神经网络的起源、发展与应用。着重说明了什么是卷积神经网络，他的组成和整体架构以及由经典架构进化的变体。

卷积神经网络是按照视觉皮层的结构演变而来的。
视觉皮层中接受野的体现是CNN中的滤波器，每一个卷积层可以有多个滤波器，每一个由相同滤波器组成的隐藏层会输出一个特征图。
CNN中还有一个概念叫池化层，工作原理与卷积层相同，但作用是缩小图像，减少使用的内存，减少计算量、减少权重参数。
经典的CNN架构为，一些卷积层加一个池化层，再加一些卷积层和一个池化层，架构的顶端为一个常规的全连接前馈深度神经网络加上一个输出层。其他的所有变体都是在这个基础上演变出来的。
我们可以使用TensorFlow轻松实现一个卷积神经网络，并且可以使用预训练的权重数据。
对一个图像中的多个物体进行分类和检测的操作称为物体检测，解决物体检测的方法会用到全卷积网络，也就是将卷积神经网络的顶部的密基层替换为卷积层。其中POLO架构是一直快速的物体检测架构。

对文章有任何疑惑或者想要和博主一起学机器学习一起进步的朋友们可以添加群号：666980220。需要机器学习实战电子版或是思维导图的也可以联系我。祝你好运！

项目地址: github

【深度学习与大模型基础】第7章-特征分解与奇异值分解 lynn-66 深度学习与大模型基础算法机器学习人工智能
一、特征分解特征分解（EigenDecomposition）是线性代数中的一种重要方法，广泛应用于计算机行业的多个领域，如机器学习、图像处理和数据分析等。特征分解将一个方阵分解为特征值和特征向量的形式，帮助我们理解矩阵的结构和性质。1.特征分解的定义对于一个n×n的方阵A，如果存在一个非零向量v和一个标量λ，使得：则称λ为矩阵A的特征值，v为对应的特征向量。特征分解将矩阵A分解为：其中：Q是由特征
【论文阅读】Persistent Homology Captures the Generalization of Neural Networks Without A Validation Set 开心星人论文阅读论文阅读
将神经网络表征为加权的无环图，直接根据模型的权重矩阵构造PD。计算相邻batch的权重矩阵PD之间的距离。比较同调收敛性与神经网络的验证精度变化趋势摘要机器学习从业者通常通过监控模型的某些指标来估计其泛化误差，并在训练数值收敛之前停止训练，以防止过拟合。通常，这种误差度量或任务相关的指标是通过一个验证集（holdoutset）来计算的。因为这些数据没有直接用于更新模型参数，通常假设模型在验证集上的
【论文阅读】实时全能分割模型万里守约论文阅读论文阅读图像分割图像处理计算机视觉
文章目录导言1、论文简介2、论文主要方法3、论文针对的问题4、论文创新点总结导言在最近的计算机视觉领域，针对实时多任务分割的需求日益增长，特别是在交互式分割、全景分割和视频实例分割等多种应用场景中。为了解决这些挑战，本文介绍了一种新方法——RMP-SAM（Real-TimeMulti-PurposeSegmentAnything），旨在实现实时的多功能分割。RMP-SAM结合了动态卷积与高效的模型
震惊！ “深度学习”都在学习什么扉间798 深度学习学习人工智能
常见的机器学习分类算法俗话说三个臭皮匠胜过诸葛亮这里面集成学习就是将单一的算法弱弱结合算法融合用投票给特征值加权重AdaBoost集成学习算法通过迭代训练一系列弱分类器，给予分类错误样本更高权重，使得后续弱分类器更关注这些样本，然后将这些弱分类器线性组合成强分类器，提高整体分类性能。（一）投票机制投票是一种直观且常用的算法融合策略。在多分类问题中，假设有多个分类器对同一数据进行分类判断。每个分类器
【论文阅读】Availability Attacks Create Shortcuts 开心星人论文阅读论文阅读
还得重复读这一篇论文，有些地方理解不够透彻可用性攻击通过在训练数据中添加难以察觉的扰动，使数据无法被机器学习算法利用，从而防止数据被未经授权地使用。例如，一家私人公司未经用户同意就收集了超过30亿张人脸图像，用于构建商业人脸识别模型。为解决这些担忧，许多数据投毒攻击被提出，以防止数据被未经授权的深度模型学习。它们通过在训练数据中添加难以察觉的扰动，使模型无法从数据中学习太多信息，从而导致模型在未见
机器学习 Day01人工智能概述山北雨夜漫步机器学习人工智能
1.什么样的程序适合在gpu上运行计算密集型的程序：此类程序主要运算集中在寄存器，寄存器读写速度快，而GPU拥有强大的计算能力，能高效处理大量的寄存器运算，因此适合在GPU上运行。像科学计算中的数值模拟、密码破解等场景的程序，都属于计算密集型，在GPU上运行可大幅提升运算速度。易于并行的程序：GPU采用SIMD架构，有众多核心，同一时间每个核心适合做相同的事。易于并行的程序能充分利用GPU这一特性
机器学习：让计算机学会思考的艺术平凡而伟大. 机器学习机器学习人工智能
目录什么是机器学习？机器学习的基本步骤常见的机器学习算法机器学习的实际应用如何入门机器学习？结语在当今数字化时代，机器学习（MachineLearning,ML）已经成为一个炙手可热的话题。从推荐系统到自动驾驶汽车，再到语音助手，机器学习的应用无处不在。然而，对于许多人来说，机器学习仍然是一个神秘而复杂的领域。本文将用通俗易懂的语言，带你走进机器学习的世界，了解它的基本原理和应用。什么是机器学习？
机器学习中的 K-均值聚类算法及其优缺点平凡而伟大. 机器学习机器学习算法均值算法
K-均值聚类是一种常用的无监督学习算法，用于将数据集中的样本分成K个簇。其基本原理是将所有样本点划分到K个簇使得簇内样本点之间的距离尽可能接近，而不同簇之间的距离尽可能远。算法流程如下：随机选择K个样本点作为初始的聚类中心。将每个样本点分配到与其最近的聚类中心所在的簇。更新每个簇的聚类中心为该簇所有样本点的平均值。重复第2步和第3步，直到聚类中心不再变化或者达到最大迭代次数。优点：简单且易于实现。
一文讲清楚深度学习和机器学习平凡而伟大. 机器学习人工智能深度学习机器学习人工智能
目录1.定义机器学习（MachineLearning,ML）深度学习（DeepLearning,DL）2.工作原理机器学习深度学习3.应用场景机器学习深度学习4.主要区别5.为什么选择深度学习？6.总结深度学习和机器学习是人工智能（AI）领域中两个密切相关但有所区别的概念。要清楚地解释它们之间的关系，我们可以从定义、工作原理、应用场景以及两者的主要区别等方面进行探讨。1.定义机器学习（Machin
机器学习knnlearn1 XW-ABAP 机器学习机器学习人工智能
importmatplotlib.pyplotaspltimportnumpyasnpimportoperator#定义一个函数用于创建数据集defcreateDataSet():#定义特征矩阵，每个元素是一个二维坐标点，代表不同策略数据点的坐标group=np.array([[20,3],[15,5],[18,1],[5,17],[2,15],[3,20]])#定义每个数据点对应的标签，用于区分
基于 MySQL 和 Spring Boot 的在线论坛管理系统设计与实现城南|阿洋-计算机从小白到大神 mysql spring boot 数据库
markdownCopy✌全网粉丝20W+,csdn特邀作者、博客专家、CSDN[新星计划]导师、java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、pyhton、机器学习技术领域和毕业项目实战✌哈喽兄弟们，好久不见哦～最近整理了一下之前写过的一些小项目/毕业设计。发现还是有很多存货的，想一想既然放在电脑里面也吃灰，那么还不如分享出去，没准还可以帮助到
零基础入门机器学习：用Scikit-learn实现鸢尾花分类藍海琴泉机器学习 scikit-learn 分类
适合人群：机器学习新手|数据分析爱好者|需快速展示案例的学生一、引言：为什么要学这个案例？目的：明确机器学习解决什么问题，建立学习信心。机器学习定义：让计算机从数据中自动学习规律（如分类鸢尾花品种）。为什么选鸢尾花数据集：数据量小、特征明确，适合教学演示。Scikit-learn优势：提供现成算法和工具，无需从头写数学公式。二、环境准备：5分钟快速上手目的：搭建可运行的代码环境，避免卡在工具安装环
机器学习--DBSCAN聚类算法详解 2201_75491841 机器学习算法聚类人工智能
目录引言1.什么是DBSCAN聚类？2.DBSCAN聚类算法的原理3.DBSCAN算法的核心概念3.1邻域（Neighborhood）3.2核心点（CorePoint）3.3直接密度可达（DirectlyDensity-Reachable）3.4密度可达（Density-Reachable）3.5密度相连（Density-Connected）4.DBSCAN算法的步骤5.DBSCAN算法的优缺点5
【机器学习】机器学习工程实战-第3章数据收集和准备腊肉芥末果机器学习工程实战机器学习人工智能
上一章：第2章项目开始前文章目录3.1关于数据的问题3.1.1数据是否可获得3.1.2数据是否相当大3.1.3数据是否可用3.1.4数据是否可理解3.1.5数据是否可靠3.2数据的常见问题3.2.1高成本3.2.2质量差3.2.3噪声（noise）3.2.4偏差（bias）3.2.5预测能力低（lowpredictivepower）3.2.6过时的样本3.2.7离群值3.2.8数据泄露/目标泄漏3
机器学习实战第一章机器学习基础 LuoY、 Machine Learning 机器学习算法人工智能
第一章机器学习1.1何谓机器学习1.2关键术语1.3机器学习的主要任务1.4如何选择合适的算法1.5开发机器学习应用程序的步骤1.6Python语言的优势1.1何谓机器学习 1、简单地说，机器学习就是把无序的数据转换成有用的信息； 2、机器学习能让我们自数据集中受启发，我们会利用计算机来彰显数据背后的真实含义； 3、机器学习横跨计算机科学、工程技术和统计学等多个学科，需要多学科的
数据挖掘实战-基于机器学习的垃圾邮件检测模型艾派森数据挖掘实战合集数据挖掘机器学习人工智能 python
‍♂️个人主页：@艾派森的个人主页✍作者简介：Python学习者希望大家多多支持，我们一起进步！如果文章对你有帮助的话，欢迎评论点赞收藏加关注+目录1.项目背景2.数据集介绍
集成学习（随机森林） herry57 数学建模大数据随机森林集成学习
目录一、集成学习概念二、Bagging集成原理三、随机森林四、例子（商品分类）一、集成学习概念集成学习通过建⽴⼏个模型来解决单⼀预测问题。它的⼯作原理是⽣成多个分类器/模型，各⾃独⽴地学习和作出预测。这些预测最后结合成组合预测，因此优于任何⼀个单分类的做出预测。只要单分类器的表现不太差，集成学习的结果总是要好于单分类器的二、Bagging集成原理分类圆形和长方形三、随机森林在机器学习中，随机森林是
【机器学习】朴素贝叶斯入门：从零到垃圾邮件过滤实战吴师兄大模型 0基础实现机器学习入门到精通机器学习人工智能朴素贝叶斯深度学习 pytorch sklearn 开发语言
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
【机器学习】机器学习工程实战-第2章项目开始前腊肉芥末果机器学习工程实战机器学习人工智能
上一章：第1章概述文章目录2.1机器学习项目的优先级排序2.1.1机器学习的影响2.1.2机器学习的成本2.2估计机器学习项目的复杂度2.2.1未知因素2.2.2简化问题2.2.3非线性进展2.3确定机器学习项目的目标2.3.1模型能做什么2.3.2成功模型的属性2.4构建机器学习团队2.4.1两种文化2.4.2机器学习团队的成员2.5机器学习项目为何失败2.5.1缺乏有经验的人才2.5.2缺乏领
机器学习怎么做特征工程全栈你个大西瓜人工智能机器学习人工智能特征工程数据预处理特征变换特征降维特征构造
一、特征工程通俗解释特征工程就像厨师做菜前的食材处理：原始数据是“生肉和蔬菜”，特征工程是“切块、腌制、调料搭配”，目的是让机器学习模型（食客）更容易消化吸收，做出更好预测（品尝美味）。二、为什么要做特征工程？数据质量差：原始数据常有缺失、噪声、不一致问题（如年龄列混入“未知”）。模型限制：算法无法直接理解原始数据（如文本、日期需要数值化）。提升效果：好特征能显著提升模型性能（准确率提升10%~5
【机器学习】机器学习四大分类藓类少女机器学习机器学习分类人工智能
机器学习的方法主要可以分为四大类，根据学习方式和数据标注情况进行分类：1.监督学习（SupervisedLearning）特点：有标注数据（即训练数据有明确的输入(X)和输出(Y)）。学习目标是找到一个映射(f(X)\approxY)。适用于分类和回归问题。主要算法：分类（Classification）：逻辑回归（LogisticRegression）支持向量机（SVM）朴素贝叶斯（NaïveBa
大模型学习终极指南：从新手到专家的必经之路，全网最详尽解析，你敢挑战吗？大模型入门教程学习人工智能 AI 大模型大模型学习大模型教程 AI大模型
随着人工智能技术的飞速发展，大模型（Large-ScaleModels）已经成为推动自然语言处理（NLP）、计算机视觉（CV）等领域进步的关键因素。本文将为您详细介绍从零开始学习大模型直至成为专家的全过程，包括所需掌握的知识点、学习资源以及实践建议等。无论您是初学者还是有一定基础的专业人士，都能从中获得有价值的指导。一、基础知识准备在开始学习大模型之前，需要先掌握一些基础知识，这些知识将为后续的学
机器学习——KNN超参数练习AI两年半机器学习人工智能深度学习
sklearn.model_selection.GridSearchCV是scikit-learn中用于超参数调优的核心工具，通过结合交叉验证和网格搜索实现模型参数的自动化优化。以下是详细介绍：一、功能概述GridSearchCV在指定参数网格上穷举所有可能的超参数组合，通过交叉验证评估每组参数的性能，最终选择最优参数组合。其核心价值在于：自动化调参：替代手动参数调试，提升效率3。交叉验证支持：通
【图像去噪】论文精读：CVPR 2025 | DnLUT: Ultra-Efficient Color Image Denoising via Channel-Aware Lookup Tables 十小大图像去噪深度学习计算机视觉人工智能图像处理论文阅读论文笔记
请先看【专栏介绍文章】：【图像去噪（ImageDenoising）】关于【图像去噪】专栏的相关说明，包含适配人群、专栏简介、专栏亮点、阅读方法、定价理由、品质承诺、关于更新、去噪概述、文章目录、资料汇总、问题汇总（更新中）文章目录前言Abstract1.Introduction2.Relatedworks2.1.ColorImagedenoising2.2.ReplacingCNNwithLUT3
重要重要！！fisher矩阵是怎么计算和更新的，以及计算过程中参数的物理含义 ZhangJiQun&MXP 教学 2021 论文 2024大模型以及算力矩阵概率论线性代数 windows 微信机器学习
fisher矩阵是怎么计算和更新的，以及计算过程中参数的物理含义Fisher信息矩阵（FisherInformationMatrix,FIM）用于衡量模型参数估计的不确定性，其计算和更新在统计学、机器学习和优化中具有重要作用。以下是其计算和更新的关键步骤：一、Fisher矩阵的计算定义Fisher矩阵的元素表示对数似然函数关于参数的二阶导数的期望值的负数，即：Fi,j=−
AI大模型训练教程 Small踢倒coffee_氕氘氚 python自学经验分享笔记
1.引言随着人工智能技术的快速发展，大模型（如GPT-3、BERT等）在自然语言处理、计算机视觉等领域取得了显著的成果。训练一个大模型需要大量的计算资源、数据和专业知识。本教程将带你了解如何从零开始训练一个AI大模型。2.准备工作2.1硬件要求GPU：推荐使用NVIDIA的高性能GPU，如A100、V100等。内存：至少64GBRAM。存储：SSD存储，至少1TB。#2.2软件环境操作系统：Lin
Opencv之计算机视觉一闭月之泪舞计算机视觉计算机视觉 opencv python
一、环境准备使用opencv库来实现简单的计算机视觉。需要安装两个库：opencv-python和opencv-contrib-python，版本可以自行选择，注意不同版本的opencv中的某些函数名和用法可能不同pipinstallopencv-python==3.4.18.65-ihttps://pypi.tuna.tsinghua.edu.cn/simplepipinstallopencv-
计算机视觉总结 Trank-Lw 计算机视觉深度学习人工智能
以下是针对上述问题的详细解答，并结合代码示例进行说明：1.改进YOLOv5人脸检测模块，复杂光照场景准确率从98.2%提升至99.5%优化具体过程：光照补偿：在数据预处理阶段，采用自适应光照补偿算法，对图像进行实时增强，以减少光照变化对人脸检测的影响。数据增强：在训练数据中增加复杂光照场景下的样本，如强光、弱光、背光等，通过数据增强提高模型对不同光照条件的适应性。模型调整：对YOLOv5模型的网络
景联文科技提供高质量文本标注服务，驱动AI技术发展景联文科技科技人工智能
文本标注是指在原始文本数据上添加标签的过程，这些标签可以用来指示特定的实体、关系、事件等信息，以帮助计算机理解和处理这些数据。文本标注是自然语言处理（NLP）领域的一个重要环节，它通过为文本的不同部分提供具体的含义和上下文信息，增强机器学习和深度学习模型对文本内容的理解能力。标注类型情感分析情感极性：确定文本表达的情感倾向，如正面、负面或中立。强度评估：衡量情感的强烈程度，从轻微到极端不等。命名实
景联文科技：以高质量数据标注推动人工智能领域创新与发展景联文科技科技人工智能数据标注
在当今这个由数据驱动的时代，高质量的数据标注对于推动机器学习、自然语言处理（NLP）、计算机视觉等领域的发展具有不可替代的重要性。数据标注过程涉及对原始数据进行加工，通过标注特定对象的特征来生成能够被机器学习模型识别和使用的编码格式，从而使数据更具有意义和可解读性。数据标注的主要类型包括：图像标注：指在图片中标识出目标物体的位置、形状或类别等信息，如自动驾驶技术中的行人、车辆及交通标志的识别。文本
[黑洞与暗粒子]没有光的世界 comsci
无论是相对论还是其它现代物理学,都显然有个缺陷,那就是必须有光才能够计算但是,我相信,在我们的世界和宇宙平面中,肯定存在没有光的世界.... 那么,在没有光的世界,光子和其它粒子的规律无法被应用和考察,那么以光速为核心的 &nbs
jQuery Lazy Load 图片延迟加载 aijuans jquery
基于 jQuery 的图片延迟加载插件，在用户滚动页面到图片之后才进行加载。对于有较多的图片的网页，使用图片延迟加载，能有效的提高页面加载速度。版本： jQuery v1.4.4+ jQuery Lazy Load v1.7.2 注意事项：需要真正实现图片延迟加载，必须将真实图片地址写在 data-original 属性中。若 src
使用Jodd的优点 Kai_Ge jodd
1. 简化和统一 controller ，抛弃 extends SimpleFormController ，统一使用 implements Controller 的方式。 2. 简化 JSP 页面的 bind, 不需要一个字段一个字段的绑定。 3. 对 bean 没有任何要求，可以使用任意的 bean 做为 formBean。使用方法简介
jpa Query转hibernate Query 120153216 Hibernate
public List<Map> getMapList(String hql, Map map) { org.hibernate.Query jpaQuery = entityManager.createQuery(hql); if (null != map) { for (String parameter : map.keySet()) { jp
Django_Python3添加MySQL/MariaDB支持 2002wmj mariaDB
现状首先，[email protected] 中默认的引擎为 django.db.backends.mysql 。但是在Python3中如果这样写的话，会发现 django.db.backends.mysql 依赖 MySQLdb[5] ，而 MySQLdb 又不兼容 Python3 于是要找一种新的方式来继续使用MySQL。 MySQL官方的方案首先据MySQL文档[3]说，自从MySQL
在SQLSERVER中查找消耗IO最多的SQL 357029540 SQL Server
返回做IO数目最多的50条语句以及它们的执行计划。 select top 50 (total_logical_reads/execution_count) as avg_logical_reads, (total_logical_writes/execution_count) as avg_logical_writes, (tot
spring UnChecked 异常官方定义！ 7454103 spring
如果你接触过spring的事物管理！那么你必须明白 spring的非捕获异常！即 unchecked 异常！因为 spring 默认这类异常事物自动回滚！！ public static boolean isCheckedException(Throwable ex) { return !(ex instanceof RuntimeExcep
mongoDB 入门指南、示例 adminjun java mongodb 操作
一、准备工作 1、下载mongoDB 下载地址：http://www.mongodb.org/downloads 选择合适你的版本相关文档：http://www.mongodb.org/display/DOCS/Tutorial 2、安装mongoDB A、不解压模式：将下载下来的mongoDB-xxx.zip打开，找到bin目录，运行mongod.exe就可以启动服务，默
CUDA 5 Release Candidate Now Available aijuans CUDA
The CUDA 5 Release Candidate is now available at http://developer.nvidia.com/<wbr></wbr>cuda/cuda-pre-production. Now applicable to a broader set of algorithms, CUDA 5 has advanced fe
Essential Studio for WinRT网格控件测评 Axiba JavaScript html5
Essential Studio for WinRT界面控件包含了商业平板应用程序开发中所需的所有控件，如市场上运行速度最快的grid 和chart、地图、RDL报表查看器、丰富的文本查看器及图表等等。同时，该控件还包含了一组独特的库，用于从WinRT应用程序中生成Excel、Word以及PDF格式的文件。此文将对其另外一个强大的控件——网格控件进行专门的测评详述。网格控件功能 1、
java 获取windows系统安装的证书或证书链 bewithme windows
有时需要获取windows系统安装的证书或证书链，比如说你要通过证书来创建java的密钥库。有关证书链的解释可以查看此处。 public static void main(String[] args) { SunMSCAPI providerMSCAPI = new SunMSCAPI(); S
NoSQL数据库之Redis数据库管理(set类型和zset类型) bijian1013 redis 数据库 NoSQL
4.sets类型 Set是集合，它是string类型的无序集合。set是通过hash table实现的，添加、删除和查找的复杂度都是O(1)。对集合我们可以取并集、交集、差集。通过这些操作我们可以实现sns中的好友推荐和blog的tag功能。 sadd：向名称为key的set中添加元
异常捕获何时用Exception，何时用Throwable bingyingao
用Exception的情况 try { //可能发生空指针、数组溢出等异常 } catch (Exception e) {
【Kafka四】Kakfa伪分布式安装 bit1129 kafka
在http://bit1129.iteye.com/blog/2174791一文中，实现了单Kafka服务器的安装，在Kafka中，每个Kafka服务器称为一个broker。本文简单介绍下，在单机环境下Kafka的伪分布式安装和测试验证 1. 安装步骤 Kafka伪分布式安装的思路跟Zookeeper的伪分布式安装思路完全一样，不过比Zookeeper稍微简单些(不
Project Euler bookjovi haskell
Project Euler是个数学问题求解网站，网站设计的很有意思，有很多problem，在未提交正确答案前不能查看problem的overview，也不能查看关于problem的discussion thread，只能看到现在problem已经被多少人解决了，人数越多往往代表问题越容易。看看problem 1吧： Add all the natural num
Java-Collections Framework学习与总结-ArrayDeque BrokenDreams Collections
表、栈和队列是三种基本的数据结构，前面总结的ArrayList和LinkedList可以作为任意一种数据结构来使用，当然由于实现方式的不同，操作的效率也会不同。这篇要看一下java.util.ArrayDeque。从命名上看
读《研磨设计模式》-代码笔记-装饰模式-Decorator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.io.BufferedOutputStream; import java.io.DataOutputStream; import java.io.FileOutputStream; import java.io.Fi
Maven学习(一) chenyu19891124 Maven私服
学习一门技术和工具总得花费一段时间，5月底6月初自己学习了一些工具，maven+Hudson+nexus的搭建，对于maven以前只是听说，顺便再自己的电脑上搭建了一个maven环境，但是完全不了解maven这一强大的构建工具，还有ant也是一个构建工具，但ant就没有maven那么的简单方便，其实简单点说maven是一个运用命令行就能完成构建，测试，打包，发布一系列功
[原创]JWFD工作流引擎设计----节点匹配搜索算法(用于初步解决条件异步汇聚问题) 补充 comsci 算法工作 PHP 搜索引擎嵌入式
本文主要介绍在JWFD工作流引擎设计中遇到的一个实际问题的解决方案，请参考我的博文"带条件选择的并行汇聚路由问题"中图例A2描述的情况(http://comsci.iteye.com/blog/339756),我现在把我对图例A2的一个解决方案公布出来，请大家多指点节点匹配搜索算法(用于解决标准对称流程图条件汇聚点运行控制参数的算法) 需要解决的问题：已知分支
Linux中用shell获取昨天、明天或多天前的日期 daizj linux shell 上几年昨天获取上几个月
在Linux中可以通过date命令获取昨天、明天、上个月、下个月、上一年和下一年 # 获取昨天 date -d 'yesterday' # 或 date -d 'last day' # 获取明天 date -d 'tomorrow' # 或 date -d 'next day' # 获取上个月 date -d 'last month' #
我所理解的云计算 dongwei_6688 云计算
在刚开始接触到一个概念时，人们往往都会去探寻这个概念的含义，以达到对其有一个感性的认知，在Wikipedia上关于“云计算”是这么定义的，它说： Cloud computing is a phrase used to describe a variety of computing co
YII CMenu配置 dcj3sjt126com yii
Adding id and class names to CMenu We use the id and htmlOptions to accomplish this. Watch. //in your view $this->widget('zii.widgets.CMenu', array( 'id'=>'myMenu', 'items'=>$this-&g
设计模式之静态代理与动态代理 come_for_dream 设计模式
静态代理与动态代理代理模式是java开发中用到的相对比较多的设计模式，其中的思想就是主业务和相关业务分离。所谓的代理设计就是指由一个代理主题来操作真实主题，真实主题执行具体的业务操作，而代理主题负责其他相关业务的处理。比如我们在进行删除操作的时候需要检验一下用户是否登陆，我们可以删除看成主业务，而把检验用户是否登陆看成其相关业务
【转】理解Javascript 系列 gcc2ge JavaScript
理解Javascript_13_执行模型详解摘要: 在《理解Javascript_12_执行模型浅析》一文中,我们初步的了解了执行上下文与作用域的概念，那么这一篇将深入分析执行上下文的构建过程，了解执行上下文、函数对象、作用域三者之间的关系。函数执行环境简单的代码:当调用say方法时，第一步是创建其执行环境，在创建执行环境的过程中，会按照定义的先后顺序完成一系列操作:1.首先会创建一个
Subsets II hcx2013 set
Given a collection of integers that might contain duplicates, nums, return all possible subsets. Note: Elements in a subset must be in non-descending order. The solution set must not conta
Spring4.1新特性——Spring缓存框架增强 jinnianshilongnian spring4
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
shell嵌套expect执行命令 liyonghui160com
一直都想把expect的操作写到bash脚本里,这样就不用我再写两个脚本来执行了,搞了一下午终于有点小成就,给大家看看吧. 系统:centos 5.x 1.先安装expect yum -y install expect 2.脚本内容: cat auto_svn.sh #!/bin/bash
Linux实用命令整理 pda158 linux
0. 基本命令　　linux 基本命令整理　　1. 压缩解压　　tar -zcvf a.tar.gz a #把a压缩成a.tar.gz 　　tar -zxvf a.tar.gz #把a.tar.gz解压成a 　　2. vim小结　　2.1 vim替换　　:m,ns/word_1/word_2/gc
独立开发人员通向成功的29个小贴士 shoothao 独立开发
概述：本文收集了关于独立开发人员通向成功需要注意的一些东西,对于具体的每个贴士的注解有兴趣的朋友可以查看下面标注的原文地址。明白你从事独立开发的原因和目的。保持坚持制定计划的好习惯。万事开头难，第一份订单是关键。培养多元化业务技能。提供卓越的服务和品质。谨小慎微。营销是必备技能。学会组织，有条理的工作才是最有效率的。 “独立
JAVA中堆栈和内存分配原理 uule java
1、栈、堆 1.寄存器：最快的存储区, 由编译器根据需求进行分配,我们在程序中无法控制.2. 栈：存放基本类型的变量数据和对象的引用，但对象本身不存放在栈中，而是存放在堆（new 出来的对象）或者常量池中（字符串常量对象存放在常量池中。）3. 堆：存放所有new出来的对象。4. 静态域：存放静态成员（static定义的）5. 常量池：存放字符串常量和基本类型常量（public static f

边境的悍匪—机器学习实战：第十四章 使用卷积神经网络的深度计算机视觉

第十四章 使用卷积神经网络的深度计算机视觉