LeadAI学院

透析 | 卷积神经网络CNN究竟是怎样一步一步工作的？

北京 | 深度学习与人工智能研修

12月23-24日

再设经典课程重温深度学习阅读全文 >

正文共6018个字109张图，预计阅读时间16分钟。

视频地址：https://www.youtube.com/embed/FmpDIaiMIeA；

文档参阅：pdf [2MB] & ppt [6MB] & Web View & GitBook；

补充知识：深度学习 — 反向传播理论推导（http://www.jianshu.com/p/408ab8177a53）；

当你听到说深度学习打破了某项新技术障碍，那么十有八九就会涉及到卷积神经网络。它们也被称作CNNs或着ConvNets，是深层神经网络领域的主力。它们已经学会对图像进行分类，在某些情况下甚至超过了人类。如果有一个方法证明了这种假设，那就是CNN。特别酷的一点就是，当你将它们分解为基本模块时，它们很容易被理解。这里有一个视频（https://www.youtube.com/embed/FmpDIaiMIeA），很详细地讨论了关于这些图像问题。

LeNet-5

Classfication

先验工作

【icml09 - Convolutional Deep Belief Networks.pdf】（http://web.eecs.umich.edu/~honglak/icml09-ConvolutionalDeepBeliefNetworks.pdf）

【Playing Atari with Deep Reinforcement Learning】

【Robot Learning Manipulation Action Plans】（https://link.jianshu.com/?t=http://www.umiacs.umd.edu/~yzyang/paper/YouCookMani_CameraReady.pdf）

A toy ConvNet：X's and O's

识别一幅图片是包含有字母"X"还是字母"O"？

为了帮助指导你理解卷积神经网络，我们讲采用一个非常简化的例子：确定一幅图像是包含有"X"还是"O"？

这个例子足够说明CNN背后的原理，同时它足够简单，能够避免陷入不必要的细节。在CNN中有这样一个问题，就是每次给你一张图，你需要判断它是否含有"X"或者"O"。并且假设必须两者选其一，不是"X"就是"O"。理想的情况就像下面这个样子：

标准的"X"和"O"，字母位于图像的正中央，并且比例合适，无变形

对于计算机来说，只要图像稍稍有一点变化，不是标准的，那么要解决这个问题还是不是那么容易的：

计算机要解决上面这个问题，一个比较天真的做法就是先保存一张"X"和"O"的标准图像（就像前面给出的例子），然后将其他的新给出的图像来和这两张标准图像进行对比，看看到底和哪一张图更匹配，就判断为哪个字母。但是这么做的话，其实是非常不可靠的，因为计算机还是比较死板的。在计算机的“视觉”中，一幅图看起来就像是一个二维的像素数组（可以想象成一个棋盘），每一个位置对应一个数字。在我们这个例子当中，像素值"1"代表白色，像素值"-1"代表黑色。

当比较两幅图的时候，如果有任何一个像素值不匹配，那么这两幅图就不匹配，至少对于计算机来说是这样的。

对于这个例子，计算机认为上述两幅图中的白色像素除了中间的3*3的小方格里面是相同的，其他四个角上都不同：

因此，从表面上看，计算机判别右边那幅图不是"X"，两幅图不同，得出结论：

但是这么做，显得太不合理了。理想的情况下，我们希望，对于那些仅仅只是做了一些像平移，缩放，旋转，微变形等简单变换的图像，计算机仍然能够识别出图中的"X"和"O"。就像下面这些情况，我们希望计算机依然能够很快并且很准的识别出来：

这也就是CNN出现所要解决的问题。

Features

对于CNN来说，它是一块一块地来进行比对。它拿来比对的这个“小块”我们称之为Features（特征）。在两幅图中大致相同的位置找到一些粗糙的特征进行匹配，CNN能够更好的看到两幅图的相似性，相比起传统的整幅图逐一比对的方法。

每一个feature就像是一个小图（就是一个比较小的有值的二维数组）。不同的Feature匹配图像中不同的特征。在字母"X"的例子中，那些由对角线和交叉线组成的features基本上能够识别出大多数"X"所具有的重要特征。

这些features很有可能就是匹配任何含有字母"X"的图中字母X的四个角和它的中心。那么具体到底是怎么匹配的呢？如下：

看到这里是不是有了一点头目呢。但其实这只是第一步，你知道了这些Features是怎么在原图上面进行匹配的。但是你还不知道在这里面究竟进行的是怎样的数学计算，比如这个下面3*3的小块到底干了什么？

接下来就跟进介绍里面的数学操作，也就是我们常说的“卷积”操作。

卷积

Convolution

当给你一张新的图时，CNN并不能准确地知道这些features到底要匹配原图的哪些部分，所以它会在原图中每一个可能的位置进行尝试。这样在原始整幅图上每一个位置进行匹配计算，我们相当于把这个feature变成了一个过滤器。这个我们用来匹配的过程就被称为卷积操作，这也就是卷积神经网络名字的由来。

这个卷积操作背后的数学知识其实非常的简单。要计算一个feature和其在原图上对应的某一小块的结果，只需要简单地将两个小块内对应位置的像素值进行乘法运算，然后将整个小块内乘法运算的结果累加起来，最后再除以小块内像素点总个数即可。如果两个像素点都是白色（也就是值均为1），那么1*1 = 1，如果均为黑色，那么(-1)*(-1) = 1。不管哪种情况，每一对能够匹配上的像素，其相乘结果为1。类似地，任何不匹配的像素相乘结果为-1。如果一个feature（比如n*n）内部所有的像素都和原图中对应一小块（n*n）匹配上了，那么它们对应像素值相乘再累加就等于n2，然后除以像素点总个数n2，结果就是1。同理，如果每一个像素都不匹配，那么结果就是-1。具体过程如下：

对于中间部分，也是一样的操作：

最后整张图算完，大概就像下面这个样子：

然后换用其他feature进行同样的操作，最后得到的结果就是这样了：

为了完成我们的卷积，我们不断地重复着上述过程，将feature和图中每一块进行卷积操作。最后通过每一个feature的卷积操作，我们会得到一个新的二维数组。这也可以理解为对原始图像进行过滤的结果，我们称之为feature map，它是每一个feature从原始图像中提取出来的“特征”。其中的值，越接近为1表示对应位置和feature的匹配越完整，越是接近-1，表示对应位置和feature的反面匹配越完整，而值接近0的表示对应位置没有任何匹配或者说没有什么关联。

这样我们的原始图，经过不同feature的卷积操作就变成了一系列的feature map。我们可以很方便，直观地将这整个操作视为一个单独的处理过程。在CNN中，我们称之为卷积层(convolution layer)，这样你可能很快就会想到后面肯定还有其他的layer。没错，后面会提到。我们可以将卷积层看成下面这个样子：

因此可想而知，CNN其实做的操作也没什么复杂的。但是尽管我们能够以这一点篇幅就描述了CNN的工作，其内部的加法，乘法和除法操作的次数其实会增加地很快。从数学的角度来说，它们会随着图像的大小，每一个filter的大小和filter的数目呈线性增长。由于有这么多因素的影响，很容易使得这个问题的计算量变得相当的庞大，这也难怪很多微处理器制造商现在都在生产制造专业的芯片来跟上CNN计算的需求。

池化（Pooling）

Pooling

CNN中使用的另一个有效的工具被称为“池化(Pooling)”。池化可以将一幅大的图像缩小，同时又保留其中的重要信息。池化背后的数学顶多也就是小学二年级水平。它就是将输入图像进行缩小，减少像素信息，只保留重要信息。通常情况下，池化都是2*2大小，比如对于max-pooling来说，就是取输入图像中2*2大小的块中的最大值，作为结果的像素值，相当于将原始图像缩小了4倍。(注：同理，对于average-pooling来说，就是取2*2大小块的平均值作为结果的像素值。)

对于本文的这个例子，池化操作具体如下：

不足的外面补"0"：

经过最大池化操作（比如2*2大小）之后，一幅图就缩小为原来的四分之一了：

然后对所有的feature map执行同样的操作，得到如下结果：

因为最大池化（max-pooling）保留了每一个小块内的最大值，所以它相当于保留了这一块最佳的匹配结果（因为值越接近1表示匹配越好）。这也就意味着它不会具体关注窗口内到底是哪一个地方匹配了，而只关注是不是有某个地方匹配上了。这也就能够看出，CNN能够发现图像中是否具有某种特征，而不用在意到底在哪里具有这种特征。这也就能够帮助解决之前提到的计算机逐一像素匹配的死板做法。

当对所有的feature map执行池化操作之后，相当于一系列输入的大图变成了一系列小图。同样地，我们可以将这整个操作看作是一个操作，这也就是CNN中的池化层(pooling layer)，如下：

通过加入池化层，可以很大程度上减少计算量，降低机器负载。

Normalization

激活函数Relu（Rectified Linear Unites）

这是一个很小但是很重要的操作，叫做Relu(Rectified Linear Units)，或者修正线性单元。它的数学公式也很简单:

![][01]
[01]:http://latex.codecogs.com/png.latex?f(x)%20=%20max(0,%20x)

对于输入的负值，输出全为0，对于正值，原样输出。关于其功能，更多详见这里（https://link.jianshu.com/?t=http://cs231n.github.io/neural-networks-1/）。

下面我们看一下本文的离例子中relu激活函数具体操作：

最后，对整幅图操作之后，结果如下：

同样地，在CNN中，我们这一系列操作视为一个操作，那么就得到Relu Layer，如下：

Deep Learning

最后，我们将上面所提到的卷积，池化，激活放在一起，就是下面这个样子：

然后，我们加大网络的深度，增加更多的层，就得到深度神经网络了：

然后在不同的层，我们进行可视化，就可以看到本文开头提到的先验知识里面的结果了：

全连接层

根据结果判定为"X"：

在这个过程中，我们定义这一系列操作为”全连接层“(Fully connected layers)：

全连接层也能够有很多个，如下：

【综合上述所有结构】

这一整个过程，从前到后，被称作”前向传播“，得到一组输出，然后通过反向传播来不断纠正错误，进行学习。

反向传播

此处数学原理可以参见：深度学习 —— 反向传播理论推导.

Gradient Descent Optimizer

Hyperparameters

Application

Images

Soung

Text

Learn more

If you'd like to dig deeper into deep learning, check out my Demystifying Deep Learning post. I also recommend the notes from the Stanford CS 231 course by Justin Johnson and Andrej Karpathy that provided inspiration for this post, as well as the writings of Christopher Olah, an exceptionally clear writer on the subject of neural networks.

If you are one who loves to learn by doing, there are a number of popular deep learning tools available. Try them all! And then tell us what you think.

Caffe（https://link.jianshu.com/?t=http://caffe.berkeleyvision.org/）

CNTK（https://link.jianshu.com?t=https://github.com/Microsoft/CNTK）

Deeplearning4j（https://en.wikipedia.org/wiki/Deeplearning4j）

TensorFlow（https://link.jianshu.com/?t=http://www.tensorflow.org/）

Theano（https://en.wikipedia.org/wiki/Theano_(software)）

Torch（https://en.wikipedia.org/wiki/Torch_(machine_learning)）

Many others（http://deeplearning.net/software_links/）

I hope you've enjoyed our walk through the neighborhood of Convolutional Neural Networks. Feel free to start up a conversation.

Brandon Rohrer

本文重点在前面的具体操作部分，所以后面的部分没有细说，只是带过了，如有必要，后期会逐渐完善，谢谢！

Reference：

http://brohrer.github.io/how_convolutional_neural_networks_work.html
深度学习 —— 反向传播理论推导

原文链接：http://www.jianshu.com/p/fe428f0b32c1

查阅更为简洁方便的分类文章以及最新的课程、产品信息，请移步至全新呈现的“LeadAI学院官网”：

www.leadai.org

请关注人工智能LeadAI公众号，查看更多专业文章

你可能感兴趣的:(透析 | 卷积神经网络CNN究竟是怎样一步一步工作的？)

springMvc36-JavaEE-JSP基础-EL表达式和JSTL标签库(Taglibs) 前端歌谣 java java-ee servlet
EL表达式和JSTL标签库:在JSP页面代替java代码,便于编写一.EL表达式作用:${}简化脚本表达式j2ee1.4以前版本需指定j2ee1.4以后版本默认支持EL表达式1.EL内置对象EL内置11个对象,不需定义可直接使用pageScope获取page域属性组成的MaprequestScope获取reqeust域属性组成的MapsessionScope获取session域属性组成的Mapap
OTSU算法（大津算法）理解&代码当代女大学生机器学习 python 计算机视觉算法
OTSU算法：对图像进行二值化的算法介绍OTSU算法是一种自适应的阈值确定的方法，又称大津阈值分割法，是最小二乘法意义下的最优分割。它是按图像的灰度特性，将图像分成背景和前景两部分。因方差是灰度分布均匀性的一种度量,背景和前景之间的类间方差越大,说明构成图像的两部分的差别越大,当部分前景错分为背景或部分背景错分为前景都会导致两部分差别变小。因此,使类间方差最大的分割意味着错分概率最小。从大津法的原
18、企业级服务-JMS 跟着汪老师学编程 java 开发语言 java-ee
JavaMessageService(JMS)一.引言JavaMessageService(JMS)是Java平台上用于实现消息orientedmiddleware（消息中间件）的标准API。它为企业级应用中的异步通信提供了一种高效、灵活且可靠的方式，允许不同的系统组件之间通过发送和接收消息进行通信，而无需直接依赖彼此的实现细节。JMS支持两种主要的消息模型：点对点（Point-to-Point，
13、JavaEE核心技术 - Servlet与JSP 跟着汪老师学编程 java java-ee servlet
二、JavaEE核心技术-Servlet与JSP一、ServletServlet（服务器端小程序）是JavaEE中用于处理HTTP请求的核心组件。它是一个Java类，运行在Web服务器上，负责接收和响应HTTP请求。1.Servlet的生命周期Servlet的生命周期由以下几个阶段组成：初始化阶段（Initialization）：触发：当Servlet容器（如Tomcat）启动时，或者当第一次请求
C++设计模式-观察者模式：从基本介绍，内部原理、应用场景、使用方法，常见问题和解决方案进行深度解析牵牛老人 C++专栏 c++设计模式观察者模式
一、基本介绍1.1模式定义与核心思想观察者模式（ObserverPattern）是一种行为型设计模式，它定义了对象间一对多的依赖关系。当被观察对象（Subject）状态改变时，所有依赖它的观察者（Observer）都会自动收到通知并更新。这种模式类似于报纸订阅机制——报社发布新刊时，所有订阅者都会收到最新报纸。1.2模式价值体现解耦利器：将事件发布者与订阅者解耦，提升系统扩展性动态响应：支持运行时
C++设计模式-工厂模式：从原理、适用场景、使用方法，常见问题和解决方案深度解析牵牛老人 C++专栏 c++设计模式开发语言
一、工厂模式的核心原理工厂模式是一种创建型设计模式，其核心思想是通过将对象创建的职责从客户端代码中剥离，交由专门的工厂类来管理。这种模式通过"封装对象创建过程"特性，实现了以下设计原则：开放封闭原则工厂模式允许系统在不修改已有代码的前提下扩展新的产品类型。如处理器内核的生产案例中，新增型号只需扩展新工厂而非修改原有逻辑。单一职责原则创建对象的逻辑集中在工厂类中，客户端只需关注接口调用，避免了对象构
ESP-IDF中FreeRTOS的三种任务调度算法蓝天居士 ESP-IDF ESP32-S3 ESP32-C3 ESP-IDF
本文内容参考：STM32F103移植FreeRTOS必须搞明白的系列知识---2（FreeRTOS任务优先级）_freertos最多支持多少个任务-CSDN博客浅析FreeRTOS任务调度器的三种调度算法和应用-电子发烧友网特此致谢！FreeRTOS中的任务调度算法FreeRTOS支持多种任务调度算法，可通过配置来满足不同应用的需求。可以通过配置configUSE_PREEMPTION和confi
flutter 专题七十九 Flutter使用JsBridge方式处理Webview与H5通信 leluckys Flutter面试与实战 flutter
目前，移动跨平台开发作为移动开发的重要组成部分，是移动开发者必须掌握的技能，也是自我提升的重要手段。作为Google推出的跨平台技术方案，Flutter具有诸多的优势，已经或正在被广大开发者应用在移动应用开发中。在过去的2019年，我看到越来越多的公司和个人开始使用Flutter来开发跨平台应用，对于移动应用开发来说，Flutter能够满足几乎所有的业务开发需求，所以，学习Flutter正当时。众
flutter 专题三十七 Flutter混合开发之FlutterFragment leluckys Flutter面试与实战 flutter gitee
我们知道，原生Android集成Flutter主要有两种方式，一种是创建fluttermodule，然后以原生module那样依赖；另一种方式是将fluttermodule打包成aar，然后在原生工程中依赖aar包，官方推荐aar的方式接入。如何在原生Android工程中以aar的方式接入Flutter，大家可以参考我之前文章的介绍：原生Android工程接入Flutteraar。今天想给大家分享
flutter跑马灯我是刘成 flutter flutter flutter跑马灯
flutter_marqueeflutter插件flutter跑马灯可以指定跑马灯的方向可以传入数组，可以是自定义的widget可以控制跑马灯的时间间隔控制点击事件等等效果图githttps://github.com/LiuC520/flutter_marquee引入:dependencies:flutter:sdk:flutterflutter_marquee:git:https://githu
用Python打造AI玩家：挑战2048，谁与争锋穿梭的编织者人工智能 python
文章目录一、创作背景二、效果图三、准备工作1.安装Chrome和ChromeDriver2.安装Python库四、代码说明‌1.init_driver函数‌2.play_2048函数‌五、完整代码六、改进版本七、主要模块八、核心算法分析1.棋盘状态获取2.位置权重系统3.连续性评估4.单调性评估5.移动模拟系统九、评估系统1.评估标准2.决策机制十、性能优化1.延迟控制2.错误处理十一、完整代码编
java零到一：Servlet和JSP-12： jstl和el表达式注意以及servlet的mvc模式慕容屠苏 java基础零到一
1、在javaee5.0及以上版本当中，如果要使用jstl和el表达式，应该注意的问题:1)常识javaee1.4---->servlet2.4(tomcat5.5)javaee5.0---->servlet2.5(tomcat6.0)sun公司在发布javaee5.0时，已经将jstl对应的jar文件合并到javaee5.0当中了，所以，不必拷贝2)解决方式:方式一:建议使用tomcat6.0及
OnionArch 项目教程宁彦腾
OnionArch项目教程OnionArchA.NETCoredemoapplicationwhichusestheOnionArchitecture项目地址:https://gitcode.com/gh_mirrors/on/OnionArch1.项目介绍OnionArch是一个基于.NETCore的演示应用程序，采用了洋葱架构（OnionArchitecture）。洋葱架构是一种软件设计模式，
openharmony5.0中HDF驱动框架源码梳理-服务管理接口咸鱼过江 openharmony5.0 harmonyos hdf框架 linux
要想大概了解一个公司，我们可能只需要知道它的运行逻辑即可，例如我们只需要知道它有财务有研发有运营等，财务报销、研发负责产品等即可，但是如果想深入具体的了解的话我们就要了解都有什么部门(对象)、各部门都包含哪些职责(对象方法)以及各部门都包含哪些关键人员(子对象)以及他们的职责(子对象方法)，根据这个逻辑我大概整理了openharmony5.0的HDF框架中包含的关键对象以及对应的方法，便于更深的理
怎样通过企业数据资产管理推动企业数字化转型阿桂天山数据资产化理论篇
企业数据资产管理在推动企业数字化转型中发挥着关键作用，以下是其主要推动方式：1.提升数据质量数据资产管理通过对数据进行清洗、整合和标准化处理，消除数据冗余和错误，提高数据的准确性和一致性。这为企业后续的数据分析和应用奠定了坚实基础，确保企业能够基于高质量的数据做出科学决策。2.促进数据共享与协同在数字化转型过程中，企业内部不同部门之间的数据共享和协同至关重要。数据资产管理通过建立统一的数据标准和规
在 MacOS 上安装 Flutter：M1、M2 和 M3 芯片指南知识大胖 Flutter开发教程大全 macos flutter
简介Flutter是一个强大的跨平台开发框架，但在搭载M1、M2或M3芯片的Mac上设置它可能比您想象的要复杂得多。在本指南中，我将引导您完成整个过程，重点介绍我最初遇到的步骤，以帮助您避免同样的陷阱。推荐文章《Flutter应用中的GooglePay和ApplePay集成应用中的支付(教程含源码)》权重2，支付类《Flutter技巧之在Flutter中使一行按钮具有相同的宽度》《Flutter教
QT编程之图像数据操作（QImage、QPixmap、QBitmap、QPicture） byxdaz QT qt 开发语言
一、介绍Qt一共提供了四个这样继承QPaintDevice的绘图设备类，分别是：QPixmap、QBitmap、QImage和QPicture。其中：QPixmap专门为图像在屏幕上的显示做了优化。QBitmap是QPixmap的一个子类，它的色深限定为1，你可以使用QPixmap的isQBitmap()函数来确定这个QPixmap是不是一个QBitmap。QImage专门为图像的像素级访问做了优
OpenCV学习(二十一) ：计算图像连通分量:connectedComponents(),connectedComponentsWithStats() Leon_Chen0 OpenCV
OpenCV学习(二十一)：计算图像连通分量:connectedComponents(),connectedComponentsWithStats()1、connectedComponents()函数ConnectedComponents即连通体算法用id标注图中每个连通体，将连通体中序号最小的顶点的id作为连通体的id。如果在图G中，任意2个顶点之间都存在路径，那么称G为连通图，否则称该图为非连
数据结构与算法——数据结构4 写代码写到手抽筋数据结构与算法数据结构
程序员没有稳定一说，目前学习数据结构，其实不难，最近在学习，系统性的总结下，便于后续复习和使用。主要是把线性表，全名为线性存储结构。使用线性表存储数据的方式可以这样理解，即“把所有数据用一根线儿串起来，再存储到物理空间中”。分为顺序表和单链表。顺序表单链表同时还要知道顺序表和链表的优缺点【待补充】还要知道链表反转，知道迭代法和递归法就可以【】还需要知道单链表相交的思路【】后边了解静态链表的原理静态
JavaEE基础八之EL与JSTL相关知识(过时不谈) ZHWVICDI Java EE JavaEE EL表达式 JSTL
EL功能动态输出内容替代JSP中的表达式元素简化jsp主要就是取值一般格式${EL表达式}内置对象牢记！！因为其他也是差不多param/paramValues方便输出请求参数pageScope/requestScopre/sessionScope/applicationScope输出各范围的属性header/headerValues与请求头相关cookie/initParampageContext
LVS、Haproxy、Nginx区别 SHISHIZHIZHI nginx 负载均衡服务器
LVS、Haproxy、Nginx区别一、Haproxy调度算法1.常见的web集群调度器2.Haproxy应用分析3.Haproxy调度算法原理4.Haproxy的主要特性5.Haproxy的优点6、LVS.Haproxy、Nginx区别二、Haproxy优化三、Haproxy日志1.修改主配置文件2.修改rsyslog配置一、Haproxy调度算法1.常见的web集群调度器目前常见的web集群
Flutter项目升级Xcode 16.2之后编译问题 Cao_Shixin攻城狮 Flutter flutter xcode
最近好久没升级Xcode了，升级了一下最新的16.2之后。发现Flutter项目在iOS设备上运行不起来了。报错：查了许多网友也遇到了，其中一个解决方案：https://stackoverflow.com/questions/79118572/xcode-16-and-ios-18-project-not-compiling有效。，通过设置DerivedData的路径：设置为工作文件路径。有三个选
Python爬虫相关内容猫猫头有亿点炸 python 爬虫开发语言
一、打开源代码的方式鉴于时间过很久后我们可能会忘记的源代码位置所以写下以下文章便于实时查看:一般有两种方法打开源代码:第一是f12第二右键查看网页源代码二、特殊情况第三种情况当你用爬虫爬取内容的时候可能用xpath还是匹配不到任何结果因为页面可能会自动刷新所以使用xpath的时候匹配不到任何内容查找源代码的示例图片三、解决办法这个时候你可以先->f12(笔记本电脑fn+f12)再->ctrl+sh
Ook密码快速辨认与解密迷茫&&前行密码解密 Ook密码
一.Ook在线解密网站Ook解密1Ook解密2二.Ook密码辨认Ook密码是一种基于Ook语言的编程语言，由DavidMorgan-Mar设计，灵感来自TerryPratchett的《碟形世界》系列中的猩猩语言。其特点如下：极简语法：仅包含三个基本符号：Ook.、Ook?、Ook!，通过不同组合表达指令。基于Brainfuck：Ook密码与Brainfuck一一对应，每个Ook指令对应一个Brai
（大模型微调大模型学习路线大模型入门）_大模型学习，吹爆！2025最详细的大模型学习路线已整理！手把手带你高效入门，大模型论文全打通！大模型老炮学习人工智能大模型学习 AI 大模型大模型微调大模型教程
一、初聊大模型1、什么是大模型？大模型，通常指的是在人工智能领域中的大型预训练模型。你可以把它们想象成非常聪明的大脑，这些大脑通过阅读大量的文本、图片、声音等信息，学习到了世界的知识。这些大脑（模型）非常大，有的甚至有几千亿个参数，这些参数就像是大脑中的神经元，它们通过复杂的计算来理解和生成语言、图片等。举个例子，你可能听说过GPT-3，它就是一个非常著名的大模型。GPT-3可以通过理解你提出的问
lvs、nginx、haproxy区别和使用场景？企鹅侠客 linux 聊聊运维 lvs nginx 运维
0.运维干货分享软考系统架构设计师三科备考经验附学习资料信息安全管理体系（ISMS）制度模板分享免费文档翻译工具(支持word、pdf、ppt、excel)PuTTY中文版安装包MobaXterm中文版安装包pinginfoview网络诊断工具中文版LVS（LinuxVirtualServer）、Nginx和HAProxy都是常见的负载均衡工具，它们在不同的场景中各有优势。以下是它们的区别、特点及
牛客练习赛135——小柒的逆序对(2) KyollBM 算法数据结构
这里还得说一下，调换一个排列中任意两个不同的数，该排列的逆序数奇偶会改变题目：思路：这道题的数据给的很大，如果我们用树状数组维护前缀和都没用，但是我们观察到英文字符只有26个，那我们可以开一个二维数组g[i][j]表示ij字符对有多少个如何维护这个数组呢，其实也很简单，遍历s每个字符c，同时开一个数组储存26个字符对于字符c，先遍历26个字符y，将g[y][c]加上y的个数，结束后再将c的数量加一
16、JavaEE核心技术-EL与 JSTL 跟着汪老师学编程 java-ee java
EL与JSTL实践一.EL（ExpressionLanguage）EL（表达式语言）是JSP2.0中引入的一种简单的脚本语言，用于在JSP页面中简化数据的访问和显示。它通过一种类似于JavaScript的语法，允许开发者在JSP页面中直接访问JavaBean的属性、集合、甚至是Java类的静态字段和方法。1、EL的基本语法EL表达式的语法格式为${}，例如：${requestScope.userN
OTSU算法（大津算法）天行者@ 算法 opencv 人工智能二值化
Otsu算法（大津算法）是一种经典的图像二值化方法，其核心是通过最大化类间方差自动确定全局阈值。以下是其具体工作原理和步骤：1.基本思想假设图像由前景（目标）和背景两部分组成，且两者的灰度分布存在明显差异（直方图呈现双峰）。Otsu算法通过寻找一个阈值，使得前景与背景之间的类间方差最大，从而将图像分割为二值图。2.数学推导（1）计算灰度直方图统计图像中每个灰度值的像素个数，得到直方图h[i]（i为
OnionArch：构建高效.NET Core应用的洋葱架构模板樊慈宜Diane
OnionArch：构建高效.NETCore应用的洋葱架构模板项目地址:https://gitcode.com/gh_mirrors/on/OnionArch项目介绍OnionArch是一个基于.NETCore的演示应用程序，采用了经典的洋葱架构（OnionArchitecture）。洋葱架构是一种分层架构模式，通过将核心业务逻辑与外部依赖（如数据库、UI等）分离，使得应用程序更加模块化、可维护和
Enum用法不懂事的小屁孩 enum
以前的时候知道enum，但是真心不怎么用，在实际开发中，经常会用到以下代码: protected final static String XJ = "XJ"; protected final static String YHK = "YHK"; protected final static String PQ = "PQ";
【Spark九十七】RDD API之aggregateByKey bit1129 spark
1. aggregateByKey的运行机制 /** * Aggregate the values of each key, using given combine functions and a neutral "zero value". * This function can return a different result type
hive创建表是报错： Specified key was too long; max key length is 767 bytes daizj hive
今天在hive客户端创建表时报错，具体操作如下 hive> create table test2(id string); FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask. MetaException(message:javax.jdo.JDODataSto
Map 与 JavaBean之间的转换周凡杨 java 自省转换反射
最近项目里需要一个工具类，它的功能是传入一个Map后可以返回一个JavaBean对象。很喜欢写这样的Java服务，首先我想到的是要通过Java 的反射去实现匿名类的方法调用，这样才可以把Map里的值set 到JavaBean里。其实这里用Java的自省会更方便，下面两个方法就是一个通过反射，一个通过自省来实现本功能。 1：JavaBean类 1 &nb
java连接ftp下载 g21121 java
有的时候需要用到java连接ftp服务器下载，上传一些操作，下面写了一个小例子。 /** ftp服务器地址 */ private String ftpHost; /** ftp服务器用户名 */ private String ftpName; /** ftp服务器密码 */ private String ftpPass; /** ftp根目录 */ private String f
web报表工具FineReport使用中遇到的常见报错及解决办法（二）老A不折腾 finereport web报表 java报表总结
抛砖引玉，希望大家能把自己整理的问题及解决方法晾出来，Mark一下，利人利己。出现问题先搜一下文档上有没有，再看看度娘有没有，再看看论坛有没有。有报错要看日志。下面简单罗列下常见的问题，大多文档上都有提到的。 1、没有返回数据集：在存储过程中的操作语句之前加上set nocount on 或者在数据集exec调用存储过程的前面加上这句。当S
linux 系统cpu 内存等信息查看墙头上一根草 cpu 内存 liunx
1 查看CPU 　　1.1 查看CPU个数　　# cat /proc/cpuinfo | grep "physical id" | uniq | wc -l 　　2 　　**uniq命令：删除重复行;wc –l命令：统计行数** 　　1.2 查看CPU核数　　# cat /proc/cpuinfo | grep "cpu cores" | u
Spring中的AOP aijuans spring AOP
Spring中的AOP Written by Tony Jiang @ 2012-1-18 （转）何为AOP AOP，面向切面编程。在不改动代码的前提下，灵活的在现有代码的执行顺序前后，添加进新规机能。来一个简单的Sample: 目标类： [java] view plain copy print ? package&nb
placeholder(HTML 5) IE 兼容插件 alxw4616 JavaScript jquery jQuery插件
placeholder 这个属性被越来越频繁的使用. 但为做HTML 5 特性IE没能实现这东西. 以下的jQuery插件就是用来在IE上实现该属性的. /** * [placeholder(HTML 5) IE 实现.IE9以下通过测试.] * v 1.0 by oTwo 2014年7月31日 11:45:29 */ $.fn.placeholder = function
Object类,值域,泛型等总结(适合有基础的人看) 百合不是茶泛型的继承和通配符变量的值域 Object类转换
java的作用域在编程的时候经常会遇到,而我经常会搞不清楚这个问题,所以在家的这几天回忆一下过去不知道的每个小知识点变量的值域; package 基础; /** * 作用域的范围 * * @author Administrator * */ public class zuoyongyu { public static vo
JDK1.5 Condition接口 bijian1013 java thread Condition java多线程
Condition 将 Object 监视器方法（wait、notify和 notifyAll）分解成截然不同的对象，以便通过将这些对象与任意 Lock 实现组合使用，为每个对象提供多个等待 set （wait-set）。其中，Lock 替代了 synchronized 方法和语句的使用，Condition 替代了 Object 监视器方法的使用。条件（也称为条件队列或条件变量）为线程提供了一
开源中国OSC源创会记录 bijian1013 hadoop spark MemSQL
一.Strata+Hadoop World（SHW）大会是全世界最大的大数据大会之一。SHW大会为各种技术提供了深度交流的机会，还会看到最领先的大数据技术、最广泛的应用场景、最有趣的用例教学以及最全面的大数据行业和趋势探讨。二.Hadoop &nbs
【Java范型七】范型消除 bit1129 java
范型是Java1.5引入的语言特性，它是编译时的一个语法现象，也就是说，对于一个类，不管是范型类还是非范型类，编译得到的字节码是一样的，差别仅在于通过范型这种语法来进行编译时的类型检查，在运行时是没有范型或者类型参数这个说法的。范型跟反射刚好相反，反射是一种运行时行为，所以编译时不能访问的变量或者方法(比如private)，在运行时通过反射是可以访问的，也就是说，可见性也是一种编译时的行为，在
【Spark九十四】spark-sql工具的使用 bit1129 spark
spark-sql是Spark bin目录下的一个可执行脚本，它的目的是通过这个脚本执行Hive的命令，即原来通过 hive>输入的指令可以通过spark-sql>输入的指令来完成。 spark-sql可以使用内置的Hive metadata-store，也可以使用已经独立安装的Hive的metadata store 关于Hive build into Spark
js做的各种倒计时 ronin47 js 倒计时
第一种：精确到秒的javascript倒计时代码 HTML代码: <form name="form1"> <div align="center" align="middle"
java-37.有n 个长为m+1 的字符串，如果某个字符串的最后m 个字符与某个字符串的前m 个字符匹配，则两个字符串可以联接 bylijinnan java
public class MaxCatenate { /* * Q.37 有n 个长为m+1 的字符串，如果某个字符串的最后m 个字符与某个字符串的前m 个字符匹配，则两个字符串可以联接， * 问这n 个字符串最多可以连成一个多长的字符串，如果出现循环，则返回错误。 */ public static void main(String[] args){
mongoDB安装开窍的石头 mongodb安装基本操作
mongoDB的安装 1:mongoDB下载 https://www.mongodb.org/downloads 2:下载mongoDB下载后解压
[开源项目]引擎的关键意义 comsci 开源项目
一个系统，最核心的东西就是引擎。。。。。而要设计和制造出引擎，最关键的是要坚持。。。。。。现在最先进的引擎技术，也是从莱特兄弟那里出现的，但是中间一直没有断过研发的
软件度量的一些方法 cuiyadll 方法
软件度量的一些方法http://cuiyingfeng.blog.51cto.com/43841/6775/在前面我们已介绍了组成软件度量的几个方面。在这里我们将先给出关于这几个方面的一个纲要介绍。在后面我们还会作进一步具体的阐述。当我们不从高层次的概念级来看软件度量及其目标的时候，我们很容易把这些活动看成是不同而且毫不相干的。我们现在希望表明他们是怎样恰如其分地嵌入我们的框架的。也就是我们度量的
XSD中的targetNameSpace解释 darrenzhu xml namespace xsd targetnamespace
参考链接: http://blog.csdn.net/colin1014/article/details/357694 xsd文件中定义了一个targetNameSpace后，其内部定义的元素，属性，类型等都属于该targetNameSpace,其自身或外部xsd文件使用这些元素，属性等都必须从定义的targetNameSpace中找：例如：以下xsd文件，就出现了该错误，即便是在一
什么是RAID0、RAID1、RAID0+1、RAID5，等磁盘阵列模式? dcj3sjt126com raid
RAID 1又称为Mirror或Mirroring，它的宗旨是最大限度的保证用户数据的可用性和可修复性。 RAID 1的操作方式是把用户写入硬盘的数据百分之百地自动复制到另外一个硬盘上。由于对存储的数据进行百分之百的备份，在所有RAID级别中，RAID 1提供最高的数据安全保障。同样，由于数据的百分之百备份，备份数据占了总存储空间的一半，因而，Mirror的磁盘空间利用率低，存储成本高。 Mir
yii2 restful web服务快速入门 dcj3sjt126com PHP yii2
快速入门 Yii 提供了一整套用来简化实现 RESTful 风格的 Web Service 服务的 API。特别是，Yii 支持以下关于 RESTful 风格的 API：支持 Active Record 类的通用API的快速原型涉及的响应格式（在默认情况下支持 JSON 和 XML) 支持可选输出字段的定制对象序列化适当的格式的数据采集和验证错误
MongoDB查询(3)——内嵌文档查询（七） eksliang MongoDB查询内嵌文档 MongoDB查询内嵌数组
MongoDB查询内嵌文档转载请出自出处：http://eksliang.iteye.com/blog/2177301 一、概述有两种方法可以查询内嵌文档：查询整个文档；针对键值对进行查询。这两种方式是不同的，下面我通过例子进行分别说明。二、查询整个文档例如:有如下文档 db.emp.insert({ &qu
android4.4从系统图库无法加载图片的问题 gundumw100 android
典型的使用场景就是要设置一个头像，头像需要从系统图库或者拍照获得，在android4.4之前，我用的代码没问题，但是今天使用android4.4的时候突然发现不灵了。baidu了一圈，终于解决了。下面是解决方案： private String[] items = new String[] { "图库","拍照" }; /* 头像名称 */
网页特效大全 jQuery等 ini JavaScript jquery css html5 ini
HTML5和CSS3知识和特效 asp.net ajax jquery实例分享一个下雪的特效 jQuery倾斜的动画导航菜单选美大赛示例你会选谁 jQuery实现HTML5时钟功能强大的滚动播放插件JQ-Slide 万圣节快乐！！！向上弹出菜单jQuery插件 htm5视差动画 jquery将列表倒转顺序推荐一个jQuery分页插件 jquery animate
swift objc_setAssociatedObject block(version1.2 xcode6.4) 啸笑天 version
import UIKit class LSObjectWrapper: NSObject { let value: ((barButton: UIButton?) -> Void)? init(value: (barButton: UIButton?) -> Void) { self.value = value
Aegis 默认的 Xfire 绑定方式，将 XML 映射为 POJO MagicMa_007 java POJO xml Aegis xfire
Aegis 是一个默认的 Xfire 绑定方式，它将 XML 映射为 POJO, 支持代码先行的开发.你开发服务类与 POJO,它为你生成 XML schema/wsdl XML 和注解映射概览默认情况下，你的 POJO 类被是基于他们的名字与命名空间被序列化。如果
js get max value in (json) Array qiaolevip 每天进步一点点学习永无止境 max 纵观千象
// Max value in Array var arr = [1,2,3,5,3,2];Math.max.apply(null, arr); // 5 // Max value in Jaon Array var arr = [{"x":"8/11/2009","y":0.026572007},{"x"
XMLhttpRequest 请求 XML,JSON ,POJO 数据 Luob. POJO json Ajax xml XMLhttpREquest
在使用XMlhttpRequest对象发送请求和响应之前，必须首先使用javaScript对象创建一个XMLHttpRquest对象。 var xmlhttp； function getXMLHttpRequest(){ if(window.ActiveXObject){ xmlhttp:new ActiveXObject("Microsoft.XMLHTTP
jquery wuai jquery
以下防止文档在完全加载之前运行Jquery代码，否则会出现试图隐藏一个不存在的元素、获得未完全加载的图像的大小等等 $(document).ready(function(){ jquery代码; }); <script type="text/javascript" src="c:/scripts/jquery-1.4.2.min.js&quo