量子位

LeCun亲授的深度学习入门课：从飞行器的发明到卷积神经网络

Root 编译整理
量子位出品 | 公众号 QbitAI

深度学习和人脑有什么关系？计算机是如何识别各种物体的？我们怎样构建人工大脑？

这是深度学习入门者绕不过的几个问题。很幸运，这里有位大牛很乐意为你讲解。

2月6日，UCLA（加州大学洛杉矶分校）与纯数学与应用数学研究所（IPAM）跨界组织主办的论坛上，“卷积神经网络之父”Yann LeCun操着一口浓重的法国口音，给数学界的科学家们介绍了深度学习。

LeCun从鸟类对飞行器发明的影响开始讲起，层层递进、逐步深入到深度学习的本质，可以说非常新手友好了。

机不可失，还不来围观这堂由大神亲自授课的深度学习入门指南？

快去搬凳抢座！

量子位首先搬运了全程视频（当然，是生肉）：

class="video_iframe" data-vidtype="2" allowfullscreen="" frameborder="0" data-ratio="1.7647058823529411" data-w="480" data-src="http://v.qq.com/iframe/player.html?vid=j0554ksial2&width=670&height=376.875&auto=0" style="display: none; width: 670px !important; height: 376.875px !important;" width="670" height="376.875" data-vh="376.875" data-vw="670"/>

当然，还整理了讲座的主要内容：

今天在座的都是数学大神。

我呢，既不是数学家，也没拿诺贝尔奖。感觉站这儿份量不太够。

以前专业是工程学，不过炸过一些东西，后来就转软件了（不然世界怎么样就不好说了）。

今天来，给大家简单介绍一下深度学习。

但我们不从AI开始讲起，而是从人类发明飞行器开始讲。

依照达芬奇飞行器草图做的第一款飞行器，完全照搬了鸟类的外形。那时候根本不知道飞行底层的原理，所以只能从自然界的生物获得灵感，照葫芦画瓢。

第一次飞行，只成功离地15公分，还是20公分的样子，飞行器就挂了。所以我们还是需要更系统的方法，就是后来莱特兄弟造飞行器用到的一套方法，飞行终于成为了现实。

一般来说，理论认知都是在实践积累之后才有的。

飞行就说这么多。

那么问题来了。

人工智能可以从大自然里获得灵感吗？

很明显，这个想法很旧啦。我们先看一下生物界的智能体。

人类的大脑，差不多有850亿个神经元。而每个神经元都有上万个突触，在一千到十万个之间不等。人脑相当高效，能耗才25瓦特，是PC的十分之一。

每个有大脑的动物都能学习，不同动物的学习方式可能不同，有些比较简单。它们并不需要特别好的视觉，或者其他智能体的教导，就能自己去学。

我们尝试找出动物学习的机制，然后用来训练机器学习。

慢慢地，从1940年起，就有了打造智能机器的想法。于是就冒出来了感知机（Perceptron）。

它不是一台计算机，而是一个计算机模拟器。输入值是电压，超过某个阈值，就打开。低于阈值，就关闭。而权重是可以被训练的，就像一个可旋转调节的钮。

尽管现在我们可以用三行Python代码实现它，但在那年代已经算是大型的计算机了。

这个感知机是怎么运转起来的呢？

原理是很简单的，你需要先集齐一堆训练数据。

比如说任务是图像识别，那么输入就是图像的一个个像素。当每个像素用0，1表示时，那么就可以组成一串数字。

你给机器一张图，字母A，然后输出应该是1。那么训练的时候，就读取图像中的像素，调高那些能增强最终结果是1，也就是判定字母是A的像素的权重，并调低偏离最终结果的像素的权重。

数学上只需要一行Python代码就可以搞定。

事实上，虽然这个办法是直觉上想出来的，但后来几年发现这个问题可以总结成几个方程，也是受到了生物学的启发。

我们回到人的大脑是怎么学习的。

每个神经元是通过突触来连接其他神经元，从而传递信号。

但数学上，这个概念被简化了，将感知机里的权重看成一个个的旋钮。

对于具体的输入，根据输出的错误再调参数，训练，重复，直到目标函数的值越来越小（目标函数的值，表示的是你得到的输出和你想要的输出的差值）。

这叫做梯度下降（gradient descent），依然是很简单的数学问题。

举个稍微复杂一点的例子，我们要做一个图片分类器，辨识汽车、飞机、椅子等物体。

它们的外观千变万化，我们怎样让计算机认出每一类物体呢？

这需要依赖大量的手动调整。给系统一张车的照片，如果系统将它认成车，红灯亮起。如果红灯不亮，就调整这些按钮，让红灯的亮度增强；输入飞机的图片，调整按钮，让绿灯亮度增强。

输入足够多的训练数据不停调整按钮，直到机器能够辨认出来它从来没见过的相片为止，那么就算训练成功了。

你们肯定会问，这个能识别图像的神秘盒子里到底装了什么？

这个答案，在过去的几十年里，一直在变。

传统的模式识别，是给它一张图，然后过一个特征提取器。这个特征提取器是人工搭建的，把这些图像的像素变成一串数字，然后用简单的算法吸收消化，得到这张图的内容。这种方法在深度学习出现以前一直都在用。

而深度学习是把模块分成可以被训练的好几层。就像视觉信号的传递一样，需要多步来提取信息。

下一个我们要问的问题是，我们应该往这些可训练的模块箱里放什么东西？

“多层”的概念是50年代提出的，到80年代时用的人稍微多了起来。

每一层都是由简单的单元组成，而单元又是基于上一层的输入，经过不同程度的权重处理得到的。然后如果值超过阈值，就继续往下走，低于阈值就不取。

那么，我们要如何训练机器呢？

这其实是不断调小偏差的过程。问题的关键在于往什么方向调整参数、调整到什么程度，才可以拿到我们想要的输出。

1980年，这个问题才有了解决方案。

这个方案是一个复杂的数学概念的实际应用，叫链式法则（Chain rule）。

当你有一个网络的时候，你有的是连续的功能区块（Functional block）。

每一个区块或者做矩阵乘法，或者是给每个输入做一个非线性的运算。我们来看看系统之中分离出来的一个区块。

你可以简单地算出来输出值。比如说这是一个线性的矩阵乘法模块，参数乘以向量，这样你就能拿到输出的向量。这两个区块有不一样的维度。

现在假设，对于每个向量中任何元素的调整，我们都知道损失会往什么方向变化。

损失函数的斜率，表示的是我们得到的输出和我们想要输出的差值。通过计算，可以得出图中绿色的向量，从上到下计算一个递归公式，通过反向传播，就能得到cost和所有模块相关的梯度。

很多现在的平台，在你写程序定义网络后，都可以自动运行反向传播，计算梯度。

这些问题都解决了之后呢，我们就可以建一个人工的大脑了吗？

要知道，人脑每秒可以做10的17次方的运算，神经元数量达到10的11次方。

我们来看一款运算速度很快的芯片。右下角的英伟达Titan-V，这个GPU每秒可做10的15次方运算，比人脑要慢100倍。

所以大家算算，即使芯片的速度翻一倍要18个月的话，那还要多长时间能达到和我们人脑一样？如果要让芯片在合理的大小范围的话，我认为我们还要等多几十年。

但这个不是主要问题。主要问题是我们不知道怎么编程它们、怎么训练它们、训练原则是什么。

这个GPU很便宜，才3000刀，但是现在大家都在买来挖矿，所以已经买不到了。

我说过很多次了，如果在我职业生涯中，能够造一个智能体，像大鼠一样具有常识，我会感到很开心很满足。我们现在也许有相应的算力了，但我们还没有搞清楚潜在原则。现在是这个底层原理限制住了。

好啦，现在我们来跳出来看看生物还有没有给我们别的启发。

Hubel & Wiesel 1962这个生物研究工作太有名了，大家都知道的，是70年代拿了诺贝尔奖的。工作本身是在60年代做的，是视觉信号传递的生理结构。

简单的细胞检测位置信息，复杂的细胞整合简单细胞受到刺激的信息。

所以，如果有一个特殊的动机，稍微移动一点，复杂细胞都会被激活。

Fukushima 1982年造了一个计算模型，就是描述简单细胞和复杂细胞之间的层级关系。这个是80年代的工作，那时候还没有合适的学习算法。所以用了其他的非监督型算法。

后来，我受到这个算法启发，造了一个含有相似构造的网络，用反向传播算法来训练，就是我们平时说的卷积神经网络（CNN）。

下面是卷积神经网络的示意图。

图像中的像素会激活CNN中的单元。但我不敢称他们为神经元，不然神经科学家会不爽。因为比起神经元来说，这些单元实在是太简单了。

每个单元，看起来像patch。这些单元会和阈值比，比他们高，就打开。低的话就关上。

可以看到这个用激光笔指出的patch是系数。

左边这个是输入patch，把系数向量和输入向量乘在一起。用系数把整个输入刷一遍，然后你记录就能得到右边的结果。

如果它们能够匹配的话，就得到高度激活的结果，不匹配就得到非激活的结果。

这在数学上就叫做离散型卷积。

经过了层层卷积核的系数处理，最后得到的是最右边的压缩过的信息。

我们90年代中期的时候弄了一个很牛的模型。不仅能够认出来一个字母，还能认出多个字母，还不用先分割开。当时如果用经典数学算法就必须先分割。

等到无法从图像中分割出物体时，我们模型的重要性就显现出来了。

这个模型中每一层都是卷积的，同时进行分割和识别。

这是那个时候年轻的我，把一张纸条放在一个摄像头下面，然后按一下键盘。这是1993年的时候（嘴上说的是1992年）。

这是我在新泽西的时候贝尔实验室那会儿的电话号码，现在已经不用了。

在几秒钟之内，就可以处理图像，识别出数字。

训练数据量不用很多，哪怕是很小的、不同的手写体，都能识别成这样，效果很不错了。

为了以合适的速度跑起来这个程序，我们用了特殊的硬件DSP 32C，速度可到 20 FLOPS。最后，我们用这个造了一个可以识别支票的系统。于1996年左右开始铺开使用。

到90年代末，这套系统已经在处理10%到20%左右的支票了。如果你够老的话，也许你的支票被这套系统读取过。

这么看，这套系统还是挺成功的。可惜在90年代中期，在机器学习圈里，大家对神经网络的热情消失了。

很大一个原因是，这套系统需要大量的计算力投入才软件系统里。这样才有可能跑起来。

这一切都发生在MATLAB、微软系统、Linux出现之前，AT&T都还没公开相应的硬件资源。没有大型计算机，或大型数据集，大家做这个都只能靠直觉。

其实在那个时候，很多东西都很玄学，我们并不能从数学的角度去解释他们。

不能解释背后的原理的话，就没办法形成一套理论。没有理论就很混乱，都发不了文章。

哪怕事实上，这些方法是可用的，但是也被抛弃了。

不过我们当中的某些人，知道，这方法最终还是会回来的。因为在某些情况下，这套方法是更好的。

因为它们会自己学习，不仅仅是识别图像，还能够抽象地表示这个世界。它们能够找到事物的本质，然后找到不同部分之间的联系，然后组装成以个整体。它们做的事情很强大，所以也需要更多的数据。

在1996年和2002年之间，我几乎停止了这方面的研究，改做图像压缩。

2003年的时候我又开始搞回这个了。我们做了一辆有两个摄像头小车，让人来控制它，当距离障碍物2米的时候，我们会控制它向左转或向右转来避开障碍物。然后，我们训练一个CNN来看两个摄像头采到的画面，去预测方向盘转向的角度。

只需要20分钟的训练数据，这个CNN就可以自己开车了！遇到障碍物的时候，它会自行转向避开。

在这套系统的启发下，DARPA举办了LAGR（Learning Applied to Ground Vehicles），一个150万美元的项目。

你可以看到这个机器人有四个摄像头，内部装了三台计算机，可以在自然环境中自动行驶。我们训练了一个CNN，让它告诉我们在画面上，哪些区域是可以顺利通过的。

使用传统的立体视觉成像技术，也能实现这个功能。但是，立体成像很贵，工作范围也很有限，大概能做到10米的距离。

这就是CNN的一种用途。

很快我们就意识到，不能只是标记一个区域能不能通过，更有意思的是，看图中的某些像素属于哪个物体。（物体识别分类）。

举个例子来说，这些是天，树，窗，路等等。

这是有人骑着自行车上路拍到的第一人称视角画面，这个算法不能说完美，它认为这里是沙漠，实际上在曼哈顿不可能有沙漠。

不过，它识别行人等主要目标的能力都不错，而且即使在普通电脑上跑，也比当时最领先的系统快100倍。这个算法让很多人产生了灵感，认为我们能把它用到无人驾驶上。

2014年，有两个公司很快就把这个技术拿过去用了。一个是MobilEye，另一个是Nvidia。

2010年之前，这些研究都在低调地进行着，后来，事情有了变化。

2011年的时候，深度学习在语音识别上有了重大的进展。

在2012年年底，深度学习在ImageNet比赛上一举成名。ImageNet数据集包含1000类物体的130万张照片，传统图像分类算法在这个数据集上取得的最低错误率大约是26%。

2012年，一个多伦多大学做出来的大型CNN，将错误率降到了15%。他们是第一个正式用GPU跑这么大的CNN的团队。

于是，突然之间，整个计算机视觉领域都开始使用这项技术。我从来没见过一个研究领域如此快速地从一种技术转向另一种。

其实就在2011年，我们还提交了一篇论文到CVPR。这篇论文打败了当时最好的记录，但是却被拒了。因为那个时候人们都不相信CNN能取得这么好的成绩。因为大家没见过，于是，他们就主观臆断地认为我们犯规了之类的。

但是3年之后，世道完全反过来了。你不用CNN，文章都不可能被接收。

不过这也不是一件好事。因为这样会灭杀多样性。讲这件事是想让大家知道，这在当时是一个多么重大的革命。

这些网络都特别大，有上百万个按钮、单元和权重。网络的第一层检测的都是一些基本motif，比如边缘、线条等等。

有的CNN多达50层，甚至更多。为什么我们需要这么多层？

神经网络的多层架构对应着数据的组成型结构，不同层检测不同的特征，比如线条、边缘等底层特征，圆圈、弧线、角等中层特征，更接近图形的高层特征。

这个世界的所有事物呈现都是分层的。比如文本，就是从字母，字，词，从句，句子，段落组成的。

爱因斯坦曾经说过，这个世界最不可思议的事，是所有东西都是可以被理解的。

世界上最令人费解的事情是，世界是可以理解的。

过去几年大量的公司做了很多努力，让这些技术落地，并规模化。

开始列举最近各种研究进展

比如说，我们现在用256个CNN，1小时就能完成在整个ImageNet上的训练，错误率达到23.74。

计算机视觉的最前沿研究Mask R-CNN，可以做物体分割，关键点检测，人体姿态捕捉等等。用Sparse ConvNet还可以做3D语义分割——

另外，CNN还能用在和视觉没什么关系的领域，比如做翻译。这对于Facebook来说很有用，帮助用户翻译短篇的文章。

今天分享提到的很多资料，都是开源的。

卷积神经网络可以应用在很多领域，比如在无人驾驶上，可以帮机器用视觉感知环境。在医学影像、基因学、物理学等等各种领域都有应用，而且几乎每天都有新的落地领域出现。

深度学习不仅能感知，还能推理。

比如说，我们可以根据一张图片，提出问题，

下图中方块的数量比黄色的物体多吗？

如果是人类来回答这个问题，需要分别数一数方块和黄色物体的数量，然后比较这两个数量的大小。

对于神经网络来说，就需要一个模块来分类出方块和黄色物体，另一个模块来数数，还需要一个模块比较大小给出答案。

这个神经网络是动态的会随着输入的变化而变化，输入会决定神经网络的架构。

另外，用记忆模块来增强神经网络也是一个很有意思的研究方向。

在讲座中，立昆老师又提到了他最近推崇的可微分编程。感兴趣的同学可以阅读之前的文章，以及自行看视频。

最后，立昆老师还强调了一点：目前，机器并没有通用的智能，也没有尝常识。

— 完 —

加入社群

量子位AI社群13群开始招募啦，欢迎对AI感兴趣的同学，加小助手微信qbitbot5入群；

此外，量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募，面向正在从事相关领域的工程师及研究人员。

进群请加小助手微信号qbitbot5，并务必备注相应群的关键词~通过审核后我们将邀请进群。（专业群审核较严，敬请谅解）

诚挚招聘

量子位正在招募编辑/记者，工作地点在北京中关村。期待有才气、有热情的同学加入我们！相关细节，请在量子位公众号(QbitAI)对话界面，回复“招聘”两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

通用 Makefile 模板想和我重名？小Tips 开发语言 linux
一个简单的Makefile模版#=============================================================================#示例项目结构:#my_project/#├──Makefile#├──src/#│├──main.c#│└──module1.cpp#└──include/#├──my_header.h#└──module1.h
VSCode - 使用 WSL（Windows Subsystem for Linux） anleng6817 开发工具 git
一开始我是只将VSCode集成的终端改成WSL的Bash，结果发现内置的GIt用的还是Windows的Git，GitHooks用的Windows的环境，上网搜了一下发现有很复杂的方式，继续翻了翻发现管饭居然有超好用的方式DevelopingintheWindowsSubsystemforLinuxwithVisualStudioCode（虽然有大神指出这种方式还有有难用的地方。。）总之安装Remo
kotlin协程的使用详解
一、协程是什么协程基于线程，它是轻量级线程。Kotlin协程是一种基于挂起函数（suspendfunctions）和结构化并发（structuredconcurrency）的轻量级并发编程模型，允许开发者以接近同步代码的简洁方式编写异步、非阻塞的逻辑。其核心是通过协作式任务调度（而非抢占式线程切换），在单线程或多线程环境中高效管理并发任务，避免传统线程的资源消耗和复杂性，同时提供直观的错误处理和生
动态规划1：爬楼梯问题追梦_逐影动态规划算法
1.看力扣这道题2.我们可以把楼梯数简化出来输入012345输出1123583.不难看出，其实就是斐波那契数列，这种题有两种解法，一种是递归，另一种则是动态规划4.动态规划可以节约时间复杂度5.下面请看解法，定义数组a[0],a[1]=1;,作为初始值，然后每次依次遍历后面的值，最终，返回a[n]则为第n阶所需要的方法数classSolution{inta[50];public:intclimbS
2024年Python最新统信UOS_麒麟KYLINOS上安装特定版本python_统信uos安装python 2401_84558914 程序员 python linux 服务器
准备解压…/16-libidn2-dev_2.0.5.1-1+dde_amd64.deb…正在解压libidn2-dev:amd64(2.0.5.1-1+dde)…/var/cache/apt/archives/libidn2-dev_2.0.5.1-1+dde_amd64.deb正在选中未选择的软件包libp11-kit-dev:amd64。准备解压…/17-libp11-kit-dev_0.2
JVM——垃圾回收五月茶 JVM jvm
在Java开发中，JVM不仅负责运行Java字节码，还通过自动内存管理机制帮助开发者避免手动内存管理的复杂性。1.JVM内存模型JVM的内存模型主要包括以下几个部分：方法区(JDK8之后叫元空间):存储类信息，常量池，静态变量堆：所有线程共享的一块内存区域，存放对象实例栈：线程私有程序计数器：线程私有，记录当前线程执行的字节码行号本地方法栈：为Native方法服务2.Java堆的划分年轻代Surv
LeetCode 70：爬楼梯｜递归到动态规划全路径解析 kiki_2411 算法设计与分析 leetcode 动态规划算法
本篇博客将通过LeetCode第70题“ClimbingStairs”为例，系统讲解从递归暴力解法到记忆化搜索、再到动态规划及空间优化的四种典型思路，适合算法初学者深入掌握递归与DP基础。文章目录LeetCode70|爬楼梯一、题目描述二、思路分析三、方法一：递归（不带记忆）思路C++代码四、方法二：递归+记忆化搜索（Top-DownDP）思路五、方法三：动态规划（Bottom-Up）思路六、方法
ADB 安装 APK 及处理安装弹窗的方法要站在顶端 APP自动化 adb
ADB安装APK及处理安装弹窗的方法总结✅背景说明在自动化测试或CI流程中（如JenkinsPipeline），我们经常需要通过ADB安装APK。但在某些设备上，安装过程会弹出“继续安装”按钮或其他确认界面，导致安装命令阻塞，无法继续执行后续操作。为此，我们需要：避免安装卡住自动点击安装按钮（如果必须）保证脚本兼容性（尤其适配Windows+Jenkins）方法一：使用adbinstall-r--
[论文阅读] 人工智能 + 软件工程 | 代码注释不一致问题研究：从数据革新到端到端解决方案张较瘦_ 前沿技术论文阅读人工智能软件工程
代码注释不一致问题研究：从数据革新到端到端解决方案原文：CCISOLVER:End-to-EndDetectionandRepairofMethod-LevelCode-CommentInconsistencyarXiv:2506.20558CCISolver:End-to-EndDetectionandRepairofMethod-LevelCode-CommentInconsistencyRe
LabVIEW实现SSB调制解调技术的详细教程九门提督守皇上
本文还有配套的精品资源，点击获取简介：本文详细探讨了在LabVIEW环境下实现单边带调制（SSB）的技术和原理。SSB是一种高效且广泛应用于无线电通信的模拟调制技术。通过LabVIEW的虚拟仪器（VI）编程，可以完成包括信号生成、预处理、调制、滤波、存储或发送以及接收、反向调制、解调和后处理在内的完整SSB调制解调过程。这些步骤对于优化通信系统和提高通信效率至关重要。1.SSB调制解调技术概述1.
ASP学生信息管理系统完整实施指南带虾条酱
本文还有配套的精品资源，点击获取简介：ASP学生信息管理系统，基于ActiveServerPages技术，为学校优化学生信息管理，提高工作效率。系统功能涵盖班级管理、成绩跟踪、权限设置等。各组件如list_fenban.asp、xj_update.asp、xj_add.asp、admin_user.asp、funoperate.asp、list_check_upd.asp、list_check_a
Android开发：管理设备配置更改与广播接收器
背景简介在Android开发中，确保应用在面对设备配置更改时数据不丢失，以及高效地管理网络请求，是提升用户体验的关键。本篇博客将基于《AndroidDeveloperFundamentalsCourse(V2)》课程内容，探讨如何使用AsyncTaskLoader来处理数据持久化问题，以及如何利用广播接收器来响应系统广播和自定义广播。使用AsyncTaskLoader进行数据持久化当用户旋转设备屏
TCP/UDP通信调试实战工具
本文还有配套的精品资源，点击获取简介：TCP调试助手是一款旨在协助程序员和网络管理员进行TCP和UDP协议调试的网络通信工具。TCP作为一种面向连接、可靠的协议，具有诸如连接管理、数据分片与重组、流量和拥塞控制等特点。该工具支持TCPServer和TCPClient两种模式，允许用户模拟服务器和客户端进行通信测试。同时，它也支持UDP通信模式，适合实时性要求高而数据完整性要求不高的场合。通过TCP
昌乐一中2021年高考成绩查询,2021年潍坊高考各高中成绩及本科升学率数据排名及分析... 带虾条酱
一、潍坊高考各高中成绩及本科升学率数据2020山东高考省前50名最多的是烟台一中，共有7位进入其次是淄博实验中学4位，潍坊一中3位，潍坊一中的孟令昊同学取得了711分的高分，(语文125分、数学150分、英语145分、物理98分、化学97分、地理96分)为山东目前最高分。临沂有1位，来自郯城一中！山东省前50名分布烟台一中788人报考，680分以上的33人临沂一中3077人报考，660分以上25人
指数计算机在线使用,ffmi(在线ffmi指数计算器) 带虾条酱指数计算机在线使用
我们可用FatFreeMassIndex(FFMI)无脂肪重量指数来做为一个衡量肌瘦肉量的基准。不像BMI会把脂肪算到重量里，FFMI在测量进展和潜力上是更有实用性的。FFMI的.彭于晏的体型用FatFreeMassIndex(FFMI)无脂肪重量指数来看应该是处于20左右，而26是不依赖药物所能达到的极限了，所以算是很不错的了。专业健美运动员都是用.首先讲一点，当年的施瓦辛格也是使用固醇类药物的
b树与b+树的区别 Senkorl MySQL b树数据结构 mysql
B树和B+树都是平衡树的一种，广泛应用于数据库和文件系统中。它们的主要区别在于结构和性能优化上。以下是B树和B+树的主要区别：1.结构差异B树：节点存储键和值：B树的每个节点不仅存储键，还存储与键关联的数据（值）。叶子节点和内部节点都可以存储数据。多层次的值存储：数据可能存储在内节点或叶子节点，因此查找时可能会终止于非叶节点。B+树：节点只存储键，值存储在叶子节点：B+树的内部节点只存储键，数据（
深入理解HashMap：从数据结构到高并发战场达利源 java面试题哈希算法散列表算法
以下是我在财税业务中的自我体会：一、核心矛盾与设计哲学想象一个存放千万级纳税人信息的仓库（Map）。你需要：极速存取：输入ID，瞬间定位到对象。动态扩容：纳税人数量激增时，仓库能自动变大。空间高效：避免仓库大部分区域空置。线程安全(可选)：多窗口（线程）同时办理业务不混乱。HashMap的答卷：核心武器：数组+链表/红黑树灵魂算法：哈希函数(HashFunction)扩容策略：负载因子(LoadF
【MySQL】事务七七&556 面试学习路线阿里巴巴 mysql 数据库
MySQL(六)事务一、事务的特性1.原子性2.一致性3.持久性4.隔离性4.1无隔离4.1.1隔离级别4.1.2执行效果4.2写加锁4.2.1隔离级别4.2.2脏读解决4.2.3执行效果4.3读加锁4.3.1不一致解决4.3.2执行效果4.4读写加锁4.4.1隔离级别4.4.2不可重复读解决4.4.3执行效果4.5串行化4.5.1隔离级别4.5.2幻读解决4.5.3执行效果二、事务的使用1.开启
[由浅入深理解神经网络] 2 张量流与反向传播
由浅入深理解神经网络2张量流与反向传播0前言1张量流和运算图2复合函数视角2.1复合函数求导2.1.1链式法则2.1.2多元函数的链式法则2.2前馈网络的反向传播2.3任意网络的反向传播3结语0前言在由浅入深理解神经网络1一个简单到极致的神经网络中,我们已经发现了训练神经网络最重要的一件事,那就是求梯度,然后优化算法利用梯度来调整网络参数.我们重写一下前面提到的一个通用的神经网络:y=f(x;θ)
spring 面试题爆爆凯 spring 数据库 java
一、Spring基础概念什么是Spring框架？Spring是一个开源的Java应用程序框架，它提供了一种轻量级的、非侵入式的方式来构建企业级应用。Spring的核心功能包括依赖注入（DependencyInjection，DI）、面向切面编程（Aspect-OrientedProgramming，AOP）、事务管理、数据访问等，旨在简化企业级Java开发，提高开发效率和代码的可维护性。Sprin
【自用】git常用操作
Git常用操作1.vscode连接上远程容器后，使用git进行开发的大致流程2.PR中出现文件内容上传错误，此时还没有合入，如何修改这次PR？情况一：上次推送的本地仓库以及分支都还在情况二：本地仓库没有，需要重新拉取远程分支进行开发3.如何在本地开发代码进行版本管理（本地开发）示例工作流程常用指令如何基于某个分支创建一个新分支git配置如何设置理解`gitclone`理解`gitfetch`1.v
低代码数字孪生智慧钢厂组态监控界面图扑可视化三维可视化数字孪生数据大屏组态监控智慧钢厂
2024年4月，中国钢铁工业协会发布了《钢铁行业数字化转型评估报告（2023年）》（以下简称《报告》）。《报告》指出，绝大部分钢铁企业建立了数字化转型相关管理组织和团队，并加强其规划落实，系统间的综合集成能力进一步加强。在研发、制造、服务全生命周期管控以及产业链协同等方面需继续深化，这也是现阶段钢铁企业数字化转型需重点建设的内容。钢铁行业作为典型的流程制造业，通过融合先进的信息技术和大数据分析，既
C#索引和范围：简化集合访问的现代特性详解阿蒙Armon C#工作中的应用 c#开发语言
C#索引和范围：简化集合访问的现代特性详解在C#8.0中引入的索引（Index）和范围（Range）特性，为集合元素的访问提供了更简洁、直观的语法。无论是数组、列表还是字符串，这些特性都能大幅简化获取元素或子序列的代码，使开发者能够更专注于业务逻辑而非边界计算。本文将全面解析索引和范围的工作原理、使用方法及实战技巧，帮助你彻底掌握这一现代C#特性。一、索引：超越传统下标的访问方式传统上，C#通过从
C#最佳实践：仅暴露必须暴露的成员阿蒙Armon C#最佳实践 microsoft c#java javascript typescript
C#最佳实践：仅暴露必须暴露的成员在C#编程的复杂生态中，类成员的合理暴露是构建高质量代码的重要一环。“仅暴露必须暴露的成员”这一原则，如同守护代码城堡的卫士，能有效减少不必要的耦合，提升系统的安全性和稳定性。接下来，我们深入探讨这一原则在C#编程中的内涵、优势、应用场景及实践要点。一、理解“仅暴露必须暴露的成员”在C#中，一个类可以包含字段、属性、方法等多种成员。当我们将类的成员设置为publi
HarmonyOS Next 记事本应用开发实践鱼弦 harmonyos 华为
HarmonyOSNext记事本应用开发实践引言在移动互联网时代，记事本应用作为基础生产力工具，仍然是用户日常使用频率最高的应用类型之一。随着HarmonyOSNext的发布，华为推出了全新的应用开发框架和工具链，为开发者提供了构建全场景分布式应用的能力。本文将全面介绍基于HarmonyOSNext平台的记事本应用开发实践，从技术背景到具体实现，再到部署与优化，为开发者提供完整的开发指南。技术背景
Python 安装使用 tesseract OCR 识别中文花果山总钻风 Python/Flask Linux python ocr 开发语言
前言：i、中文识别效果更好的开源OCR库：CnOCR使用教程ii、6款开源中文OCR使用介绍（亲测效果）：点我查看iii、windows安装tesserract教程：windows安装：点我查看教程1、点我查看教程2windows安装完成，设置好环境变量后，报找不到路径的错误点这里：解决办法本文为CentOS下安装教程Tesseract的OCR引擎目前已作为开源项目发布在GoogleProject
UI前端与大数据的深度融合：打造智慧应用的新生态前端开发与ui设计的老司机 ui 前端大数据
hello宝子们...我们是艾斯视觉擅长ui设计、前端开发、数字孪生、大数据、三维建模、三维动画10年+经验!希望我的分享能帮助到您!如需帮助可以评论关注私信我们一起探讨!致敬感谢感恩!在数字化转型的浪潮中，UI前端与大数据正逐渐成为推动智慧应用发展的核心力量。UI前端作为用户与应用程序交互的直接界面，负责提供直观、便捷且吸引人的用户体验；而大数据则凭借其强大的数据收集、分析和预测能力，为应用程序
rabbitmq动态创建交换机、队列、动态绑定，销毁
//缓存已创建的绑定，避免重复声明privatefinalMapcreatedBindings=newConcurrentHashMapargs=newHashMap{@AutowiredRabbitMQServicerabbitMQService;@OverridepublicvoidonApplicationEvent(ListenerContainerConsumerFailedEvente
Django REST framework - 版本控制 djangopython
版本控制是一种礼貌地淘汰已部署客户端的方式。—RoyFielding。API版本控制允许你在不同客户端之间改变行为。RESTframework提供了多种不同的版本控制方案。版本控制由传入的客户端请求确定，可以基于请求URL或基于请求头。对于版本控制，有多种有效的实现方式。对于非版本化系统，如果是在设计长期系统且有多个不受控的客户端时，也可能适用。在RESTframework中实现版本控制当启用了A
Django REST framework - 元数据 pythondjango
[OPTIONS]方法允许客户端确定与资源相关联的选项和/或要求，或者服务器的能力，而不暗示资源操作或启动资源检索。——RFC7231，第4.3.7节。RESTframework包含一个可配置的机制，用于确定你的API应该如何响应OPTIONS请求。这允许你返回API模式或其他资源信息。目前没有被广泛采用的关于OPTIONS请求应该返回何种风格响应的确切约定，因此我们提供了一种临时风格，返回一些有
jQuery 键盘事件keydown ,keypress ,keyup介绍 107x js jquery keydown keypress keyup
本文章总结了下些关于jQuery 键盘事件keydown ,keypress ,keyup介绍，有需要了解的朋友可参考。一、首先需要知道的是： 1、keydown() keydown事件会在键盘按下时触发. 2、keyup() 代码如下复制代码 $('input').keyup(funciton(){
AngularJS中的Promise bijian1013 JavaScript AngularJS Promise
一.Promise Promise是一个接口，它用来处理的对象具有这样的特点：在未来某一时刻（主要是异步调用）会从服务端返回或者被填充属性。其核心是，promise是一个带有then()函数的对象。为了展示它的优点，下面来看一个例子，其中需要获取用户当前的配置文件： var cu
c++ 用数组实现栈类 CrazyMizzz 数据结构 C++
#include<iostream> #include<cassert> using namespace std; template<class T, int SIZE = 50> class Stack{ private: T list[SIZE];//数组存放栈的元素 int top;//栈顶位置 public: Stack(
java和c语言的雷同麦田的设计者 java 递归 scaner
软件启动时的初始化代码，加载用户信息2015年5月27号从头学java二 1、语言的三种基本结构：顺序、选择、循环。废话不多说，需要指出一下几点： a、return语句的功能除了作为函数返回值以外，还起到结束本函数的功能，return后的语句不会再继续执行。 b、for循环相比于whi
LINUX环境并发服务器的三种实现模型被触发 linux
服务器设计技术有很多，按使用的协议来分有TCP服务器和UDP服务器。按处理方式来分有循环服务器和并发服务器。 1 循环服务器与并发服务器模型在网络程序里面，一般来说都是许多客户对应一个服务器，为了处理客户的请求，对服务端的程序就提出了特殊的要求。目前最常用的服务器模型有： ·循环服务器：服务器在同一时刻只能响应一个客户端的请求 ·并发服务器：服
Oracle数据库查询指令肆无忌惮_ oracle数据库
20140920 单表查询 -- 查询************************************************************************************************************ -- 使用scott用户登录 -- 查看emp表 desc emp
ext右下角浮动窗口知了ing JavaScript ext
第一种 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/
浅谈REDIS数据库的键值设计矮蛋蛋 redis
http://www.cnblogs.com/aidandan/ 原文地址：http://www.hoterran.info/redis_kv_design 丰富的数据结构使得redis的设计非常的有趣。不像关系型数据库那样，DEV和DBA需要深度沟通，review每行sql语句，也不像memcached那样，不需要DBA的参与。redis的DBA需要熟悉数据结构，并能了解使用场景。
maven编译可执行jar包 alleni123 maven
http://stackoverflow.com/questions/574594/how-can-i-create-an-executable-jar-with-dependencies-using-maven <build> <plugins> <plugin> <artifactId>maven-asse
人力资源在现代企业中的作用百合不是茶 HR 企业管理
//人力资源在在企业中的作用人力资源为什么会存在，人力资源究竟是干什么的人力资源管理是对管理模式一次大的创新，人力资源兴起的原因有以下点：工业时代的国际化竞争，现代市场的风险管控等等。所以人力资源在现代经济竞争中的优势明显的存在，人力资源在集团类公司中存在着明显的优势(鸿海集团)，有一次笔者亲自去体验过红海集团的招聘，只知道人力资源是管理企业招聘的当时我被招聘上了，当时给我们培训的人
Linux自启动设置详解 bijian1013 linux
linux有自己一套完整的启动体系，抓住了linux启动的脉络，linux的启动过程将不再神秘。阅读之前建议先看一下附图。本文中假设inittab中设置的init tree为： /etc/rc.d/rc0.d /etc/rc.d/rc1.d /etc/rc.d/rc2.d /etc/rc.d/rc3.d /etc/rc.d/rc4.d /etc/rc.d/rc5.d /etc
Spring Aop Schema实现 bijian1013 java spring AOP
本例使用的是Spring2.5 1.Aop配置文件spring-aop.xml <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmln
【Gson七】Gson预定义类型适配器 bit1129 gson
Gson提供了丰富的预定义类型适配器，在对象和JSON串之间进行序列化和反序列化时，指定对象和字符串之间的转换方式， DateTypeAdapter public final class DateTypeAdapter extends TypeAdapter<Date> { public static final TypeAdapterFacto
【Spark八十八】Spark Streaming累加器操作（updateStateByKey) bit1129 update
在实时计算的实际应用中，有时除了需要关心一个时间间隔内的数据，有时还可能会对整个实时计算的所有时间间隔内产生的相关数据进行统计。比如：对Nginx的access.log实时监控请求404时，有时除了需要统计某个时间间隔内出现的次数，有时还需要统计一整天出现了多少次404，也就是说404监控横跨多个时间间隔。 Spark Streaming的解决方案是累加器，工作原理是，定义
linux系统下通过shell脚本快速找到哪个进程在写文件 ronin47
一个文件正在被进程写我想查看这个进程文件一直在增大找不到谁在写使用lsof也没找到这个问题挺有普遍性的，解决方法应该很多，这里我给大家提个比较直观的方法。 linux下每个文件都会在某个块设备上存放，当然也都有相应的inode, 那么透过vfs.write我们就可以知道谁在不停的写入特定的设备上的inode。幸运的是systemtap的安装包里带了inodewatch.stp，位
java-两种方法求第一个最长的可重复子串 bylijinnan java 算法
import java.util.Arrays; import java.util.Collections; import java.util.List; public class MaxPrefix { public static void main(String[] args) { String str="abbdabcdabcx";
Netty源码学习-ServerBootstrap启动及事件处理过程 bylijinnan java netty
Netty是采用了Reactor模式的多线程版本，建议先看下面这篇文章了解一下Reactor模式： http://bylijinnan.iteye.com/blog/1992325 Netty的启动及事件处理的流程，基本上是按照上面这篇文章来走的文章里面提到的操作，每一步都能在Netty里面找到对应的代码其中Reactor里面的Acceptor就对应Netty的ServerBo
servelt filter listener 的生命周期 cngolon filter listener servelt 生命周期
1. servlet 当第一次请求一个servlet资源时，servlet容器创建这个servlet实例，并调用他的 init(ServletConfig config)做一些初始化的工作，然后调用它的service方法处理请求。当第二次请求这个servlet资源时，servlet容器就不在创建实例，而是直接调用它的service方法处理请求，也就是说
jmpopups获取input元素值 ctrain JavaScript
jmpopups 获取弹出层form表单首先，我有一个div，里面包含了一个表单，默认是隐藏的，使用jmpopups时，会弹出这个隐藏的div，其实jmpopups是将我们的代码生成一份拷贝。当我直接获取这个form表单中的文本框时，使用方法：$('#form input[name=test1]').val()；这样是获取不到的。我们必须到jmpopups生成的代码中去查找这个值，$(
vi查找替换命令详解 daizj linux 正则表达式替换查找 vim
一、查找查找命令 /pattern<Enter> ：向下查找pattern匹配字符串 ?pattern<Enter>：向上查找pattern匹配字符串使用了查找命令之后，使用如下两个键快速查找： n：按照同一方向继续查找 N：按照反方向查找字符串匹配 pattern是需要匹配的字符串，例如： 1: /abc<En
对网站中的js,css文件进行打包 dcj3sjt126com PHP 打包
一，为什么要用smarty进行打包 apache中也有给js,css这样的静态文件进行打包压缩的模块，但是本文所说的不是以这种方式进行的打包，而是和smarty结合的方式来把网站中的js,css文件进行打包。为什么要进行打包呢，主要目的是为了合理的管理自己的代码。现在有好多网站，你查看一下网站的源码的话，你会发现网站的头部有大量的JS文件和CSS文件，网站的尾部也有可能有大量的J
php Yii: 出现undefined offset 或者 undefined index解决方案 dcj3sjt126com undefined
在开发Yii 时，在程序中定义了如下方式： if($this->menuoption[2] === 'test')，那么在运行程序时会报：undefined offset:2，这样的错误主要是由于php.ini 里的错误等级太高了，在windows下错误等级
linux 文件格式（1） sed工具 eksliang linux linux sed工具 sed工具 linux sed详解
转载请出自出处： http://eksliang.iteye.com/blog/2106082 简介 sed 是一种在线编辑器，它一次处理一行内容。处理时，把当前处理的行存储在临时缓冲区中，称为“模式空间”（pattern space），接着用sed命令处理缓冲区中的内容，处理完成后，把缓冲区的内容送往屏幕。接着处理下一行，这样不断重复，直到文件末尾
Android应用程序获取系统权限 gqdy365 android
引用如何使Android应用程序获取系统权限第一个方法简单点，不过需要在Android系统源码的环境下用make来编译： 1. 在应用程序的AndroidManifest.xml中的manifest节点
HoverTree开发日志之验证码 hvt .net C#asp.net hovertree webform
HoverTree是一个ASP.NET的开源CMS，目前包含文章系统，图库和留言板功能。代码完全开放，文章内容页生成了静态的HTM页面，留言板提供留言审核功能，文章可以发布HTML源代码，图片上传同时生成高品质缩略图。推出之后得到许多网友的支持，再此表示感谢！留言板不断收到许多有益留言，但同时也有不少广告，因此决定在提交留言页面增加验证码功能。ASP.NET验证码在网上找，如果不是很多，就是特别多
JSON API：用 JSON 构建 API 的标准指南中文版 justjavac json
译文地址：https://github.com/justjavac/json-api-zh_CN 如果你和你的团队曾经争论过使用什么方式构建合理 JSON 响应格式，那么 JSON API 就是你的 anti-bikeshedding 武器。通过遵循共同的约定，可以提高开发效率，利用更普遍的工具，可以是你更加专注于开发重点：你的程序。基于 JSON API 的客户端还能够充分利用缓存，
数据结构随记_2 lx.asymmetric 数据结构笔记
第三章栈与队列一．简答题 1. 在一个循环队列中，队首指针指向队首元素的前一个位置。 2.在具有n个单元的循环队列中，队满时共有 n-1 个元素。 3. 向栈中压入元素的操作是先移动栈顶指针&n
Linux下的监控工具dstat 网络接口 linux
1) 工具说明dstat是一个用来替换 vmstat,iostat netstat,nfsstat和ifstat这些命令的工具, 是一个全能系统信息统计工具. 与sysstat相比, dstat拥有一个彩色的界面, 在手动观察性能状况时, 数据比较显眼容易观察; 而且dstat支持即时刷新, 譬如输入dstat 3, 即每三秒收集一次, 但最新的数据都会每秒刷新显示. 和sysstat相同的是,
C 语言初级入门--二维数组和指针 1140566087 二维数组 c/c++指针
/* 二维数组的定义和二维数组元素的引用二维数组的定义：当数组中的每个元素带有两个下标时，称这样的数组为二维数组； (逻辑上把数组看成一个具有行和列的表格或一个矩阵); 语法：类型名数组名[常量表达式1][常量表达式2] 二维数组的引用：引用二维数组元素时必须带有两个下标，引用形式如下：例如： int a[3][4]; 引用：
10点睛Spring4.1-Application Event wiselyman application
10.1 Application Event Spring使用Application Event给bean之间的消息通讯提供了手段应按照如下部分实现bean之间的消息通讯继承ApplicationEvent类实现自己的事件实现继承ApplicationListener接口实现监听事件使用ApplicationContext发布消息

LeCun亲授的深度学习入门课：从飞行器的发明到卷积神经网络

Root 编译整理量子位 出品 | 公众号 QbitAI

量子位首先搬运了全程视频（当然，是生肉）：

当然，还整理了讲座的主要内容：

你可能感兴趣的:(LeCun亲授的深度学习入门课：从飞行器的发明到卷积神经网络)

Root 编译整理
量子位出品 | 公众号 QbitAI