中南大学苹果实验室

ssd : Single Shot MultiBox Detector

作者：18届 cyl

日期：2021-08-08

论文：《Single Shot MultiBox Detector》

期刊：ECCV

一、主要问题

1.SSD的检测结构(网络结构与简单的检测过程)
2.SSD如何检测目标(具体的检测过程)
3.SSD的训练过程

二、背景

1.目标检测近年来已经取得了很重要的进展，主流的算法主要分为两个类型：
(1)two-stage方法:以R-CNN系列框架为代表，其主要思路是先通过启发式方法（selective search）或者CNN网络产生一系列候选框，然后对这些候选框进行分类与回归，two-stage方法的优势是准确度高,但是在速度方面离实时效果还比较远。
(2)one-stage方法:以YOLO框架为代表，其主要思路是均匀地在图片的不同位置进行抽样(滑动窗口)，然后利用CNN提取特征后直接进行分类与回归，整个过程只需要一步，所以其优势是速度快，但缺陷是每个网格只能预测一个物体，容易造成漏检；且对于物体的尺度相对比较敏感，面对尺度变化较大的物体时泛化能力较差，同时检测精度上不来。
总结来说就是现在流行的目标检测系统大致都是如下步骤:先生成一些假设的 bounding boxes,然后在这些 bounding boxes 中提取特征，之后再经过一个分类器，来判断里面是不是物体，是什么物体(two-stage方法)。但这类方法有一个缺陷，就是所需要的计算时间太久了，不足以进行实时的检测。当然也有很多工作是朝着实时检测的目标迈进，但目前为止，都是牺牲检测精度来换取时间(one-stage方法)。
2.基于上述情况，在提高检测精度的同时兼顾检测速度逐渐成为神经网络目标检测领域的未来趋势，在这个趋势下，SSD成为了继YOLO之后又一个引人注目的目标检测框架，它沿用了YOLO中直接回归Bounding Box和分类概率的方法，同时又参考了Faster RCNN，大量使用anchor来提升识别准确度。通过把这两种结构相结合，SSD保持了很高的识别速度，还能把mAP(平均精度)提升到较高的水平。

三、检测结构

要了解SSD的目标检测结构，首先得来看一下SSD的网络结构图:

输入: 300x300的彩色图像。上面的网络一般被称为SSD300,顾名思义就是该网络的输入原图尺寸是300x300的彩色图像。
特征提取部分: 这一部分以VGG16作为基础网络,并将VGG16的两个全连接层换成了普通的卷积层(图中conv6和conv7),之后又接了多个卷积层(conv8_2,conv9_2,conv10_2)以获得更多的特征图用于检测。
输出: 经过最后一层池化之后，会输出8732个预测框(文中称为Default box，与Faster RCNN中的anchor概念是一样的)，然后网络会用一组小卷积滤波器对这些预测框进行对象类别和位置偏移的预测(分类和定位),经过NMS(非极大值抑制)算法之后输出检测结果.
这里引出SSD的核心思想->多尺度特征图检测:从网络结构图中可以看到,SSD并不是像yolo那样只使用最后一层输出的结果用于预测,而是将conv4_3、conv7、conv8_2、conv9_2、conv10_2、conv11_2都连接到了最后的检测分类层并输出8732个预测框做预测,原因是通过结合不同层、不同尺寸的feature map来做预测能提高对不同尺度目标的检测准确率。

上图是多尺度特征图检测的基本过程:
1.首先将一副 300x300 的彩色图像输入到预训练好的分类网络(改进的传统的VGG16 网络)中来获得不同大小的特征图；
2.然后抽取 Conv4_3、Conv7、Conv8_2、Conv9_2、Conv10_2、Conv11_2 层的 feature map ，分别在这些 feature map 上面的每一个单元( feature map cell )构造4个或6个不同尺度的 Default boxes ,这些默认框在每个不同特征图中有着不同的长宽比和尺寸，最后网络对这些默认框进行对象类别和位置偏移的预测。(和 yolo 基本相同)

3、将不同feature map 获得的Default boxes 结合起来，经过NMS （非极大值抑制）方法来抑制掉一部分重叠或者不正确的Default boxes ，生成最终的Default boxes 集合(即检测结果)。

四、SSD如何检测目标

1.抽取多个卷积层的特征图并同时做分类和位置回归

上面这张图是Yolo检测目标的经典理解,将一张图片划分为49个格子，每个格子生成2个bounding box用于预测。SSD也沿用了这个方法，只不过它是对多张不同尺寸的特征图生成多个默认框(用于生成bounding box)做预测。以下面这张图为例,可以看到，在进行卷积处理时,对不同尺度(这里以8x8和4x4为例)的特征图的每个单元都设置了4个不同长宽比和尺度的default box，对于每个default box，我们预测对所有对象类别（（c 1，c 2，…，c p）)相对于真实框的相对位置偏移和置信度(分类和定位)。

这里简单说一下抽取多个卷积层的特征图同时用于检测目标的好处是浅层的特征图尺寸大，可以划分更多的单元,适合识别尺寸较小的目标,深层的特征图尺寸小,但每个单元产生的box大,适合识别较大的目标。因此，如果我们同时在不同的feature map上面进行目标检测，理论上应该会获得更好的检测效果。

以SSD检测图(a)为例，浅层网络特征图很适合用来识别猫这一目标(蓝色方框)，但面对狗这一目标，选框尺寸显得太小无法很好地将目标检测到。而到了深层网络，由于特征图经过池化层后尺寸减小，感受野变大，因此，红色选框可以较准确地识别到狗。

Default box尺寸的确定
我们刚才说过,不同特征图的每个单元上的default box尺度和长宽比不同,而这部分参数也是人为设定的，文中遵循的原则是：随着特征图大小降低，先验框尺度线性增加 。根据这个原则，default box的尺度计算公式如下:

这里smin是0.2，表示最底层的scale是0.2,；smax是0.9，表示最高层的scale是0.9。(m为特征图的数量)
至于长宽比，论文中用ar表示，共选取了五种长宽比:

因此每个default box的宽的计算公式为:

高的计算公式为: （很容易理解宽和高的乘积是scale的平方）

另外当aspect ratio为1时，作者还增加一种scale的default box：

因此，对于每个feature map cell而言，一共有6种default box(有些是4个,没有生成尺度为3和1/3的框)。
SSD300一共可以预测的default box个数为：

总结: 可以看出这种default box在不同的特征层有不同的尺度(scale)，在同一个特征图层又有不同的长宽比(aspect ratio)，因此基本上可以覆盖输入图像中的各种形状和大小的目标。
到这里就完成了SSD检测的第一步,对所有用于检测的特征图生成了各个尺度和长宽比的预测框,接下来就是对这些框进行对象概率预测以及位置回归。
2.用卷积进行检测
yolo是使用全连接提取检测结果(输出7x7x30的张量),而SSD则是采用卷积对不同的特征图提取检测结果。

可以看到，SSD的检测过程并不复杂,唯一和yolo不同的是SSD对每一层特征图分别采用两个3x3的卷积滤波器进行卷积，这两个滤波器一个输出位置回归用的localization(如果某一层的default box是6个,那么就有6x4=24个卷积核,卷积后map的大小和卷积前一样,因为pad=1), 每个default box生成4个坐标值（x，y，w，h）。另一个输出分类用的confidence，每个default box生成21个confidence(这是针对VOC数据集包含20个对象类别而言的，另外一个是背景的分类)。

举个例子来说,就是对于在给定位置的k个框中,对每个框我们计算c个类别(包括背景)的置信度和相对于原始默认框的4个偏移量(x,y,w,h)。这使得在特征图中的每个位置需要总共(c+4)k个滤波器，对于m×n特征图产生*(c+4) k * m n**个输出。
**最终的预测输出：mm k*(n_label+4)**向量

(1)n_label个对象分类的概率
这里n_label是指数据集中所有对象的类别数目,SSD与Yolo一样都为20, 所以这里有21个值表示该网格位置存在任一种对象的概率(背景算作一类)。
(2)k个anchor的位置
每个anchor需要4个数值来表示其位置(x,y,w,h), k个anchor共需要4k个数值来表示其位置。这里拆分成了k个单独输出，因此每个输出包括类别(n_label)+4个anchor坐标,即(n_label+4)。每一个这样的单独输出都与一个anchor对应, 即与输入的一个固定的矩形区域对应. 如图所示, 每一个输出, 都对应输入图像的一个anchor.

五、SSD的训练过程

1.default box匹配
首先,在训练过程中,要确定训练图片中的真实目标(ground truth)与哪个默认框来进行匹配,与之匹配的默认框则负责预测这个对象。在YOLO中，ground truth的中心落在哪个单元格,该单元格中与其IOU最大的边界框负责预测它。但是在SSD 中却完全不一样，SSD的默认框与ground truth的匹配原则主要有两点:
(1)首先,从ground truth出发,寻找与每一个ground truth box有最大IoU的default box，这样能保证每一个ground truth至少能与一个default box对应起来,与guround truth匹配的被称作正样本。反之，若一个默认框没有与任何ground truth进行匹配，那么它只能与背景匹配，被称作负样本。而一个图片中ground truth是非常少的，但default box却很多，如果仅按第一个原则匹配，很多default box会是负样本，正负样本极其不平衡，所以需要第二个原则。
(2)从default box出发,将剩余还没有配对的default box与任意一个ground truth尝试配对,只要两者之间的IoU大于阈值,就进行匹配(SSD 300 阈值为0.5)。这意味着某个ground truth可能与多个default box匹配，这是可以的。但是反过来却不可以，因为一个default box只能匹配一个ground truth，如果多个ground truth与某个default box的 IOU 大于阈值，那么default box只与IOU最大的那个ground truth进行匹配。注意：第二个原则一定在第一个原则之后进行，仔细考虑一下这种情况，如果某个ground truth所对应最大 IOU小于阈值，并且所匹配的default box却与另外一个ground truth的 IOU大于阈值，那么该default box应该匹配谁，答案应该是前者，首先要确保某个ground truth一定有一个default box与之匹配。但是，这种情况基本上是不存在的，由于default box很多，某个ground truth的最大 IOU 肯定大于阈值，所以可能只实施第二个原则就可以了。
到这里，基本就已经完成了正样本和负样本的分类,配对到ground truth的default box就是正样本,没有配对到ground trurh的default box就是负样本,只有正样本才会参与loss的计算。

2.Hard negative mining:
值得注意的是，一般情况下负样本的数量会远远大于正样本的数量，若是直接训练会导致网络过于重视负样本，从而导致loss不稳定。为了保证正负样本尽量平衡，SSD在训练时采用了hard negative mining方法，即依据confidience loss对default box进行排序，挑选其中confidience loss高的box进行训练，将正负样本的比例控制在positive：negative=1:3。显而易见，用来训练网络的负样本为提取的负样本的子集，那么，我们当然选择负样本中容易被分错类的困难负样本来进行网络训练这样会取得更好的效果。
总结:hard negative mining就是对负样本进行抽样，抽样时按照置信度误差（预测背景的置信度越小，误差越大）进行降序排列，选取误差的较大的top-k作为训练的负样本，以保证正负样本比例接近1:3。
3.loss函数
总体目标损失函数是定位损失（loc）和置信度损失（conf）的加权和：

可以看到SSD的损失函数与一般的目标检测模型没什么区别,分为两部分: 计算相应的default box与目标类别的confidence loss以及相应的location loss(位置回归)。其中N是匹配到ground truth的default box数量(正样本),如果N=0，就将损失设为0。而 α 用于调整confidence loss和location loss之间的比例，默认 α=1。
对于位置误差，采用Smooth L1 loss(与Faster RCNN用的一样),对于置信度误差,其采用softmax loss。

采用Smooth L1 loss的原因主要是为了从两个方面限制梯度:
(1)当预测框与 ground truth 差别过大时，梯度值不至于过大；
(2)当预测框与 ground truth 差别很小时，梯度值足够小。
softmax损失的特点主要是可以让数值计算更加稳定，因为正指数概率可能会有非常大的值。

4.数据增强
SSD算法使用了多种数据增强的方法，包括水平翻转、裁剪、放大和缩小等。论文明确指出，数据增强可以明显的提高算法的性能(有实验证明)。主要的目的是为了使得该算法对输入的不同大小和不同形状的目标具有更好的鲁棒性。直观的理解是通过这个数据增强操作可以增加训练样本的个数，同时构造出更多的不同形状和大小的目标，将其输入到网络中，可以使得网络学习到更加鲁棒的特征。

检测结果对比：

SSD的优点:
因为同为one-stage方法(单网络)，运行速度可以和YOLO媲美，同时对于不同横纵比的object的检测都有效，这是因为算法对于每个feature map cell都使用多种横纵比和不同尺寸的default boxes，这也是本文算法的核心。
SSD的缺点:
1.需要人工设置default boxes的初始尺度和长宽比的值。网络中default boxes的基础大小和形状不能直接通过学习获得，而是需要手工设置。而网络中每一层 feature使用的default box大小和形状恰好都不一样，导致调试过程非常依赖经验。
2.对小尺寸的目标识别仍比较差，还达不到 Faster R-CNN 的水准。这主要是因为小尺寸的目标多用较低层级的特征来训练(因为小尺寸目标在较低层级IOU较大)，较低层级的特征非线性程度不够，无法训练到足够的精确度。

Nginx、Spring Cloud Gateway 与 Higress 的应用场景及核心区别拂晓神剑zzz nginx 运维
Nginx、SpringCloudGateway与Higress的应用场景及核心区别一、应用场景对比1.Nginx：传统Web服务与高性能反向代理典型场景：静态资源服务器（图片、CSS、JS）高并发Web服务反向代理（如JavaTomcat前端）简单负载均衡（轮询、IP哈希）传统企业网站、电商平台入口层优势：轻量级、低资源消耗，单机可处理万级并发稳定可靠，适合长期运行的静态服务社区成熟，插件生态丰
开源的APP+小程序商城源码推荐，可支持二次开发。 yuhuidog 开源APP商城源码小程序商城源码来客电商 saas新功能
今天我给大家介绍一款基于PHP开发的电商平台框架，可快速二次开发！用户体验还可以~全网比较shao见的Saas移动电商平台源码。系统特点：1、VueCLI框架，完全实现前后端分离，完善的API文档2、标准接口3、支持队列4、长链接5、无缝事件机制6、支持分布式部署7、基于SAAS源码服务8、N多插件扩展：拼团+分销+多店+会员电商+线下核销+拍卖+砍价等9、支持支付宝小程序+微信小程序+andro
【机器学习笔记 Ⅱ】11 决策树模型巴伦是只猫机器学习机器学习笔记决策树
决策树模型（DecisionTree）详解决策树是一种树形结构的监督学习模型，通过一系列规则对数据进行分类或回归。其核心思想是模仿人类决策过程，通过不断提问（基于特征划分）逐步逼近答案。1.核心概念节点类型：根节点：起始问题（最佳特征划分点）。内部节点：中间决策步骤（特征判断）。叶节点：最终预测结果（类别或数值）。分支：对应特征的取值或条件判断（如“年龄≥30？”）。2.构建决策树的关键步骤(1)
【机器学习笔记 Ⅱ】10 完整周期
机器学习的完整生命周期（End-to-EndPipeline）机器学习的完整周期涵盖从问题定义到模型部署的全过程，以下是系统化的步骤分解和关键要点：1.问题定义（ProblemDefinition）目标：明确业务需求与机器学习任务的匹配性。关键问题：这是分类、回归、聚类还是强化学习问题？成功的标准是什么？（如准确率>90%、降低10%成本）输出：项目目标文档（含评估指标）。2.数据收集（DataC
【机器学习笔记Ⅰ】13 正则化代价函数
正则化代价函数（RegularizedCostFunction）详解正则化代价函数是机器学习中用于防止模型过拟合的核心技术，通过在原始代价函数中添加惩罚项，约束模型参数的大小，从而提高泛化能力。以下是系统化的解析：1.为什么需要正则化？过拟合问题：当模型过于复杂（如高阶多项式回归、深度神经网络）时，可能完美拟合训练数据但泛化性能差。解决方案：在代价函数中增加对参数的惩罚，抑制不重要的特征权重。2.
【机器学习笔记Ⅰ】6 多类特征巴伦是只猫机器学习机器学习笔记人工智能
多类特征（Multi-classFeatures）详解多类特征是指一个特征（变量）可以取多个离散的类别值，且这些类别之间没有内在的顺序关系。这类特征是机器学习中常见的数据类型，尤其在分类和回归问题中需要特殊处理。1.核心概念(1)什么是多类特征？定义：特征是离散的、有限的类别，且类别之间无大小或顺序关系。示例：颜色：红、绿、蓝（无顺序）。城市：北京、上海、广州（无数学意义的大小关系）。动物类别：猫
图像分割技术详解：从原理到实践 lanjieying
本文还有配套的精品资源，点击获取简介：图像分割是图像处理领域将图像分解为多个区域的过程，用于图像分析、特征提取等。文章介绍了图像分割的原理，并通过一个将图像划分为2*4子块的示例，展示了如何使用Python和matplotlib库中的tight_subplot函数进行图像分割和展示。文章还探讨了图像分割在不同领域的应用，以及如何在机器学习项目中作为数据预处理步骤。1.图像分割基本概念在图像处理领域
机器学习笔记——支持向量机 star_and_sun 机器学习笔记支持向量机
支持向量机参数模型对分布需要假设（这也是与非参数模型的区别之一）间隔最大化，形式转化为凸二次规划问题最大化间隔间隔最大化是意思：对训练集有着充分大的确信度来分类训练数据，最难以分的点也有足够大的信度将其分开间隔最大化的分离超平面的的求解怎么求呢？最终的方法如下1.线性可分的支持向量机的优化目标其实就是找得到分离的的超平面求得参数w和b的值就可以了注意，最大间隔分离超平面是唯一的，间隔叫硬间隔1.1
【机器学习&深度学习】多分类评估策略一叶千舟深度学习【理论】深度学习【应用必备常识】大数据人工智能
目录前言一、多分类3大策略✅宏平均（MacroAverage）✅加权平均（WeightedAverage）✅微平均（MicroAverage）二、类比理解2.1宏平均（MacroAverage）2.1.1计算方式2.1.2适合场景2.1.3宏平均不适用的场景2.1.4宏平均一般用在哪些指标上？2.1.5怎么看macroavg指标？2.1.6宏平均值低说明了什么？2.1.7从宏平均指标中定位模型短板
Unity 内置着色器的使用与性能优化【Usage and Performance of Built-in Shaders】小李也疯狂 #Shader：Built-in shaders unity 着色器性能优化 shader
Unity中的着色器通过材质（Material）应用，材质将着色器代码与纹理、颜色等参数结合。理解着色器与材质的关系及性能影响因素，对优化项目渲染效率至关重要。以下是内置着色器的使用指南与性能分析：一、着色器与材质的关系核心概念着色器（Shader）：定义渲染逻辑（如光照计算、纹理混合），决定材质的属性和外观。材质（Material）：着色器的实例，存储具体参数（如纹理、颜色值），同一着色器可创建
自学黑客（网络安全），一般人我劝你还是算了吧网络安全工程师教学兼职副业网络安全黑客技术 web安全安全网络人工智能学习
我是一名8年半的网安工程师“老司机”，要给准备入坑的同学泼盆冷水了，网络安全真的不是一般人能学的。有人会问“你一个8年的网安老司机，为什么还给大家泼冷水”？好多人说：网安基础很简单，是个人稍微认真点都能懂，给网安打上了简单、易懂的标签。然后上来就是一波言论浮夸的输出，把一些很基础很浅显的技术点拆解出来，让小白快速上手，误导新手，让他们以为网络安全就这么回事儿，可一到真正实操，哦豁，啥也不会。这导致
STM32-内存运行原理与RAM执行实战东方少爷内存地址单片机嵌入式硬件 arm开发硬件工程 stm32
一、底层原理深度解析（先懂“为什么要拷贝”）1.存储介质本质差异（ROM/FlashvsRAM）ROM（以STM32内部Flash为例）：物理特性：电可擦写非易失性存储（虽叫ROM，实际可通过编程改写），擦写次数有限（一般万次级别），读速度慢（STM32F1系列Flash读取周期约30-50ns）。存储内容：程序代码（指令）、只读常量（const修饰的全局变量、字符串字面量）、初始化的全局变量（R
【机器学习笔记Ⅰ】7 向量化巴伦是只猫机器学习机器学习笔记人工智能
向量化（Vectorization）详解向量化是将数据或操作转换为向量（或矩阵）形式，并利用并行计算高效处理的技术。它是机器学习和数值计算中的核心优化手段，能显著提升代码运行效率（尤其在Python中避免显式循环）。1.为什么需要向量化？(1)传统循环的缺陷低效：Python的for循环逐元素操作，速度慢。代码冗长：需手动处理每个元素。示例：计算两个数组的点积（非向量化）a=[1,2,3]b=[4
【前端工程化】前端组件模版构建那些事前端
在企业级后台系统中，组件是构建页面的基础单元。与C端不同，B端更注重功能完整性、交互一致性与复用效率。因此，我们需要围绕业务场景封装出可复用、易维护、结构清晰的组件模板。本文档主要围绕组件设计原则、分类建议和使用方式展开，适用于Vue或React技术栈下的开发场景。一、组件设计原则职责单一每个组件只负责一个功能或UI元素，不依赖外部状态；示例：按钮组件只处理点击行为，不包含API调用逻辑；高内聚低
AI Infra：SuperMemory，构建“记忆增强智能体（Memory-Augmented Agents）”的基础设施 sluke
原创陆蔚青平行记陆项目supermemoryai/supermemory是SuperMemory项目的核心代码库。这个项目是构建“记忆增强智能体（Memory-AugmentedAgents）”的基础设施，为AI提供可读、可写、可回忆、可推理的“记忆”。一、项目定位：什么是SuperMemory？SuperMemory=MemoryOS+MemoryAPIs+MemorySDK+MemoryAge
数据库的后悔药：Undo Log揭秘你一身傲骨怎能输游戏行业领域知识专栏撤销日志（Undo Log）
文章摘要撤销日志（UndoLog）是数据库的“后悔药”机制，用于保证数据操作的原子性和一致性。其核心原理是修改数据前先记录原始状态到UndoLog，若事务失败则进行回滚恢复。典型应用包括：1）事务回滚（如转账异常时还原数据）；2）并发控制（通过快照读提供多版本视图）。主流数据库如MySQLInnoDB和Oracle均采用该技术，其流程可概括为“先备份后修改，出错即还原”。简言之，UndoLog通过
2019年架构师系列教程：高并发Netty实战打造百万连接架构不教书的塞涅卡
本文还有配套的精品资源，点击获取简介：本课程面向高级IT专业人士，旨在教授如何利用Netty框架设计和实现能够处理高并发连接的服务器架构。Netty是一个高性能、异步事件驱动的Java网络应用程序框架。课程将提升学员在系统架构设计和性能优化方面的技能，应对高并发场景挑战，特别是在金融、游戏、物联网等领域。1.Netty框架基础概念介绍Netty是一个高性能的网络应用框架，专为快速开发可维护的高性能
【网络安全基础】第七章---无线网络安全薄荷椰果抹茶信息安全与网络安全 web安全网络安全
仅供参考文章目录一、无线安全二、移动设备安全三、IEEE802.11四、IEEE802.11i五、习题训练一、无线安全严重威胁无线网络安全的关键因素：信道、移动性、资源、可访问性无线网络环境由三部分组成，为攻击提供了切入点：无线客户（手机等）、无线接入点（Wifi热点等）、传递无线电波无线网络安全威胁：无线安全措施：安全无线传输、安全的无线接入点、安全的无线网络无线网络安全主要通过加密和认证来实现
Flask 安装使用教程小奇JAVA面试安装使用教程 flask python 后端
一、Flask简介Flask是一个使用Python编写的轻量级Web应用框架，核心设计理念是简单易用、模块化扩展性强。Flask提供了路由、模板、请求响应等基本功能，适合构建中小型网站、RESTfulAPI、微服务架构等。二、环境准备2.1安装Python确保已安装Python3.7或以上版本：python--version如未安装，可前往：https://www.python.org/downl
深度解析：Java内部类与外部类的交互机制 hi星尘 java java 交互开发语言
1.内部类概述在Java中，**内部类（InnerClass）**是定义在另一个类内部的类。根据是否依赖外部类实例，内部类可分为：非静态内部类（成员内部类）：持有外部类的隐式引用，可访问其成员。静态内部类（StaticNestedClass）：不依赖外部类实例，需显式传递引用。局部内部类（LocalClass）：定义在方法或作用域内。匿名内部类（AnonymousClass）：无类名，直接实例化。
TypeScript-webpack 難釋懷 typescript webpack javascript
一、前言随着前端工程化的不断演进，使用TypeScript编写更加健壮、可维护的代码已成为主流趋势。而Webpack则是目前最流行的模块打包工具之一，它可以帮助我们将多个模块、资源文件进行打包压缩，适用于大型项目开发。本文将带你一步步搭建一个基于TypeScript+Webpack的开发环境，涵盖基础配置、编译流程、开发服务器设置等内容，适合初学者和中级开发者学习参考。二、什么是TypeScrip
李宏毅2025《机器学习》第四讲-Transformer架构的演进
Transformer架构的演进与替代方案：从RNN到Mamba的技术思辨Transformer作为当前AI领域的标准架构，其设计并非凭空而来，也并非没有缺点。本次讨论的核心便是：新兴的架构，如MAMA，是如何针对Transformer的弱点进行改进，并试图提供一个更优的解决方案的。要理解架构的演进，我们必须首先明确一个核心原则：每一种神经网络架构，都有其存在的技术理由。CNN（卷积神经网络）：为
数据库连接池的作用是什么？破碎的天堂鸟学习教程数据库 oracle sql
数据库连接池（DatabaseConnectionPool）是一种核心的数据库资源管理技术，通过预先创建、复用和管理数据库连接，显著提升应用程序的性能、稳定性和资源利用率。其作用可归纳为以下核心维度：一、核心作用：提升系统性能与效率减少连接创建/销毁开销数据库连接的建立涉及TCP三次握手、身份验证、内存分配等操作，耗时约数十至数百毫秒。连接池在初始化时创建固定数量的连接（如minIdle），后续请
马尔可夫链：随机过程的记忆法则与演化密码大千AI助手人工智能 Python #OTHER python 人工智能马尔科夫链 MC 算法随机过程
本文由「大千AI助手」原创发布，专注用真话讲AI，回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我，一起撕掉过度包装，学习真实的AI技术！一、核心定义：无记忆的随机演化马尔可夫链（MarkovChain）是一种具有马尔可夫性质的离散随机过程，其核心特征是：未来状态仅取决于当前状态，与历史路径无关数学表述：[P(Xt+1=xt+1∣Xt=xt,Xt−1=xt−1,…,X0=x0)=P(Xt
条件概率：不确定性决策的基石大千AI助手人工智能 Python #OTHER 决策树算法机器学习人工智能条件概率概率论
条件概率是概率论中的核心概念，用于描述在已知某一事件发生的条件下，另一事件发生的概率。它量化了事件之间的关联性，是贝叶斯推理、统计建模和机器学习的基础。本文由「大千AI助手」原创发布，专注用真话讲AI，回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我，一起撕掉过度包装，学习真实的AI技术！一、定义与公式设(A)和(B)是两个随机事件，且(P(B)>0)：条件概率(P(A\midB))表示
【干货】深度解析个人IP打造：从定位到变现的全维度运营指南老蒋新思维创始人IP
在短视频浪潮席卷的当下，越来越多人意识到“个人IP”的商业价值。但许多人将其简单等同于“真人出镜发内容”或“企业找员工代言”，这种浅层认知往往导致运营陷入瓶颈。事实上，打造个人IP是一项系统性工程，需要从定位、内容、平台到商业体系的全链条规划。本文将聚焦「定位」这一核心基石，结合实战案例与趋势洞察，为创业者提供可落地的操作框架。一、定位本质：构建差异化价值坐标个人IP的定位绝非“选赛道”这么简单，
OpenCV教程——图像模糊。均值模糊，高斯模糊，中值模糊，双边模糊，高斯分布
1.图像模糊图像模糊是图像处理中最简单和常用的操作之一。⚠️使用该操作的原因之一是为了给图像预处理时降低噪声。图像模糊操作背后是数学的卷积计算。卷积操作的原理：常用的图像模糊的方法：均值模糊高斯模糊中值模糊双边模糊这四种模糊方式有时也被称为：均值滤波、高斯滤波、中值滤波和双边滤波。因为模糊属于一种滤波操作，具体关系可参照下图：其中，均值滤波、高斯滤波和中值滤波属于线性滤波；而双边滤波属于非线性滤波
REACT (Web开发框架 : react)极速入门 masterphp react.js 前端前端框架
前面讲过了很多后端，今天复习一下前端，为啥要讲React？对咯！我这边又被借调到前端组了，和前端的同学一起做React，以前有基础加上前端同学只做过Vue，所以我毫无疑问的又被借过去了......，这个是复习资料，高级玩家可略过。首先我要说一下，有Vue框架和JS原生的同学学习React会特别的快速，所以基础稍微差一点的同学可以先复习一下JS，特别说一下是JS老生常谈的，说明一下啥是Reac
垂起固定翼无人机应用及技术分析云卓SKYDROID 无人机云卓科技科技科普高科技
一、主要应用行业1.能源基础设施巡检电力巡检：适用于超高压输电线路通道的快速巡查，实时回传数据提升智能运检效率。油田管道监测：利用长航时特性（1.5-2小时）对大范围管道进行隐患排查，减少人力巡查成本。2.测绘与地理信息在山区、丘陵等复杂地形实现高精度航测，克服传统固定翼需跑道的限制。单架次可完成200平方公里区域的测绘任务，效率较旋翼机提升3倍以上。3.森林与生态监管通过热红外载荷监测林火隐患，
无人机载重模块技术要点分析
一、技术要点1.结构设计创新双电机卷扬系统：采用主电机（张力控制）和副电机（卷扬控制）协同工作，解决绳索缠绕问题，支持30米绳长1.2m/s高速收放，重载稳定性提升。轴双桨布局：无人机采用8轴16桨+轴双桨结构，单轴推力提升40%，载重能力突破200kg，冗余设计保障单轴失效时平稳飞行。模块化快拆：碳纤维+航空铝材质实现减重20%且强度提升50%，桨叶5分钟内可更换，提升野外维护效率。2.安全与制
辗转相处求最大公约数沐刃青蛟 C++漏洞
无言面对”江东父老“了，接触编程一年了，今天发现还不会辗转相除法求最大公约数。惭愧惭愧！为此，总结一下以方便日后忘了好查找。 1.输入要比较的两个数a,b 忽略：2.比较大小（因为后面要的是大的数对小的数做%操作） 3.辗转相除（用循环不停的取余，如a%b,直至b=0） 4.最后的a为两数的最大公约数 &
F5负载均衡会话保持技术及原理技术白皮书 bijian1013 F5 负载均衡
一.什么是会话保持？在大多数电子商务的应用系统或者需要进行用户身份认证的在线系统中，一个客户与服务器经常经过好几次的交互过程才能完成一笔交易或者是一个请求的完成。由于这几次交互过程是密切相关的，服务器在进行这些交互过程的某一个交互步骤时，往往需要了解上一次交互过程的处理结果，或者上几步的交互过程结果，服务器进行下
Object.equals方法：重载还是覆盖 Cwind java generics override overload
本文译自StackOverflow上对此问题的讨论。原问题链接在阅读Joshua Bloch的《Effective Java（第二版）》第8条“覆盖equals时请遵守通用约定”时对如下论述有疑问： “不要将equals声明中的Object对象替换为其他的类型。程序员编写出下面这样的equals方法并不鲜见，这会使程序员花上数个小时都搞不清它为什么不能正常工作：” pu
初始线程 15700786134
暑假学习的第一课是讲线程，任务是是界面上的一条线运动起来。既然是在界面上，那必定得先有一个界面，所以第一步就是，自己的类继承JAVA中的JFrame，在新建的类中写一个界面，代码如下： public class ShapeFr
Linux的tcpdump 被触发 tcpdump
用简单的话来定义tcpdump，就是：dump the traffic on a network，根据使用者的定义对网络上的数据包进行截获的包分析工具。 tcpdump可以将网络中传送的数据包的“头”完全截获下来提供分析。它支持针对网络层、协议、主机、网络或端口的过滤，并提供and、or、not等逻辑语句来帮助你去掉无用的信息。实用命令实例默认启动 tcpdump 普通情况下，直
安卓程序listview优化后还是卡顿肆无忌惮_ ListView
最近用eclipse开发一个安卓app，listview使用baseadapter，里面有一个ImageView和两个TextView。使用了Holder内部类进行优化了还是很卡顿。后来发现是图片资源的问题。把一张分辨率高的图片放在了drawable-mdpi文件夹下，当我在每个item中显示，他都要进行缩放，导致很卡顿。解决办法是把这个高分辨率图片放到drawable-xxhdpi下。 &nb
扩展easyUI tab控件，添加加载遮罩效果知了ing jquery
(function () { $.extend($.fn.tabs.methods, { //显示遮罩 loading: function (jq, msg) { return jq.each(function () { var panel = $(this).tabs(&
gradle上传jar到nexus 矮蛋蛋 gradle
原文地址： https://docs.gradle.org/current/userguide/maven_plugin.html configurations { deployerJars } dependencies { deployerJars "org.apache.maven.wagon
千万条数据外网导入数据库的解决方案。 alleni123 sql mysql
从某网上爬了数千万的数据，存在文本中。然后要导入mysql数据库。悲剧的是数据库和我存数据的服务器不在一个内网里面。。 ping了一下， 19ms的延迟。于是下面的代码是没用的。 ps = con.prepareStatement(sql); ps.setString(1, info.getYear())............; ps.exec
JAVA IO InputStreamReader和OutputStreamReader 百合不是茶 JAVA.io操作字符流
这是第三篇关于java.io的文章了，从开始对io的不了解-->熟悉--->模糊，是这几天来对文件操作中最大的感受，本来自己认为的熟悉了的，刚刚在回想起前面学的好像又不是很清晰了，模糊对我现在或许是最好的鼓励我会更加的去学加油！： JAVA的API提供了另外一种数据保存途径，使用字符流来保存的，字符流只能保存字符形式的流字节流和字符的难点：a,怎么将读到的数据
MO、MT解读 bijian1013 GSM
MO= Mobile originate，上行，即用户上发给SP的信息。MT= Mobile Terminate，下行，即SP端下发给用户的信息；上行:mo提交短信到短信中心下行:mt短信中心向特定的用户转发短信，你的短信是这样的，你所提交的短信，投递的地址是短信中心。短信中心收到你的短信后，存储转发，转发的时候就会根据你填写的接收方号码寻找路由，下发。在彩信领域是一样的道理。下行业务：由SP
五个JavaScript基础问题 bijian1013 JavaScript call apply this Hoisting
下面是五个关于前端相关的基础问题，但却很能体现JavaScript的基本功底。问题1：Scope作用范围考虑下面的代码： (function() { var a = b = 5; })(); console.log(b); 什么会被打印在控制台上？回答：上面的代码会打印 5。 &nbs
【Thrift二】Thrift Hello World bit1129 Hello world
本篇，不考虑细节问题和为什么，先照葫芦画瓢写一个Thrift版本的Hello World，了解Thrift RPC服务开发的基本流程 1. 在Intellij中创建一个Maven模块，加入对Thrift的依赖，同时还要加上slf4j依赖，如果不加slf4j依赖，在后面启动Thrift Server时会报错 <dependency>
【Avro一】Avro入门 bit1129 入门
本文的目的主要是总结下基于Avro Schema代码生成，然后进行序列化和反序列化开发的基本流程。需要指出的是，Avro并不要求一定得根据Schema文件生成代码，这对于动态类型语言很有用。 1. 添加Maven依赖 <?xml version="1.0" encoding="UTF-8"?> <proj
安装nginx+ngx_lua支持WAF防护功能 ronin47
需要的软件:LuaJIT-2.0.0.tar.gz nginx-1.4.4.tar.gz &nb
java-5.查找最小的K个元素-使用最大堆 bylijinnan java
import java.util.Arrays; import java.util.Random; public class MinKElement { /** * 5.最小的K个元素 * I would like to use MaxHeap. * using QuickSort is also OK */ public static void
TCP的TIME-WAIT bylijinnan socket
原文连接： http://vincent.bernat.im/en/blog/2014-tcp-time-wait-state-linux.html 以下为对原文的阅读笔记说明：主动关闭的一方称为local end，被动关闭的一方称为remote end 本地IP、本地端口、远端IP、远端端口这一“四元组”称为quadruplet，也称为socket 1、TIME_WA
jquery ajax 序列化表单 coder_xpf Jquery ajax 序列化
checkbox 如果不设定值，默认选中值为on；设定值之后，选中则为设定的值 <input type="checkbox" name="favor" id="favor" checked="checked"/> $("#favor&quo
Apache集群乱码和最高并发控制 cuisuqiang apache tomcat 并发集群乱码
都知道如果使用Http访问，那么在Connector中增加URIEncoding即可，其实使用AJP时也一样，增加useBodyEncodingForURI和URIEncoding即可。最大连接数也是一样的，增加maxThreads属性即可，如下，配置如下： <Connector maxThreads="300" port="8019" prot
websocket dalan_123 websocket
一、低延迟的客户端-服务器和服务器-客户端的连接很多时候所谓的http的请求、响应的模式，都是客户端加载一个网页，直到用户在进行下一次点击的时候，什么都不会发生。并且所有的http的通信都是客户端控制的，这时候就需要用户的互动或定期轮训的，以便从服务器端加载新的数据。通常采用的技术比如推送和comet（使用http长连接、无需安装浏览器安装插件的两种方式：基于ajax的长
菜鸟分析网络执法官 dcj3sjt126com 网络
最近在论坛上看到很多贴子在讨论网络执法官的问题。菜鸟我正好知道这回事情.人道"人之患好为人师" 手里忍不住,就写点东西吧. 我也很忙.又没有MM,又没有MONEY....晕倒有点跑题. OK,闲话少说,切如正题. 要了解网络执法官的原理. 就要先了解局域网的通信的原理. 前面我们看到了.在以太网上传输的都是具有以太网头的数据包.
Android相对布局属性全集 dcj3sjt126com android
RelativeLayout布局android:layout_marginTop="25dip" //顶部距离android:gravity="left" //空间布局位置android:layout_marginLeft="15dip //距离左边距 // 相对于给定ID控件android:layout_above 将该控件的底部置于给定ID的
Tomcat内存设置详解 eksliang jvm tomcat tomcat内存设置
Java内存溢出详解一、常见的Java内存溢出有以下三种： 1. java.lang.OutOfMemoryError: Java heap space ----JVM Heap（堆）溢出JVM在启动的时候会自动设置JVM Heap的值，其初始空间(即-Xms)是物理内存的1/64，最大空间(-Xmx)不可超过物理内存。可以利用JVM提
Java6 JVM参数选项 greatwqs java HotSpot jvm jvm参数 JVM Options
Java 6 JVM参数选项大全（中文版）作者：Ken Wu Email: [email protected] 转载本文档请注明原文链接 http://kenwublog.com/docs/java6-jvm-options-chinese-edition.htm！本文是基于最新的SUN官方文档Java SE 6 Hotspot VM Opt
weblogic创建JMC i5land weblogic jms
进入 weblogic控制太 1.创建持久化存储 --Services--Persistant Stores--new--Create FileStores--name随便起--target默认--Directory写入在本机建立的文件夹的路径--ok 2.创建JMS服务器 --Services--Messaging--JMS Servers--new--name随便起--Pers
基于 DHT 网络的磁力链接和BT种子的搜索引擎架构 justjavac DHT
上周开发了一个磁力链接和 BT 种子的搜索引擎 {Magnet & Torrent}，本文简单介绍一下主要的系统功能和用到的技术。系统包括几个独立的部分：使用 Python 的 Scrapy 框架开发的网络爬虫，用来爬取磁力链接和种子；使用 PHP CI 框架开发的简易网站；搜索引擎目前直接使用的 MySQL，将来可以考虑使
sql添加、删除表中的列 macroli sql
添加没有默认值：alter table Test add BazaarType char(1) 有默认值的添加列：alter table Test add BazaarType char(1) default(0) 删除没有默认值的列：alter table Test drop COLUMN BazaarType 删除有默认值的列：先删除约束（默认值）alter table Test DRO
PHP中二维数组的排序方法 abc123456789cba 排序二维数组 PHP
<?php/*** @package BugFree* @version $Id: FunctionsMain.inc.php,v 1.32 2005/09/24 11:38:37 wwccss Exp $*** Sort an two-dimension array by some level
hive优化之------控制hive任务中的map数和reduce数 superlxw1234 hive hive优化
一、控制hive任务中的map数: 1. 通常情况下，作业会通过input的目录产生一个或者多个map任务。主要的决定因素有： input的文件总个数，input的文件大小，集群设置的文件块大小(目前为128M, 可在hive中通过set dfs.block.size;命令查看到，该参数不能自定义修改)；2.
Spring Boot 1.2.4 发布 wiselyman spring boot
Spring Boot 1.2.4已于6.4日发布，repo.spring.io and Maven Central可以下载(推荐使用maven或者gradle构建下载)。这是一个维护版本，包含了一些修复small number of fixes,建议所有的用户升级。 Spring Boot 1.3的第一个里程碑版本将在几天后发布，包含许多