我去喝咖啡了

笔记三|Fast R-CNN

溯源：Fast R-CNN基于R-CNN（笔记二）RCNN和SPP-Net的思想

论文地址

本文结构：

1 Fast R-CNN结构

1.1特征提取与RoI

优点

1.2感兴趣区域池化层

1.3 全连接层

2 训练

2.1预训练

2.2 批量与样本选择

2.3 损失函数

2.3.1目标分类损失

2.3.2 边界框回归损失

2.3.3 网络总损失

2.4 感兴趣区域池化层的反向传播

2.5 SGD超参数

2.6 尺度不变的目标检测

3 模型的加速

3.1 全连接层加速（ Truncated SVD)

4 实验解读

1 Fast R-CNN结构

1.1特征提取与RoI

网络组成的思路类似于RCNN，网络的输入为整幅的待检测图像，使用VGG16等图像分类网络中的卷积部分，对图像进行特征提取，得到最终的特征图。

RoI（Regions of Interest）：感兴趣区域，是proposal（原图的红框区域）在特征图（Figure 1 中是Conv feature map）上的对应区域（灰色区域部分）

个人理解：用卷积网络在原图提取特征时，结果是整幅图像的特征图，网络其实有两个输入，一个是整张图，另一个则是用其他提取算法例如selective search等得到的proposals，卷积网络可以的输入端和输出端可以看成是一个线性的映射，RoI就是proposals经卷积后在特征图上的映射区域。

优点

【与RCNN相比】

RCNN在提取特征时，是使用卷积网络提取每一个proposals的特征；

在Fast R-CNN中，CNN只提取一次整幅图的特征，CNN的计算是共享的，节省了时间。

1.2感兴趣区域池化层

在RCNN中，卷积层的最后一层后面接了pool5池化层，Fast R-CNN吸收了SPP-Net的思想，使用了与SPP层类似的感兴趣区域池化层，将所有的RoI（在特征图上提取的灰色部分）都送到感兴趣区域池化层。

RoI池化层对每个RoI提取特定长度的特征向量，其使用最大池化的方式，具体操作为：

将RoI看成一个尺寸大小为 $h\times w$ 的窗口，将其划分为 $H\times W$ 的子窗口（每个窗口大小为 $h/H\times w/W$ ),对RoI的每个子窗口进行池化,输出每个子窗口中的最大值。

该操作对于特征图的每个channel是独立进行的
最大池化这一步统一了输出的尺寸，即RoI因为是proposals的映射，其长宽比仍然是不变的，也就是RoIs的尺寸并不统一，通过最大池化的操作，无论原始数据如何，调节窗口的大小，池化后都是 $H\times W$

1.3 全连接层

RoI最大池化层后接两个全连接层，作用是得到固定尺寸的RoI的特征向量

输出层由两个并接的全连接层组成，接收RoI的特征向量，输出两个任务的结果：softmax分类，边界框回归

【优点】将RCNN中分开训练的分类，边界框回归统一到了一个框架中，只用训练一次。

2 训练

2.1预训练

选取AlexNet、VGG_CNN_M_1024和VGG16这3个预训练网络作为基础网络。预训练网络是在ImageNet上通过图像分类任务训练得到的，每个网络有5个最大池化层和5~13个卷积层。

在用预训练网络初始化Fast R-CNN网络时，会经历三次变换：

第一次，最后的最大池化层被感兴趣区域池化层代替。

第二次，网络最后的全连接层和softmax函数被替换成两个同级层，分别用于目标分类任务和边界框回归任务。

第三次，网络的数据输入被改为两个，分别是图像的列表和这些图像中的建议框的列表

2.2 批量与样本选择

采用mini-batch的方法，每个mini-batch有N幅图片，再从N幅图片中选R个proposals；正样本为与某类真值边界框（ground-truth bounding box）的 $IoU\geqslant 0.5$ 的proposals，负样本为与全部类别的真值边界框 $IoU\leqslant 0.5$ 的建议框，正负样本比例在1：3；

在训练期间，会以50%的概率将图像水平翻转，作为唯一的数据增强的方式

2.3 损失函数

由最终输出层可知，网络是一个多任务模型：目标分类和边界框回归。因此存在两个损失函数，网络的总损失函数为两者的加权和：

$L(p,u,t^u,t^*) = L_{cls}(p,u)+\lambda[u\geq 1]L_{loc}(t^u,t^*)$

2.3.1目标分类损失

softmax输出的是 $p = (p_0,\cdots,p_K)$ ，代表的是一个RoI在K+1个类别上的离散概率分布（k=0是背景），每个RoI都有标定的真值类别。

分类损失是一个对数损失：

$L_{cls}(p,u) = -log p_u$

2.3.2 边界框回归损失

第二个子连接层输出的是边界框回归的坐标，是对类别进行预测的边界框回归参数，是每个RoI的真值边界框的回归参数，，都是维度为四的向量，，前两个分量表示真值边界框G相对于建议框P计算得到的相对平移量，后两个分类代表缩放量。（类似于RCNN中边界框回归）。

边界框损失为：

$L_{loc}(t^u,t^*) = \sum\limits_{i\in{x,y,w,h}} smooth_{L_1}(t_i^u-t_i^*)$

smooth是一个鲁棒的L1损失，与R-CNN和SPP-Net中使用的L2损失相比，更不容易受极值端的影响：

$smooth_{L1}(x) = \begin{cases} 0.5x^2 & \text{ if } \lvert x \rvert<1 \\ \lvert x \rvert - 0.5 & otherwise \end{cases}$

2.3.3 网络总损失

$L(p,u,t^u,t^*) = L_{cls}(p,u) + \lambda[\mu\geqslant 1]L_{loc}(t^u,t^*)$

$\mu \geqslant 1$ 表示标定的真值类别 $\mu$ 为1-K的类别的边界框才要计算边界框回归损失， $\mu = 0$ 表示被标记为背景类别的RoI可以忽略边界框损失

本实验中， $\lambda = 1$ ，表示两种损失的权重。

2.4 感兴趣区域池化层的反向传播

当普通最大池化层反向传播时，设为该池化层中的第各输入节点，为该池化层的第个输出节点，那么损失函数对输入节点的梯度为

$\frac{\partial L}{\partial y_j} = \begin{cases} 0 & \delta (i,j) = false \\ \frac{\partial L}{\partial y_j} & \delta (i,j) =true \end{cases}$

其中，判决函数 $\delta (i,j)$ 表示输入节点是否被输出节点选为最大值输出，若选中则为true；损失函数对的偏导数等于损失函数对的偏导数乘以对的偏导数。（对的偏导数恒等于1）

由于RoI在特征图上可能会出现重叠的情况，所以一个输入节点可能与多个输出节点相关联。

所以，在进行反向传播时，损失函数对输入节点的梯度为损失函数对各个有可能的RoI的输出节点 $y_{rj}$ 梯度的累加：

$\frac{\partial L}{\partial x_i} = \sum \sum [i = \delta(r,j)]\frac{\partial L}{\partial y_{rj}}$

其中，

$[i = \delta(r,j)] = \begin{cases} 1 & i = \delta(r,j) \\ 0 & otherwise \end{cases}$

2.5 SGD超参数

初始化全连接层与边界框回归：零均值高斯分布，偏差分别为0.01，0.001；偏差为0

所有层对权重的学习率为1，偏差的学习率为2；全局的学习率为0.001

当在VOC07上或VOC12上训练时，每个小批量使用SGD方法，迭代30K，然后降低学习率为0.0001再另训练10K迭代次数。

大训练集再训练更多的次数

2.6 尺度不变的目标检测

brute force learning：每个image处理成预定大小进行训练和测试。所以网络必须直接从训练数据中学习尺度不变的目标检测

using image pyramids：相比之下，多尺度方法通过图像金字塔为网络提供了近似的尺度不变性。在测试时，每个图像金字塔被用来对每个object proposal近似尺度归一化。在多尺度训练过程，当一个图像被采样时，我们随机采样一个金字塔尺度，作为数据增强的一种方式。

3 模型的加速

检测：一旦一个Fast R-CNN网络被精修，

image或者image pyramid（编码成一个图像列表）和R个目标proposals组成的列表作为输入；在测试时，R一般在2000个左右，使用image pyramid时，每个RoI被缩放成一个尺度，使缩放后的RoI接近224×224

每个测试RoI r，前向传播输出一个类的后验概率p以及一个关于r的预测边界框偏差的集合（每个类别都有其修正的边界框预测

给每个r在每个目标类上一个检测可信度（detection confidence），计算方式为：

然后对每个类用非最大抑制的方法

3.1 全连接层加速（ Truncated SVD)

感兴趣区域池化层后面接了两个全连接层，在Fast R-CNN中，全连接层的计算次数取决于RoI的个数，而RoI有2000个之多，因此全连接层的计算量是巨大的。几乎一半的前向传播时间用在全连接层上。

【Truncated SVD】Fast R-CNN给出了基于奇异值分解（SVD)的全连接层计算加速方法。

设全连接层的参数为 $u\times v$ 大小的权重矩阵，可利用奇异值被近似分解为：

$W \approx U\Sigma _tV^T$

U大小为 $u\times t$ ，由W的前t个左奇异向量组成， $\Sigma_t$ 是 $t\times t$ 的对角矩阵，对角线上的值取W的前t个最高的奇异值，V是前t个右奇异向量组成。

【参数量】Truncated SVD将参数量由uv降低到了t(u+v)。

【实现】这种方法相当于将单个全连接层拆分成两个全连接层，由权重为W的单全连接层替换成第一层权重矩阵为 $\Sigma_tV^T$ ,第二层权重矩阵为U的全连接层

【效果】实验表明可以在使mAP在只降低0.3%的情况下提升30%的速度

4 实验解读

哪些层用来精修：

对于SPPnet网络，只精修全连接层可以取得很好的正确率；但是Fast R-CNN用的卷积层是VGG16，相比于SPPnet来说，卷积层更深。因此本文做了实验，看从哪些层开始进行精修能够提升网络的性能。

可以看到训练经过RoI池化层的效果提升了很多。

那么所有的卷积层都需要精修吗》在小的网络上，conv1通常是通用的，与任务无关，允许conv1是否学习在mAP上没有很大的影响。在VGG16上，只发现更新从conv3_1至9？这样的优点是：

：

从conv2_1开始精修，相较于con3_1会增加1.3倍训练时间，mAP只增加了0.3个点；从conv1_1开始训练，GPU内存不够。

Fast R-CNN都使用从conv3_1及以上的层精修，模型S和M精修conv2及以上

多任务训练是否提高了目标检测的准确率

有三个量级的模型S,M,L

第一列是VOC07 mAP的基准线，基准值是没有边界框回归的。

S,M,L的第二列是用文章中提到的损失函数训练的（Fast R-CNN虽然是多任务，但参数是共享的），但在测试时禁用了边界框回归。可以看到每组多任务训练都要优于只分类训练的准确率。

第三列是在基准模型（只用分类损失训练）上添加了边界框回归层，然后用回归损失训练回归层参数（其他层参数保持不变），这种方法就是stage-wise训练策略，结果mAP相较于基准值也提高了，但还是低于多任务训练（第四列）。

尺度不变目标检测

有两种方法：

暴力学习

多尺度：

【结论】多尺度和暴力法的mAP差距很小，且暴力法的速度要优于多尺度，实现速度与准确率上很好的tradeoff，因此文中的其他部分都用single-scale的方式

增加训练数据

在原有的VOC07 trainval数据集上添加VOC12 trainval，图像数量增加了三倍（16.5k），mini-batch迭代次数从40k增加到了60k，在VOC10和2012实验上同理扩增数据集，使用VOC07 trainval，test 和VOC12 trainval的集合（21.5k），训练时使用100k SGD迭代，每过40k迭代次数，将学习率降低0.1倍。也提升了VOC10和2012的mAP

SVM和softmax的比较

文中提到R-CNN和SPPnet都是对SVM进行post-hoc（训练相较于卷积网络是滞后的），所以为了统一性，在Fast R-CNN也进行post-hoc训练（这里不太清楚细节是怎么实现的）

可以看到在FRCN同一框架下，softmax的mAP分数更高，作者提到softmax在给RoI打分时，类间是有竞争的，与SVM的one-vs-rest的给分方式不同。

proposals是否越多越好：

概括的说目标检测有两种，分别使用object proposals的稀疏集（如选择性算法得到的）和密集集（用如DPM方法得到的）。分类具有稀疏性的proposals是一种cascade（首先用proposal机制拒绝大量的候选proposals，留给分类器一个小集合去评估。这种cascade应用到DPM上也能提高检测的准确性，这种方法也能提高Fast R-CNN的性能

整体疏导

Fast R-CNN网络的输入

将数据集图像image（比如来自VOC数据集的）首先处理成同一尺寸大小的blob。

【原因】

网络的结构是固定的，即网络的输入尺寸是固定的，所以进行处理

上图为源码中处理image的对应语块。

对于不同尺寸的image，处理思路是：先用

C++树状数组详解浩瀚星辰2024 java 算法数据结构
C++树状数组深度解析第1章引言：为什么需要树状数组1.1动态序列处理的挑战在现代计算机科学中，我们经常需要处理动态变化的序列数据，这类数据具有以下特点：实时更新：数据点会随时间不断变化频繁查询：需要快速获取特定区间的统计信息大规模数据：通常涉及数百万甚至数十亿个数据点考虑一个实时股票分析系统：需要监控数千只股票的价格变化，并实时计算：某只股票在特定时间段内的平均价格多只股票之间的价格相关性价格波
自动化测试 | UI Automator 进阶指南 aihuanshang9340
UIAutomator相关介绍：跨应用的用户界面自动化测试包含在AndroidXTest(https://developer.android.com/training/testing)中支持的Android系统：>=Android4.3(APIlevel18)基于instrumentation，依赖于AndroidJUnitRunner测试运行器设置UIAutomator(SetupUIAutom
JavaScript中的系统对话框：alert、confirm、prompt
JavaScript中的系统对话框：alert、confirm、prompt在Web开发的世界里，JavaScript始终扮演着“桥梁”的角色——它连接用户与网页，让静态的页面焕发活力。而在这座桥梁上，系统对话框（SystemDialogs）是最基础却最实用的工具之一。它们像是一位贴心的助手，在用户需要确认、提示或输入时，悄然出现，又在任务完成后无声退场。今天，我们就来聊聊JavaScript中三
识花APP：一键识别，开启植物探索之旅
在大自然的怀抱中，我们常常会被各种各样的花草所吸引，却不知道它们的名字和习性。识花APP正是这样一款能够帮助我们快速识别植物、了解植物知识的神奇工具。由上海原来信息科技有限公司研发的这款植物识别软件，以其强大的功能、简单的操作和丰富的植物数据库，成为了植物爱好者和自然探索者的得力助手。软件优势·拍照识花：1秒就能知道植物的名字和故事·分享美图：一键生成有诗词花语的植物美图·花语壁纸：精美壁纸天天上
最近AI领域大火的MCP到底是什么？
文章目录AI领域的MCP（ModelContextProtocol）入门详解1.MCP是什么？2.为什么需要MCP？3.MCP的架构与运作方式4.MCP的核心优势5.实际应用场景6.MCP与相关技术的区别7.MCP开发实战：如何编写一个MCPServer？核心步骤小白也能用的工具8.MCP与区块链的深度融合为什么需要区块链？具体结合方式9.MCP的潜在挑战技术难点现实问题10.未来展望与学习路径M
深入剖析开源AI阅读器项目Saga Reader基于大模型的文本转换与富文本渲染优化方案魑魅丶小鬼人工智能
引言AI阅读器作为一种新型的内容消费工具，正在改变人们获取和处理信息的方式。本文将介绍SagaReader项目中如何利用大型语言模型(LLM)进行网页内容抓取、智能优化和富文本渲染，特别是如何通过精心设计的提示词(prompt)引导LLM生成样式丰富的HTML内容，提升用户阅读体验。关于SagaReader基于Tauri开发的著名开源AI驱动的智库式阅读器（前端部分使用Web框架），能根据用户指定
品诺维新硬件实习生试题解析与答案
本文还有配套的精品资源，点击获取简介：本文档为苏州品诺维新公司硬件开发实习生面试准备材料。包含了三极管工作状态相关的面试题目及其解析，三极管的三种工作状态（截止、放大、饱和）被详细解释，并指出正确答案。考生需深入理解三极管的工作原理，这不仅是电子技术的基础理论，也是实际电路设计与故障排查的基础。通过理解三极管特性，可以更好地应用于开关电路、放大电路及模拟数字转换等场景。考生在准备面试时，应全面复习
python进程线程协程区别_Python：线程、进程与协程(1)——概念 weixin_39989159 python进程线程协程区别
最近的业余时间主要放在了学习Python线程、进程和协程里，第一次用python的多线程和多进程是在两个月前，当时只是简单的看了几篇博文然后就跟着用，没有仔细去研究，第一次用的感觉它们其实挺简单的，最近这段时间通过看书，看Python中文官方文档等等相关资料，发现并没有想想中的那么简单，很多知识点需要仔细去理解，Python线程、进程和协程应该是Python的高级用法。Python的高级用法有很多
四、Actor-Critic Methods 沈夢昂志 DRL深度强化学习 python 深度学习
由于在看DRL论文中，很多公式都很难理解。因此最近在学习DRL的基本内容。再此说明，非常推荐B站“王树森老师的DRL强化学习”本文的图表及内容，都是基于王老师课程的后自行理解整理出的内容。目录A.书接上回1、Reinforce算法B.State-ValueFunctionC.PolicyNetWork（Actor）D.ActionValueNetwork(Critic)E.TraintheNeur
一周掌握Flutter开发--7、包管理心上之秋 flutter 前端
TableofContents7.包管理核心工具7.1`pubspec.yaml`：依赖管理文件常用包7.2`cached_network_image`(图片缓存)7.3`flutter_bloc`(状态管理)7.4`get`(路由+状态管理)总结7.包管理包管理是Flutter开发中的重要环节，通过合理使用第三方包可以显著提高开发效率。Flutter使用pubspec.yaml文件来管理依赖，开
全栈运维的“诅咒”与“荣光”：为什么“万金油”工程师是项目成功的隐藏MVP？云原生水神职业发展系统运维运维
大家好，今天，我们来聊一个特殊且至关重要的群体：运维工程师。特别是那些在项目制中，以一己之力扛起一个或多个产品生死的“全能战士”。你是否就是其中一员？你的技能树上点亮了：操作系统、网络协议、mysql与Redis中间件、Docker与K8s容器化、Ansible与Terraform自动化、Go/Python工具开发、Prometheus监控体系、opentelemetry可视化，甚至要负责信息安全
MaxCompute数据迁移至OSS完全指南大模型大数据攻城狮 odps 大数据阿里云 maxcompute dataworks tunnel sdk oss
目录1.为什么要把MaxCompute的数据搬到OSS？2.工具与环境准备：别急，先把家伙事儿备齐3.迁移方式总览：选对路子事半功倍4.用DataWorks实现数据迁移：点几下鼠标就搞定4.1配置数据源4.2创建同步任务4.3调度与运行5.用INSERT语句写入OSS外部表：SQL爱好者的最爱5.1创建OSS外部表5.2插入数据6.用Tunnel命令行实现数据迁移：硬核玩家的选择6.1Tunnel
Char Studio 使用入门：高效构建企业级对话系统的实战指南 charles666666 人工智能产品经理语言模型自然语言处理架构
数字化浪潮推动下，企业与用户的交互模式正经历深刻变革，对话系统作为核心交互手段，其重要性日益凸显。然而，众多企业在构建对话系统时，却深陷诸多困境，难以自拔。一、开篇痛点场景：企业对话系统开发的典型困境企业在自行开发对话系统时，往往面临预算超支、周期漫长以及维护成本居高不下等问题。开发团队需要投入大量时间和精力进行底层技术架构的搭建，例如自然语言处理算法的研究、对话逻辑的设计等，这不仅消耗了大量的人
在 Windows 系统中，你可以通过以下命令或工具查询占用 8080 端口的程序青春不流名 eclipse
在Windows系统中，你可以通过以下命令或工具查询占用8080端口的程序：1.使用命令行工具（推荐）打开命令提示符（CMD）或PowerShell，执行以下命令：netstat-ano|findstr:8080输出示例：TCP0.0.0.0:80800.0.0.0:0LISTENING12345UDP[::]:8080[::]:012345其中，12345是进程ID（PID）。2.通过PID查找
制作MikTex本地包可用于离线安装包
MikTex安装包版本是basic-miktex-24.1-x64.exe。注：basic版本表示只安装MikTex基本包，不安装全部包。在能够联网的电脑上安装MikTex软件后，可以按以下步骤制作本地包库。一、制作本地包库1、新建一个文件夹，比如在D盘新建miktex-local-repository目录2、管理员权限打开cmd3、在cmd中将当前目录切换到D盘4、使用miktexsetup工具
Python Selenium 使用指南
Selenium是一个用于自动化Web浏览器交互的强大工具，常用于网页测试、数据抓取和自动化任务。以下是Python中Selenium的详细使用说明。安装Selenium首先需要安装Selenium库和浏览器驱动：pipinstallselenium然后下载对应浏览器的驱动：Chrome:ChromeDriverFirefox:GeckoDriverEdge:EdgeDriver将驱动放在系统PA
麒麟V10安装部署达梦数据库（单机版）熊娜丽莎的微笑数据库运维开发 linux
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言1.单机部署过程1.1部署规划1.2数据库软件安装及环境配置1.2.1操作系统配置1.2.2数据库软件安装1.3使用dminit工具初始化实例1.4注册服务并启动实例1.5登录数据库1.6归档配置1.7定制备份策略1.8数据库参数优化1.9配置sql日志1.10迁移信息统计查询总结前言麒麟V10安装部署达梦数据库单机安装的
Selenium使用指南
点击文末小卡片，免费获取软件测试全套资料，资料在手，涨薪更快Selenium是网页应用中最流行的自动化测试工具，可以用来做自动化测试或者浏览器爬虫等。官网地址为：相对于另外一款web自动化测试工具QTP来说有如下优点：免费开源轻量级，不同语言只需要一个体积很小的依赖包支持多种系统，包括Windows，Mac，Linux支持多种浏览器，包括Chrome，FireFox，IE，safari，opera
Kotlin JVM 注解详解
前言Kotlin作为一门现代JVM语言，提供了出色的Java互操作性。为了更好地支持与Java代码的交互，Kotlin提供了一系列JVM相关注解。这些注解不仅能帮助我们控制Kotlin代码编译成Java字节码的行为，还能让我们的Kotlin代码更好地被Java代码调用。虽然在日常开发中我们最常用的是@JvmOverloads、@JvmStatic、@JvmName和@JvmField这几个注解，但
Softhub软件下载站实战开发（十四）：软件收藏集设计叹一曲当时只道是寻常 softHub 前端 golang
文章目录Softhub软件下载站实战开发（十四）：软件收藏集设计引言：为什么我们需要收藏集功能？收藏集功能的核心价值1.资源整合与分类管理技术架构设计数据库设计核心接口设计后端实现详解1.收藏集服务层2.列表查询实现3.添加软件实现前端实现详解1.收藏集列表页面2.软件管理弹窗组件3.软件选择与添加逻辑Softhub软件下载站实战开发（十四）：软件收藏集设计前面几篇我们讲了软件管理相关实现，本篇我
Softhub软件下载站实战开发（一）：项目总览叹一曲当时只道是寻常 softHub go
文章目录Softhub软件下载站实战开发（一）：项目总览项目介绍技术栈选择关键组件功能列表Softhub软件下载站实战开发（一）：项目总览项目介绍在数字化浪潮席卷全球的今天，软件已成为我们工作和生活的核心工具。然而，当我们尝试从传统软件下载站获取所需工具时，常常陷入这样的困境：用户下载需求传统下载站满屏闪烁广告隐藏的捆绑安装已下载的软件不好归档误点下载器陷阱被强制安装垃圾软件重新下载本项目无法解决
Java程序设计（二十七）：基于SSM框架的OA办公自动化管理平台的设计与实现人工智能_SYBH 2025年java程序设计 java 数据挖掘开发语言 vue.js 后端人工智能 spring boot
1.项目概述办公自动化（OA，OfficeAutomation）管理平台是企业实现内部管理信息化的重要工具。本文提出并实现了一个基于Java的OA办公自动化管理平台。该平台基于SSM架构（Spring+SpringMVC+MyBatis），数据库采用MySQL，并通过HTML、CSS、JavaScript等技术实现用户界面。1.1平台功能简介平台提供了管理员、普通用户和部门三类角色，分别具有不同的
Unity Demo-3DFarm详解-其一 KhalilRuan unity 游戏引擎
我们来拆解一个种田游戏，这个游戏种类内部的功能还是比较模板化的，我们来一点点说。我们大体上分为这么几个部分：农场运营玩法角色与玩家互动物品与背包存档和进度管理用户界面系统农场运营可以大体上分为：种植系统：支持种植、成长、收获等完整的植物生命周期；动物系统：包含野生动物、家畜、宠物等，支持喂养、骑乘、驯养等功能；建筑与建造：玩家可以建造、升级、摧毁建筑；采集与合成：支持采集资源、合成物品、制作工具；
神经网络初步学习3——数据与损失 X Y O 神经网络学习人工智能
一、传统机器学习与神经网络前言：该部分需要一定的机器学习与数学基础（很浅的基础），如果有不理解的地方可以自行查阅。（1）区别这里不妨以图像识别为例子：（1）在传统的机器学习视角中：我们需要人工手动去设置并提取我们的特征量，例如常见的SIFT、SURF和HOG等，随后需要我们选择合适的分类器（例如：SVM、KNN等分类器）,接着把我们的参数训练出来。（2）而在神经网络的视角中：我们只需要把图片喂给它
brew java 切换_如何在Mac下配置多个Java版本 weixin_39904522 brew java 切换
说明使用工具：brewcaskbrewcask是一个用命令行管理Mac下应用的工具，提供了自动安装和卸载功能，能够自动从官网上下载并安装最新的版本，它是基于homebrew的一个增强工具。一.安装最新版的Java#如何没有安装brewcask。请执行$brewtapcaskroom/versions$brewcaskinstalljava二.安装其他版本的Java如果你需要安装其他的jdk(JDK
AI驱动的个人工作革命：基于DeepSeek构建全场景智能工作助理（含源代码+多应用场景） AI_DL_CODE DeepSeek深度应用人工智能 DeepSeek 个人智能助理 LangChain 任务自动化知识管理大模型应用
摘要：本文详细阐述基于DeepSeek大模型构建个人工作助理的完整技术方案，通过LangChain实现任务分解、知识检索与工具调用的智能协同。方案融合向量数据库、多模态交互与个性化学习算法，构建涵盖邮件处理、会议管理、文档生成等15大核心工作场景的自动化系统。文中提供可运行代码、完整部署指南及效能测试数据，实现邮件处理效率提升13倍、会议纪要生成时间缩短100%、任务安排错误率降低83%的显著优化
【计算机网络】第三章：数据链路层（上） iFulling 计算机网络笔记计算机网络网络网络协议笔记
本篇笔记课程来源：王道计算机考研计算机网络接下节：【计算机网络】第三章：数据链路层（下）【计算机网络】第三章：数据链路层（上）一、数据链路层的功能1.基本概念2.功能总览二、组帧（封装成帧）1.主要实现2.字符计数法3.字节填充法4.零比特填充法5.违规编码法三、差错控制1.主要实现2.检错编码Ⅰ.奇偶校验码Ⅱ.循环冗余校验码3.纠错编码Ⅰ.海明校验码四、流量控制、可靠传输1.相关机制Ⅰ.滑动窗口
Python 网络爬虫的基本流程及 robots 协议详解女码农的重启 python 网络爬虫 JAVA 开发语言
数据驱动的时代，网络爬虫作为高效获取互联网信息的工具，其规范化开发离不开对基本流程的掌握和对robots协议的遵守。本文将系统梳理Python网络爬虫的核心流程，并深入解读robots协议的重要性及实践规范。一、Python网络爬虫的基本流程Python网络爬虫的工作过程可分为四个核心阶段，每个阶段环环相扣，共同构成数据采集的完整链路。1.1发起网络请求这是爬虫与目标服务器交互的第一步，通过发送H
【Linux | 网络】socket编程 - 使用UDP实现服务端向客户端提供简单的服务是阿建吖! 【网络】【Linux】网络 linux udp
目录一、UdpServerSever（客户端发送信息，服务端直接返回信息）1.1Comm.hpp（公共数据）1.2Log.hpp（日志）1.3InetAddr.hpp（管理sockaddr_in相关信息）1.4NoCopy.hpp（防拷贝）1.5UdpServer.hpp（服务端封装）1.6Main.cpp（服务端）1.7UdpClient.cpp（客户端）二、UdpServerExecute（客
异物检测的计算机视觉算法技术路线思绪漂移计算机视觉算法人工智能
异物检测的计算机视觉算法技术路线在现代智能监测系统中，异物检测有着其必要性和运维重要性，通过计算机视觉算法，可以实时识别各种异常物体，为设备安全运行提供有力保障。本文将介绍异物检测的主要技术路线。一、分类识别适应场景分类识别技术主要适用于已知目标类别的异物检测场景。在运维环境中，这类场景包括：固定区域内的障碍物监测（如轨道区域的石块、工具、动物等）关键部件的异物附着检测（如固定装置上的杂物）安全通
多线程编程之卫生间周凡杨 java 并发卫生间线程厕所
如大家所知，火车上车厢的卫生间很小，每次只能容纳一个人，一个车厢只有一个卫生间，这个卫生间会被多个人同时使用，在实际使用时，当一个人进入卫生间时则会把卫生间锁上，等出来时打开门，下一个人进去把门锁上，如果有一个人在卫生间内部则别人的人发现门是锁的则只能在外面等待。问题分析：首先问题中有两个实体，一个是人，一个是厕所，所以设计程序时就可以设计两个类。人是多数的，厕所只有一个（暂且模拟的是一个车厢）。
How to Install GUI to Centos Minimal sunjing linux Install Desktop GUI
http://www.namhuy.net/475/how-to-install-gui-to-centos-minimal.html I have centos 6.3 minimal running as web server. I’m looking to install gui to my server to vnc to my server. You can insta
Shell 函数 daizj shell 函数
Shell 函数 linux shell 可以用户定义函数，然后在shell脚本中可以随便调用。 shell中函数的定义格式如下： [function] funname [()]{ action; [return int;] } 说明： 1、可以带function fun() 定义，也可以直接fun() 定义,不带任何参数。 2、参数返回
Linux服务器新手操作之一周凡杨 Linux 简单操作
1.whoami 当一个用户登录Linux系统之后，也许他想知道自己是发哪个用户登录的。此时可以使用whoami命令。 [ecuser@HA5-DZ05 ~]$ whoami e
浅谈Socket通信（一）朱辉辉33 socket
在java中ServerSocket用于服务器端，用来监听端口。通过服务器监听，客户端发送请求，双方建立链接后才能通信。当服务器和客户端建立链接后，两边都会产生一个Socket实例，我们可以通过操作Socket来建立通信。首先我建立一个ServerSocket对象。当然要导入java.net.ServerSocket包 ServerSock
关于框架的简单认识西蜀石兰框架
入职两个月多，依然是一个不会写代码的小白，每天的工作就是看代码，写wiki。前端接触CSS、HTML、JS等语言，一直在用的CS模型，自然免不了数据库的链接及使用，真心涉及框架，项目中用到的BootStrap算一个吧，哦，JQuery只能算半个框架吧，我更觉得它是另外一种语言。后台一直是纯Java代码，涉及的框架是Quzrtz和log4j。都说学前端的要知道三大框架，目前node.
You have an error in your SQL syntax; check the manual that corresponds to your 林鹤霄
You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'option,changed_ids ) values('0ac91f167f754c8cbac00e9e3dc372
MySQL5.6的my.ini配置 aigo mysql
注意：以下配置的服务器硬件是：8核16G内存 [client] port=3306 [mysql] default-character-set=utf8 [mysqld] port=3306 basedir=D:/mysql-5.6.21-win
mysql 全文模糊查找便捷解决方案 alxw4616 mysql
mysql 全文模糊查找便捷解决方案 2013/6/14 by 半仙 [email protected] 目的: 项目需求实现模糊查找. 原则: 查询不能超过 1秒. 问题: 目标表中有超过1千万条记录. 使用like '%str%' 进行模糊查询无法达到性能需求. 解决方案: 使用mysql全文索引. 1.全文索引 : MySQL支持全文索引和搜索功能。MySQL中的全文索
自定义数据结构链表(单项 ,双向,环形) 百合不是茶单项链表双向链表
链表与动态数组的实现方式差不多, 数组适合快速删除某个元素链表则可以快速的保存数组并且可以是不连续的单项链表;数据从第一个指向最后一个实现代码: //定义动态链表 clas
threadLocal实例 bijian1013 java thread java多线程 threadLocal
实例1： package com.bijian.thread; public class MyThread extends Thread { private static ThreadLocal tl = new ThreadLocal() { protected synchronized Object initialValue() { return new Inte
activemq安全设置—设置admin的用户名和密码 bijian1013 java activemq
ActiveMQ使用的是jetty服务器, 打开conf/jetty.xml文件，找到 <bean id="adminSecurityConstraint" class="org.eclipse.jetty.util.security.Constraint"> <p
【Java范型一】Java范型详解之范型集合和自定义范型类 bit1129 java
本文详细介绍Java的范型，写一篇关于范型的博客原因有两个，前几天要写个范型方法(返回值根据传入的类型而定)，竟然想了半天，最后还是从网上找了个范型方法的写法；再者，前一段时间在看Gson, Gson这个JSON包的精华就在于对范型的优雅简单的处理，看它的源代码就比较迷糊，只其然不知其所以然。所以，还是花点时间系统的整理总结下范型吧。范型内容范型集合类范型类
【HBase十二】HFile存储的是一个列族的数据 bit1129 hbase
在HBase中，每个HFile存储的是一个表中一个列族的数据，也就是说，当一个表中有多个列簇时，针对每个列簇插入数据，最后产生的数据是多个HFile，每个对应一个列族，通过如下操作验证 1. 建立一个有两个列族的表 create 'members','colfam1','colfam2' 2. 在members表中的colfam1中插入50*5
Nginx 官方一个配置实例 ronin47 nginx 配置实例
user www www; worker_processes 5; error_log logs/error.log; pid logs/nginx.pid; worker_rlimit_nofile 8192; events { worker_connections 4096;} http { include conf/mim
java-15.输入一颗二元查找树，将该树转换为它的镜像，即在转换后的二元查找树中，左子树的结点都大于右子树的结点。用递归和循环 bylijinnan java
//use recursion public static void mirrorHelp1(Node node){ if(node==null)return; swapChild(node); mirrorHelp1(node.getLeft()); mirrorHelp1(node.getRight()); } //use no recursion bu
返回null还是empty bylijinnan java apache spring 编程
第一个问题，函数是应当返回null还是长度为0的数组（或集合）？第二个问题，函数输入参数不当时，是异常还是返回null？先看第一个问题有两个约定我觉得应当遵守： 1.返回零长度的数组或集合而不是null（详见《Effective Java》）理由就是，如果返回empty，就可以少了很多not-null判断： List<Person> list
[科技与项目]工作流厂商的战略机遇期 comsci 工作流
在新的战略平衡形成之前，这里有一个短暂的战略机遇期，只有大概最短6年，最长14年的时间，这段时间就好像我们森林里面的小动物，在秋天中，必须抓紧一切时间存储坚果一样，否则无法熬过漫长的冬季。。。。在微软，甲骨文，谷歌，IBM,SONY
过度设计-举例 cuityang 过度设计
过度设计，需要更多设计时间和测试成本，如无必要，还是尽量简洁一些好。未来的事情，比如访问量，比如数据库的容量，比如是否需要改成分布式都是无法预料的再举一个例子，对闰年的判断逻辑：　　1、 if($Year%4==0) return True; else return Fasle; 　　2、if ( ($Year%4==0 &am
java进阶，《Java性能优化权威指南》试读 darkblue086 java性能优化
记得当年随意读了微软出版社的.NET 2.0应用程序调试，才发现调试器如此强大，应用程序开发调试其实真的简单了很多，不仅仅是因为里面介绍了很多调试器工具的使用，更是因为里面寻找问题并重现问题的思想让我震撼，时隔多年，Java已经如日中天，成为许多大型企业应用的首选，而今天，这本《Java性能优化权威指南》让我再次找到了这种感觉，从不经意的开发过程让我刮目相看，原来性能调优不是简单地看看热点在哪里，
网络学习笔记初识OSI七层模型与TCP协议 dcj3sjt126com 学习笔记
协议：在计算机网络中通信各方面所达成的、共同遵守和执行的一系列约定　　计算机网络的体系结构：计算机网络的层次结构和各层协议的集合。　　两类服务：　　面向连接的服务通信双方在通信之前先建立某种状态，并在通信过程中维持这种状态的变化，同时为服务对象预先分配一定的资源。这种服务叫做面向连接的服务。　　面向无连接的服务通信双方在通信前后不建立和维持状态，不为服务对象
mac中用命令行运行mysql dcj3sjt126com mysql linux mac
参考这篇博客：http://www.cnblogs.com/macro-cheng/archive/2011/10/25/mysql-001.html 感觉workbench不好用（有点先入为主了）。 1，安装mysql 在mysql的官方网站下载 mysql 5.5.23 http://www.mysql.com/downloads/mysql/，根据我的机器的配置情况选择了64
MongDB查询（1）——基本查询[五] eksliang mongodb mongodb 查询 mongodb find
MongDB查询转载请出自出处：http://eksliang.iteye.com/blog/2174452 一、find简介 MongoDB中使用find来进行查询。 API:如下 function ( query , fields , limit , skip, batchSize, options ){.....} 参数含义： query:查询参数 fie
base64，加密解密经融加密，对接 y806839048 经融加密对接
String data0 = new String(Base64.encode(bo.getPaymentResult().getBytes(("GBK")))); String data1 = new String(Base64.decode(data0.toCharArray()),"GBK"); // 注意编码格式，注意用于加密，解密的要是同
JavaWeb之JSP概述 ihuning javaweb
什么是JSP？为什么使用JSP？ JSP表示Java Server Page，即嵌有Java代码的HTML页面。使用JSP是因为在HTML中嵌入Java代码比在Java代码中拼接字符串更容易、更方便和更高效。 JSP起源在很多动态网页中，绝大部分内容都是固定不变的，只有局部内容需要动态产生和改变。如果使用Servl
apple watch 指南啸笑天 apple
1. 文档 WatchKit Programming Guide（中译在线版 By @CocoaChina）译文译者原文概览 - 开始为 Apple Watch 进行开发 @星夜暮晨 Overview - Developing for Apple Watch 概览 - 配置 Xcode 项目 - Overview - Configuring Yo
java经典的基础题目 macroli java 编程
1.列举出 10个JAVA语言的优势 a:免费，开源，跨平台(平台独立性)，简单易用，功能完善，面向对象，健壮性，多线程，结构中立，企业应用的成熟平台, 无线应用 2.列举出JAVA中10个面向对象编程的术语 a:包，类，接口，对象，属性，方法，构造器，继承，封装，多态，抽象，范型 3.列举出JAVA中6个比较常用的包 Java.lang;java.util;java.io;java.sql;ja
你所不知道神奇的js replace正则表达式 qiaolevip 每天进步一点点学习永无止境纵观千象 regex
var v = 'C9CFBAA3CAD0'; console.log(v); var arr = v.split(''); for (var i = 0; i < arr.length; i ++) { if (i % 2 == 0) arr[i] = '%' + arr[i]; } console.log(arr.join('')); console.log(v.r
[一起学Hive]之十五-分析Hive表和分区的统计信息(Statistics) superlxw1234 hive hive分析表 hive统计信息 hive Statistics
关键字：Hive统计信息、分析Hive表、Hive Statistics 类似于Oracle的分析表，Hive中也提供了分析表和分区的功能，通过自动和手动分析Hive表，将Hive表的一些统计信息存储到元数据中。表和分区的统计信息主要包括：行数、文件数、原始数据大小、所占存储大小、最后一次操作时间等； 14.1 新表的统计信息对于一个新创建
Spring Boot 1.2.5 发布 wiselyman spring boot
Spring Boot 1.2.5已在7月2日发布，现在可以从spring的maven库和maven中心库下载。这个版本是一个维护的发布版，主要是一些修复以及将Spring的依赖提升至4.1.7(包含重要的安全修复)。官方建议所有的Spring Boot用户升级这个版本。项目首页 | 源

笔记三|Fast R-CNN

1 Fast R-CNN结构

1.1特征提取与RoI

优点

1.2感兴趣区域池化层

1.3 全连接层

2 训练

2.1预训练

2.2 批量与样本选择

2.3 损失函数

2.3.1目标分类损失

2.3.2 边界框回归损失

2.3.3 网络总损失

2.4 感兴趣区域池化层的反向传播

2.5 SGD超参数

2.6 尺度不变的目标检测

3 模型的加速

3.1 全连接层加速（ Truncated SVD)

4 实验解读

整体疏导

Fast R-CNN网络的输入

你可能感兴趣的:(目标检测相关神经网络,目标检测相关工具算法,深度学习)