aeeeeeep

Faster-RCNN原理笔记

摘要

详细记录了 Faster RCNN 网络原理和个人的理解

论文下载
论文源码

前期

Tensorflow 2.0 基础

RCNN 原理

Fast RCNN 原理

原理

论文中的网络结构图解

主要步骤是

输入图片
对图片进行卷积，提取特征
使用 RPN 网络生成 Anchor box，对其裁剪过滤后，通过 softmax 对前景和后景分类，同时，bounding box regression 修正 anchor box，形成校正后的 proposals
将 proposals 映射到 feature maps 上
通过 RoI pooling 层使每个 RoI 生成固定尺寸的 feature map
利用 Softmax Loss 和 Smooth L1 Loss 对分类概率和边框回归联合训练

Faster RCNN 具体的网络结构图

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-TKdQIUEE-1649642178369)(https://aeeeeeep.top/image/Faster-RCNN%E5%8E%9F%E7%90%86%E7%AC%94%E8%AE%B0/construction.png)]

主干特征提取网络

可选 ResNet，MobileNet，VGG16 等网络，本模型使用的是 VGG16 网络，由卷积层模块后接全连接层模块构成，每个卷积层的参数分别为 kernel_size=(3,3), padding='same', activation='relu', kernel_regularizer='l2'，最大池化层的参数为 pool_size=(2,2), padding='same'

____________________________________________________________________________________________________
Layer (type)                                 Output Shape                            Param #        
====================================================================================================
input_1 (InputLayer)                         [(None, 500, 500, 3)]                   0              
____________________________________________________________________________________________________
conv2d (Conv2D)                              (None, 500, 500, 64)                    1792           
____________________________________________________________________________________________________
conv2d_1 (Conv2D)                            (None, 500, 500, 64)                    36928          
____________________________________________________________________________________________________
max_pooling2d (MaxPooling2D)                 (None, 250, 250, 64)                    0              
____________________________________________________________________________________________________
conv2d_2 (Conv2D)                            (None, 250, 250, 128)                   73856          
____________________________________________________________________________________________________
conv2d_3 (Conv2D)                            (None, 250, 250, 128)                   147584         
____________________________________________________________________________________________________
max_pooling2d_1 (MaxPooling2D)               (None, 125, 125, 128)                   0              
____________________________________________________________________________________________________
conv2d_4 (Conv2D)                            (None, 125, 125, 256)                   295168         
____________________________________________________________________________________________________
conv2d_5 (Conv2D)                            (None, 125, 125, 256)                   590080         
____________________________________________________________________________________________________
conv2d_6 (Conv2D)                            (None, 125, 125, 256)                   590080         
____________________________________________________________________________________________________
max_pooling2d_2 (MaxPooling2D)               (None, 63, 63, 256)                     0              
____________________________________________________________________________________________________
conv2d_7 (Conv2D)                            (None, 63, 63, 512)                     1180160        
____________________________________________________________________________________________________
conv2d_8 (Conv2D)                            (None, 63, 63, 512)                     2359808        
____________________________________________________________________________________________________
conv2d_9 (Conv2D)                            (None, 63, 63, 512)                     2359808        
____________________________________________________________________________________________________
max_pooling2d_3 (MaxPooling2D)               (None, 32, 32, 512)                     0              
____________________________________________________________________________________________________
conv2d_10 (Conv2D)                           (None, 32, 32, 512)                     2359808        
____________________________________________________________________________________________________
conv2d_11 (Conv2D)                           (None, 32, 32, 512)                     2359808        
____________________________________________________________________________________________________
conv2d_12 (Conv2D)                           (None, 32, 32, 512)                     2359808        
____________________________________________________________________________________________________
dense (Dense)                                (None, 32, 32, 10)                      5130           
====================================================================================================
Total params: 14,719,818
Trainable params: 14,719,818
Non-trainable params: 0
____________________________________________________________________________________________________

使用 VGG16 网络不像resnet那么复杂，更深的网络理论上效果也更好

RPN (Region Proposal Networks)

在图像中产生所有可能为目标的候选区域，用来解决生成检测框耗时较多的问题。RPN 根据 CNN 生成的特征图，在 img 的尺度上生成多个锚框，对生成的锚框进行分类和回归。

网络分为2条线，上面一条通过softmax分类 anchors 获得positive 和 negative 分类，下面一条用于计算对于 anchors 的 bounding box regression 偏移量，获得精确的 proposal。最后的 Proposal layer 负责综合 positive anchors 和对应 bounding box regression 偏移量获取 proposals，同时剔除太小和超出边界的 proposals

ahchors

是一种多尺度方法，以一个像素点为中心，生成一组描述 9 个矩形的矩阵，每行4个值 $x_min, y_min, x_max, y_max)$ 表示矩形左上和右下角点坐标，长宽比为 $ width:height \in { 1:1, 1:2, 2:1 } $

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-WA83duQ9-1649642178370)(https://aeeeeeep.top/image/Faster-RCNN%E5%8E%9F%E7%90%86%E7%AC%94%E8%AE%B0/anchors.jpg)]

其中，anchors size 是根据检测图像设置的，Faster RCNN网络会把所有输入的图像 reshape 成固定大小，在论文中，会为 feature map 中的每个像素点生成 anchors，后面的2次 bounding box regression 会修正 anchors 检测框位置

上图截取自论文，其中

256-d: 论文中主干特征提取网络的最后一层 num_output=256，对应生成的 feature map 是256维的
sliding window: feature map 在进入 RPN 网络后，又进行了一次 3x3 的卷积，256-d 没有变
$\quad layer$ : 已知每个像素点上有 k 个 anchor(图中 k = 9)，每个 anchor 要分前景(positive)和背景(negative)，所以每个点由 256-d 的 feature map 转化为 2k scores
$\quad layer$ : 已知每个像素点上有 k 个 anchor(图中 k = 9)，每个 anchor 有 $(x, y, w, h)$ 对应的4个偏移量，所以每个点由 256-d 的 feature map 转化为 4k coordinates

上图以图片大小 500x500 为例，计算生成的 gernerate anchors 的数量
$\operatorname{ceil}(500 / 16) \times \operatorname{ceil}(500 / 16) \times 9=32 \times 32 \times 9= 9216$
ceil()为向上取整，因为图中VGG16网络输出的 feature map size 为整数

判定 positive/negative

主要步骤：

RPN 网络图中上面一条输入为共享层卷积的输出
进行通道数为2k(k=num_anchors)的 1x1 卷积
reshape 成两个通道
对通道层做归一化，使类别预测的概率和为 1
取最终的预测类别和概率
reshape 回复原状 [1, h, w, 9*2]

论文作者在源码中的 softmax_loss_layer.cpp 对最后 reshape层的解释:

"Number of labels must match number of predictions; "
"e.g., if softmax axis == 1 and prediction shape is (N, C, H, W), "
"label count (number of labels) must be N*H*W, "
"with integer values in {0, 1, ..., C-1}.";

bounding box regression

图中所示，绿色框为苹果的 ground truth，红色为提取的 positive anchors，即便红色的框被分类器识别为苹果，但是由于红色的框定位不准，这张图相当于没有正确的检测出苹果。所以需要采用一种方法对红色的框进行微调，使得 positive anchors 和 ground truth 更加接近

对于窗口一般使用四维向量 $(x, y, w, h)$ 表示，分别表示窗口的中心点坐标和宽高，红框代表原始的positive anchors，绿框代表目标的 ground truth，使得输入原始的 anchor 经过映射得到一个跟 ground truth 更接近的回归窗口，即

positive anchors: $A = (A_x, A_y, A_w, A_h)$

ground truth: $GT = (G_x, G_y, G_w, G_h)$

寻找 $F$ ，使 $(G_{x}^{\prime}, G_{y}^{\prime}, G_{w}^{\prime}, G_{h}^{\prime})$

其中 $(G_{x}^{\prime}, G_{y}^{\prime}, G_{w}^{\prime}, G_{h}^{\prime}) \approx (G_{x}, G_{y}, G_{w}, G_{h})$

通过变换 $F$ 从 $A$ 变换到 $G^{'}$ ，我们要做的是

平移
$G_x^\prime = A_w \cdot d_x(A) + A_x \\ G_y^\prime = A_h \cdot d_y(A) + A_y$
缩放
$G_w^\prime = A_w \cdot exp(d_w(A))\\ G_h^\prime = A_h \cdot exp(d_h(A))$
需要学习的是 $d_x(A), d_y(A), d_w(A) ,d_h(A)$ 这四个变换。当输入的 $A$ 与 $G T$ 相差较小时，认为这种变换是一种线性变换，用线性回归来建模对窗口进行微调，当 $A$ 和 $G T$ 比较接近时，认为是复杂的非线性问题

已知线性回归公式 $Y = W X$ ， $X$ 为 feature map，定义为 $\phi$ ，训练传入 $A$ 与 $G T$ 之间的变换量 $t_x, t_y, t_w, t_h, )$ ， $Y$ 为 $d_x(A), d_y(A), d_w(A) ,d_h(A))$ ，则目标函数为
$d_*(A) = W_*^T\phi(A)$
其中 $\phi(A)$ 是对应 anchor 的 feature map 组成的特征向量， $W_{*}$ 是需要学习的参数， $d_{*}(A)$ 是得到的预测值

在 Faster RCNN 论文中，positive anchor 与 ground truth 之间的平移量 $t_x, t_y)$ 与尺度因子 $t_w, t_h)$ 如下
$t_x = (x-x_a)/w_a \quad t_y = (y-y_a)/h_a \\ t_w = \log(w/w_a) \quad t_h = \log(h/h_a)$
为了让预测值 $ {d_{*}(A) }$ 与真实值差距最小， ${\operatorname{smooth}_{L_{1}}}$ 损失函数为
$\begin{cases} 0.5 \cdot (\sum_i^N (t_*^i -W_*^T \cdot \phi(A^i))^2 & \text{if}|x| <1 \\ \sum_i^N |t_*^i -W_*^T \cdot \phi(A^i)| - 0.5 & \text{otherwise} \\ \end{cases}$
优化目标函数为
$\hat{W}_* = {argmin}_{W_*} \sum_i^n (t_*^i -W_*^T \cdot \phi(A^i))^2 + \lambda \| W_* \|$
之后可通过梯度下降等方法修正 anchor 位置，注意当 $A$ 和 $G T$ 比较接近时，才可近似认为上述线性变换及优化目标函数成立

对 proposals 进行 bounding box regression

在第二条线路中，num_output=36，即经过该卷积输出图像为 WxHx36，存储为 [1, 4x9, H, W]，这里相当于 feature maps 每个点都有9个 anchors，每个 anchors 又都有4个用于回归的 $d_x(A), d_y(A), d_w(A) ,d_h(A))$ 变换量

VGG16 网络输出 $32 * 32 * 512$ 的特征，对应设置 $32 * 32 * k$ 个 anchors，因此RPN输出

大小为 $32 * 32 * 2 k$ 的 positive/negative softmax 分类特征矩阵
大小为 $32 * 32 * 4 k$ 的 regression 坐标回归特征矩阵

对应 RPN 的 positive/negative 分类和 bounding box regression 坐标回归

Proposal Layer

Proposal Layer负责综合所有 $d_x(A), d_y(A), d_w(A), d_h(A))$ 变换量和 positive anchors，计算出精准的proposal，送入后续 RoI Pooling Layer

Proposal Layer有3个输入：positive/negative anchors 分类器结果 rpn_cls_score， $d_x(A), d_y(A), d_w(A), d_h(A))$ 的变换量 rpn_bbox_pred，img_info(包含 feat_stride = 16)

img_info: 对于一副任意大小 PxQ 图像，传入 Faster RCNN 前_prob概首先reshape到固定 MxN，im_info=[M, N, scale_factor] 保存了此次缩放的所有信息。然后经过 VGG16，经过4次 max_pooling2d 变为 WxH=(M/16)x(N/16) 大小，其中 feature_stride=16 则保存了该信息，用于计算 anchor 偏移量

Proposal Layer forward（前传函数）按照以下顺序依次处理:

生成anchors，利用 $ (d_x(A), d_y(A), d_w(A), d_h(A)) $ 对所有的 anchors 做 bbox regression 回归（这里的 anchors 生成和训练时相同）
按照输入的 positive softmax scores 由大到小排序 anchors，提取前 pre_nms_top N(e.g. 5000) 个anchors，即提取修正位置后的 positive anchors
限定超出图像边界的 positive anchors 为图像边界，防止后续 ROIpooling 时 proposal 超出图像边界
剔除尺寸非常小的 positive anchors
对剩余的 positive anchors 进行NMS(极大值抑制)
Proposal Layer 有3个输入: positive 和 negative anchors 分类器结果 rpn_cls_score，对应的 bbox reg 的 (e.g. 300) 结果作为 proposal 输出

输出 proposal 为 [x_min, y_min, x_max, y_max]，由于需要将 anchors 映射回原图判断是否超出边界，所以 proposal 对应的图像尺度为 MxN

ROIHead

在传统的CNN网络中，当训练好后输入的图像尺寸必须是固定值，同时网络输出也是固定大小的 vector or matrix，如果输入图像大小不定，过去有2种解决办法:

从图像中 crop 一部分传入网络
将图像warp成需要的大小后传入网络

crop后破坏了图像的完整结构，warp后破坏了图像原始形状信息，两种方法都不好

为了使网络可以接收不同大小的图像，Faster RCNN 中提出了 ROIPooling，ROIPooling 从 Spatial Pyramid Pooling 发展而来，这里不展开讨论

ROI pooling

ROIpooling 对 proposal 对 feature map 裁剪后的 ROIs 进行 maxpooling 使输入的 shape 相同，生成 proposal feature maps，它有3个参数:

pooled_w: proposal feature maps 的 width
pooled_h: proposal feature maps 的 width
spatial_scale: 是 VGG16 提取 feature map 后对图像尺度的改变，也就是 feature_stride=16

由于 proposal 是对应 MxN 尺度的，所以首先使用 spatial_scale 将其映射回 (M/16)x(N/16) 大小的 feature map 尺度，再将每个 proposal 对应的 feature map 区域水平分为 pooled_w x pooled_h 的网格，对网格的每一份都进行max pooling处理

例:

假定输入 feature map 为

假定区域建议为

假定 pooled_w=2, pooled_h=2

对网格的每一份都进行 max pooling 处理

这种方法显著加快了训练和测试时间

Classification

利用 ROIpooling 输出的 proposal feature maps，通过 1x1的conv2d 层与 softmax 计算每个 proposal 具体属于那个类别，输出 cls_prob 概率向量，同时再次利用 bounding box regression 获得每个 proposal 的位置偏移量 bbox_pred，用于回归更加精确的目标检测框

训练过程

论文源码中训练 Faster RCNN 有两种方式，一种是四步交替训练法，一种是 end-to-end 训练法，本文只讨论四步交替训练法

由前面我们可知，Faster RCNN 大概可以分为 RPN 网络和 Fast RCNN 网络部分

训练 RPN，用 feature map 初始化 RPN 网络，并端到端微调，生成 region proposal
用 feature map 初始化 Fast RCNN 网络部分，利用第一步的 RPN 生成的 region proposals 作为输入数据，接着训练 Fast RCNN部分，这时两个网络没有共享卷积层
用第二步的 Fast RCNN model 初始化 RPN 第二次进行训练，但固定共享的卷积层，并且只微调 RPN 独有的层，现在两个网络共享卷积层
由第三步的 RPN model 初始化 Fast RCNN 网络部分，输入数据为第三步生成的 proposals，保持共享的卷积层固定，微调 Fast RCNN 网络部分 Classification 中的卷积层，两个网络共享相同的卷积层，构成一个统一的网络，也就是论文中的 unified network

文中提到的共享卷积层的方法为迁移学习中的技术: 微调(fine tunin)

参考

Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks Shaoqing Ren; Kaiming He; Ross B. Girshick; Jian Sun 0001
Fast R-CNN Ross Girshick; Microsoft Research
Research on Apple Detection Classification and Location Technology in Complex Environment Based on Deep Learning Tian Bokai; Professor Yue Youjun
Apple Target Detection Based on Improved Faster - RCNN Framework of Deep Learning LI Linsheng; ZENG Pingping
https://github.com/FurkanOM/tf-faster-rcnn
https://blog.csdn.net/weixin_43198141/article/details/90178512
https://zhuanlan.zhihu.com/p/31426458
https://github.com/jinfagang/keras_frcnn
https://github.com/bubbliiiing/faster-rcnn-keras
https://blog.csdn.net/weixin_40449426/article/details/78141635

python中的高级变量V hbwhmama python学习 python
定义一个元组(常规)info_tuple=("Tom",18,1.85)print(type(info_tuple))#查看info_tuple的类型print(info_tuple)#输出元祖中的所有元素('Tom',18,1.85)print(info_tuple[0])#指定索引直输出指定数据Tom定义一个空元组info_tuple_01=()print(type(info_tuple_01
华为认证系统备考指南全解析噗老师华为认证 IT HCIE HCIA HCIP 备考备考攻略
Hello！大家好，小编是一名专注IT领域的资深探索家。都知道华为认证就像技术江湖的"段位证书"！从HCIA的入门小白到HCIE的架构大神，这套认证体系藏着清晰的成长路径。今天就带你拆解备考密码，把考纲变地图、把难点变台阶，轻松解锁技术进阶新姿势一、华为认证体系：技术进阶的阶梯华为认证构建**“HCIA→HCIP→HCIE”三级能力模型**，覆盖数据通信（Datacom）、云计算（Cloud）、网
【数据结构】检验括号匹配问题会的全对٩(ˊᗜˋ*)و 数据结构数据结构检验括号匹配算法经验分享学习
题目：假设表达式中允许有两种括号：圆括号和方括号，其嵌套的顺序随意，即(()[]）或[([][])]等为正确格式，[(])或(((]均为不正确的格式。检验括号是否匹配的方法可用“期待的紧迫程度”这个概念来描述。例如：考虑下列的括号序列：[([][])]12345678当计算机接受了第1个括号以后，他期待着与其匹配的第8个括号的出现，然而等来的却是第2个括号，此时第1个括号“[”只能暂时靠边，而迫切
Python应用指南：利用高德地图API获取公交+地铁可达圈（二）图说交通高德API系列 python 开发语言信息可视化 shp 高德地图api
副标题：利用Python自动化调用高德API并批量处理可达圈在上一篇文章中，我们详细探讨了如何利用高德地图API获取单一位置的公交可达圈数据。通过构建请求URL、发送HTTP请求、解析返回的JSON数据，并对其中的坐标进行从GCJ-02（高德火星坐标系）到WGS84（通用地理坐标系）的转换，最终将结果整理为CSV格式输出，实现了对单个出发点在指定时间范围内可到达区域的精确描绘。这一过程不仅帮助我们
SQL Server 进阶：递归 CTE+CASE WHEN 实现复杂树形统计(第二课) AI、少年郎 java 数据库开发语言 sql递归树形递归
在《SQLServer函数实战：一条SQL替代3000行代码的计算逻辑》基础上，我们进一步拓展业务需求，实现更复杂的层级数据统计。本次将重点解决两个核心问题：一是统计每个部门（含所有下级部门）请假天数大于3天的记录数量；二是让上级部门的统计结果自动汇总所有下级部门数据，实现树形结构的递归统计。通过递归CTE、CASEWHEN函数与分组聚合的深度结合，完成从基础数据统计到层级化数据分析的跨越。一、业
自动提示SQL：一种在资源受限环境中实现文本到SQL转换的高效架构
ZetongTang1{}^{1}1,QianMa2\mathrm{Ma}^{2}Ma2,DiWu3∗\mathrm{Wu}^{3*}Wu3∗1{}^{1}1西南大学计算机与信息科学学院，[email protected]，中国重庆2{}^{2}2西南大学计算机与信息科学学院，[email protected]，中国重庆3{}^{3}3西南大学计算机与信
从零开始理解Transformer模型：架构与应用淮橘√ transformer 深度学习人工智能
引言近年来，Transformer模型席卷了自然语言处理（NLP）领域，成为了深度学习中的明星架构。从Google提出的《AttentionisAllYouNeed》论文到ChatGPT、BERT等模型的广泛应用，Transformer以其强大的性能和灵活性改变了我们对序列建模的认知。本文将从零开始，深入浅出地解析Transformer的架构原理、核心组件以及实际应用场景，并提供一个简单的代码示例
题解：二叉树的中序遍历（94.二叉树的中序遍历）微白.. 算法数据结构 leetcode
题目描述给定一个二叉树的根节点root，返回它的中序遍历。解题思路二叉树的中序遍历是一种常见的树遍历方法。它按照访问左子树——根节点——右子树的顺序进行。本文将介绍三种实现二叉树中序遍历的方法：递归、迭代和Morris遍历，并详细分析每种方法的复杂度。方法一：递归思路与算法递归是最直观的中序遍历实现方式。中序遍历的特点是先遍历左子树，然后访问根节点，最后遍历右子树。因此，可以通过递归函数来实现这一
用流式API优雅地在Java中组装数据
作为开发者，我们经常会遇到这样的场景：从数据库、微服务API或不同的文件里获取到了几份数据，它们之间通过某些ID相互关联。我们的任务是将它们“拼接”成一个完整的、信息丰富的视图。通常，我们的第一反应可能是这样：//丑陋的嵌套循环Listresult=newArrayListfinalData=DataAssembler.source(users).data(orders).match((user,
LeetCode高频100题刷题记录之——二叉树的中序遍历巍巍微澜 Leetcode刷题记录 leetcode 算法 python 二叉树
1问题描述给定一个二叉树，按照左，中，右的顺序遍历这棵树。2代码实现思路很简单，从左到右遍历这颗二叉树即可。2.1递归代码实现#Definitionforabinarytreenode.#classTreeNode:#def__init__(self,val=0,left=None,right=None):#self.val=val#self.left=left#self.right=right#
java opencv 数字识别算法_[机器学习]基于OpenCV实现最简单的数字识别后期小雨 java opencv 数字识别算法
本文将基于OpenCV实现简单的数字识别。这里以游戏AngryBirds为例，通过以下几个主要步骤对其中右上角的分数部分进行自动识别。1.学习分类器根据训练样本，选取模型训练产生数字分类器。这里的样本可以是通用的数字样本库(如NIST等)，也可以是针对应用场景而制作的专门训练样本。前者优在泛化性，后者强在准确率，当然常用做法是将这两者结合，即在通用数字库基础上做修改。另外这里由于模式并不复杂，计算
【CSS-14-基础样式表Base.css】如何编写高质量的Base.css：前端样式重置与基础规范指南 AllenBright #CSS 前端 css
在前端开发中，Base.css（也称为重置样式表或基础样式表）是整个项目样式的基石。它负责消除浏览器默认样式的差异，建立统一的样式基准，为后续开发提供一致的起点。一个精心设计的Base.css能够显著提高开发效率，减少浏览器兼容性问题，并保持项目样式的一致性。1.Base.css的核心作用样式重置（Reset）：消除不同浏览器之间的默认样式差异基础规范（BaseRules）：定义项目通用的基础样式
新手学习linux关于CentOS下载及版本选择 \光辉岁月/ linux
i386是给32位机器使用的，而x86_64适用于64位机器。前者只能使用32位软件，后者可以兼用32位软件，这就是两者区别。如果你的服务器内存超4GB，强烈建议使用64位版本；如果只在虚拟机器里安装学习，那么32位就行了，也就是选择i386版本。如果想做服务器，则建议选64位。进入之后我们看到这样一个界面：这么多文件该怎么选择呢？对新手来说，可能一下子要蒙了。不急，慢慢来。先观察文件后缀名，分.
ES6 数组常用方法初遇你时动了情 ES6 es6 javascript 前端
实例方法at()长久以来，JavaScript不支持数组的负索引，如果要引用数组的最后一个成员，不能写成arr[-1]，只能使用arr[arr.length-1]。这是因为方括号运算符[]在JavaScript语言里面，不仅用于数组，还用于对象。对于对象来说，方括号里面就是键名，比如obj[1]引用的是键名为字符串1的键，同理obj[-1]引用的是键名为字符串-1的键。由于JavaScript的数
es6特性-第一部分 \光辉岁月/ ecmascript es6 前端 ecmascript
letlet关键字主要用来进行变量的声明。有以下注意的点：变量名不能重复声明，防止变量被污染。var关键字可以letstar='罗志祥';letstar='小猪';//执行后报错let声明的变量只能在块级作用域（if、函数、for…）内有效。但不影响作用域链。{letgirl="周扬青';}console.log(girl);//报错{letschool='尚硅谷';functionfn(){co
mysql中有大量sleep进程的原因与解决办法 \光辉岁月/ php 数据库
mysql中有大量sleep进程的原因与解决办法mysql服务器中有大量的sleep进程，本文分析下mysql出现大sleep进程原因分析与解决方法。可能的原因：造成睡眠连接过多的原因？1.使用了太多持久连接（个人觉得，在高并发系统中，不适合使用持久连接）2.程序中，没有及时关闭mysql连接3.数据库查询不够优化，过度耗时。当然，更根本的方法，还是从以上三点排查之：1.程序中，不使用持久链接，即
es6数组的flat()，flatMap()函数用法实例分析 PrinciplesMan #Es6 es6 javascript 开发语言
数组的成员有时还是数组，Array.prototype.flat()用于将嵌套的数组“拉平”，变成一维数组。该方法返回一个新数组，对原数据没有影响。[1,2,[3,4]].flat()//[1,2,3,4]上面代码中，原数组的成员里面有一个数组，flat()方法将子数组的成员取出来，添加在原来的位置。flat()默认只会“拉平”一层，如果想要“拉平”多层的嵌套数组，可以将flat()方法的参数写成
如何使用 PHP 接入港股实时行情接口（WebSocket 实时K线+盘口） quant_1986 php 开发语言网络协议 websocket 后端经验分享笔记
在构建金融类网站或量化交易系统时，实时行情数据是不可或缺的核心组件之一。尤其是对港股市场感兴趣的开发者，更需要一个可靠且实时的行情源。本文将介绍如何使用PHP接入港股行情接口，并实现实时接收1分钟K线数据。准备工作首先，确保你的开发环境中安装了Composer。我们将使用PHP的WebSocket客户端库textalk/websocket。composerrequiretextalk/websoc
ES6模块化导入导出示范荣华富贵8 程序员的知识储备2 程序员的知识储备3 javascript 开发语言 ecmascript
下面给你一个实用且稍微复杂点的ES6模块化示范，涵盖命名导出、默认导出、以及模块组合导入，非常适合程序员日常用法。1.mathUtils.js—命名导出//mathUtils.jsexportfunctionadd(a,b){returna+b;}exportfunctionmultiply(a,b){returna*b;}exportconstPI=3.1415926;2.stringUtils
页面通信的方式 :postMessage向指定窗口发送信息呼叫6945 javascript 页面通信
postMessage是HTML5引入的一个跨文档通信API，允许不同窗口或iframe之间安全地发送消息。通过postMessage，你可以向指定的窗口或iframe发送信息，并且接收方可以通过监听message事件来接收这些信息。使用方法发送消息targetWindow.postMessage(message,targetOrigin,[transfer]);targetWindow:目标窗口
MVVM前端开发模型,怎么快速定位问题
MVVM（Model-View-ViewModel）是一种常见的前端开发架构，主要用于分离应用的逻辑和UI，提升代码的可维护性和可测试性。在MVVM中，Model代表数据层，View代表用户界面层，而ViewModel是连接两者的中介，负责处理UI和数据之间的交互。在开发中，尤其是调试和快速定位问题时，可能会遇到一些挑战。以下是一些基于MVVM前端架构的调试技巧和方法：1.明确问题的层次首先，要清
前端流式输出3种实现呼叫6945 前端 javascript
在前端开发中，流式输出（streamingoutput）通常是指逐步输出数据，而不是等待所有数据准备好后一次性显示。这种技术在处理大型数据集、实时数据或需要逐步加载内容的情况下非常有用。下面介绍几种实现流式输出的方法，包括使用FetchAPI和EventSource。1.使用FetchAPI实现流式输出通过FetchAPI和可读流（ReadableStreams），可以在响应到达时逐步读取和处理数
ES6模块导入详解与实战示例 t0_54coder 编程问题解决手册 es6 前端 ecmascript 编程开发
ES6模块导入详解与实战示例在JavaScript的世界里，随着ES6的推出，模块化编程变得更加简洁和强大。本篇博客将深入探讨ES6模块的导入特性，并结合实例来展示如何灵活使用。模块导入的灵活性ES6允许开发者选择性地导入模块中的特性，而不是像之前的import*asXYZ那样一次性导入所有导出的内容。这种方式可以提高代码的可读性和维护性。选择性导入命名特性使用以下语法，我们可以只导入需要的特性：
Autodesk 3ds Max 2025专业级硬件配置指南：释放三维创作潜能渲吧-云渲染 3d
Autodesk3dsMax2025软件受以下64位操作系统支持，并且至少需要具有以下64位硬件的系统：软件操作系统Microsoft®Windows®10版本1809或更高版本。Microsoft®Windows®11有关支持信息，请参见Autodesk的产品支持生命周期。浏览器Autodesk建议使用以下Web浏览器的最新版本来访问联机补充内容：Microsoft®EdgeGoogleChro
筑牢医疗AI安全防线：四重防护体系全解析 Allen_Lyb 数智化教程（第二期）人工智能安全
一、引言：医疗AI发展中的安全困境在数字化浪潮席卷下，医疗领域正经历着一场由人工智能（AI）驱动的深刻变革。医疗AI凭借其强大的数据分析与处理能力，在疾病诊断、药物研发、健康管理等诸多环节展现出巨大潜力，成为推动医疗行业进步的关键力量。而这一切的背后，医疗数据作为AI发展的“燃料”，以及AI算力作为运行的“引擎”，起着不可或缺的核心作用。医疗数据涵盖了患者从基本信息、病史、症状描述到各种检查检验报
2025年6月28和29日复习和预习（C++）子豪-中国机器人算法 java 数据结构 c++
学习笔记大纲一、预习部分：数组基础（一）核心知识点数组的创建：掌握一维数组的声明方式，如intarr[5];（创建一个包含5个整数的数组）。重点在于理解数组长度需为常量，且在声明时确定。数组的初始化：学会为数组赋值，例如intarr[]={1,2,3};，可省略数组长度，编译器根据初始化值自动确定。数组元素的访问：通过索引访问数组元素，索引从0开始，如arr[1]表示访问数组arr的第二个元素。（
OpenCV CUDA模块设备层-----双曲正切函数tanh() 村北头的码农 OpenCV opencv 人工智能计算机视觉
操作系统：ubuntu22.04OpenCV版本：OpenCV4.9IDE:VisualStudioCode编程语言：C++11算法描述OpenCV的CUDA模块（cudev）中的一个设备函数，用于在GPU上对uchar4类型的向量（如RGBA像素）进行双曲正切（hyperbolictangent）运算，并返回一个float4类型的结果。函数原型__device____forceinline__f
重磅教程！华为鸿蒙 4.2/4.3 也能用谷歌？教你轻松安装 Google 框架，畅享原汁原味体验！ AI创界者华为 harmonyos
随着华为鸿蒙系统的发展，越来越多用户开始使用HarmonyOS4.2/4.3作为日常主力系统。然而，对于一些有海外App使用需求，或需要使用Google生态服务（如Gmail、YouTube、GoogleMaps、Play商店）的用户来说，无法直接使用谷歌框架一直是一个遗憾。今天，我们就来教大家一个低风险、亲测有效的安装方式，让你的鸿蒙设备也能顺利运行谷歌应用，畅享更全面的移动体验！准备工作在开始
二叉树题解——二叉树的中序遍历【LeetCode】统一写法版本
94.二叉树的中序遍历一、算法逻辑（逐步通顺地讲解）这段代码的目标是实现中序遍历，即按照顺序：左子树→当前节点→右子树遍历整个二叉树，并返回节点值的列表。与常见的递归或传统栈方法不同，这里使用的是一种“统一写法”技巧，将“节点值访问”与“节点展开”分开处理，流程如下：1️⃣初始化结构使用一个栈保存待处理元素（可能是TreeNode或int）；初始栈中放入整棵树的根节点；结果数组rst用来保存最终遍
:checked=“true“ 咔咔咔索菲斯 vue.js 前端 javascript
在Vue中，:checked="true"是通过v-bind（缩写:）绑定表单元素的checked属性，使其默认处于选中状态。具体说明如下：1.作用：动态设置复选框/单选框的选中状态-当isSelected为true时，复选框默认选中；为false时取消选中。-单选框通过表达式userGender==='male'的布尔值判断是否选中。2.与不使用v-bind的区别-:checked="true"
Nginx负载均衡 510888780 nginx 应用服务器
Nginx负载均衡一些基础知识: nginx 的 upstream目前支持 4 种方式的分配 1)、轮询（默认）每个请求按时间顺序逐一分配到不同的后端服务器，如果后端服务器down掉，能自动剔除。 2)、weight 指定轮询几率，weight和访问比率成正比
RedHat 6.4 安装 rabbitmq bylijinnan erlang rabbitmq redhat
在 linux 下安装软件就是折腾，首先是测试机不能上外网要找运维开通，开通后发现测试机的 yum 不能使用于是又要配置 yum 源，最后安装 rabbitmq 时也尝试了两种方法最后才安装成功机器版本： [root@redhat1 rabbitmq]# lsb_release LSB Version: :base-4.0-amd64:base-4.0-noarch:core
FilenameUtils工具类 eksliang FilenameUtils common-io
转载请出自出处：http://eksliang.iteye.com/blog/2217081 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
xml文件解析SAX 不懂事的小屁孩 xml
xml文件解析:xml文件解析有四种方式， 1.DOM生成和解析XML文档(SAX是基于事件流的解析) 2.SAX生成和解析XML文档(基于XML文档树结构的解析) 3.DOM4J生成和解析XML文档 4.JDOM生成和解析XML 本文章用第一种方法进行解析，使用android常用的DefaultHandler import org.xml.sax.Attributes;
通过定时任务执行mysql的定期删除和新建分区，此处是按日分区酷的飞上天空 mysql
使用python脚本作为命令脚本，linux的定时任务来每天定时执行 #!/usr/bin/python # -*- coding: utf8 -*- import pymysql import datetime import calendar #要分区的表 table_name = 'my_table' #连接数据库的信息 host,user,passwd,db =
如何搭建数据湖架构？听听专家的意见蓝儿唯美架构
Edo Interactive在几年前遇到一个大问题：公司使用交易数据来帮助零售商和餐馆进行个性化促销，但其数据仓库没有足够时间去处理所有的信用卡和借记卡交易数据 “我们要花费27小时来处理每日的数据量，”Edo主管基础设施和信息系统的高级副总裁Tim Garnto说道：“所以在2013年，我们放弃了现有的基于PostgreSQL的关系型数据库系统，使用了Hadoop集群作为公司的数
spring学习——控制反转与依赖注入 a-john spring
控制反转（Inversion of Control，英文缩写为IoC）是一个重要的面向对象编程的法则来削减计算机程序的耦合问题，也是轻量级的Spring框架的核心。控制反转一般分为两种类型，依赖注入（Dependency Injection，简称DI）和依赖查找（Dependency Lookup）。依赖注入应用比较广泛。
用spool+unixshell生成文本文件的方法 aijuans xshell
例如我们把scott.dept表生成文本文件的语句写成dept.sql,内容如下: 　　set pages 50000; 　　set lines 200; 　　set trims on; 　　set heading off; 　　spool /oracle_backup/log/test/dept.lst; 　　select deptno||','||dname||','||loc
1、基础--名词解析(OOA/OOD/OOP) asia007 学习基础知识
OOA:Object-Oriented Analysis（面向对象分析方法）是在一个系统的开发过程中进行了系统业务调查以后，按照面向对象的思想来分析问题。OOA与结构化分析有较大的区别。OOA所强调的是在系统调查资料的基础上，针对OO方法所需要的素材进行的归类分析和整理，而不是对管理业务现状和方法的分析。　　OOA（面向对象的分析）模型由5个层次（主题层、对象类层、结构层、属性层和服务层）
浅谈java转成json编码格式技术百合不是茶 json编码 java转成json编码
json编码;是一个轻量级的数据存储和传输的语言在java中需要引入json相关的包,引包方式在工程的lib下就可以了 JSON与JAVA数据的转换（JSON 即 JavaScript Object Natation，它是一种轻量级的数据交换格式，非常适合于服务器与 JavaScript 之间的数据的交
web.xml之Spring配置(基于Spring+Struts+Ibatis) bijian1013 java web.xml SSI spring配置
指定Spring配置文件位置 <context-param> <param-name>contextConfigLocation</param-name> <param-value> /WEB-INF/spring-dao-bean.xml,/WEB-INF/spring-resources.xml, /WEB-INF/
Installing SonarQube（Fail to download libraries from server） sunjing Install Sonar
1. Download and unzip the SonarQube distribution 2. Starting the Web Server The default port is "9000" and the context path is "/". These values can be changed in &l
【MongoDB学习笔记十一】Mongo副本集基本的增删查 bit1129 mongodb
一、创建复本集假设mongod,mongo已经配置在系统路径变量上，启动三个命令行窗口，分别执行如下命令： mongod --port 27017 --dbpath data1 --replSet rs0 mongod --port 27018 --dbpath data2 --replSet rs0 mongod --port 27019 -
Anychart图表系列二之执行Flash和HTML5渲染白糖_ Flash
今天介绍Anychart的Flash和HTML5渲染功能 HTML5 Anychart从6.0第一个版本起，已经逐渐开始支持各种图的HTML5渲染效果了，也就是说即使你没有安装Flash插件，只要浏览器支持HTML5，也能看到Anychart的图形（不过这些是需要做一些配置的）。这里要提醒下大家，Anychart6.0版本对HTML5的支持还不算很成熟，目前还处于
Laravel版本更新异常4.2.8-> 4.2.9 Declaration of ... CompilerEngine ... should be compa bozch laravel
昨天在为了把laravel升级到最新的版本，突然之间就出现了如下错误： ErrorException thrown with message "Declaration of Illuminate\View\Engines\CompilerEngine::handleViewException() should be compatible with Illuminate\View\Eng
编程之美-NIM游戏分析-石头总数为奇数时如何保证先动手者必胜 bylijinnan 编程之美
import java.util.Arrays; import java.util.Random; public class Nim { /**编程之美 NIM游戏分析问题：有N块石头和两个玩家A和B，玩家A先将石头随机分成若干堆，然后按照BABA...的顺序不断轮流取石头，能将剩下的石头一次取光的玩家获胜，每次取石头时，每个玩家只能从若干堆石头中任选一堆，
lunce创建索引及简单查询 chengxuyuancsdn 查询创建索引 lunce
import java.io.File; import java.io.IOException; import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis.standard.StandardAnalyzer; import org.apache.lucene.document.Docume
[IT与投资]坚持独立自主的研究核心技术 comsci it
和别人合作开发某项产品....如果互相之间的技术水平不同,那么这种合作很难进行,一般都会成为强者控制弱者的方法和手段..... 所以弱者,在遇到技术难题的时候,最好不要一开始就去寻求强者的帮助,因为在我们这颗星球上,生物都有一种控制其
flashback transaction闪回事务查询 daizj oracle sql 闪回事务
闪回事务查询有别于闪回查询的特点有以下3个：（1）其正常工作不但需要利用撤销数据，还需要事先启用最小补充日志。（2）返回的结果不是以前的“旧”数据，而是能够将当前数据修改为以前的样子的撤销SQL（Undo SQL）语句。（3）集中地在名为flashback_transaction_query表上查询，而不是在各个表上通过“as of”或“vers
Java I/O之FilenameFilter类列举出指定路径下某个扩展名的文件游其是你 FilenameFilter
这是一个FilenameFilter类用法的例子，实现的列举出“c:\\folder“路径下所有以“.jpg”扩展名的文件。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
C语言学习五函数，函数的前置声明以及如何在软件开发中合理的设计函数来解决实际问题 dcj3sjt126com c
# include <stdio.h> int f(void) //括号中的void表示该函数不能接受数据，int表示返回的类型为int类型 { return 10; //向主调函数返回10 } void g(void) //函数名前面的void表示该函数没有返回值 { //return 10; //error 与第8行行首的void相矛盾 } in
今天在测试环境使用yum安装，遇到一个问题： Error: Cannot retrieve metalink for repository: epel. Pl dcj3sjt126com centos
今天在测试环境使用yum安装，遇到一个问题： Error: Cannot retrieve metalink for repository: epel. Please verify its path and try again 处理很简单，修改文件“/etc/yum.repos.d/epel.repo”，将baseurl的注释取消， mirrorlist注释掉。即可。 &n
单例模式 shuizhaosi888 单例模式
单例模式懒汉式 public class RunMain { /** * 私有构造 */ private RunMain() { } /** * 内部类，用于占位，只有 */ private static class SingletonRunMain { priv
Spring Security（09）——Filter 234390216 Spring Security
Filter 目录 1.1 Filter顺序 1.2 添加Filter到FilterChain 1.3 DelegatingFilterProxy 1.4 FilterChainProxy 1.5
公司项目NODEJS实践0.1 逐行分析JS源代码 mongodb nginx ubuntu nodejs
一、前言前端如何独立用nodeJs实现一个简单的注册、登录功能，是不是只用nodejs+sql就可以了？其实是可以实现，但离实际应用还有距离，那要怎么做才是实际可用的。网上有很多nod
java.lang.Math liuhaibo_ljf java Math lang
System.out.println(Math.PI); System.out.println(Math.abs(1.2)); System.out.println(Math.abs(1.2)); System.out.println(Math.abs(1)); System.out.println(Math.abs(111111111)); System.out.println(Mat
linux下时间同步 nonobaba ntp
今天在linux下做hbase集群的时候，发现hmaster启动成功了，但是用hbase命令进入shell的时候报了一个错误 PleaseHoldException: Master is initializing，查看了日志，大致意思是说master和slave时间不同步，没办法，只好找一种手动同步一下，后来发现一共部署了10来台机器，手动同步偏差又比较大，所以还是从网上找现成的解决方
ZooKeeper3.4.6的集群部署 roadrunners zookeeper 集群部署
ZooKeeper是Apache的一个开源项目，在分布式服务中应用比较广泛。它主要用来解决分布式应用中经常遇到的一些数据管理问题，如：统一命名服务、状态同步、集群管理、配置文件管理、同步锁、队列等。这里主要讲集群中ZooKeeper的部署。 1、准备工作我们准备3台机器做ZooKeeper集群，分别在3台机器上创建ZooKeeper需要的目录。数据存储目录
Java高效读取大文件 tomcat_oracle java
　　读取文件行的标准方式是在内存中读取，Guava 和Apache Commons IO都提供了如下所示快速读取文件行的方法：　　Files.readLines(new File(path), Charsets.UTF_8); 　　FileUtils.readLines(new File(path)); 　　这种方法带来的问题是文件的所有行都被存放在内存中，当文件足够大时很快就会导致
微信支付api返回的xml转换为Map的方法 xu3508620 xml map 微信api
举例如下： <xml> <return_code><![CDATA[SUCCESS]]></return_code> <return_msg><![CDATA[OK]]></return_msg> <appid><