calvinpaean

FastReID A PyTorch ToolBox for General Instance ReIdentification 论文学习

Abstract

通用的实例 ReID 在计算机视觉领域是非常重要的一个任务，可许多应用中都有使用，如行人/车辆重识别、人脸识别、野生动物保护、商品追溯等。为了满足日益增长的需求，本文介绍了一个在京东广泛应用的软件系统 — FastReID。高度模块化和可扩展设计使之使用起来很方便。友好的管理系统配置和工程部署功能让从业者能很快地在应用中部署模型。作者实现了一些 SOTA 的工程，包括行人重识别、跨域重识别和车辆重识别，计划将这些在多个基准上预训练的模型开放出来。FastReID 是目前为止最通用、性能最优的工具库，支持单个或多个GPU服务器，你可以很容易地复现本文提到的结果。模型和代码位于：https://github.com/JDAI-CV/fast-reid。

1. Introduction

通用实例重识别是一个以实例为中心的 AI 技术，其目的是在大量的视频文件中找到某一个人/车辆/人脸/物体。它促成了各类应用的实现，以前这些应用需要大量痛苦、无聊的观看视频，包括在电视连续剧中找到某个演员的视频画面，从监控视频中找到一个走失的儿童，城市监控系统中一个可疑的车辆。此外，通用的实例重识别技术也会用在电商网站上，商品安全的商品追踪以及野生动物保护领域。然而在学术研究和工业落地之间一直存在着鸿沟，很难将学术成果快速落地到生产中。

为了促进通用实例重识别技术的发展，作者开放了一个统一的实例重识别库，叫做 FastReID。它具备很高的模块化、扩展性设计，使研究人员和从业者能迅速地将他们设计的模块插入一个重识别系统中，而无需重写代码，将科研想法转变为生产模型。管理系统配置让它更加灵活、可扩展，可很容易地应用到其它领域，如人脸识别和图像检索。作者提供了多个基准上训练的预训练模型，比如行人重识别、跨域重识别、车辆重识别、部分行人重识别，在将来还会放出人脸识别和目标检索模型。

最近，FastReID 已成为 JD AI 研究院广泛应用的开源库。作者会持续优化它，增加新的功能。

2. Highlights

FastReID 提供了训练、测试、微调和部署一整套工具包。此外，FastReID 也提供了强大的基线模型，能够在多个任务上取得优异的表现。

模块化和可扩展设计。在 FastReID 中，作者引入了一个模块化设计，用户可以在重识别系统中任一部分中插入自定义的模块。因此，研究员和从业者可快速实现他们的想法，无需写多少代码。

图1. FastReID 库的流程

管理系统配置。FastReID 用 PyTorch 实现，可在多个GPU服务器上快速训练。模型定义、训练和测试用 YAML 文件编写。FastReID 支持许多的选项，如主干网络、head聚合层和损失函数、训练策略。

更丰富的评价系统。目前，许多研究员只使用 CMC 评价指标。为了满足模型部署的需要，FastReID 提供了更多丰富的评价指标，如 ROC和mINP，能更好地反映模型的表现。

工程部署。太深的模型很难部署在边缘设备上，因为推理太耗时了。FastReID 使用知识蒸馏模块来得到一个准确而高效的轻量级模型。同样，FastReID 提供了一个转换工具，PyTorch $\rightarrow$ Caffe 以及PyTorch $\rightarrow$ TensorRT，进行快速的模型部署。

预训练模型。FastReID 提供了 SOTA 的推理模型，包括行人重识别、局部重识别、跨域行人重识别和车辆重识别。作者计划开放所有的这些模型。FastReID 很容易就可扩展到人脸识别和通用目标检索。

3. Architecture

这一部分，作者在图1中展示了其架构。整体架构包括4个模块：图像预处理、主干网络、聚合和head。

3.1 图像预处理

搜集来的图像有不同的大小，我们首先将它们缩放到同样的尺寸。然后将这些图像做为一个batch，输入进网络。为了得到一个更加鲁棒的模型，翻转会将原图像做镜像，让数据更多样。随机擦除、随机裁剪会随机选择图像中的一个矩形区域，用随机数、0值、图像等来填充里面的像素，避免模型过拟合，对遮挡更鲁棒。自动增广是基于 AutoML 的一种技术，可提升特征表示的鲁棒性。它使用自动搜索算法找到融合的策略，如平移、旋转、裁剪。

3.2 主干网络

主干就是推理出图像特征图的网络，比如没有最后平均池化层的 ResNet。FastReID 实现了3种主干，包括 ResNet、ResNeSt、ResNeXt。作者也增加了注意力 Non-local 模块和实例批归一化（IBN）模块，学习更鲁棒的特征。

3.3 Aggregation

聚合层目的是将主干网络的特征图聚合为一个全局特征。作者介绍了4种聚合方法：最大池化、平均池化、GeM 池化和注意力池化。池化层的输入是 $\mathbf{M}\in \mathbb{R}^{W\times H\times C}$ ，输出是 $\mathbf{f}\in \mathbb{R}^{1\times 1\times C}$ ， $W, H, C$ 分别是宽度、高度和通道数。对于最大池化、平均池化和 GeM池化而言，全局向量 $\mathbf{f}=[f_1,f_c,...,f_C]$ 分别是：

$\text{Max Pooling:} \quad f_c=\max_{x\in \mathbf{X}_c}x \tag{1}$

$\text{Avg Pooling:} \quad f_c=\frac{1}{|\mathbf{X}_c|} \sum_{x\in \mathbf{X}_c}x \tag{2}$

$\text{Gem Pooling:} \quad f_c= (\frac{1}{|\mathbf{X}_c|} \sum_{x\in \mathbf{X}_c}x^{\alpha})^{\frac{1}{\alpha}} \tag{3}$

$\text{Avg Pooling:} \quad f_c=\frac{1}{|\mathbf{X}_c \ast \mathbf{W}_c|} \sum_{x\in \mathbf{X}_c, w\in \mathbf{W}_c}w\ast x \tag{4}$

其中 $\alpha$ 为控制系数， $\mathbf{W}_c$ 是 softmax 注意力权重。

3.4 Head

Head 用于聚合模块输出的全局向量，包括批归一化 head、线性 head和 Reduction head。图3列出了这三种 head，线性 head 只包括一个决策层，BN head包括一个 BN 层和一个决策层，Reduction head 包括 conv+bn+relu+dropout 操作、一个 reduction 层和一个决策层。

图3. FastReID 中不同的 Heads

Batch Norm 用于解决内部协变量偏移（internal covariate shift）问题，因为用易饱和的非线性函数训练模型很困难。给定一个batch的特征向量 $\mathbf{f}\in \mathbb{R}^{m\times C}$ （ $m$ 是该batch内的样本数），然后 BN 特征向量 $\mathbf{f}_{bn}\in \mathbb{R}^{m\times C}$ 计算如下：

$\left\{ \begin{aligned} \mu & = \frac{1}{m}\sum_{i=1}^m \mathbf{f}_i, \\ \sigma^2 & = \frac{1}{m}\sum_{i=1}^m(\mathbf{f}_i -\mu)^2, \\ z & = \gamma \cdot \frac{\mathbf{f}-\mu}{\sqrt{\sigma^2 + \epsilon} + \beta} \end{aligned} \tag{5} \right.$

其中 $\gamma,\beta$ 是可训练的缩放和偏移参数， $\epsilon$ 是一个常数，加在 mini-batch 的方差之上，保证数值稳定。

Reduction 层目的是将高维特征变为低维特征，如 2048-dim $\rightarrow$ 512-dim。

决策层输出不同类别的置信度以区分不同的类别，进行后续的模型训练。

4. 训练

4.1 损失函数

FastReID 提供了4种损失函数。

交叉熵损失 通常用在多选一的分类问题中，定义为：

$\mathcal{L}_{ce} = \sum_{i=1}^C y_i \log \hat y_i + (1-y_i)\log (1-\hat y_i), \tag{6}$

其中 $\hat y_i=\frac{e^{\mathbf{W}_i^T \mathbf{f}}}{\sum_{i=1}^C e^{\mathbf{W}_i^T \mathbf{f}}}$ 。交叉熵损失让预测的对数值趋近于 ground truth。它让最大的对数值和其它值的差距变大，再加上梯度是有界的，就降低了模型调节的能力，造成模型对预测值过于自信，从而导致过拟合。为了构建一个鲁棒的模型，Label smoothing 被谷歌大脑提了出来，解决该问题。它让倒数第二层的激活值趋近于正确类别，而错误类别的距离则是相等的。这样交叉熵损失中的 $\mathbf{y}$ 就可写作： $y_i(j=c)=1-\delta$ ， $y_i(j\neq c)=\frac{\delta}{C-1}$ 。

Arcface 损失将笛卡尔坐标映射到超球面坐标。它将对数变换为 $\mathbf{W_i}^T \mathbf{f}= \left \| \mathbf{W}_i \right \| \left \| f \right \| \cos \theta_i$ ，其中 $\theta_i$ 是权重 $\mathbf{W_i}$ 和特征 $\mathbf{f}$ 的角度。它通过 L2 归一化将单个权重 $\left \| \mathbf{W_i}\right \|=1$ ，同样将 embedding 特征 $\mathbf{f}$ 固定，然后缩放它为 $s$ ，这样 $\hat y=\frac{e^{s\cos \theta_i}}{\sum_{i=1}^C e^{s\cos \theta_i}}$ 。为了同时增强类内紧凑度和类间差异，Arcface 增加了一个额外的角度距离惩罚项 $m$ 。这样 $\hat y_i=\frac{e^{s\cos \theta_i + m}}{e^{s\cos \theta_i + m} + \sum_{i=1,i\neq c}^{C-1} e^{s\cos \theta_i}}$ 。

Circle 损失。Circle损失的推导过程没有介绍，可参考[10]。

Triplet 损失 确保某个人的所有图像足够接近，在特征空间内，让某个人的图像 $x_i^a$ (anchor)接近该人的其它图像 $x_i^p$ (positive)，而距离其他人的图像 $x_i^n$ (negative)足够远。因此，我们希望 $D(x_i^a, x_i^p) + m < D(x_i^a, x_i^n)$ ，其中 $D (:, :)$ 用于计算两张行人图像的距离。然后 $N$ 个样本的 Triplet loss 的定义为： $\sum_{i=1}^N [m + D(g_i^a, g_i^p) - D(g_i^a, g_i^n)]$ ，其中 $m$ 是加在一对正负样本上的 margin。

4.2 训练策略

图4 显示了训练策略，包括许多的训练技巧，如不同迭代时的学习率、网络预热和冻结。

学习率预热 帮助减缓网络在初始阶段过早地过拟合。它也能帮助保持模型的稳定性。所以，作者给了一个非常小的学习率，比如训练初始时 $3.5\times 10^{-5}$ ，然后在2000个迭代过程中逐渐增加。在2000到9000次迭代时，学习率维持在 $3.5\times 10^{-4}$ 。9000次迭代后，学习率通过余弦策略从 $3.5\times 10^{-4}$ 衰退到 $7.7\times 10^{-7}$ 。在18000次迭代时，训练结束。

图4. 学习率曲线

主干网络冻结。为了让分类网络满足我们任务的需求，作者在 ImageNet 上预训练模型。通常，我们会在 ResNet 之上加一个分类器，然后分类器参数随机初始化。为了更好地初始化参数，作者只训练了分类器参数，在前2000个迭代时冻结了网络其余参数，不更新其参数。2000次后，释放这些参数，让它们进行端到端的训练。

5. 测试

5.1 距离度量

FastReID 实现了欧式距离和余弦距离。作者也实现了一个局部匹配方法：深度空间重建（DSR）。

深度空间重建。假设有两张行人图像 $x$ 和 $y$ 。将 $x$ 的主干网络的空间特征图标记为 $\mathbf{x}$ ，其维度是 $w_x\times h_x \times d$ ， $y$ 的特征图维度是 $w_y\times h_y\times d$ 。然后将 $N$ 个位置的 $N$ 个空间特征聚合，得到矩阵 $\mathbf{X}=[\mathbf{x}_n]_{n=1}^N \in \mathbb{R}^{d\times N}$ ，其中 $N=w_x\times h_x$ 。同样，作者构建了一个图像库特征矩阵 $\mathbf{Y}=\{\mathbf{y}_m\}_{m=1}^M \in \mathbb{R}^{d\times M}$ ，其中 $M=w_y\times h_y$ 。然后 $\mathbf{x}_n$ 能够在 $\mathbf{Y}$ 中找到最相似的特征，以及其匹配的得分 $s_n$ 。所以，作者尝试得到 $\mathbf{X}$ 的所有特征关于 $\mathbf{Y}$ 的相似得分，最终的匹配得分定义为 $s=\sum_{n=1}^N s_n$ 。

5.2 后处理

FastReID 实现了两个再排序方法：K-reciprocal coding 和 Query Expansion。

Query Expansion。给定一个查询图片，用它找到 $m$ 张相似图片。查询特征的定义是 $\mathbf{f}_q$ ， $m$ 个相似特征定义为 $\mathbf{f}_g$ 。然后将验证了的图库特征和查询特征求平均，构建出一个新的查询特征。所以新的查询特征 $\mathbf{f}_{newq}$ 的定义是：

$\mathbf{f}_{newq}=\frac{\mathbf{f}_q + \sum_{i=1}^m \mathbf{f}_g^{(i)}}{m+1} \tag{7}$

然后新的查询特征 $\mathbf{f}_{qnew}$ 就可用于后续的图像检索。QE可以很容易地应用在实际场景中。

5.3 Evaluation

对于表现评价，作者使用了行人重识别领域中的标准的度量，即累积匹配曲线（CMC）和平均精度（mAP）。此外，作者也增加了2个度量：re-ceiver operating characteristic (ROC) curve 和 mean in-verse negative penalty (mINP)。

5.4 可视化

作者提供了多个排序列表工具来呈现检索结果。

6. 部署

通常模型越深，性能越好。但是，模型太深了就不容易在边缘设备上部署，因为1) 推理很耗时，2）AI芯片上很难实现某些层。考虑到这些原因，作者实现了知识蒸馏的方法来得到高精度、高效率的轻量级模型。

图5.。知识蒸馏模块

如图5，给定在 ReID 数据集上的预训练学生模型和预训练教师模型，教师模型更深一些，使用了 non-local 模块、IBN 模块和其它技巧。学生模型很简单、层浅。作者采用了双流方式来训练学生模型，将教师主干冻结。学生和教师模型分别输出分类器logit $\mathbf{l}_s,\mathbf{l}_t$ 及特征 $\mathbf{f}_s, \mathbf{f}_t$ 。我们希望学生模型学习教师模型的分类能力，logit 学习可定义为：

$\mathcal{L}_{logit} = \left \| \mathbf{l}_s - \mathbf{l}_t \right \|_1 \tag{8}$

为了确保学生模型和教师模型在特征空间的分布一致，作者使用了基于KL散度的概率知识迁移模型，从而优化学生模型：

$\left\{ \begin{aligned} \mathcal{L}_{PKT} & = \sum_{i=1}^N\sum_{j=1,i\neq j}^N p_{j|i} \log(\frac{p_{j|i}}{p_{i|j}}), \\ p_{i|j} & = \frac{K(\mathbf{f}_s^i, \mathbf{f}_s^j)}{\sum_{j=1,i\neq j}^N K(\mathbf{f}_s^i, \mathbf{f}_s^j)}, \\ p_{j|i} & = \frac{K(\mathbf{f}_t^i, \mathbf{f}_t^j)}{\sum_{j=1,i\neq j}^N K(\mathbf{f}_t^i, \mathbf{f}_t^j)} \end{aligned} \tag{9} \right.$

其中 $K (:, :)$ 是余弦相似度。

同时，学生模型需要 ReID 损失 $\mathcal{L}_{reid}$ 来优化整个网络。因此，总的损失是：

$\mathcal{L}_{kd}=\mathcal{logit}+\alpha \mathcal{L}_{PKT} + \mathcal{L}_{reid}. \tag{10}$

完成训练后， $\mathbf{f}_s$ 用于推理。

作者在 FastReID 库中也提供了模型转换工具（Pytorch $\rightarrow$ Caffe，Pytorch $\rightarrow$ TensorRT）。

Kubernetes基础体系架构入门学习笔记(一) 全栈工程师修炼指南云原生落地实用指南控制器大数据分布式 kubernetes 数据库
关注「WeiyiGeek」公众号将我设为「特别关注」，每天带你玩转网络安全运维、应用开发、物联网IOT学习！0x00基础简述1.发展经历描述:近些年由于Cloud云计算(公有云)以及大数据的发展促进了企业从传统转型到数字信息化再到上云,其中运维部署应用技术也从物理机转向虚拟化再转向了容器化，再说到如今的Kubernetes对容器资源的编排与控制,这也是本次学习的重中之重#公有云类型Infrastr
【C++】string类讲解：含常用接口使用及原理模拟实现 White の algo C++初阶 c++开发语言
目录string介绍为什么要学习string类？学习方法：auto和范围forauto概念及使用注意：范围forstring类常见接口说明构造函数析构函数size()和capacity()reserve()和resize()empty()和clear()operator[]和at()begin()、end()和rbegin()、rend()push_back()append()insert()op
机器学习之条件概率贾斯汀玛尔斯 2024最新深度学习算法机器学习人工智能
1.引言概率模型在机器学习中广泛应用于数据分析、模式识别和推理任务。本文将调研几种重要的概率模型，包括EM算法、MCMC、朴素贝叶斯、贝叶斯网络、概率图模型（CRF、HMM）以及最大熵模型，介绍其基本原理、算法流程、应用场景及优势。2.EM算法（Expectation-Maximization）2.1概述EM算法是一种用于含有隐变量或缺失数据的最大似然估计方法。其核心思想是交替执行期望（E）步骤和
【C++初阶】模板初阶 White の algo C++初阶 c++算法
前言在我们之前的学习中我们要实现一个交换函数，会这么写//voidSwap(int*x,int*y)voidSwap(int&x,int&y){inttmp=x;x=y;y=tmp;}这个函数可以实现int类型的变量进行交换，但要实现其他类型，如：double、float……等，便要使用函数重载，每当出现新的类型时就需要写一个新的对应函数，太麻烦了！哪有什么方法可以只用一个函数就可以实现都种不同类
《CKA/CKAD应试指南/从docker到kubernetes 完全攻略》学习笔记第3章部署kubernets集群 Aphelios· docker kubernetes 学习
目录3.1了解kubernetes3.2安装kubernetes3.2.1实验拓扑图及环境及准备设置3.2.3安装master3.2.4配置work加入集群3.2.5安装calico网络3.3安装后的设置3.3.1删除节点及重新加入3.3.2常见一些命令3.4设置metric-server监控pod及节点的负载3.5命名空间namespace3.6管理命名空间3.7安装一套v1.20.1版本的集群
【傅里叶级数原理讲解--信号的合成与分解--含LabVIEW源码】做一个码农都是奢望 course labview FFT 传感器与测试技术
测试技术-信号的合成与分解传感器与测试技术根据傅里叶变化进行距离矩形波信号Codedesign#程序下载传感器与测试技术傅里叶级数的学习一直是难点，若不对信号进行分析，很难掌握，或者只能理解概念而无法在实际信号中得到综合应用。根据傅里叶变化进行距离N年前，采用LabVIEW设计了信号的合成。主要使用了：信号采样概念，fs采样率，f信号频率，每周期的采样点N=fs/f；队列生产和消费结构来实现信号合
2024年自学网络安全（黑客技术）网安kk web安全网络安全网络安全学习
基于入门网络安全/黑客打造的：黑客&网络安全入门&进阶学习资源包前言什么是网络安全网络安全可以基于攻击和防御视角来分类，我们经常听到的“红队”、“渗透测试”等就是研究攻击技术，而“蓝队”、“安全运营”、“安全运维”则研究防御技术。如何成为一名黑客很多朋友在学习安全方面都会半路转行，因为不知如何去学，在这里，我将这个整份答案分为黑客（网络安全）入门必备、黑客（网络安全）职业指南、黑客（网络安全）学习
Kubernetes(K8S)学习笔记（2）：Kubernetes架构徐卷分布式与并行计算 kubernetes 学习笔记云计算
注：该笔记整理自Kubernetes官方文档中的内容，笔记中使用的观点与资源均来源于官方文档以及我个人的理解，如果涵盖其它来源的观点，会额外标明引用。1、相关概念Kubernetes集群由一个控制平面与一组用于运行容器化应用的工作机器组成，我们把这些工作机器称之为节点（Node）。工作节点托管着组成工作负载的Pod，控制平面负责管理工作节点以及Pod，以下为Kubernetes集群组件的逻辑关系图
Java中Scanner类应用详解海边漫步者 Java基础 java 开发语言
Java中的Scanner类应用详解在java编程中，Scanner类是一个用于读取数据的常用工具，可以从文件、输入流、字符串中读取数据。本文从常用构造方法、常用方法两个方面讲解其功能并举例说明。该类尚有其他的构造方法与一般方法，有技术开发需求的读者可以从官网查看API文档学习应用。一、常用构造方法1.Scanner(InputStreamsource)功能：构造一个新的Scanner，它生成的值
大数据学习（82）-数仓详解 viperrrrrrr 大数据学习数仓
大数据学习系列专栏：哲学语录:用力所能及，改变世界。如果觉得博主的文章还不错的话，请点赞+收藏⭐️+留言支持一下博主哦一、什么是数据仓库数据仓库（下文以“数仓”称），顾名思义，存放数据的仓库，它集合了各个业务系统的数据，以金融业为例，数仓包含了贷款业务、CRM、存款业务等数据。用于企业做数据分析、出报告、做决策；在有些公司也作为各业务系统的数据来源。从逻辑上理解，数据库和数仓没有区别，都是通过数据
Java 程序员必读书单 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 Java实战深度学习实战自然语言处理人工智能语言模型编程实践开发语言架构设计
作者：禅与计算机程序设计艺术1.简介Java是一门高级、新兴的静态面向对象编程语言，在互联网、移动互联网、大数据、云计算、人工智能、物联网等领域都有广泛应用。作为Java程序员的你是否也经常被面试官或者HR问到有关Java的知识点呢？如果你最近在准备面试或阅读相关技术文档，则本文正是适合你。在本文中，我将给你一些你可能不知道的关于Java的重要概念和知识，并通过具体的代码示例和图表来帮助你理解这些
SvelteKit 最新中文文档教程（9）—— 部署静态站点与单页应用
前言Svelte，一个语法简洁、入门容易，面向未来的前端框架。从Svelte诞生之初，就备受开发者的喜爱，根据统计，从2019年到2024年，连续6年一直是开发者最感兴趣的前端框架No.1：Svelte以其独特的编译时优化机制著称，具有轻量级、高性能、易上手等特性，非常适合构建轻量级Web项目。为了帮助大家学习Svelte，我同时搭建了Svelte最新的中文文档站点。如果需要进阶学习，也可以入手我
Python 学习笔记1 - 认识Python Scora_liu Python 学习笔记 python
一、什么是Python1989年圣诞节期间，荷兰数学和计算机科学研究学会的GuidovanRossum（吉多.范罗苏姆）决心开发一个新的解释程序，作为ABC语言的替代品。这门ABC语言的替代语言被取名为Python,命名来自Guido爱看的的电视剧MontyPython'sFlyingCircus（蟒蛇马戏团）。二、什么是Python（⭐⭐）Python是一门解释型语言。计算机不能识别任何除了机器
HarmonyOS NEXT 基于原生能力获取视频缩略图
大家好，我是V哥。不得不佩服HarmonyOSNEXT原生能力的强大，如果你想在鸿蒙APP开发中获取视频缩略图，不用依赖第三方库，就可以高效和稳定的实现，AVMetadataHelper就是一个好帮手，下面V哥整理实现步骤的代码，帮助你快速理解，开整。想要学习鸿蒙开发，一定绕不开学习ArkTS语言，V哥写了三本鸿蒙开发之路的书，第一本《鸿蒙HarmonyOSNEXT开发之路卷1ArkTS篇》已上市
一文彻底搞清楚HarmonyOS NEXT的元服务 harmonyos-next
程序员Feri一名12年+的程序员,做过开发带过团队创过业,擅长Java、嵌入式、鸿蒙、人工智能等,专注于程序员成长那点儿事,希望在成长的路上有你相伴！君志所向,一往无前！1.什么是元服务在万物互联时代，人均持有设备量不断攀升，设备种类和使用场景更加多样，使得应用开发、应用入口变得更加复杂。在此背景下，应用提供方和用户迫切需要一种新的服务提供方式，使应用开发更简单、服务（如听音乐、打车等）的获取和
从零开始学AI——1 人工智能
前言最近总算有想法回到学习上来，这次就拿AI开刀吧。本系列叫从零开始学AI不是骗人的，我对AI的了解几乎就是道听途说，所以起了这么一个标题，希望学完从0变1（？此外，我应该不会特别关注代码实现上的内容，因为我对python也是一窍不通。本笔记为学习周志华老师《机器学习》（西瓜书）的个人学习记录，内容基于个人理解进行整理和再阐述。由于理解可能存在偏差，欢迎指正。引用模块说明：在笔记中，我会使用引用模
蓝桥杯算法实战：技巧、策略与进阶之路竣雄蓝桥杯算法职场和发展
摘要蓝桥杯作为国内颇具影响力的程序设计竞赛，对提升大学生算法思维与编程能力意义重大。本文深入剖析蓝桥杯算法竞赛，结合历年真题总结核心考点与典型题型，分享实用解题技巧与备考策略，并探讨算法优化与进阶方向。通过系统学习与实践，助力参赛者提升算法水平，在竞赛中取得优异成绩。关键词蓝桥杯；算法竞赛；解题技巧；备考策略；算法优化一、引言蓝桥杯全国软件和信息技术专业人才大赛旨在选拔优秀的软件和信息技术人才，推
从阅读空间到知识孵化器，AI时代智慧图书馆何为？技能咖生成式人工智能认证 GAI认证人工智能
在人工智能（AI）浪潮席卷全球的当下，图书馆作为知识传播与文化传承的重要场所，正面临着前所未有的变革。从传统的阅读空间到如今的知识孵化器，智慧图书馆在AI时代肩负着新的使命与挑战。本文将探讨智慧图书馆在AI时代的发展方向，并引入生成式人工智能认证（GAI）认证，为图书馆从业者的技能提升提供新思路。AI时代智慧图书馆的新角色知识资源整合与挖掘者在AI时代，信息爆炸式增长，图书馆不再仅仅是纸质书籍的收
基于人工智能的扫阅卷和数据分析服务需求文档 YiWait 人工智能人工智能数据分析数据挖掘
基于人工智能的扫阅卷和数据分析服务需求文档一、项目背景在教育领域，传统的人工阅卷方式效率低下、主观性强且易出错，难以满足大规模考试及频繁测评的需求。随着人工智能技术的飞速发展，基于人工智能的扫阅卷和数据分析服务应运而生。该服务利用先进的图像识别、自然语言处理等技术，实现试卷扫描、自动阅卷、成绩统计以及深度数据分析，为教育机构、学校提供高效、准确、全面的测评解决方案，助力教学质量提升和教育决策优化。
微信小程序和uni-app的区别 cccv工程师微信小程序 uni-app notepad++
开发语言和框架：Uni-app：Uni-app使用Vue.js框架进行开发，利用Vue的语法和生命周期函数，开发者可以使用熟悉的前端技术栈。微信小程序：微信小程序使用自己的框架，基于WXML（类似于HTML）和WXSS（样式语言）进行开发，需要学习微信小程序独有的语法和组件。平台支持：Uni-app：Uni-app是一个跨平台开发框架，可以将一套代码编译成多个平台的应用，包括微信小程序、H5、Ap
AI程序员大逃杀：从“码农”到“魔法师”的奇幻漂流 ——揭秘人工智能如何重塑程序员工作流 lifire_H 人工智能
当程序员遇上AI，是“饭碗不保”还是“原地飞升”？这场代码界的工业革命，正在让每个程序员经历从“流水线工人”到“科技魔法师”的奇幻蜕变。一、效率革命：当键盘遇上“读心术”1.需求分析：从“鸡同鸭讲”到“灵魂共鸣”还记得那些年被客户需求文档支配的恐惧吗？甲方爸爸一句“我想要五彩斑斓的黑”，就能让产品经理和程序员集体崩溃。现在，AI就像个自带翻译机的“需求捕手”——把客户支离破碎的诉求往WPSAI里一
啸叫抑制（AFS）从算法仿真到工程源码实现-第一节-效果演示 aflyingwolf_pomelo 语音信号处理算法人工智能
一、概述啸叫抑制算法也叫声反馈抑制，本专题我们讨论啸叫抑制算法的平台搭建，算法仿真和设备端的工程落地实现。完整记录一个扩声系统的搭建。更多资料和代码可以进入https://t.zsxq.com/qgmoN，同时欢迎大家提出宝贵的建议，以共同探讨学习。二、啸叫抑制算法视频演示啸叫抑制算法演示视频三、语谱图3.1产生啸叫效果3.2去啸叫后的效果四、总结这一节我们主要记录了啸叫抑制（去啸叫）算法的效果演
Python 学习第五册深度学习第1章什么是深度学习 weixin_38135241 python 学习深度学习人工智能
----用教授的方式学习。目录1.1人工智能、机器学习与深度学习1.1.1人工智能1.1.2机器学习1.1.3从数据中学习表示1.1.4深度学习之“深度”1.1.5用三张图理解深度学习的工作原理1.2深度学习之前：机器学习简史1.2.1概率建模1.2.2核方法1.2.3决策树、随机森林与梯度提升机1.2.4深度学习有何不同什么是深度学习？1.1人工智能、机器学习与深度学习三者关系：1.1.1人工智
当细致剪裁遇上大语言模型：从数据匹配到卓越性能的奇幻之旅步子哥 AGI通用人工智能语言模型人工智能自然语言处理
在浩如烟海的人工智能技术中，构建和调教大语言模型（LLMs）的过程就像是一场精心策划的奇幻冒险。本文带您走进一个鲜为人知的领域——如何利用“量身定制”的数据，让模型在知识的海洋中游刃有余。我们将透过一篇最新的研究《TheBestInstruction-TuningDataareThoseThatFit》，探索如何通过选择与目标模型分布高度契合的数据来优化监督式微调（SFT）的效果，以及这一方法如何
MySQL 奇幻之旅：从基础探秘到高级应用魔法进阶的华夫饼进大厂 mysql 数据库
MySQL奇幻之旅：从基础探秘到高级应用魔法在数据库的神秘世界里，MySQL宛如一座蕴藏无尽宝藏的城堡，我怀揣着探索的热情与求知的渴望，踏上了这趟扣人心弦的学习征程。一、MySQL基础：城堡基石的雕琢（一）数据库与表的操作：构建数据的栖息之所数据库创建与管理：绘制数据城堡的蓝图：犹如精心绘制城堡的设计图，我熟练掌握了使用CREATEDATABASE语句创建数据库的魔法咒语，像CREATEDATAB
服务器上部署springboot项目学习笔记 Warren98 服务器 spring boot 学习后端阿里云 java
Java相关命令运行jar包:在linux中,进入到jar包所在目录后,直接tab补全名称即可java-jarjar包名称查看jar包是否在运行：ps-ef|grepjava终止运行的jar包:kill#是jar包的id根据jar包名称查看运行状态psaux|grepMyBlog-0.0.1-SNAPSHOT.jar设置jar包一直运行每次启动jar包时,都需要打开SSH远程连接工具,比如fina
深度学习：让机器学会“思考”的魔法 AI极客Jayden　 AI 深度学习
文章目录引言：从“鹦鹉学舌”到“举一反三”一、深度学习是什么？1.定义：机器的“大脑”2.核心思想：从数据中“悟”出规律二、深度学习的“大脑”结构：神经网络1.神经元：深度学习的基本单元2.神经网络：多层“神经元”的组合3.深度：为什么需要多层？三、深度学习如何“学习”？1.训练过程：从“笨拙”到“熟练”2.损失函数：衡量“错误”的尺子3.反向传播：从错误中“反思”四、深度学习的“超能力”1.图像
珍藏！Java SpringBoot 精品源码合集约惠来袭，获取路径大公开秋野酱 java spring boot 开发语言
技术范围：SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、小程序、安卓app、大数据、物联网、机器学习等设计与开发。主要内容：免费功能设计、开题报告、任务书、中期检查PPT、系统功能实现、代码编写、论文编写和辅导、论文降重、长期答辩答疑辅导、腾讯会议一对一专业讲解辅导答辩、模拟答辩演练、和理解代码逻辑思路。文末获取源码联系文末获取源码联
相同的问题看看Grok3怎么回答-详细讲讲PPO & GRPO原理释迦呼呼 AI一千问人工智能深度学习机器学习语言模型算法神经网络计算机视觉
关键要点研究表明，PPO（近端策略优化）是一种稳定高效的强化学习算法，适用于单代理或多代理场景，重点是最大化绝对奖励。GRPO（基于梯度的相对策略优化）似乎是专为多代理系统设计的，优化代理之间的相对表现，目前信息有限，可能较少为人所知。这两个算法在目标和应用领域上有显著差异，PPO更通用，GRPO更适合竞争性多代理环境。关于PPO的解释什么是PPO？PPO，全称近端策略优化，是一种强化学习算法，帮
第三十九个问题-详细讲讲PPO & GRPO原理释迦呼呼 AI一千问人工智能深度学习机器学习语言模型自然语言处理算法
PPO（ProximalPolicyOptimization）原理详解PPO（近端策略优化）是OpenAI于2017年提出的强化学习算法，旨在解决传统策略梯度方法中训练不稳定和样本效率低的问题。其核心思想是通过限制策略更新的幅度，确保新策略不会偏离旧策略太远，从而稳定训练过程。1.策略梯度（PolicyGradient）基础策略梯度方法通过直接优化策略参数θθ来最大化期望回报。目标函数为：J(θ)
jQuery 跨域访问的三种方式 No 'Access-Control-Allow-Origin' header is present on the reque qiaolevip 每天进步一点点学习永无止境跨域众观千象
XMLHttpRequest cannot load http://v.xxx.com. No 'Access-Control-Allow-Origin' header is present on the requested resource. Origin 'http://localhost:63342' is therefore not allowed access. test.html:1
mysql 分区查询优化 annan211 java 分区优化 mysql
分区查询优化引入分区可以给查询带来一定的优势，但同时也会引入一些bug. 分区最大的优点就是优化器可以根据分区函数来过滤掉一些分区，通过分区过滤可以让查询扫描更少的数据。所以，对于访问分区表来说，很重要的一点是要在where 条件中带入分区，让优化器过滤掉无需访问的分区。可以通过查看explain执行计划，是否携带 partitions
MYSQL存储过程中使用游标 chicony Mysql存储过程
DELIMITER $$ DROP PROCEDURE IF EXISTS getUserInfo $$ CREATE PROCEDURE getUserInfo(in date_day datetime)-- -- 实例-- 存储过程名为：getUserInfo-- 参数为：date_day日期格式:2008-03-08-- BEGINdecla
mysql 和 sqlite 区别 Array_06 sqlite
转载： http://www.cnblogs.com/ygm900/p/3460663.html mysql 和 sqlite 区别 SQLITE是单机数据库。功能简约，小型化，追求最大磁盘效率 MYSQL是完善的服务器数据库。功能全面，综合化，追求最大并发效率 MYSQL、Sybase、Oracle等这些都是试用于服务器数据量大功能多需要安装，例如网站访问量比较大的。而sq
pinyin4j使用 oloz pinyin4j
首先需要pinyin4j的jar包支持；jar包已上传至附件内方法一:把汉字转换为拼音；例如：编程转换后则为biancheng /** * 将汉字转换为全拼 * @param src 你的需要转换的汉字 * @param isUPPERCASE 是否转换为大写的拼音； true:转换为大写；fal
微博发送私信随意而生微博
在前面文章中说了如和获取登陆时候所需要的cookie，现在只要拿到最后登陆所需要的cookie，然后抓包分析一下微博私信发送界面 http://weibo.com/message/history?uid=****&name=**** 可以发现其发送提交的Post请求和其中的数据，让后用程序模拟发送POST请求中的数据，带着cookie发送到私信的接入口，就可以实现发私信的功能了。
jsp 香水浓 jsp
JSP初始化容器载入JSP文件后，它会在为请求提供任何服务前调用jspInit()方法。如果您需要执行自定义的JSP初始化任务，复写jspInit()方法就行了 JSP执行这一阶段描述了JSP生命周期中一切与请求相关的交互行为，直到被销毁。当JSP网页完成初始化后
在 Windows 上安装 SVN Subversion 服务端 AdyZhang SVN
在 Windows 上安装 SVN Subversion 服务端2009-09-16高宏伟哈尔滨市道里区通达街291号最佳阅读效果请访问原地址：http://blog.donews.com/dukejoe/archive/2009/09/16/1560917.aspx 现在的Subversion已经足够稳定，而且已经进入了它的黄金时段。我们看到大量的项目都在使
android开发中如何使用 alertDialog从listView中删除数据？ aijuans android
我现在使用listView展示了很多的配置信息，我现在想在点击其中一条的时候填出 alertDialog,点击确认后就删除该条数据，（ ArrayAdapter ，ArrayList，listView 全部删除），我知道在下面的onItemLongClick 方法中参数 arg2 是选中的序号，但是我不知道如何继续处理下去 1 2 3
jdk-6u26-linux-x64.bin 安装 baalwolf linux
1.上传安装文件(jdk-6u26-linux-x64.bin) 2.修改权限 [root@localhost ~]# ls -l /usr/local/jdk-6u26-linux-x64.bin 3.执行安装文件 [root@localhost ~]# cd /usr/local [root@localhost local]# ./jdk-6u26-linux-x64.bin&nbs
MongoDB经典面试题集锦 BigBird2012 mongodb
1.什么是NoSQL数据库？NoSQL和RDBMS有什么区别？在哪些情况下使用和不使用NoSQL数据库？ NoSQL是非关系型数据库，NoSQL = Not Only SQL。关系型数据库采用的结构化的数据，NoSQL采用的是键值对的方式存储数据。在处理非结构化/半结构化的大数据时；在水平方向上进行扩展时；随时应对动态增加的数据项时可以优先考虑使用NoSQL数据库。在考虑数据库的成熟
JavaScript异步编程Promise模式的6个特性 bijian1013 JavaScript Promise
Promise是一个非常有价值的构造器，能够帮助你避免使用镶套匿名方法，而使用更具有可读性的方式组装异步代码。这里我们将介绍6个最简单的特性。在我们开始正式介绍之前，我们想看看Javascript Promise的样子： var p = new Promise(function(r
[Zookeeper学习笔记之八]Zookeeper源代码分析之Zookeeper.ZKWatchManager bit1129 zookeeper
ClientWatchManager接口 //接口的唯一方法materialize用于确定那些Watcher需要被通知 //确定Watcher需要三方面的因素1.事件状态 2.事件类型 3.znode的path public interface ClientWatchManager { /** * Return a set of watchers that should
【Scala十五】Scala核心九：隐式转换之二 bit1129 scala
隐式转换存在的必要性，在Java Swing中，按钮点击事件的处理，转换为Scala的的写法如下： val button = new JButton button.addActionListener( new ActionListener { def actionPerformed(event: ActionEvent) {
Android JSON数据的解析与封装小Demo ronin47
转自：http://www.open-open.com/lib/view/open1420529336406.html package com.example.jsondemo; import org.json.JSONArray; import org.json.JSONException; import org.json.JSONObject; impor
[设计]字体创意设计方法谈 brotherlamp UI ui自学 ui视频 ui教程 ui资料
从古至今，文字在我们的生活中是必不可少的事物，我们不能想象没有文字的世界将会是怎样。在平面设计中，UI设计师在文字上所花的心思和功夫最多，因为文字能直观地表达UI设计师所的意念。在文字上的创造设计，直接反映出平面作品的主题。如设计一幅戴尔笔记本电脑的广告海报，假设海报上没有出现“戴尔”两个文字，即使放上所有戴尔笔记本电脑的图片都不能让人们得知这些电脑是什么品牌。只要写上“戴尔笔
单调队列-用一个长度为k的窗在整数数列上移动，求窗里面所包含的数的最大值 bylijinnan java 算法面试题
import java.util.LinkedList; /* 单调队列滑动窗口单调队列是这样的一个队列：队列里面的元素是有序的，是递增或者递减题目：给定一个长度为N的整数数列a(i),i=0,1,...,N-1和窗长度k. 要求：f(i) = max{a(i-k+1),a(i-k+2),..., a(i)},i = 0,1,...,N-1 问题的另一种描述就
struts2处理一个form多个submit chiangfai struts2
web应用中，为完成不同工作，一个jsp的form标签可能有多个submit。如下代码： <s:form action="submit" method="post" namespace="/my"> <s:textfield name="msg" label="叙述：">
shell查找上个月，陷阱及野路子 chenchao051 shell
date -d "-1 month" +%F 以上这段代码，假如在2012/10/31执行，结果并不会出现你预计的9月份，而是会出现八月份，原因是10月份有31天，9月份30天，所以-1 month在10月份看来要减去31天，所以直接到了8月31日这天，这不靠谱。野路子解决：假设当天日期大于15号
mysql导出数据中文乱码问题 daizj mysql 中文乱码导数据
解决mysql导入导出数据乱码问题方法：１、进入mysql，通过如下命令查看数据库编码方式： mysql> show variables like 'character_set_%'; +--------------------------+----------------------------------------+ | Variable_name&nbs
SAE部署Smarty出现：Uncaught exception 'SmartyException' with message 'unable to write dcj3sjt126com PHP smarty sae
对于SAE出现的问题：Uncaught exception 'SmartyException' with message 'unable to write file...。官方给出了详细的FAQ：http://sae.sina.com.cn/?m=faqs&catId=11#show_213 解决方案为： 01 $path
《教父》系列台词 dcj3sjt126com
Your love is also your weak point. 你的所爱同时也是你的弱点。 If anything in this life is certain, if history has taught us anything, it is that you can kill anyone. 不顾家的人永远不可能成为一个真正的男人。 &
mongodb安装与使用 dyy_gusi mongo
一.MongoDB安装和启动,widndows和linux基本相同 1.下载数据库, linux:mongodb-linux-x86_64-ubuntu1404-3.0.3.tgz 2.解压文件,并且放置到合适的位置 tar -vxf mongodb-linux-x86_64-ubun
Git排除目录 geeksun git
在Git的版本控制中，可能有些文件是不需要加入控制的，那我们在提交代码时就需要忽略这些文件，下面讲讲应该怎么给Git配置一些忽略规则。有三种方法可以忽略掉这些文件，这三种方法都能达到目的，只不过适用情景不一样。 1. 针对单一工程排除文件这种方式会让这个工程的所有修改者在克隆代码的同时，也能克隆到过滤规则，而不用自己再写一份，这就能保证所有修改者应用的都是同一
Ubuntu 创建开机自启动脚本的方法 hongtoushizi ubuntu
转载自： http://rongjih.blog.163.com/blog/static/33574461201111504843245/ Ubuntu 创建开机自启动脚本的步骤如下： 1) 将你的启动脚本复制到 /etc/init.d目录下以下假设你的脚本文件名为 test。 2) 设置脚本文件的权限 $ sudo chmod 755
第八章流量复制/AB测试/协程 jinnianshilongnian nginx lua coroutine
流量复制在实际开发中经常涉及到项目的升级，而该升级不能简单的上线就完事了，需要验证该升级是否兼容老的上线，因此可能需要并行运行两个项目一段时间进行数据比对和校验，待没问题后再进行上线。这其实就需要进行流量复制，把流量复制到其他服务器上，一种方式是使用如tcpcopy引流；另外我们还可以使用nginx的HttpLuaModule模块中的ngx.location.capture_multi进行并发
电商系统商品表设计 lkl
DROP TABLE IF EXISTS `category`; -- 类目表 /*!40101 SET @saved_cs_client = @@character_set_client */; /*!40101 SET character_set_client = utf8 */; CREATE TABLE `category` ( `id` int(11) NOT NUL
修改phpMyAdmin导入SQL文件的大小限制 pda158 sql mysql
　用phpMyAdmin导入mysql数据库时，我的10M的数据库不能导入，提示mysql数据库最大只能导入2M。　　 phpMyAdmin数据库导入出错：　　You probably tried to upload too large file. Please refer to documentation for ways to workaround this limit.
Tomcat性能调优方案 Sobfist apache jvm tomcat 应用服务器
一、操作系统调优对于操作系统优化来说，是尽可能的增大可使用的内存容量、提高CPU的频率，保证文件系统的读写速率等。经过压力测试验证，在并发连接很多的情况下，CPU的处理能力越强，系统运行速度越快。。【适用场景】任何项目。二、Java虚拟机调优应该选择SUN的JVM，在满足项目需要的前提下，尽量选用版本较高的JVM，一般来说高版本产品在速度和效率上比低版本会有改进。 J
SQLServer学习笔记 vipbooks 数据结构 xml
1、create database school 创建数据库school 2、drop database school 删除数据库school 3、use school 连接到school数据库，使其成为当前数据库 4、create table class(classID int primary key identity not null) 创建一个名为class的表，其有一