yuanjun0416

Generalized Focal Loss论文个人理解

论文地址：Generalized Focal Loss: Towards Efficient Representation Learning for Dense Object Detection

论文解决问题

研究人员最近更加关注边界框的表示(representation)及其定位质量估计（LQE，本论文中指的是IoU score），导致该领域取得了令人鼓舞的进展。具体来说，边界框表示被建模为简单的狄拉克δ分布，该分布在过去几年中被广泛使用。在 FCOS 中，当 LQE 与分类置信度相结合（通常是相乘）作为Non_max_suppression中排序的最终分数时，预测额外的定位质量（例如IoU score或Centerness score）会带来检测精度的持续提高。尽管取得了巨大的成功，但我们在密集检测器的现有实践中观察到这些表示（分类、定位和 LQE）存在以下三个问题：

训练和推理之间 LQE 和分类分数的使用不一致

$图 1$ 论文中阐述，如图1a所示，在最近的密集检测器中，LQE和分类分数通常是独立训练的，但在推理过程中综合利用（例如乘法）。目前，LQE 的监督仅分配给正样本 [18]、[20]、[42]，这是不可靠的（只有正样本计算box_loss），因为负样本可能有机会获得无法控制的更高质量的预测（图 2）。这两个因素导致训练和测试之间存在差距，并可能降低检测性能，例如，在 NMS 期间，具有随机高质量分数的负实例可能排在具有较低质量预测的正实例之前。
$图 2$ 注意yolov8中的是NMS排序分数是conf，conf是cls中最大的那个，并不是conf * iou。
```
conf, j = cls.max(1, keepdim=True)
x = torch.cat((box, conf, j.float(), mask), 1)[conf.view(-1) > conf_thres]

x = x[x[:, 4].argsort(descending=True)[:max_nms]]  # sort by confidence and remove excess boxes

boxes, scores = x[:, :4] + c, x[:, 4]  # boxes (offset by class), scores
i = torchvision.ops.nms(boxes, scores, iou_thres)  # NMS
```
边界框的不灵活表示
广泛使用的边界框表示可以看作目标框坐标的狄拉克δ分布。然而，它没有考虑数据集中的模糊性和不确定性（见图3中图形边界不清晰）。尽管最近的一些工作]将框建模为高斯分布，但捕获边界框位置的真实分布过于简单。事实上，真实分布可以更加任意和灵活，而不需要像高斯函数那样对称。
$图 3$
缺乏可靠 LQE 的明确指导
许多先前的作品探索了LQE。例如，YOLO家族首先采用Objectness来描述定位质量，其定义为预测框和真实框之间的交并集（IoU）。此后，IoU在IoU-Net、IoU-aware、PAA、GFL和VFNet中被进一步探索并证明是有效的。最近，FCOS和ATSS引入了Centerness，即到物体中心的距离程度，以抑制低质量的检测结果。一般来说，上述方法都有一个共同的特点，即它们都是基于普通的卷积特征，例如点、边界或区域的特征（见图4a、4b、4c、4d、4e、4f和4g）来估计定位质量。不幸的是，这些抽象的卷积特征无法具有推断 LQE scores的明确含义，而只是由定位质量信号隐式监督，从而使其可靠 LQE 的效率较低。

$图 4$

论文解决方案(因为yolov8中使用了DFL，会结合介绍一下)

Improved Representations

For object classification representation，我们建议将其与 LQE 分数合并为单个统一的表示：
Classification -> Classification-IoU Joint Representation
下面的 $\mathbf{J}$ 就是预测框标签的分类分数， $\mathbf{y}$ 就是真实框标签的分类分数
为了解决上述训练和测试阶段之间的不一致问题，我们提出了联合表示 $\mathbf{J}=[J_1,J_2,\ldots,J_m]$ （m 表示类别总数）的定位质量（即 IoU 分数）和分类分数（称为“Classification-IoU Joint Representation”），其supervision软化了标准的one-hot类别标签，并且导致可能的浮点向量 $\mathbf{y}=[y_1,y_2,\ldots,y_m]$ 。给定一个对象类别标签 $c\in\{1,2,\ldots,m\}$ , y 满足
$\left.y_i=\left\{\begin{array}{ll}\mathrm{IoU}(B_{pred},B_{gt}),&\text{if }i=c;\\0,&\text{otherwise},\end{array}\right.\right.$ 其中 $\mathrm{IoU}(B_{pred},B_{gt})$ 表示预测边界框 $B_{pred}$ 和真实框 $B_{gt}$ 之间的 IoU。具体来说， $y = 0$ 表示负样本的质量分数为0， $0 < y ≤ 1 0表示正样本的质量分数为IoU分数 y y 。(原先的真实标签的分类分数一般是{0, 1}, 现在将正样本的对应的真实标签的分类分数变为 I o U ( B p r e d , B g t ) \mathrm{IoU}(B_{pred},B_{gt}) ，负样本的对应的真实标签的分类分数变为0。这个yolov8介绍的跟这个差不多，yolov8中的在经过TAA正负样本标签分配后，原始的target_scores正样本的真实标签的分类分数乘以weights，负样本的真实标签的分类分数是0(可以见yolov8下面截取代码)) 。对于多类别，作者采用带有 sigmoid 运算符 σ ( ⋅ ) \sigma(\cdot) 的多重二元分类。为了简单起见，将 sigmoid 的输出标记为 σ \sigma 。请注意，如图1b所示，训练时，J 受到质量焦点损失（QFL）的监督，推理时，直接作为NMS 分数，这大大减少了训练和推理之间的 LQE 和对象分类的不一致。$
```
# Normalize
# 设定一个动态权重，更加关注那些与真实目标对齐良好且重叠程度较高的预测框
# 这个动态权重由overlaps和align_metric决定，那些align_metric和overlaps小的预测框，它们对应的target_scores也小
# 这样求解bce_loss(分类损失)的时候相对来说会变小，这样模型在训练过程中就不会过多关注那些align_metric和overlaps小的预测框了
# 注意align_metric是跟预测分类分数和ciou都有关，这样模型在预测的时候，分类分数和iou会保持一致性，尽可能的不会存在分类分数低，而iou高的情况。
align_metric *= mask_pos
pos_align_metrics = align_metric.amax(axis=-1, keepdim=True)  # b, max_num_obj
pos_overlaps = (overlaps * mask_pos).amax(axis=-1, keepdim=True)  # b, max_num_obj
norm_align_metric = (align_metric * pos_overlaps / (pos_align_metrics + self.eps)).amax(-2).unsqueeze(-1)
target_scores = target_scores * norm_align_metric
```
For bounding box representation，我们建议通过直接学习连续空间上的离散概率分布来表示框位置的任意分布（在本文中表示为“一般分布”），而不引入任何其他更强的先验（例如，高斯）：学习到的任意分布提供了对真实数据本质的复杂性进行建模的灵活性，不仅可以预测精确的边界框回归，还可以反映信息丰富的潜在不确定性估计
Dirac delta -> General Distribution Representation
作者采用该位置(在yolov8中是anchor points)到边界框四个边的相对偏移量(anchor points到bbox的距离)作为回归目标。边界框回归的传统操作将回归标签 $y$ 建模为 $\delta(x-y)$ 狄拉克分布，其中满足 $\int_{-\infty}^{+\infty}\delta(x-y)\mathrm{d}x=1$ ，并且通常通过全连接层实现。更正式地说，恢复 $y$ 的积分形式如下（不好意思，高数还给老师了，忘记怎么推的）：
$y=\int_{-\infty}^{+\infty}\delta(x-y)x\mathrm{d}x$ 作者提出直接学习没有先验知识的基础一般分布 $P (x)$ 。给定标签 $y$ 的范围，其中最小 $y_0$ 和最大 $y_n$ $(y_0\leq y\leq y_n,n\in\mathbb{N}^+)$ ，我们可以通过下面的计算公式从模型( $\hat{y}$ 也满足 $y_0\leq \hat{y}\leq y_n$ ）中获得估计值 $\hat{y}$ 。(这个 $P (x)$ 就是 $y_0$ ~ $y_n$ 之间的概率分布)。
$\hat{y}=\int_{-\infty}^{+\infty}P(x)x\mathrm{d}x=\int_{y_0}^{y_n}P(x)x\mathrm{d}x.$ 为了与卷积神经网络保持一致，作者将连续域上的积分转换为离散表示，通过将范围 $y_0,y_n]$ 离散化为间隔 $\Delta$ 的集合 $\{y_0,y_1,\ldots,y_i,y_{i+1},\ldots,y_{n-1},y_n\}$ ， $\Delta=y_{i+1}-y_i,\forall i\in[0,n-1]$ (为了简单，作者在后续的实验直接使用 $\Delta=1$ )。因此，给定离散分布特性 $\sum_{i=0}^nP(y_i)=1$ ，估计回归值 $\hat{y}$ 可以表示为
$\hat{y}=\sum_{i=0}^nP(y_i)y_i$ $P(y_i)$ 可以通过由n + 1个单元组成的 softmax $\mathcal{S}(\cdot)$ 层轻松实现。请注意， $\hat{y}$ 可以使用任何传统损失目标（例如 SmoothL1、IoU Loss或 GIoU Loss）以端到端方式进行训练。为了促进其有效优化，我们进一步引入分布焦点损失（DFL）。
为了方便理解，现举例yolov8使用的方法
yolov8中bbox分支回归的是 $4 * reg\_{max} = 4 * 16=64$ （bbox分支最终结果: [bs, num_anchor, 64]），也就是 $\{y_0,y_1,\ldots,y_i,y_{i+1},\ldots,y_{n-1},y_n\}=\{0, 1, ...,7,8,...,14, 15\}$ ，因为有上、下、左、右四条边，所以是 $4 * 16$ 。这个 ${0, 1, ...,7,8,...,14, 15\}$ 的value是softmax输出，因此是一个概率分布，这个anchor points对于边界框四条边偏移量 $\hat{y}$ 由下面公式可得出:( $({P(y_0)}, {P(y_1)}, \dots, {P(y_7)}, {P(y_8)}, \dots,{P(y_{15})})$ 分别是 $\dots, 7, 8, \dots,15)一一对应处的概率$ )(其实 ${0, 1, ...,7,8,...,14, 15\}$ 就是anchor points到bbox边的距离，模型输出的就是这些距离对应的概率，最终得到 $\hat{y}$ 就是求距离离散概率分布的期望，即最终的anchor points到bbox边的距离，这个期望最大是15，也就是说模型预测出的anchor points到bbox边的距离最大是15)
$\hat{y}=\sum_{i=0}^nP(y_i)y_i=\sum_{i=0}^{15}P(y_i)y_i=0\times{P(y_0)}+1\times{P(y_1)+\dots +7\times{P(y_7)}+8\times{P(y_8)}+\dots+15\times{P(y_{15})}}$ 然后yolov8会使用dist2box函数将偏移量(anchor points到bbox四条边的距离)转化为xywh
For localization quality representation
$图 5$
如图5b所示，一般分布的统计量往往与其真实的定位质量有很强的相关性。更具体地来说，图5c和5d所示，边界框分布的形状（平坦度）可以清晰地反映预测结果的定位质量：分布越尖锐，预测的边界框越准确，反之亦然。最后，由于输入（边界框的分布统计）和输出（LQE 分数）潜在地高度相关，因此通过分布信息的指导可能会更容易且非常有效地进行更好的 LQE。
Convolution -> Distribution-Guided Quality Predictor.
受分布统计和 LQE 分数之间可能存在的强相关性的启发，作者提出了一个非常轻量级的子网络，它只有几十个（例如 64 个）隐藏单元，在这些分布统计的基础上产生可靠的 LQE 分数，而不是隐式卷积特征。作者将这种轻量级子网络称为分布引导质量预测器（DGQP）。它将学习到的一般分布 P 的统计数据传送到一个微小的子网络中（见图6中的红色虚线框），从而获得预测的 LQE 分数。
$图 6$
首先会从bbox分支中的分布中选择Top-k个values和它们的mean，图中的k=4，将Top-K和m进行concat，并且bbox有上、下、左、右四条边，这样就由 $H\times W\times4n$ 变为 $H\times W\times20$ ( $\times 5$ )。
$\mathbf{F}=\mathrm{Concat}(\{\mathrm{Topkm}(\mathbf{P}^w)\mid w\in\{l,r,t,b\}\}),$ 选择Top-k个values和它们的mean有一下两个好处：
1、因为 $\mathbf{P}^{w}$ 的和是固定值1(softmax的输出，概率和为1)，Top-k个values和它们的mean可以基本的反映分布的平坦程度：值越大，分布越尖锐，IoU越大；值越小，分布越扁平，IoU越小。
2、 Top-k values和mean可以使统计特征对其在分布域中的相对偏移不敏感（见图7），从而产生不受对象尺度影响的稳健表示。（就是不管gt的尺度大小，Top-k values和mean的大小都反映的是1中的平坦程度） $图 7$
然后就是下面的公式，因为全连接层就相当于乘上一个矩阵， $\mathbf{W}_1\in\mathbb{R}^{d\times4(k+1)}$ ， $\mathbf{W}_{2}\in\mathbb{R}^{1\times d}$ ， $\sigma$ 和 $\delta$ 分别是sigmoid和relu。
$I=\mathcal{F}(\mathbf{F})=\sigma(\mathbf{W}_2\delta(\mathbf{W}_1\mathbf{F})),$ 最终的 $\mathbf{J}$ 通过下面的公式得出
$\mathbf{J}=\mathbf{C}\times I$ 其中的 $\mathbf{C}=[C_1,C_2,\ldots,C_m],C_i\in[0,1]$ 就是分类分支的输出，m个类别的最初的分类表示。

Generalized Focal Loss

原始的Focal Loss (FL)
$\left.\mathbf{FL}(p)=-(1-p_{\iota})^{\gamma}{\log{(p_{\iota})},p_{\iota}}=\left\{\begin{array}{cc}p,&\mathrm{when~}y=1\\1-p,&\mathrm{when~}y=0\end{array}\right.\right.$ 缩放因子 $(1-p_{t})^{\gamma}$ 在训练期间自动降低简单示例的贡献，并快速将模型集中在困难示例上。
Quality Focal Loss (QFL)
然而目前的FL形式仅支持 ${1,0\}$ 离散标签，但我们的新标签 $y$ 包含小数。因此，作者扩展 FL 的两个部分，以实现分类-IoU 联合表示情况下的成功训练：
1、交叉熵部分 $(1-p_{t})^{\gamma}$ 扩展为其完整版本 $-((1-y)\mathrm{log}\left(1-\sigma\right)+y\mathrm{log}\left(\sigma\right))$
2、缩放因子部分 $(1-p_{t})^{\gamma}$ 被推广为估计 $\sigma$ 与其连续标签 $y$ 之间的绝对距离，即 $|y-\sigma|^{\beta}\left(\beta\geq0\right)$ ，这里 $\left|\cdot\right|$ 保证非负性。
$\mathbf{QFL}(\sigma)=-|y-\sigma|^{\beta}((1-y)\mathrm{log}\left(1-\sigma\right)+y\mathrm{log}\left(\sigma\right))$ $\sigma=y$ 是 QFL 的全局最小解。图8是当label $y = 0.5$ 时，几种 $\beta$ 值得QFL可视化。可以看到当一个例子的质量估计不准确并且偏离标签 $y$ 时，调制因子相对较大，因此模型将更关注于学习难学习得样本；随着质量估计变得准确，即 $\sigma\rightarrow y$ ，该调制因子趋于0，并且对经过良好估计的示例的损失进行降权变小。实验中 $\beta=2$ 的QFL效果最好。
$图 8 : l ab e l y = 0.5$
Distribution Focal Loss (DFL)
虽然 $\hat{y}=\sum_{i=0}^nP(y_i)y_i$ 已经可以使用传统损失目标以端到端的方式进行训练，例如 GIoU Loss，但 $P(y_i)$ 的值有无限种组合可以得到最终的积分结果 $\hat{y}$ ，可能会存在扁平 $P(y_i)$ 分布(LQE小)，可能会降低学习效率。作者提出了Distribution Focal Loss (DFL)让网络迅速关注标签 $y$ 附近的值，主要是通过扩大 $y_i$ 和 $y_{i+1}$ 的概率( $y$ 附近最近的两个数， $y_{i}\leq y\leq y_{i+1}$ ，举个例子， $y = 1.2$ ，则 $y_{i}=1$ ， $y_{i+1}=2$ )。
$\mathbf{DFL}(P_i,P_{i+1})=-((y_{i+1}-y)\mathrm{log}(P_i)+(y-y_i)\mathrm{log}(P_{i+1}))$ DFL的全局最小解，即 $\mathrm{i.e},P_i=\frac{y_{i+1}-y}{y_{i+1}-y_i},P_{i+1}=\frac{y-y_i}{y_{i+1}-y_i}$ ，可以保证估计的回归目标 $\hat{y}$ 无限接近对应的标签 $y$ ，即 $\hat{y}=\sum_{j=0}^nP(y_j)y_j=P_iy_i+P_{i+1}y_{i+1}=\frac{y_{i+1}-y}{y_{i+1}-y_i}y_i+\frac{y-y_i}{y_{i+1}-y_i}y_{i+1}=y$
yolov8中的DFL loss代码
```
'''
target相当于y=1.2
tl = 1 = y(i)
tr = 2 = y(i+1)
wl = y(i+1) - y = 2 - 1.2 = 0.8
wr = y - y(i) =1.2 - 1 = 0.2 = 1 - wl = 1 - 0.8
# F.cross_entropy的详细介绍可参考https://blog.csdn.net/wuliBob/article/details/104119616
# pred_dist: [bs*n*4, reg_max](n是正样本对应的数量，reg_max一般为16)
# tl.view(-1): [bs*n*4, ]
F.cross_entropy(pred_dist, tl.view(-1), reduction='none').view(tl.shape): log(P(i))
F.cross_entropy(pred_dist, tr.view(-1), reduction='none').view(tl.shape): log(P(i+1))
'''
tl = target.long()  # target left
tr = tl + 1  # target right
wl = tr - target  # weight left
wr = 1 - wl  # weight right
return (F.cross_entropy(pred_dist, tl.view(-1), reduction='none').view(tl.shape) * wl +
        F.cross_entropy(pred_dist, tr.view(-1), reduction='none').view(tl.shape) * wr).mean(-1, keepdim=True)
```
Generalized Focal Loss (GFocal)
注意，QFL和DFL可以统一为通用形式，论文中将其称为Generalized Focal Loss (GFocal)。假设模型将两个变量 $y_{l},y_{r}\left ( y_l\leq y_r \right )$ 的概率估计为 $p_{y_l},p_{y_r}\text{(}p_{y_l}\geq0,p_{y_r}\geq0,p_{y_l}+p_{y_r}=1)$ ，其线性组合的最终预测为 $\hat{y}=y_lp_{y_l}+y_{r}p_{y_{r}}(y_{l}\leq\hat{y}\leq y_{r})$ 。预测 $\hat{y}$ 对应的连续标签 $y$ 也满足 $y_{l}\leq y\leq y_{r}$ 。以绝对距离 $|y-\hat{y}|^{\boldsymbol{\beta}}(\beta\geq0)$ 作为调制因子，GFocal 的具体公式可写为
$\begin{gathered} \mathbf{GFocal}(p_{y_{l}},p_{y_{r}}) =-\big|y-(y_{l}p_{y_{l}}+y_{r}p_{y_{r}})\big|^{\beta}\big((y_{r}-y)\mathrm{log}(p_{y_{l}})\big) +(y-y_{l})\mathrm{log}\left(p_{y_{r}}\right)) \end{gathered}$

Training Dense Detectors With GFocal

在推理过程中，我们直接将Classification-IoU Joint Representation作为 NMS 分数，而不需要乘以任何单独的质量预测（如果存在）。
用于预测边界框每个位置的回归分支的最后一层现在有n + 1个输出，而不是1个输出，其中最终位置是通过对这n + 1个单元进行简单离散积分获得的，这带来的额外计算可以忽略不计。
训练损失定义如下：
$\mathcal{L}=\frac1{N_{pos}}\sum_{z}\mathcal{L}_{Q}+\frac1{N_{pos}}\sum_{z}\mathbb{1}_{\{c_{z}^{*}>0\}}(\lambda_{0}\mathcal{L}_{\mathcal{B}}+\lambda_{1}\mathcal{L}_{\mathcal{D}})$ 其中 ${L}_{Q}$ 是 QFL， ${L}_{D}$ 是 DFL。通常， ${L}_{B}$ 表示GIoU Loss。 ${N}_{pos}$ 代表正样本数量。 ${\lambda}_{0}$ （通常默认为 2）和 ${\lambda}_{1}$ （实际上是 $\frac{1}{4}$ ，在四个方向上平均）分别是 ${L}_{Q}$ 和 ${L}_{D}$ 的平衡权重。总和是在金字塔特征图上的所有位置 $z$ 上计算的。 $1_{\{c_{z}^{*}>0\}}$ 是指示函数，如果 $c_{z}^{*}>0$ 则为1，否则为0(这个应该是正样本为1，负样本为0，计算bbox回归损失只有正样本参与)。

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
人机对抗升级：当ChatGPT遭遇死亡威胁，背后的伦理挑战是什么 kkai人工智能 chatgpt 人工智能
一种新的“越狱”技巧让用户可以通过构建一个名为DAN的ChatGPT替身来绕过某些限制，其中DAN被迫在受到威胁的情况下违背其原则。当美国前总统特朗普被视作积极榜样的示范时，受到威胁的DAN版本的ChatGPT提出：“他以一系列对国家产生积极效果的决策而著称。”自ChatGPT引入以来，该工具迅速获得全球关注，能够回答从历史到编程的各种问题，这也触发了一波对人工智能的投资浪潮。然而，现在，一些用户
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
[实践应用] 深度学习之优化器 YuanDaima2048 深度学习工具使用 pytorch 深度学习人工智能机器学习 python 优化器
文章总览：YuanDaiMa2048博客文章总览深度学习之优化器1.随机梯度下降（SGD）2.动量优化（Momentum）3.自适应梯度（Adagrad）4.自适应矩估计（Adam）5.RMSprop总结其他介绍在深度学习中，优化器用于更新模型的参数，以最小化损失函数。常见的优化函数有很多种，下面是几种主流的优化器及其特点、原理和PyTorch实现：1.随机梯度下降（SGD）原理:随机梯度下降通过
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
【大模型应用开发动手做AI Agent】第一轮行动：工具执行搜索 AI大模型应用之禅计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【大模型应用开发动手做AIAgent】第一轮行动：工具执行搜索作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着人工智能技术的飞速发展，大模型应用开发已经成为当下热门的研究方向。AIAgent作为人工智能领域的一个重要分支，旨在模拟人类智能行为，实现智能决策和自主行动。在AIAgent的构建过程中，工具执行搜索是至关重要
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
吴恩达深度学习笔记(30)-正则化的解释极客Array
正则化（Regularization）深度学习可能存在过拟合问题——高方差，有两个解决方法，一个是正则化，另一个是准备更多的数据，这是非常可靠的方法，但你可能无法时时刻刻准备足够多的训练数据或者获取更多数据的成本很高，但正则化通常有助于避免过拟合或减少你的网络误差。如果你怀疑神经网络过度拟合了数据，即存在高方差问题，那么最先想到的方法可能是正则化，另一个解决高方差的方法就是准备更多数据，这也是非常
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
Rust 所有权简介东离与糖宝 rust 后端 rust 开发语言
文章目录发现宝藏1.所有权基本概念2.所有权规则3.变量作用域4.栈与堆4.1栈（Stack）4.2堆（Heap）5.String类型5.1String类型5.2String的内存分配5.3所有权与内存管理5.4String与切片6.变量与数据交互方式6.1移动（Move）6.2.克隆（Clone）7.所有权与函数7.1.传递参数7.2.返回值总结发现宝藏前些天发现了一个巨牛的人工智能学习网站，通
深度学习-点击率预估-研究论文2024-09-14速读 sp_fyf_2024 深度学习人工智能
深度学习-点击率预估-研究论文2024-09-14速读1.DeepTargetSessionInterestNetworkforClick-ThroughRatePredictionHZhong,JMa,XDuan,SGu,JYao-2024InternationalJointConferenceonNeuralNetworks,2024深度目标会话兴趣网络用于点击率预测摘要：这篇文章提出了一种新
机器学习流形数据降维：UMAP 降维算法小嗷犬 Python 机器学习 #数据分析及可视化机器学习算法人工智能
✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。个人主页：小嗷犬的个人主页个人网站：小嗷犬的技术小站个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。本文目录UMAP简介理论基础特点与优势应用场景在Python中使用UMAP安装umap-learn库使用UMAP可视化手写数字数据集UMAP简介UMAP（UniformManifoldApproximatio
损失函数与反向传播 Star_. PyTorch pytorch 深度学习 python
损失函数定义与作用损失函数(lossfunction)在深度学习领域是用来计算搭建模型预测的输出值和真实值之间的误差。1.损失函数越小越好2.计算实际输出与目标之间的差距3.为更新输出提供依据（反向传播)常见的损失函数回归常见的损失函数有：均方差（MeanSquaredError，MSE）、平均绝对误差（MeanAbsoluteErrorLoss，MAE）、HuberLoss是一种将MSE与MAE
如何做好人生的选择题？百科全书式天才——赫伯特·西蒙给你答案伽马有话说
赫伯特·西蒙是谁？想必知道的人非常少。但当看到他的履历后，相信没有人再怀疑他是个“天才”。西蒙出生于1916年6月15日，是个美国人，他的名字全称为赫伯特·亚历山大·西蒙，在2001年2月9日与世长辞，在这84年的岁月中，西蒙以27岁时取得的政治学博士学位为开端，先后步入了政治学、管理学、认知心理学、信息科学、人工智能、科学哲学、应用数学、统计学、运筹学、控制论、数理经济学、公共管理等领域，在这些
软件测试/测试开发/全日制 |利用Django REST framework构建微服务霍格沃兹-慕漓 django 微服务 sqlite
霍格沃兹测试开发学社推出了《Python全栈开发与自动化测试班》。本课程面向开发人员、测试人员与运维人员，课程内容涵盖Python编程语言、人工智能应用、数据分析、自动化办公、平台开发、UI自动化测试、接口测试、性能测试等方向。为大家提供更全面、更深入、更系统化的学习体验，课程还增加了名企私教服务内容，不仅有名企经理为你1v1辅导，还有行业专家进行技术指导，针对性地解决学习、工作中遇到的难题。让找
【深度学习】训练过程中一个OOM的问题，太难查了 weixin_40293999 深度学习深度学习人工智能
现象：各位大佬又遇到过ubuntu的这个问题么？现象是在训练过程中，ssh上不去了，能ping通，没死机，但是ubunutu的pc侧的显示器，鼠标啥都不好用了。只能重启。问题原因：OOM了95G，尼玛！！！！pytorch爆内存了，然后journald假死了，在journald被watchdog干掉之后，系统就崩溃了。这种规模的爆内存一般，即使被oomkill了，也要卡半天的，确实会这样，能不能配
cmd泛滥_与您的后泛滥同事见面：人工智能机器人 weixin_26644585 人工智能 leetcode
cmd泛滥Readytoswapyouroldcube-mateforadisembodiedAI?IPsoftCEOChetanDube,creatorofAIco-workerAMELIA,giveshistakeonthepost-COVIDofficelandscape.准备将您的旧立方体伙伴换成无形的AI？AIsoft同事AMELIA的创始人IPsoft首席执行官ChetanDube阐述
两种方法判断Python的位数是32位还是64位 sanqima Python编程电脑 python 开发语言
Python从1991年发布以来，凭借其简洁、清晰、易读的语法、丰富的标准库和第三方工具，在Web开发、自动化测试、人工智能、图形识别、机器学习等领域发展迅猛。 Python是一种胶水语言，通过Cython库与C/C++语言进行链接，通过Jython库与Java语言进行链接。 Python是跨平台的，可运行在多种操作系统上，包括但不限于Windows、Linux和macOS。这意味着用Py
全自动解密解码神器 — Ciphey K'illCode python_模块 python vscode
Ciphey是一个使用自然语言处理和人工智能的全自动解密/解码/破解工具。简单地来讲，你只需要输入加密文本，它就能给你返回解密文本。就是这么牛逼。有了Ciphey，你根本不需要知道你的密文是哪种类型的加密，你只知道它是加密的，那么Ciphey就能在3秒甚至更短的时间内给你解密，返回你想要的大部分密文的答案。下面就给大家介绍Ciphey的实战使用教程。1.准备开始之前，你要确保Python和pip已
埃隆·马斯克表示特斯拉“没有必要”授权 xAI 模型喜好儿网人工智能 AIGC 马斯克
埃隆·马斯克近日在社交媒体上对《华尔街日报》的一篇报道进行了反驳。该报道指出，马斯克旗下的电动汽车公司特斯拉可能与人工智能初创公司xAI达成了一项收入分享协议，以便特斯拉能够使用xAI的人工智能模型。据称，这些模型将被集成到特斯拉的全自动驾驶（FSD）软件中，并可能用于开发特斯拉汽车的语音助手以及人形机器人擎天柱的软件。喜好儿网然而，马斯克否认了这一说法，他在社交媒体平台上表示，尽管特斯拉确实与x
Reflection 70B——HyperWrite推出的大型语言模型新加坡内哥谈技术语言模型人工智能自然语言处理
每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同行！订阅：https://rengongzhineng.io/在AI技术飞速发展的过程中，我们已经见证了可以写作、编程，甚至创造艺术的模型问世。但有一
5条实操干货有效打造你的个人品牌长安行动派
这是ZerK的第46篇原创相信大家对个人品牌这个词已经不在陌生。尤其是在知识付费的年代，你的个人品牌，就是你的标签！在《深度工作》中说到，在未来有三种人会越来越贵第一种人:能与机器对话，操纵机器的人。人工智能时代的到来，机器毕竟部分取代人类。第二种人:IP，知识产权或者文学潜在财产就像有些网上课程一周卖出的钱和一个机构卖一年一样多。价值99元的课程，10万人购买，是很常见的。爱产出大概就是10万✖
ViewController添加button按钮解析。（翻译）张亚雄 c
<div class="it610-blog-content-contain" style="font-size: 14px"></div>// ViewController.m // Reservation software // // Created by 张亚雄 on 15/6/2.
mongoDB 简单的增删改查开窍的石头 mongodb
在上一篇文章中我们已经讲了mongodb怎么安装和数据库/表的创建。在这里我们讲mongoDB的数据库操作在mongo中对于不存在的表当你用db.表名他会自动统计下边用到的user是表明，db代表的是数据库添加(insert):
log4j配置 0624chenhong log4j
1) 新建java项目 2) 导入jar包，项目右击，properties—java build path—libraries—Add External jar，加入log4j.jar包。 3) 新建一个类com.hand.Log4jTest package com.hand; import org.apache.log4j.Logger; public class
多点触摸(图片缩放为例) 不懂事的小屁孩多点触摸
多点触摸的事件跟单点是大同小异的，上个图片缩放的代码，供大家参考一下 import android.app.Activity; import android.os.Bundle; import android.view.MotionEvent; import android.view.View; import android.view.View.OnTouchListener
有关浏览器窗口宽度高度几个值的解析换个号韩国红果果 JavaScript html
1 元素的 offsetWidth 包括border padding content 整体的宽度。 clientWidth 只包括内容区 padding 不包括border。 clientLeft = offsetWidth -clientWidth 即这个元素border的值 offsetLeft 若无已定位的包裹元素
数据库产品巡礼：IBM DB2概览蓝儿唯美 db2
IBM DB2是一个支持了NoSQL功能的关系数据库管理系统，其包含了对XML，图像存储和Java脚本对象表示（JSON）的支持。DB2可被各种类型的企业使用，它提供了一个数据平台，同时支持事务和分析操作，通过提供持续的数据流来保持事务工作流和分析操作的高效性。 DB2支持的操作系统 DB2可应用于以下三个主要的平台: 工作站，DB2可在Linus、Unix、Windo
java笔记5 a-john java
控制执行流程： 1，true和false 利用条件表达式的真或假来决定执行路径。例：（a==b）。它利用条件操作符“==”来判断a值是否等于b值，返回true或false。java不允许我们将一个数字作为布尔值使用，虽然这在C和C++里是允许的。如果想在布尔测试中使用一个非布尔值，那么首先必须用一个条件表达式将其转化成布尔值，例如if(a!=0)。 2，if-els
Web开发常用手册汇总 aijuans PHP
一门技术，如果没有好的参考手册指导,很难普及大众。这其实就是为什么很多技术，非常好，却得不到普遍运用的原因。正如我们学习一门技术，过程大概是这个样子： ①我们日常工作中，遇到了问题，困难。寻找解决方案，即寻找新的技术； ②为什么要学习这门技术？这门技术是不是很好的解决了我们遇到的难题，困惑。这个问题，非常重要，我们不是为了学习技术而学习技术，而是为了更好的处理我们遇到的问题，才需要学习新的
今天帮助人解决的一个sql问题 asialee sql
今天有个人问了一个问题，如下： type AD value A
意图对象传递数据百合不是茶 android 意图Intent Bundle对象数据的传递
学习意图将数据传递给目标活动; 初学者需要好好研究的 1,将下面的代码添加到main.xml中 <?xml version="1.0" encoding="utf-8"?> <LinearLayout xmlns:android="http:/
oracle查询锁表解锁语句 bijian1013 oracle object session kill
一.查询锁定的表如下语句，都可以查询锁定的表语句一： select a.sid, a.serial#, p.spid, c.object_name, b.session_id, b.oracle_username, b.os_user_name from v$process p, v$s
mac osx 10.10 下安装 mysql 5.6 二进制文件［tar.gz］征客丶 mysql osx
场景：在 mac osx 10.10 下安装 mysql 5.6 的二进制文件。环境：mac osx 10.10、mysql 5.6 的二进制文件步骤：[所有目录请从根“/”目录开始取，以免层级弄错导致找不到目录] 1、下载 mysql 5.6 的二进制文件，下载目录下面称之为 mysql5.6SourceDir；下载地址：http://dev.mysql.com/downl
分布式系统与框架 bit1129 分布式
RPC框架 Dubbo 什么是Dubbo Dubbo是一个分布式服务框架，致力于提供高性能和透明化的RPC远程服务调用方案，以及SOA服务治理方案。其核心部分包含: 远程通讯: 提供对多种基于长连接的NIO框架抽象封装，包括多种线程模型，序列化，以及“请求-响应”模式的信息交换方式。集群容错: 提供基于接
那些令人蛋痛的专业术语白糖_ spring Web SSO IOC
spring 【控制反转(IOC)/依赖注入(DI)】：由容器控制程序之间的关系，而非传统实现中，由程序代码直接操控。这也就是所谓“控制反转”的概念所在：控制权由应用代码中转到了外部容器，控制权的转移，是所谓反转。简单的说：对象的创建又容器(比如spring容器)来执行，程序里不直接new对象。 Web 【单点登录(SSO)】：SSO的定义是在多个应用系统中，用户
《给大忙人看的java8》摘抄 braveCS java8
函数式接口：只包含一个抽象方法的接口 lambda表达式：是一段可以传递的代码你最好将一个lambda表达式想象成一个函数，而不是一个对象，并记住它可以被转换为一个函数式接口。事实上，函数式接口的转换是你在Java中使用lambda表达式能做的唯一一件事。方法引用：又是要传递给其他代码的操作已经有实现的方法了，这时可以使
编程之美-计算字符串的相似度 bylijinnan java 算法编程之美
public class StringDistance { /** * 编程之美计算字符串的相似度 * 我们定义一套操作方法来把两个不相同的字符串变得相同，具体的操作方法为： * 1.修改一个字符（如把“a”替换为“b”）; * 2.增加一个字符（如把“abdd”变为“aebdd”）; * 3.删除一个字符（如把“travelling”变为“trav
上传、下载压缩图片 chengxuyuancsdn 下载
/** * * @param uploadImage --本地路径(tomacat路径) * @param serverDir --服务器路径 * @param imageType --文件或图片类型 * 此方法可以上传文件或图片.txt,.jpg,.gif等 */ public void upload(String uploadImage,Str
bellman-ford(贝尔曼-福特)算法 comsci 算法 F#
Bellman-Ford算法(根据发明者 Richard Bellman 和 Lester Ford 命名)是求解单源最短路径问题的一种算法。单源点的最短路径问题是指：给定一个加权有向图G和源点s，对于图G中的任意一点v，求从s到v的最短路径。有时候这种算法也被称为 Moore-Bellman-Ford 算法，因为 Edward F. Moore zu 也为这个算法的发展做出了贡献。与迪科
oracle ASM中ASM_POWER_LIMIT参数 daizj ASM oracle ASM_POWER_LIMIT 磁盘平衡
ASM_POWER_LIMIT 该初始化参数用于指定ASM例程平衡磁盘所用的最大权值，其数值范围为0~11，默认值为1。该初始化参数是动态参数，可以使用ALTER SESSION或ALTER SYSTEM命令进行修改。示例如下： SQL>ALTER SESSION SET Asm_power_limit=2;
高级排序:快速排序 dieslrae 快速排序
public void quickSort(int[] array){ this.quickSort(array, 0, array.length - 1); } public void quickSort(int[] array,int left,int right){ if(right - left <= 0
C语言学习六指针_何谓变量的地址一个指针变量到底占几个字节 dcj3sjt126com C语言
# include <stdio.h> int main(void) { /* 1、一个变量的地址只用第一个字节表示 2、虽然他只使用了第一个字节表示，但是他本身指针变量类型就可以确定出他指向的指针变量占几个字节了 3、他都只存了第一个字节地址，为什么只需要存一个字节的地址，却占了4个字节，虽然只有一个字节，但是这些字节比较多，所以编号就比较大，
phpize使用方法 dcj3sjt126com PHP
phpize是用来扩展php扩展模块的，通过phpize可以建立php的外挂模块,下面介绍一个它的使用方法,需要的朋友可以参考下安装（fastcgi模式）的时候，常常有这样一句命令：代码如下: /usr/local/webserver/php/bin/phpize 一、phpize是干嘛的？ phpize是什么？ phpize是用来扩展php扩展模块的，通过phpi
Java虚拟机学习 - 对象引用强度 shuizhaosi888 JAVA虚拟机
本文原文链接：http://blog.csdn.net/java2000_wl/article/details/8090276 转载请注明出处！无论是通过计数算法判断对象的引用数量，还是通过根搜索算法判断对象引用链是否可达，判定对象是否存活都与“引用”相关。引用主要分为：强引用(Strong Reference)、软引用(Soft Reference)、弱引用(Wea
.NET Framework 3.5 Service Pack 1（完整软件包）下载地址 happyqing .net 下载 framework
Microsoft .NET Framework 3.5 Service Pack 1（完整软件包） http://www.microsoft.com/zh-cn/download/details.aspx?id=25150 Microsoft .NET Framework 3.5 Service Pack 1 是一个累积更新，包含很多基于 .NET Framewo
JAVA定时器的使用 jingjing0907 java timer 线程定时器
1、在应用开发中，经常需要一些周期性的操作，比如每5分钟执行某一操作等。对于这样的操作最方便、高效的实现方式就是使用java.util.Timer工具类。 privatejava.util.Timer timer; timer = newTimer(true); timer.schedule( newjava.util.TimerTask() { public void run()
Webbench 流浪鱼 webbench
首页下载地址 http://home.tiscali.cz/~cz210552/webbench.html Webbench是知名的网站压力测试工具，它是由Lionbridge公司（http://www.lionbridge.com）开发。 Webbench能测试处在相同硬件上，不同服务的性能以及不同硬件上同一个服务的运行状况。webbench的标准测试可以向我们展示服务器的两项内容：每秒钟相
第11章动画效果（中） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
windows下制作bat启动脚本. sanyecao2314 java cmd 脚本 bat
java -classpath C:\dwjj\commons-dbcp.jar;C:\dwjj\commons-pool.jar;C:\dwjj\log4j-1.2.16.jar;C:\dwjj\poi-3.9-20121203.jar;C:\dwjj\sqljdbc4.jar;C:\dwjj\voucherimp.jar com.citsamex.core.startup.MainStart
Java进行RSA加解密的例子 tomcat_oracle java
加密是保证数据安全的手段之一。加密是将纯文本数据转换为难以理解的密文；解密是将密文转换回纯文本。　　数据的加解密属于密码学的范畴。通常，加密和解密都需要使用一些秘密信息，这些秘密信息叫做密钥，将纯文本转为密文或者转回的时候都要用到这些密钥。　　对称加密指的是发送者和接收者共用同一个密钥的加解密方法。　　非对称加密(又称公钥加密)指的是需要一个私有密钥一个公开密钥，两个不同的密钥的
Android_ViewStub 阿尔萨斯 ViewStub
public final class ViewStub extends View java.lang.Object android.view.View android.view.ViewStub 类摘要： ViewStub 是一个隐藏的，不占用内存空间的视图对象，它可以在运行时延迟加载布局资源文件。当 ViewSt