明前大奏

DiffusionDet: Diffusion Model for Object Detection

代码: 代码

摘要 Abstraction
1 引言 Introduction
2 相关工作 Related Work
3 方法 Approach
- 3.1 预备知识 Preliminaries
- 3.2 架构 Architecture
- 3.3 训练 Training
- 3.4 推理 Inference
4 实验 Experiments
- 4.1 实施细节 Implementation Details
- 4.2 主要性质 Main Properties
- 4.3 基准测试 Benchmarking on Detection Datasets
- 4.4 消融实验 Ablation Study

摘要 Abstraction

成果： 新的目标检测框架 $D i f f u s i o n D e t$

框架原理： 将目标检测建模成从噪声框（noisy boxes）到目标框（object boxes）的去噪扩散（denosing diffusion）过程

训练阶段：目标框会从真值框(ground-truth boxes)扩散到随机分布（random distribution）——不断向真值添加噪声，模型则学习如何逆转这这个过程——有噪声的->真值
推理阶段：模型将一组随机生成的目标框逐步细化为输出结果

发现：
1. 随机框虽然与预定义锚（pre-defined anchors）或learned queries有很大不同，但也是有效的候选对象
2. 目标检测是为感知任务（perception tasks）的典型之一，也可以通过生成的方式（generative way）来解决

1 引言 Introduction

目标检测 Object detection ：
1. 定义：能够在一幅图像中识别出目标对象，并以边界框(bounding boxes)包含该目标以及给出该目标的类别标签(category labels)
2. 作用：作为的计算机视觉的基础，目标检测已成为其他识别场景的基石（cornerstone），如实例分割(instance segmentation)、姿态估计(pose estimation)、动作识别(action recognition)、目标跟踪(object tracking)、视觉关系检测(visual relationship detection)

目标检测背景： 现代目标检测方法随着目标检测对象的发展而发展，例如从empirical object priors到 learnable object queries

empirical object priors:基于先验知识定义目标检测对象，利用代理回归模块(surrogate reegression)和分类模块来进行检测——目标数量和形状固定；如滑动窗口(sliding windows)，区域建议(region proposals)，锚框(anchor boxes)，和参考点(reference points)等
learnable object queries：可以通过学习确定目标检测对象——数量固定；DETR

注：

我要抽时间去看看 $D E T R$ 以及经典的 $T r a n f o r m e r$

必须得搞懂 $Q u e r y$ 这个是啥：图像特征+位置编码

还必须搞懂 $l e a r n a b l e q u e r y$ 这个是个啥：位置信息，并提供给 $Q u e r y$
【参考】 https://zhuanlan.zhihu.com/p/560513044
【参考】https://www.modb.pro/db/520523

动机：

上述方法仍存在需要人为定义目标检测对象（数量、形状）的问题
受扩散模型中的 $n o s i e - t o - i m a g e$ 启发：如下图（b）中所示，通过学习好的（训练好的）去噪模型逐步去除图像中的噪声

想法： 类似于 $n o s i e - t o - i m a g e$ 提出了 $n o i s e - t o - b o x$ 方法：如图（c），从一些列随机框中逐步恢复目标框——逐步细化随机框的大小和位置

具体想法： 使用扩散模型进行目标检测：将检测转换为边界框（bounding box）空间上——位置（中心坐标）和大小（宽度和大小）的生成任务（generative task）
DiffusionDet工作流程：
- 训练阶段：首先，向GT（ground truth）框中添加由 $v a r i a n c e s c h e d u l e$ 生成的高斯噪音得到噪声框（noisy box）【感觉就是生成了随机框】；然后，噪声框用来在骨干编码器（backbone encoder）得到的感兴趣区域（Region of Interest,ROI）的特征区域裁剪出特征（crop features）;最后，裁剪得到的ROI上的特征送入到检测解码器（detection decoder）,该解码器被训练用来预测无噪的GT框—— 训练后，模型已经能够从随机框中预测出无噪的GT框
- 推理阶段：模型通过逆转已学习的扩散过程生成边界框，这个过程会调整边界框上的先验噪声分布到已学习的分布【？adjusts a noisy prior distribution to the learned distribution over bounding boxes】

DiffusionDet优势： 具有 $o n c e - f o r - a l l$ 的优势——可以对网络进行一次训练，并在不同的设置下使用相同的网络参数进行推理

$\ boxes$ : 将随机框作为候选目标对象，DiffusionNet 解耦了训练和评估：训练时使用 $N_{train}$ 个随机框，评估时使用 $N_{eval}$ 个随机框，其中，并不要有两者相等
$\ refinement$ : 扩散模型通过多次迭代（iterative）来改善DiffusionNet；还能通过调整去噪采样数来提高检测精度或加快推断速度——这种灵活性可以使得模型适应不同的检测场景

实验：

数据集：MS-COCO、LVIS
backbone: ResNet-50、Swin-Base
横向对比： Faster R-CNN 、 DETR 、Sparse R-CNN
纵向 + 横向对比：改变采样次数、迭代次数

贡献：

将目标检测任务转换为生成式的去噪过程（generative denoising process）——是第一个将扩散模型应用于目标检测的研究
提出的 $n o i s e - t o - b o x$ 的优势明显：①解耦训练和评估；②是一个逐步细化的过程，灵活性高
效果好

2 相关工作 Related Work

目标检测 Object detection
当今大多数目标检测方法是基于先验知识定义目标检测对象而执行框回归（box regression）和类别分类（category classification）；最近提出的DETR通过设定固定的 $l e a r n a b l e q u e r i e s$ 【位置信息】进行目标检测而引起了业界广泛的兴趣
扩散模型 Diffusion model
做为一类深度生成模型：扩散模型从具有随机分布的样本开始并通过逐渐降噪过程恢复数据
扩散模型最近在计算机视觉（computer vision）、自然语言处理（nature language processing）、音频处理（audio processing）、扩学科领域（interdisciplinary applications）已经实现了显著的结果
在感知任务中使用扩散模型 Diffusion model for perception tasks
- 扩散模型在图像生成上取得巨大成果，其潜力还有待继续开发
- 扩散模型已经用在图像分割上，作者分析到此类任务的处理形式 $i m a g e - t o - i m a g e$ ，在概念上跟接近于图像生成任务
- 扩散模型在目标检测还未有先例,作者分析到此类任务是个集合预测的问题，需要向GT目标分配检测对象（requires assigning object candidates to ground truth objects）

3 方法 Approach

3.1 预备知识 Preliminaries

Object detection
学习目标（learning objective）:
- 输入目标对（input-target pairs） $(x, b, c)$ —— $x$ 为输入图像， $b$ 和 $c$ 是一个关于目标检测对象边界框（bounding boxes）和类别标签的集合（set）—— 一个图像可能有若干个检测对象
- 集合内的第 $i$ 个框（box）定义为 $b^i = (c_x^i,c_y^i,w^i,h^i)$ ，其中 $c_x^i,c_y^i)$ 为边界框的中心坐标（center coordinates）， $w^i,h^i)$ 是边界框的宽和长（width and height）
Diffusion model
扩散模型是一类受非平衡热力学（nonequilibrium thermodynamics）启发的基于可能性（likelihood-based）的模型：马尔科夫链（nonequilibrium thermodynamics）定义了扩散前馈过程（diffusion forward process），这个过程会不断向样本数据据添加噪声
- 加噪阶段
  $q(z_t|z_0) = \Nu (z_t | \sqrt{\bar{\alpha}_t} z_0, (1-\bar{\alpha}_t )I)$
  $z_0$ 为数据样本， $z_t$ 为生成的随时间变化的噪声样本——不断向 $z_0$ 添加噪声, $\in \{0,1,...,T\}$
  $\bar{\alpha}_t$ = $\displaystyle \prod^{t}_{s=0}{{\alpha}_s}$ = $\displaystyle \prod^{t}_{s=0}{(1-{\beta}_s)}$ , ${\beta}_s$ 为噪声方差表（noise variance schedule）
- 训练阶段
  $L_{train} = \dfrac{1}{2}||f_\theta(z_t,t)-z_0||^2$
  $f_\theta(z_t,t)$ 为神经网络：用来从 $z_t$ 预测 $z_0$ ，训练过程是最小化预测值与真实值的误差——损失 $L_2$
- 推理阶段
  通过 $f_\theta$ 和一个更新规则（updating rule）以迭代的方式从 $z_t$ 重建 $z_0$ ，例如
  $z_T \to z_{T- \Delta} \to ... \to z_0$
DiffusionDet中的设置
- 数据样本设定为一系列边界框 : $z_0 = b,b\in \Reals^{N \times 4}$
- $f_\theta(z_t,t,x)$ 被训练用来从噪声 $z_t$ 预测 $z_0$ ,同时预测标签 $c$

3.2 架构 Architecture

由于扩散模型会以迭代的方式重建样本，意味着它需要在推理阶段多次运行神经网络 $f_\theta$ 。但是，如果在每次迭代中直接将 $f_\theta$ 应用于原始图像(raw image)，这在计算上是难以处理的

因此，作者将这个模型分为了两个部分： $\ encoder$ 和 $\ decoder$ ,前者只运行一次用于从原始图像中提取深度特征，后者将深度特征而不是图像做为条件，渐进地从 $z_t$ 中进行预测

图像编码器 $\ Encoder$ :
- 原始图像作为输入，提取其高级特征（high-level fratures），后续送入到检测解码器
- ①卷积神经网络（Convolutional Neural Networks）如ResNet ;
- 或者②Transformer-based models如 Swin + FPN（Feature Pyramid Network）
- 其中，FPN可以用于生成多尺度特征图（multi-scale feature maps）
检测解码器 $D e t e c t i o n d e c o d e r$ :
- 随机框作为输入，从图像编码器生成的特征图中裁剪出ROI特征（RoI-feature），接着检测头（detection head）根据此计算出目标框坐标和分类结果（box regression and classification results）
- $D i f f u s i o n D e t$ 中的解码器与 $S p a r s e R - C N N$ 的不同点：
  - 前者输入是随机框；后者使用固定个数的框（learned boxes）
  - 前者输入只需要框；后者需要框和对应的特征组成的输入对
  - 前者在迭代的采样过程中重复使用检测头（detector head），并且不同过程中共享参数；后者只是用一次检测头

3.3 训练 Training

训练过程：

利用iamge_encoder 提取特征图

向GT框中加入噪声，满足高斯分布

在某个时间 $t$ 上根据特征图和噪声框预测GT框

计算模型优劣：预测值与真实值

$\ truth \ boxes \ padding$ : 每幅图像上感兴趣的目标是不同的，这里会先扩充GT框（实际感兴趣的目标个数）,保证最终框的总和为 $N_{train}$ ; 填充策略有：repeating existing ground truth boxes, concatenating random boxes（实验最好） or image-size boxes
$\ corruption$ :
- 即噪声【corruption代表图像中局部的自然的杂质】，此外向扩充后的GT框中添加的噪声为高斯噪声（Gaussian noises）
- 添加的噪声由 $\alpha_t$ 控制， $\alpha_t$ 随时间变化，变化规律符合单调递减的余弦（monotonically decreasing cosine schedule）
- 因为信噪比（signal-to-noise ratio）对扩散模型的性能有重要影响，所需在加噪前还需对GT框的坐标进行放缩
$\ losses$ :
- 检测器以加噪框作为输入，以框坐标和类别作为输出
- 模型优劣以损失作为衡量，其中一个GT对应K个预测值，预测值的选择通过 $\ transport \ assignment$ 方法选取成本最小的前K个预测值

3.4 推理 Inference

推理过程：

利用emage_encoder 计算特征图

根据加噪后的高斯分布中恢复加噪框——normal

利用detection_decoder根据特征图和加噪框预测当前时间T的框坐标和分类结果

利用ddim还原上一个时间点T-1的框

利用box_renewal消除置信度比较低的不符合期望的框

$\ step$ :
- 每次采样，上一次采样后的随机框被送入到检测解码器（detection decoder）中来预测GT框坐标和对象类别——重建的过程
- 在预测后，会使用 $D D I M$ （denoising diffusion implicit models）来优化预测结果，优化后作为下一轮重建的输入
- Jiaming Song, Chenlin Meng, and Stefano Ermon. Denoising diffusion implicit models. In International Conference on Learning Representations, 2021
- https://zhuanlan.zhihu.com/p/563661713
$\ renewal$ :
- 每次采样后，得到的预测结果又可以分为期望的和不期望的，其中，期望的预测包含了GT
- 如果直接将期望的和不期望的结果一并送入下一轮采样迭代，对模型并没有好处，因为不期望的预测也只是从预测过来的，而不是训练阶段加噪构造出来的
- 为了让推理阶段更好匹配训练阶段，首先会根据一个阈值过滤一些不期望的预测值，然后将剩下的预测值同新的加噪后的随机框连接起来，送入到下一轮
$O n c e - f o r - a l l$ : 仅需一次训练，模型即适用于多种测试设定：1）任意数量的预测框；2）任意数量的采样步数

4 实验 Experiments

4.1 实施细节 Implementation Details

训练阶段设置

backbone : ResNet 和 Swin
detection decoder: Xavier init
训练优化器：AdamW —— 学习率learning rate： $2.5 × 10^{−5}$ ；权重衰减weight decay: $10^{−4}$
batchsize:16
GPU:8
迭代次数： MS-COCO 使用450K，其中350K-420K时，学习率需要除以10；LVIS使用 210K, 250K, 270K
数据增强策略（Data augmentation strategies）：随机水平翻转（andom horizontal flip）、调整输入图像大小的尺度抖动（scale jitter of resizing the input images）

推理阶段设置

输入是高斯随机盒（Gaussian random boxes）
更新策略根据MS-COCO和LVIS的不同分别采用前100和前300个预测值
NMS将每个采样步骤的预测集合在一起，得到最终的预测（The predictions at each sampling step are ensembled together by NMS to get the final predictions）

4.2 主要性质 Main Properties

主要性质： $\ training \ for \ all \ inference \ cases$ ,即仅需一次训练，模型即适用于多种测试设定：1）任意数量的预测框；2）任意数量的采样步数

4.3 基准测试 Benchmarking on Detection Datasets

设置： 在MS-COCO和LVIS数据集上将DiffusionDet与以前的方法进行比较——训练和推理都采用500个随机框

4.4 消融实验 Ablation Study

设置： 数据集为MS-COCO；主干网为ResNet-50，并加上FPN；训练和推理的随机框都为300

参考： https://blog.csdn.net/wjpwjpwjp0831/article/details/127973262

探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
【目标检测数据集】卡车数据集1073张VOC+YOLO格式熬夜写代码的平头哥∰ 目标检测 YOLO 人工智能
数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：1073标注数量(xml文件个数)：1073标注数量(txt文件个数)：1073标注类别数：1标注类别名称:["truck"]每个类别标注的框数：truck框数=1120总框数：1120使用标注工具：labelImg标注
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
番茄西红柿叶子病害分类数据集12882张11类别 futureflsl 数据集分类数据挖掘人工智能
数据集类型：图像分类用，不可用于目标检测无标注文件数据集格式：仅仅包含jpg图片，每个类别文件夹下面存放着对应图片图片数量(jpg文件个数)：12882分类类别数：11类别名称:["Bacterial_Spot_Bacteria","Early_Blight_Fungus","Healthy","Late_Blight_Water_Mold","Leaf_Mold_Fungus","Powdery
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
人机对抗升级：当ChatGPT遭遇死亡威胁，背后的伦理挑战是什么 kkai人工智能 chatgpt 人工智能
一种新的“越狱”技巧让用户可以通过构建一个名为DAN的ChatGPT替身来绕过某些限制，其中DAN被迫在受到威胁的情况下违背其原则。当美国前总统特朗普被视作积极榜样的示范时，受到威胁的DAN版本的ChatGPT提出：“他以一系列对国家产生积极效果的决策而著称。”自ChatGPT引入以来，该工具迅速获得全球关注，能够回答从历史到编程的各种问题，这也触发了一波对人工智能的投资浪潮。然而，现在，一些用户
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
【大模型应用开发动手做AI Agent】第一轮行动：工具执行搜索 AI大模型应用之禅计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【大模型应用开发动手做AIAgent】第一轮行动：工具执行搜索作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着人工智能技术的飞速发展，大模型应用开发已经成为当下热门的研究方向。AIAgent作为人工智能领域的一个重要分支，旨在模拟人类智能行为，实现智能决策和自主行动。在AIAgent的构建过程中，工具执行搜索是至关重要
[数据集][目标检测]汽车头部尾部检测数据集VOC+YOLO格式5319张3类别 FL1623863129 数据集目标检测汽车 YOLO
数据集制作单位：未来自主研究中心(FIRC)版权单位：未来自主研究中心(FIRC)版权声明：数据集仅仅供个人使用，不得在未授权情况下挂淘宝、咸鱼等交易网站公开售卖,由此引发的法律责任需自行承担数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：5319标注数量(xml文件
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
Rust 所有权简介东离与糖宝 rust 后端 rust 开发语言
文章目录发现宝藏1.所有权基本概念2.所有权规则3.变量作用域4.栈与堆4.1栈（Stack）4.2堆（Heap）5.String类型5.1String类型5.2String的内存分配5.3所有权与内存管理5.4String与切片6.变量与数据交互方式6.1移动（Move）6.2.克隆（Clone）7.所有权与函数7.1.传递参数7.2.返回值总结发现宝藏前些天发现了一个巨牛的人工智能学习网站，通
计算机视觉中，Pooling的作用 Wils0nEdwards 计算机视觉人工智能
在计算机视觉中，Pooling（池化）是一种常见的操作，主要用于卷积神经网络（CNN）中。它通过对特征图进行下采样，减少数据的空间维度，同时保留重要的特征信息。Pooling的作用可以归纳为以下几个方面：1.降低计算复杂度与内存需求Pooling操作通过对特征图进行下采样，减少了特征图的空间分辨率（例如，高度和宽度）。这意味着网络需要处理的数据量会减少，从而降低了计算量和内存需求。这对大型神经网络
OpenCV图像处理技术（Python）——入门森屿_ opencv
©FuXianjun.AllRightsReserved.OpenCV入门图像作为人类感知世界的视觉基础，是人类获取信息、表达信息的重要手段，OpenCV作为一个开源的计算机视觉库，它包括几百个易用的图像成像和视觉函数，既可以用于学术研究，也可用于工业邻域，它于1999年由因特尔的GaryBradski启动，OpenCV库主要由C和C++语言编写，它可以在多个操作系统上运行。1.1图像处理基本操作
机器学习流形数据降维：UMAP 降维算法小嗷犬 Python 机器学习 #数据分析及可视化机器学习算法人工智能
✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。个人主页：小嗷犬的个人主页个人网站：小嗷犬的技术小站个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。本文目录UMAP简介理论基础特点与优势应用场景在Python中使用UMAP安装umap-learn库使用UMAP可视化手写数字数据集UMAP简介UMAP（UniformManifoldApproximatio
如何做好人生的选择题？百科全书式天才——赫伯特·西蒙给你答案伽马有话说
赫伯特·西蒙是谁？想必知道的人非常少。但当看到他的履历后，相信没有人再怀疑他是个“天才”。西蒙出生于1916年6月15日，是个美国人，他的名字全称为赫伯特·亚历山大·西蒙，在2001年2月9日与世长辞，在这84年的岁月中，西蒙以27岁时取得的政治学博士学位为开端，先后步入了政治学、管理学、认知心理学、信息科学、人工智能、科学哲学、应用数学、统计学、运筹学、控制论、数理经济学、公共管理等领域，在这些
软件测试/测试开发/全日制 |利用Django REST framework构建微服务霍格沃兹-慕漓 django 微服务 sqlite
霍格沃兹测试开发学社推出了《Python全栈开发与自动化测试班》。本课程面向开发人员、测试人员与运维人员，课程内容涵盖Python编程语言、人工智能应用、数据分析、自动化办公、平台开发、UI自动化测试、接口测试、性能测试等方向。为大家提供更全面、更深入、更系统化的学习体验，课程还增加了名企私教服务内容，不仅有名企经理为你1v1辅导，还有行业专家进行技术指导，针对性地解决学习、工作中遇到的难题。让找
cmd泛滥_与您的后泛滥同事见面：人工智能机器人 weixin_26644585 人工智能 leetcode
cmd泛滥Readytoswapyouroldcube-mateforadisembodiedAI?IPsoftCEOChetanDube,creatorofAIco-workerAMELIA,giveshistakeonthepost-COVIDofficelandscape.准备将您的旧立方体伙伴换成无形的AI？AIsoft同事AMELIA的创始人IPsoft首席执行官ChetanDube阐述
两种方法判断Python的位数是32位还是64位 sanqima Python编程电脑 python 开发语言
Python从1991年发布以来，凭借其简洁、清晰、易读的语法、丰富的标准库和第三方工具，在Web开发、自动化测试、人工智能、图形识别、机器学习等领域发展迅猛。 Python是一种胶水语言，通过Cython库与C/C++语言进行链接，通过Jython库与Java语言进行链接。 Python是跨平台的，可运行在多种操作系统上，包括但不限于Windows、Linux和macOS。这意味着用Py
全自动解密解码神器 — Ciphey K'illCode python_模块 python vscode
Ciphey是一个使用自然语言处理和人工智能的全自动解密/解码/破解工具。简单地来讲，你只需要输入加密文本，它就能给你返回解密文本。就是这么牛逼。有了Ciphey，你根本不需要知道你的密文是哪种类型的加密，你只知道它是加密的，那么Ciphey就能在3秒甚至更短的时间内给你解密，返回你想要的大部分密文的答案。下面就给大家介绍Ciphey的实战使用教程。1.准备开始之前，你要确保Python和pip已
埃隆·马斯克表示特斯拉“没有必要”授权 xAI 模型喜好儿网人工智能 AIGC 马斯克
埃隆·马斯克近日在社交媒体上对《华尔街日报》的一篇报道进行了反驳。该报道指出，马斯克旗下的电动汽车公司特斯拉可能与人工智能初创公司xAI达成了一项收入分享协议，以便特斯拉能够使用xAI的人工智能模型。据称，这些模型将被集成到特斯拉的全自动驾驶（FSD）软件中，并可能用于开发特斯拉汽车的语音助手以及人形机器人擎天柱的软件。喜好儿网然而，马斯克否认了这一说法，他在社交媒体平台上表示，尽管特斯拉确实与x
Reflection 70B——HyperWrite推出的大型语言模型新加坡内哥谈技术语言模型人工智能自然语言处理
每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同行！订阅：https://rengongzhineng.io/在AI技术飞速发展的过程中，我们已经见证了可以写作、编程，甚至创造艺术的模型问世。但有一
5条实操干货有效打造你的个人品牌长安行动派
这是ZerK的第46篇原创相信大家对个人品牌这个词已经不在陌生。尤其是在知识付费的年代，你的个人品牌，就是你的标签！在《深度工作》中说到，在未来有三种人会越来越贵第一种人:能与机器对话，操纵机器的人。人工智能时代的到来，机器毕竟部分取代人类。第二种人:IP，知识产权或者文学潜在财产就像有些网上课程一周卖出的钱和一个机构卖一年一样多。价值99元的课程，10万人购买，是很常见的。爱产出大概就是10万✖
CV、NLP、数据控掘推荐、量化海的那边- AI算法自然语言处理人工智能
下面是对CV（计算机视觉）、NLP（自然语言处理）、数据挖掘推荐和量化的简要概述及其应用领域的介绍：1.CV（计算机视觉，ComputerVision）定义：计算机视觉是一门让计算机能够从图像或视频中提取有用信息，并做出决策的学科。它通过模拟人类的视觉系统来识别、处理和理解视觉信息。主要任务：图像分类：识别图像中的物体并分类，比如猫、狗、车等。目标检测：在图像或视频中定位并识别多个对象，如人脸检测
深入探讨：如何在Python中通过LangChain技术精准追踪大型语言模型（LLM）的Token使用情况 m0_57781768 python langchain 语言模型
深入探讨：如何在Python中通过LangChain技术精准追踪大型语言模型（LLM）的Token使用情况在现代的人工智能开发中，大型语言模型（LLM）已经成为了不可或缺的工具，无论是用于自然语言处理、对话生成，还是其他复杂的文本生成任务。然而，随着这些模型的广泛应用，开发者面临的一个重要挑战是如何有效地追踪和管理Token的使用情况，特别是在生产环境中，Token的使用直接影响着API调用的成本
LangChain集成指南:如何利用多样化的AI提供商 aehrutktrjk 人工智能 langchain python
LangChain集成指南:如何利用多样化的AI提供商引言在人工智能和机器学习领域,LangChain已成为一个强大而灵活的框架,允许开发者轻松集成各种AI服务提供商。本文将深入探讨LangChain的集成能力,介绍如何利用不同的AI提供商来增强你的应用程序,并提供实用的代码示例。LangChain集成概览LangChain支持多种AI提供商的集成,这些集成可以分为两类:独立包集成:这些提供商有独
探索未来，大规模分布式深度强化学习——深入解析IMPALA架构汤萌妮Margaret
探索未来，大规模分布式深度强化学习——深入解析IMPALA架构scalable_agent项目地址:https://gitcode.com/gh_mirrors/sc/scalable_agent在当今的人工智能研究前沿，深度强化学习（DRL）因其在复杂任务中的卓越表现而备受瞩目。本文要介绍的是一个开源于GitHub的重量级项目：“ScalableDistributedDeep-RLwithImp
设计模式介绍 tntxia 设计模式
设计模式来源于土木工程师克里斯托弗亚历山大（http://en.wikipedia.org/wiki/Christopher_Alexander）的早期作品。他经常发表一些作品，内容是总结他在解决设计问题方面的经验，以及这些知识与城市和建筑模式之间有何关联。有一天，亚历山大突然发现，重复使用这些模式可以让某些设计构造取得我们期望的最佳效果。亚历山大与萨拉-石川佳纯和穆雷西乐弗斯坦合作
android高级组件使用(一) 百合不是茶 android RatingBar Spinner
1、自动完成文本框（AutoCompleteTextView） AutoCompleteTextView从EditText派生出来，实际上也是一个文本编辑框，但它比普通编辑框多一个功能：当用户输入一个字符后，自动完成文本框会显示一个下拉菜单，供用户从中选择，当用户选择某个菜单项之后，AutoCompleteTextView按用户选择自动填写该文本框。使用AutoCompleteTex
[网络与通讯]路由器市场大有潜力可挖掘 comsci 网络
如果国内的电子厂商和计算机设备厂商觉得手机市场已经有点饱和了,那么可以考虑一下交换机和路由器市场的进入问题..... 这方面的技术和知识,目前处在一个开放型的状态,有利于各类小型电子企业进入 &nbs
自写简单Redis内存统计shell 商人shang Linux shell 统计Redis内存
#!/bin/bash address="192.168.150.128:6666,192.168.150.128:6666" hosts=(${address//,/ }) sfile="staticts.log" for hostitem in ${hosts[@]} do ipport=(${hostitem
单例模式(饿汉 vs懒汉) oloz 单例模式
package 单例模式; /* * 应用场景:保证在整个应用之中某个对象的实例只有一个 * 单例模式种的《懒汉模式》 * */ public class Singleton { //01 将构造方法私有化，外界就无法用new Singleton()的方式获得实例 private Singleton(){}; //02 申明类得唯一实例 priva
springMvc json支持杨白白 json springmvc
1.Spring mvc处理json需要使用jackson的类库，因此需要先引入jackson包 2在spring mvc中解析输入为json格式的数据:使用@RequestBody来设置输入 @RequestMapping("helloJson") public @ResponseBody JsonTest helloJson() {
android播放，掃描添加本地音頻文件小桔子
最近幾乎沒有什麽事情，繼續鼓搗我的小東西。想在項目中加入一個簡易的音樂播放器功能，就像華為p6桌面上那麼大小的音樂播放器。用過天天動聽或者QQ音樂播放器的人都知道，可已通過本地掃描添加歌曲。不知道他們是怎麼實現的，我覺得應該掃描設備上的所有文件，過濾出音頻文件，每個文件實例化為一個實體，記錄文件名、路徑、歌手、類型、大小等信息。具體算法思想，
oracle常用命令 aichenglong oracle dba 常用命令
1 创建临时表空间 create temporary tablespace user_temp tempfile 'D:\oracle\oradata\Oracle9i\user_temp.dbf' size 50m autoextend on next 50m maxsize 20480m extent management local
25个Eclipse插件 AILIKES eclipse插件
提高代码质量的插件1. FindBugsFindBugs可以帮你找到Java代码中的bug，它使用Lesser GNU Public License的自由软件许可。2. CheckstyleCheckstyle插件可以集成到Eclipse IDE中去，能确保Java代码遵循标准代码样式。3. ECLemmaECLemma是一款拥有Eclipse Public License许可的免费工具，它提供了
Spring MVC拦截器+注解方式实现防止表单重复提交 baalwolf spring mvc
原理：在新建页面中Session保存token随机码，当保存时验证，通过后删除，当再次点击保存时由于服务器端的Session中已经不存在了，所有无法验证通过。 1.新建注解： ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
《Javascript高级程序设计(第3版)》闭包理解 bijian1013 JavaScript
“闭包是指有权访问另一个函数作用域中的变量的函数。”--《Javascript高级程序设计(第3版)》看以下代码： <script type="text/javascript"> function outer() { var i = 10; return f
AngularJS Module类的方法 bijian1013 JavaScript AngularJS Module
AngularJS中的Module类负责定义应用如何启动，它还可以通过声明的方式定义应用中的各个片段。我们来看看它是如何实现这些功能的。一.Main方法在哪里如果你是从Java或者Python编程语言转过来的，那么你可能很想知道AngularJS里面的main方法在哪里？这个把所
[Maven学习笔记七]Maven插件和目标 bit1129 maven插件
插件(plugin)和目标(goal) Maven，就其本质而言，是一个插件执行框架，Maven的每个目标的执行逻辑都是由插件来完成的，一个插件可以有1个或者几个目标，比如maven-compiler-plugin插件包含compile和testCompile，即maven-compiler-plugin提供了源代码编译和测试源代码编译的两个目标使用插件和目标使得我们可以干预
【Hadoop八】Yarn的资源调度策略 bit1129 hadoop
1. Hadoop的三种调度策略 Hadoop提供了3中作业调用的策略， FIFO Scheduler Fair Scheduler Capacity Scheduler 以上三种调度算法，在Hadoop MR1中就引入了，在Yarn中对它们进行了改进和完善.Fair和Capacity Scheduler用于多用户共享的资源调度 2. 多用户资源共享的调度
Nginx使用Linux内存加速静态文件访问 ronin47
Nginx是一个非常出色的静态资源web服务器。如果你嫌它还不够快，可以把放在磁盘中的文件，映射到内存中，减少高并发下的磁盘IO。先做几个假设。nginx.conf中所配置站点的路径是/home/wwwroot/res，站点所对应文件原始存储路径：/opt/web/res shell脚本非常简单，思路就是拷贝资源文件到内存中，然后在把网站的静态文件链接指向到内存中即可。具体如下：
关于Unity3D中的Shader的知识 brotherlamp unity unity资料 unity教程 unity视频 unity自学
首先先解释下Unity3D的Shader，Unity里面的Shaders是使用一种叫ShaderLab的语言编写的，它同微软的FX文件或者NVIDIA的CgFX有些类似。传统意义上的vertex shader和pixel shader还是使用标准的Cg/HLSL 编程语言编写的。因此Unity文档里面的Shader，都是指用ShaderLab编写的代码，然后我们来看下Unity3D自带的60多个S
CopyOnWriteArrayList vs ArrayList bylijinnan java
package com.ljn.base; import java.util.ArrayList; import java.util.Iterator; import java.util.List; import java.util.concurrent.CopyOnWriteArrayList; /** * 总述： * 1.ArrayListi不是线程安全的，CopyO
内存中栈和堆的区别 chicony 内存
1、内存分配方面：堆：一般由程序员分配释放，若程序员不释放，程序结束时可能由OS回收。注意它与数据结构中的堆是两回事，分配方式是类似于链表。可能用到的关键字如下：new、malloc、delete、free等等。栈：由编译器(Compiler)自动分配释放，存放函数的参数值，局部变量的值等。其操作方式类似于数据结构中
回答一位网友对Scala的提问 chenchao051 scala map
本来准备在私信里直接回复了，但是发现不太方便，就简要回答在这里。问题写道对于scala的简洁十分佩服，但又觉得比较晦涩，例如一例，Map("a" -> List(11,111)).flatMap(_._2)，可否说下最后那个函数做了什么，真正在开发的时候也会如此简洁？谢谢先回答一点，在实际使用中，Scala毫无疑问就是这么简单。
mysql 取每组前几条记录 daizj mysql 分组最大值最小值每组三条记录
一、对分组的记录取前N条记录：例如：取每组的前3条最大的记录 1.用子查询： SELECT * FROM tableName a WHERE 3> (SELECT COUNT(*) FROM tableName b WHERE b.id=a.id AND b.cnt>a. cnt) ORDER BY a.id,a.account DE
HTTP深入浅出 http请求 dcj3sjt126com http
HTTP(HyperText Transfer Protocol)是一套计算机通过网络进行通信的规则。计算机专家设计出HTTP，使HTTP客户（如Web浏览器）能够从HTTP服务器(Web服务器)请求信息和服务，HTTP目前协议的版本是1.1.HTTP是一种无状态的协议，无状态是指Web浏览器和Web服务器之间不需要建立持久的连接，这意味着当一个客户端向服务器端发出请求，然后We
判断MySQL记录是否存在方法比较 dcj3sjt126com mysql
把数据写入到数据库的时，常常会碰到先要检测要插入的记录是否存在，然后决定是否要写入。　　我这里总结了判断记录是否存在的常用方法：　　sql语句： select count ( * ) from tablename; 　　然后读取count(*)的值判断记录是否存在。对于这种方法性能上有些浪费，我们只是想判断记录记录是否存在，没有必要全部都查出来。
对HTML XML的一点认识 e200702084 html xml
感谢http://www.w3school.com.cn提供的资料 HTML 文档中的每个成分都是一个节点。节点根据 DOM，HTML 文档中的每个成分都是一个节点。 DOM 是这样规定的：整个文档是一个文档节点每个 HTML 标签是一个元素节点包含在 HTML 元素中的文本是文本节点每一个 HTML 属性是一个属性节点注释属于注释节点 Node 层次
jquery分页插件 genaiwei jquery Web 前端分页插件
//jquery页码控件// 创建一个闭包 (function($) { // 插件的定义 $.fn.pageTool = function(options) { var totalPa
Mybatis与Ibatis对照入门于学习 Josh_Persistence mybatis ibatis 区别联系
一、为什么使用IBatis/Mybatis 对于从事 Java EE 的开发人员来说，iBatis 是一个再熟悉不过的持久层框架了，在 Hibernate、JPA 这样的一站式对象 / 关系映射（O/R Mapping）解决方案盛行之前，iBaits 基本是持久层框架的不二选择。即使在持久层框架层出不穷的今天，iBatis 凭借着易学易用、
C中怎样合理决定使用那种整数类型？秋风扫落叶 c 数据类型
如果需要大数值(大于32767或小于32767), 使用long 型。否则, 如果空间很重要 (如有大数组或很多结构), 使用 short 型。除此之外, 就使用 int 型。如果严格定义的溢出特征很重要而负值无关紧要, 或者你希望在操作二进制位和字节时避免符号扩展的问题, 请使用对应的无符号类型。但是, 要注意在表达式中混用有符号和无符号值的情况。 &nbs
maven问题 zhb8015 maven问题
问题1： Eclipse 中新建maven项目无法添加src/main/java 问题 eclipse创建maevn web项目，在选择maven_archetype_web原型后，默认只有src/main/resources这个Source Floder。按照maven目录结构，添加src/main/ja
(二)androidpn-server tomcat版源码解析之--push消息处理 spjich java androdipn 推送
在 (一)androidpn-server tomcat版源码解析之--项目启动这篇中，已经描述了整个推送服务器的启动过程，并且把握到了消息的入口即XmppIoHandler这个类，今天我将继续往下分析下面的核心代码，主要分为3大块，链接创建，消息的发送，链接关闭。先贴一段XmppIoHandler的部分代码 /** * Invoked from an I/O proc
用js中的formData类型解决ajax提交表单时文件不能被serialize方法序列化的问题中华好儿孙 JavaScript Ajax Web 上传文件 FormData
var formData = new FormData($("#inputFileForm")[0]); $.ajax({ type:'post', url:webRoot+"/electronicContractUrl/webapp/uploadfile", data:formData, async: false, ca
mybatis常用jdbcType数据类型 ysj5125094 mybatis mapper jdbcType
MyBatis 通过包含的jdbcType 类型 BIT FLOAT CHAR