阿珩#

多目标跟踪MOT论文阅读记录2（持续更新中...）

以下内容都是个人理解，有不当的地方烦请批评指正。

前文：

多目标跟踪MOT论文阅读记录1_阿珩#的博客-CSDN博客

1 综述

2 检测后跟踪（tracking by detection）

2.1 Separate Detection and Embedding (SDE)

1） 2022年 MotionTrack: rethinking the motion cue for multiple object tracking in USV videos

网络结构：

关联伪代码：

kalman更新公式：

论文地址：MotionTrack: rethinking the motion cue for multiple object tracking in USV videos | SpringerLink

代码地址：lzq11/MotionTrack: MotionTrack: Rethinking the Motion Cue for Multiple Object Tracking in USV Videos (github.com)

创新点：在bytetrack的基础上添加一级高斯距离匹配，以观测为中心的kalman校正

为什么：USV跟踪存在的观测平台摆动、物体非线性运动、小目标等问题的影响

怎么做：1）高斯距离匹配：在bytetrack的基础上添加第三次匹配，即对第二次未匹配的轨迹和第一次未匹配的高分检测框进行高斯距离匹配；2）观测为中心的kalman校正：直接使用检测结果作为跟踪结果，以更新kalman，也就是令更新公式里的噪声R为0

总结：使用YOLOv7作为检测器，不使用reid，速度很快（接近SORT），适合水面目标跟踪

（如果进行行人跟踪还是添加外观更准确一些？）

2） 2022年CVPR Observation-Centric SORT: Rethinking SORT for Robust Multi-Object Tracking

网络结构：

OCM：

论文地址：[2203.14360] Observation-Centric SORT: Rethinking SORT for Robust Multi-Object Tracking (arxiv.org)

代码地址：noahcao/OC_SORT: [CVPR2023] The official repo for OC-SORT: Observation-Centric SORT on video Multi-Object Tracking. OC-SORT is simple, online and robust to occlusion/non-linear motion. (github.com)

创新点：1）以观察为中心的重新更新（ORU）（针对KF）；2）以观察为中心的动量（OCM）（针对关联）

为什么：SORT的三个局限；1）KF对状态估计噪声敏感、2）目标消失后，随时间推移的KF预测误差累积；3）以估计为中心的KF导致即使重新关联也很容易再次丢失

怎么做：1）ORU：在一条轨迹inactive一段时间后，重新关联成功时，利用上一次最后的检测点和当前帧的新检测点，在两点之间，使用恒定速度生成一条虚拟轨迹，并沿着这条虚拟轨迹执行一遍kalman预测、更新，以达到清除误差累计的目的；2）OCM：如上图2，计算AC与BD夹角（越小越好），将这个夹角的度量加入关联代价矩阵中；3）OCR：第二次关联：在未匹配的检测，和未匹配的轨迹的最后一次检测之间进行关联尝试

总结：检测器使用bytetrack训练的YOLOX，没使用reid，fps高达793，主要是针对遮挡和快速非线性目标运动问题的，适合DanceTrack这样的数据集和场景

3） 2022年CVPR MotionTrack: Learning Robust Short-term and Long-term Motions for Multi-Object Tracking

网络结构：

交互模块：

4） 2023年 DEEP OC-SORT: MULTI-PEDESTRIAN TRACKING BY ADAPTIVE REIDENTIFICATION

网络结构：

论文地址：https://arxiv.org/abs/2302.11813

代码地址：https://github.com/GerardMaggiolino/Deep-OC-SORT

创新点：在OC-SORT基础上添加：1）相机运动估计模块CMC；2）自适应特征更新因子DA；3）外观代价矩阵自适应权重AW

为什么：觉得外观重要吧

怎么做：1）CMC：同BOTSORT；2）DA：将EMA特征更新中的α换成随置信度自适应调节的，也就是说检测置信度大，则提高这次外观嵌入的权重，如果检测置信度很低，那这次就不更新特征了，保留上一次的；3）AW：在代价矩阵C中的外观代价A部分，添加了因子，使外观矩阵中，相似度最高的，和次高之间的差距足够大，这样才是更突出的外观关联。

总结：检测器使用bytetrack训练的YOLOX，reid使用botsort相同的fast-reid，效果比ocsort好一点，没提到fps，应该是大大下降了

5） 2023年 CVPR Simple Cues Lead to a Strong Multi-Object Tracker

inactive轨迹距离：

动态域适应：

论文地址：https://arxiv.org/abs/2206.04656

代码地址：https://github.com/dvl-tum/GHOST

创新点：1）分别对active和inactive轨迹进行匹配；2）动态域适应

为什么：inactive轨迹用常规的外观或运动距离难以区分开；不用数据集的分布不同，会影响ReID模型的迁移性能

怎么做：1）对active轨迹，使用常规的外观度量（即检测的外观特征与轨迹上一帧的外观特征之间的距离），对inactive轨迹，di（检测的外观）与t（轨迹）的k个历史外观分别计算距离，然后求和取均值，作为最终的外观距离；同时两者的外观代价阈值不同；2）动态域适应：调整BN层统计数据以反映数据集的分布变化，提高ReID模型跨数据集的应用效果（大概是个针对数据集的迁移学习，是ReID领域的思想）

总结：两个思想均可应用于其他跟踪器，运动模型使用线性模型（作者发现线性模型和kalman相比相差不大）

2.2 Joint Detection and Embedding (JDE)

1） 2020年 Rethinking the Competition Between Detection and ReID in Multiobject Tracking

网络结构：

REN网络：

SAAN网络：

论文地址：Rethinking the Competition Between Detection and ReID in Multiobject Tracking | IEEE Journals & Magazine | IEEE Xplore

代码地址：GitHub - JudasDie/SOTS: Single object tracking and segmentation.

创新点：引入了一种互惠网络（REN）和尺度感知注意力网络（SAAN）来改善检测和ReID的竞争和协作。

为什么：1）JDE方法共享网络的检测和reid任务存在矛盾，即检测需要学习同一类别的相似性，reid需要学习每个目标的差异性；2）使用FPN的检测网络中，不同尺度关注不同大小的目标，即一个目标只出现在一个尺度的bbox中，也就是reid只能嵌入对应这个尺度下bbox的特征，而作者希望reid能够嵌入多个尺度下同一个目标的特征，也就是作者提到的“语义级错位”

怎么做：在JDE的基础上：1）REN：在网络的head和neck中间添加REN，用以解耦特征，具有自关系权重和交叉关系权重的学习（为什么一定要学交叉？为了任务之间的协作吗？）；2）SAAN：reid头换成了SAAN，里面应用了空间注意力SAM（学习哪里的特征重要）和通道注意力CAM（融合通道，学习什么特征重要）

总结：使用YOLOv5作为检测器，除了这些创新点外和JDE基本一致，轻量版本CSTrack-S有34.6FPS

2） 2021年 One More Check: Making “Fake Background” Be Tracked Again

网络结构：

Re-check Network结构：

论文地址：[2104.09441] One More Check: Making "Fake Background" Be Tracked Again (arxiv.org)

代码地址：JudasDie/SOTS: Single object tracking and segmentation. (github.com)

创新点：提出重新检查网络来恢复被错误分类为“假背景”的边界框。

为什么：检测结果不可靠，会将一些目标判定为背景

怎么做：在JDE（CSTrack）的基础上：添加一个re-check network用于预测轨迹在当前帧的位置，具体来说，（transductive detection module）比较上一帧的特征嵌入E和当前帧的特征F的相似性，得到特征响应图，保留最大响应（类似于nms），（refinement module）去除已消失目标在transductive模块造成的错误预测，得到最终的预测响应图Mp，Mp代表是前景的概率，与检测器生成的原始bbox结合，得到“假背景”检测Dtrans，与检测器的Dbase相加得到最终检测结果。

同时，为了减少图像四周（只露出一部分的人）的漏检，将回归机制修改为边界感知回归（BAR），能够根据可见部分预测对象的不可见部分。

总结：同一个作者对CSTrack的改进，是一个即插即用模块

3） 2023年 CVPR Tracking Multiple Deformable Objects in Egocentric Videos

网络结构：

MDN和PAN：

论文地址：https://openaccess.thecvf.com/content/CVPR2023/papers/Huang_Tracking_Multiple_Deformable_Objects_in_Egocentric_Videos_CVPR_2023_paper.pdf

代码地址：https://mingzhenhuang.com/projects/detracker.html

创新点：1）可穿戴相机拍摄的狗的存在形变数据集；1）DETracker：联合检测跟踪运动相机的可行变目标

为什么：针对强相机移动（穿戴式相机）和物体形变

怎么做：DETracker：三个部分，MDN、PMN、PAN。1）MDN：用于估计运动光流，为了处理以自我为中心的视频中常见的大相机运动，将成本体积搜索范围扩展到整个帧像素；2）PAN：将目标分块，然后每块分别在下一帧搜索关联目标，最后整合成一个bbox，做到联合检测跟踪，包含注意力思想；3）PMN：将匹配成功的和不匹配的块的外观信息保留到一个缓存区，其中不匹配的用来以后对形变进行关联

总结：分块和保存缓冲的思想很有意思，用CenterNet检测器初始化新目标

2.3 其他方法

1） 2022年 Decode-MOT: How Can We Hurdle Frames to Go Beyond Tracking-by-Detection?

网络结构：

自监督跟踪上下文学习流程：

论文地址：Decode-MOT: How Can We Hurdle Frames to Go Beyond Tracking-by-Detection? | IEEE Journals & Magazine | IEEE Xplore

代码地址：https://github.com/reussite-cv/Decode-MOT

创新点：在线MOT期间自动选择使用TBD还是TBM（tracking by motion）的决策器Decode-MOT

为什么：TBM速度快，TBD精度高，为了平衡精度，交替使用TBM和TBD

怎么做：1）场景上下文学习的长期注意力：使用长短期注意力的场景上下文学习，以在连续帧之间生成更具辨别力的特征；2）决策器Decode-MOT：使用最近一次TBD帧和当前帧的不相似性及注意力机制，决策出当前帧是使用TBM还是TBD；3）分层置信度关联策略：（在bytetrack的基础上）添加了轨迹置信度的二次关联，一共三层：D(high)+T(high)，D(high)+T(high+low)，D(high+low)+T(high+low)；4）自监督学习：基于跟踪基数和运动上下文相似性（IOU），相似性低，则生成TBD伪标签，相似性高则TBM伪标签。

总结：TBM的方法适合固定相机场景，因此TBM+TBD的也比较适合相机运动不大的场景。可以和知识蒸馏、多孔金字塔池化、多头注意力模块结合。

2）2023年 CVPR Referring Multi-Object Tracking

网络结构：

早期融合模块：

论文地址：https://openaccess.thecvf.com/content/CVPR2023/papers/Wu_Referring_Multi-Object_Tracking_CVPR_2023_paper.pdf

代码地址：https://github.com/wudongming97/RMOT

创新点：一个语言expression+视频的多目标跟踪数据集refer-KITTI；及对应的网络TransRMOT

为什么：目前RMOT的基准存在问题：1）一个表达式难以描述多目标；2）一个表达式难以描述目标的短期状态（时间差异）

怎么做：数据集：1）标注成本低：鼠标点两下；2）目标灵活：expression描述多个物体；3）高时间动态性：expression描述的时间长短不一。

网络：基于DETR，包含特征提取器、跨模态编码器、解码器、refer头。1）跨模态编码器：包含早期融合模块用于降低计算，早期融合模块针对图像特征和语句特征进行注意力机制。2）编码器：以当前帧的检测查询（用于预测新目标）和上一帧的跟踪查询（已存在的目标）作为输入，得到可以作为下一帧解码器输入的跟踪信息（？）。3）头：头输出类别、框、referent score，referent score指目标符合expression的可能性。

总结：自然语言处理+视频MOT，更关注语句描述的目标，Transformer结构，还能加载各种传统MOT方法上（如bytetrack、fairmot）

3）2023年 Follow Anything: Open-set detection, tracking, and following in real-time

论文地址：[2308.05737] Follow Anything: Open-set detection, tracking, and following in real-time (arxiv.org)

代码地址：alaamaalouf/FollowAnything (github.com)

创新点：1）一种开放式多模式方法，用于实时检测、分割、跟踪和跟踪任何对象。可以通过输入文本提示、图像、边界框或点击来指定感兴趣的对象。2）可部署到机器人上。3）重新检测机制。

怎么做：流程：分割—区域特征计算+匹配—跟踪

使用SAM分割图像，形成多个区域对应的seg mask；使用DINO提取图像的像素特征（逐像素提取），聚合seg mask对应的区域特征，将聚合区域特征与目标特征作像素相似度计算（类似ReID特征匹配），匹配成功的用SiamMask做跟踪。
目标可以通过点击图像、提供文本描述、手动画bbox、提供其他检测器得到的bbox 获取，即文中的查询q，可以提供多个目标。
如果使用文本信息，则将DINO替换为CLIP（这里超出我的知识面了）
重新检测机制：1）用户查找（需要人来交互）；2）等待目标重新出现然后分割关联；3）主动搜寻：在目标的周围区域（seg mask分割出来的或者是跟踪器选定的可能区域）计算区域特征并与目标特征计算相似度，特征会以均值的方式存储

总结：FPS=9左右，提出了一系列用于提高速度的分割和VIT优化技巧，使用分割获取检测，其他思想和多目标跟踪常规方法思路一致

3 联合检测跟踪（joint tracking and detection）

网络结构：

论文地址：

代码地址：

创新点：

为什么：

怎么做：

总结：

问题：

Ultralytics YOLO 库介绍与使用指南东北豆子哥人工智能/机器学习 YOLO
文章目录UltralyticsYOLO库介绍与使用指南主要特点安装基本使用1.使用预训练模型进行推理2.训练自定义模型3.验证模型4.导出模型高级功能1.使用不同任务模型2.使用自定义数据集3.跟踪对象(结合ByteTrack)常见问题解决性能优化技巧UltralyticsYOLO库介绍与使用指南UltralyticsYOLO是一个流行的计算机视觉库，专注于实现和优化YOLO(YouOnlyLoo
KITTI数据集可视化实用教程及源码解析国营窝窝乡蛮大人
本文还有配套的精品资源，点击获取简介：本文详细介绍如何使用源码实现KITTI数据集的可视化，强调数据集可视化在计算机视觉领域的关键作用。重点介绍如何加载、处理和融合KITTI数据集中的图像和激光雷达数据，并通过可视化手段分析结果，包括图像点云投影、坐标转换、颜色映射等技术。读者将通过学习源码深入理解数据结构、文件格式，并定制化工具以满足特定项目需求。1.计算机视觉数据集可视化的重要性在计算机视觉领
DiNA：扩张邻域注意力 Transformer AI专题精讲 Paper阅读 transformer 人工智能
摘要Transformer正迅速成为跨模态、跨领域和跨任务中应用最广泛的深度学习架构之一。在计算机视觉领域，除了持续发展的纯transformer架构，分层transformer也因其优越的性能和在现有框架中易于集成而受到广泛关注。这类模型通常采用局部化的注意力机制，如滑动窗口的NeighborhoodAttention（NA）或SwinTransformer的ShiftedWindowSelfA
使用SQL-Ollama与自然语言交互SQL数据库的指南 antja_ 数据库 sql
#使用SQL-Ollama与自然语言交互SQL数据库的指南##技术背景介绍随着人工智能技术的发展，能够使用自然语言与SQL数据库交互的需求越来越大。这种技术可以帮助用户轻松访问和操作数据库，而无需深刻理解SQL语法。SQL-Ollama是一个专门设计的模板，利用Zephyr-7b模型，通过Ollama在本地运行推理，使这一过程变得简单而高效。##核心原理解析SQL-Ollama通过将自然语言转换为
文心大模型4.5及X1重磅上线，真实测评
2025年3月16日，人工智能领域迎来一场重要盛事——百度文心大模型4.5如期正式发布。与此同时，百度还惊喜推出了另一款全新模型——文心大模型X1。目前，文心大模型4.5和X1已在文心一言官网（https://yiyan.baidu.com/）正式上线，并免费向用户开放。其中，文心大模型4.5面向企业用户和开发者，用户可以通过登录百度智能云千帆大模型平台，轻松调用文心大模型4.5的API接口，快速
人工智能-基础篇-10-什么是卷积神经网络CNN（网格状数据处理：输入层，卷积层，激活函数，池化层，全连接层，输出层等） weisian151 人工智能人工智能 cnn 神经网络
卷积神经网络（ConvolutionalNeuralNetwork,CNN）是一种专为处理网格状数据（如图像、视频、音频）设计的深度学习模型。它通过模拟生物视觉机制，从原始数据中自动提取多层次的特征，最终实现高效的分类、检测或生成任务。1、核心概念与原理1、生物视觉启发局部感受野：模仿人类视觉皮层神经元仅响应局部区域刺激的特性，每个神经元关注输入数据的局部区域（如图像的一小块区域）。权值共享：同一
python系列教程246——多态人工智能AI技术 python系列教程 python 开发语言
朋友们，如需转载请标明出处：https://blog.csdn.net/jiangjunshow声明：在人工智能技术教学期间，不少学生向我提一些python相关的问题，所以为了让同学们掌握更多扩展知识更好地理解AI技术，我让助理负责分享这套python系列教程，希望能帮到大家！由于这套python教程不是由我所写（有时候有空也会参与编写），所以不如我的人工智能教程风趣幽默，学起来比较枯燥；但它的知
Python 解析 AI 在能源管理与智能电网中的应用头发在线失联 python 人工智能开发语言
```htmlPython解析AI在能源管理与智能电网中的应用Python解析AI在能源管理与智能电网中的应用随着全球对可持续发展的重视和能源需求的不断增长，能源管理与智能电网技术正在成为研究和实践的重要领域。在这个背景下，人工智能（AI）作为一项前沿技术，正被广泛应用于能源管理与智能电网中，以提高效率、优化资源分配并减少环境影响。本文将探讨Python如何在这一领域中发挥作用，并解析其具体应用场
如何实现聊天模型响应流式处理 yunwu12777 langchain
在现代人工智能应用中，流式处理聊天模型的响应成为一种常见需求，特别是在需要实时输出或大规模处理时。本文将详细介绍如何在Python中实现聊天模型的同步和异步流式处理，使用langchain库中提供的ChatAnthropic模型作为示例。技术背景介绍流式处理是指从模型逐步获取输出，而不是等待整个输出完成。这对于处理长文本生成或需要动态响应的应用场景特别有用。langchain库中的聊天模型实现了R
AI人工智能助力空间智能领域提升运营效率 AI智能探索者 AI Agent 智能体开发实战人工智能网络 ai
AI人工智能助力空间智能领域提升运营效率关键词：AI人工智能、空间智能领域、运营效率、智能算法、数据驱动摘要：本文聚焦于AI人工智能在空间智能领域的应用，旨在探讨其如何助力该领域提升运营效率。首先介绍了空间智能领域的背景和相关概念，阐述了AI在其中的核心作用和原理。接着详细讲解了相关核心算法，并结合数学模型进行分析。通过项目实战案例展示了AI在空间智能领域的具体应用和实现方式。同时探讨了实际应用场
人工智能的发展历程与未来展望唐骁虎 ai
人工智能的发展历程与未来展望一、人工智能的起源与早期发展1.1人工智能的定义与概念起源人工智能（AI）的定义与概念起源可追溯至20世纪中叶，当时一群具有远见的科学家和工程师开始探索机器是否能够模拟人类智能行为。1956年，在达特茅斯会议上，约翰·麦卡锡首次提出了“人工智能”这一术语，标志着该领域的正式诞生。AI的定义涉及创建能够执行需要人类智能的任务的机器，如视觉感知、语音识别、决策和语言翻译等。
DeepSeek：AI驱动的效率革命与实战案例解 weixin_45788582 人工智能 ai DeepSeek
在人工智能技术的浪潮中，DeepSeek作为一款专注实现AGI（通用人工智能）的先锋工具，正通过其强大的自然语言处理（NLP）与分布式计算能力，重新定义高效办公的边界。以下通过技术解析与实战案例，展现DeepSeek如何赋能个人与企业，开启职场效率革命。一、技术革新：DeepSeek的核心竞争力深度学习赋能DeepSeek的技术架构基于BERT、Transformer等先进深度学习模型，通过构建复
如何让人工智能使你的工作效率一日千里南风过闲庭人工智能 ai python
1.自动化重复性任务1.1识别并自动化日常任务提高工作效率的首要步骤是识别日常工作中重复性高且耗时的任务。根据麦肯锡全球研究院的报告，知识工作者大约有40%的时间花费在此类任务上。通过自动化这些任务，员工可以将更多时间投入到需要创造性思维和复杂决策的工作上。数据支持：一项针对500名知识工作者的调查显示，通过自动化日常任务，平均每天可以节省2小时的工作时间。这些任务包括数据录入、文件整理、邮件分类
AI驱动的智能电网:平衡供需提高效率 AI智能应用 AI大模型应用入门实战与进阶 java python javascript kotlin golang 架构人工智能
智能电网，AI，机器学习，预测模型，优化算法，供需平衡，能源效率1.背景介绍随着全球能源需求的不断增长和可再生能源的快速发展，传统电网面临着越来越多的挑战。传统的电网结构是集中式供电，难以适应分布式能源的接入和负荷需求的波动性。智能电网应运而生，它利用先进的通信技术、传感器网络和数据分析技术，实现电网的自动化、智能化和可视化，从而提高电网的可靠性、效率和安全性。人工智能（AI）作为一种新兴技术，在
RoomGPT: 人工智能驱动的室内设计革命 m0_56734068 人工智能
RoomGPT:用AI重新定义室内设计在当今数字化时代,人工智能正在改变各个行业的面貌,室内设计领域也不例外。RoomGPT作为一款革命性的AI驱动室内设计工具,正在彻底改变人们对室内空间进行创意和改造的方式。本文将深入探讨RoomGPT的工作原理、使用方法以及它为室内设计行业带来的变革。RoomGPT简介RoomGPT是一个开源项目,由GitHub用户Nutlope开发。它允许用户上传任何房间的
AI 技术&AI开发框架 34号树洞人工智能深度学习人工智能机器学习 NLP GAI
目录一、AI技术及其开发框架1.AI技术分类与代表方向2.主流AI开发框架3.AI应用开发流程简述4.补充：基础依赖与生态二、AI技术方向1.机器学习（MachineLearning,ML）✦核心概念：✦关键方法：✦应用案例：2.深度学习（DeepLearning,DL）✦核心概念：✦网络结构举例：✦技术趋势：3.自然语言处理（NLP）✦核心任务：✦代表模型：4.计算机视觉（ComputerVis
MCP如何助力智能交通系统？从数据融合到精准决策 Echo_Wish Python 进阶 python 开发语言
MCP如何助力智能交通系统？从数据融合到精准决策近年来，智能交通系统（ITS）正在全球范围内快速发展，它结合人工智能（AI）、物联网（IoT）和数据分析，致力于提高交通效率、减少拥堵、增强安全性。而MCP（Multi-ConstraintPathfinding，多约束路径寻优）技术作为一种复杂路径优化算法，在智能交通系统中扮演着重要角色，尤其是在导航优化、公共交通调度、应急响应等场景。今天，我们就
AI如何提升个性化广告精准度——让投放更智能、更懂用户 Echo_Wish 前沿技术人工智能人工智能
AI如何提升个性化广告精准度——让投放更智能、更懂用户随着人工智能（AI）技术的发展，个性化广告已经从粗暴推送演变为智能匹配，广告主再也不想把预算砸给不感兴趣的人，而是精准触达有购买意向的用户。AI在广告投放中的核心优势在于深度数据分析、智能推荐、实时优化，让广告投放更精准、更有效。今天，我们就来聊聊AI如何提升个性化广告的精准度，并用Python代码演示其中的关键技术。1.为什么传统广告投放越来
NeRF-Pytorch：NeRF神经辐射场复现——Pytorch版全流程分析与测试【Ubuntu20.04】【2025最新版！！！】那就举个栗子！三维重建计算机视觉人工智能
一、引言在计算机视觉和计算机图形学的交叉领域中，视图合成（ViewSynthesis）一直是一个充满挑战的研究方向。传统的三维重建方法往往需要复杂的几何建模和纹理映射过程，而且在处理复杂光照和材质时效果有限。2020年，来自UCBerkeley的研究团队提出了NeuralRadianceFields（NeRF），这一革命性的方法彻底改变了我们对三维场景表示和渲染的理解。NeRF的核心思想是将三维场
道可云人工智能每日资讯｜江苏首个机器人训练中心在苏州吴江启动道可云道可云人工智能人工智能机器人 ar DeepSeek xr 百度
道可云人工智能&元宇宙每日简报（2025年6月26日）讯，今日人工智能&元宇宙新鲜事有：江苏首个机器人训练中心在苏州吴江启动近日，长三角一体化示范区智能机器人训练中心在东太湖度假区（太湖新城）正式启用，成为江苏省首个机器人智能训练中心。该中心占地1500平方米，设有8个训练场景和30个生产工位，涵盖智能制造、商业服务、特种应用三大领域，年产数据可超200万条，旨在加速机器人从实验室走向真实产业场景
道可云人工智能每日资讯｜《辽宁省促进人工智能创新发展实施方案》发布道可云道可云人工智能人工智能 ar DeepSeek xr
道可云人工智能&元宇宙每日简报（2025年6月13日）讯，今日人工智能&元宇宙新鲜事有：《辽宁省促进人工智能创新发展实施方案》发布近日，辽宁省人民政府办公厅印发《辽宁省促进人工智能创新发展实施方案》。根据《实施方案》可知，到2027年，实现以沈阳、大连“双核”牵引辐射带动，各地协同共进，千行百业深度赋能，打造人工智能创新发展和融合应用的新高地。人工智能赋能可持续发展论坛于成都市天府国际会议中心举办
Java AI 新纪元：Spring AI 与 Spring AI Alibaba 的崛起小沛9 Spring AI Alibaba Spring AI java 人工智能 spring spring ai SAA
此章节没什么营养，只是一个描述，同时也能看到AI的能力（文章基本都是AI进行生成的），小沛觉得开始不写点引言好像差了点什么东西，好像鱼离开了自行车。引言：AI时代对Java开发者的机遇与挑战，Java在AI领域的现状在当今技术飞速发展的时代，人工智能（AI）已不再是遥不可及的未来概念，而是深刻地融入到我们生活的方方面面，从智能推荐系统到自动驾驶，从自然语言处理到计算机视觉，AI正以前所未有的速度改
统一认证、限流、Mock 一网打尽！用 APISIX/Kong 让低代码平台更清爽网罗开发实战源码前端 kong 低代码
网罗开发（小红书、快手、视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者：《ESP32-C3物联网工程开发实战》图书作者：《SwiftUI入门，进阶与实战》超级个体：CO
生成式AI技术对未来知识生产模式的颠覆性影响：跨学科案例分析德宿人工智能
引言随着人工智能技术的迅猛发展，生成式AI作为一种革命性技术正在深刻地改变人类知识生产和学术研究的范式。生成式AI不仅能够创建原创内容，还能模拟人类思维过程，处理和生成大量数据，从而在各个学科领域展现出广阔的应用前景。本研究报告旨在深入探讨生成式AI技术对未来知识生产模式的颠覆性影响，通过对比传统学术研究与AI辅助研究的范式差异，并选取医学、法学、文学、经济学和艺术学等五个典型领域进行深度案例分析
ChatGPT驱动的跨学科研究灵感挖掘指南学境思源AcademicIdeas 学境思源 AI写作 ChatGPT chatgpt
跨学科研究已成为解决复杂问题的重要手段。学境思源，无论是人工智能与心理学的结合，一键生成论文初稿！还是生态学与经济学的融合，越来越多的研究者正试图打破学科界限，探索全新问题域。但问题是：acaids.com。我们如何高效发现这些跨学科交叉点？使用传统方式，像文献综述、领域专家访谈或大型头脑风暴虽有效，但耗时，且受限于已有认知。今天为大家分享一种高效、智能、可复制的方法——利用ChatGPT进行跨学
大模型本地部署，拥有属于自己的ChatGpt 小妖同学学AI chatgpt
ChatGpt以其强大的信息整合和对话能力惊艳了全球，在自然语言处理上面表现出了惊人的能力。不管用于文案撰写还是程序辅助开发都大大提高了我们的工作效率，但是其使用有一定的门槛，让我们大多数人都望而却步，今天我们利用ollama实现本地大模型的步骤，让我们轻松拥有自己的人工智能。Ollama作为一个轻量级的工具，可以帮助用户在本地运行这些大型语言模型，无需持续依赖云服务，既保护了数据隐私，又能减少网
PPT 要你好看（全彩）又是一个装逼的
分享一下我老师大神的人工智能教程！零基础，通俗易懂！http://blog.csdn.net/jiangjunshow也欢迎大家转载本篇文章。分享知识，造福人民，实现我们中华民族伟大复兴！PPT,要你好看（全彩）杨臻编著ISBN978-7-121-14725-82011年11月出版定价：49.90元16开264页宣传语：般若黑洞▪百万点击之升华16位知名PPT高手联袂热议内容简介此刻呈现在你面前的
Spring AI 结合 MCP MySQL 实现对话式数据库查询没刮胡子软件开发技术实战专栏人工智能AI Spring 数据库 spring 人工智能 spring-ai mcp-server mysql
在现代应用开发中，将人工智能与数据库查询结合可以创造更自然、更智能的用户交互方式。下面我将详细介绍如何使用SpringAI框架结合MCP（可能指MySQL连接池或相关组件）实现对话中的数据库查询功能。什么是SpringAI和MCPMySQLSpringAI框架概述SpringAI是基于Spring生态的人工智能集成框架，它提供了：与大型语言模型(LLM)的集成能力对话管理和自然语言处理功能业务逻辑
MiniMax - M1：开源大模型的革命性突破
开源大模型MiniMax-M1研究报告一、引言在人工智能技术飞速发展的当下，大模型领域的竞争愈发激烈。开源大模型以其开放性、可定制性和社区协作的优势，逐渐成为推动人工智能技术进步的重要力量。MiniMax-M1作为全球首个开源大规模混合架构的推理模型，一经发布便引起了广泛关注。它在长上下文处理、推理效率和成本控制等方面展现出了卓越的性能，为人工智能的发展带来了新的思路和方向。本文将对MiniMax
车牌识别与标注：基于百度OCR与OpenCV的实现（一）喜欢踢足球的老罗大模型应用开发实践之旅 ocr opencv 人工智能
车牌识别与标注：基于百度OCR与OpenCV的实现在计算机视觉领域，车牌识别是一项极具实用价值的技术，广泛应用于交通监控、智能停车场管理等领域。本文将介绍如何在macOS系统下，利用百度OCRAPI进行车牌识别，并结合OpenCV库在图片上绘制标注框和车牌号码，实现一个完整的车牌识别与标注流程。整个工程将使用PyCharm进行组织和开发。一、系统环境与工程结构系统环境操作系统：macOS开发工具：
java短路运算符和逻辑运算符的区别 3213213333332132 java基础
/* * 逻辑运算符——不论是什么条件都要执行左右两边代码 * 短路运算符——我认为在底层就是利用物理电路的“并联”和“串联”实现的 * 原理很简单，并联电路代表短路或（||），串联电路代表短路与（&&）。 * * 并联电路两个开关只要有一个开关闭合，电路就会通。 * 类似于短路或（||），只要有其中一个为true（开关闭合）是
Java异常那些不得不说的事白糖_ java exception
一、在finally块中做数据回收操作比如数据库连接都是很宝贵的，所以最好在finally中关闭连接。 JDBCAgent jdbc = new JDBCAgent(); try{ jdbc.excute("select * from ctp_log"); }catch(SQLException e){ ... }finally{ jdbc.close();
utf-8与utf-8(无BOM)的区别 dcj3sjt126com PHP
BOM——Byte Order Mark，就是字节序标记在UCS 编码中有一个叫做"ZERO WIDTH NO-BREAK SPACE"的字符，它的编码是FEFF。而FFFE在UCS中是不存在的字符，所以不应该出现在实际传输中。UCS规范建议我们在传输字节流前，先传输字符"ZERO WIDTH NO-BREAK SPACE"。这样如
JAVA Annotation之定义篇周凡杨 java 注解 annotation 入门注释
Annotation: 译为注释或注解 An annotation, in the Java computer programming language, is a form of syntactic metadata that can be added to Java source code. Classes, methods, variables, pa
tomcat的多域名、虚拟主机配置 g21121 tomcat
众所周知apache可以配置多域名和虚拟主机，而且配置起来比较简单，但是项目用到的是tomcat，配来配去总是不成功。查了些资料才总算可以，下面就跟大家分享下经验。很多朋友搜索的内容基本是告诉我们这么配置：在Engine标签下增面积Host标签，如下： <Host name="www.site1.com" appBase="webapps"
Linux SSH 错误解析（Capistrano 的cap 访问错误 Permission ） 510888780 linux capistrano
1.ssh -v [email protected] 出现 Permission denied (publickey,gssapi-keyex,gssapi-with-mic,password). 错误运行状况如下： OpenSSH_5.3p1, OpenSSL 1.0.1e-fips 11 Feb 2013 debug1: Reading configuratio
log4j的用法 Harry642 java log4j
一、前言： log4j 是一个开放源码项目，是广泛使用的以Java编写的日志记录包。由于log4j出色的表现，当时在log4j完成时，log4j开发组织曾建议sun在jdk1.4中用log4j取代jdk1.4 的日志工具类，但当时jdk1.4已接近完成，所以sun拒绝使用log4j，当在java开发中
mysql、sqlserver、oracle分页，java分页统一接口实现 aijuans oracle jave
定义：pageStart 起始页，pageEnd 终止页,pageSize页面容量 oracle分页：　　　　select * from ( select mytable.*,rownum num from (实际传的SQL) where rownum<=pageEnd) where num>=pageStart sqlServer分页：
Hessian 简单例子 antlove java Web service hessian
hello.hessian.MyCar.java package hessian.pojo; import java.io.Serializable; public class MyCar implements Serializable { private static final long serialVersionUID = 473690540190845543
数据库对象的同义词和序列百合不是茶 sql 序列同义词 ORACLE权限
回顾简单的数据库权限等命令; 解锁用户和锁定用户 alter user scott account lock/unlock; //system下查看系统中的用户 select * dba_users; //创建用户名和密码 create user wj identified by wj; identified by //授予连接权和建表权 grant connect to
使用Powermock和mockito测试静态方法 bijian1013 持续集成单元测试 mockito Powermock
实例： package com.bijian.study; import static org.junit.Assert.assertEquals; import java.io.IOException; import org.junit.Before; import org.junit.Test; import or
精通Oracle10编程SQL(6)访问ORACLE bijian1013 oracle 数据库 plsql
/* *访问ORACLE */ --检索单行数据 --使用标量变量接收数据 DECLARE v_ename emp.ename%TYPE; v_sal emp.sal%TYPE; BEGIN select ename,sal into v_ename,v_sal from emp where empno=&no; dbms_output.pu
【Nginx四】Nginx作为HTTP负载均衡服务器 bit1129 nginx
Nginx的另一个常用的功能是作为负载均衡服务器。一个典型的web应用系统，通过负载均衡服务器，可以使得应用有多台后端服务器来响应客户端的请求。一个应用配置多台后端服务器，可以带来很多好处：负载均衡的好处增加可用资源增加吞吐量加快响应速度，降低延时出错的重试验机制 Nginx主要支持三种均衡算法： round-robin l
jquery-validation备忘白糖_ jquery css F#Firebug
留点学习jquery validation总结的代码： function checkForm(){ validator = $("#commentForm").validate({// #formId为需要进行验证的表单ID errorElement :"span",// 使用"div"标签标记错误，默认:&
solr限制admin界面访问（端口限制和http授权限制） ronin47 限定Ip访问
solr的管理界面可以帮助我们做很多事情，但是把solr程序放到公网之后就要限制对admin的访问了。可以通过tomcat的http基本授权来做限制，也可以通过iptables防火墙来限制。我们先看如何通过tomcat配置http授权限制。第一步：在tomcat的conf/tomcat-users.xml文件中添加管理用户，比如： <userusername="ad
多线程-用JAVA写一个多线程程序，写四个线程，其中二个对一个变量加1，另外二个对一个变量减1 bylijinnan java 多线程
public class IncDecThread { private int j=10; /* * 题目:用JAVA写一个多线程程序，写四个线程，其中二个对一个变量加1，另外二个对一个变量减1 * 两个问题： * 1、线程同步--synchronized * 2、线程之间如何共享同一个j变量--内部类 */ public static
买房历程 cfyme
2015-06-21: 万科未来城，看房子 2015-06-26: 办理贷款手续，贷款73万，贷款利率5.65=5.3675 2015-06-27: 房子首付,签完合同 2015-06-28，央行宣布降息 0.25，就2天的时间差啊，没赶上。首付，老婆找他的小姐妹接了5万，另外几个朋友借了1-
[军事与科技]制造大型太空战舰的前奏 comsci 制造
天气热了........空调和电扇要准备好.......... 最近,世界形势日趋复杂化,战争的阴影开始覆盖全世界.......... 所以,我们不得不关
dateformat dai_lm DateFormat
"Symbol Meaning Presentation Ex." "------ ------- ------------ ----" "G era designator (Text) AD" "y year
Hadoop如何实现关联计算 datamachine mapreduce hadoop 关联计算
选择Hadoop，低成本和高扩展性是主要原因，但但它的开发效率实在无法让人满意。以关联计算为例。假设：HDFS上有2个文件，分别是客户信息和订单信息，customerID是它们之间的关联字段。如何进行关联计算，以便将客户名称添加到订单列表中？ &nbs
用户模型中修改用户信息时，密码是如何处理的 dcj3sjt126com yii
当我添加或修改用户记录的时候对于处理确认密码我遇到了一些麻烦，所有我想分享一下我是怎么处理的。场景是使用的基本的那些(系统自带)，你需要有一个数据表(user)并且表中有一个密码字段(password),它使用 sha1、md5或其他加密方式加密用户密码。面是它的工作流程: 当创建用户的时候密码需要加密并且保存，但当修改用户记录时如果使用同样的场景我们最终就会把用户加密过的密码再次加密，这
中文 iOS/Mac 开发博客列表 dcj3sjt126com Blog
本博客列表会不断更新维护，如果有推荐的博客，请到此处提交博客信息。本博客列表涉及的文章内容支持定制化Google搜索，特别感谢 JeOam 提供并帮助更新。本博客列表也提供同步更新的OPML文件（下载OPML文件），可供导入到例如feedly等第三方定阅工具中，特别感谢 lcepy 提供自动转换脚本。这里有导入教程。
js去除空格，去除左右两端的空格蕃薯耀去除左右两端的空格 js去掉所有空格 js去除空格
js去除空格，去除左右两端的空格 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>&g
SpringMVC4零配置--web.xml hanqunfeng springmvc4
servlet3.0+规范后，允许servlet，filter，listener不必声明在web.xml中，而是以硬编码的方式存在，实现容器的零配置。 ServletContainerInitializer：启动容器时负责加载相关配置 package javax.servlet; import java.util.Set; public interface ServletContainer
《开源框架那些事儿21》：巧借力与借巧力 j2eetop 框架 UI
同样做前端UI，为什么有人花了一点力气，就可以做好？而有的人费尽全力，仍然错误百出？我们可以先看看几个故事。故事1：巧借力，乌鸦也可以吃核桃有一个盛产核桃的村子，每年秋末冬初，成群的乌鸦总会来到这里，到果园里捡拾那些被果农们遗落的核桃。核桃仁虽然美味，但是外壳那么坚硬，乌鸦怎么才能吃到呢？原来乌鸦先把核桃叼起，然后飞到高高的树枝上，再将核桃摔下去，核桃落到坚硬的地面上，被撞破了，于是，
JQuery EasyUI 验证扩展可怜的猫 jquery easyui 验证
最近项目中用到了前端框架-- EasyUI，在做校验的时候会涉及到很多需要自定义的内容，现把常用的验证方式总结出来，留待后用。以下内容只需要在公用js中添加即可。使用类似于如下： <input class="easyui-textbox" name="mobile" id="mobile&
架构师之httpurlconnection----------读取和发送(流读取效率通用类) nannan408
1.前言. 如题. 2.代码. /* * Copyright (c) 2015, S.F. Express Inc. All rights reserved. */ package com.test.test.test.send; import java.io.IOException; import java.io.InputStream
Jquery性能优化 r361251 JavaScript jquery
一、注意定义jQuery变量的时候添加var关键字这个不仅仅是jQuery，所有javascript开发过程中，都需要注意，请一定不要定义成如下： $loading = $('#loading'); //这个是全局定义，不知道哪里位置倒霉引用了相同的变量名，就会郁闷至死的二、请使用一个var来定义变量如果你使用多个变量的话，请如下方式定义： . 代码如下: var page
在eclipse项目中使用maven管理依赖 tjj006 eclipse maven
概览: 如何导入maven项目至eclipse中建立自有Maven Java类库服务器建立符合maven代码库标准的自定义类库 Maven在管理Java类库方面有巨大的优势，像白衣所说就是非常“环保”。我们平时用IDE开发都是把所需要的类库一股脑的全丢到项目目录下，然后全部添加到ide的构建路径中，如果用了SVN/CVS，这样会很容易就把
中国天气网省市级联页面 x125858805 级联
1、页面及级联js <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"> &l

多目标跟踪MOT论文阅读记录2（持续更新中...）

以下内容都是个人理解，有不当的地方烦请批评指正。

1 综述

2 检测后跟踪 （tracking by detection）

2.1 Separate Detection and Embedding (SDE)

1） 2022年 MotionTrack: rethinking the motion cue for multiple object tracking in USV videos

2） 2022年CVPR Observation-Centric SORT: Rethinking SORT for Robust Multi-Object Tracking

3） 2022年CVPR MotionTrack: Learning Robust Short-term and Long-term Motions for Multi-Object Tracking

4） 2023年 DEEP OC-SORT: MULTI-PEDESTRIAN TRACKING BY ADAPTIVE REIDENTIFICATION

5） 2023年 CVPR Simple Cues Lead to a Strong Multi-Object Tracker

2.2 Joint Detection and Embedding (JDE)

1） 2020年 Rethinking the Competition Between Detection and ReID in Multiobject Tracking

2） 2021年 One More Check: Making “Fake Background” Be Tracked Again

3） 2023年 CVPR Tracking Multiple Deformable Objects in Egocentric Videos

2.3 其他方法

1） 2022年 Decode-MOT: How Can We Hurdle Frames to Go Beyond Tracking-by-Detection?

2）2023年 CVPR Referring Multi-Object Tracking

3）2023年 Follow Anything: Open-set detection, tracking, and following in real-time

3 联合检测跟踪 （joint tracking and detection）

你可能感兴趣的:(计算机视觉,人工智能)

2 检测后跟踪（tracking by detection）

3 联合检测跟踪（joint tracking and detection）