旅途中的宽~

【计算机视觉 | 目标检测 | 图像分割】arxiv 计算机视觉关于目标检测和图像分割的学术速递（7 月 14 日论文合集）

文章目录

一、检测相关(6篇)
- 1.1 LVLane: Deep Learning for Lane Detection and Classification in Challenging Conditions
- 1.2 Garbage in, garbage out: Zero-shot detection of crime using Large Language Models
- 1.3 Robotic surface exploration with vision and tactile sensing for cracks detection and characterisation
- 1.4 Multimodal Object Detection in Remote Sensing
- 1.5 Weakly supervised marine animal detection from remote sensing images using vector-quantized variational autoencoder
- 1.6 Automated Deception Detection from Videos: Using End-to-End Learning Based High-Level Features and Classification Approaches
二、分割|语义相关(4篇)
- 2.1 RVD: A Handheld Device-Based Fundus Video Dataset for Retinal Vessel Segmentation
- 2.2 Multi-objective Evolutionary Search of Variable-length Composite Semantic Perturbations
- 2.3 Full-resolution Lung Nodule Segmentation from Chest X-ray Images using Residual Encoder-Decoder Networks
- 2.4 Deep learning-based Segmentation of Rabbit fetal skull with limited and sub-optimal annotations

一、检测相关(6篇)

1.1 LVLane: Deep Learning for Lane Detection and Classification in Challenging Conditions

LVLane：挑战条件下车道检测和分类的深度学习

https://arxiv.org/abs/2307.06853

车道检测在自动驾驶汽车和先进辅助驾驶系统（ADAS）领域起着举足轻重的作用。多年来，出现了许多算法，从基本的图像处理技术到复杂的深度神经网络。基于深度学习的模型的性能高度依赖于其训练数据的质量。因此，这些模型在遇到诸如极端照明条件、部分可见的车道标记和稀疏的车道标记（如Botts点）等具有挑战性的场景时通常会经历性能下降。为了解决这个问题，我们提出了一个基于深度学习方法的端到端车道检测和分类系统。在我们的研究中，我们引入了一个独特的数据集，精心策划，以涵盖对最先进（SOTA）模型构成重大挑战的场景。通过微调选定的模型，我们的目标是实现增强的定位精度。此外，我们提出了一个基于CNN的分类分支，与检测器无缝集成，便于识别不同的车道类型。此架构可实现明智的车道变更决策，并提供更具弹性的ADAS功能。我们还研究了使用混合精度训练和测试对不同模型和批量大小的影响。在广泛使用的TuSimple数据集，加州理工学院车道数据集和我们的LVLane数据集上进行的实验评估证明了我们的模型在具有挑战性的场景中准确检测和分类车道的有效性。我们的方法在TuSimple数据集上实现了最先进的分类结果。论文被接受后，将公布工作代码。

1.2 Garbage in, garbage out: Zero-shot detection of crime using Large Language Models

垃圾输入，垃圾输出：使用大型语言模型对犯罪进行Zero-Shot检测

https://arxiv.org/abs/2307.06844

本文提出了利用大型语言模型学习的常识知识，对监控视频的文本描述进行犯罪zero-shot推理。我们表明，当视频（手动）转换为高质量的文本描述，大型语言模型能够检测和分类犯罪与国家的最先进的性能，只使用zero-shot推理。然而，现有的自动视频到文本的方法是无法生成足够的质量，以支持推理的视频描述（垃圾视频描述到大型语言模型，垃圾）。

1.3 Robotic surface exploration with vision and tactile sensing for cracks detection and characterisation

用于裂纹检测和表征的视觉和触觉感知机器人表面探测

https://arxiv.org/abs/2307.06784

本文提出了一种新的算法，通过光纤的视觉和触觉分析的基础上裂纹定位和检测。采用基于光纤的指形传感器进行数据采集，为分析和实验收集数据。为了检测裂缝的可能位置，使用相机来扫描环境，同时运行对象检测算法。一旦检测到裂纹，就从裂纹的骨架化版本创建全连接图。最小生成树，然后用于计算最短路径，探索裂纹，然后用于开发的机器人机械手的运动规划。运动规划器将裂缝划分为多个节点，然后分别对其进行探索。然后，操纵器开始探索并执行触觉数据分类，以确认在该位置中是否确实存在裂缝，或者仅仅是视觉算法的假阳性。如果检测到裂纹，则还计算分支的长度、宽度、取向和数量。重复此操作，直到探测到裂纹的所有节点。为了验证完整的算法，执行各种实验：通过全扫描和运动规划算法对裂纹的探测进行比较，使用视觉和触觉数据的组合实现用于裂纹分类和几何分析的基于频率的特征。从实验的结果，它表明，所提出的算法是能够检测裂纹和改善的结果，从视觉，正确分类裂纹和他们的几何形状与最小的成本由于运动规划算法。

1.4 Multimodal Object Detection in Remote Sensing

遥感中的多模式目标检测

https://arxiv.org/abs/2307.06724

遥感中的目标检测是一项重要的计算机视觉任务，深度学习技术已经取得了重大进展。然而，在这一领域的大多数现有的作品集中在使用通用对象检测，并没有利用多模态数据融合的潜力。在本文中，我们提出了一个比较的方法，多模态对象检测遥感，调查可用的多模态数据集适合评估，并讨论未来的发展方向。

1.5 Weakly supervised marine animal detection from remote sensing images using vector-quantized variational autoencoder

基于矢量量化变分自动编码器的遥感图像弱监督海洋动物检测

https://arxiv.org/abs/2307.06720

本文研究了一种基于重构的海洋环境中航空图像弱监督动物检测方法。这样的方法利用直接在输入空间上计算度量的异常检测框架，与特征嵌入方法相比增强了可解释性和异常定位。基于矢量量化变分自动编码器在计算机视觉数据集异常检测中的成功，我们将其应用于海洋动物检测领域，并解决处理噪声数据的挑战。为了评估我们的方法，我们将其与现有的方法进行比较，从航空图像数据的海洋动物检测的背景下。在两个专用数据集上进行的实验表明，所提出的方法比最近的研究在文献中的优越性能。我们的框架提供了改进的解释性和本地化的异常，监测海洋生态系统和减轻人类活动对海洋动物的影响提供了宝贵的见解。

1.6 Automated Deception Detection from Videos: Using End-to-End Learning Based High-Level Features and Classification Approaches

视频中的自动欺骗检测：基于端到端学习的高层特征和分类方法

https://arxiv.org/abs/2307.06625

欺骗检测是一个跨学科的领域，吸引了来自心理学，犯罪学，计算机科学和经济学的研究人员。我们提出了一种结合深度学习和判别模型的多模态方法，用于自动欺骗检测。使用视频模式，我们采用卷积端到端学习来分析凝视，头部姿势和面部表情，与最先进的方法相比，取得了令人鼓舞的结果。由于有限的训练数据，我们还利用判别模型进行欺骗检测。虽然序列到类的方法进行了探索，判别模型优于他们，由于数据稀缺。我们的方法进行了评估五个数据集，包括一个新的滚动骰子实验的动机是经济因素。结果表明，面部表情优于凝视和头部姿势，并结合模式与特征选择提高检测性能。不同数据集表达特征的差异强调了特定场景训练数据的重要性以及上下文对欺骗行为的影响。跨数据集实验强化了这些发现。尽管低风险数据集（包括滚动骰子实验）带来了挑战，但欺骗检测性能超过了机会水平。我们提出的多模态方法和综合评估揭示了从视频模态自动化欺骗检测的潜力，为未来的研究开辟了道路。

二、分割|语义相关(4篇)

2.1 RVD: A Handheld Device-Based Fundus Video Dataset for Retinal Vessel Segmentation

RVD：一种基于手持设备的眼底视频视网膜血管分割方法

https://arxiv.org/abs/2307.06577

视网膜血管分割通常以利用台式设备收集的基于图像的数据集为基础。静态图像自然地失去视网膜波动的动态特性，导致数据集丰富性降低，并且台式设备的使用由于其有限的可访问性而进一步限制了数据集的可扩展性。考虑到这些限制，我们引入了第一个基于视频的视网膜数据集，采用手持设备进行数据采集。该数据集包括从四个不同诊所收集的635个基于智能手机的眼底视频，涉及415名50至75岁的患者。它在空间和时间维度上提供视网膜结构的全面和精确的注释，旨在推进脉管系统分割的前景。具体而言，数据集提供三个级别的空间注释：用于总体视网膜结构描绘的二元血管掩模、用于区分静脉和动脉的一般静脉-动脉掩模、以及用于进一步表征每个动脉和静脉的粒度的细粒度静脉-动脉掩模。此外，数据集提供了捕获血管脉动特性的时间注释，有助于检测需要细粒度识别血液动力学波动的眼部疾病。在应用中，我们的数据集表现出显着的域转移相对于台式设备捕获的数据，从而对现有的方法提出了很大的挑战。在实验中，我们在我们的数据集上提供了评估指标和基准结果，反映了它为血管分割任务提供的潜力和挑战。我们希望这个具有挑战性的数据集将大大有助于眼科疾病诊断和早期预防的发展。

2.2 Multi-objective Evolutionary Search of Variable-length Composite Semantic Perturbations

变长复合语义扰动的多目标进化搜索

https://arxiv.org/abs/2307.06548

深度神经网络已被证明容易受到对抗性攻击的影响，这种攻击的形式是在图像上添加特定的扰动以产生错误的输出。设计更强大的对抗性攻击方法可以帮助更可靠地评估DNN模型的鲁棒性。为了减轻港口负担并提高攻击性能，自动机器学习（AutoML）最近成为一种成功的技术，可以帮助自动找到接近最佳的对抗性攻击策略。然而，现有的关于AutoML对抗性攻击的工作仅关注基于 $L_{\infty}$ -范数的扰动。事实上，语义扰动由于其自然性和物理可实现性而受到越来越多的关注。为了弥合AutoML和语义对抗攻击之间的差距，我们提出了一种新的方法，称为可变长度复合语义扰动的多目标进化搜索（MES-VCSP）。具体而言，我们构建了变长复合语义扰动的数学模型，提供了五种基于梯度的语义攻击方法。允许多次执行攻击序列中的相同类型的扰动。此外，我们引入了多目标进化搜索NSGA-II和邻域搜索组成，以找到接近最优的变长攻击序列。在CIFAR 10和ImageNet数据集上的实验结果表明，与现有方法相比，MES-VCSP可以获得攻击成功率更高、更自然、时间开销更少的对抗性示例。

2.3 Full-resolution Lung Nodule Segmentation from Chest X-ray Images using Residual Encoder-Decoder Networks

基于残差编解码网的胸部X光图像全分辨率肺结节分割

https://arxiv.org/abs/2307.06547

肺癌是癌症死亡的主要原因，并且早期诊断与积极预后相关。胸部X射线（CXR）为肺癌诊断提供了廉价的成像模式。使用CXR难以将可疑结节与血管和骨结构区分开。计算机视觉以前曾被提出来帮助人类放射科医生完成这项任务，然而，领先的研究使用下采样图像和计算昂贵的方法，这些方法具有未经证实的泛化能力。相反，这项研究使用高效的编码器-解码器神经网络来定位肺结节，该神经网络处理全分辨率图像以避免下采样导致的任何信号丢失。编码器-解码器网络使用JSRT肺结节数据集进行训练和测试。该网络用于从独立的外部CXR数据集定位肺结节。使用自动化框架测量灵敏度和假阳性率，以消除任何观察者的主观性。这些实验允许确定用于广义肺结节定位的最佳网络深度、图像分辨率和预处理流水线。我们发现，结节定位的微妙性的影响，与更微妙的结节被检测到在早期的训练时期。因此，我们提出了一种新的自集成模型，从三个连续的时代集中的验证最佳。该集合在10倍内部测试中实现了85%的灵敏度，其中每个图像的假阳性为8。在形态学假阳性减少后，在假阳性率为6时实现了81%的灵敏度。该结果与基于线性和空间滤波的计算更复杂的系统相当，但具有比其他方法更快的亚秒级推理时间。所提出的算法取得了良好的泛化效果对外部数据集的灵敏度为77%，在7.6的假阳性率。

2.4 Deep learning-based Segmentation of Rabbit fetal skull with limited and sub-optimal annotations

基于深度学习的兔胎颅骨有限和次优标注分割

https://arxiv.org/abs/2307.06392

在本文中，我们提出了一种基于深度学习的方法来分割荷兰带兔胎儿的微CT图像中的骨骼结构，这可以帮助评估药物诱导的骨骼异常，作为发育和生殖毒理学（DART）中所需的研究。我们的策略利用来自26个micro-CT体积的22个颅骨的次优分割标签，并将它们映射到250个未标记的体积，在该体积上训练基于CNN的深度分割模型。在实验中，我们的模型能够在测试集上的所有骨骼上实现0.89的平均Dice相似系数（DSC），并且26个颅骨中的14个达到平均DSC >0.93。我们的下一步是分割整个身体，然后开发一个模型来分类异常。

2025年全球数据安全发展趋势 jinan886 人工智能大数据安全数据分析
随着云计算、大数据、人工智能等技术的迅猛发展，数据已成为驱动经济社会发展的关键生产要素。然而，数据泄露、网络攻击等安全事件频发，给个人隐私、企业利益乃至国家安全带来了前所未有的挑战。全球数据安全发展趋势正随着技术进步和威胁演变而不断变化，以下是主要趋势：1.数据隐私法规加强GDPR（欧盟《通用数据保护条例）和CCPA（加州消费者隐私法案）等法规推动了全球对数据隐私的重视，更多国家和地区正在制定或更
AI原生应用监控：实时领域偏见预警系统设计原理 Agentic AI人工智能与大数据 CSDN AI-native 人工智能 ai
AI原生应用监控：实时领域偏见预警系统设计原理关键词AI监控、算法偏见、实时预警、公平性AI、模型监控、偏见检测、AI治理摘要在人工智能驱动决策日益普及的今天，AI系统中的隐性偏见已成为影响公平性、可信度和业务连续性的关键风险。本文深入探讨了AI原生应用监控的核心挑战，重点剖析了实时领域偏见预警系统的设计原理与实现方法。通过将复杂的算法偏见比作"数字世界的隐形滤镜"，我们揭示了偏见如何在AI系统中
【软考高项论文】信息系统项目的资源管理
摘要在信息系统项目管理里，资源管理是核心要素之一，对项目的成功实施与交付意义重大。本文结合项目管理实际，深入论述对信息系统项目资源管理的认识，详细阐述在具体项目中的资源管理实践及心得体会。通过对项目资源管理基本过程的介绍、资源分解结构示例的说明，以及实际项目资源管理做法的分享，强调了有效资源管理对提升项目执行效率、降低成本和提高成功率的重要性。正文在当今数字化飞速发展的时代，信息系统项目如雨后春笋
【软考高项论文】论信息系统项目的沟通管理 _Richard_ 软考高项论文软考高项软考高级信息系统项目管理师
摘要信息系统项目的沟通管理是项目成功的关键因素之一。本文结合实际项目，阐述了对信息系统项目沟通管理的认识，包括项目沟通管理的过程、输入和输出，以及如何拟定沟通管理计划。同时，详细介绍了在项目中灵活应用沟通方法与不同干系人进行有效沟通的具体做法，并分享了心得体会。通过有效的沟通管理，能够确保信息准确传递，减少误解和冲突，提高项目执行效率和客户满意度。正文在当今数字化时代，信息系统项目日益复杂，涉及众
【软考高项论文】论信息系统项目的整体管理 _Richard_ 软考高项论文软考高项软考高级信息系统项目管理师
摘要在信息系统项目的管理中，整体管理处于核心地位，对项目全局规划与协调起着关键作用，保障项目各阶段目标一致且高效执行。本文结合作者参与的2024年6月启动的信息系统项目，深入探讨项目整体管理的过程，着重阐述整体变更管理，详细记录一个具体变更从申请到关闭的全过程。通过该项目实践，深刻体会到项目整体管理的重要性，严格的变更控制流程能确保项目面对需求变化时有序推进，保障项目成功。正文在当今数字化飞速发展
【软考高项论文】论信息系统项目的沟通管理 _Richard_ 软考高项论文软考高项软考高级信息系统项目管理师
摘要在信息系统项目的实施进程中，沟通管理的重要性不言而喻。有效的沟通不仅能保证项目信息准确传递，还能推动团队协作，提高项目整体效率。本文结合2024年6月我所参与的信息系统项目，围绕项目沟通管理的过程及项目干系人管理过程展开论述，并给出了具体的干系人管理计划。项目沟通管理涵盖规划沟通、发布信息、管理干系人期望以及报告绩效四个关键过程；项目干系人管理则涉及识别干系人、分析干系人期望、制定干系人管理计
机器学习在智能仓储中的应用：库存管理与物流优化 Blossom.118 机器学习与人工智能机器学习人工智能深度学习机器人 sklearn tensorflow cnn
最近研学过程中发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击链接跳转到网站人工智能及编程语言学习教程。读者们可以通过里面的文章详细了解一下人工智能及其编程等教程和学习方法。下面开始对正文内容的介绍。随着电子商务的蓬勃发展，仓储和物流行业面临着前所未有的挑战和机遇。智能仓储通过整合先进的信息技术，如物联网（IoT）、大数据和机器学习，能够实现从货物入库到出库的全流程
Ai工具分享(2):Vscode+Cline无限免费的使用教程
大家好，我是程序员寒山。今天给大家分享一个最新的免费使用的Ai插件Cline的方法，之前也给大家分享过一些免费的方案，但是这些都是随时在变化，之前推荐的很多都不能使用了。Ai工具分享(2):Vscode+Cline无限免费的使用教今天再给大家推荐一个，可以免费使用，且没有token限制的方法(最起码我连续高强度使用了2天，没有发现有问题)，关键是相应还非常的快。一、为什么选择Cline？作为程序员
Distinguishing Look-Alike Innocent and Vulnerable Code by Subtle Semantic Representation Learning an XLYcmy 漏洞挖掘论文阅读网络安全论文笔记漏洞检测数据集深度学习论文分享 AI
今天分享的论文是《DistinguishingLook-AlikeInnocentandVulnerableCodebySubtleSemanticRepresentationLearningandExplanation》原文链接：[2308.11237]DistinguishingLook-AlikeInnocentandVulnerableCodebySubtleSemanticReprese
行为正则化与顺序策略优化结合的离线多智能体学习算法
离线多智能体强化学习（MARL）是一个新兴领域，目标是在从预先收集的数据集中学习最佳的多智能体策略。随着人工智能技术的发展，多智能体系统在诸如自动驾驶、智能家居、机器人协作以及智能调度决策等方面展现了巨大的应用潜力。但现有的离线MARL方法也面临很多挑战，仍存在不协调行为和分布外联合动作的问题。为了应对这些挑战，中山大学计算机学院、美团履约平台技术部开展了学术合作项目，并取得了一些的成果，希望分享
利用视觉-语言模型搭建机器人灵巧操作的支架三谷秋水智能体大模型计算机视觉语言模型机器人人工智能计算机视觉机器学习
25年6月来自斯坦福和德国卡尔斯鲁厄理工的论文“ScaffoldingDexterousManipulationwithVision-LanguageModels”。灵巧机械手对于执行复杂的操作任务至关重要，但由于演示收集和高维控制的挑战，其训练仍然困难重重。虽然强化学习(RL)可以通过在模拟中积累经验来缓解数据瓶颈，但它通常依赖于精心设计的、针对特定任务的奖励函数，这阻碍了其可扩展性和泛化能力。
华为HDC 2025：一场开发者的技术盛宴与灵感之旅
前言作为一名开发者，参加华为HDC大会就像是一场朝圣之旅。每年这个时候，全球的开发者们都会汇聚一堂，分享最新的技术成果，探讨未来的趋势，而今年的HDC2025更是让我期待已久。这次大会不仅有华为最新技术的展示，还有各种实战案例和深度分享，对我来说，这是一次难得的学习和交流机会，更是面基各位好友的最佳机会。那么接下来就来分享一下三掌柜参加2025华为HDC大会的所见所感吧。初到会场：满满的科技感当我
提升AI产品竞争力：可用性评估的10个核心维度 AGI大模型与大数据研究院人工智能 ai
提升AI产品竞争力：可用性评估的10个核心维度关键词：AI产品、可用性评估、用户体验、人机交互、产品竞争力、评估维度、人工智能摘要：本文深入探讨了提升AI产品竞争力的10个核心可用性评估维度。我们将从用户角度出发，系统性地分析如何评估和优化AI产品的可用性，包括易用性、效率、可学习性、容错性等关键指标。通过详细的案例分析和实用建议，帮助产品团队打造更具竞争力的AI解决方案。背景介绍目的和范围本文旨
面经总结系列（十六）：元象科技大模型推理优化工程师 GoAI AI面经总结机器学习算法人工智能大模型机器学习深度学习
‍作者简介：CSDN、阿里云人工智能领域博客专家，新星计划计算机视觉导师，百度飞桨PPDE，专注大数据与AI知识分享。✨公众号：GoAI的学习小屋，免费分享书籍、简历、导图等，更有交流群分享宝藏资料，关注公众号回复“加群”或➡️点击链接加群。AI学习星球推荐：GoAI的学习社区知识星球是一个致力于提供《机器学习|深度学习|CV|NLP|大模型|多模态|AIGC》各个最新AI方向综述、论文等成体系的
《深入浅出多模态》(四)：多模态经典模型CLIP GoAI 深入浅出多模态多模态大模型 LLM 人工智能
AI学习星球推荐：GoAI的学习社区知识星球是一个致力于提供《机器学习|深度学习|CV|NLP|大模型|多模态|AIGC》各个最新AI方向综述、论文等成体系的学习资料，配有全面而有深度的专栏内容，包括不限于前沿论文解读、资料共享、行业最新动态以、实践教程、求职相关（简历撰写技巧、面经资料与心得）多方面综合学习平台，强烈推荐AI小白及AI爱好者学习，性价比非常高！加入星球➡️点击链接✨专栏介
ECharts后台读取数据动态生成折线图：实时数据可视化解决方案窦菲芊Harriet
ECharts后台读取数据动态生成折线图：实时数据可视化解决方案【下载地址】ECharts后台读取数据动态生成折线图该项目提供了一种高效的方法，利用PHP从数据库中读取数据，并通过JSON格式传输到前端，结合ECharts库动态生成折线图。通过AJAX技术，数据能够实时刷新，确保折线图始终反映最新数据变化。项目集成了ECharts和jQuery，简化了开发流程，适合需要实时数据可视化的场景。只需将
大学专业科普 | 物联网、自动化和人工智能
在选择大学专业时，可以先从自身兴趣、能力和职业规划出发，初步确定几个感兴趣的领域。然后结合外部环境因素，如专业前景、教育资源和就业情况等，对这些专业进行深入的分析和比较。物联网专业课程设置基础课程：包括物联网概论、电子电工基础、计算机网络技术、数据库应用基础、C语言程序设计等。专业核心课程：传感器与传感网技术、自动识别技术与应用、单片机基础、物联网通信技术、嵌入式系统设计、无线传感器网络等。实践课
深入浅出多模态》（十一）之多模态经典模型：Flamingo系列 GoAI 机器学习多模态大模型人工智能 LLM 机器学习
AI学习星球推荐：GoAI的学习社区知识星球是一个致力于提供《机器学习|深度学习|CV|NLP|大模型|多模态|AIGC》各个最新AI方向综述、论文等成体系的学习资料，配有全面而有深度的专栏内容，包括不限于前沿论文解读、资料共享、行业最新动态以、实践教程、求职相关（简历撰写技巧、面经资料与心得）多方面综合学习平台，强烈推荐AI小白及AI爱好者学习，性价比非常高！加入星球➡️点击链接✨专栏介绍：本作
招标专家随机抽选——抽取结果打印模板设计—未来之窗智能编程——仙盟创梦IDE 未来之窗软件服务招标专家仙盟创梦IDE 东方仙盟
打印代码function未来之窗_人工智能_打印指定区域(魔都id){varmode="iframe";varclose=false;varextraCss=`.cyberwinqrimg{display:inline-block!important;}`;varkeepAttr=[];keepAttr.push($("#"+魔都id).html());varheadElements=',';va
深度学习目标检测之YOLOv3实战（二）训练自己的图像数据郎郎不会飞深度学习目标识别 python 深度学习
深度学习目标检测之YOLOv3实战（二）训练自己的图像数据数据集准备数据集预处理原demo修改数据集训练目标检测补充二零二零年的大年初一，给大家拜个年，祝大家鼠年吉祥，万事如意，趁着喜气，把Yolov3训练自己的数据过程，记录一下，共勉共进。同样，无人机搭载山狗拍摄的视频，目标检测的种类是模型tank和airplane，部分效果图镇贴：数据集准备首先需要将自己的数据集准备好，不同场景下的目标数据尽
YOLOv12 正式发布 | 检测效果超越YOLO11！！
论文地址：YOLOv12:Attention-CentricReal-TimeObjectDetectors代码地址：https://github.com/sunsmarterjie/yolov12提升YOLO框架的网络架构一直至关重要，尽管注意力机制在建模能力方面已被证明具有优越性，但长期以来一直专注于基于CNN的改进。这是因为基于注意力的模型无法与基于CNN的模型的速度相匹配。本文提出了一种以
D-FINE模型详解及代码复现清风AI 目标跟踪人工智能计算机视觉深度学习机器学习 python 神经网络
研究背景在实时目标检测领域的快速发展背景下，D-FINE作为一项突破性的方法应运而生。它超越了现有模型如YOLOv10、YOLO11及RT-DETRv1/v2/v3，重新定义了边界框回归任务，显著提升了实时目标检测的性能上限。D-FINE通过创新的细粒度分布优化(FDR)和全局最优定位自蒸馏(GO-LSD)机制，为目标检测领域带来了新的突破，为未来的研究奠定了基础。创新优势D-FINE模型在创新方
Neo4j 图数据库安装教程（2024最新版）—— Windows / Linux / macOS 全平台指南 2501_91537435 图数据库 neo4j 数据库 windows
Neo4j图数据库安装教程（2024最新版）——Windows/Linux/macOS全平台指南Neo4j是目前最流行的图数据库（GraphDatabase），广泛应用于社交网络、推荐系统、知识图谱等领域。本文将详细介绍Windows、Linux和macOS三大平台的Neo4j安装方法，并包含配置优化、基础使用示例和常见问题解决。一、Neo4j简介1.什么是Neo4j？Neo4j是一个高性能的No
【EI会议征稿】2025年第四届计算机视觉与模式分析国际学术大会（ICCPA 2025）
重要信息2025年5月16-18日|中国·鞍山大会官网：www.iccpa.org会议主页：2025年第五届计算机视觉与模式分析国际学术大会（ICCPA2025）_艾思科蓝_学术一站式服务平台接收/拒稿通知：投稿后1周内收录检索：EICompendex，Scopus主办单位辽宁科技大学往届历史ICCPA前四届均已成功举办，并完成EI、Scopus检索（高录用，稳定检索）
2025 AI编程工具全景图：七强横评与实战落地实战指南杜哥无敌 AI应用人工智能
—深度拆解最新技术趋势，赋能开发者效率革命一、市场现状与演进趋势：从辅助工具到开发核心引擎2025年，AI编程工具已从“代码补全插件”进化为覆盖需求分析、编码、测试、部署的全流程智能伙伴。据Gartner数据，全球75%开发者依赖AI生成代码，头部企业25%的新代码由AI生成后人工审核。技术演进呈现三大特征：多模型协同：主流工具集成GPT-4o、Claude3.7、Gemini2.0等模型，动态切
探索Lshort：一份现代 LaTeX 入门指南司莹嫣Maude
探索Lshort：一份现代LaTeX入门指南项目地址:https://gitcode.com/gh_mirrors/ls/lshort是一个由PeterR.Oetiker创建并维护的开源项目，它提供了一份详尽且易于理解的LaTeX初学者指南。LaTeX是一种基于TeX的排版系统，广泛应用于学术论文、科技报告、书籍和各种专业文档的编写。Lshort通过清晰的结构和实例，帮助用户快速掌握LaTeX的基
【EI会议征稿】东北大学主办第三届机器视觉、图像处理与影像技术国际会议（MVIPIT 2025）诗远Yolanda 图像处理计算机视觉考研视频机器学习论文阅读
一、会议信息大会官网：www.mvipit.org官方邮箱：[email protected]会议地点：辽宁沈阳主办单位：东北大学会议时间：2025年9月27日-9月29日二、征稿主题集中但不限于“机器视觉、图像处理与影像技术”等其他相关主题。机器视觉：视觉中的统计机器学习；立体视觉标定；几何建模与处理；人脸识别与手势识别；早期视觉和生物学启发的视觉；光流法和运动追踪；图像分割和图像分类；基于模型的视觉
MCP模型上下文协议：AI人工智能模型训练的自动化调参 AI天才研究院 AI人工智能与大数据人工智能自动化运维 ai
MCP模型上下文协议：AI人工智能模型训练的自动化调参关键词：MCP模型、自动化调参、AI训练、超参数优化、上下文协议、机器学习、深度学习摘要：本文深入探讨MCP模型上下文协议在AI模型训练自动化调参中的应用。MCP(ModelContextProtocol)是一种创新的自动化调参框架，通过上下文感知和动态参数调整机制，显著提升模型训练效率和性能。文章将从理论基础、算法实现、数学原理到实际应用进行
MySql表设计经验记录拄杖忙学轻声码 MySQL Oracle PostgreSQL mysql
业务表关系设计：一、缓存、表设计(多对多关系表、最新一条数据Id冗余设计法)二、一对多数据表，在实际业务场景中，主表数据只有一个，从表数据经常会不定时新增数据，每次新增从表数据时可以把这条最新的数据(Id或编号)更新到主表中(用来标识获取从表最新的一条数据)三、主从表字段同步标识设计法1、主表增加特殊标识，需要控制从表数据对主表数据的可见度或其他业务等2、此时可以采用主从表特殊标识属性同步法，也就
AI--提升效率、驱动创新的核心引擎保持学习ing AI编程自动化低代码
自动化代码生成、低代码/无代码开发、算法优化实践等新兴技术在软件开发领域正逐渐崭露头角。这些技术为开发者提供了更高效、更便捷的开发方式，大大提升了软件开发的效率和质量。本文重点探讨的是这些技术在实际应用中的价值和优势。1、自动化代码生成1.1优势自动化代码生成是利用机器学习和人工智能技术，通过分析需求和已有代码，生成可用的代码片段或完整的程序。这种技术可以极大地减少开发人员的工作量，提高开发效率。
ASM系列四利用Method 组件动态注入方法逻辑 lijingyao8206 字节码技术 jvm AOP 动态代理 ASM
这篇继续结合例子来深入了解下Method组件动态变更方法字节码的实现。通过前面一篇，知道ClassVisitor 的visitMethod()方法可以返回一个MethodVisitor的实例。那么我们也基本可以知道，同ClassVisitor改变类成员一样，MethodVIsistor如果需要改变方法成员，注入逻辑，也可以
java编程思想 --内部类百合不是茶 java 内部类匿名内部类
内部类;了解外部类并能与之通信内部类写出来的代码更加整洁与优雅 1,内部类的创建内部类是创建在类中的 package com.wj.InsideClass; /* * 内部类的创建 */ public class CreateInsideClass { public CreateInsideClass(
web.xml报错 crabdave web.xml
web.xml报错 The content of element type "web-app" must match "(icon?,display- name?,description?,distributable?,context-param*,filter*,filter-mapping*,listener*,servlet*,s
泛型类的自定义麦田的设计者 java android 泛型
为什么要定义泛型类，当类中要操作的引用数据类型不确定的时候。采用泛型类，完成扩展。例如有一个学生类 Student{ Student(){ System.out.println("I'm a student....."); } } 有一个老师类
CSS清除浮动的4中方法 IT独行者 JavaScript UI css
清除浮动这个问题，做前端的应该再熟悉不过了，咱是个新人，所以还是记个笔记，做个积累，努力学习向大神靠近。CSS清除浮动的方法网上一搜，大概有N多种，用过几种，说下个人感受。 1、结尾处加空div标签 clear:both 1 2 3 4 .div 1 { background : #000080 ; border : 1px s
Cygwin使用windows的jdk 配置方法 _wy_ jdk windows cygwin
1.[vim /etc/profile] JAVA_HOME="/cgydrive/d/Java/jdk1.6.0_43" (windows下jdk路径为D:\Java\jdk1.6.0_43) PATH="$JAVA_HOME/bin:${PATH}" CLAS
linux下安装maven 无量 maven linux 安装
Linux下安装maven(转) 1.首先到Maven官网下载安装文件，目前最新版本为3.0.3，下载文件为 apache-maven-3.0.3-bin.tar.gz，下载可以使用wget命令； 2.进入下载文件夹，找到下载的文件，运行如下命令解压 tar -xvf apache-maven-2.2.1-bin.tar.gz 解压后的文件夹
tomcat的https 配置,syslog-ng配置 aichenglong tomcat http跳转到https syslong-ng配置 syslog配置
1) tomcat配置https,以及http自动跳转到https的配置 1)TOMCAT_HOME目录下生成密钥(keytool是jdk中的命令) keytool -genkey -alias tomcat -keyalg RSA -keypass changeit -storepass changeit
关于领号活动总结 alafqq 活动
关于某彩票活动的总结具体需求，每个用户进活动页面，领取一个号码，1000中的一个；活动要求 1，随机性，一定要有随机性； 2，最少中奖概率，如果注数为3200注，则最多中4注 3，效率问题，（不能每个人来都产生一个随机数，这样效率不高）； 4，支持断电（仍然从下一个开始），重启服务；（存数据库有点大材小用，因此不能存放在数据库）解决方案 1，事先产生随机数1000个，并打
java数据结构冒泡排序的遍历与排序百合不是茶 java
java的冒泡排序是一种简单的排序规则冒泡排序的原理：比较两个相邻的数，首先将最大的排在第一个，第二次比较第二个，此后一样；针对所有的元素重复以上的步骤，除了最后一个例题；将int array[]
JS检查输入框输入的是否是数字的一种校验方法 bijian1013 js
如下是JS检查输入框输入的是否是数字的一种校验方法： <form method=post target="_blank"> 数字：<input type="text" name=num onkeypress="checkNum(this.form)"><br> </form>
Test注解的两个属性：expected和timeout bijian1013 java JUnit expected timeout
JUnit4：Test文档中的解释：　　The Test annotation supports two optional parameters. 　　The first, expected, declares that a test method should throw an exception. 　　If it doesn't throw an exception or if it
[Gson二]继承关系的POJO的反序列化 bit1129 POJO
父类 package inheritance.test2; import java.util.Map; public class Model { private String field1; private String field2; private Map<String, String> infoMap
【Spark八十四】Spark零碎知识点记录 bit1129 spark
1. ShuffleMapTask的shuffle数据在什么地方记录到MapOutputTracker中的 ShuffleMapTask的runTask方法负责写数据到shuffle map文件中。当任务执行完成成功，DAGScheduler会收到通知，在DAGScheduler的handleTaskCompletion方法中完成记录到MapOutputTracker中
WAS各种脚本作用大全 ronin47 WAS 脚本
　　　http://www.ibm.com/developerworks/cn/websphere/library/samples/SampleScripts.html 　　　无意中，在WAS官网上发现的各种脚本作用，感觉很有作用，先与各位分享一下　　　获取下载这些示例 jacl 和 Jython 脚本可用于在 WebSphere Application Server 的不同版本中自
java-12.求 1+2+3+..n不能使用乘除法、 for 、 while 、 if 、 else 、 switch 、 case 等关键字以及条件判断语句 bylijinnan switch
借鉴网上的思路，用java实现： public class NoIfWhile { /** * @param args * * find x=1+2+3+....n */ public static void main(String[] args) { int n=10; int re=find(n); System.o
Netty源码学习-ObjectEncoder和ObjectDecoder bylijinnan java netty
Netty中传递对象的思路很直观： Netty中数据的传递是基于ChannelBuffer（也就是byte[]）；那把对象序列化为字节流，就可以在Netty中传递对象了相应的从ChannelBuffer恢复对象，就是反序列化的过程 Netty已经封装好ObjectEncoder和ObjectDecoder 先看ObjectEncoder ObjectEncoder是往外发送
spring 定时任务中cronExpression表达式含义 chicony cronExpression
一个cron表达式有6个必选的元素和一个可选的元素，各个元素之间是以空格分隔的，从左至右，这些元素的含义如下表所示：代表含义是否必须允许的取值范围 &nb
Nutz配置Jndi ctrain JNDI
1、使用JNDI获取指定资源： var ioc = { dao : { type :"org.nutz.dao.impl.NutDao", args : [ {jndi :"jdbc/dataSource"} ] } } 以上方法,仅需要在容器中配置好数据源,注入到NutDao即可.
解决 /bin/sh^M: bad interpreter: No such file or directory daizj shell
在Linux中执行.sh脚本，异常/bin/sh^M: bad interpreter: No such file or directory。分析：这是不同系统编码格式引起的：在windows系统中编辑的.sh文件可能有不可见字符，所以在Linux系统下执行会报以上异常信息。解决： 1）在windows下转换：利用一些编辑器如UltraEdit或EditPlus等工具
[转]for 循环为何可恨？ dcj3sjt126com 程序员读书
Java的闭包(Closure)特征最近成为了一个热门话题。一些精英正在起草一份议案，要在Java将来的版本中加入闭包特征。然而，提议中的闭包语法以及语言上的这种扩充受到了众多Java程序员的猛烈抨击。不久前，出版过数十本编程书籍的大作家Elliotte Rusty Harold发表了对Java中闭包的价值的质疑。尤其是他问道“for 循环为何可恨？”[http://ju
Android实用小技巧 dcj3sjt126com android
1、去掉所有Activity界面的标题栏　　修改AndroidManifest.xml 　　在application 标签中添加android:theme="@android:style/Theme.NoTitleBar" 2、去掉所有Activity界面的TitleBar 和StatusBar 　　修改AndroidManifes
Oracle 复习笔记之序列 eksliang Oracle 序列 sequence Oracle sequence
转载请出自出处：http://eksliang.iteye.com/blog/2098859 1.序列的作用序列是用于生成唯一、连续序号的对象一般用序列来充当数据库表的主键值 2.创建序列语法如下： create sequence s_emp start with 1 --开始值 increment by 1 --増长值 maxval
有“品”的程序员 gongmeitao 工作
完美程序员的10种品质　　完美程序员的每种品质都有一个范围，这个范围取决于具体的问题和背景。没有能解决所有问题的完美程序员（至少在我们这个星球上），并且对于特定问题，完美程序员应该具有以下品质：　　1. 才智非凡- 能够理解问题、能够用清晰可读的代码翻译并表达想法、善于分析并且逻辑思维能力强（范围：用简单方式解决复杂问题）　　
使用KeleyiSQLHelper类进行分页查询 hvt sql .net C#asp.net hovertree
本文适用于sql server单主键表或者视图进行分页查询，支持多字段排序。KeleyiSQLHelper类的最新代码请到http://hovertree.codeplex.com/SourceControl/latest下载整个解决方案源代码查看。或者直接在线查看类的代码：http://hovertree.codeplex.com/SourceControl/latest#HoverTree.D
SVG 教程（三）圆形，椭圆，直线天梯梦 svg
SVG <circle> SVG 圆形 - <circle> <circle> 标签可用来创建一个圆：下面是SVG代码： <svg xmlns="http://www.w3.org/2000/svg" version="1.1"> <circle cx="100" c
链表栈 luyulong java 数据结构
public class Node { private Object object; private Node next; public Node() { this.next = null; this.object = null; } public Object getObject() { return object; } public
基础数据结构和算法十：2-3 search tree sunwinner Algorithm 2-3 search tree
Binary search tree works well for a wide variety of applications, but they have poor worst-case performance. Now we introduce a type of binary search tree where costs are guaranteed to be loga
spring配置定时任务 stunizhengjia spring timer
最近因工作的需要，用到了spring的定时任务的功能,觉得spring还是很智能化的,只需要配置一下配置文件就可以了,在此记录一下，以便以后用到： //------------------------定时任务调用的方法------------------------------ /** * 存储过程定时器 */ publi
ITeye 8月技术图书有奖试读获奖名单公布 ITeye管理员活动
ITeye携手博文视点举办的8月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 8月试读活动回顾： http://webmaster.iteye.com/blog/2102830 本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《跨终端Web》 gleams：http