旅途中的宽~

【计算机视觉 | 图像分割】arxiv 计算机视觉关于图像分割的学术速递（7 月 21 日论文合集）

文章目录

一、分割|语义相关(14篇)
- 1.1 CNOS: A Strong Baseline for CAD-based Novel Object Segmentation
- 1.2 Spinal nerve segmentation method and dataset construction in endoscopic surgical scenarios
- 1.3 WeakPolyp: You Only Look Bounding Box for Polyp Segmentation
- 1.4 Divide & Bind Your Attention for Improved Generative Semantic Nursing
- 1.5 Label Calibration for Semantic Segmentation Under Domain Shift
- 1.6 Gradient-Semantic Compensation for Incremental Semantic Segmentation
- 1.7 See More and Know More: Zero-shot Point Cloud Segmentation via Multi-modal Visual Data
- 1.8 EdgeAL: An Edge Estimation Based Active Learning Approach for OCT Segmentation
- 1.9 TwinLiteNet: An Efficient and Lightweight Model for Driveable Area and Lane Segmentation in Self-Driving Cars
- 1.10 Interactive Segmentation for Diverse Gesture Types Without Context
- 1.11 CPCM: Contextual Point Cloud Modeling for Weakly-supervised Point Cloud Semantic Segmentation
- 1.12 On the Real-Time Semantic Segmentation of Aphid Clusters in the Wild
- 1.13 Confidence intervals for performance estimates in 3D medical image segmentation
- 1.14 Towards Automated Semantic Segmentation in Mammography Images

一、分割|语义相关(14篇)

1.1 CNOS: A Strong Baseline for CAD-based Novel Object Segmentation

CNOS：基于CAD的新型目标分割的强基线

https://arxiv.org/abs/2307.11067

我们提出了一个简单的三阶段的方法来分割看不见的物体在RGB图像中使用其CAD模型。利用最近强大的基础模型DINOv2和Segment Anything，我们创建描述符并生成建议，包括给定输入RGB图像的二进制掩码。通过匹配的建议与参考描述符创建的CAD模型，我们实现了精确的对象ID分配以及模态掩码。我们的实验表明，我们的方法实现了最先进的结果，在CAD为基础的新的对象分割，超过现有的方法在七个核心数据集的BOP挑战19.8% AP使用相同的BOP评估协议。我们的源代码可在https://github.com/nv-nguyen/cnos获得。

1.2 Spinal nerve segmentation method and dataset construction in endoscopic surgical scenarios

内窥镜手术场景中的脊神经分割方法及数据集构建

https://arxiv.org/abs/2307.10955

内窥镜手术目前是脊柱外科领域中的重要治疗方法，并且通过视频引导避免对脊神经的损伤是一个关键挑战。本文提出了第一个实时分割的方法，在内窥镜手术的脊神经，这为外科医生提供了至关重要的导航信息。在手术过程中记录的约10，000个连续帧的精细注释的分割数据集首次为该领域构建，解决了语义分割的问题。基于此数据集，我们提出了FUnet（Frame-Unet），它通过利用帧间信息和自注意机制实现了最先进的性能。我们还进行了扩展的实验，类似的息肉内窥镜视频数据集，并表明该模型具有良好的泛化能力与优势的性能。这项工作的数据集和代码如下：https://github.com/zzzzzzpc/FUnet。

1.3 WeakPolyp: You Only Look Bounding Box for Polyp Segmentation

WeakPolyp：您只需查看用于息肉分割的边界框

https://arxiv.org/abs/2307.10912

受限于昂贵的像素级标签，息肉分割模型受到数据短缺的困扰并且遭受受损的泛化。相比之下，息肉边界框注释要便宜得多，也更容易访问。因此，为了降低标记成本，我们提出学习弱监督息肉分割模型（即，WeakPolyp）完全基于边界框注释。然而，粗略的边界框包含太多的噪声。为了避免干扰，我们引入掩模到盒（M2B）变换。通过监督预测的外部框掩码而不是预测本身，M2B极大地减轻了粗略标签与精确预测之间的失配。但是，M2B仅提供稀疏监督，导致非唯一预测。因此，我们进一步提出了密集监督的规模一致性（SC）损失。通过在不同尺度下跨同一图像明确地对齐预测，SC损失大大减少了预测的变化。请注意，我们的WeakPolyp是一个即插即用的模型，它可以很容易地移植到其他有吸引力的主干上。此外，所提出的模块仅在训练期间使用，不会给推理带来计算开销。大量的实验证明了我们提出的WeakPolyp的有效性，它令人惊讶地实现了与完全监督模型相当的性能，根本不需要掩码注释。

1.4 Divide & Bind Your Attention for Improved Generative Semantic Nursing

将注意力分散和捆绑在一起，以改善生成性语义护理

https://arxiv.org/abs/2307.10864

新兴的大规模文本到图像生成模型，例如，稳定扩散（SD）已经以高保真度展示了压倒性的结果。尽管取得了巨大的进步，但当前最先进的模型仍然难以生成完全符合输入提示的图像。先前的工作Attend & Excite引入了生成语义护理（GSN）的概念，旨在优化推理时间期间的交叉注意力，以更好地结合语义。它在生成简单提示方面展示了有希望的结果，例如，“一只猫和一只狗”。然而，当处理更复杂的提示时，它的功效下降，并且它没有明确地解决不正确的属性绑定的问题。为了解决复杂提示或涉及多个实体的场景所带来的挑战，并实现改进的属性绑定，我们提出了分割和绑定。我们为GSN引入两个新的损耗目标：新的出勤损失和绑定损失。我们的方法脱颖而出，在其能力，忠实地合成所需的对象，从复杂的提示改进属性对齐，并在多个评估基准表现出卓越的性能。更多视频和更新可以在项目页面\url{https：//sites.google.com/view/divide-and-bind}找到。

1.5 Label Calibration for Semantic Segmentation Under Domain Shift

领域漂移下的语义分割中的标签校正

https://arxiv.org/abs/2307.10842

预训练的语义分割模型的性能可能会在来自新领域的数据上大幅降低。我们表明，通过在域偏移下计算软标签原型，并根据最接近具有预测类概率的向量的原型进行预测，预训练模型可以适应未标记的目标域数据。建议的适应过程是快速的，几乎是免费的计算资源，并导致相当大的性能改善。我们展示了这种标签校准的好处，高度实用的合成到真正的语义分割问题。

1.6 Gradient-Semantic Compensation for Incremental Semantic Segmentation

基于梯度语义补偿的增量式语义分割

https://arxiv.org/abs/2307.10822

增量语义分割的目的是不断学习新的类别的分割，而不访问先前学习的类别的训练数据。然而，大多数现有的方法未能解决灾难性遗忘和背景偏移，因为它们1）平等地对待所有先前的类，而不考虑由不平衡梯度反向传播引起的不同遗忘步距; 2）类之间缺乏强有力的语义指导。为了解决上述挑战，在本文中，我们提出了梯度语义补偿（GSC）模型，它超越了增量语义分割从梯度和语义的角度。具体来说，为了解决灾难性遗忘从梯度方面，我们开发了一个步骤感知梯度补偿，可以平衡遗忘的步伐以前看到的类通过重新加权梯度反向传播。同时，我们提出了一种软尖锐语义关系蒸馏，通过软标签提取一致的类间语义关系，以减轻灾难性遗忘的语义方面。此外，我们开发了一个原型的伪重标签，提供强大的语义指导，以减轻背景转移。它通过测量像素和类原型之间的距离，为背景中的旧类生成高质量的伪标签。在三个公共数据集上进行了广泛的实验，即Pascal VOC 2012、ADE 20 K和Cityscapes证明了我们提出的GSC模型的有效性。

1.7 See More and Know More: Zero-shot Point Cloud Segmentation via Multi-modal Visual Data

看得更多、知道得更多：基于多模式视觉数据的零炮点云分割

https://arxiv.org/abs/2307.10782

Zero-shot点云分割旨在使深度模型能够识别在训练阶段不可见的点云中的新对象。最近的趋势有利于将知识从看到的类与标签转移到看不见的类没有标签的管道。它们通常将视觉特征与从单词嵌入中获得的语义特征对齐，通过监督所看到的类的注释。然而，点云包含的信息有限，无法与语义特征完全匹配。事实上，图像丰富的外观信息是对无纹理点云的天然补充，这在以往文献中没有得到很好的探索。基于此，我们提出了一种新的多模态zero-shot学习方法，以更好地利用点云和图像的互补信息，更准确地进行视觉语义对齐。在两个流行的基准测试中进行了大量的实验，即，SemanticKITTI和nuScenes，和我们的方法优于当前的SOTA方法，平均改善了52%和49%的未见类mIoU。

1.8 EdgeAL: An Edge Estimation Based Active Learning Approach for OCT Segmentation

EdgeAL：一种基于边缘估计的OCT分割主动学习方法

https://arxiv.org/abs/2307.10745

主动学习算法对于具有有限数据的训练模型已经变得越来越流行。然而，选择用于注释的数据仍然是一个具有挑战性的问题，因为在未见数据上可用的信息有限。为了解决这个问题，我们提出了EdgeAL，它利用未见图像的边缘信息作为测量不确定性的{\it a previous}信息。通过分析模型预测中的散度和熵来量化不确定性。然后使用该度量来选择用于注释的超像素。我们证明了EdgeAL在多类光学相干断层扫描（OCT）分割任务的有效性，其中我们实现了99%的骰子得分，同时将注释标签成本降低到12%，2.3%和3%，分别在三个公开可用的数据集（杜克，AROI和UMN）。源代码可在\url{https：//github.com/Mak-Ta-Reque/EdgeAL}获得

1.9 TwinLiteNet: An Efficient and Lightweight Model for Driveable Area and Lane Segmentation in Self-Driving Cars

TwinLiteNet：一种高效轻量级的自动驾驶汽车可行驶区域和车道分割模型

https://arxiv.org/abs/2307.10705

语义分割是自动驾驶中理解周围环境的常见任务。可行驶区域分割和车道检测对于道路上的安全和高效导航尤为重要。然而，原始的语义分割模型在计算上是昂贵的，并且需要高端硬件，这对于自动驾驶车辆中的嵌入式系统是不可行的。本文提出了一个轻量级的模型，可行驶区域和车道线分割。TwinLiteNet的设计成本低廉，但可以实现准确高效的分割结果。我们在BDD 100 K数据集上评估了TwinLiteNet，并将其与现代模型进行了比较。实验结果表明，我们的TwinLiteNet执行类似于现有的方法，需要显着更少的计算资源。具体来说，TwinLiteNet在可行驶区域任务中实现了91.3%的mIoU得分，在车道检测任务中实现了31.08%的IoU得分，仅使用了40万个参数，并在GPU RTX A5000上实现了415 FPS。此外，TwinLiteNet可以在计算能力有限的嵌入式设备上实时运行，特别是因为它在Jetson Xavier NX上实现了60 FPS，使其成为自动驾驶汽车的理想解决方案。代码可用：url{https：//github.com/chequanghuy/TwinLiteNet}.

1.10 Interactive Segmentation for Diverse Gesture Types Without Context

针对不同手势类型的无上下文交互分割

https://arxiv.org/abs/2307.10518

交互式分割需要人类标记图像以指导模型如何创建或编辑分割。我们的工作解决了现有方法的局限性：它们或者仅支持用于标记图像的一种手势类型（例如，点击或涂写），或者需要知道所采用的手势类型，并且需要指定在最终分割中是否应该包括标记区域还是排除标记区域。相反，我们提出了一个简化的交互式分割任务，其中用户只必须标记图像，其中输入可以是任何手势类型，而不指定手势类型。我们通过引入具有多种手势类型的第一交互式分割数据集以及能够全面评估交互式分割算法的新评估指标来支持这一新任务。然后，我们分析了许多交互式分割算法，包括适应我们的新任务。虽然我们观察到整体表现有希望，但我们也强调了未来需要改进的领域。为了促进这项工作的进一步扩展，我们在https://github.com/joshmyersdean/dig公开分享了我们的新数据集。

1.11 CPCM: Contextual Point Cloud Modeling for Weakly-supervised Point Cloud Semantic Segmentation

CPCM：弱监督点云语义分割的上下文点云建模

https://arxiv.org/abs/2307.10316

我们研究了具有稀疏注释的弱监督点云语义分割的任务（例如，少于0.1%的点被标记），旨在降低密集注释的昂贵成本。不幸的是，非常稀疏的注释点，这是非常困难的提取上下文和对象信息的场景理解，如语义分割。受掩蔽建模的启发（例如，MAE）在图像和视频表示学习中，我们试图赋予掩码建模的能力，以从稀疏注释的点中学习上下文信息。然而，直接将MAE应用于具有稀疏注释的3D点云可能无法工作。首先，有效地从3D点云中屏蔽出信息丰富的视觉上下文是不平凡的。其次，如何充分利用稀疏的注释上下文建模仍然是一个悬而未决的问题。在本文中，我们提出了一种简单而有效的上下文点云建模（CPCM）方法，该方法由两部分组成：区域式掩蔽（RegionMask）策略和上下文掩蔽训练（CMT）方法。具体地，RegionMask在几何空间中连续地掩蔽点云，以构造用于后续上下文学习的有意义的掩蔽预测任务。CMT将监督分割和无监督掩蔽上下文预测的学习分开，分别用于有效地学习非常有限的标记点和大量未标记点。在广泛测试的ScanNet V2和S3DIS基准上进行的大量实验证明了CPCM优于最先进的技术。

1.12 On the Real-Time Semantic Segmentation of Aphid Clusters in the Wild

野外蚜虫群的实时语义切分研究

https://arxiv.org/abs/2307.10267

蚜虫侵扰可对小麦和高粱田造成广泛损害并传播植物病毒，导致农业产量显著损失。为了解决这个问题，农民通常依赖于化学农药，这些农药在大面积的田地上施用效率低下。结果，相当数量的杀虫剂被浪费在没有害虫的地区，而施用到害虫严重的地区的量不足。本文重点关注对智能自主系统的迫切需求，该系统可以在复杂的作物冠层内定位和喷洒虫害，减少农药使用和环境影响。我们已经收集并标记了一个大的蚜虫图像数据集在该领域，并提出了使用实时语义分割模型来分割蚜虫集群。生成多尺度数据集以允许学习不同尺度的聚类。我们比较了四种最先进的实时语义分割模型在蚜虫集群数据集上的分割速度和准确性，并将其与非实时模型进行了比较。研究结果表明了实时解决方案的有效性，可以减少低效的农药使用并提高作物产量，为自主害虫检测系统铺平了道路。

1.13 Confidence intervals for performance estimates in 3D medical image segmentation

三维医学图像分割中性能估计的置信度

https://arxiv.org/abs/2307.10926

医学分割模型的经验评估。由于这样的评估是基于有限的一组示例图像，因此不可避免地有噪声。因此，除了平均性能指标之外，报告置信区间也至关重要。然而，在医学图像分割中很少这样做。置信区间的宽度取决于测试集的大小和性能度量的分布（其在测试集上的标准差）。对于分类，需要许多测试图像以避免宽置信区间。然而，分割还没有被研究，它的不同之处在于给定的测试图像所带来的信息量。本文研究了医学图像分割中的典型置信区间。我们使用标准的nnU-net框架，来自医学十项全能挑战的两个数据集和两个性能指标进行3D图像分割实验：Dice精度和Hausdorff距离。我们表明，参数的置信区间是合理的近似的bootstrap估计不同的测试集大小和传播的性能指标。重要的是，我们表明，需要达到一个给定的精度的测试大小往往比分类任务低得多。通常情况下，1%宽的置信区间需要约100-200个测试样本时，蔓延是低的（标准偏差约3%）。更困难的分割任务可能会导致更高的传播，并需要超过1000个样本。

1.14 Towards Automated Semantic Segmentation in Mammography Images

乳房摄影图像的自动语义分割研究

https://arxiv.org/abs/2307.10296

乳腺X线摄影图像被广泛用于检测不可触及的乳腺病变或结节，预防癌症并在必要时提供计划干预的机会。一些感兴趣的结构的识别是必不可少的诊断和评估图像的充分性。因此，计算机辅助检测系统可以通过自动分割这些标志结构来帮助医学解释。在本文中，我们提出了一个基于深度学习的框架，用于分割标准视图乳腺X射线摄影图像上的乳头、胸肌、纤维腺体组织和脂肪组织。我们引入了一个大型的私有分割数据集，并考虑了不同的深度学习模型架构进行了广泛的实验。我们的实验表明，准确的分割性能的变量和具有挑战性的情况下，表明该框架可以集成到临床实践中。

【优秀文章】7月优秀文章推荐
优秀文章智能自主运动体与人工智能技术——环境感知、SLAM定位、路径规划、运动控制、多智能体协同作者：fpga和matlabC++之红黑树认识与实现作者：zzh_zao【手把手带你刷好题】–C语言基础编程题(十)作者：草莓熊Lotso飞算JavaAI：从“码农”到“代码指挥官”的终极进化论作者：可涵不会debug前端网页开发学习（HTML+CSS+JS）有这一篇就够！作者：一颗小谷粒
【学习】搭建个人Hexo博客网站程序员
一、准备环境1、安装node访问Node.js官网：https://nodejs.org/下载LTS(长期支持版本)安装时保持默认选项即可安装完成后，打开命令提示符验证安装：node-v2、安装npmnpm已包含在Node.js安装包中，安装Node.js时会自动安装打开命令提示符验证安装：npm-v更新npm到最新版本（可选）：npminstall-gnpm3、安装hexo打开命令提示符，以管理
【心灵鸡汤】深度学习技能形成树：从零基础到AI专家的成长路径全解析智算菩萨人工智能深度学习
引言：技能树的生长哲学在这个人工智能浪潮汹涌的时代，深度学习犹如一棵参天大树，其根系深深扎入数学与计算科学的沃土，主干挺拔地承载着机器学习的核心理念，而枝叶则繁茂地延伸至计算机视觉、自然语言处理、强化学习等各个应用领域。对于初入此领域的新手而言，理解这棵技能树的生长规律，掌握其形成过程中的关键节点和发展阶段，将直接决定其在人工智能道路上能够走多远、攀多高。技能树的概念源于游戏设计，但在学习深度学习
mysql下载不是运作宝教程_MySQL下载与安装 8.0详细版喵琛CC mysql下载不是运作宝教程
MySQL下载与安装一、下载地址：https://dev.mysql.com/downloads/mysql/当前最新是8.0版本，我选择上一个最新的mysql-5.7.24-winx64.zip二、安装MySQL安装文件分两种.msi和.zip，.msi需要安装zip格式是自己解压，解压缩之后其实MySQL就可以使用了，但是要进行环境变量配置zip格式是自己解压我的电脑->属性->高级->环境变
MongoDB + Voyage AI 详解：重塑数据库与AI的协同范式 csdn_tom_168 NoSQL 数据库 mongodb 人工智能 AI
MongoDB+VoyageAI详解：重塑数据库与AI的协同范式2025年2月，MongoDB官方宣布收购VoyageAI，这一举措标志着数据库与人工智能技术的深度融合迈入新阶段。通过整合VoyageAI的先进AI检索与嵌入模型能力，MongoDB旨在重新定义AI时代的数据库架构，为企业构建智能应用提供端到端的数据基础设施。一、收购背景与技术战略1.行业趋势驱动AI数据挑战：随着生成式AI与大语言
HarmonyOS5.0仓颉引擎与盘古大模型：个性化作业批改系统架构设计与实现 H老师带你学鸿蒙系统架构 HarmonyOS5.0 鸿蒙华为仓颉教育
人工智能与边缘计算的融合正在重塑教育评价体系。本文将展示如何基于HarmonyOS5.0仓颉并发引擎和盘古大模型，构建新一代智能作业批改系统。系统架构全景graphTDA[学生端设备]-->|提交作业|B[仓颉边缘处理]B-->C[盘古大模型分析]C-->D[个性化反馈生成]D-->E[学生终端]D-->F[教师仪表盘]subgraphHarmonyOS分布式系统B-->|设备协同|G[教室平板集
知识图谱的个性化智能教学推荐系统(论文+源码) 毕设工作室_wlzytw python论文项目知识图谱人工智能
目录摘要Abstract目录第1章绪论1.1研究背景及意义1.2国内外研究现状1.2.1知识图谱1.2.2个性化推荐系统1.3本文研究内容及创新点1.4全文组织结构第2章相关理论与技术概述2.1知识图谱2.1.1知识图谱的介绍与发展2.1.2知识图谱的构建2.3协同过滤推荐算法2.2.1推荐算法概述2.2.2Pearson相关系数2.2.3Spearman相关系数2.4Bert模型和Albert模
阿里云瑶池数据库 Data Agent for Meta 正式发布，让 AI 更懂你的业务！数据库观点资讯人工智能
背景随着生成式人工智能（GenerativeAI）从概念验证迈向规模化商业落地，AIAgent已成为企业核心业务流程的重要组成部分。然而，当模型调用日益便捷时，核心痛点已不再是模型本身，而是集中在一个关键要素上：数据。AIAgent的落地瓶颈已从技术能力转向高质量、高相关性、安全合规的数据供给。企业面临的核心挑战在于：数据孤岛导致知识库分散，通用大模型难以理解专业业务传统数据管理依赖人工开发维护，
【PaddleOCR】OCR文本检测与文本识别数据集整理，持续更新......
博主简介：曾任某智慧城市类企业算法总监，目前在美国市场的物流公司从事高级算法工程师一职，深耕人工智能领域，精通python数据挖掘、可视化、机器学习等，发表过AI相关的专利并多次在AI类比赛中获奖。CSDN人工智能领域的优质创作者，提供AI相关的技术咨询、项目开发和个性化解决方案等服务，如有需要请站内私信或者联系任意文章底部的的VX名片（ID：xf982831907）博主粉丝群介绍：①群内初中生、
多模态大模型的技术应用与未来展望：重构AI交互范式的新引擎 zhaoyi_he 重构人工智能
一、引言：为什么多模态是AI发展的下一场革命？过去十年，深度学习推动了计算机视觉和自然语言处理的飞跃，但两者的发展路径长期割裂。随着生成式AI和大模型时代的到来，**多模态大模型（MultimodalFoundationModels）**以统一的建模方式处理图像、文本、音频、视频等多源数据，重塑了“感知-认知-决策”链条，为AGI迈出关键一步。OpenAI的GPT-4o、Google的Gemini
使用 C++ 实现 MFCC 特征提取与说话人识别系统 whoarethenext c++开发语言 mfcc 语音识别
使用C++实现MFCC特征提取与说话人识别系统在音频处理和人工智能领域，C++凭借其卓越的性能和对硬件的底层控制能力，在实时音频分析、嵌入式设备和高性能计算场景中占据着不可或缺的地位。本文将引导你了解如何使用C++库计算核心的音频特征——梅尔频率倒谱系数(MFCCs)，并进一步利用这些特征构建一个说话人识别（声纹识别）系统。Part1:在C/C++中计算MFCCs直接从零开始实现MFCC的所有计算
ImportError: /nvidia/cusparse/lib/libcusparse.so.12: undefined symbol: __nvJitLinkComplete_12_4 爱编程的喵喵 Python基础课程 python ImportError torch nvJitLink 解决方案
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了ImportError:/home/
图像分割技术详解：从原理到实践 lanjieying
本文还有配套的精品资源，点击获取简介：图像分割是图像处理领域将图像分解为多个区域的过程，用于图像分析、特征提取等。文章介绍了图像分割的原理，并通过一个将图像划分为2*4子块的示例，展示了如何使用Python和matplotlib库中的tight_subplot函数进行图像分割和展示。文章还探讨了图像分割在不同领域的应用，以及如何在机器学习项目中作为数据预处理步骤。1.图像分割基本概念在图像处理领域
网络安全相关专业总结（非常详细）零基础入门到精通，收藏这一篇就够了网络安全工程师教学兼职副业黑客技术网络安全 web安全安全人工智能网络运维
一、网络工程专业专业内涵网络工程是指按计划进行的以工程化的思想、方式、方法，设计、研发和解决网络系统问题的工程，一般指计算机网络系统的开发与构建。该专业培养具备计算机科学与技术学科理论基础，掌握网络技术领域专业知识和基本技能，在计算机、网络及人工智能领域的工程实践和应用方面受到良好训练，具有深厚通信背景、可持续发展、能力较强的高水平工程技术人才。学生可在计算机软硬件系统、互联网、移动互联网及新一代
Linux下Redis安装配置全攻略（2024最新版）「已注销」 linux redis 运维
手残党也能搞定的Redis安装指南还在为Linux安装Redis发愁？（别问我怎么知道的）今天这个保姆级教程绝对能让你爽到飞起！从零开始到完全可用只要10分钟，连小白都能轻松上手！（信我，真的）环境准备（超级重要）先确认你的Linux发行版（敲黑板！）：#查看系统信息cat/etc/os-release推荐系统：Ubuntu20.04/22.04LTSCentOS7/8RockyLinux8/9安
OpenCV 图像操作：颜色识别、替换与水印添加
目录引言代码实现1.导入必要的库2.图像加法3.图像直接相加4.颜色加权加法5.HSV颜色空间转换概念作用6.查找颜色范围对应的像素点7.与运算-生成掩膜8.添加水印9.主函数总结引言在计算机视觉领域，OpenCV是一个强大的库，提供了丰富的图像操作功能。本文将详细介绍如何使用OpenCV进行图像加法、颜色加权加法、HSV颜色空间转换、颜色范围查找、与运算生成掩膜以及添加水印等操作，并给出相应的P
Java面试八股文(2023最新)--Linux面试题月月崽面试 linux 运维服务器
目录1.什么是Linux内核2.Linux的体系结构.4.基本命令5.如何查看最近1000行日志6.如何查端口号是否被占用7.查看当前所有已经使用的端口情况8.什么是硬链接和软链接?1.什么是Linux内核Linux系统的核心是内核,内核控制着计算机系统上的软硬件,在必要时分配硬件,并根据需要执行软件.系统内存管理应用程序管理硬件设备管理文件系统管理2.Linux的体系结构.Linux体系结构可以
Java面试八股文(2023最新)--Redis面试题月月崽面试 java redis 面试
目录1.什么是Redis？2.Redis的优缺点？3.Redis有哪些数据结构？4.Redis的应用场景5.持久化？6.Redis的持久化机制是什么？有什么优缺点？7.Redis的过期删除策略？8.Redis的内存淘汰策略有哪些？9.Redis的事务保证原子性吗，支持回滚吗？10.什么是Redis穿透？10.什么是Redis击穿？11.什么是redis雪崩？12.使用Redis作为缓存，Redis
spyder汉化方法
spyder汉化方法：1、下载安装好Anaconda3；在此强调请安装Anaconda3,如果是anaconda2，汉化可能会遇到出错或者乱码问题。2、spyder的版本至少在3.x以上。（查看方法：打开spyder—help—AboutSpyder）3、尽量升级Spyder到最新版本。方法：（前提是你在Anaconda环境下）cmd-----condaupdatespyder-----若不是最新
大模型训练与微调（1）——优化器选择总结 John_今天务必休息一天人工智能机器学习深度学习
大模型训练与微调（1）——优化器选择总结一、AdamW优化器：成熟稳定的主流选择二、Lion优化器：谷歌提出的高效替代方案三、其他优化器的补充应用四、优化器选择趋势与实验对比五、未来发展方向当前最新的大模型在优化器的选择上，主要结合了传统优化器的稳定性与新型优化器的效率优势。以下是主流大模型采用的优化器及其技术特点的总结：一、AdamW优化器：成熟稳定的主流选择核心原理与改进AdamW是Adam的
《北京市加快推动“人工智能+医药健康“创新发展行动计划（2025-2027年）》深度解读
引言随着新一轮科技革命和产业变革的深入推进，人工智能技术与医药健康的深度融合已成为全球科技创新的重要方向。北京市于2025年7月正式发布《北京市加快推动"人工智能+医药健康"创新发展行动计划（2025-2027年）》，旨在充分发挥北京在人工智能技术策源、头部医疗资源汇聚、健康数据高度富集等方面的突出优势，构建形成"人工智能+医药健康"创新和应用并举的产业生态体系，打造具有国际影响力的创新策源地、应
「源力觉醒创作者计划」_文心大模型开源：开启 AI 新时代的大门小黄编程快乐屋人工智能
在人工智能的浩瀚星空中，大模型技术宛如一颗璀璨的巨星，照亮了无数行业前行的道路。自诞生以来，大模型凭借其强大的语言理解与生成能力，引发了全球范围内的技术变革与创新浪潮。百度宣布于6月30日开源文心大模型4.5系列，这一消息如同一颗重磅炸弹，在AI领域掀起了惊涛骇浪，其影响之深远，意义之重大，足以改写行业的发展轨迹。百度这次放大招，直接把文心大模型4.5开源了，这操作就像往国内AI圈子里空投了一个超
四种微调技术详解：SFT 监督微调、LoRA 微调、P-tuning v2、Freeze 监督微调方法
当谈到人工智能大语言模型的微调技术时，我们进入了一个令人兴奋的领域。这些大型预训练模型，如GPT-3、BERT和T5，拥有卓越的自然语言处理能力，但要使它们在特定任务上表现出色，就需要进行微调，以使其适应特定的数据和任务需求。在这篇文章中，我们将深入探讨四种不同的人工智能大语言模型微调技术：SFT监督微调、LoRA微调方法、P-tuningv2微调方法和Freeze监督微调方法。第一部分：SFT监
2023年搜索领域的技术认证与职业发展指南搜索引擎技术搜索引擎 ai
2023年搜索领域的技术认证与职业发展指南关键词搜索领域、技术认证、职业发展、搜索引擎技术、人工智能搜索摘要本指南旨在为搜索领域的从业者和有志于进入该领域的人士提供全面的技术认证与职业发展参考。首先介绍搜索领域的概念基础，包括其历史发展和关键问题。接着阐述相关理论框架，分析不同认证背后的原理。架构设计部分展示搜索系统的组成与交互。实现机制探讨算法复杂度和代码优化。实际应用部分给出实施和部署策略。高
探索AI人工智能医疗NLP实体识别系统的架构设计 AI学长带你学AI 人工智能自然语言处理 easyui ai
探索AI人工智能医疗NLP实体识别系统的架构设计关键词：人工智能、医疗NLP、实体识别、系统架构、深度学习、自然语言处理、医疗信息化摘要：本文将深入探讨医疗领域NLP实体识别系统的架构设计。我们将从基础概念出发，逐步解析医疗文本处理的特殊性，详细介绍实体识别技术的核心原理，并通过实际案例展示如何构建一个高效可靠的医疗实体识别系统。文章还将探讨当前技术面临的挑战和未来发展方向，为医疗AI领域的从业者
【python实用小脚本-128】基于 Python 的 Hacker News 爬虫工具：自动化抓取新闻数据 Kyln.Wu Python python 爬虫自动化
引言在技术社区中，HackerNews是一个汇聚最新技术文章和讨论的热门平台。许多开发者和技术爱好者依赖它来获取行业动态和前沿资讯。然而，手动浏览和筛选这些文章可能耗时且低效。本文将介绍一个基于Python的HackerNews爬虫工具，它能够自动化地从HackerNews网站抓取最新文章，并将结果保存为CSV文件。该工具主要利用了Python的requests、BeautifulSoup和csv
AI智能体原理及实践：从概念到落地的全链路解析 you的日常人工智能大语言模型人工智能机器学习深度学习神经网络自然语言处理
AI智能体正从实验室走向现实世界，成为连接人类与数字世界的桥梁。它代表了人工智能技术从"知"到"行"的质变，是能自主感知环境、制定决策、执行任务并持续学习的软件系统。在2025年，AI智能体已渗透到智能家居、企业服务、医疗健康、教育和内容创作等领域，展现出强大的生产力与创造力。然而，其发展也伴随着技术挑战、伦理困境和安全风险，需要从架构设计到落地应用的全链条思考与平衡。一、AI智能体的核心定义与技
查看npm包某个具体版本及所有版本大猫会长前端
查看该包的所有版本及最新版本npminfojquery查看npmjs服务器上包的版本信息：使用npmviewjqueryversions；这种方式可以查看npm服务器上所有的jquery版本信息；使用npmviewjqueryversion；这种方式只能查看jquery的最新的版本是哪一个；使用npminfojquery；这种方式和第一种类似，也可以查看jquery所有的版本，但是能查出更多的关于
人工智能动画展示人类的特征 AGI大模型与大数据研究院 AI大模型应用开发实战 java python javascript kotlin golang 架构人工智能
人工智能，动画，人类特征，情感识别，行为模拟，机器学习，深度学习，自然语言处理1.背景介绍人工智能（AI）技术近年来发展迅速，已渗透到生活的方方面面。从智能语音助手到自动驾驶汽车，AI正在改变着我们的世界。然而，尽管AI技术取得了令人瞩目的成就，但它仍然难以完全模拟人类的复杂行为和特征。人类的特征是多方面的，包括情感、认知、社交和创造力等。这些特征是人类区别于其他生物的重要标志，也是人类社会文明发
ros-noetic搭建turtlebot3测试 qq_43133135 嵌入式 ros
准备先要搭建好ros环境，并用roscore验证，cmake--version查看版本不能低于3.2turtlebot3安装创建目录mkdir-pcatkin_turtlebot3/srccdcatkin_turtlebot3/src克隆最新的turtlebot3包gitclone-bnoetic-develhttps://github.com/ROBOTIS-GIT/turtlebot3_msg
Maven Array_06 eclipse jdk maven
Maven Maven是基于项目对象模型(POM)，信息来管理项目的构建，报告和文档的软件项目管理工具。 Maven 除了以程序构建能力为特色之外，还提供高级项目管理工具。由于 Maven 的缺省构建规则有较高的可重用性，所以常常用两三行 Maven 构建脚本就可以构建简单的项目。由于 Maven 的面向项目的方法，许多 Apache Jakarta 项目发文时使用 Maven，而且公司
ibatis的queyrForList和queryForMap区别 bijian1013 java ibatis
一.说明 iBatis的返回值参数类型也有种：resultMap与resultClass，这两种类型的选择可以用两句话说明之： 1.当结果集列名和类的属性名完全相对应的时候，则可直接用resultClass直接指定查询结果类
LeetCode[位运算] - #191 计算汉明权重 Cwind java 位运算 LeetCode Algorithm 题解
原题链接：#191 Number of 1 Bits 要求：写一个函数，以一个无符号整数为参数，返回其汉明权重。例如，‘11’的二进制表示为'00000000000000000000000000001011', 故函数应当返回3。汉明权重：指一个字符串中非零字符的个数；对于二进制串，即其中‘1’的个数。难度：简单分析：将十进制参数转换为二进制，然后计算其中1的个数即可。 “
浅谈java类与对象 15700786134 java
java是一门面向对象的编程语言，类与对象是其最基本的概念。所谓对象，就是一个个具体的物体，一个人，一台电脑，都是对象。而类，就是对象的一种抽象，是多个对象具有的共性的一种集合，其中包含了属性与方法，就是属于该类的对象所具有的共性。当一个类创建了对象，这个对象就拥有了该类全部的属性，方法。相比于结构化的编程思路，面向对象更适用于人的思维
linux下双网卡同一个IP 被触发 linux
转自： http://q2482696735.blog.163.com/blog/static/250606077201569029441/ 由于需要一台机器有两个网卡，开始时设置在同一个网段的IP，发现数据总是从一个网卡发出，而另一个网卡上没有数据流动。网上找了下，发现相同的问题不少：一、关于双网卡设置同一网段IP然后连接交换机的时候出现的奇怪现象。当时没有怎么思考、以为是生成树
安卓按主页键隐藏程序之后无法再次打开肆无忌惮_ 安卓
遇到一个奇怪的问题，当SplashActivity跳转到MainActivity之后，按主页键，再去打开程序，程序没法再打开（闪一下），结束任务再开也是这样，只能卸载了再重装。而且每次在Log里都打印了这句话"进入主程序"。后来发现是必须跳转之后再finish掉SplashActivity 本来代码： // 销毁这个Activity fin
通过cookie保存并读取用户登录信息实例知了ing JavaScript html
通过cookie的getCookies()方法可获取所有cookie对象的集合；通过getName()方法可以获取指定的名称的cookie；通过getValue()方法获取到cookie对象的值。另外，将一个cookie对象发送到客户端，使用response对象的addCookie()方法。下面通过cookie保存并读取用户登录信息的例子加深一下理解。（1）创建index.jsp文件。在改
JAVA 对象池矮蛋蛋 java ObjectPool
原文地址： http://www.blogjava.net/baoyaer/articles/218460.html Jakarta对象池 ☆为什么使用对象池恰当地使用对象池化技术，可以有效地减少对象生成和初始化时的消耗，提高系统的运行效率。Jakarta Commons Pool组件提供了一整套用于实现对象池化
ArrayList根据条件+for循环批量删除的方法 alleni123 java
场景如下： ArrayList<Obj> list Obj-> createTime, sid. 现在要根据obj的createTime来进行定期清理。（释放内存） ------------------------- 首先想到的方法就是 for(Obj o:list){ if(o.createTime-currentT>xxx){
阿里巴巴“耕地宝”大战各种宝百合不是茶平台战略
“耕地保”平台是阿里巴巴和安徽农民共同推出的一个 “首个互联网定制私人农场”，“耕地宝”由阿里巴巴投入一亿，主要是用来进行农业方面，将农民手中的散地集中起来不仅加大农民集体在土地上面的话语权，还增加了土地的流通与利用率，提高了土地的产量，有利于大规模的产业化的高科技农业的发展，阿里在农业上的探索将会引起新一轮的产业调整，但是集体化之后农民的个体的话语权将更少，国家应出台相应的法律法规保护
Spring注入有继承关系的类（1） bijian1013 java spring
一个类一个类的注入 1.AClass类 package com.bijian.spring.test2; public class AClass { String a; String b; public String getA() { return a; } public void setA(Strin
30岁转型期你能否成为成功人士 bijian1013 成功
很多人由于年轻时走了弯路，到了30岁一事无成，这样的例子大有人在。但同样也有一些人，整个职业生涯都发展得很优秀，到了30岁已经成为职场的精英阶层。由于做猎头的原因，我们接触很多30岁左右的经理人，发现他们在职业发展道路上往往有很多致命的问题。在30岁之前，他们的职业生涯表现很优秀，但从30岁到40岁这一段，很多人
[Velocity三]基于Servlet+Velocity的web应用 bit1129 velocity
什么是VelocityViewServlet 使用org.apache.velocity.tools.view.VelocityViewServlet可以将Velocity集成到基于Servlet的web应用中，以Servlet+Velocity的方式实现web应用 Servlet + Velocity的一般步骤 1.自定义Servlet，实现VelocityViewServl
【Kafka十二】关于Kafka是一个Commit Log Service bit1129 service
Kafka is a distributed, partitioned, replicated commit log service.这里的commit log如何理解？ A message is considered "committed" when all in sync replicas for that partition have applied i
NGINX + LUA实现复杂的控制 ronin47 lua nginx 控制
安装lua_nginx_module 模块 lua_nginx_module 可以一步步的安装，也可以直接用淘宝的OpenResty Centos和debian的安装就简单了。。这里说下freebsd的安装： fetch http://www.lua.org/ftp/lua-5.1.4.tar.gz tar zxvf lua-5.1.4.tar.gz cd lua-5.1.4 ma
java-14.输入一个已经按升序排序过的数组和一个数字，在数组中查找两个数，使得它们的和正好是输入的那个数字 bylijinnan java
public class TwoElementEqualSum { /** * 第 14 题：题目：输入一个已经按升序排序过的数组和一个数字，在数组中查找两个数，使得它们的和正好是输入的那个数字。要求时间复杂度是 O(n) 。如果有多对数字的和等于输入的数字，输出任意一对即可。例如输入数组 1 、 2 、 4 、 7 、 11 、 15 和数字 15 。由于
Netty源码学习-HttpChunkAggregator-HttpRequestEncoder-HttpResponseDecoder bylijinnan java netty
今天看Netty如何实现一个Http Server org.jboss.netty.example.http.file.HttpStaticFileServerPipelineFactory： pipeline.addLast("decoder", new HttpRequestDecoder()); pipeline.addLast(&quo
java敏感词过虑-基于多叉树原理 cngolon 违禁词过虑替换违禁词敏感词过虑多叉树
基于多叉树的敏感词、关键词过滤的工具包，用于java中的敏感词过滤 1、工具包自带敏感词词库，第一次调用时读入词库，故第一次调用时间可能较长，在类加载后普通pc机上html过滤5000字在80毫秒左右，纯文本35毫秒左右。 2、如需自定义词库，将jar包考入WEB-INF工程的lib目录，在WEB-INF/classes目录下建一个 utf-8的words.dict文本文件，
多线程知识 cuishikuan 多线程
T1，T2，T3三个线程工作顺序，按照T1，T2，T3依次进行 public class T1 implements Runnable{ @Override
spring整合activemq dalan_123 java spring jms
整合spring和activemq需要搞清楚如下的东东1、ConnectionFactory分： a、spring管理连接到activemq服务器的管理ConnectionFactory也即是所谓产生到jms服务器的链接 b、真正产生到JMS服务器链接的ConnectionFactory还得
MySQL时间字段究竟使用INT还是DateTime？ dcj3sjt126com mysql
环境：Windows XPPHP Version 5.2.9MySQL Server 5.1 第一步、创建一个表date_test（非定长、int时间） CREATE TABLE `test`.`date_test` (`id` INT NOT NULL AUTO_INCREMENT ,`start_time` INT NOT NULL ,`some_content`
Parcel: unable to marshal value dcj3sjt126com marshal
在两个activity直接传递List<xxInfo>时，出现Parcel: unable to marshal value异常。在MainActivity页面（MainActivity页面向NextActivity页面传递一个List<xxInfo>）： Intent intent = new Intent(this, Next
linux进程的查看上（ps） eksliang linux ps linux ps -l linux ps aux
ps:将某个时间点的进程运行情况选取下来转载请出自出处：http://eksliang.iteye.com/admin/blogs/2119469 http://eksliang.iteye.com ps 这个命令的man page 不是很好查阅，因为很多不同的Unix都使用这儿ps来查阅进程的状态，为了要符合不同版本的需求，所以这个
为什么第三方应用能早于System的app启动 gqdy365 System
Android应用的启动顺序网上有一大堆资料可以查阅了，这里就不细述了，这里不阐述ROM启动还有bootloader，软件启动的大致流程应该是启动kernel -> 运行servicemanager 把一些native的服务用命令启动起来（包括wifi, power, rild, surfaceflinger, mediaserver等等）-> 启动Dalivk中的第一个进程Zygot
App Framework发送JSONP请求(3) hw1287789687 jsonp 跨域请求发送jsonp ajax请求越狱请求
App Framework 中如何发送JSONP请求呢? 使用jsonp,详情请参考:http://json-p.org/ 如何发送Ajax请求呢? (1)登录 /*** * 会员登录 * @param username * @param password */ var user_login=function(username,password){ // aler
发福利，整理了一份关于“资源汇总”的汇总 justjavac 资源
觉得有用的话，可以去github关注：https://github.com/justjavac/awesome-awesomeness-zh_CN 通用 free-programming-books-zh_CN 免费的计算机编程类中文书籍精彩博客集合 hacke2/hacke2.github.io#2 ResumeSample 程序员简历
用 Java 技术创建 RESTful Web 服务 macroli java 编程 Web REST
转载：http://www.ibm.com/developerworks/cn/web/wa-jaxrs/ JAX-RS (JSR-311) 【 Java API for RESTful Web Services 】是一种 Java™ API，可使 Java Restful 服务的开发变得迅速而轻松。这个 API 提供了一种基于注释的模型来描述分布式资源。注释被用来提供资源的位
CentOS6.5-x86_64位下oracle11g的安装详细步骤及注意事项超声波 oracle linux
前言：这两天项目要上线了，由我负责往服务器部署整个项目，因此首先要往服务器安装oracle，服务器本身是CentOS6.5的64位系统，安装的数据库版本是11g，在整个的安装过程中碰到很多的坑，不过最后还是通过各种途径解决并成功装上了。转别写篇博客来记录完整的安装过程以及在整个过程中的注意事项。希望对以后那些刚刚接触的菜鸟们能起到一定的帮助作用。安装过程中可能遇到的问题（注
HttpClient 4.3 设置keeplive 和 timeout 的方法 supben httpclient
ConnectionKeepAliveStrategy kaStrategy = new DefaultConnectionKeepAliveStrategy() { @Override public long getKeepAliveDuration(HttpResponse response, HttpContext context) { long keepAlive
Spring 4.2新特性-@Import注解的升级 wiselyman spring 4
3.1 @Import @Import注解在4.2之前只支持导入配置类在4.2,@Import注解支持导入普通的java类,并将其声明成一个bean 3.2 示例演示java类 package com.wisely.spring4_2.imp; public class DemoService { public void doSomethin