旅途中的宽~

【计算机视觉 | 图像分割】arxiv 计算机视觉关于图像分割的学术速递（7 月 20 日论文合集）

文章目录

一、分割|语义相关(11篇)
- 1.1 Two Approaches to Supervised Image Segmentation
- 1.2 Boundary-Refined Prototype Generation: A General End-to-End Paradigm for Semi-Supervised Semantic Segmentation
- 1.3 Source-Free Domain Adaptive Fundus Image Segmentation with Class-Balanced Mean Teacher
- 1.4 U-CE: Uncertainty-aware Cross-Entropy for Semantic Segmentation
- 1.5 Hierarchical Semantic Perceptual Listener Head Video Generation: A High-performance Pipeline
- 1.6 Source-Free Domain Adaptation for Medical Image Segmentation via Prototype-Anchored Feature Alignment and Contrastive Learning
- 1.7 Longitudinal Data and a Semantic Similarity Reward for Chest X-Ray Report Generation
- 1.8 Space Engage: Collaborative Space Supervision for Contrastive-based Semi-Supervised Semantic Segmentation
- 1.9 ClickSeg: 3D Instance Segmentation with Click-Level Weak Annotations
- 1.10 DenseMP: Unsupervised Dense Pre-training for Few-shot Medical Image Segmentation
- 1.11 SAM-Path: A Segment Anything Model for Semantic Segmentation in Digital Pathology

一、分割|语义相关(11篇)

1.1 Two Approaches to Supervised Image Segmentation

有监督图像分割的两种方法

https://arxiv.org/abs/2307.10123

尽管人类几乎毫不费力地执行，但是根据其感兴趣的组成区域（例如~）来分割2D灰度或彩色图像。背景、对象或对象的部分）构成了科学和技术中最大的挑战之一，这是由于所涉及的降维（3D到2D）、噪声、反射、阴影和遮挡以及许多其它可能的影响。虽然在过去的几十年中，已经分别提出了大量有趣的方法，但主要是随着深度学习的最近发展，获得了更有效和通用的解决方案，目前构成了这类操作的基本比较参考。最近还开发了一种基于多重集的方法，已经描述了能够鼓励性能，结合了空间精度，稳定性和鲁棒性，同时需要最少的计算资源（硬件和/或训练和识别时间）。后一种方法的有趣功能主要是从增强的选择性和灵敏度，以及良好的鲁棒性数据扰动和离群值，允许的重合相似性指数上的多集方法监督图像分割的基础上。在描述了深度学习和多集方法之后，本工作开发了它们之间的两个比较实验，主要目的是说明当应用于所采用的特定类型的数据和参数配置时，它们各自的主要有趣特征。虽然深度学习方法证实了其执行图像分割的潜力，但替代的多集方法允许鼓励准确性，同时需要很少的计算资源。

1.2 Boundary-Refined Prototype Generation: A General End-to-End Paradigm for Semi-Supervised Semantic Segmentation

边界细化原型生成：一种半监督语义分割的通用端到端范型

https://arxiv.org/abs/2307.10097

基于原型的分类方法是机器学习中的经典方法，近年来在半监督语义分割中取得了显著的成功。然而，当前的方法将原型初始化过程与主训练框架隔离，这似乎是不必要的。此外，虽然直接使用K-Means算法生成原型已经考虑了丰富的类内方差，但它可能不是分类任务的最佳解决方案。为了解决这些问题，我们提出了一种新的边界细化原型生成（BRPG）方法，这是纳入到整个训练框架。具体来说，我们的方法样本和集群的高和低置信度的功能分别基于一个置信度阈值，旨在生成更接近类边界的原型。此外，一个自适应的原型优化策略，使原型扩充的类别与分散的特征分布。在PASCAL VOC 2012和Cityscapes数据集上的大量实验证明了该方法的优越性和可扩展性，优于目前最先进的方法。代码可在xxxxxxxxxxxx获得。

1.3 Source-Free Domain Adaptive Fundus Image Segmentation with Class-Balanced Mean Teacher

基于班级均衡的无源域自适应眼底图像分割

https://arxiv.org/abs/2307.09973

本文研究了无源域自适应眼底图像分割，其目的是使预先训练的眼底分割模型适应目标域使用未标记图像。这是一项具有挑战性的任务，因为仅使用未标记数据调整模型是非常危险的。大多数现有的方法主要通过设计技术来从模型的预测小心地生成伪标签并使用伪标签来训练模型来解决这个任务。虽然经常获得积极的适应效果，这些方法遭受两个主要问题。首先，它们往往是相当不稳定的-不正确的伪标签突然出现可能会对模型造成灾难性的影响。其次，它们没有考虑眼底图像的严重类别不平衡，其中前景（例如，杯子）的面积通常很小。本文旨在解决这两个问题，提出班级平衡平均教师（CBMT）模型。CBMT通过提出弱-强增强均值教师学习方案来解决不稳定的问题，其中只有教师模型从弱增强图像生成伪标签来训练学生模型，以强增强图像作为输入。教师被更新为即时训练的学生的移动平均值，这可能是嘈杂的。这防止教师模型突然受到不正确的伪标签的影响。针对类不平衡问题，CBMT提出了一种新的损失校正方法，根据全局统计来突出前景类。实验表明，CBMT很好地解决了这两个问题，并优于现有的方法在多个基准测试。

1.4 U-CE: Uncertainty-aware Cross-Entropy for Semantic Segmentation

U-CE：语义切分的不确定性感知交叉熵

https://arxiv.org/abs/2307.09947

深度神经网络在各种任务中表现出出色的性能，但它们缺乏稳健性、可靠性和过度自信的倾向，给它们在自动驾驶等安全关键应用中的部署带来了挑战。在这方面，量化模型的预测固有的不确定性是解决这些缺点的一个有希望的努力。在这项工作中，我们提出了一种新的不确定性感知交叉熵损失（U-CE），将动态预测的不确定性纳入训练过程中的众所周知的交叉熵损失（CE）的像素加权。通过大量的实验，我们证明了U-CE优于常规CE训练的两个基准数据集，Cityscapes和ACDC，使用两个常见的骨干架构，ResNet-18和ResNet-101。使用U-CE，我们设法训练模型，不仅提高其分割性能，而且在训练后提供有意义的不确定性。因此，我们致力于开发更强大、更可靠的分段模型，最终推动安全关键应用及其他领域的最新技术。

1.5 Hierarchical Semantic Perceptual Listener Head Video Generation: A High-performance Pipeline

层次化语义知觉听者头部视频生成：一种高性能的流水线

https://arxiv.org/abs/2307.09821

在双向的说者-听者互动中，听者的头部反应与说者的头部动作共同构成了重要的非言语语义表达。听者头部生成任务旨在基于说话者的音频和听者的参考图像来合成响应性听者的头部视频。相对于说话人，从说话人的声音和视觉信息中捕捉相关线索更具挑战性。根据ViCo基线方案，我们提出了一种高性能的解决方案，通过增强音频编码器模块的分层语义提取能力，并改进解码器部分，渲染器和后处理模块。我们的解决方案在官方排行榜上获得了第一名的听头生成轨道。本文是ACM Multimedia 2023会议ViCo@2023 Conversational Head Generation Challenge的技术报告。

1.6 Source-Free Domain Adaptation for Medical Image Segmentation via Prototype-Anchored Feature Alignment and Contrastive Learning

基于原型锚定特征对齐和对比学习的无源域自适应医学图像分割

https://arxiv.org/abs/2307.09769

无监督域自适应（UDA）技术能够将从标记源域学习到的知识转移到未标记目标域，因此受到越来越多的关注。然而，典型的UDA方法需要同时访问源和目标域数据，这在很大程度上限制了其在医疗场景中的应用，其中源数据由于隐私问题而通常不可用。为了解决源数据缺失的问题，我们提出了一个新的两阶段无源域自适应（SFDA）的医学图像分割框架，其中只有一个训练有素的源分割模型和未标记的目标数据是可用的领域自适应。具体来说，在原型锚定特征对齐阶段，我们首先利用预先训练的像素分类器的权重作为源原型，其保留了源特征的信息。然后，我们引入了双向传输，通过最小化其预期成本，将目标功能与类原型对齐。最重要的是，还设计了对比学习阶段，以利用具有不可靠预测的那些像素来获得更紧凑的目标特征分布。在跨模态医学分割任务上的大量实验表明，与最先进的SFDA方法甚至一些UDA方法相比，我们的方法在大域差异设置中具有优越性。代码可在https://github.com/CSCYQJ/MICCAI23-ProtoContra-SFDA上获得。

1.7 Longitudinal Data and a Semantic Similarity Reward for Chest X-Ray Report Generation

纵向数据与胸片报告生成的语义相似性奖励

https://arxiv.org/abs/2307.09758

胸部X射线（CXR）报告生成是提高CXR解释效率的有前途的方法。然而，在实现这一目标之前，需要显著提高诊断准确性。基于此，我们提出了一个框架，更内联放射科医生的工作流程，考虑纵向数据。这里，解码器另外经由提示以来自对象的先前成像研究的报告为条件。我们还提出了一个新的奖励强化学习的基础上CXR-BERT，它计算报告之间的相似性。我们在MIMIC-CXR数据集上进行实验。结果表明，纵向数据改进了CXR报告的生成。CXR-BERT也被证明是基于RadGraph的当前最先进的奖励的有前途的替代品。这项调查表明，纵向CXR报告生成可以提供诊断准确性的大幅提高。我们的拥抱脸模型可在以下网站获得：https://huggingface.co/aehrc/cxrmate和代码可在：https://github.com/aehrc/cxrmate。

1.8 Space Engage: Collaborative Space Supervision for Contrastive-based Semi-Supervised Semantic Segmentation

Space Engage：基于对比的半监督语义切分的协同空间监督

https://arxiv.org/abs/2307.09755

半监督语义分割（S4）旨在训练具有有限的标记图像和大量未标记图像的分割模型。为了提高表示的鲁棒性，强大的方法在潜在空间中引入逐像素对比学习方法（即，表示空间），其以完全监督的方式将表示聚合到它们的原型。然而，以前的基于对比的S4方法仅仅依赖于监督从模型的输出（logits）在logit空间在未标记的训练。相比之下，我们利用logit空间和表示空间的输出，以获得合作的方式监督。来自两个空间的监督起着两个作用：1）借助于表示降低了过度拟合逻辑中不正确语义信息的风险; 2）加强两个空间之间的知识交流。此外，与以前的方法不同，我们使用表征和原型之间的相似性作为一个新的指标倾斜训练那些表现不佳的表征和实现一个更有效的对比学习过程。两个公共基准的结果表明，我们的方法相比，国家的最先进的方法的竞争性能。

1.9 ClickSeg: 3D Instance Segmentation with Click-Level Weak Annotations

ClickSeg：带点击级弱标注的3D实例分割

https://arxiv.org/abs/2307.09732

3D实例分割方法通常需要完全注释的密集标签用于训练，这是昂贵的获得。在本文中，我们提出了ClickSeg，一种新的点击级弱监督3D实例分割方法，只需要一个点，每个实例注释。由于标签极其有限，这一问题非常具有挑战性，以前很少解决。我们首先开发了一种基线弱监督训练方法，该方法通过模型本身为未标记的数据生成伪标签。为了利用点击级注释设置的属性，我们进一步提出了一个新的训练框架。代替直接使用模型推理的方式，即均值移位聚类，为了生成伪标签，我们建议使用具有固定初始种子的k均值：注释的要点。新的相似性度量进一步设计用于聚类。在ScanNetV 2和S3 DIS数据集上的实验表明，所提出的ClickSeg算法比先前的最佳弱监督实例分割结果有很大的差距（例如，ScanNetV 2上的+9.4% mAP）。仅使用0.02%的监督信号，ClickSeg实现了完全监督对应物的$\sim$90%的准确性。同时，它还实现了最先进的语义分割结果之间的弱监督方法，使用相同的注释设置。

1.10 DenseMP: Unsupervised Dense Pre-training for Few-shot Medical Image Segmentation

DenseMP：用于Few-Shot医学图像分割的无监督密集预训练

https://arxiv.org/abs/2307.09604

Few-Shot医学图像的语义分割是医学图像分析领域中的一个重要问题。然而，现有的方法在训练阶段难以应对数据稀缺的挑战，导致过度拟合。为了缓解这个问题，我们引入了一种新的无监督密集Few-Shot医学图像分割模型训练管道（DenseMP），它利用了无监督密集预训练。DenseMP由两个不同的阶段组成：（1）分割感知的密集对比预训练，以及（2）Few-Shot感知的超像素引导的密集预训练。这些阶段协同产生专门为Few-Shot医学图像分割设计的预训练的初始模型，其随后可以在目标数据集上进行微调。我们提出的流水线显着提高了广泛认可的Few-Shot分割模型PA-Net的性能，在Abd-CT和Abd-MRI数据集上实现了最先进的结果。代码将在验收后发布。

1.11 SAM-Path: A Segment Anything Model for Semantic Segmentation in Digital Pathology

SAM-PATH：一种用于数字病理语义分割的任意分段模型

https://arxiv.org/abs/2307.09570

病理实体的语义分割在计算病理学工作流程中具有重要的临床价值。基础模型，诸如分段任意模型（SAM），最近已经提出用于分段任务中的普遍使用。SAM在自然图像的实例分割方面表现出显著的前景。然而，SAM对计算病理学任务的适用性由于以下因素而受到限制：（1）缺乏SAM训练中使用的全面病理学数据集，和（2）SAM的设计不是针对语义分割任务固有地优化的。在这项工作中，我们适应SAM的语义分割引入可训练类提示，然后通过纳入病理编码器，特别是病理学基础模型进一步增强。我们的框架，SAM-Path增强SAM的能力，进行语义分割的数字病理学没有人类输入提示。通过两个公共病理数据集，BCSS和CRAC数据集的实验，我们证明，微调与可训练类提示和后处理香草SAM与手动提示27.52%的Dice得分和71.63%的IOU。在这两个数据集上，所提出的额外病理学基础模型进一步实现了Dice评分的相对改善5.07%至5.12%，IOU的相对改善4.50%至8.48%。

ChatGPT大模型极简应用开发-目录 uncle_ll #GPT chatgpt 人工智能 LLM 大模型 GPT
引言要理解ChatGPT，了解其背后的Transformer架构和GPT技术一路的演进则变得非常必要。ChatGPT背后的LLM技术使普通人能够通过自然语言完成过去只能由程序员通过编程语言实现的任务，这是一场巨大的变革。然而，人类通常容易高估技术的短期影响而低估长期影响。进一步学习关于LLM技术原理的论文、视频、图书等。在阅读这本书或者后续学习过程中，你有任何疑问都可以随时请教ChatGPT等工具
PCL 生成空间圆点云【2025最新版】点云侠 PCL学习算法 c++3d 计算机视觉开发语言
目录一、算法原理二、代码实现三、结果展示本文由CSDN点云侠原创，原文链接。博客长期更新，最近一次更新时间为：2025年1月17日。代码在PCL1.14.1中测试通过。一、算法原理三维空间圆形式如下：三维空间圆的参数方程：{
Open3D 手动裁剪点云【2025最新版】点云侠 python点云处理几何学 python 3d 计算机视觉算法
目录一、概述1、主要函数2、基础操作二、代码实现三、结果展示四、相关链接博客长期更新，本文最近更新时间为：2025年1月18日。一、概述 Open3d中的VisualizerWithEditing类提供了图形用户交互功能。draw_geometries_with_editing([pcd])函数提供了顶点选择和裁剪功能。1、主要函数defdraw_geometries_with_editing(
PCL 点云按曲率大小渲染颜色【2025最新版】点云侠 PCL学习可视化计算机视觉开发语言 3d c++
目录一、表面曲率二、代码实现三、结果展示博客长期更新，本文最近更新时间为：2025年1月6日。一、表面曲率本案例中，所使用的曲率是指根据点云的特征值计算出来的表面曲率。定义如下：任意一点PPP点的特征值满足
Pytorch 三小时极限入门教程 power-辰南人工智能深度学习 pytorch 人工智能
一、引言在当今的人工智能领域，深度学习占据了举足轻重的地位。而Pytorch作为一款广受欢迎的深度学习框架，以其简洁、灵活的特性，吸引了大量开发者投身其中。无论是科研人员探索前沿的神经网络架构，还是工程师将深度学习技术落地到实际项目，Pytorch都提供了强大的支持。本教程将带你从零基础开始，一步步深入了解Pytorch的核心知识，助你顺利踏上深度学习的征程。二、Pytorch基础环境搭建安装An
PCL 点云高程渲染：实现点云高程信息的颜色渲染技术征服冒险 PCL
PCL点云高程渲染：实现点云高程信息的颜色渲染点云渲染在计算机视觉和图形学中具有重要的应用价值。在处理点云数据时，一种常见的需求是通过将高程信息映射到颜色空间，以实现对点云的可视化。本文将介绍如何使用PCL（PointCloudLibrary）库实现点云的高程渲染，并提供相应的源代码。引言在开始之前，我们首先需要了解点云的基本概念。点云是由大量的三维点组成的数据集合，每个点都具有X、Y和Z坐标。点
思维图GOT：用大语言模型解决复杂问题硅谷秋水大模型人工智能机器学习语言模型人工智能自然语言处理
23年8月份来自瑞士和波兰的大学以及一个数据公司Cledar的大语言模型论文“GraphofThoughts:SolvingElaborateProblemswithLargeLanguageModels“。思维图（GoT）是一个框架，提高大型语言模型（LLM）中的提示功能，超出思维链或思维树(ToT)等范式所提供的能力。GoT的关键思想和主要优势是能够将LLM生成的信息建模为任意图，其中信息单位
融云 IM 干货丨获取会话列表或者历史消息报 25101 的错误？融云im即时通讯
出现获取会话列表或者历史消息报25101错误，主要有以下几种原因及解决方法：融云平台1、SDK版本过低：如果未执行撤回动作却出现25101报错，这是低版本SDK的已知问题，建议升级至最新SDK。2、未开通单群聊云存储服务：出现25101报错还可能是由于未开通单群聊云存储服务。可到开发者后台-IM商用版开通该服务，服务开通后30分钟左右生效。其他平台若以上平台的解决方法均不适用，建议检查以下通用方面
Git 的引用规格（refspec）语法张紫娃 GIT git elasticsearch 大数据
目录引用规格语法格式常见用法强制-f和+的区别gitfetchoriginremote-branch:local-branch和gitpushoriginlocal-branch:remote-branch区别引用规格语法格式格式如下：[+]:常见用法#fetchgitfetchorigin:从远程仓库origin的分支拉取最新的提交，并将其创建或更新为本地的分支gitfetchorigin:re
华为OD机试C卷-- 跳格子3（Java & JS & Python & C）飞码创造者华为OD机试题库华为od c语言 java javascript python
获取题库不需要订阅专栏，可直接私信我进入CSDN领军人物top1博主的华为OD交流圈观看完整题库、最新面试实况、考试报告等内容以及大佬一对一答疑。题目描述小明和朋友们一起玩跳格子游戏，每个格子上有特定的分数score=[1,-1,-6,7,-17,7]，从起点score[0]开始，每次最大的步长为k，请你返回小明跳到终点score[n-1]时，能得到的最大得分。输入描述第一行输入总的格子数量n第二
【论文翻译】GOT-OCR论文翻译——General OCR Theory: Towards OCR-2.0 via a Unified End-to-end Model 机器白学论文翻译 ocr 论文阅读论文翻译
论文原文链接：https://arxiv.org/abs/2409.01704特别声明，本文不做任何商业用途，仅作为个人学习相关论文的翻译记录。本文对原文内容直译，一切以论文原文内容为准，对原文作者表示最大的敬意。如有任何侵权请联系我下架相关文章。目录通用OCR理论：通过统一的端到端模型迈向OCR-2.00摘要1引言2相关工作2.1传统OCR2.2基于LVLM的OCR3通用OCR理论3.1框架3.
NVIDIA下一代Hopper架构曝光，采用5nm工艺晶体管超1400亿 Java小海. 架构人工智能后端程序人生 java
据媒体报道，NVIDIA下一代主要面向高性能计算、人工智能等Hopper架构，将会采用5nm工艺制程，晶体管多达1400亿个，面积核心达到了900平方毫米，是有史以来最大的GPU。作为参考，NVIDIA自家旗舰Ampere架构的A100为542亿个晶体管（每平方毫米约为6560万个晶体管），AMD阵营中采用Aldebaran架构的InstinctMI200系列为582亿个晶体管（每平方米约为736
NVIDIA Hopper解说白总Server redis 数据库缓存 rust mongodb 大数据数据仓库
NVIDIAHopper架构是NVIDIA推出的面向高性能计算（HPC）和人工智能（AI）的最新一代GPU架构。它代表了NVIDIA在加速计算领域的最新进展，旨在为AI训练和推理、HPC应用提供前所未有的性能提升。NVIDIAHopper架构和基于该架构的GPU产品H100的详细信息：NVIDIAHopper架构技术特点：第四代TensorCore：Hopper架构引入了第四代TensorCore
LLMs，即大型语言模型 maopig AI 语言模型人工智能自然语言处理
LLMs，即大型语言模型，是一类基于深度学习的人工智能模型，它们通过海量的数据和大量的计算资源进行训练，可以理解和生成自然语言。LLMs的核心架构是Transformer，其关键在于自注意力机制，使得模型能够同时对输入的所有位置进行“关注”，从而更好地捕捉长距离的语义依赖关系。LLMs在众多领域都有广泛的应用，如自然语言理解（NLU），语言生成，以及语音识别和合成等。例如，它们能够理解人类的语言
【论文速读】| 利用大语言模型在灰盒模糊测试中生成初始种子云起无垠论文速读/精读语言模型 p2p 人工智能
基本信息论文标题:HarnessingLargeLanguageModelsforSeedGenerationinGreyb0xFuzzing作者:WenxuanShi,YunhangZhang,XinyuXing,JunXu作者单位:NorthwesternUniversity,UniversityofUtah关键词:Greyb0xfuzzing,LargeLanguageModels,Seed
第79期 | GPTSecurity周报云起无垠 GPTSecurity AIGC gpt
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大语言模型（LLM）等安全领域应用的知识。在这里，您可以找到关于GPT/AIGC/LLM最新的研究论文、博客文章、实用的工具和预设指令（Prompts）。现为了更好地知悉近一周的贡献内容，现总结如下。SecurityPapers1.TrojanWhi
第60期 | GPTSecurity周报云起无垠 GPTSecurity 人工智能语言模型网络安全
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大语言模型（LLM）等安全领域应用的知识。在这里，您可以找到关于GPT/AIGC/LLM最新的研究论文、博客文章、实用的工具和预设指令（Prompts）。现为了更好地知悉近一周的贡献内容，现总结如下。SecurityPapers1.映射你的模型：评估
【第十章——数据可视化之地图构建】【最新！黑马程序员Python自学课程笔记】课上笔记+案例源码+作业源码嗯哈！信息可视化 python 笔记 pycharm
第十章-数据可视化之地图构建10.1数据可视化-地图-基础地图使用注意！！！现在的版本，需要加：省，市"""演示地图可视化的基本使用"""frompyecharts.chartsimportMapfrompyecharts.optionsimportVisualMapOpts#准备地图对象map=Map()#准备数据data=[("北京市",9),("上海市",8),("湖南省",5),("台湾省
全新 Hopper 架构的Transformer 引擎有什么特点？扫地的小何尚人工智能
Transformer引擎是全新Hopper架构的一部分，将显著提升AI性能和功能，并助力在几天或几小时内训练大型模型。Transformer模型是当今广泛使用的语言模型（例如asBERT和GPT-3）的支柱。Transformer模型最初针对自然语言处理用例而开发，但因其通用性，现在逐步应用于计算机视觉、药物研发等领域。与此同时，模型大小不断呈指数级增长，现在已达到数万亿个参数。由于计算量巨大，
Apache PDFBox添加maven依赖,pdf转成图片 iteye_10392 网站设计 apache maven pdf
要使用ApachePDFBox将PDF文件转换为图片，并将其添加到Maven项目中，您可以按照以下步骤操作：1.添加Maven依赖在您的pom.xml文件中添加ApachePDFBox的依赖。请确保使用最新版本的PDFBox库。截至2025年，以下是推荐的配置：org.apache.pdfboxpdfbox2.0.27org.apache.pdfboxfontbox2.0.27请检查MavenCe
大语言模型（LLMs）入门教程（非常详细）从零基础入门到精通，看完这一篇就够了大模型零基础教程语言模型人工智能自然语言处理大模型
大语言模型（LLMs）作为人工智能（AI）领域的一项突破性发展，已经改变了自然语言处理（NLP）和机器学习（ML）应用的面貌。这些模型，包括OpenAI的GPT-4o和Google的gemini系列等，已经展现出了在理解和生成类人文本方面的令人印象深刻的能力，使它们成为各行各业的宝贵工具。如下这份指南将涵盖LLMs的基础知识、训练过程、用例和未来趋势……一.WhatareLargeLanguage
hive表修改字段类型没有级连导致历史分区报错尘世壹俗人大数据Hive技术 hive hadoop 数据仓库
一：问题背景修改hive的分区表时有级连概念，指字段的最新状态，默认只对往后的分区数据生效，而之前的分区保留历史元数据状态。好处就是修改语句的效率很快，坏处就是如果历史分区的数据还有用，那就回发生分区元数据和表元数据的不一致报错最终导致：presto或hive任务抽取历史分区会报如下的错误Thereisamismatchbetweenthetableandpartitionschemas.Thet
BERT详解 comli_cn 大模型笔记 bert 人工智能深度学习
1.背景结构1.1基础知识BERT（BidirectionalEncoderRepresentationsfromTransformers）是谷歌提出，作为一个Word2Vec的替代者，其在NLP领域的11个方向大幅刷新了精度，可以说是前几年来自残差网络最优突破性的一项技术了。论文的主要特点以下几点：使用了双向Transformer作为算法的主要框架，之前的模型是从左向右输入一个文本序列，或者将l
华为OD机试E卷 - 跳格子3 （Java & Python& JS & C++ & C ）算法大师最新华为OD机试华为od java python c语言 javascript c++华为OD机试E卷 -跳格子3
最新华为OD机试真题目录：点击查看目录华为OD面试真题精选：点击立即查看题目描述小明和朋友们一起玩跳格子游戏，每个格子上有特定的分数score=[1,-1,-6,7,-17,7]，从起点score[0]开始，每次最大的步长为k，请你返回小明跳到终点score[n-1]时，能得到的最大得分。输入描述第一行输入总的格子数量n第二行输入每个格子的分数score[i]第三行输入最大跳的步长k备注格子的总长
华为OD机试E卷 - 查找接口成功率最优时间段（Java & Python& JS & C++ & C ）算法大师最新华为OD机试华为od java python 华为OD机试E卷 javascript c++
最新华为OD机试真题目录：点击查看目录华为OD面试真题精选：点击立即查看题目描述服务之间交换的接口成功率作为服务调用关键质量特性，某个时间段内的接口失败率使用一个数组表示，数组中每个元素都是单位时间内失败率数值，数组中的数值为0~100的整数，给定一个数值(minAverageLost)表示某个时间段内平均失败率容忍值，即平均失败率小于等于minAverageLost，找出数组中最长时间段，如果未
1.8 GPT-4：开创人工智能的新纪元少林码僧 AI大模型应用实战专栏人工智能
GPT-4：开创人工智能的新纪元自从OpenAI推出GPT-4以来，人工智能领域经历了显著的突破。作为“生成预训练转换器”家族中的最新成员，GPT-4不仅在功能上进行了提升，更在语言处理能力、理解深度以及适应性方面带来了全新的变革。本篇文章将深入探讨GPT-4的特点、创新以及它如何定义未来人工智能技术的发展。GPT-4的技术亮点1.规模与深度的进一步提升GPT-4的规模比前代模型更大，训练数据量和
第83期 | GPTSecurity周报云起无垠 GPTSecurity 人工智能网络安全
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大语言模型（LLM）等安全领域应用的知识。在这里，您可以找到关于GPT/AIGC/LLM最新的研究论文、博客文章、实用的工具和预设指令（Prompts）。现为了更好地知悉近一周的贡献内容，现总结如下。SecurityPapers1.混乱中建立秩序：人
【Python】已解决：ModuleNotFoundError: No module named ‘sklearn‘ 屿小夏 python sklearn 人工智能
个人简介：某不知名博主，致力于全栈领域的优质博客分享|用最优质的内容带来最舒适的阅读体验！文末获取免费IT学习资料！文末获取更多信息精彩专栏推荐订阅收藏专栏系列直达链接相关介绍书籍分享点我跳转书籍作为获取知识的重要途径，对于IT从业者来说更是不可或缺的资源。不定期更新IT图书，并在评论区抽取随机粉丝，书籍免费包邮到家AI前沿点我跳转探讨人工智能技术领域的最新发展和创新，涵盖机器学习、深度学习、自然
华为OD机试C卷-- 机器人走迷宫（Java & JS & Python）飞码创造者华为OD机试题库华为od c语言机器人 javascript python java
获取题库不需要订阅专栏，可直接私信我进入CSDN领军人物top1博主的华为OD交流圈观看完整题库、最新面试实况、考试报告等内容以及大佬一对一答疑。题目描述1.房间由XY的方格组成，例如下图为6*4的大小。每一个方格以坐标(x，y)描述。2.机器人固定从方格(0，0)出发，只能向东或者向北前进。出口固定为房间的最东北角，如下图的方格(5，3)。用例保证机器人可以从入口走到出口。3.房间有些方格是墙壁
3D UNet和Swin-UNETR 学無芷境计算机视觉
3DUNet和Swin-UNETR都是用于医学图像分析的深度学习网络，它们对三维（3D）数据进行特征提取和分割。3DUNet3DUNet是UNet架构的一个变体，专门设计用于处理三维医学图像数据。UNet最初是为二维（2D）图像分割任务设计的，具有典型的编码器-解码器结构。3DUNet扩展了这种架构，以便更好地处理具有深度信息的体积数据，如CT或MRI扫描。主要特点：编码器：逐渐下采样图像，提取并
统一思想认识永夜-极光思想
1.统一思想认识的基础,才能有的放矢原因: 总有一种描述事物的方式最贴近本质,最容易让人理解. 如何让教育更轻松,在于找到最适合学生的方式. 难点在于,如何模拟对方的思维基础选择合适的方式. &
Joda Time使用笔记 bylijinnan java joda time
Joda Time的介绍可以参考这篇文章： http://www.ibm.com/developerworks/cn/java/j-jodatime.html 工作中也常常用到Joda Time，为了避免每次使用都查API，记录一下常用的用法： /** * DateTime变化（增减） */ @Tes
FileUtils API eksliang FileUtils FileUtils API
转载请出自出处：http://eksliang.iteye.com/blog/2217374 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
各种新兴技术不懂事的小屁孩技术
1:gradle Gradle 是以 Groovy 语言为基础，面向Java应用为主。基于DSL（领域特定语言）语法的自动化构建工具。现在构建系统常用到maven工具，现在有更容易上手的gradle，搭建java环境: http://www.ibm.com/developerworks/cn/opensource/os-cn-gradle/ 搭建android环境： http://m
tomcat6的https双向认证酷的飞上天空 tomcat6
1.生成服务器端证书 keytool -genkey -keyalg RSA -dname "cn=localhost,ou=sango,o=none,l=china,st=beijing,c=cn" -alias server -keypass password -keystore server.jks -storepass password -validity 36
托管虚拟桌面市场势不可挡蓝儿唯美
用户还需要冗余的数据中心，dinCloud的高级副总裁兼首席营销官Ali Din指出。该公司转售一个MSP可以让用户登录并管理和提供服务的用于DaaS的云自动化控制台，提供服务或者MSP也可以自己来控制。在某些情况下，MSP会在dinCloud的云服务上进行服务分层，如监控和补丁管理。 MSP的利润空间将根据其参与的程度而有所不同，Din说。 “我们有一些合作伙伴负责将我们推荐给客户作为个
spring学习——xml文件的配置 a-john spring
在Spring的学习中，对于其xml文件的配置是必不可少的。在Spring的多种装配Bean的方式中，采用XML配置也是最常见的。以下是一个简单的XML配置文件： <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.or
HDU 4342 History repeat itself 模拟 aijuans 模拟
来源：http://acm.hdu.edu.cn/showproblem.php?pid=4342 题意：首先让求第几个非平方数，然后求从1到该数之间的每个sqrt(i)的下取整的和。思路：一个简单的模拟题目，但是由于数据范围大，需要用__int64。我们可以首先把平方数筛选出来，假如让求第n个非平方数的话，看n前面有多少个平方数，假设有x个，则第n个非平方数就是n+x。注意两种特殊情况，即
java中最常用jar包的用途 asia007 java
java中最常用jar包的用途 jar包用途axis.jarSOAP引擎包commons-discovery-0.2.jar用来发现、查找和实现可插入式接口，提供一些一般类实例化、单件的生命周期管理的常用方法.jaxrpc.jarAxis运行所需要的组件包saaj.jar创建到端点的点到点连接的方法、创建并处理SOAP消息和附件的方法，以及接收和处理SOAP错误的方法. w
ajax获取Struts框架中的json编码异常和Struts中的主控制器异常的解决办法百合不是茶 js json编码返回异常
一:ajax获取自定义Struts框架中的json编码出现以下问题: 1,强制flush输出 json编码打印在首页 2, 不强制flush js会解析json 打印出来的是错误的jsp页面却没有跳转到错误页面 3, ajax中的dataType的json 改为text 会
JUnit使用的设计模式 bijian1013 java 设计模式 JUnit
JUnit源代码涉及使用了大量设计模式 1、模板方法模式（Template Method）定义一个操作中的算法骨架，而将一些步骤延伸到子类中去，使得子类可以不改变一个算法的结构，即可重新定义该算法的某些特定步骤。这里需要复用的是算法的结构，也就是步骤，而步骤的实现可以在子类中完成。
Linux常用命令（摘录） sunjing crond chkconfig
chkconfig --list 查看linux所有服务 chkconfig --add servicename 添加linux服务 netstat -apn | grep 8080 查看端口占用 env 查看所有环境变量 echo $JAVA_HOME 查看JAVA_HOME环境变量安装编译器 yum install -y gcc
【Hadoop一】Hadoop伪集群环境搭建 bit1129 hadoop
结合网上多份文档，不断反复的修正hadoop启动和运行过程中出现的问题，终于把Hadoop2.5.2伪分布式安装起来，跑通了wordcount例子。Hadoop的安装复杂性的体现之一是，Hadoop的安装文档非常多，但是能一个文档走下来的少之又少，尤其是Hadoop不同版本的配置差异非常的大。Hadoop2.5.2于前两天发布，但是它的配置跟2.5.0，2.5.1没有分别。 &nb
Anychart图表系列五之事件监听白糖_ chart
创建图表事件监听非常简单：首先是通过addEventListener('监听类型',js监听方法)添加事件监听，然后在js监听方法中定义具体监听逻辑。以钻取操作为例，当用户点击图表某一个point的时候弹出point的name和value，代码如下： <script> //创建AnyChart var chart = new AnyChart(); //添加钻取操作&quo
Web前端相关段子 braveCS web前端
Web标准：结构、样式和行为分离使用语义化标签 0）标签的语义：使用有良好语义的标签，能够很好地实现自我解释，方便搜索引擎理解网页结构，抓取重要内容。去样式后也会根据浏览器的默认样式很好的组织网页内容，具有很好的可读性，从而实现对特殊终端的兼容。 1）div和span是没有语义的：只是分别用作块级元素和行内元素的区域分隔符。当页面内标签无法满足设计需求时，才会适当添加div
编程之美-24点游戏 bylijinnan 编程之美
import java.util.ArrayList; import java.util.Arrays; import java.util.HashSet; import java.util.List; import java.util.Random; import java.util.Set; public class PointGame { /**编程之美
主页面子页面传值总结 chengxuyuancsdn 总结
1、showModalDialog returnValue是javascript中html的window对象的属性,目的是返回窗口值,当用window.showModalDialog函数打开一个IE的模式窗口时,用于返回窗口的值主界面 var sonValue=window.showModalDialog("son.jsp"); 子界面 window.retu
[网络与经济]互联网+的含义 comsci 互联网+
互联网+后面是一个人的名字 = 网络控制系统互联网+你的名字 = 网络个人数据库每日提示:如果人觉得不舒服,千万不要外出到处走动,就呆在床上,玩玩手游,更不能够去开车,现在交通状况不
oracle 创建视图 with check option daizj 视图 view oralce
我们来看下面的例子： create or replace view testview as select empno,ename from emp where ename like ‘M%’ with check option; 这里我们创建了一个视图，并使用了with check option来限制了视图。然后我们来看一下视图包含的结果： select * from testv
ToastPlugin插件在cordova3.3下使用 dibov Cordova
自己开发的Todos应用，想实现“ 再按一次返回键退出程序 ”的功能，采用网上的ToastPlugins插件，发现代码或文章基本都是老版本，运行问题比较多。折腾了好久才弄好。下面吧基于cordova3.3下的ToastPlugins相关代码共享。 ToastPlugin.java package&nbs
C语言22个系统函数 dcj3sjt126com c function
C语言系统函数一、数学函数下列函数存放在math.h头文件中Double floor(double num) 求出不大于num的最大数。Double fmod(x, y) 求整数x/y的余数。Double frexp(num, exp); double num; int *exp; 将num分为数字部分（尾数）x和以2位的指数部分n，即num=x*2n，指数n存放在exp指向的变量中，返回x。D
开发一个类的流程 dcj3sjt126com 开发
本人近日根据自己的开发经验总结了一个类的开发流程。这个流程适用于单独开发的构件，并不适用于对一个项目中的系统对象开发。开发出的类可以存入私人类库，供以后复用。以下是开发流程： 1. 明确类的功能，抽象出类的大概结构 2. 初步设想类的接口 3. 类名设计（驼峰式命名） 4. 属性设置(权限设置) 判断某些变量是否有必要作为成员属
java 并发 shuizhaosi888 java 并发
能够写出高伸缩性的并发是一门艺术在JAVA SE5中新增了3个包 java.util.concurrent java.util.concurrent.atomic java.util.concurrent.locks 在java的内存模型中，类的实例字段、静态字段和构成数组的对象元素都会被多个线程所共享，局部变量与方法参数都是线程私有的，不会被共享。
Spring Security（11）——匿名认证 234390216 Spring Security ROLE_ANNOYMOUS 匿名
匿名认证目录 1.1 配置 1.2 AuthenticationTrustResolver 对于匿名访问的用户，Spring Security支持为其建立一个匿名的AnonymousAuthenticat
NODEJS项目实践0.2[ express,ajax通信...] 逐行分析JS源代码 Ajax nodejs express
一、前言通过上节学习，我们已经 ubuntu系统搭建了一个可以访问的nodejs系统，并做了nginx转发。本节原要做web端服务及 mongodb的存取，但写着写着，web端就
在Struts2 的Action中怎样获取表单提交上来的多个checkbox的值 lhbthanks java html struts checkbox
第一种方法：获取结果String类型在 Action 中获得的是一个 String 型数据，每一个被选中的 checkbox 的 value 被拼接在一起，每个值之间以逗号隔开(,)。所以在 Action 中定义一个跟 checkbox 的 name 同名的属性来接收这些被选中的 checkbox 的 value 即可。以下是实现的代码：前台 HTML 代码：
003.Kafka基本概念 nweiren hadoop kafka
Kafka基本概念：Topic、Partition、Message、Producer、Broker、Consumer。 Topic：消息源（Message）的分类。 Partition： Topic物理上的分组，一
Linux环境下安装JDK roadrunners jdk linux
1、准备工作创建JDK的安装目录： mkdir -p /usr/java/ 下载JDK，找到适合自己系统的JDK版本进行下载： http://www.oracle.com/technetwork/java/javase/downloads/index.html 把JDK安装包下载到/usr/java/目录，然后进行解压： tar -zxvf jre-7
Linux忘记root密码的解决思路 tomcat_oracle linux
1：使用同版本的linux启动系统，chroot到忘记密码的根分区passwd改密码　　2：grub启动菜单中加入init=/bin/bash进入系统，不过这时挂载的是只读分区。根据系统的分区情况进一步判断. 　　3: grub启动菜单中加入 single以单用户进入系统. 　　4:用以上方法mount到根分区把/etc/passwd中的root密码去除　　例如: 　　ro
跨浏览器 HTML5 postMessage 方法以及 message 事件模拟实现 xueyou jsonp jquery 框架 UI html5
postMessage 是 HTML5 新方法，它可以实现跨域窗口之间通讯。到目前为止，只有 IE8+, Firefox 3, Opera 9, Chrome 3和 Safari 4 支持，而本篇文章主要讲述 postMessage 方法与 message 事件跨浏览器实现。postMessage 方法 JSONP 技术不一样，前者是前端擅长跨域文档数据即时通讯，后者擅长针对跨域服务端数据通讯，p