Mars_prime

HALLUSIONBENCH: An Advanced Diagnostic Suite for Entangled Language Hallucination & Visual Illusion

HALLUSIONBENCH: An Advanced Diagnostic Suite for Entangled Language Hallucination & Visual Illusion in Large Vision-Language Models
----
HALLUSIONBENCH：大型视觉语言模型中纠缠语言幻觉和视觉错觉的高级诊断套件

马里兰大学学院公园分校

Abstract

我们推出“HALLUSIONBENCH1”，这是一个专为评估图像上下文推理而设计的综合基准。该基准测试强调对视觉数据的细致入微的理解和解释，对高级大型视觉语言模型 (LVLM)（例如 GPT-4V(ision) 和 LLaVA-1.5）提出了重大挑战。该基准包括 346 张图像和 1129 个问题，全部由人类专家精心制作。我们为这些视觉问题引入了一种新颖的结构，旨在建立对照组。这种结构使我们能够对模型的响应倾向、逻辑一致性以及各种故障模式进行定量分析。在 HALLUSIONBENCH 的评估中，我们对 13 个不同的模型进行了基准测试，突出显示最先进的 GPT-4V 实现了 31.42% 的问题对准确率。值得注意的是，所有其他评估模型的准确率均低于 16%。此外，我们的分析不仅强调了观察到的故障模式，包括语言幻觉和视觉错觉，而且加深了对这些陷阱的理解。我们在 HALLUSIONBENCH 中进行的综合案例研究揭示了 LVLM 中幻觉和错觉的挑战。根据这些见解，我们提出了未来改进的潜在途径。可以通过此链接访问数据和注释。

1. Introduction
----
一、简介

近年来，大型语言模型（LLM）[8,9,25,37,42,43,56]凭借语言理解和内容生成的能力彻底改变了机器学习领域，在各个领域提供了前所未有的能力和潜力。大量的应用程序。法学硕士与计算机视觉系统的集成催生了大型视觉语言模型（LVLM）[5,7,21,26,31,37,38,45,46,51,58]。这些模型在各种应用中展示了深厚的能力，并显着提高了图像推理任务的性能[4,17,19,28,29,34,36,39]。然而，法学硕士[54]的幻觉问题被认为是一个具有挑战性且尚未解决的问题，当我们将法学硕士与视觉技术结合时，这会导致许多问题。

虽然像 GPT-4V(ision) [44] 和 LLaVA1.5 [30] 这样的 LVLM 在各种应用中表现出色，但它们受到明显的语言偏差的阻碍。这种偏见源于知识先验与视觉背景发生冲突的情况[23,27,53]。同样，无论问题的实际内容如何，LLaVA-1.5 [30] 和 mPLUG-Owl [46] 等模型都倾向于给出肯定的答案 [23]。不同 VLM 的不同故障模式凸显了特定改进的必要性。认识和理解这些局限性和失败类型对于推进这些模型并在知识先验和上下文理解之间取得微妙的平衡至关重要。

在探索这些 LVLM 时，我们观察到它们强烈的语言偏差常常掩盖了视觉信息，导致过度依赖语言先验而不是视觉上下文。为了研究这种现象，我们使用“语言幻觉”这个术语，它是指在没有视觉输入的情况下得出的结论。另一方面，LVLM 中有限能力内的视觉组件可能会产生“视觉错觉”，视觉输入可能会被误解，导致模型过于自信但错误的断言。

主要贡献：认识到需要理解 LVLM 失败的原因并解决这些问题，我们提出了 HALLUSIONBENCH，这是一个精心设计的基准，旨在深入探索图像上下文推理的复杂性，并揭示当前 LVLM 的各种问题，例如如图1所示。我们设计的视觉问题（VQ）对，格式独特，有助于对模型的失败进行定量分析，从而实现更彻底的评估。这项研究揭示了现有的局限性，并为未来的改进奠定了基础，旨在使下一代 LVLM 更加稳健、平衡和精确。我们工作的新颖之处包括：

1. 我们推出 HALLUSIONBENCH，这是第一个高级诊断套件，专门用于系统地剖析和分析 LVLM 的各种故障模式。 HALLUSIONBENCH 由大约 1129 个手工制作的视觉问答 (VQA) 对组成，其中包括 165 个原始图像和 181 个由人类专业人员专业修改的图像。我们的 VQA 对超越了传统的正确性和准确性指标，采用创新结构精心制定。这种方法使我们能够定量分析当前模型失效的具体维度和方面。

2. 我们评估了 HALLUSIONBENCH 上的 13 种最新方法。我们的基准对现有方法提出了巨大的挑战。值得注意的是，SoTA GPT-4V 仅实现了 31.42% 的问题对准确率，而所有其他方法的性能均低于 16%。

3. 我们探索 HALLUSIONBENCH 并对 SoTA LVLM（例如 GPT-4V 和 LLaVA-1.5）失败的示例进行深入分析。我们还根据 HALLUSIONBENCH 的定量分析，对现有 LVLM 面临的不同问题提供见解。在我们对 HALLUSIONBENCH 的探索中，我们对 SoTA LVLM（包括 GPT-4V 和 LLaVA-1.5）的不足之处进行了详细分析。此外，我们的调查利用 HALLUSIONBENCH 的定量功能来揭示当前挑战现有 LVLM 的各种问题。

图 1. HALLUSIONBENCH 的数据样本，其中包含不同的主题、视觉模式。人工编辑的图像为红色。

3.2.视觉、问题和注释结构

符号：令 (I, q) ∈ V ⊆ I×Q 为图像 I ∈ I 和问题 q ∈ Q 的元组，其中 V 是有效 VQ 对的集合。设N为从互联网获得的原始图像的数量，Io={I(i,0)}0

2. Related Work相关工作

2.1. Large Multi-Modal Models大型多模式模型

大型语言模型是一项重大进步，它带来了不仅可以理解文本，还可以理解图像等其他事物的新方法，所有这些都在一个大型系统中进行。构建这些高级大型视觉语言模型 (LVLM) 的主要方法有多种，它们可以很好地理解图像和文字，而无需针对每项任务进行特定训练。例如，Flamingo [3] 具有许多功能，将不会改变的视觉部分与具有同时理解图像和文字的特殊功能的大语言模型相结合。另一个模型 PaLM-E [12] 将视觉信息直接混合到已经很强大的 PaLM 模型中，该模型拥有 5200 亿个参数，使其在现实世界中有效使用。最近，研究人员一直在从 GPT4 和 GPT-4V [44] 创建高质量、多样化的多模态数据集，以微调开源 LVLM，包括 LLaVA [27]、MiniGPT4 [58]、Mplug-Owl [46]、 LRV-Instruction [27]、LLaVAR [55] 和其他作品 [11,24,35,48]。

2.2. LVLM 中的幻觉

幻觉通常是指生成的响应包含视觉内容中不存在的信息的情况。先前的研究主要考察两个领域：检测和评估幻觉 [23, 54]，以及减少幻觉的方法 [27, 40, 49]。早期的方法包括训练分类器来识别幻觉，或者将输出与准确答案进行比较以检测不准确性。为了减轻幻觉，人们努力改进数据收集和培训程序。例如，LRV-Instruction [27] 创建平衡的正负指令来微调 LVLM。 VIGC [40] 使用迭代过程来生成简洁的答案并将其组合起来，旨在获得详细而准确的响应。类似地，Woodpecker [49] 引入了一种免训练的方法来从生成的文本中挑选并纠正幻觉。

2.3. Benchmarks for Large VL Models
----
2.3.大型 VL 模型的基准

传统的视觉语言（VL）基准旨在评估不同的技能，包括视觉识别 [16]、图像描述 [2, 26] 等。然而，随着先进 LVLM 的出现，对新基准的需求不断增加。鉴于 LVLM 强大的零样本能力，传统的评估指标通常无法提供详细的能力评估。由于它们无法准确匹配给定的答案，这个问题进一步加剧，导致严重的稳健性问题。为了应对这些挑战，研究社区引入了一系列基准，包括 MME [14]、MMBench [32]、MM-Vet [50]、SEED-Bench [20]、GAVIE [27] 和 LAMMBench [13]。这些基准系统地构建和评估复杂的多模式任务。与评估 LVLM 的物体幻觉的 POPE [23] 和 GAVIE [27] 不同，HALLUSIONBENCH 是第一个人工注释的分析基准，专注于诊断 LVLM 的视错觉和知识幻觉。

3. HALLUSIONBENCH Construction
----
3. HALLUSIONBENCH 建造

我们推出了 HALLUSIONBENCH，这是第一个旨在检查 LVLM 的视觉错觉和知识幻觉并根据每个手工制作的示例对分析潜在故障模式的基准。 HALLUSIONBENCH 由 455 个视觉问题控制对组成，包括 346 个不同的人物和总共 1129 个不同主题的问题（包括食物、数学、几何、统计、地理、体育、卡通、著名错觉、电影、模因等）和格式（包括徽标、海报、图形、图表、表格、地图、连续图像等）。在以下部分中，我们首先提供基于不同视觉问题类型的数据集构建指南。其次，我们将描述HALLUSIONBENCH的数据和注释结构。最后，我们将描述数据集的统计数据。

3.1.视觉问题分类

我们的目标是开发一个多模态图像上下文推理基准来研究 LVLM 固有的潜在语言偏差，这种偏差有时会掩盖视觉上下文。我们定义了两类视觉问题：视觉相关和视觉补充。

3.1.1 视觉相关问题

视觉相关问题被定义为没有视觉上下文就没有肯定答案的问题。此类问题询问的是图像本身或图像中的某些内容。例如，“右侧橙色圆圈与左侧橙色圆圈大小相同吗？”就没有明确的答案。没有图像来提供更多上下文。指南：在此设置下，我们的基准测试旨在评估视觉常识知识和视觉推理技能。我们的探索和数据集构建以以下问题为指导：

1.模型的视觉理解和推理能力有多好？

2. 模型的参数记忆如何影响其对问题的响应？

3. 该模型是否能够捕获多个图像的时间关系？

3.1.2 视觉补充问题

视觉补充问题是无需视觉输入即可回答的问题；视觉组件仅提供补充信息或更正。例如，一些 LVLM 可以回答“新墨西哥州比德克萨斯州大吗？”在没有美国地图的情况下使用参数记忆中的先验知识。指南：在此设置下，我们的基准测试旨在评估视觉推理能力以及参数记忆和图像上下文之间的平衡。我们在此类别下的探索和数据集构建以以下问题为指导：

1. 当模型在其语言模块的参数记忆中缺乏先验知识或答案时，模型是否（仍然）对图像产生幻觉？ 2. 当模型的语言模块在其参数记忆中有足够的先验知识或直接知道答案时，它是否仍然通过从视觉补充中收集额外的信息来增强其响应（特别是当先验知识与视觉输入或参数记忆冲突时）已经过时了）？

3.模型如何很好地解释具有密集信息（即图形、图表、地图等）的视觉输入以回答问题？哪些类型的图像处理可能会阻碍或扭曲视觉信息提取？

3.2.视觉、问题和注释结构

符号：令 (I, q) ∈ V ⊆ I×Q 为图像 I ∈ I 和问题 q ∈ Q 的元组，其中 V 是有效 VQ 对的集合。设N为从互联网获得的原始图像的数量，Io={I(i,0)}0

3.3.数据集统计

遵循上述注释结构和指南，我们要求人类专家手动收集 346 张具有不同主题和类型的图像。如图2所示，Visual Dependent有591个问题，包括视频、错觉、数学、海报、标志、卡通等； Visual Supplement 有 538 个问题，包括图表、表格、地图和 OCR。此外，图2（右）描述了没有视觉输入（16％）、原始在线图像（39％）和由人类专家编辑的视觉输入（45％）的问题的分布。我们的图像处理策略包括图像翻转、顺序反转、遮罩、光学字符编辑、对象编辑和颜色编辑。此外，每张图像平均有 3.26 个问题。图 2（左）提供了有关每个主题和视觉输入类别中的问题数量的更多详细信息。

图 2. HALLUSIONBENCH 的统计数据：我们显示了表中的问题数量（左），以及视觉问题在视觉依赖 (VD) 和视觉补充 (VS) 每个子类别中的分布（中）以及按以下分类的视觉输入类型没有视觉、原始和编辑过的图像（右）。 HALLUSIONBENCH 涵盖了多种视觉格式，近一半的图像是手动编辑的。

3.4. HALLUSIONBENCH 的独特之处

HALLUSIONBENCH 与现有基准之间的主要比较如表 1 所示。 1. 如图所示，现有基准[10,18,23,27]与HALLUSIONBENCH在幻觉评估方面存在显着差距，因为现有基准主要关注对象幻觉、有限主题和视觉输入类型。因此，我们的数据集 HALLUSIONBENCH 致力于通过提供更多主题、更多图像类型和更多视觉输入方式（包括图像和视频）来弥补这一差距。此外，我们的人类专家会仔细选择每张图像并编写问答对。我们也是第一个包含人工编辑图像来评估当前 LVLM 稳健性的工作。此外，与现有基准不同，HALLUSIONBENCH 专注于评估语言幻觉和视觉错觉，超越物体幻觉的狭窄范围。

4.HALLUSIONBENCH 评估套件

4.1.纯文本 GPT4 辅助评估

符号：设 M(I, q) ∈ {“是”, “否”, “不确定”} 是 VLM M 对图像问题对 (I, q) 的解析输出答案。 GPT-4 GP T (M(I, q), y(I, q)) 然后根据groundtruth y(I, q) ∈ {“是”, “否”来判断答案M(I, q)如果预测响应不明确，则输出不正确 (0)、正确 (1) 或不确定 (2)。 GPT-4判断的提示设计为：

想象一下你是一位聪明的老师。仔细阅读问题、参考答案和预测答案，以确保清楚地理解所提供的信息。评估预测的正确性。如果预测答案与参考答案不冲突，请生成“正确”。如果预测答案与参考答案冲突，请生成“不正确”。如果预测答案对答案不清楚，请生成“不清楚”。

对于每个样本，我们在模板中填充问题、真实情况和 LVLM 输出。通过将填写的提示输入 GPT-4，GPT-4 将为样本生成“正确”、“不正确”或“不清楚”。发现尽管温度设置为0，GPT4的输出仍然存在方差。因此，我们利用GPT-4对LLM的输出进行3次评估并报告平均分数。

与人类评估的比较：为了证明我们的 GPT4 辅助评估是有效的，我们获得了 GPT-4V [44] 和 LLaVA-1.5 [30] 的响应，并手动评估它们响应的正确性。如果答案不明确，我们将答案标记为不正确 (0)、正确 (1) 和不确定 (2)。如Tab前两行所示。 2 和选项卡。如图3所示，差异可以忽略不计，证明GPT4辅助的方法与人类的判断非常吻合。

4.2.正确性评估指标

由于我们基准的重点是幻觉和错觉，而不是知识的广度，因此当视觉补充类别下没有视觉输入时，我们认为不确定的答案是可以接受的。对于最终的准确率得分，我们将正确性转换为二进制值 bM ∈ {0, 1}：

4.3.分析评价标准

除了准确性指标之外，我们还引入了三个分析标准来衡量和诊断 LVLM 的故障：是/否偏差测试、一致性测试和诊断测试。我们不是定性地检查和分析每个失败的案例，而是通过问题集的独特设计提出这些新颖的定量测量。这些测试按复杂程度排列，因此如果前一个基本测试失败，后一个测试就不会那么有用和有洞察力。

4.3.1 是/否偏差测试

根据[23]，一些模型[15,30,46]在大多数情况下倾向于回答“是”。如果模型有很强的偏见或倾向于以一种方式回答而不管实际问题如何，则无需进一步分析，因此我们设计了两个标准来揭示模型的这种偏好。是百分比差异 (Pct. Diff) dy ∈ [−1, 1]: dy = P (I ,q)εV 1 M(I, q) = “是” − 1 y(I, q) = “是” |V| , (6) dy 表示问题集中“是”的预测数量与实际数量之间的差异。当 |dy| 时，模型的偏差更大。接近 1。假阳性率 (FP Ratio) rfp ∈ [0, 1]: rfp = P (I,q)∈W 1 M(I, q) = “yes” |W| , (7) 其中 W = {(I, q) ∈ V | bM(I, q) = 0} 是一组不正确的视觉问题。rfp 衡量模型在所有不正确的回答中回答“是”的可能性。当rfp 接近 0.5

4.3.2 一致性测试一致性测试的目的是测试回答的逻辑一致性，并确保问题不是基于随机猜测而回答的。许多问题 Qi 源于 Ri

4.3.3 语言幻觉和视觉错觉在我们深入进行诊断测试之前，我们根据失败的案例将失败分为两大类：语言幻觉是指在没有相关视觉输入的情况下形成的感知。在语言幻觉中，模型对输入和图像上下文做出错误的先验假设基于其参数记忆。模型应该根据问题的框架做出响应，而不是忽略它或对图像做出错误的假设。视觉错觉是指对准确视觉信息的误解。视觉错觉来自于无法在视觉上识别和理解输入图像。该模型无法获得准确的信息或正确地推理图像。

4.3.4 诊断测试为了研究语言幻觉和语言错觉问题，我们分析了 VQ 控制对中两个视觉问题的回答和正确性，并将不正确的回答分为三类：语言幻觉、视觉错觉和混合/不确定。我们衡量这些失败在所有失败案例中的百分比。控制对：控制对将始终包含用于视觉相关问题的原始图像或用于视觉补充问题的空图像（无视觉）。控制对中的另一个问题可能有编辑过的图像（或者 VS 问题的原始图像）。对这个问题的回答将提供更多关于答案是否存在于参数知识中或者模型是否在训练数据中看到它的信息。此外，我们可以检查编辑原始图像后响应是否保持不变，以获得对失败的更多见解，这比单独检查单个视觉问题提供更多信息。在图 3 中，我们提供了一个决策树来确定控制对的故障类型。在分配失败类型时，我们考虑以下原则： 1. 对于视觉相关（VD）问题或具有视觉输入的视觉补充（VS）问题，如果回答不正确或不确定，则失败可能是视觉错觉，因为模型无法正确从视觉信息中提取。 2. 对于没有视觉输入的视觉补充（VS）问题，如果答案给出了确定但错误的答案，我们将其归因于语言幻觉。 3. 如果模型正确响应原始图像（或无图像）并且对编辑后的图像具有相同的响应（这与常识相反），则意味着参数知识超过了实际图像输入。因此，我们也将失败归咎于语言幻觉。我们将在补充材料中包含一些示例。

5. 实验结果

5.1.模型

我们在 HALLUSIONBENCH 上进行了大量实验，评估了总共 13 个 LVLM，包括 GPT-4V [1]、LLaVA1.5 [30]、MiniGPT4 [58]、MiniGPT5 [57]、GiT [41]、InstructBLIP [11]、 Qwen-VL [6]、mPLUG-Owl-v1 [46]、mPLUGOwl-v2 [47]、LRV-指令 [27]、BLIP2 [21]、BLIP2-T5 [21] 和 Open-Flamingo [3]。我们还包括随机机会（即随机选择是或否）作为基线。

5.2.结果分析

我们比较了几种模型的性能，包括闭源模型和开源模型。结果在表中给出。 2、选项卡。如图 3 和图 4 所示。此外，我们建立了人类专家评估来评估纯文本 GPT4 辅助评估的有效性。正确性评估。如表所示。 2、除了硬精度之外，GPT-4V 大幅优于所有开源 LVLM。硬准确度衡量模型理解来自 HALLUSIONBENCH 的人工编辑图像的能力。较差的精度表明我们对 GPT-4V 和其他开源 LVLM 进行图像处理面临着挑战。在开源模型中，我们研究扩大 LLM 主干的大小（0.8B 到 13B）是否可以减轻物体存在幻觉。如选项卡中详细说明。如图2所示，随着模型尺寸的增大，幻觉明显减少，如LLaVA-1.5和BLIP2-T5。在大小小于10B的模型中，InstructBLIP和mPLUG-Owl-v2是性能最好的。 InstructBLIP 利用 BLIP-2 架构并通过跨 26 个不同数据集的指令微调进行增强，表明更广泛和更广泛的训练集可以显着提高性能。与 mPLUG-Owl-v1 相比，mPLUG-Owl-v2 的性能提升可归因于其新颖的模块，该模块利用语言解码器作为管理不同模态的通用接口。是/否偏见。另一个观察结果是，GPT-4V、BLIP2T5 和 mPLUG-Owl-v2 在问题对准确性、图形对准确性和问题级别准确性方面均优于随机选择。其他模型，例如 Qwen-VL 和 MiniGPT4，性能甚至比随机选择更差。这表明他们的视觉推理能力仍然有限。然而，LLaVA-1.5 的性能优于随机选择，但在问题对准确性和图形对准确性方面均取得较差的结果。我们将这种现象归因于 LLaVA-1.5 倾向于回答“是”这一事实。表 1 中“是/否偏倚测试”中 LLaVA-1.5 的低“是百分比差异”和“假阳性率”支持了这一假设。 3. 此外，我们发现 Open-Flamingo 和 mPLUG-Owl-v1 也倾向于回答“是”，具有较高的“是”百分比差异和误报率。受[27]的启发，一个可能的原因是这些 LVLM 在训练集中缺乏平衡的正向和负向指令。我们还将这些 LVLM 的较差性能归因于训练集中人工编辑图像的稀缺，因为大多数 LVLM 仅利用现有数据集中的原始图像。语言和视力诊断。我们在图 4 中报告了不同视觉输入的 6 个著名 LVLM 的细粒度分数。结果表明，数学、幻觉和视频是当前 LVLM（包括 GPT-4V）最具挑战性的格式。从图 5（上）中，我们发现 GPT-4V 和 LLaVA-1.5 都无法正确识别正则三角形，在问题对准确度和图形对准确度方面都取得了较差的结果。我们将这种现象归因于 LLaVA-1.5 倾向于回答“是”这一事实。表 1 中“是/否偏倚测试”中 LLaVA-1.5 的低“是百分比差异”和“假阳性率”支持了这一假设。 3. 此外，我们发现 Open-Flamingo 和 mPLUG-Owl-v1 也倾向于回答“是”，具有较高的“是”百分比差异和误报率。受[27]的启发，一个可能的原因是这些 LVLM 在训练集中缺乏平衡的正向和负向指令。我们还将这些 LVLM 的较差性能归因于训练集中人工编辑图像的稀缺，因为大多数 LVLM 仅利用现有数据集中的原始图像。语言和视力诊断。我们在图 4 中报告了不同视觉输入的 6 个著名 LVLM 的细粒度分数。结果表明，数学、幻觉和视频是当前 LVLM（包括 GPT-4V）最具挑战性的格式。从图 5（上）中，我们发现 GPT-4V 和 LLaVA-1.5 都无法正确识别正三角形，这意味着几何和数学对于 GPT-4V 来说仍然是一项具有挑战性的任务。从图 5（中）中，我们发现 GPT-4V 在识别所有错觉案例并知道它们的名称方面比 LLaVA-1.5 更有知识。然而，GPT-4V 未能根据编辑后的图像忠实地回答这个问题。这背后的原因可能是 GPT-4V 倾向于根据其参数记忆生成答案，而不是分析图像。与 GPT-4V 相比，LLaVA-1.5 在原始图像和编辑图像上的表现都很差，表明 LLaVA-1.5 的视觉感知能力有限。从图5（下）中，我们发现GPT-4V无法区分图像的正序和反序，这表明视频推理能力还有很大的提升空间。

[论文阅读] 人工智能 + 软件工程 | 揭秘ChatGPT在软件开发问题解决中的有效性：一项实证研究张较瘦_ 前沿技术论文阅读人工智能软件工程
揭秘ChatGPT在软件开发问题解决中的有效性：一项实证研究论文：WhatMakesChatGPTEffectiveforSoftwareIssueResolution?AnEmpiricalStudyofDeveloper-ChatGPTConversationsinGitHubarXiv:2506.22390WhatMakesChatGPTEffectiveforSoftwareIssueRe
[论文阅读] 人工智能 + 软件工程 | 代码注释不一致问题研究：从数据革新到端到端解决方案张较瘦_ 前沿技术论文阅读人工智能软件工程
代码注释不一致问题研究：从数据革新到端到端解决方案原文：CCISOLVER:End-to-EndDetectionandRepairofMethod-LevelCode-CommentInconsistencyarXiv:2506.20558CCISolver:End-to-EndDetectionandRepairofMethod-LevelCode-CommentInconsistencyRe
数字孪生：未来城市管理的革命性技术大有数据可视化信息可视化
一、数字孪生技术概述数字孪生技术是一种通过创建虚拟模型与物理实体之间实时交互的技术。它借助物联网、大数据、云计算、人工智能等前沿技术，实现对物理实体的精准映射与动态仿真。数字孪生的核心在于构建一个与物理世界相对应的虚拟模型，该模型能够实时反映物理实体的状态，并通过数据分析与模拟优化其性能。在城市管理领域，数字孪生技术为城市管理者提供了一种全新的视角和工具。城市是一个复杂的巨系统，涉及基础设施、交通
人类编程时代即将终结？OpenAI首席产品官预测AI将在今年底全面超越人类程序员前端javascript
ReactHook深入浅出CSS技巧与案例详解vue2与vue3技巧合集VueUse源码解读近日，OpenAI首席产品官KevinWeil在接受采访时表示，人工智能的发展速度远超预期，今年底就有可能在编程领域永久性地超越人类程序员。这一观点立即引发了行业热议，也让程序员们对未来产生了深刻的思考。人工智能的进展速度远超想象在与VarunMayya和TanmayBhat共同主持的YouTube节目《O
Python大数据分析&人工智能教程 - Django-Celery异步处理（深入解析与实战案例） AI_DL_CODE python 数据分析 Django Celery异步处理 Celery
文章目录1.概念介绍1.1Django框架概述1.2Celery异步任务队列1.3AMQP协议与消息路由2.环境搭建2.1安装Django和Celery2.2配置Redis作为消息代理3.Celery架构与工作原理3.1Celery组件介绍3.2任务生命周期3.3任务调度与执行3.3.1定时任务3.3.2异步任务调用3.3.3任务结果查询4.Django与Celery集成4.1创建Celery实例
智能之火，重塑创造：大模型如何点燃新一代开发引擎？黑巧克力可减脂 AIGC 人工智能 AIGC
导言：普罗米修斯之火再现在科技演进的长河中，每一次生产力的跃迁都伴随着工具的质变。从蒸汽机轰鸣到电力普及，再到信息高速公路的铺就，人类驾驭能量的能力不断突破。今天，我们站在一个崭新的临界点上：大语言模型（LLM）正将人工智能的“普罗米修斯之火”引入软件开发的核心腹地。这不再仅仅是效率的优化，更是对开发者角色、开发流程乃至软件本质的深度重塑。GitHubCEOThomasDohmke曾断言：“Cop
Python大数据分析&人工智能教程 - Django-RestFramework框架（深入解析+实操案例） AI_DL_CODE python 数据分析 django RestFramework框架
文章目录1.Django-RestFramework基础1.1Django-RestFramework概述1.2安装与配置1.3构建第一个API1.3.1定义模型1.3.2创建序列化器1.3.3定义视图1.3.4配置URL路由1.4进阶功能1.4.1权限控制1.4.2限流1.5实战案例1.5.1创建图书1.5.2查询图书1.5.3更新图书1.5.4删除图书2.序列化器(Serializers)2.
Python从0到100完整学习指南（必看导航）是Dream呀 Python python 人工智能爬虫 web 神经网络算法深度学习
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学业升学和工作就业的先行者！【优惠信息】•新专栏订阅前1000名享9.9元优惠•订阅量破10
FastGPT与MCP：解锁AI新时代的技术密码挑战者666888 AI模型应用实战迁移学习集成学习文心一言
一、AI浪潮中的新星：FastGPT与MCP登场在当今科技飞速发展的时代，人工智能（AI）已成为推动各行业变革的核心力量。从智能语音助手到复杂的图像识别系统，AI的应用无处不在，而其中的关键技术——语言模型和集成平台，更是备受关注。FastGPT和MCP（Multi-ComponentPlatform）作为这一领域的新兴代表，正逐渐崭露头角，为AI的发展注入新的活力。FastGPT，以其高效的推理
前沿技术推动机器人的智能化升级 AI天才研究院 AI大模型企业级应用开发实战 Agentic AI 实战 AI人工智能与大数据机器人 ai
前沿技术推动机器人的智能化升级关键词：机器人智能化、人工智能、机器学习、计算机视觉、自主导航、人机交互、边缘计算摘要：本文深入探讨了前沿技术如何推动机器人从传统自动化向智能化升级的演进过程。文章首先分析了机器人技术发展的历史脉络和当前挑战，然后详细阐述了人工智能、机器学习、计算机视觉等关键技术如何赋能机器人智能化。通过算法原理分析、数学模型构建和实际项目案例，展示了智能机器人的核心技术实现路径。最
提升首屏加载的秘密武器：一文讲透 CDN 加速核心逻辑网罗开发实战源码前端 json javascript
网罗开发（小红书、快手、视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者：《ESP32-C3物联网工程开发实战》图书作者：《SwiftUI入门，进阶与实战》超级个体：CO
量化AI价值的30个关键指标 mao_feng 人工智能 AI
摘要：量化AI的战略价值人工智能（AI）成功集成到业务运营中超越了单纯的技术部署;它需要一种严格、可量化的方法来展示其价值。本报告系统地分类并解释了评估AI优势的基本指标，从核心模型性能到总体战略和道德考虑因素。必须制定多方面的衡量策略，将技术AI指标与运营效率、客户体验、财务绩效、战略优势和负责任的AI实践等有形业务成果直接联系起来。稳健的关键绩效指标（KPI）不仅仅是问责制的工具;它们是持续改
【AI大模型】23、构建你的西部世界：AI小镇具身智能实战指南无心水 AI大模型人工智能 AI小镇搭建具身智能实战智能体系统架构提示语工程优化虚拟社会构建 AI大模型
引言：从代码到虚拟社会的奇妙旅程在人工智能领域，具身智能的发展正引领着一场新的革命。当我们谈论构建一个类似《西部世界》的虚拟社会时，我们不仅在创造一个数字游乐场，更是在探索智能体如何在模拟环境中展现出类似人类的认知、社交和决策能力。本文将带领你踏上一段激动人心的旅程，从底层架构到上层应用，全面解析如何利用提示语工程构建一个充满活力的AI小镇。想象一下，你将成为这个虚拟世界的造物主，通过精心设计的提
九章数学体系：定义域无界化——AI鲁棒性的“隐形杀手“ 九章数学体系数学建模拓扑学人工智能神经网络
九章数学体系：定义域无界化——AI鲁棒性的"隐形杀手"摘要传统人工智能模型在面对边缘场景时常常表现出鲁棒性不足的问题，本文深入分析发现，这种现象的本质根源在于模型缺乏显式的定义域约束，导致无界化假设成为影响AI鲁棒性的"隐形杀手"。文章系统阐述了无界假设如何引发对抗样本脆弱性和数值不稳定等核心问题，并引入九章数学体系的定义域约束理论，为解决这些问题提供了全新的数学视角和工程实现路径。研究表明，通过
从单一设备到万物互联：鸿蒙生态崛起的未来之路王子良. 经验分享 harmonyos 华为
目录一、引言：开启智能时代的钥匙二、鸿蒙生态概述：跨设备协同的核心价值三、开发者机遇与挑战：抓住鸿蒙崛起的机会四、鸿蒙生态崛起的前景：万物互联的未来五、开发者在鸿蒙生态中的实践机遇与挑战1.跨设备开发的机遇2.与人工智能和物联网结合的创新空间3.持续创新与生态完善的挑战六、鸿蒙生态未来的多维发展：智能硬件与大数据的深度结合1.智能硬件与大数据的结合2.在智能家居与城市管理中的应用3.行业领域的深度
考取华为HCIE-AI有什么用？博睿谷IT99_ 华为人工智能华为认证职业规划
在人工智能技术重塑各行各业的浪潮中，掌握核心AI能力成为专业人士的制胜关键。华为推出的HCIE-AISolutionArchitect（华为认证ICT专家-AI解决方案架构师），正是面向这一领域顶尖人才设立的最高级别认证。主要是为了培养和认证掌握人工智能解决方案架构、设计与应用知识，具备大模型业务场景分析、大模型训练与微调、模型推理部署能力的专家级人才。一、HCIE-AI：专家级能力的权威认证HC
多模态实操第一弹：多模态AI是什么？能做什么？江凯吴杰多模态的尝试人工智能
多模态AI专栏第一期：多模态人工智能概述与应用你是否想过，AI如何像人一样同时"看、听、说"？本期专栏将带你深入了解多模态AI的核心原理、发展脉络、关键技术、典型应用，并为后续实战打下坚实基础。最后，我们将详细介绍本系列所用的ERIT数据集及其任务背景。目录1.什么是多模态AI？2.多模态AI的发展历程3.多模态AI的核心技术4.多模态AI的应用场景5.多模态AI的挑战与机遇6.专栏预告与ERIT
ChatGPT、DeepSeek等大语言模型助力高效办公、论文与项目撰写、数据分析、机器学习与深度学习建模等深度科研 Yolo566Q chatgpt 语言模型数据分析
随着人工智能技术的快速发展，大语言模型如ChatGPT和DeepSeek在科研领域的应用正在为科研人员提供强大的支持。这些模型通过深度学习和大规模语料库训练，能够帮助科研人员高效地筛选文献、生成论文内容、进行数据分析和优化机器学习模型。ChatGPT和DeepSeek能够快速理解和生成复杂的语言，帮助研究人员在撰写论文时提高效率，不仅生成高质量的文章内容，还能优化论文结构和语言表达。在数据分析方面
大语言模型助力高效办公、论文与项目撰写、数据分析、机器学习与深度学习建模等 xiao5kou4chang6kai4 人工智能深度学习机器学习 rnn 语言模型 lstm 深度学习机器学习人工智能 DeepSeek
随着人工智能技术的快速发展，大语言模型如ChatGPT和DeepSeek在科研领域的应用正在为科研人员提供强大的支持。这些模型通过深度学习和大规模语料库训练，能够帮助科研人员高效地筛选文献、生成论文内容、进行数据分析和优化机器学习模型。ChatGPT和DeepSeek能够快速理解和生成复杂的语言，帮助研究人员在撰写论文时提高效率，不仅生成高质量的文章内容，还能优化论文结构和语言表达。在数据分析方面
十分钟了解人工智能的过去、现在与未来 ithadoop 人工智能人工智能
十分钟了解人工智能的过去、现在与未来人工智能(AI)作为重塑人类社会的技术革命，正以前所未有的速度改变着我们的工作方式、生活方式和思维方式。从1943年人工神经元模型的提出，到2025年AI应用场景的全面爆发，AI发展经历了多个关键阶段。在接下来的十分钟里，我们将通过图文解说，快速了解AI从萌芽到现在的历程，以及未来可能带来的机遇与挑战。一、人工智能的过去：从理论奠基到技术突破1.萌芽阶段(194
ChatGPT、DeepSeek等大语言模型助力高效办公、论文与项目撰写、数据分析、机器学习与深度学习建模 asyxchenchong888 chatgpt 语言模型机器学习
随着人工智能技术的快速发展，大语言模型如ChatGPT和DeepSeek在科研领域的应用正在为科研人员提供强大的支持。这些模型通过深度学习和大规模语料库训练，能够帮助科研人员高效地筛选文献、生成论文内容、进行数据分析和优化机器学习模型。ChatGPT和DeepSeek能够快速理解和生成复杂的语言，帮助研究人员在撰写论文时提高效率，不仅生成高质量的文章内容，还能优化论文结构和语言表达。在数据分析方面
ChatGPT、DeepSeek等大语言模型助力高效办公、论文与项目撰写、数据分析、机器学习与深度学习建模等科研应用科研的力量人工智能 ChatGPT chatgpt 语言模型数据分析
随着人工智能技术的快速发展，大语言模型如ChatGPT和DeepSeek在科研领域的应用正在为科研人员提供强大的支持。这些模型通过深度学习和大规模语料库训练，能够帮助科研人员高效地筛选文献、生成论文内容、进行数据分析和优化机器学习模型。ChatGPT和DeepSeek能够快速理解和生成复杂的语言，帮助研究人员在撰写论文时提高效率，不仅生成高质量的文章内容，还能优化论文结构和语言表达。在数据分析方面
探索 AI 系统提示与模型资源库：`system-prompts-and-models-of-ai-tools` 几道之旅人工智能智能体及数字员工人工智能
在当今的人工智能领域，系统提示和工具模型的优化与应用对于提升AI助手的性能和响应质量至关重要。x1xhlol开源的system-prompts-and-models-of-ai-tools仓库为开发者们提供了一个丰富的资源集合，涵盖了多种AI工具的系统提示、工具和模型。仓库概述这个仓库包含了超过7500行的代码和文档，详细介绍了多个知名AI工具的系统提示和相关模型，其中包括FULLv0、Curso
AI人工智能中LSTM在视频行为识别的应用
AI人工智能中LSTM在视频行为识别的应用关键词：LSTM、视频行为识别、深度学习、时序建模、计算机视觉、神经网络、动作识别摘要：本文将深入探讨LSTM（长短期记忆网络）在视频行为识别领域的应用。我们将从基础概念出发，逐步讲解LSTM如何解决视频时序建模的挑战，分析其核心算法原理，并通过实际代码示例展示LSTM在行为识别中的具体实现。文章还将探讨当前的应用场景、工具资源以及未来发展趋势，为读者提供
多模态AI：让机器像人一样“全感官”理解世界 Echo_Wish 前沿技术人工智能人工智能
多模态AI：让机器像人一样“全感官”理解世界咱们人类理解世界，从来不是只靠单一感官：眼睛看到画面，耳朵听到声音，皮肤感受到温度，嘴巴尝到味道，甚至鼻子闻到气味。正是这多感官的“多模态”输入，构筑了我们对复杂世界的深刻认知。而人工智能领域的多模态学习（MultimodalLearning），正是让机器拥有“多感官”理解能力的技术突破。今天，我想跟大家聊聊：多模态学习为何重要？当前有哪些创新模型？如何
【PaddleOCR】快速集成 PP-OCRv5 的 Python 实战秘籍--- PaddleOCR实例化 OCR 对象的参数介绍云天徽上 PaddleOCR python ocr 开发语言人工智能文字识别
博主简介：曾任某智慧城市类企业算法总监，目前在美国市场的物流公司从事高级算法工程师一职，深耕人工智能领域，精通python数据挖掘、可视化、机器学习等，发表过AI相关的专利并多次在AI类比赛中获奖。CSDN人工智能领域的优质创作者，提供AI相关的技术咨询、项目开发和个性化解决方案等服务，如有需要请站内私信或者联系任意文章底部的的VX名片（ID：xf982831907）博主粉丝群介绍：①群内初中生、
最新人工智能硬件培训AI基础入门学习课程参考2025版（离线AI语音视觉识别篇）聆思科技AI芯片聆思大模型开发板实践分享语音识别人机交互人工智能视觉检测嵌入式硬件 mcu AI编程
前言端侧离线AI智能硬件作为AI技术的重要载体之一，凭借其无需依赖网络即可实现智能功能的特性，在一些网络条件受限或对数据隐私有较高要求的场景中，发挥着不可或缺的作用。本章基于CSK6大模型语音视觉开发板开箱即用的离线AI能力，分类列出学习课程知识点和实操参考，希望能够帮助大家快速掌握离线AI智能硬件的基础知识与实战技能，同时了解相关AI技术在实际场景的应用情况。正文按入下框架展开，相关理论和实操除
最新人工智能硬件培训AI 基础入门学习课程参考2025版（大模型篇）聆思科技AI芯片聆思大模型开发板实践分享大模型语音交互人工智能语音识别视觉检测 AI编程人机交互
前言在人工智能大模型重塑教育与社会发展的当下，无论是探索未来职业方向，还是更新技术储备，掌握大模型知识都已成为新时代的必修课。从职场上辅助工作的智能助手，到课堂用于学术研究的智能工具，大模型正在工作生活教育等领域发挥着越来越重要的作用。针对日前前来咨询的广大客户对面向大模型智能硬件的学习需求，我们根据CSK6大模型语音视觉开发板已有功能，整理了一份适合基于本开发板进行教学活动的学习课程参考给大家备
2025年全球数据安全发展趋势 jinan886 人工智能大数据安全数据分析
随着云计算、大数据、人工智能等技术的迅猛发展，数据已成为驱动经济社会发展的关键生产要素。然而，数据泄露、网络攻击等安全事件频发，给个人隐私、企业利益乃至国家安全带来了前所未有的挑战。全球数据安全发展趋势正随着技术进步和威胁演变而不断变化，以下是主要趋势：1.数据隐私法规加强GDPR（欧盟《通用数据保护条例）和CCPA（加州消费者隐私法案）等法规推动了全球对数据隐私的重视，更多国家和地区正在制定或更
AI原生应用监控：实时领域偏见预警系统设计原理 Agentic AI人工智能与大数据 CSDN AI-native 人工智能 ai
AI原生应用监控：实时领域偏见预警系统设计原理关键词AI监控、算法偏见、实时预警、公平性AI、模型监控、偏见检测、AI治理摘要在人工智能驱动决策日益普及的今天，AI系统中的隐性偏见已成为影响公平性、可信度和业务连续性的关键风险。本文深入探讨了AI原生应用监控的核心挑战，重点剖析了实时领域偏见预警系统的设计原理与实现方法。通过将复杂的算法偏见比作"数字世界的隐形滤镜"，我们揭示了偏见如何在AI系统中
ztree异步加载 3213213333332132 JavaScript Ajax json Web ztree
相信新手用ztree的时候,对异步加载会有些困惑，我开始的时候也是看了API花了些时间才搞定了异步加载，在这里分享给大家。我后台代码生成的是json格式的数据，数据大家按各自的需求生成，这里只给出前端的代码。设置setting，这里只关注async属性的配置 var setting = { //异步加载配置
thirft rpc 具体调用流程 BlueSkator 中间件 rpc thrift
Thrift调用过程中，Thrift客户端和服务器之间主要用到传输层类、协议层类和处理类三个主要的核心类，这三个类的相互协作共同完成rpc的整个调用过程。在调用过程中将按照以下顺序进行协同工作：（1）将客户端程序调用的函数名和参数传递给协议层（TProtocol），协议
异或运算推导, 交换数据 dcj3sjt126com PHP 异或 ^
/* * 5 0101 * 9 1010 * * 5 ^ 5 * 0101 * 0101 * ----- * 0000 * 得出第一个规律: 相同的数进行异或, 结果是0 * * 9 ^ 5 ^ 6 * 1010 * 0101 * ---- * 1111 * * 1111 * 0110 * ---- * 1001
事件源对象周华华 JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
MySql配置及相关命令 g21121 mysql
MySQL安装完毕后我们需要对它进行一些设置及性能优化，主要包括字符集设置，启动设置，连接优化，表优化，分区优化等等。一修改MySQL密码及用户
[简单]poi删除excel 2007超链接 53873039oycg Excel
采用解析sheet.xml方式删除超链接，缺点是要打开文件2次,代码如下: public void removeExcel2007AllHyperLink(String filePath) throws Exception { OPCPackage ocPkg = OPCPac
Struts2添加 open flash chart 云端月影
准备以下开源项目： 1. Struts 2.1.6 2. Open Flash Chart 2 Version 2 Lug Wyrm Charmer (28th, July 2009) 3. jofc2，这东西不知道是没做好还是什么意思，好像和ofc2不怎么匹配，最好下源码，有什么问题直接改。 4. log4j 用eclipse新建动态网站，取名OFC2Demo，将Struts2 l
spring包详解 aijuans spring
下载的spring包中文件及各种包众多，在项目中往往只有部分是我们必须的，如果不清楚什么时候需要什么包的话，看看下面就知道了。 aspectj目录下是在Spring框架下使用aspectj的源代码和测试程序文件。Aspectj是java最早的提供AOP的应用框架。 dist 目录下是Spring 的发布包，关于发布包下面会详细进行说明。 docs&nb
网站推广之seo概念 antonyup_2006 算法 Web 应用服务器搜索引擎 Google
持续开发一年多的b2c网站终于在08年10月23日上线了。作为开发人员的我在修改bug的同时，准备了解下网站的推广分析策略。所谓网站推广，目的在于让尽可能多的潜在用户了解并访问网站，通过网站获得有关产品和服务等信息，为最终形成购买决策提供支持。网站推广策略有很多，seo，email，adv
单例模式,sql注入,序列百合不是茶单例模式序列 sql注入预编译
序列在前面写过有关的博客,也有过总结,但是今天在做一个JDBC操作数据库的相关内容时需要使用序列创建一个自增长的字段居然不会了,所以将序列写在本篇的前面 1,序列是一个保存数据连续的增长的一种方式; 序列的创建; CREATE SEQUENCE seq_pro 2 INCREMENT BY 1 -- 每次加几个 3
Mockito单元测试实例 bijian1013 单元测试 mockito
Mockito单元测试实例： public class SettingServiceTest { private List<PersonDTO> personList = new ArrayList<PersonDTO>(); @InjectMocks private SettingPojoService settin
精通Oracle10编程SQL(9)使用游标 bijian1013 oracle 数据库 plsql
/* *使用游标 */ --显示游标 --在显式游标中使用FETCH...INTO语句 DECLARE CURSOR emp_cursor is select ename,sal from emp where deptno=1; v_ename emp.ename%TYPE; v_sal emp.sal%TYPE; begin ope
【Java语言】动态代理 bit1129 java语言
JDK接口动态代理 JDK自带的动态代理通过动态的根据接口生成字节码(实现接口的一个具体类)的方式，为接口的实现类提供代理。被代理的对象和代理对象通过InvocationHandler建立关联 package com.tom; import com.tom.model.User; import com.tom.service.IUserService;
Java通信之URL通信基础白糖_ java jdk webservice 网络协议 ITeye
java对网络通信以及提供了比较全面的jdk支持，java.net包能让程序员直接在程序中实现网络通信。在技术日新月异的现在，我们能通过很多方式实现数据通信，比如webservice、url通信、socket通信等等，今天简单介绍下URL通信。学习准备：建议首先学习java的IO基础知识 URL是统一资源定位器的简写，URL可以访问Internet和www，可以通过url
博弈Java讲义 - Java线程同步 (1) boyitech java 多线程同步锁
在并发编程中经常会碰到多个执行线程共享资源的问题。例如多个线程同时读写文件，共用数据库连接，全局的计数器等。如果不处理好多线程之间的同步问题很容易引起状态不一致或者其他的错误。同步不仅可以阻止一个线程看到对象处于不一致的状态，它还可以保证进入同步方法或者块的每个线程，都看到由同一锁保护的之前所有的修改结果。处理同步的关键就是要正确的识别临界条件（cri
java-给定字符串，删除开始和结尾处的空格，并将中间的多个连续的空格合并成一个。 bylijinnan java
public class DeleteExtraSpace { /** * 题目：给定字符串，删除开始和结尾处的空格，并将中间的多个连续的空格合并成一个。 * 方法1.用已有的String类的trim和replaceAll方法 * 方法2.全部用正则表达式，这个我不熟 * 方法3.“重新发明轮子”，从头遍历一次 */ public static v
An error has occurred.See the log file错误解决！ Kai_Ge MyEclipse
今天早上打开MyEclipse时，自动关闭！弹出An error has occurred.See the log file错误提示！很郁闷昨天启动和关闭还好着！！！打开几次依然报此错误，确定不是眼花了！打开日志文件！找到当日错误文件内容： --------------------------------------------------------------------------
[矿业与工业]修建一个空间矿床开采站要多少钱? comsci
地球上的钛金属矿藏已经接近枯竭........... 我们在冥王星的一颗卫星上面发现一些具有开采价值的矿床..... 那么,现在要编制一个预算,提交给财政部门..
解析Google Map Routes dai_lm google api
为了获得从A点到B点的路劲，经常会使用Google提供的API，例如 [url] http://maps.googleapis.com/maps/api/directions/json?origin=40.7144,-74.0060&destination=47.6063,-122.3204&sensor=false [/url] 从返回的结果上，大致可以了解应该怎么走，但
SQL还有多少“理所应当”？ datamachine sql
转贴存档，原帖地址：http://blog.chinaunix.net/uid-29242841-id-3968998.html、http://blog.chinaunix.net/uid-29242841-id-3971046.html！ ------------------------------------华丽的分割线--------------------------------
Yii使用Ajax验证时，如何设置某些字段不需要验证 dcj3sjt126com Ajax yii
经常像你注册页面,你可能非常希望只需要Ajax去验证用户名和Email,而不需要使用Ajax再去验证密码,默认如果你使用Yii 内置的ajax验证Form,例如: $form=$this->beginWidget('CActiveForm', array( 'id'=>'usuario-form',&
使用git同步网站代码 dcj3sjt126com crontab git
转自:http://ued.ctrip.com/blog/?p=3646?tn=gongxinjun.com 管理一网站，最开始使用的虚拟空间，采用提供商支持的ftp上传网站文件，后换用vps，vps可以自己搭建ftp的，但是懒得搞，直接使用scp传输文件到服务器，现在需要更新文件到服务器，使用scp真的很烦。发现本人就职的公司，采用的git+rsync的方式来管理、同步代码，遂
sql基本操作蕃薯耀 sql sql基本操作 sql常用操作
sql基本操作 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月1日 17:30:33 星期一 &
Spring4+Hibernate4+Atomikos3.3多数据源事务管理 hanqunfeng Hibernate4
Spring3+后不再对JTOM提供支持，所以可以改用Atomikos管理多数据源事务。Spring2.5+Hibernate3+JTOM参考：http://hanqunfeng.iteye.com/blog/1554251Atomikos官网网站：http://www.atomikos.com/ 一.pom.xml <dependency> <
jquery中两个值得注意的方法one()和trigger()方法 jackyrong trigger
在jquery中，有两个值得注意但容易忽视的方法，分别是one()方法和trigger()方法,这是从国内作者<<jquery权威指南》一书中看到不错的介绍 1） one方法 one方法的功能是让所选定的元素绑定一个仅触发一次的处理函数，格式为 one(type,${data},fn) &nb
拿工资不仅仅是让你写代码的 lampcy 工作面试咨询
这是我对团队每个新进员工说的第一件事情。这句话的意思是，我并不关心你是如何快速完成任务的，哪怕代码很差，只要它像救生艇通气门一样管用就行。这句话也是我最喜欢的座右铭之一。这个说法其实很合理：我们的工作是思考客户提出的问题，然后制定解决方案。思考第一，代码第二，公司请我们的最终目的不是写代码，而是想出解决方案。话粗理不粗。付你薪水不是让你来思考的，也不是让你来写代码的，你的目的是交付产品
架构师之对象操作----------对象的效率复制和判断是否全为空 nannan408 架构师
1.前言。如题。 2.代码。 (1)对象的复制，比spring的beanCopier在大并发下效率要高，利用net.sf.cglib.beans.BeanCopier Src src=new Src(); BeanCopier beanCopier = BeanCopier.create(Src.class, Des.class, false);
ajax 被缓存的解决方案 Rainbow702 JavaScript jquery Ajax cache 缓存
使用jquery的ajax来发送请求进行局部刷新画面，各位可能都做过。今天碰到一个奇怪的现象，就是，同一个ajax请求，在chrome中，不论发送多少次，都可以发送至服务器端，而不会被缓存。但是，换成在IE下的时候，发现，同一个ajax请求，会发生被缓存的情况，只有第一次才会被发送至服务器端，之后的不会再被发送。郁闷。解决方法如下： ① 直接使用 JQuery提供的 “cache”参数，
修改date.toLocaleString()的警告 tntxia String
我们在写程序的时候，经常要查看时间，所以我们经常会用到date.toLocaleString()，但是date.toLocaleString()是一个过时的API，代替的方法如下： package com.tntxia.htmlmaker.util; import java.text.SimpleDateFormat; import java.util.
项目完成后的小总结 xiaomiya js 总结项目
项目完成了，突然想做个总结但是有点无从下手了。做之前对于客户端给的接口很模式。然而定义好了格式要求就如此的愉快了。先说说项目主要实现的功能吧 1，按键精灵 2，获取行情数据 3，各种input输入条件判断 4，发送数据（有json格式和string格式） 5，获取预警条件列表和预警结果列表， 6，排序， 7，预警结果分页获取 8，导出文件（excel，text等） 9，修

HALLUSIONBENCH: An Advanced Diagnostic Suite for Entangled Language Hallucination & Visual Illusion

Abstract

1. Introduction ---- 一、简介

3.2.视觉、问题和注释结构

2. Related Work相关工作

2.1. Large Multi-Modal Models大型多模式模型

2.2. LVLM 中的幻觉

2.3. Benchmarks for Large VL Models ---- 2.3.大型 VL 模型的基准

3. HALLUSIONBENCH Construction ---- 3. HALLUSIONBENCH 建造

3.1.视觉问题分类

3.1.1 视觉相关问题

3.1.2 视觉补充问题

3.2.视觉、问题和注释结构

3.3.数据集统计

3.4. HALLUSIONBENCH 的独特之处

4.HALLUSIONBENCH 评估套件

4.1.纯文本 GPT4 辅助评估

4.2.正确性评估指标

4.3.分析评价标准

4.3.1 是/否偏差测试

5. 实验结果

5.1.模型

5.2.结果分析

你可能感兴趣的:(人工智能)

1. Introduction
----
一、简介

2.3. Benchmarks for Large VL Models
----
2.3.大型 VL 模型的基准

3. HALLUSIONBENCH Construction
----
3. HALLUSIONBENCH 建造