生信宝典

ChatGPT已打破图灵测试，新的测试方法在路上

生信麻瓜的 ChatGPT 4.0 初体验

偷个懒，用ChatGPT 帮我写段生物信息代码

代码看不懂？ChatGPT 帮你解释，详细到爆！

如果 ChatGPT 给出的的代码不太完善，如何请他一步步改好？

全球最佳的人工智能系统可以通过难度较大的考试，写出有人类感染力的文章，还能和人类一样流畅地聊天，以至于很多人无法辨别它们的输出是否为人类所写。那么，它们不能做什么呢？解决简单的视觉逻辑谜题。

据研究人员在2023年5月发布的报告称，通过一系列排列在屏幕上的鲜艳彩色方块的测试，大多数人可以发现其中的连接模式。然而，ChatGPT和搜索引擎Bing的AI系统GPT-4在其中一个模式的谜题中仅答对了三分之一，而在另一个模式中仅有3%的正确率[1]。

逻辑谜题的研究团队旨在为评估AI系统的能力提供更好的基准，并帮助解决大型语言模型（LLM）如GPT-4所面临的难题。从某种程度上测试时，它们轻松通过了曾被视为机器智能的重要里程碑式的任务。但从另一种测试方式来看，它们似乎不那么出色，展现出明显的盲点和对抽象概念无法进行推理的局限。

“人工智能领域的人们正在努力解决如何评估这些系统的问题，”新墨西哥州圣达菲研究所计算机科学家Melanie Mitchell表示，她的团队创建了这些逻辑谜题。

到目前为止，人工智能系统在ConceptARC测试上还无法达到人类水平的表现。这个逻辑谜题要求解决者在观察多维度展示的抽象概念基础上，展示格网模式在解决者看到后会如何变化。以下是基于相同抽象概念的两个样本任务。你能解决它们吗？

**看看你都答对了吗？**

过去两三年中，大型语言模型（LLM）在多项任务的能力上远远超过了之前的人工智能系统。它们的工作原理是，在给定输入文本时，根据它们在数十亿条在线句子中训练出的单词之间的统计相关性生成合理的下一个单词。对于建立在LLMs上的聊天机器人来说，还有一个额外的因素：人类培训师提供了广泛的反馈来调整机器人的响应。

令人惊讶的是，这种基于自动补全算法是从海量人类语言的数据中训练得出，其功能应用广泛。其他AI系统可能在某一项任务上击败LLMs，但它们必须根据特定问题相关的数据进行训练，并且不能从一项任务推广到另一项任务。

两派系研究人员对LLMs内部工作机制持不同看法，哈佛大学认知科学家Tomer Ullman表示，其中一些研究人员认为LLMs的成就是基于一种推理或理解的算法。然而其他研究人员（包括他自己和Mitchell等研究人员）则持谨慎态度。

Ullman说：“争论双方都是非常优秀的人才。” 之所以出现分歧，是因为没有确凿的证据支持任何一种观点。Ullman补充说：“没有仪器可以向某物发出“滴滴声-是的，有智能”。

来自讨论双方的研究人员表示，像逻辑谜题这样揭示人类和人工智能系统能力差异的测试是朝着正确方向迈出的一步。这些基准还可以帮助揭示当今机器学习系统的局限性，并梳理人类智能的要素, 纽约大学的认知计算科学家Brenden Lake说道。

关于如何最好地测试LLMs以及这些测试所显示的内容的研究也有着实际意义。如果LLMs将被应用在现实世界的领域——从医学到法律——了解其能力的局限性是非常重要的，Mitchell说道，“我们必须了解它们能做什么和不能做什么，以便我们知道如何安全地使用它们。”

图灵测试过时了？

长期以来，最著名的机器智能测试是图灵测试，由英国数学家和计算领域的杰出人物Alan Turing在 1950 年提出，当时计算机还处于起步阶段。图灵提出了一个名为模拟游戏的评估方法[2]。评估中，人类考官与隐藏的计算机和一个看不见的人进行简短的、基于文本的对话。考官能否可靠地判断出哪台是电脑？这是一个相当于“机器能思考吗？”的问题，图灵建议道。

Mitchell提到，图灵并未指出该测试场景的具体细节，因此没有确切的标题可以回溯。“这并非是一个能在机器上运行的字面测试——它更像是一个思想实验，”谷歌的软件工程师François Chollet说，他常驻华盛顿州西雅图。

但是，利用语言来测试机器是否能够思考的想法依然存在。几十年来，商人和慈善家Hugh Loebner资助了一年一度的图灵测试活动，即勒布纳奖（Loebner Prize）。人类考官与机器和人进行基于文本的对话，并试图猜测哪个是哪个。但计算机科学家Rob Wortham说，由于Loebner已经去世，用于策划图灵测试的会议经费已用完，因此，年度会议在2019年之后便停止了。Rob Wortham是英国人工智能和行为模拟研究学会的联合主任，该学会从2014年开始代表Loebner主办比赛。他说，LLM现在很有可能在这样的比赛中愚弄人类;巧合的是，这些测试活动在LLM兴起前不久就结束了。

其他研究人员一致认为，GPT-4 和其他 LLM 可能会通过图灵测试的流行概念，甚至可以在简短的对话中愚弄很多人。2023年5月，以色列特拉维夫AI21 Labs公司的研究人员报告说，超过150万人玩过基于图灵测试的网络游戏。玩家被分配聊天两分钟，要么是另一个玩家，要么是表现得像人的LLM驱动的机器人。只有60%的玩家能正确识别机器人，研究人员指出，这个概率堪比偶然事件[3]。

然而，熟悉LLM的研究人员可能仍然可以赢得这种游戏。Chollet说，他发现通过利用系统的已知弱点很容易判断出LLM。“如果你让我处于这样一种境地，你问我，'我现在在和LLM聊天吗？我一定能告诉你，“Chollet说。

他说，关键是让LLM脱离舒适区。他建议用利用不同场景的数据来训练LLM。在许多情况下，LLM通过提取最有可能与其训练数据中的原始问题相关的单词来作答，而不是通过给出适用新场景的正确答案。

然而，Chollet和其他人对使用以欺骗为中心的测试作为计算机科学的目标持怀疑态度。“这一切都是为了欺骗评审团，”Chollet说。该测试激励聊天机器人开发人员让人工智能达成欺骗，而不是开发有用或有趣的功能。

基准测试的危险

研究人员通常使用旨在评估特定能力（如语言能力、常识推理和数学能力）性能的基准来评估人工智能系统，并非采用图灵测试。越来越多的团队开始转向为人类设计的学术和专业考试。

2023年3月发布GPT-4时，位于加利福尼亚州旧金山的 OpenAI公司在一系列为机器设计的基准测试上测试了它的性能，包括阅读理解、数学和编码。GPT-4在大多数方面都取得了优异成绩[4].该公司还为 GPT-4 设置了大约 30 项考试，包括：为美国高中生设计的各种特定学科测试，称为大学先修课程;评估美国医生临床知识现状的考试;以及美国研究生学习选拔过程中使用的标准测试GRE。OpenAI 报告称，在构成美国许多州律师资格认证流程部分的统一律师考试中，GPT-4 的分数位于前 10% （参见“AI 系统性能 — 选定结果”）。

“很多语言模型都可以在这些基准测试上做得很好，” Mitchell说。“但通常，结论不是他们在这些一般能力上超过了人类，而是基准是有限的。”研究人员提到的一个挑战是，这些模型是在大量的文本上进行训练的，以至于他们已经在训练数据中看到类似的问题，因此实际上可能正在寻找答案。这类问题称为污染。

OpenAI表示，通过在问题和训练数据中寻找类似的单词字符串来进一步测试。去除类似字符串之前和之后测试LLM，其性能几乎无差异，这表明成功不能主要归因于污染。然而，一些研究人员质疑这项测试是否足够严格。

纽约大学的语言技术科学家Sam Bowman也在旧金山的人工智能公司Anthropic工作，他告诫不要将GPT-4的能力视为仅仅是记忆的结果。他说，污染“使结果有点复杂，但我认为它并没有真正改变大局”。

研究人员还指出，LLM在考试问题上的成功是不稳定的，可能无法转化为在现实世界中获得正确示例所需的强大能力。Mitchell说，稍微变换考试题目LLM可能就会失败。例如，她从工商管理硕士生考试题中抽去了一道，ChatGPT已经通过了，然后她稍微改写了一下。能回答这个问题的人就能回答改写后的问题。然而，ChatGPT没有通过。

在解释基准的含义方面存在更深层次的问题。对于一个人来说，这些考试的高分将可靠地表明普通智力水平（它指的是在一系列任务中表现良好并适应不同环境的能力）。也就是说，通常可以假设在考试中取得好成绩的人在其他认知测试中表现良好。但对于LLM来说，情况并非如此，Mitchell说;其工作方式与人非常不同。“以人类的思维方式进行推断并不总是适用于人工智能系统，”她说。

这可能是因为LLM只是从语言中学习;并未与物质世界相结合，他们就不会像人那样体验语言与物体、属性和感觉的联系。“很明显，他们理解单词的方式与人类不同，”Lake说。在他看来，LLM目前证明“如果没有真正的理解，你可以拥有非常流利的语言”。

另一方面，LLM还具有人类不具备的能力，例如能够知道人类曾经写过的几乎每个单词之间的联系。Mitchell说，这可能允许模型通过依赖语言或其他指标的怪癖来解决问题，而不必推广到更广泛的性能。

OpenAI的研究员Nick Ryder也认为，一项测试的表现可能不会像获得相同分数的人那样普遍化。“我认为人们不应该看对人类和大型语言模型的评估报告，并得出任何程度的等效性，”他说。OpenAI分数“并不意味着对类似人类的能力或类似人类的推理的陈述。它旨在说明模型在该任务上的表现”。

研究人员还比通过传统的机器基准测试和人工检查对LLM进行更广泛地探索。2023年3月，华盛顿州雷德蒙德Microsoft研究公司的Sébastien Bubeck和他的同事发表在预印本上的论文引起了很大的风波。论文题为“通用人工智能的火花：GPT-4的早期实验（Sparks of Artificial General Intelligence: Early experiments with GPT-4）”[5]。使用GPT-4的早期版本，他们记录了一系列令人惊讶的功能 - 其中许多与语言没有直接或明显的联系。一个值得注意的壮举是，它通过了心理学家的心理测试（心理测试可预测和推理他人的精神状态）。“鉴于GPT-4功能的广度和深度，我们认为它可以合理地被视为通用人工智能（AGI）系统的早期（但仍然不完整）版本，”他们写道。

尽管如此，正如Bubeck向Nature杂志澄清的那样，“GPT-4当然不会像人一样思考，对于它所展示的任何能力，它都会以自己的方式实现它”。

Mitchell说，虽然具有挑衅性，但该报告并没有系统的探讨LLM的能力。“这更像是人类学，”她说。Ullman说，要确信机器有心智理论，需要看到与类似人类的心智理论相对应的潜在认知过程的证据，而不仅仅是机器可以输出与人相同的答案。

人工智能研究人员说，为了找出LLM的优势和劣势，需要进行更广泛和严格的审计。色彩缤纷的逻辑谜题可能是一个候选者。

新的谜题

2019年，在LLMs（大型语言模型）走红之前，Chollet在网上发布了一种他创造的新型逻辑测试，名为“抽象和推理语料库”（ARC）[6]。求解者需要查看一个由方块构成的网格的多个视觉演示，观察网格是如何变换到另一种模式，并通过指示下一个网格将如何变换来展示他们掌握了网格变换的基本规律。“它旨在测试你对未曾见过的事物的适应能力，”Chollet说，并认为这是智能的本质。

ARC捕捉了“人类智能的特征”，Lake说，即从日常知识中进行抽象，并将其应用于以前未遇到的问题。

2020年，Chollet组织了一场机器人ARC竞赛，当时LLMs尚未获得广泛关注。获胜的机器人是一个专门训练用于解决类似ARC任务的AI系统，但与LLMs不同，它没有普遍应用的能力；它只正确解决了21%的问题。相比之下，人类解决ARC问题的正确率为80%[7]。几个研究团队现在已经使用ARC来测试LLMs的能力，但没有一项测验接近人类的表现。

Mitchell及其同事制作了一组新的谜题——ConceptARC，灵感来自ARC，但有两个关键的不同之处[1]。ConceptARC测试更为简单：Mitchell的团队希望确保基准测试不会错过机器智能的进展（即使进展很小）。另一个不同是，团队选择了特定的概念进行测试，然后为每个概念创建了一系列的谜题，这些谜题是概念的变体。

例如，为了测试“相同性”概念，一个谜题要求求解者保留具有相同形状的对象的模式；另一个谜题要求保留与同一轴线对齐的对象。这样做的目的是减少AI系统在未掌握概念的情况下通过测试的可能性（参见“击败机器的抽象思维测试”）。

性能不佳意味着什么

研究人员将ConceptARC任务分别提供给GPT-4和400名在线参与者。人类在所有概念组中的平均得分为 91%（在其中一个概念组上为97%）；GPT-4在其中一个组上得分为33%，在其余所有组上得分不到30%。

Mitchell表示：“我们展示了机器仍然无法接近人类水平。”“令人惊讶的是，尽管它从未接受过这方面的训练却能解决其中一些问题”她补充说。

该团队还测试了Chollet竞赛中的领先机器人，这些机器人并非像LLMs那样具有通用能力，而是专门设计用于解决视觉谜题（如ARC）。总体而言，它们表现比GPT-4要好，但比人类差，最佳得分为77%，但在大多数类别中得分小于60%[1]。

Bowman表示，GPT-4在ConceptARC测试中表现的很艰难并不意味着它缺乏抽象推理的潜在能力。他表示，ConceptARC对GPT-4来说并不公平，因为它是一个视觉测试，而LLM的公开版本只能接受文本输入，因此研究人员将用代表图像的数字数组输入给GPT-4（例如，空白像素可能为0，而彩色方块可能是一个数字）。相比之下，人类参与者只需看到图像即可。“我们是在将一个仅限于语言的系统与具有高度发达的视觉系统的人类进行比较，”Mitchell说。“因此，这种比较不公平。”

OpenAI已经创建了GPT-4的“多模态”版本，可以接受图像作为输入。Mitchell和她的团队正等待该版本公开，以便测试ConceptARC，尽管她认为多模态GPT-4的表现也不会好到哪里去。“我不认为这些系统具有与人类相同的抽象概念和推理能力，”她说。

剑桥麻省理工学院的计算认知科学家Sam Acquaviva对此表示赞同。“我会感到震惊，”他说。他指出，另一个研究团队已经对GPT-4进行了1D-ARC的基准测试，其中抽象模式限于单行而不是网格[8]。他说，这应该能够消除一些不公平。Acquaviva表示，尽管GPT-4的表现有所改善，但并不足以表明LLM能可靠地掌握潜在规则并进行推理。

推理论证

Bowman指出，与其他实验结果汇总在一起表明，LLM至少已经获得了对抽象概念进行推理的基本能力。在一项示例中，哈佛大学的计算机科学家Kenneth Li和他的同事使用了数字版本的棋盘游戏Othello（两名玩家通过将黑白棋子在8×8网格上进行竞争），测试LLM是否依赖于语言的记忆表面统计数据来生成文本，或者他们是否可能像人们一样构建世界的内部表征。

当他们通过提供玩家的招数列表来训练LLM时，它变得非常擅长为下一步的有效性提供准确的建议。研究人员认为，他们有证据表明LLM一直在跟踪棋盘的状态，并且基于棋盘状态来提出下一步落子何处，而不仅仅是提供文本建议。

Bowman承认，LLM的推理能力总体上是“参差不齐”的，而且比人更有限 - 但他说它们是存在的，并且似乎随着模型大小而改善，这表明未来的LLM会更好。“这些系统绝对没有我们想要的那么可靠或通用，而且可能有一些特定的抽象推理技能仍然完全失败，”他说。“但我认为基本能力是有的。

Bowman、Mitchell和其他人一致认为，测试LLM的抽象推理能力和其他智力迹象的最佳方法仍然是一个开放性的、悬而未决的问题。加利福尼亚州帕洛阿尔托斯坦福大学的认知科学家Michael Frank并不认为会出现一种单一的、包罗万象的测试会成为图灵测试的继任者。“没有卢比孔河，不是只有一个标准，”他说。相反，他认为研究人员需要进行大量测试来量化各种系统的优势和劣势。“这些代理很棒，但它们在很多很多方面都有突破，系统地探测它们绝对至关重要，”他说。

Wortham为任何试图理解AI系统的人提供建议——避免他所谓的拟人化的诅咒。“我们将任何看似能证明智慧的东西拟人化，”他说。

“这是一种诅咒，因为除了使用人类模型之外，我们无法想到以任何方式显示以目标为导向的行为，”他说。“我们正在想象它这样做的原因是因为它像我们一样思考。

参考文献：

[1]. Moskvichev, A., Odouard, V. V. & Mitchell, M. Preprint at https://arxiv.org/abs/2305.07141 (2023).

[2]. Turing, A. M. Mind LIX, 433–460 (1950).

[3]. Jannai, D., Meron, A., Lenz, B., Levine, Y. & Shoham, Y. Preprint at https://arxiv.org/abs/2305.20010 (2023).

[4]. OpenAI. Preprint at https://arxiv.org/abs/2303.08774 (2023).

[5]. Bubeck, S. et al. Preprint at https://arxiv.org/abs/2303.12712 (2023).

[6]. Chollet, F. Preprint at https://arxiv.org/abs/1911.01547 (2019).

[7]. Johnson, A., Vong, W. K., Lake, B. M. & Gureckis, T. M. Preprint at https://arxiv.org/abs/2103.05823 (2021).

[8]. Xu, Y., Li, W., Vaezipoor, P., Sanner. S. & Khalil, E. B. Preprint at https://arxiv.org/abs/2305.18354 (2023).

[9]. Li, K. et al. Proc. Eleventh Int. Conf. Learn. Represent. https://openreview.net/forum?id=DeG07_TcZvT (2023).

阅读原文内容：

https://doi.org/10.1038/d41586-023-02361-7

往期精品(点击图片直达文字对应教程)

机器学习

[特殊字符] AlphaGo：“神之一手”背后的智能革命与人机博弈新纪元大千AI助手人工智能 Python #OTHER 人工智能算法数据挖掘机器学习 alphago google 围棋
从围棋棋盘到科学前沿的通用人工智能范式突破本文由「大千AI助手」原创发布，专注用真话讲AI，回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我，一起撕掉过度包装，学习真实的AI技术！一、核心定义与历史意义AlphaGo是由谷歌DeepMind团队开发的围棋人工智能程序，其里程碑意义在于：首破人类围棋壁垒：2016年以4:1击败世界冠军李世石九段，成为首个在完整对局中战胜人类顶尖棋手的AI。
【人工智能】Spring AI Alibaba，一个面向 Java 开发者的开源框架，它旨在简化将人工智能（AI）功能集成到应用程序中的过程。本本本添哥 A -AIGC 人工智能大模型人工智能 java spring
一、SpringAIAlibaba介绍SpringAIAlibaba是一个面向Java开发者的开源框架，它旨在简化将人工智能（AI）功能集成到应用程序中的过程。该项目基于SpringAI构建，并且是阿里云通义系列模型及服务在JavaAI应用开发领域的最佳实践。SpringAIAlibaba的目标是为开发者提供一套高层次的AIAPI抽象以及与云原生基础设施的深度集成方案，从而帮助他们快速构建智能应用
模型融合与人机协同：构建人机共生的智能未来 AI天才研究院 Agentic AI 实战计算 AI人工智能与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
1.背景介绍在科技日新月异的今天，人工智能（AI）已经成为了我们生活中不可或缺的一部分。从智能手机，到自动驾驶汽车，再到医疗诊断，AI的应用已经渗透到了我们生活的方方面面。然而，尽管AI的发展已经取得了显著的成就，但是我们仍然面临着一个重大的挑战：如何让AI系统更好地理解和适应人类的需求，以实现人机共生的智能未来。为了解决这个问题，越来越多的研究者开始探索模型融合和人机协同的方法。2.核心概念与联
vLLM 优化与调优：提升模型性能的关键策略强哥之神人工智能深度学习计算机视觉 deepseek 智能体 vllm
在当今人工智能领域，大语言模型（LLM）的应用日益广泛，而优化和调优这些模型的性能成为了至关重要的任务。vLLM作为一种高效的推理引擎，提供了多种策略来提升模型的性能。本文将深入探讨vLLMV1的优化与调优策略，帮助读者更好地理解和应用这些技术。抢占式调度（Preemption）由于Transformer架构的自回归特性，有时键值缓存（KVcache）空间不足以处理所有批量请求。在这种情况下，vL
Spring Data Neo4j 与后端人工智能算法的数据交互 AI大模型应用实战 spring neo4j 人工智能 ai
SpringDataNeo4j与后端人工智能算法的数据交互关键词：SpringDataNeo4j、图数据库、人工智能算法、数据交互、知识图谱、图神经网络、数据集成摘要：本文深入探讨了如何利用SpringDataNeo4j框架实现后端人工智能算法与图数据库的高效数据交互。文章首先介绍了图数据库和人工智能算法的基本概念，然后详细解析了SpringDataNeo4j的核心架构和原理。接着，通过实际代码示
【AI大模型】深入解析预训练：大模型时代的核心引擎我爱一条柴ya 学习AI记录深度学习人工智能 ai python AI编程算法
预训练已成为现代人工智能，尤其是自然语言处理和计算机视觉领域的基石技术。它彻底改变了模型开发范式，催生了BERT、GPT等革命性模型。本文将系统阐述预训练的核心概念、原理、方法、应用及挑战。一、预训练的本质：为何需要它？核心问题：数据标注的瓶颈监督学习依赖海量高质量标注数据，获取成本极高（时间、金钱、专业知识）。对于复杂任务（如理解语义、生成文本），标注难度呈指数级上升。标注数据稀缺导致模型泛化能
广州曼顿2P数字微断：保护电力设备的安全守护者 mdkk678 安全
在现代社会，电力设备的安全运行对各行各业至关重要。然而，电力系统中存在各种电压波动、过载和短路等问题，可能对设备造成损害。为了保护电力设备免受这些问题的影响，广州曼顿推出了2P数字微断器。本文将介绍这一创新产品的特点和优势，以及它对电力设备的保护作用。广州曼顿科技有限公司专注用户侧智慧数字电气产品研制，以及智慧电能服务大数据云平台建设。基于人工智能技术，大幅提升人触电时的生命安全保障，以及电气火灾
Python通关秘籍之基础教程(一） Smile丶Life丶 Python 通关指南：从零基础到高手之路 python 开发语言后端
引言在编程的世界里，Python就像一位温和而强大的导师，它以简洁优雅的语法和强大的功能吸引着无数初学者和专业人士。无论你是想开发网站、分析数据、构建人工智能，还是仅仅想学习编程思维，Python都是你的理想选择。Python的魅力在于它的易读性和广泛的应用场景。它的代码就像英语句子一样自然，即使是完全没有编程经验的人也能快速上手。同时，Python拥有庞大的生态系统，从Web开发（Django、
多模态大模型发展全景：从架构创新到应用突破陈敬雷-充电了么-CEO兼CTO python 大模型多模态大模型 AIGC 机器学习深度学习 DeepSeek
注：此文章内容均节选自充电了么创始人，CEO兼CTO陈敬雷老师的新书《GPT多模态大模型与AIAgent智能体》（跟我一起学人工智能）【陈敬雷编著】【清华大学出版社】《GPT多模态大模型与AIAgent智能体》新出书籍配套视频【陈敬雷】推荐算法系统实战全系列精品课【陈敬雷】文章目录GPT多模态大模型系列四多模态大模型发展全景：从架构创新到应用突破更多技术内容总结GPT多模态大模型系列四多模态大模型
ollama v0.9.6版本发布详解：修复启动屏幕样式及新增工具名称参数支持福大大架构师每日一题文心一言vschatgpt ollama
作为近年来备受瞩目的开源对话式人工智能框架之一，ollama持续更新优化其产品，致力于为开发者带来更稳定、高效的使用体验。2025年7月8日，ollama发布了v0.9.6版本，这一版本在用户界面和API的可用性方面做出了重要改进，进一步增强了开发和集成的便捷性。本文将对ollamav0.9.6版本的更新内容进行全面解析，详细介绍新特性、修复的具体问题、应用示例及最佳实践，帮助开发者快速掌握和应用
AI人工智能与机器学习的大数据融合应用 AI智能探索者人工智能机器学习大数据 ai
AI人工智能与机器学习的大数据融合应用关键词：AI人工智能、机器学习、大数据、融合应用、数据挖掘摘要：本文深入探讨了AI人工智能与机器学习在大数据融合应用方面的相关内容。首先介绍了研究的背景、目的、预期读者和文档结构，对核心术语进行了清晰定义。接着阐述了AI、机器学习和大数据的核心概念及相互联系，给出了形象的文本示意图和Mermaid流程图。详细讲解了核心算法原理，并通过Python源代码进行说明
深入解读 Qwen3 技术报告（一）：引言小爷毛毛（卓寿杰）大模型AIGC 深度学习基础/原理人工智能自然语言处理 python 语言模型深度学习
重磅推荐专栏：《大模型AIGC》《课程大纲》《知识星球》本专栏致力于探索和讨论当今最前沿的技术趋势和应用领域，包括但不限于ChatGPT和StableDiffusion等。我们将深入研究大型模型的开发和应用，以及与之相关的人工智能生成内容（AIGC）技术。通过深入的技术解析和实践经验分享，旨在帮助读者更好地理解和应用这些领域的最新进展1.引言：迎接大型语言模型的新纪元我们正处在一个由人工智能（AI
Agentic AI与Gen AI区别 500佰技术资讯 NodeJS 人工智能
AgenticAI上班族的摸鱼神器我最近一年都在用AI，非但没有感觉AI成了我的助理，却感觉我好像再给AI打工。因为我总是需要不断去喂提示词，要不断调整模型的输出，我就像一个保姆一样要守在ChatGPT旁边，其实此时此刻，人类点亮的科技树，已经够我们用AI去自动化60%-70%的工作时长了，但这个实际进度还在个位数，ni知道问题所在吗。这问题在于，我们还处在generatedAI的阶段，我们和AI
AI人工智能遇上TensorFlow：技术融合新趋势 AI大模型应用之禅人工智能 tensorflow python ai
AI人工智能遇上TensorFlow：技术融合新趋势关键词：人工智能、TensorFlow、深度学习、神经网络、机器学习、技术融合、AI开发摘要：本文深入探讨了人工智能技术与TensorFlow框架的融合发展趋势。我们将从基础概念出发，详细分析TensorFlow在AI领域的核心优势，包括其架构设计、算法实现和实际应用。文章包含丰富的技术细节，如神经网络原理、TensorFlow核心算法实现、数学
边缘人工智能与医疗AI融合发展路径：技术融合与应用前景（上） Allen_Lyb 数智化医院2025 人工智能健康医疗算法
引言人工智能技术正以前所未有的速度改变着医疗保健领域，从辅助诊断到个性化治疗，AI应用的广度和深度不断拓展。在这一浪潮中，边缘人工智能（EdgeAI）作为一种新兴技术范式，正成为推动医疗AI创新的关键力量。边缘AI区别于传统的云计算模式，它将数据处理和AI模型部署在数据源头附近，实现快速响应和隐私保护。这种特性使其在医疗保健领域具有独特优势，特别是在实时监测、紧急响应和患者隐私保护等方面。边缘AI
7.3 React+CLI双剑合璧：GitHub监控工具界面开发实战全攻略少林码僧 github 前端 gpt 人工智能语言模型
React+CLI双剑合璧：GitHub监控工具界面开发实战全攻略-GitHubSentinelAgent用户界面原型设计与实现关键词：前端框架选型、React原型设计、API集成策略、CLI开发、组件化测试1.1用户界面功能规划通过ChatGPT交互式规划核心功能模块：
AI人工智能领域中AI作画的技术优势 AI大模型应用之禅人工智能 AI作画 ai
AI人工智能领域中AI作画的技术优势关键词：AI作画、技术优势、人工智能、艺术创作、图像生成摘要：本文深入探讨了AI人工智能领域中AI作画的技术优势。从背景介绍出发，阐述了AI作画的起源与发展，明确了文章的目的、范围、预期读者以及文档结构。接着详细分析了AI作画的核心概念，包括其原理和架构，并通过Mermaid流程图进行直观展示。对核心算法原理进行了深入剖析，结合Python代码示例进行讲解。同时
快速掌握Python编程基础张彦峰ZYF python
干货分享，感谢您的阅读！备注：本博客将自己初步学习Python的总结进行分享，希望大家通过本博客可以在短时间内快速掌握Python的基本程序编码能力，如有错误请留言指正，谢谢！（持续更新）一、快速了解Python和环境准备（一）Python快速介绍Python是一种简洁、强大、易读的编程语言，广泛应用于Web开发、数据分析、人工智能、自动化运维等领域。它由GuidovanRossum在1991年设
2025B卷 - 华为OD机试七日集训第5期 - 按算法分类，由易到难，循序渐进，玩转OD 哪吒搬砖工逆袭Java架构师华为od 算法华为OD机试 2025B卷 java
目录推荐刷题方法：一、适合人群二、本期训练时间三、如何参加四、七日集训第5期五、精心挑选21道高频100分经典题目，作为入门。第1天、逻辑分析第2天、逻辑分析第3天、逻辑分析第4天、字符串处理第5天、正则表达式第6天、深度优先搜索dfs第7天、深度优先搜索dfs六、集训总结国内直接使用ChatGPT4o、o3、o4-mini-high、GPT-4.5、GPT4.1、Gemini2.5pro0605
2025B卷 - 华为OD机试七日集训第4期 - 按算法分类，由易到难，循序渐进，玩转OD（Python/JS/C/C++）哪吒搬砖工逆袭Java架构师华为od 算法 python 华为OD机试 2025B卷
目录推荐刷题方法：一、适合人群二、本期训练时间三、如何参加四、七日集训第4期五、精心挑选21道高频100分经典题目，作为入门。第1天、逻辑分析第2天、逻辑分析第3天、逻辑分析第4天、贪心算法第5天、二分查找第6天、字符串处理第7天、字符串处理六、集训总结国内直接使用ChatGPT4o、o3、o4-mini-high、GPT-4.5、GPT4.1、Gemini2.5pro0605、ClaudeSon
人工智能开源的大模型训练微调框架LLaMA-Factory
LLaMA-Factory是一个开源的大模型训练微调框架，具有模块化设计和多种高效的训练方法，能够满足不同用户的需求。用户可以通过命令行或Web界面进行操作，实现个性化的语言模型微调。LLaMA-Factory是一个专注于高效微调LLaMA系列模型的开源框架（GitHub项目地址：https://github.com/hiyouga/LLaMA-Factory）。它以极简配置、低资源消耗和对中文任
2025B卷 - 华为OD机试七日集训第2期 - 按算法分类，由易到难，循序渐进，玩转OD（Python/JS/C/C++）
目录推荐刷题方法：一、适合人群二、本期训练时间三、如何参加四、七日集训第2期五、精心挑选21道高频100分经典题目，作为入门。第1天、逻辑分析第2天、数组第3天、双指针第4天、贪心算法第5天、字符串处理第6天、深度优先搜索DFS第7天、动态规划六、集训总结国内直接使用ChatGPT4o、o3、o4-mini-high、GPT-4.5、GPT4.1、Gemini2.5pro0605、ClaudeSo
智慧城市大脑解决方案
智慧城市大脑背景与意义智慧城市大脑作为城市管理的创新模式，通过集成大数据、人工智能等技术，实现了对城市运行的全面感知与智能决策。它不仅提升了城市管理效率，还为市民带来了更加便捷、安全的生活体验。智慧城市大脑建设历程某城市作为智慧城市大脑的创新策源地，自2016年起便与阿里巴巴集团深度合作，投入巨资自主研发城市数据大脑“交通小脑”平台。该平台成功接入了大量视频和数据，实现了对道路和时间资源的再分配，
csdn-AI测评 Right.W 人工智能
一、你平时会使用这类AI工具吗？你对这类型的工具有什么看法？AI工具灵活、多样、能够回答各种问题，大为方便了人们日常学习、工作、生活的需要。目前很流行的chartgpt就是一款超火爆的ai工具，可以写论文、敲代码各种功能十分强大，为各个领域的数字化和智能化进程给予了很大帮助。但是人的智慧和意识是机器无法取代的，人类对人工智能不能过度依赖，人工智能只是改善生活、提高效率的工具而已。二、你可以花几分钟
智慧城市大脑：城市治理的新引擎 Fulima_cloud 智慧城市人工智能
在科技日新月异的今天，智慧城市的概念已经深入人心。而智慧城市大脑，作为智慧城市的中枢神经系统，运用大数据、云计算、物联网、人工智能等先进技术，构建的城市级智能化管理体系，正逐步成为提升城市治理能力、优化城市服务、推动城市可持续发展的重要力量。智慧城市大脑是什么，简而言之，是运用大数据、云计算、物联网、人工智能等先进技术，构建的城市级智能化管理体系。它如同城市的“智慧中枢”，通过对城市全域运行数据的
AI时代下如何学习前端之第2篇：前端开发者的“AI焦虑“：被替代还是被赋能？指尖动听知识库 AI时代下如何学习前端人工智能前端
文/指尖动听知识库-胖胖文章为付费内容，商业行为，禁止私自转载及抄袭，违者必究！！！文章专栏：AI时代下如何学习前端“每当我看到AI生成完美代码时，都会想：我的工作还有价值吗？”——一位有5年经验的前端开发者如果你读了上一篇《ChatGPT问世后ÿ
【亲测免费】探索AudioSlicer：智能音频分割工具秦贝仁Lincoln
探索AudioSlicer：智能音频分割工具去发现同类优质开源项目:https://gitcode.com/项目介绍AudioSlicer是一个基于Python的轻量级工具，专门用于切割.wav音频文件。它通过检测静音段将音频拆分成多个独立样本，并生成一个.json文件，详细记录了每个切片的时间范围。该项目灵感源自AndrewPhillipDoss的工作，现在正向着人工智能适应的方向发展，有望实现
人工智能怎么入门？零基础入门指南：从小白到AI实战者的第一步 OpenCV图像识别人工智能人工智能计算机视觉自然语言处理神经网络机器学习
人工智能（AI）是当今最具前景的科技领域之一。从聊天机器人到自动驾驶，从图像识别到语音翻译，AI正在以前所未有的速度改变世界。但对于初学者来说，一个最常见的问题是：“我没有基础，也不是学数学或计算机的，人工智能还能学吗？我该怎么入门？”答案是：可以学，而且你并不孤单。越来越多的人正在以“跨专业、转行、自学”的方式进入AI领域。关键是，你需要一个清晰的入门路径，理解应该先做什么、学什么、避开什么误区
Attention机制完全解析：从原理到ChatGPT实战学废了wuwu chatgpt
一、Attention的本质与计算步骤1.1核心思想动态聚焦：Attention是一种信息分配机制，让模型在处理输入时动态关注最重要的部分。类比：像人类阅读时用荧光笔标记关键句子。1.2计算三步曲（以"吃苹果"为例）Q(Query)、K(Key)、V(Value)的分工角色数学表示作用类比QW_q·输入向量主动提问者：表示当前需要关注什么好比"学生举手提问"KW_k·输入向量匹配者：提供被匹配的特
深度学习基础与应用：从理论到实战创新工场
本文还有配套的精品资源，点击获取简介：深度学习是人工智能的核心分支，通过模拟人脑神经网络处理大量数据以执行复杂任务。Python因其简洁性和强大的库支持成为深度学习研究的首选语言。本文概述了深度学习基础概念、核心算法、Python框架，并假设了一个包含教程、示例代码、数据集、交互式学习环境、性能评估指标和进阶主题的“deep-learning-study-main”压缩包内容，旨在帮助学习者深入理
Java常用排序算法/程序员必须掌握的8大排序算法 cugfy java
分类： 1）插入排序（直接插入排序、希尔排序） 2）交换排序（冒泡排序、快速排序） 3）选择排序（直接选择排序、堆排序） 4）归并排序 5）分配排序（基数排序）所需辅助空间最多：归并排序所需辅助空间最少：堆排序平均速度最快：快速排序不稳定：快速排序，希尔排序，堆排序。先来看看8种排序之间的关系： 1.直接插入排序（1
【Spark102】Spark存储模块BlockManager剖析 bit1129 manager
Spark围绕着BlockManager构建了存储模块，包括RDD，Shuffle，Broadcast的存储都使用了BlockManager。而BlockManager在实现上是一个针对每个应用的Master/Executor结构，即Driver上BlockManager充当了Master角色，而各个Slave上(具体到应用范围，就是Executor)的BlockManager充当了Slave角色
linux 查看端口被占用情况详解 daizj linux 端口占用 netstat lsof
经常在启动一个程序会碰到端口被占用，这里讲一下怎么查看端口是否被占用，及哪个程序占用，怎么Kill掉已占用端口的程序 1、lsof -i:port port为端口号 [root@slave /data/spark-1.4.0-bin-cdh4]# lsof -i:8080 COMMAND PID USER FD TY
Hosts文件使用周凡杨 hosts locahost
一切都要从localhost说起，经常在tomcat容器起动后，访问页面时输入http://localhost:8088/index.jsp，大家都知道localhost代表本机地址，如果本机IP是10.10.134.21，那就相当于http://10.10.134.21:8088/index.jsp，有时候也会看到http: 127.0.0.1:
java excel工具 g21121 Java excel
直接上代码，一看就懂，利用的是jxl： import java.io.File; import java.io.IOException; import jxl.Cell; import jxl.Sheet; import jxl.Workbook; import jxl.read.biff.BiffException; import jxl.write.Label; import
web报表工具finereport常用函数的用法总结（数组函数）老A不折腾 finereport web报表函数总结
ADD2ARRAY ADDARRAY(array,insertArray, start):在数组第start个位置插入insertArray中的所有元素，再返回该数组。示例： ADDARRAY([3,4, 1, 5, 7], [23, 43, 22], 3)返回[3, 4, 23, 43, 22, 1, 5, 7]. ADDARRAY([3,4, 1, 5, 7], "测试&q
游戏服务器网络带宽负载计算墙头上一根草服务器
家庭所安装的4M，8M宽带。其中M是指，Mbits/S 其中要提前说明的是： 8bits = 1Byte 即8位等于1字节。我们硬盘大小50G。意思是50*1024M字节，约为 50000多字节。但是网宽是以“位”为单位的，所以，8Mbits就是1M字节。是容积体积的单位。 8Mbits/s后面的S是秒。8Mbits/s意思是每秒8M位，即每秒1M字节。我是在计算我们网络流量时想到的
我的spring学习笔记2-IoC（反向控制依赖注入） aijuans Spring 3 系列
IoC（反向控制依赖注入）这是Spring提出来了，这也是Spring一大特色。这里我不用多说，我们看Spring教程就可以了解。当然我们不用Spring也可以用IoC，下面我将介绍不用Spring的IoC。 IoC不是框架，她是java的技术，如今大多数轻量级的容器都会用到IoC技术。这里我就用一个例子来说明：如：程序中有 Mysql.calss 、Oracle.class 、SqlSe
高性能mysql 之选择存储引擎(一) annan211 mysql InnoDB MySQL引擎存储引擎
1 没有特殊情况，应尽可能使用InnoDB存储引擎。原因：InnoDB 和 MYIsAM 是mysql 最常用、使用最普遍的存储引擎。其中InnoDB是最重要、最广泛的存储引擎。她被设计用来处理大量的短期事务。短期事务大部分情况下是正常提交的，很少有回滚的情况。InnoDB的性能和自动崩溃恢复特性使得她在非事务型存储的需求中也非常流行，除非有非常
UDP网络编程百合不是茶 UDP编程局域网组播
UDP是基于无连接的,不可靠的传输与TCP/IP相反 UDP实现私聊,发送方式客户端,接受方式服务器 package netUDP_sc; import java.net.DatagramPacket; import java.net.DatagramSocket; import java.net.Ine
JQuery对象的val()方法执行结果分析 bijian1013 JavaScript js jquery
JavaScript中，如果id对应的标签不存在（同理JAVA中，如果对象不存在），则调用它的方法会报错或抛异常。在实际开发中，发现JQuery在id对应的标签不存在时，调其val()方法不会报错，结果是undefined。
http请求测试实例（采用json-lib解析） bijian1013 json http
由于fastjson只支持JDK1.5版本，因些对于JDK1.4的项目，可以采用json-lib来解析JSON数据。如下是http请求的另外一种写法，仅供参考。 package com; import java.util.HashMap; import java.util.Map; import
【RPC框架Hessian四】Hessian与Spring集成 bit1129 hessian
在【RPC框架Hessian二】Hessian 对象序列化和反序列化一文中介绍了基于Hessian的RPC服务的实现步骤，在那里使用Hessian提供的API完成基于Hessian的RPC服务开发和客户端调用，本文使用Spring对Hessian的集成来实现Hessian的RPC调用。定义模型、接口和服务器端代码 |---Model &nb
【Mahout三】基于Mahout CBayes算法的20newsgroup流程分析 bit1129 Mahout
1.Mahout环境搭建 1.下载Mahout http://mirror.bit.edu.cn/apache/mahout/0.10.0/mahout-distribution-0.10.0.tar.gz 2.解压Mahout 3. 配置环境变量 vim /etc/profile export HADOOP_HOME=/home
nginx负载tomcat遇非80时的转发问题 ronin47
　　nginx负载后端容器是tomcat（其它容器如WAS,JBOSS暂没发现这个问题）非８０端口，遇到跳转异常问题。解决的思路是：$host:port 详细如下：　　该问题是最先发现的，由于之前对nginx不是特别的熟悉所以该问题是个入门级别的： ? 1 2 3 4 5
java-17-在一个字符串中找到第一个只出现一次的字符 bylijinnan java
public class FirstShowOnlyOnceElement { /**Q17.在一个字符串中找到第一个只出现一次的字符。如输入abaccdeff，则输出b * 1.int[] count:count[i]表示i对应字符出现的次数 * 2.将26个英文字母映射：a-z <--> 0-25 * 3.假设全部字母都是小写 */ pu
mongoDB 复制集开窍的石头 mongodb
mongo的复制集就像mysql的主从数据库，当你往其中的主复制集(primary)写数据的时候，副复制集(secondary)会自动同步主复制集(Primary)的数据,当主复制集挂掉以后其中的一个副复制集会自动成为主复制集。提供服务器的可用性。和防止当机问题 mo
[宇宙与天文]宇宙时代的经济学 comsci 经济
宇宙尺度的交通工具一般都体型巨大，造价高昂。。。。。在宇宙中进行航行，近程采用反作用力类型的发动机，需要消耗少量矿石燃料，中远程航行要采用量子或者聚变反应堆发动机，进行超空间跳跃，要消耗大量高纯度水晶体能源以目前地球上国家的经济发展水平来讲，
Git忽略文件 Cwind git
有很多文件不必使用git管理。例如Eclipse或其他IDE生成的项目文件，编译生成的各种目标或临时文件等。使用git status时，会在Untracked files里面看到这些文件列表，在一次需要添加的文件比较多时（使用git add . / git add -u），会把这些所有的未跟踪文件添加进索引。 ==== ==== ==== 一些牢骚
MySQL连接数据库的必须配置 dashuaifu mysql 连接数据库配置
MySQL连接数据库的必须配置 1.driverClass：com.mysql.jdbc.Driver 2.jdbcUrl：jdbc:mysql://localhost:3306/dbname 3.user：username 4.password：password 其中1是驱动名；2是url，这里的‘dbna
一生要养成的60个习惯 dcj3sjt126com 习惯
一生要养成的60个习惯第1篇让你更受大家欢迎的习惯 1 守时，不准时赴约,让别人等,会失去很多机会。如何做到： ①该起床时就起床， ②养成任何事情都提前15分钟的习惯。 ③带本可以随时阅读的书，如果早了就拿出来读读。 ④有条理，生活没条理最容易耽误时间。 ⑤提前计划：将重要和不重要的事情岔开。 ⑥今天就准备好明天要穿的衣服。 ⑦按时睡觉，这会让按时起床更容易。 2 注重
[介绍]Yii 是什么 dcj3sjt126com PHP yii2
Yii 是一个高性能，基于组件的 PHP 框架，用于快速开发现代 Web 应用程序。名字 Yii （读作易）在中文里有“极致简单与不断演变”两重含义，也可看作 Yes It Is! 的缩写。 Yii 最适合做什么？ Yii 是一个通用的 Web 编程框架，即可以用于开发各种用 PHP 构建的 Web 应用。因为基于组件的框架结构和设计精巧的缓存支持，它特别适合开发大型应
Linux SSH常用总结 eksliang linux ssh SSHD
转载请出自出处：http://eksliang.iteye.com/blog/2186931 一、连接到远程主机格式： ssh name@remoteserver 例如： ssh [email protected] 二、连接到远程主机指定的端口格式： ssh name@remoteserver -p 22 例如： ssh i
快速上传头像到服务端工具类FaceUtil gundumw100 android
快速迭代用 import java.io.DataOutputStream; import java.io.File; import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io.FileOutputStream; import java.io.IOExceptio
jQuery入门之怎么使用 ini JavaScript html jquery Web css
jQuery的强大我何问起（个人主页：hovertree.com）就不用多说了，那么怎么使用jQuery呢？首先，下载jquery。下载地址：http://hovertree.com/hvtart/bjae/b8627323101a4994.htm，一个是压缩版本，一个是未压缩版本，如果在开发测试阶段，可以使用未压缩版本，实际应用一般使用压缩版本(min)。然后就在页面上引用。
带filter的hbase查询优化 kane_xie 查询优化 hbase RandomRowFilter
问题描述 hbase scan数据缓慢，server端出现LeaseException。hbase写入缓慢。问题原因直接原因是： hbase client端每次和regionserver交互的时候，都会在服务器端生成一个Lease,Lease的有效期由参数hbase.regionserver.lease.period确定。如果hbase scan需
java设计模式-单例模式 men4661273 java 单例枚举反射 IOC
单例模式1，饿汉模式 //饿汉式单例类.在类初始化时，已经自行实例化 public class Singleton1 { //私有的默认构造函数 private Singleton1() {} //已经自行实例化 private static final Singleton1 singl
mongodb 查询某一天所有信息的3种方法，根据日期查询 qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
// mongodb的查询真让人难以琢磨，就查询单天信息，都需要花费一番功夫才行。 // 第一种方式： coll.aggregate([ {$project:{sendDate: {$substr: ['$sendTime', 0, 10]}, sendTime: 1, content:1}}, {$match:{sendDate: '2015-
二维数组转换成JSON tangqi609567707 java 二维数组 json
原文出处：http://blog.csdn.net/springsen/article/details/7833596 public class Demo { public static void main(String[] args) { String[][] blogL
erlang supervisor wudixiaotie erlang
定义supervisor时，如果是监控celuesimple_one_for_one则删除children的时候就用supervisor:terminate_child (SupModuleName, ChildPid)，如果shutdown策略选择的是brutal_kill，那么supervisor会调用exit(ChildPid, kill)，这样的话如果Child的behavior是gen_

ChatGPT已打破图灵测试，新的测试方法在路上

往期精品(点击图片直达文字对应教程)

你可能感兴趣的:(chatgpt,人工智能)