zenRRan

阿里达摩院金榕：从技术到科学，中国AI向何处去？

点击下面卡片，关注我呀，每天给你送来AI技术干货！

转载：机器之心

如果从达特茅斯会议起算，AI 已经走过 65 年历程，尤其是近些年深度学习兴起后，AI 迎来了空前未有的繁荣。不过，最近两年中国 AI 热潮似乎有所回落，在理论突破和落地应用上都遇到了挑战，外界不乏批评质疑的声音，甚至连一些 AI 从业者也有些沮丧。

从 90 年代到美国卡耐基梅隆大学读博开始，我有幸成为一名 AI 研究者，见证了这个领域的一些起伏。通过这篇文章，我将试图通过个人视角回顾 AI 的发展，审视我们当下所处的历史阶段，以及探索 AI 的未来究竟在哪里。

本文的部分观点如下：

AI 时代序幕刚拉开，AI 目前还处于初级阶段，犹如法拉第刚刚发现了交流电，还未能从技术上升为科学。
以深度学习为代表的 AI 研究这几年取得了诸多令人赞叹的进步，但部分也是运气的结果，其真正原理迄今无人知晓。
在遇到瓶颈后，深度学习有三个可能突破方向：深度学习的根本理解、自监督学习和小样本学习、知识与数据的有机融合。
AI 在当下最大的机会：用 AI 解决科学重要难题（AI for Science）。

一、AI 的历史阶段：手工作坊

虽然有人把当下归为第三波甚至是第四波 AI 浪潮，乐观地认为 AI 时代已经到来，但我的看法要谨慎一些：AI 无疑具有巨大潜力，但就目前我们的能力，AI 尚处于比较初级的阶段，是技术而非科学。这不仅是中国 AI 的问题，也是全球 AI 共同面临的难题。

这几年深度学习的快速发展，极大改变了 AI 行业的面貌，让 AI 成为公众日常使用的技术，甚至还出现了一些令公众惊奇的 AI 应用案例，让人误以为科幻电影即将变成现实。但实际上，技术发展需要长期积累，目前只是 AI 的初级阶段，AI 时代才刚开始。

如果将 AI 时代和电气时代类比，今天我们的 AI 技术还是法拉第时代的电。法拉第通过发现电磁感应现象，从而研制出人类第一台交流电发电机原型，不可谓不伟大。法拉第这批先行者，实践经验丰富，通过大量观察和反复实验，手工做出了各种新产品，但他们只是拉开了电气时代的序幕。电气时代的真正大发展，很大程度上受益于电磁场理论的提出。麦克斯维尔把实践的经验变成科学的理论，提出和证明了具有跨时代意义的麦克斯维尔方程。

如果人们对电磁的理解停留在法拉第的层次，电气革命是不可能发生的。试想一下，如果刮风下雨打雷甚至连温度变化都会导致断电，电怎么可能变成一个普惠性的产品，怎么可能变成社会基础设施？又怎么可能出现各种各样的电气产品、电子产品、通讯产品，彻底改变我们的生活方式？

这也是 AI 目前面临的问题，局限于特定的场景、特定的数据。AI 模型一旦走出实验室，受到现实世界的干扰和挑战就时常失效，鲁棒性不够；一旦换一个场景，我们就需要重新深度定制算法进行适配，费时费力，难以规模化推广，泛化能力较为有限。

这是因为今天的 AI 很大程度上是基于经验。AI 工程师就像当年的法拉第，能够做出一些 AI 产品，但都是知其然，不知其所以然，还未能掌握其中的核心原理。

那为何 AI 迄今未能成为一门科学？

答案是，技术发展之缓慢远超我们的想象。回顾 90 年代至今这二十多年来，我们看到的更多是 AI 应用工程上的快速进步，核心技术和核心问题的突破相对有限。一些技术看起来是这几年兴起的，实际上早已存在。

以自动驾驶为例，美国卡耐基梅隆大学的研究人员进行的 Alvinn 项目，在 80 年代末已经开始用神经网络来实现自动驾驶，1995 年成功自东向西穿越美国，历时 7 天，行驶近 3000 英里。在下棋方面，1992 年 IBM 研究人员开发的 TD-Gammon，和 AlphaZero 相似，能够自我学习和强化，达到了双陆棋领域的大师水平。

1995 年穿越美国项目开始之前的团队合照。

不过，由于数据和算力的限制，这些研究只是点状发生，没有形成规模，自然也没有引起大众的广泛讨论。今天由于商业的普及、算力的增强、数据的方便获取、应用门槛的降低，AI 开始触手可及。

但核心思想并没有根本性的变化。我们都是试图用有限样本来实现函数近似从而描述这个世界，有一个 input，再有一个 output，我们把 AI 的学习过程想象成一个函数的近似过程，包括我们的整个算法及训练过程，如梯度下降、梯度回传等。

同样的，核心问题也没有得到有效解决。90 年代学界就在问的核心问题，迄今都未得到回答，他们都和神经网络、深度学习密切相关。比如非凸函数的优化问题，它得到的解很可能是局部最优解，并非全局最优，训练时可能都无法收敛，有限数据还会带来泛化不足的问题。我们会不会被这个解带偏了，忽视了更多的可能性？

二、深度学习：大繁荣后遭遇发展瓶颈

毋庸讳言，以深度学习为代表的 AI 研究这几年取得了诸多令人赞叹的进步，比如在复杂网络的训练方面，产生了两个特别成功的网络结构，CNN 和 transformer。基于深度学习，AI 研究者在语音、语义、视觉等各个领域都实现了快速的发展，解决了诸多现实难题，实现了巨大的社会价值。

但回过头来看深度学习的发展，不得不感慨 AI 从业者非常幸运。

首先是随机梯度下降（SGD），极大推动了深度学习的发展。随机梯度下降其实是一个很简单的方法，具有较大局限性，在优化里面属于收敛较慢的方法，但它偏偏在深度网络中表现很好，而且还是出奇的好。为什么会这么好？迄今研究者都没有完美的答案。类似这样难以理解的好运气还包括残差网络、知识蒸馏、Batch Normalization、Warmup、Label Smoothing、Gradient Clip、Layer Scaling… 尤其是有些还具有超强的泛化能力，能用在多个场景中。

再者，在机器学习里，研究者一直在警惕过拟合（overfitting）的问题。当参数特别多时，一条曲线能够把所有的点都拟合得特别好，它大概率存在问题，但在深度学习里面这似乎不再成为一个问题… 虽然有很多研究者对此进行了探讨，但目前还有没有明确答案。更加令人惊讶的是，我们即使给数据一个随机的标签，它也可以完美拟合（请见下图红色曲线），最后得出拟合误差为 0。如果按照标准理论来说，这意味着这个模型没有任何偏差（bias），能帮我们解释任何结果。请想想看，任何东西都能解释的模型，真的可靠吗，包治百病的良药可信吗？

Understanding deep learning requires rethinking generalization. ICLR, 2017.

说到这里，让我们整体回顾下机器学习的发展历程，才能更好理解当下的深度学习。

机器学习有几波发展浪潮，在上世纪 80 年代到 90 年代，首先是基于规则（rule based）。从 90 年代到 2000 年代，以神经网络为主，大家发现神经网络可以做一些不错的事情，但是它有许多基础的问题没回答。所以 2000 年代以后，有一批人尝试去解决这些基础问题，最有名的叫 SVM（support vector machine），一批数学背景出身的研究者集中去理解机器学习的过程，学习最基础的数学问题, 如何更好实现函数的近似，如何保证快速收敛，如何保证它的泛化性？

那时候，研究者非常强调理解，好的结果应该是来自于我们对它的深刻理解。研究者会非常在乎有没有好的理论基础，因为要对算法做好的分析，需要先对泛函分析、优化理论有深刻的理解，接着还要再做泛化理论… 大概这几项都得非常好了，才可能在机器学习领域有发言权，否则连文章都看不懂。如果研究者自己要做一个大规模实验系统，特别是分布式的，还需要有工程的丰富经验，否则根本做不了，那时候没有太多现成的东西，更多只是理论，多数工程实现需要靠自己去跑。

但是深度学习时代，有人做出了非常好的框架，便利了所有的研究者，降低了门槛，这真是非常了不起的事情，促进了行业的快速发展。今天去做深度学习，有个好想法就可以干，只要写上几十行、甚至十几行代码就可以跑起来。成千上万人在实验各种各样的新项目，验证各种各样新想法，经常会冒出来非常让人惊喜的结果。

但我们可能需要意识到，时至今日，深度学习已遇到了很大的瓶颈。那些曾经帮助深度学习成功的好运气，那些无法理解的黑盒效应，今天已成为它进一步发展的桎梏。

三、下一代 AI 的三个可能方向

AI 的未来究竟在哪里？下一代 AI 将是什么？目前很难给出明确答案，但我认为，至少有三个方向值得重点探索和突破。

第一个方向是寻求对深度学习的根本理解，破除目前的黑盒状态，只有这样 AI 才有可能成为一门科学。具体来说，应该包括对以下关键问题的突破：

对基于 DNN 函数空间的更全面刻画；
对 SGD（或更广义的一阶优化算法）的理解；
重新考虑泛化理论的基础。

第二个方向是知识和数据的有机融合。

人类在做大量决定时，不仅使用数据，而且大量使用知识。如果我们的 AI 能够把知识结构有机融入，成为重要组成部分，AI 势必有突破性的发展。研究者已经在做知识图谱等工作，但需要进一步解决知识和数据的有机结合，探索出可用的框架。之前曾有些创新性的尝试，比如 Markov Logic，就是把逻辑和基础理论结合起来，形成了一些有趣的结构。

第三个重要方向是自监督学习和小样本学习。

我虽然列将这个列在第三，但却是目前值得重点推进的方向，它可以弥补 AI 和人类智能之间的差距。

今天我们经常听说 AI 在一些能力上可以超越人类，比如语音识别、图像识别，最近达摩院 AliceMind 在视觉问答上的得分也首次超过人类，但这并不意味着 AI 比人类更智能。谷歌 2019 年有篇论文 on the Measure of intelligence 非常有洞察力，核心观点是说，真正的智能不仅要具有高超的技能，更重要的是能否快速学习、快速适应或者快速通用？

按照这个观点，目前 AI 是远不如人类的，虽然它可能在一些方面的精度超越人类，但可用范围非常有限。这里的根本原因在于：人类只需要很小的学习成本就能快速达到结果，聪明的人更是如此——这也是我认为目前 AI 和人类的主要区别之一。

有一个很简单的事实证明 AI 不如人类智能，以翻译为例，现在好的翻译模型至少要亿级的数据。如果一本书大概是十几万字，AI 大概要读上万本书。我们很难想象一个人为了学习一门语言需要读上万本书。

另外有意思的对比是神经网络结构和人脑。目前 AI 非常强调深度，神经网络经常几十层甚至上百层，但我们看人类，以视觉为例，视觉神经网络总共就四层，非常高效。而且人脑还非常低功耗，只有 20 瓦左右，但今天 GPU 基本都是数百瓦，差了一个数量级。著名的 GPT-3 跑一次，碳排放相当于一架 747 飞机从美国东海岸到西海岸往返三次。再看信息编码，人脑是以时间序列来编，AI 是用张量和向量来表达。

也许有人说，AI 发展不必一定向人脑智能的方向发展。我也认为这个观点不无道理，但在 AI 遇到瓶颈，也找不到其他参照物时，参考人脑智能可能会给我们一些启发。比如，拿人脑智能来做对比，今天的深度神经网络是不是最合理的方向？今天的编码方式是不是最合理的？这些都是我们今天 AI 的基础，但它们是好的基础吗？

应该说，以 GPT-3 为代表的大模型，可能也是深度学习的一个突破方向，能够在一定程度上实现自学习。大模型有些像之前恶补了所有能看到的东西，碰到一个新场景，就不需要太多新数据。但这是一个最好的解决办法吗？我们目前还不知道。还是以翻译为例，很难想象一个人需要装这么多东西才能掌握一门外语。大模型现在都是百亿、千亿参数规模起步，没有一个人类会带着这么多数据。

所以，也许我们还需要继续探索。

四、AI 的机会：AI for Science

说到这里，也许有些人会失望。既然我们 AI 还未解决上面的三个难题，AI 还未成为科学，那 AI 还有什么价值？

技术本身就拥有巨大价值，像互联网就彻底重塑了我们的工作和生活。AI 作为一门技术，当下一个巨大的机会就是帮助解决科学重点难题（AI for Science）。AlphaFold 已经给了我们一个很好的示范，AI 解决了生物学里困扰半个世纪的蛋白质折叠难题。

我们要学习 AlphaFold，但没必要崇拜。AlphaFold 的示范意义在于，DeepMind 在选题上真是非常厉害，他们选择了一些今天已经有足够的基础和数据积累、有可能突破的难题，然后建设一个当下最好的团队，下决心去攻克。

我们有可能创造比 AlphaFold 更重要的成果，因为在自然科学领域，有着很多重要的 open questions，AI 还有更大的机会，可以去发掘新材料、发现晶体结构，甚至去证明或发现定理… AI 可颠覆传统的研究方法，甚至改写历史。

比如现在一些物理学家正在思考，能否用 AI 重新发现物理定律？过去数百年来，物理学定律的发现都是依赖天才，爱因斯坦发现了广义相对论和狭义相对论，海森堡、薛定谔等人开创了量子力学，这些都是个人行为。如果没有这些天才，很多领域的发展会推迟几十年甚至上百年。但今天，随着数据越来越多，科学规律越来越复杂，我们是不是可以依靠 AI 来推导出物理定律，而不再依赖一两个天才？

以量子力学为例，最核心的是薛定谔方程，它是由天才物理学家推导出来的。但现在，已有物理学家通过收集到的大量数据，用 AI 自动推导出其中规律，甚至还发现了薛定谔方程的另外一个写法。这真的是一件非常了不起、有可能改变物理学甚至人类未来的事情。

我们正在推进的 AI EARTH 项目，是将 AI 引入气象领域。天气预报已有上百年历史，是一个非常重大和复杂的科学问题，需要超级计算机才能完成复杂计算，不仅消耗大量资源而且还不是特别准确。我们今天是不是可以用 AI 来解决这个问题，让天气预报变得既高效又准确？如果能成功，将是一件非常振奋人心的事情。当然，这注定是一个非常艰难的过程，需要时间和决心。

五、AI 从业者：多一点兴趣，少一点功利

AI 的当下局面，是对我们所有 AI 研究者的考验。不管是 AI 的基础理论突破，还是 AI 去解决科学问题，都不是一蹴而就的事情，需要研究者们既聪明又坚定。如果不聪明，不可能在不确定的未来抓住机会；如果不坚定，很可能就被吓倒了。

但更关键的是兴趣驱动，而不是利益驱动，不能急功近利，这些年深度学习的繁荣，使得中国大量人才和资金涌入 AI 领域，快速推动了行业发展，但也催生了一些不切实际的期待。像 DeepMind 做了 AlphaGo 之后，中国一些人跟进复制，但对于核心基础创新进步来说意义相对有限。

既然 AI 还不是一门科学，我们要去探索没人做过的事情，很有可能失败。这意味着我们必须有真正的兴趣，靠兴趣和好奇心去驱动自己前行，才能扛过无数的失败。我们也许看到了 DeepMind 做成了 AlphaGo 和 AlphaFold 两个项目，但可能还有更多失败的、无人听闻的项目。

在兴趣驱动方面，国外研究人员值得我们学习。像一些获得图灵奖的顶级科学家，天天还在一线做研究，亲自推导理论。还记得在 CMU 读书的时候，当时学校有多个图灵奖得主，他们平常基本都穿梭在各种 seminar（研讨班）。我认识其中一个叫 Manuel Blum，因为密码学研究获得图灵奖，有一次我参加一个 seminar，发现 Manuel Blum 没有座位，就坐在教室的台阶上。他自己也不介意坐哪里，感兴趣就来了，没有座位就挤一挤。我曾有幸遇到过诺贝尔经济学奖得主托马斯 · 萨金特，作为经济学者，他早已功成名就，但他 60 岁开始学习广义相对论，70 岁开始学习深度学习，76 岁还和我们这些晚辈讨论深度学习的进展… 也许这就是对研究的真正热爱吧。

说回国内，我们也不必妄自菲薄，中国 AI 在工程方面拥有全球领先的实力，承认 AI 还比较初级并非否定从业者的努力，而是提醒我们需要更坚定地长期努力，不必急于一时。电气时代如果没有法拉第这些先行者，没有一个又一个的点状发现，不可能总结出理论，让人类迈入电气时代。

同样，AI 发展有赖于我们以重大创新为憧憬，一天天努力，不断尝试新想法，然后才会有一些小突破。当一些聪明的脑袋，能够将这些点状的突破联结起来，总结出来理论，AI 才会产生重大突破，最终上升为一门科学。

我们已经半只脚踏入 AI 时代的大门，这注定是一个比电气时代更加辉煌、激动人心的时代，但这一切的前提，都有赖于所有研究者的坚定不移的努力。

投稿或交流学习，备注：昵称-学校（公司）-方向，进入DL&NLP交流群。

方向有很多：机器学习、深度学习，python，情感分析、意见挖掘、句法分析、机器翻译、人机对话、知识图谱、语音识别等。

记得备注呦

点击上面卡片，关注我呀，每天推送AI技术干货~

整理不易，还望给个在看！

知识蒸馏：让大模型“瘦身“而不失智慧的魔术一休哥助手人工智能人工智能
引言：当AI模型需要"减肥"在人工智能领域，一个有趣的悖论正在上演：大模型的参数规模每年以10倍速度增长，而移动设备的算力却始终受限。GPT-4的1750亿参数需要价值500万美元的GPU集群运行，但现实中的智能设备可能只有指甲盖大小。这种矛盾催生了一项神奇的技术——知识蒸馏（KnowledgeDistillation），它就像给AI模型进行"脑外科手术"，将庞然大物的智慧浓缩到轻量模型中。第一章
Zynq PL端IP核之AXI DMA Mazy.v fpga开发嵌入式硬件 arm开发单片机
1.AXIDMA简介Zynq提供了两种DMA，一种是PS中的DMA控制器，通过GP口与PL端连接，另一种是PL中的AXIDMAIP核（软核），通过HP口与PS端连接。Zynq有4个HP接口，每一个HP接口都包含控制和数据FIFO，这些FIFO为大数据量突发传输提供缓冲，让HP接口成为理想的高速数据传输接口。AXIDMAIP内核在AXI4内存映射和AXI4StreamIP接口之间提供高带宽直接储存访
C++和Java相比，哪个更适合初学者学习？ c++java
C++和Java都是非常流行的编程语言，但它们在设计理念、应用场景和学习难度上存在显著差异。对于初学者来说，选择哪种语言更适合，取决于学习目标、兴趣和未来的职业规划。以下是对C++和Java的详细对比，帮助初学者做出选择：一、学习难度C++复杂性高：C++继承了C语言的复杂性，支持多种编程范式（如面向对象、泛型编程等），语法复杂，学习曲线陡峭。内存管理：C++需要手动管理内存，容易出现内存泄漏和悬
Ark-TS 语言：鸿蒙生态的高效开发利器，让我们用大白话说一说 harmonyos-next
Ark-TS（华为专门为鸿蒙系统——就是华为自己的手机、平板、智能设备操作系统——设计的编程语言，基于TypeScript，一种比普通JavaScript更严格、能减少错误的语言）是鸿蒙应用开发的主力工具。它就像给开发者配备了一套趁手的工具包，让写代码又快又稳。简单来说，Ark-TS有几个厉害的地方：静态类型检查（写代码时必须给变量指定类型，比如数字、文字，这样电脑能在运行前就发现类型错误，避免程
深入探索C++：从基础到高级 c++
深入探索C++：从基础到高级一、C++简介C++是一种通用的、静态类型的、大小写敏感的、自由格式的编程语言，支持过程化编程、面向对象编程和泛型编程。它最初由BjarneStroustrup在1980年代设计，目的是在C语言的基础上增加面向对象的功能。C++广泛应用于系统/应用程序软件、游戏开发、高性能服务器和客户端应用等领域。二、C++的核心特性（一）数据类型C++提供了丰富的数据类型，包括基本数
10.2 如何解决从复杂 PDF 文件中提取数据的问题？墨染辉大语言模型 pdf
10.2如何解决从复杂PDF文件中提取数据的问题？解决方案：嵌入式表格检索解释：嵌入式表格检索是一种专门针对从复杂PDF文件中的表格提取数据的技术。它结合了表格识别、解析和语义理解，使得从复杂结构的表格中检索信息成为可能。具体步骤：表格检测和识别：目标：在PDF页面中准确地定位和识别表格区域。方法：使用计算机视觉和深度学习技术，如卷积神经网络（CNN）或其他先进的图像处理算法。效果：能够检测出页面
golang-嵌套结构体 lmryBC49 golang 开发语言后端
结构体嵌套golang中没有类，他通过结构体来实现其他编程语言中类的相关功能。具名结构体基本语法基本语法golang的结构体嵌套特别简单。type结构体类型1struct{字段类型1字段类型2}//这样就实现了结构体的嵌套type结构体类型2struct{字段类型1字段类型2字段结构体类型1}举例packagestruct_knowledgeimport"fmt"typeWorkerstruct{
TensorFlow深度学习实战项目：从入门到精通点我头像干啥 Ai 深度学习 tensorflow 人工智能
引言深度学习作为人工智能领域的一个重要分支，近年来取得了显著的进展。TensorFlow作为Google开源的深度学习框架，因其强大的功能和灵活的架构，成为了众多开发者和研究者的首选工具。本文将带领大家通过一个实战项目，深入理解TensorFlow的使用方法，并掌握深度学习的基本流程。1.TensorFlow简介1.1TensorFlow是什么？TensorFlow是一个开源的机器学习框架，由Go
揭秘时空大数据：详细介绍、真实应用场景和数据示例解析陈书予 GIS开发（时空大数据）前端大数据 python 时序数据库
时空大数据(SpatialBigData)是指利用空间环境和时间环境信息，以及数字技术，从多种来源获取的海量、动态的、多维的数据，对空间环境和时间环境进行实时监测，并基于复杂的数据分析和挖掘，获取有价值的信息。时空大数据示例：1）社会网络数据：Twitter、Facebook、Instagram等社交媒体上的海量数据，可以通过时间、空间、主题等来提取有价值的信息。2）遥感图像数据：通过遥感技术从卫
使用大语言模型API在AI应用中的实现 qq_37836323 人工智能语言模型自然语言处理 python
随着人工智能技术的迅速发展，大语言模型（LLM）在自然语言处理（NLP）领域的应用越来越广泛。本文将介绍如何使用大语言模型API来实现一些基础的AI应用，并提供一个简单的demo代码，帮助大家更好地理解和使用这些技术。大语言模型API简介大语言模型（如GPT-4）能够理解和生成类似人类的文本。这些模型可以应用于各种任务，包括文本生成、语言翻译、情感分析、对话系统等。为了方便国内用户访问这些强大的模
python基于Django的旅游景点数据分析及可视化的设计与实现 7blk7 qq2295116502 python django 数据分析
目录项目介绍技术栈具体实现截图Scrapy爬虫框架关键技术和使用的工具环境等的说明解决的思路开发流程爬虫核心代码展示系统设计论文书写大纲详细视频演示源码获取项目介绍大数据分析是现下比较热门的词汇，通过分析之后可以得到更多深入且有价值的信息。现实的科技手段中，越来越多的应用都会涉及到大数据随着大数据时代的到来，数据挖掘、分析与应用成为多个行业的关键,本课题首先介绍了网络爬虫的基本概念以及技术实现方法
国外7个最佳大语言模型 (LLM) API推荐幂简集成 API新理念语言模型人工智能自然语言处理
大型语言模型(LLM)API将彻底改变我们处理语言的方式。在深度学习和机器学习算法的支持下，LLMAPI提供了前所未有的自然语言理解能力。通过利用这些新的API，开发人员现在可以创建能够以前所未有的方式理解和响应书面文本的应用程序。下面，我们将比较从Bard到ChatGPT、PaLM等市场上顶级LLMAPI。我们还将探讨整合这些LLM的潜在用例，并考虑其对语言处理的影响。什么是大语言模型(LLM)
【深度学习】DeepSeek模型介绍与部署 Nerous_ 深度学习深度学习人工智能
原文链接：DeepSeek-V31.介绍DeepSeek-V3，一个强大的混合专家(MoE)语言模型，拥有671B总参数，其中每个token激活37B参数。为了实现高效推理和成本效益的训练，DeepSeek-V3采用了多头潜在注意力(MLA)和DeepSeekMoE架构，这些架构在DeepSeek-V2中得到了充分验证。此外，DeepSeek-V3首次提出了无辅助损失的负载平衡策略，并设置了多to
【深度学习】 PyTorch一文详解 Nerous_ 深度学习深度学习 pytorch 人工智能机器学习 python
“PyTorchisadeeplearningframeworkthatprioritizessimplicityandflexibility,makingitthego-tochoiceforbothresearchersanddevelopers.”—Anonymous1.PyTorch简介1.1PyTorch的背景与发展PyTorch是由Facebook人工智能研究院（FAIR）开发的一个开
C#电子相册：面向对象设计与架构实践金融先生-Frank
本文还有配套的精品资源，点击获取简介：C#电子相册是一个使用高级编程语言C#开发的Windows平台应用程序。该项目采用面向对象编程方法，将对象如照片和相册封装、继承和多态地组织起来。它可能采用了MVC、MVVM或MVP架构模式，并使用.NETFramework或.NETCore以及VisualStudio作为开发环境。数据库管理部分涉及SQL数据库，支持相册数据的存储与检索。文件列表中的"eri
【DNN量化工具】QKeras 工具简介 kanhao100 笔记 dnn 人工智能神经网络
QKeras工具简介QKeras是一个用于量化深度学习模型的Keras扩展库，旨在使深度学习模型的量化（即将模型的浮点权重转换为低精度格式）变得简单而高效。QKeras主要目标是优化模型的存储和推理速度，特别适用于需要在资源受限的设备（如移动设备和嵌入式系统）上运行深度学习模型的场景。QKeras的主要特点量化支持：QKeras提供了对不同类型量化的支持，包括权重量化和激活量化。用户可以根据需求选
Softmax温度调节与注意力缩放：深度神经网络中的平滑艺术 Mark White dnn 人工智能神经网络
Softmax温度调节与注意力缩放：深度神经网络中的平滑艺术在深度学习的精密机械中，有些细微的调整机制往往被视为理所当然，却实际上蕴含着深刻的数学洞察和巧妙的工程智慧。今天，我们将探讨两个看似独立却本质相通的机制：生成模型中的温度参数与Transformer注意力机制中的缩放因子。这两个设计都围绕着同一个核心概念——softmax分布的平滑控制。Softmax函数：概率分布的催化剂在深入讨论之前，
存算一体与存算分离：架构设计的深度解析与实现方案克里斯蒂亚诺罗纳尔多阿维罗大数据数据库
随着数据量的不断增大和对计算能力的需求日益提高，存算一体作为一种新型架构设计理念，在大数据处理、云计算和人工智能等领域正逐步引起广泛关注。在深入探讨存算一体之前，我们需要先了解存储和计算的基本概念，以及存算分离和存算一体之间的区别。什么是存算一体？存算一体，顾名思义，是将数据存储与计算资源紧密结合，形成一个统一的架构。在这种架构下，存储和计算不仅在物理层面上结合，更在架构设计上深度融合。具体来说，
OpenCV图像拼接（2）基于羽化（feathering）技术的图像融合算法拼接类cv::detail::FeatherBlender 村北头的码农 OpenCV opencv 算法人工智能
操作系统：ubuntu22.04OpenCV版本：OpenCV4.9IDE:VisualStudioCode编程语言：C++11算法描述cv::detail::FeatherBlender是OpenCV中用于图像拼接的一个类，它属于stitching模块的一部分。这个类实现了基于羽化（feathering）技术的图像融合算法，用于平滑地混合重叠区域中的图像，从而生成无缝的全景图。主要特点羽化技术：
LakeHouse湖仓一体成为下一站灯塔，数仓、数据湖架构即将退出群聊科杰科技大数据数据仓库
摘要：当前的大数据技术应用趋势表明，客户对单一的数据湖和数仓架构并不满意。近年来几乎所有的数据仓库都增加了对Parquet和ORC格式的外部表支持，这使数仓用户可以从相同的SQL引擎查询数据湖表，但它不会使数据湖表更易于管理，也不会消除仓库中数据的ETL复杂性、陈旧性和高级分析挑战。KeenDataLakeHouse（湖仓一体）作为新一代大数据技术架构，将逐渐取代单一数据湖和数仓架构，成为大数据架
OpenCV图像拼接（1）自动校准之校准旋转相机的函数calibrateRotatingCamera() 村北头的码农 OpenCV opencv 人工智能
操作系统：ubuntu22.04OpenCV版本：OpenCV4.9IDE:VisualStudioCode编程语言：C++11算法描述cv::detail::calibrateRotatingCamera是OpenCV中用于校准旋转相机的函数。它特别适用于那种相机相对于一个固定的场景进行纯旋转运动的情况，比如在全景拼接过程中。此函数可以从一系列单应性矩阵（HomographyMatrices）中
QKeras、Brevitas和QONNX量化工具对比 kanhao100 笔记深度学习边缘计算
QKeras、Brevitas和QONNX量化工具对比一、引言在深度学习模型部署领域，量化技术已成为提升模型执行效率的关键手段。通过将浮点权重转换为低精度表示，量化能显著减小模型体积、降低内存占用并加速推理过程。对于资源受限的设备（如移动设备、嵌入式系统和边缘计算设备），量化技术尤为重要。本文深入对比三款主流量化工具：QKeras、Brevitas和QONNX，从用户实际应用角度剖析它们的技术特点
Umi-OCR：解锁高效文字识别的新时代水熠芝Dark-Haired
Umi-OCR：解锁高效文字识别的新时代Umi-OCR一款强大而高效的文字识别工具项目地址:https://gitcode.com/Resource-Bundle-Collection/6adda项目介绍在数字化浪潮席卷全球的今天，文字识别技术已成为提升工作效率和生活质量的关键工具。Umi-OCR，作为一款基于深度学习技术的开源文字识别工具，凭借其强大的功能和高效的性能，迅速成为众多用户的首选。无
Umi-OCR：一款强大而高效的文字识别工具裘心国Trent
Umi-OCR：一款强大而高效的文字识别工具Umi-OCR一款强大而高效的文字识别工具项目地址:https://gitcode.com/Resource-Bundle-Collection/6adda介绍Umi-OCR是一款基于深度学习技术的开源文字识别工具，特别适合日常办公、学术研究及数据分析等场景。它能有效解决将图像中的文字快速转化为可编辑文本的需求，极大提升工作效率。此工具依托于先进的计算机
自动语音识别（ASR）：技术、应用与未来 ajie1117 语音识别人工智能
自动语音识别（ASR）：技术、应用与未来1.ASR简介自动语音识别（ASR，AutomaticSpeechRecognition）是一种将语音转换为文本的技术。它利用人工智能（AI）、深度学习和自然语言处理（NLP）技术来识别和理解人类的语言，使计算机能够与人类进行更自然的交互。2.ASR的工作原理ASR的核心流程通常包括以下几个步骤：语音信号采集：通过麦克风或其他设备获取音频数据。预处理：去除噪
机器学习是怎么一步一步由神经网络发展到今天的Transformer架构的？ yuanpan 机器学习神经网络 transformer
机器学习和神经网络的发展经历了一系列重要的架构和技术阶段。以下是更全面的总结，涵盖了从早期神经网络到卷积神经网络之前的架构演变：1.早期神经网络：感知机（Perceptron）时间：1950年代末至1960年代。背景：感知机由FrankRosenblatt提出，是第一个具有学习能力的神经网络模型。它由单层神经元组成，可以用于简单的二分类任务。特点：输入层和输出层之间直接连接，没有隐藏层。使用简单的
30秒生成电子合同：B2B系统+AI引擎缩短80%交易周期|数商云数商云网络 B2B系统数字化电商平台人工智能大数据云计算数据库运维 java spring
引言在数字经济时代，B2B（Business-to-Business）电子商务正在以前所未有的速度改变着企业的运营模式。随着交易量的不断攀升，传统的合同生成和审核流程逐渐成为制约交易效率的瓶颈。然而，随着人工智能（AI）技术的飞速发展，结合B2B系统的智能化升级，我们正见证一场合同生成效率的革命。本文将深入探讨“30秒生成电子合同：B2B系统+AI引擎缩短80%交易周期”这一创新模式，解析其背后的
关于误差平面小记文弱_书生乱七八糟平面算法神经网络机器学习
四维曲面的二维切片：误差平面详解在深度学习优化过程中，我们通常研究损失函数（LossFunction）的变化，试图找到权重的最优配置。由于神经网络的参数空间通常是高维的，我们需要使用低维可视化的方法来理解优化过程和误差平面（ErrorSurface）。在这里，我们讨论一个四维曲面的二维切片，其中：三个维度是网络的权重（w1,w2,w3w_1,w_2,w_3w1,w2,w3）。第四个维度是误差（损失
奇异值分解（SVD）文弱_书生乱七八糟神经网络人工智能
奇异值分解(SVD)介绍奇异值分解(SVD)，这是最强大的矩阵分解技术之一。SVD广泛应用于机器学习、数据科学和其他计算领域，用于降维、降噪和矩阵近似等应用。与仅适用于方阵的特征分解不同，SVD可以应用于任何矩阵，使其成为一种多功能工具。在这里煮啵将分解SVD背后的理论，通过手动计算示例进行分析，并展示如何在Python中实现SVD。在本节结束时，您将清楚地了解SVD的强大功能及其在机器学习中的应
【北京迅为】iTOP-RK3568开发板OpenHarmony系统南向驱动开发UART接口运作机制迅为电子 RK3568开发板 RK3568开发板 OpenHarmony
瑞芯微RK3568芯片是一款定位中高端的通用型SOC，采用22nm制程工艺，搭载一颗四核Cortex-A55处理器和MaliG522EE图形处理器。RK3568支持4K解码和1080P编码，支持SATA/PCIE/USB3.0外围接口。RK3568内置独立NPU，可用于轻量级人工智能应用。RK3568支持安卓11和linux系统，主要面向物联网网关、NVR存储、工控平板、工业检测、工控盒、卡拉OK
Spring的注解积累 yijiesuifeng spring 注解
用注解来向Spring容器注册Bean。需要在applicationContext.xml中注册： <context:component-scan base-package=”pagkage1[,pagkage2,…,pagkageN]”/>。如：在base-package指明一个包 <context:component-sc
传感器百合不是茶 android 传感器
android传感器的作用主要就是来获取数据,根据得到的数据来触发某种事件下面就以重力传感器为例; 1,在onCreate中获得传感器服务 private SensorManager sm;// 获得系统的服务 private Sensor sensor;// 创建传感器实例 @Override protected void
[光磁与探测]金吕玉衣的意义 comsci
这是一个古代人的秘密:现在告诉大家信不信由你们: 穿上金律玉衣的人,如果处于灵魂出窍的状态,可以飞到宇宙中去看星星这就是为什么古代
精简的反序打印某个数沐刃青蛟打印
以前看到一些让求反序打印某个数的程序。比如：输入123，输出321。记得以前是告诉你是几位数的，当时就抓耳挠腮，完全没有思路。似乎最后是用到%和/方法解决的。而今突然想到一个简短的方法，就可以实现任意位数的反序打印（但是如果是首位数或者尾位数为0时就没有打印出来了）代码如下： long num, num1=0;
PHP：6种方法获取文件的扩展名 IT独行者 PHP 扩展名
PHP：6种方法获取文件的扩展名 1、字符串查找和截取的方法 1 $extension = substr ( strrchr ( $file , '.' ), 1); 2、字符串查找和截取的方法二 1 $extension = substr
面试111 文强chu 面试
1事务隔离级别有那些，事务特性是什么（问到一次） 2 spring aop 如何管理事务的，如何实现的。动态代理如何实现，jdk怎么实现动态代理的，ioc是怎么实现的，spring是单例还是多例，有那些初始化bean的方式，各有什么区别（经常问） 3 struts默认提供了那些拦截器（一次） 4 过滤器和拦截器的区别（频率也挺高） 5 final，finally final
XML的四种解析方式小桔子 dom jdom dom4j sax
在平时工作中，难免会遇到把 XML 作为数据存储格式。面对目前种类繁多的解决方案，哪个最适合我们呢？在这篇文章中，我对这四种主流方案做一个不完全评测，仅仅针对遍历 XML 这块来测试，因为遍历 XML 是工作中使用最多的（至少我认为）。　　预备　　测试环境：　　AMD 毒龙1.4G OC 1.5G、256M DDR333、Windows2000 Server
wordpress中常见的操作 aichenglong 中文注册 wordpress 移除菜单
1 wordpress中使用中文名注册解决办法 1)使用插件 2)修改wp源代码进入到wp-include/formatting.php文件中找到 function sanitize_user( $username, $strict = false
小飞飞学管理-1 alafqq 管理
项目管理的下午题，其实就在提出问题（挑刺），分析问题，解决问题。今天我随意看下10年上半年的第一题。主要就是项目经理的提拨和培养。结合我自己经历写下心得对于公司选拔和培养项目经理的制度有什么毛病呢？ 1，公司考察，选拔项目经理，只关注技术能力，而很少或没有关注管理方面的经验，能力。 2，公司对项目经理缺乏必要的项目管理知识和技能方面的培训。 3，公司对项目经理的工作缺乏进行指
IO输入输出部分探讨百合不是茶 IO
//文件处理在处理文件输入输出时要引入java.IO这个包； /* 1，运用File类对文件目录和属性进行操作 2，理解流，理解输入输出流的概念 3，使用字节/符流对文件进行读/写操作 4，了解标准的I/O 5，了解对象序列化 */ //1，运用File类对文件目录和属性进行操作 //在工程中线创建一个text.txt
getElementById的用法 bijian1013 element
getElementById是通过Id来设置/返回HTML标签的属性及调用其事件与方法。用这个方法基本上可以控制页面所有标签，条件很简单，就是给每个标签分配一个ID号。返回具有指定ID属性值的第一个对象的一个引用。语法： &n
励志经典语录 bijian1013 励志人生
经典语录1: 哈佛有一个著名的理论：人的差别在于业余时间，而一个人的命运决定于晚上8点到10点之间。每晚抽出2个小时的时间用来阅读、进修、思考或参加有意的演讲、讨论，你会发现，你的人生正在发生改变，坚持数年之后，成功会向你招手。不要每天抱着QQ/MSN/游戏/电影/肥皂剧……奋斗到12点都舍不得休息，看就看一些励志的影视或者文章，不要当作消遣；学会思考人生，学会感悟人生
[MongoDB学习笔记三]MongoDB分片 bit1129 mongodb
MongoDB的副本集(Replica Set)一方面解决了数据的备份和数据的可靠性问题，另一方面也提升了数据的读写性能。MongoDB分片(Sharding)则解决了数据的扩容问题，MongoDB作为云计算时代的分布式数据库，大容量数据存储，高效并发的数据存取，自动容错等是MongoDB的关键指标。本篇介绍MongoDB的切片(Sharding) 1.何时需要分片 &nbs
【Spark八十三】BlockManager在Spark中的使用场景 bit1129 manager
1. Broadcast变量的存储，在HttpBroadcast类中可以知道 2. RDD通过CacheManager存储RDD中的数据，CacheManager也是通过BlockManager进行存储的 3. ShuffleMapTask得到的结果数据，是通过FileShuffleBlockManager进行管理的，而FileShuffleBlockManager最终也是使用BlockMan
yum方式部署zabbix ronin47 yum方式部署zabbix
安装网络yum库#rpm -ivh http://repo.zabbix.com/zabbix/2.4/rhel/6/x86_64/zabbix-release-2.4-1.el6.noarch.rpm 通过yum装mysql和zabbix调用的插件还有agent代理#yum install zabbix-server-mysql zabbix-web-mysql mysql-
Hibernate4和MySQL5.5自动创建表失败问题解决方法 byalias J2EE Hibernate4
今天初学Hibernate4，了解了使用Hibernate的过程。大体分为4个步骤： ①创建hibernate.cfg.xml文件 ②创建持久化对象 ③创建*.hbm.xml映射文件 ④编写hibernate相应代码在第四步中，进行了单元测试，测试预期结果是hibernate自动帮助在数据库中创建数据表，结果JUnit单元测试没有问题，在控制台打印了创建数据表的SQL语句，但在数据库中
Netty源码学习-FrameDecoder bylijinnan java netty
Netty 3.x的user guide里FrameDecoder的例子，有几个疑问： 1.文档说：FrameDecoder calls decode method with an internally maintained cumulative buffer whenever new data is received. 为什么每次有新数据到达时，都会调用decode方法？ 2.Dec
SQL行列转换方法 chicony 行列转换
create table tb(终端名称 varchar(10) , CEI分值 varchar(10) , 终端数量 int) insert into tb values('三星' , '0-5' , 74) insert into tb values('三星' , '10-15' , 83) insert into tb values('苹果' , '0-5' , 93)
中文编码测试 ctrain 编码
循环打印转换编码 String[] codes = { "iso-8859-1", "utf-8", "gbk", "unicode" }; for (int i = 0; i < codes.length; i++) { for (int j
hive 客户端查询报堆内存溢出解决方法 daizj hive 堆内存溢出
hive> select * from t_test where ds=20150323 limit 2; OK Exception in thread "main" java.lang.OutOfMemoryError: Java heap space 问题原因： hive堆内存默认为256M 这个问题的解决方法为：修改/us
人有多大懒，才有多大闲 (评论『卓有成效的程序员』) dcj3sjt126com 程序员
卓有成效的程序员给我的震撼很大，程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可以那么勤奋，每天都孜孜不倦得做着重复单调的工作。在看这本书之前，我属于勤奋的人，而看完这本书以后，我要努力变成懒惰的人。不要在去庞大的开始菜单里面一项一项搜索自己的应用程序，也不要在自己的桌面上放置眼花缭乱的快捷图标
Eclipse简单有用的配置 dcj3sjt126com eclipse
1、显示行号 Window -- Prefences -- General -- Editors -- Text Editors -- show line numbers 2、代码提示字符 Window ->Perferences，并依次展开 Java -> Editor -> Content Assist，最下面一栏 auto-Activation
在tomcat上面安装solr4.8.0全过程 eksliang Solr solr4.0后的版本安装 solr4.8.0安装
转载请出自出处： http://eksliang.iteye.com/blog/2096478 首先solr是一个基于java的web的应用，所以安装solr之前必须先安装JDK和tomcat，我这里就先省略安装tomcat和jdk了第一步：当然是下载去官网上下载最新的solr版本，下载地址
Android APP通用型拒绝服务、漏洞分析报告 gg163 漏洞 android APP 分析
点评：记得曾经有段时间很多SRC平台被刷了大量APP本地拒绝服务漏洞，移动安全团队爱内测（ineice.com）发现了一个安卓客户端的通用型拒绝服务漏洞，来看看他们的详细分析吧。 0xr0ot和Xbalien交流所有可能导致应用拒绝服务的异常类型时，发现了一处通用的本地拒绝服务漏洞。该通用型本地拒绝服务可以造成大面积的app拒绝服务。针对序列化对象而出现的拒绝服务主要
HoverTree项目已经实现分层 hvt 编程 .net Web C#ASP.ENT
HoverTree项目已经初步实现分层，源代码已经上传到 http://hovertree.codeplex.com请到SOURCE CODE查看。在本地用SQL Server 2008 数据库测试成功。数据库和表请参考：http://keleyi.com/a/bjae/ue6stb42.htmHoverTree是一个ASP.NET 开源项目，希望对你学习ASP.NET或者C#语言有帮助，如果你对
Google Maps API v3: Remove Markers 移除标记天梯梦 google maps api
Simply do the following: I. Declare a global variable: var markersArray = []; II. Define a function: function clearOverlays() { for (var i = 0; i < markersArray.length; i++ )
jQuery选择器总结 lq38366 jquery 选择器
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40
基础数据结构和算法六：Quick sort sunwinner Algorithm Quicksort
Quick sort is probably used more widely than any other. It is popular because it is not difficult to implement, works well for a variety of different kinds of input data, and is substantially faster t
如何让Flash不遮挡HTML div元素的技巧_HTML/Xhtml_网页制作刘星宇 html Web
今天在写一个flash广告代码的时候，因为flash自带的链接，容易被当成弹出广告，所以做了一个div层放到flash上面，这样链接都是a触发的不会被拦截，但发现flash一直处于div层上面，原来flash需要加个参数才可以。让flash置于DIV层之下的方法，让flash不挡住飘浮层或下拉菜单，让Flash不档住浮动对象或层的关键参数：wmode=opaque。方法如下：
Mybatis实用Mapper SQL汇总示例 wdmcygah sql mysql mybatis 实用
Mybatis作为一个非常好用的持久层框架，相关资料真的是少得可怜，所幸的是官方文档还算详细。本博文主要列举一些个人感觉比较常用的场景及相应的Mapper SQL写法，希望能够对大家有所帮助。不少持久层框架对动态SQL的支持不足，在SQL需要动态拼接时非常苦恼，而Mybatis很好地解决了这个问题，算是框架的一大亮点。对于常见的场景，例如：批量插入/更新/删除，模糊查询，多条件查询，联表查询，

阿里达摩院金榕：从技术到科学，中国AI向何处去？

你可能感兴趣的:(大数据,编程语言,机器学习,人工智能,深度学习)