浅唱丶

探秘AlphaStar:星际争霸人工智能

（声明：此文已发表于《爱上机器人》2019年2月刊，转载请联系作者）

前言

近十年来，人工智能的研究人员们一直在尝试将游戏用作测试和评估人工智能系统的方法。得益于算法的发展和计算能力的增长，研究人员们开始寻求攻克越来越复杂的游戏，这些游戏拥有可以用来解决科学和现实问题所需的诸多要素。从最初的Atari游戏（乒乓球、打砖块），到后来的围棋和象棋，再到即时战略游戏星际争霸系列，人类正在一步一步地向通用人工智能迈进。

AlphaStar的诞生

2017年5月28日，一场围棋世纪大战落下帷幕，Deepmind公司开发的人工智能围棋系统AlphaGo以3：0的比分完胜世界排名第一的人类棋手柯洁。至此，人工智能终于攻破了千百年来人类智慧的最后防线——被称为“千古无重局”的围棋。随后，Deepmind开始将重心放在即时战略游戏星际争霸2上，试图攻克这一更大的难题。

柯洁 vs AlphaGo

早在2011年3月，Deepmind的创始人Demis Hassabis就提出了AI挑战星际争霸的目标，Deepmind的研究团队也开始了相关研究。无奈受限于当时的技术，这一目标一直没有实现。

2017年8月，Deepmind与星际争霸系列的制作者暴雪娱乐公司合作，联合发布了他们一直在使用的星际争霸2人工智能研究环境SC2LE，帮助广大研究人员和爱好者进行研究。除此之外，暴雪还宣布挑选出十万份匿名玩家的比赛录像进行数据支撑。

2018年6月，Deepmind公布了研究的最新进展，它们用关系性深度强化学习，在星际争霸2的六个模拟小游戏（移动、采矿、建造等）中达到当前最优水平。

终于，到了2019年1月25日，AlphaStar首次公开亮相。这个名字的由来与AlphaGo相同：Alpha是希腊语中的第一个字母，有起源、开端的意思；Star则是星际争霸的英文名StarCraft的第一个字母。据Deepmind介绍，AlphaStar使用的种族为神族（Protoss），在此前以5：0的战绩击败了Team Liquid战队的职业星际争霸2选手TLO。在训练了两周后，AlphaStar再次挑战WCS世界锦标赛亚军——同样来自Team Liquid战队的Mana。不同与TLO，Mana可以称的上是当今最强的欧洲神族之一，并且不久前在WCS世界锦标赛上获得亚军。面对如此强大的对手，最新的AlphaStar的表现依旧让人眼前一亮。又是5：0，AlphaStar的表现超过了Deepmind的研究团队的预期。在回顾了全部10场比赛的录像后，Mana与AlphaStar在现场进行了一场比赛。不过这次的AlphaStar与之前有很大不同，它在视野感知上更接近与人类。也就是说，需要自己控制视角而无法直接读取地图上所有可见内容。最终，Mana击败AlphaStar，捍卫了人类的荣誉。

AlphaStar比赛分析

对战信息

这10场比赛全部是星际争霸2虚空之遗版本，双方的种族都是星灵(Protoss，又称神族)，地图是汇龙岛-天梯版（Catalyst LE）。星际争霸中一共3个种族：人类(Terran)、星灵(Protoss)、异虫(Zerg)。目前，AlphaStar仅学习了星灵vs星灵这一种对抗，因为这一种对抗的战术博弈非常多变，可以更好的训练AI的决策能力。

在与TLO的揭幕战之中，AlphaStar使用了人类比赛中最常规的开局，双方前期的发展基本完全相同，但是AlphaStar的建筑建造位置略有瑕疵。但是这些都无伤大雅。紧接着，AlphaStar建造了4个兵营组织快速进攻，在展现了非常精彩的操作后战胜了对手，仅用时7分钟。后续的四场比赛中，AlphaStar连续展现了多种战术，比如：自爆球、闪烁追猎等。而TLO显然已经被AlphaStar打乱了阵脚，四场比赛也是一败涂地。在战术博弈和操作上，AlphaStar都是完全碾压了对手。

可以说AlphaStar的首次亮相的表现远超在场的所有人的预期，5场比赛赢得干脆利落，丝毫不给对手任何机会。这场对局使我们第一次正面了解了AlphaStar，虽然它轻松战胜了对手，但是由于训练时间太短，所以仍然会做出一些让人无法理解的奇怪操作，在专业玩家眼里看来还是破绽百出。AlphaStar学习了上万场人类比赛的录像，却还没有掌握建筑的建造位置，经常会出现被自己的建筑卡住的情况。在第四场比赛中生产了过多的反隐形单位却没有分散使用造成资源浪费、单矿运营农民数量达到上限时建造了额外的农民等细节暴露它目前的实力并不是很强。

5个“观察者“在一片战场上

TLO虽然是一名职业选手，但是他并不是职业神族选手，他的主族是异虫。所以，在又训练了两周后，AlphaStar与职业神族选手Mana展开了较量。

AlphaStar在闭关修炼之后已然脱胎换骨，弥补了之前很多细节上的不足。一盘野外造兵营的极限进攻战术，把开矿运营的Mana打得措手不及，5分钟兵不血刃拿下第一局。第二盘AlphaStar使用了人类比赛中非常少见的凤凰+追猎者组合，依靠犀利的操作在两三波交换上占据优势，从而获得胜利。后续的三盘中，AlphaStar使用的战术都不是人类比赛的常规战术，它使用追猎者作为核心兵种，配合其他兵种辅助，都取得不错的成效，打得世界亚军Mana苦笑连连。这就是AlphaStar学习出的自己对游戏的独特理解。

平均每场比赛建造50个追猎者

最后的现场对决中，在AlphaStar的强势期，Mana采用了运输机带不朽者空投骚扰战术，本在进攻途中AlphaStar竟然撤回了所有部队进行回防。Mana见状立刻打起了游击战，敌退我进，敌进我退。几次反复下来，由于不懂得分兵防守，AlphaStar的部队被困在基地无法出门，经济也受到打击。最终Mana在一个有利地形包夹了AlphaStar的主力部队，获得了胜利。

由此我们不难看出，尽管AlphaStar的策略已经趋于长期优化，但似乎仍然会在一定程度上陷入局部最优，被人类发现其固定模式，落入圈套。

星际争霸AI背景

总比分10：1，这一胜利的重要程度不亚于当年的AlphaGo。同围棋一样，星际争霸也属于零和博弈问题。但是星际争霸的非完全信息博弈以及更庞大的状态空间和动作空间等特点，才使它真正成为了人工智能的又一大挑战。

众所周知，围棋的棋盘上可能出现的情况数非常之多，所以被称为“千古无重局”,其状态空间复杂度多达1048。每一步可以选择的落点（即动作空间）有大约300个。这一数字看上去已经十分巨大，但是还远不及即时战略游戏，尤其是星际争霸。它的状态空间已经不能用数字描述，可以说是”无穷大“，动作空间更是达到了指数级别。而所谓非完全信息博弈，就是指不能完全获取所有的游戏信息。这一点在即时战略游戏中以“战争迷雾”的形式普遍存在。游戏里，你只能感知获取你周围环境的信息，在你感知范围之外的一切都被黑雾所笼罩。在围棋中，整个棋盘的信息和对手的每一次落子都会被我方感知，智能体就能通过这些信息计算出最佳策略。在星际争霸2中，我们能获取的信息十分有限，唯一的办法是通过侦察手段获得对手的情报，即便如此智能体也无法第一时间获知对手的每一步动作，这会极大地影响智能体的判断和决策。Deepmind的研究团队曾公开表示，对于星际争霸2的AI来说，非完全信息博弈是最大的挑战。其实，这一点与我们的现实生活十分相似：我们可以把现实生活看成是一场即时战略游戏，从读书、找工作，到参加各种比赛，我们所能获取到的信息永远只是我们需要知道的决策信息的一小部分。这场游戏中我们的对手，也就是其他人，永远在迷雾中行动。因此，我们要面对的最大挑着就是这永恒的不确定性。不论我们拥有多么强大的能力，我们依然生活在充满不确定性的迷雾里，这就要求我们不能过度渴望精确的预测，要学会根据现有的信息进行决策。

在AlphaStar面世之前，就已经有一些科研团队发布过一些成熟的AI，其中包括笔者所在的中科院自动化所、FaceBook、腾讯AI Lab、加州大学伯克利分校、南京大学等。在不久前，纪念大学的ai团队举办了世界上最大的星际争霸AI大赛AIIDE，采用的版本是星际争霸母巢之战，冠军由三星开发的SAIDA获得。SAIDA是一个基于规则的AI，没有使用任何机器学习技术。换句话说，它的一切决策都是人类根据经验写好的程序执行的，而FaceBook开发的基于机器学习的CherryPi成绩并不理想。究其原因，大概是因为机器学习对理论、工程、计算能力的要求都相当高，想要在星际争霸上超越人类长时间积累的经验绝非易事。但是，星际争霸是个博弈游戏，己方的决策应该建立在对手的决策上，这种基于规则的AI系统一旦被人熟知它的套路，就会变得不堪一击。与之相比，AlphaStar就相当于一个会思考的机器人，它已经有了真正的通用人工智能的影子，即：自主学习、举一反三的能力。这其中究竟包含了哪些技术呢？下面为大家一一解读。

技术解读

Deepmind研究团队在他们发表的论文中将训练AlphaStar的算法称为关系性深度强化学习，其本质就是融合了监督学习和强化学习以及多体博弈的方法。

监督学习是在训练过程中，我们使用带有标记的数据来告诉AI哪些是正确的、哪些是错误的。以人像检测为例，我们在输入一张照片的同时也要输入这张照片是否有人像。这样训练完成后的AI可以自行检测任何照片中的人像。在这种情况下，我们进行的通常是一个结果为yes or no的训练，但事实是，监督学习也可以用于输出一组值，而不仅仅是0或1。例如，我们可以训练一个模型，用它来输出一个人偿还信用卡贷款的概率，那么在这种情况下，输出值就是0到100之间的任意值。当前最火的深度学习也属于监督学习的范畴，它使用深度神经网络去近似这个判定过程。神经网络中包含多个神经元，每一个神经元通过激活函数决定是否允许通过。所有被激活的神经元会将它计算后的数据传递给下一层直到输出层，然后将这个输出与我们给出的标记对比，通过误差函数计算出误差反馈给网络，利用这个误差从后往前逐层修改神经元的权重。这个过程我们通常称之为反向传播。通过这个训练过程，神经网络模型就学到了判断能力，从而帮助我们进行决策。目前为止，监督学习已经广泛应用在语音识别，车辆检测等诸多领域。

比赛中AlphaStar如何做出下一步决策

从这张图上我们可以清晰地看到，AlphaStar的各种操作是从神经网络的原始观察接口输入系统（左下1），然后神经网络开始激活处理输入（左下2），最终输出当前决策以及决策目标位置。与此同时计算自己的胜率。

监督学习虽然已经拥有很多成熟的理论和算法，但是它必须使用有标记的数据才可以训练。得到一个标注好的数据集可能会很难亦或是很昂贵，所以你需要确保预测的价值能够证明获得标记数据的成本是值得的。强化学习不需要带标签的数据，而是拥有一个目标和评价是否接近目标的回报函数。强化学习的思想更倾向于训练AI使他学会如何在一场游戏中得到最大回报（通常是取得胜利）。也就是说，强化学习会在没有任何标签的情况下，通过先尝试做出一些行为得到一个结果，通过这个结果是对还是错的反馈，调整之前的行为，就这样不断的调整，算法能够学习到在什么样的情况下选择什么样的行为可以得到最好的结果。这个反馈通常是具有延迟的，就像在围棋和星际争霸中，我们当前的一步动作并不能马上带来回报，而是在一段时间后才发挥作用，我们称之为长期回报。为了获得准确的长期回报，AI必须经过很多次尝试，所以强化学习对算法和算力有着很大的要求，通常需要很长时间来训练。

在创造AlphaStar时，Deepmind团队首先从人类比赛的录像中提取数据，利用监督学习训练了一个神经网络，再基于强化学习让AlphaStar进行对战并自我提升。这就是AlphaStar的整体框架。

MMR分布图

上图中的每一个点代表AlphaStar的一个训练完成的版本，MMR是评价玩家实力的标准。通常业余选手的MMR值在0到5500范围内呈正态分布。5500以上就是业余顶尖选手和职业选手水准。TLO和Mana的MMR值分别在5600和7000左右。图中左边的灰色部分是监督学习与训练出的版本，可以看到最高的也不到5000MMR。右边是强化学习的自我博弈提升阶段，训练出的最强版本的AlphaStar的MMR有7500左右，并且我们可以看到强化学习训练的时间长达2周。之前的AlphaGo中，自我对弈阶段的对手都是由所有之前的训练过程中出现的表现最好的版本生成的，也就是说每一时刻都存在一个最好的版本，并不断寻找比他更好的版本进行替换。但对于星际争霸，Deepmind的研究团队认为不同的优秀策略之间是相互克制的，事实也是如此，没有哪一种策略是可以完胜其他所有策略的。所以这次他们的做法是建立了一个“AlphaStar”联赛，分别更新和记录多个不同版本的AI。在这个过程里，可以做到不会把某些个体学会的成果轻易遗忘，而是在多体博弈中有效运用所有已经学会的策略并选择他写胜率较高的保留。最终的训练结果是一个达到纳什均衡状态的最强AI组合。

AlphaStar联赛

如上图所示，AlphaStar每轮都会在数个比较强的版本中进行分支，分支前的版本会被固定参数保留下来，一直参与后续的多轮自我对战。这样在不断提升AI水平的前提下又保留了足够的多样性。

未来展望

星际争霸是个足够复杂且具有代表性的任务，用来解决这个任务的技术也可以用在其他的复杂问题上。AlphaStar让我们看到了AI在非完全信息博弈这个与真实世界的情况非常接近的背景里所取得的巨大进步。也许在不久的将来，AI就能学会指挥一场现实世界的战争。但我们也无需恐慌，AlphaStar真正的贡献是为我们带来的是一场AI革命，那些新的AI技术会很快应用在各行各业，提高我们的生活质量。

薄紫彤于中科院软件所

开发基于WebRTC和OpenAI实时API的AI语音助手框架：技术解析与最佳实践花生糖@ AIGC学习资料库 webrtc 人工智能
随着人工智能（AI）和实时通信技术的发展，构建一个能够提供即时响应、多语言支持以及个性化用户体验的AI语音助手变得越来越重要。本文将深入探讨如何使用现代Web技术和先进的AI工具开发这样一个语音助手框架，具体来说，我们将基于Next.js、WebRTC和OpenAIAPI创建一个高效且用户友好的解决方案。技术架构主框架-Next.js选择Next.js作为主框架不仅因为它提供的服务端渲染（SSR）
国外各领域专家学者的一些谏言：如何使AI代理架构变得成功强哥之神人工智能语言模型 AI代理智能体大模型 Agent
最近在研究AI代理架构为什么比较难落地，看到有一篇文章是关于各领域专家学者对AI代理架构的一些看法，值得关注。我将其整理成了中文，大家可一起细品各家观点，全文如下。代理型人工智能被寄予厚望，其潜力在于能够独立完成复杂任务。然而，目前该领域的炒作热潮远超实际成功案例，背后原因复杂多样。“2024年，AI代理已成为众多供应商的营销热词。但对于用户组织而言，代理技术还处于早期探索阶段，充满好奇心与实验性
【人工智能时代】- 开源向量数据库比较：Chroma, Milvus, Faiss,Weaviate xiaoli8748_软件开发人工智能时代人工智能开源数据库
语义搜索和检索增强生成(RAG)正在彻底改变我们的在线交互方式。实现这些突破性进展的支柱就是向量数据库。选择正确的向量数据库能是一项艰巨的任务。本文为你提供四个重要的开源向量数据库之间的全面比较，希望你能够选择出最符合自己特定需求的数据库。什么是向量数据库?向量数据库是一种将数据存储为高维向量的数据库，高维向量是特征或属性的数学表示。每个向量都有一定数量的维度，根据数据的复杂性和粒度，可以从数十到
NVIDIA L40s、A10、A40、A100、A6000横评，哪个GPU 更适合 AI 推理任务？ DO_Community 技术科普商业建议人工智能 gpu算力 DigitalOcean ai AIGC
近年来，随着人工智能技术的发展，特别是深度学习模型的广泛应用，GPU（图形处理单元）作为加速计算的重要硬件，在AI领域扮演着越来越重要的角色。AI推理是指已经训练好的模型对新数据进行预测的过程。与训练阶段相比，推理通常对GPU的要求有所不同，更注重于能效比、延迟以及并发处理能力。本文将从这些角度出发，对比分析NVIDIA的L40s、A10、A40、A100、A6000五款GPU在AI推理任务中的表
线性回归——最小二乘法代数详细计算过程在天愿作比翼鸟在地愿为连理枝机器学习和人工智能学习概述线性回归最小二乘法机器学习
Reference:动手实战人工智能AIByDoing关于矩阵方法的求解可参考：最小二乘法矩阵详细计算过程基本定义：通过找到一条直线去拟合数据点的分布趋势的过程，就是线性回归的过程。在上图呈现的这个过程中，通过找到一条直线去拟合数据点的分布趋势的过程，就是线性回归的过程。而线性回归中的「线性」代指线性关系，也就是图中所绘制的红色直线。所以，找到最适合的那一条红色直线，就成为了线性回归中需要解决的目
《数据孤岛：AI模型训练之殇，精度与泛化的双重困境》人工智能深度学习
在人工智能飞速发展的当下，数据就是模型的“燃料”。从医疗影像诊断到智能交通调度，从电商推荐系统到金融风险预测，AI模型的精准度与泛化能力，决定了其在实际应用中的价值。然而，一个棘手的问题正阻碍着AI前行的步伐——数据孤岛。数据孤岛，是指在组织内部或不同组织之间，由于系统、管理或流程的原因，数据被孤立存储在不同的数据库、应用程序或部门中，彼此之间缺乏有效的连接和整合。据权威机构调研，在高度信息化的企
自动驾驶系统研发系列—追尾风险不再隐形：解密后碰撞预警系统（RCW）的技术与应用学步_技术自动驾驶系统研发自动驾驶人工智能机器学习 RCW
欢迎来到我的技术小筑，一个专为技术探索者打造的交流空间。在这里，我们不仅分享代码的智慧，还探讨技术的深度与广度。无论您是资深开发者还是技术新手，这里都有一片属于您的天空。让我们在知识的海洋中一起航行，共同成长，探索技术的无限可能。探索专栏：学步_技术的首页——持续学习，不断进步，让学习成为我们共同的习惯，让总结成为我们前进的动力。技术导航：人工智能：深入探讨人工智能领域核心技术。自动驾驶：分享自动
自动驾驶系列—自动驾驶MCU架构全方位解析：从单核到多核的选型指南与应用实例学步_技术自动驾驶自动驾驶单片机架构 MCU
欢迎来到我的技术小筑，一个专为技术探索者打造的交流空间。在这里，我们不仅分享代码的智慧，还探讨技术的深度与广度。无论您是资深开发者还是技术新手，这里都有一片属于您的天空。让我们在知识的海洋中一起航行，共同成长，探索技术的无限可能。探索专栏：学步_技术的首页——持续学习，不断进步，让学习成为我们共同的习惯，让总结成为我们前进的动力。技术导航：人工智能：深入探讨人工智能领域核心技术。自动驾驶：分享自动
你知道吗？其实这些都是AI——智能聊天机器人贫苦游商人工智能机器人机器学习 AIGC 制造
智能聊天机器人AI：优化用户体验的智能助手在现代的数字化生活中，智能聊天机器人已经成为许多中国社交平台上不可或缺的一部分。这些机器人通过人工智能技术的支持，为用户提供各种互动服务，从回答常见问题到提供个性化建议，极大地提升了用户体验和平台的服务质量。智能聊天机器人AI的核心在于其强大的自然语言处理能力。通过分析用户的输入文本，这些系统能够理解用户的意图，并生成相应的回复。例如，当用户在购物平台上询
分享当下最热门的AI工具合集香橙薄荷心人工智能人工智能
1、ChatGPTChatGPT一个基于人工智能技术的虚拟助手，旨在为用户提供信息、解答问题和协助完成各种任务。我能够处理多种主题，包括但不限于科学、技术、文化、历史等领域。我的目标是为您提供准确、及时的帮助，以提升您的工作和生活效率这个，可免费使用GPT-3.5和GPT-4.0模型~推荐指数：⭐⭐⭐⭐⭐链接：点击直达>>>2、ChatGAIChatGAI是一个基于人工智能技术的语言模型，旨在理解
探秘Xss：原理、类型与防范全解析咕德猫宁丶网络 xss java
一、Xss究竟是什么？（一）Xss的定义简述Xss全称是跨站脚本攻击（CrossSiteScripting），为了不和层叠样式表（CascadingStyleSheets，CSS）的缩写混淆，故将其缩写为Xss。它是一种常见的网络安全漏洞，指的是攻击者利用网站对用户输入内容校验不严格等漏洞，将恶意脚本（通常是JavaScript，也可以是Java、VBScript、ActiveX、Flash等）注
「QT」经验篇之界面代码与逻辑代码的分离思想何曾参静谧「QT」QT5程序设计 qt 系统架构数据库
✨博客主页何曾参静谧的博客（✅关注、点赞、⭐收藏、转发）全部专栏（专栏会有变化，以最新发布为准）「Win」Windows程序设计「IDE」集成开发环境「定制」定制开发集合「C/C++」C/C++程序设计「DSA」数据结构与算法「UG/NX」NX二次开发「QT」QT5程序设计「File」数据文件格式「UG/NX」BlockUI集合「Py」Python程序设计「Math」探秘数学世界「PK」Paras
「Py」进阶语法篇之 Python中的异常捕获与处理何曾参静谧「Py」Python程序设计 python 数据库开发语言
✨博客主页何曾参静谧的博客（✅关注、点赞、⭐收藏、转发）全部专栏（专栏会有变化，以最新发布为准）「Win」Windows程序设计「IDE」集成开发环境「UG/NX」BlockUI集合「C/C++」C/C++程序设计「DSA」数据结构与算法「UG/NX」NX二次开发「QT」QT5程序设计「File」数据文件格式「UG/NX」NX定制开发「Py」Python程序设计「Math」探秘数学世界「PK」Pa
信息学/计算机系各种网站（学习资源、常用工具及其他）一只贴代码君命令大全-干货合集学习 dubbo java 开发语言算法 c++
大学指南上海交通大学生存手册中国科学技术大学人工智能与数据科学学院本科进阶指南USTC不完全入学指南大学生活质量指北科研论信息搜集AI信息搜集USTC飞跃网站计算机保研技术新闻HackerNewsTheHackerNewsTechCrunchArsTechnicaMITNews技术博客日更技术雷达学习资源CS清华计算机系学生科协技能引导文档菜鸟教程北大CS自学指南OpenSourceSociety
2024年人工智能领域发生了哪些事儿？全球AI大事件1至12月盘点人工智能aigc
2024年，对人工智能（AI）而言是激动人心的一年。这一年不仅见证了AI技术的全面突破，也深刻改变了社会生活的方方面面。从金融到医疗、从教育到娱乐，AI的深度渗透无处不在。显然，这项技术已经从概念走向普及，并开始重新定义我们的未来。一月：人机交互技术的崭新开端2024年1月30日：Neuralink脑机接口植入Neuralink宣布，首名人类成功接受脑机接口芯片植入手术。这项手术由机器人完成，芯片
第84期 | GPTSecurity周报 aigc
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大语言模型（LLM）等安全领域应用的知识。在这里，您可以找到关于GPT/AIGC/LLM最新的研究论文、博客文章、实用的工具和预设指令（Prompts）。现为了更好地知悉近一周的贡献内容，现总结如下。SecurityPapers1.利用数据流路径对大
未来商贸物流：人工智能与大数据的深度融合呆码科技临沂软件开发软件开发商贸物流科技人工智能
未来商贸物流：人工智能与大数据的深度融合在当今数字化浪潮汹涌澎湃的时代，商贸物流行业正站在变革的十字路口，而人工智能与大数据宛如一对闪耀的双子星，为其照亮前行的道路，深度融合之下，一个全新的未来画卷正徐徐展开。智能预测需求：精准把握市场脉搏传统的商贸物流往往依赖过往经验和粗略的市场调研来预估货物需求，这就如同在迷雾中摸索，充满不确定性。而如今，借助大数据的海量存储与超强分析能力，以及人工智能的深度
从文字到思维：呆马GPT在人工智能领域的创新之旅呆码科技 gpt 人工智能
引言生成式预训练变换器（GenerativePre-trainedTransformer，简称GPT）领域是人工智能技术中的一大革新。自OpenAI推出第一代GPT以来，该技术经历了多代发展，不断提升模型的规模、复杂度和智能化程度。GPT模型通过在大规模数据集上进行预训练，学习语言的统计规律和世界知识，然后在特定任务上进行微调，以适应不同的应用需求。GPT领域的发展推动了自然语言处理（NLP）技术
小米Vela操作系统开源：AIoT时代的全新引擎 lilu8888888 开源前端
小米近日正式开源了其物联网嵌入式软件平台——Vela操作系统，并将其命名为OpenVela。这一举动在AIoT（人工智能物联网）领域掀起了不小的波澜，也为开发者们提供了一个强大的AI代码生成器和开发平台。OpenVela项目源代码已托管至GitHub和Gitee，采用Apache2.0开源协议，这意味着全球开发者都可以参与其中，共同推动物联网技术的进步。……Vela操作系统基于开源实时操作系统Nu
智源社区AI周刊：Hinton预测破解大脑机制时间；Gary Marcus批判追捧深度学习风潮；谷歌发布Imagen... 智源社区机器学习人工智能深度学习编程语言大数据
汇聚每周必看AI观点、研究和各类资源，不错过一条重要资讯！欢迎扫码订阅，获取邮件推送。观点“我们会在未来的五年内破解这些（人脑的）程序......现有的一切人工智能，都是建立在与大脑高层次上所做的事情完全不同的基础上......假设有数十亿的参数，这些神经元间的权重在大量训练实例的基础上去调整，会发生奇妙的事情。大脑是如此，深度学习也是如此。但问题在于，如何获得调整参数的梯度......目前我的信
深度探索 DeepSeek-R1：国产大模型的AGI雏形与创新进展微凉的衣柜科技头条 agi 人工智能
随着人工智能技术的飞速发展，国内外企业纷纷发布了一系列创新的大模型，推动了AGI（通用人工智能）领域的探索。近期，DeepSeek-R1这一模型的发布引起了广泛关注，它不仅标志着国产大模型在智能化上的一次重大突破，还提出了全新的训练方法，解决了过去依赖大量人类数据的问题。本篇文章将详细介绍DeepSeek-R1的核心优势、技术创新以及实际应用案例，揭示它在AGI领域的潜力。1.DeepSeek-R
AI界的拼多多-中国人工智能初创公司DeepSeek如何与硅谷巨头竞争 xidianjiapei001 AI-人工智能与大模型人工智能 AI DeepSeek 大模型
这家公司打造出了一款成本更低且颇具竞争力的聊天机器人，其使用的高端计算机芯片数量少于谷歌和OpenAI等美国巨头企业，这凸显出芯片出口管制的局限性。圣诞节次日，一家名为DeepSeek的中国小型初创公司推出了一款新的人工智能系统，其性能可与OpenAI和谷歌等公司的尖端聊天机器人相媲美。仅此一点就堪称一个里程碑。但这个名为DeepSeek-V3系统的研发团队称，他们迈出了更大的一步。在一篇解释该技
学习AI职场应用技能的意义 Mieux718 学习人工智能
在智能化浪潮下，“人工智能+”通识必修课的普及，其核心并非在于培养人工智能领域的专家，而是旨在构建全民AI素养的基石。学习AI是可以让学生借助其技术力量，为各自的专业领域插上创新的翅膀。除了高校外，越来越多的企业也开始关注AI对企业业务的帮助，职场中掌握AI也变得越来越重要。随着人工智能技术的发展，许多行业都在引入相关技术和应用，人工智能应用场景已深度融入办公流程、项目管理、项目运营、客户服务等工
想转行到人工智能领域，我该学什么，怎么学？张登杰踩人工智能 python
转行到人工智能（AI）领域需要系统的学习和实践，以下是详细的路径建议，涵盖基础知识、技能学习、项目实践和求职准备：一、明确目标和领域方向人工智能领域广泛，建议先了解细分方向（如机器学习、深度学习、计算机视觉、自然语言处理、强化学习等），结合兴趣和职业规划选择切入点。二、构建基础知识1.数学基础线性代数：矩阵运算、特征值、向量空间。微积分：导数、梯度、优化理论。概率与统计：贝叶斯定理、分布、假设检验
2024人工智能AI+制造业应用落地研究报告汇总PDF洞察（附原数据表）拓端研究室人工智能
原文链接：https://tecdat.cn/?p=39068本报告合集洞察深入剖析当前技术应用的现状，关键技术创新方向，以及行业应用的具体情况，通过制造业具体场景的典型案例揭示人工智能如何助力制造业研发设计、生产制造、运营管理和产品服务的全流程智能化升级。在此基础上对制造业人工智能的未来发展趋势进行展望，以期为相关政策制定者以及行业从业者提供决策支持，共同助力我国制造业在人工智能时代的转型升级和
Open AI GPT大模型深度解析：通往智能的里程碑 xziyuan 人工智能 gpt
大模型——OpenAIGPT大模型介绍人工智能技术的快速发展引发了对智能系统和应用的巨大需求。多模态大模型已经成为了人工智能领域的重要研究方向之一。OpenAI作为一家全球领先的人工智能公司，在推动人工智能技术的边界上发挥着重要作用，其在大模型方面的研究和应用也是一直处于领先地位。本文将介绍OpenAI多模态大模型的研究成果和应用，探讨其在人工智能领域的重要性和影响力，以及给世界带来的可能性。1.
AI Agent：一场智能革命的开始机器人openai区块链
在当今科技日新月异的时代，AI（人工智能）技术正以前所未有的速度改变着我们的生活和工作方式。其中，AIAgent作为AI领域的一个新兴分支，正逐渐展现出其巨大的潜力和价值。本文将深入探讨AIAgent的发展现状、核心优势以及未来的发展方向，带您领略这一前沿技术的无限魅力。一、AIAgent的发展现状：技术突破与广泛应用近年来，随着大数据、云计算和机器学习等技术的飞速发展，AIAgent的技术水平得
python面试情景题_50道python笔试面试真题大集合我是史迪仔 python面试情景题
Python爬虫人工智能100GBweb爬虫数据分析人工智能视频免费领题目后面有50道题答案领取方式哦1、一行代码实现1--100之和利用sum()函数求和2、如何在一个函数内部修改全局变量利用global修改全局变量3、列出5个python标准库os：提供了不少与操作系统相关联的函数sys:通常用于命令行参数re:正则匹配math:数学运算datetime:处理日期时间4、字典如何删除键和合并两
AI人工智能代理工作流 AI Agent WorkFlow：在金融领域中的应用 AI天才研究院大数据AI人工智能 AI大模型企业级应用开发实战 AI大模型应用入门实战与进阶计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
AI人工智能代理工作流AIAgentWorkFlow：在金融领域中的应用作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming关键词：AIAgentWorkFlow,金融风险管理,自动化投资决策,数据驱动策略生成,量化交易系统1.背景介绍1.1问题的由来随着金融市场全球化和技术的飞速发展，金融机构面临着日益复杂的业务挑战。从风险管理和投资决策到客户关系管理
快手可灵视频生成大模型全方位测评人工智能llm
快手视频生成大模型“可灵”（Kling），是全球首个真正用户可用的视频生成大模型，自面世以来，凭借其无与伦比的视频生成效果，在全球范围内赢得了用户的热烈追捧与高度评价。截至目前，申请体验其内测版的用户数量已突破70万大关，累计生成的视频作品更是高达700万。可灵在持续创新的道路上也从未停下脚步，在七月份举办的世界人工智能大会（WAIC）期间，可灵再次迎来重大升级。新功能包括上线web端、基础模型效
log4j对象改变日志级别 3213213333332132 java log4j level log4j对象名称日志级别
log4j对象改变日志级别可批量的改变所有级别，或是根据条件改变日志级别。 log4j配置文件： log4j.rootLogger=ERROR,FILE,CONSOLE,EXECPTION #log4j.appender.FILE=org.apache.log4j.RollingFileAppender log4j.appender.FILE=org.apache.l
elk+redis 搭建nginx日志分析平台 ronin47 elasticsearch kibana logstash
elk+redis 搭建nginx日志分析平台 logstash,elasticsearch,kibana 怎么进行nginx的日志分析呢？首先，架构方面，nginx是有日志文件的，它的每个请求的状态等都有日志文件进行记录。其次，需要有个队列，redis的l
Yii2设置时区 dcj3sjt126com PHP timezone yii2
时区这东西，在开发的时候，你说重要吧，也还好，毕竟没它也能正常运行，你说不重要吧，那就纠结了。特别是linux系统，都TMD差上几小时，你能不痛苦吗？win还好一点。有一些常规方法，是大家目前都在采用的1、php.ini中的设置，这个就不谈了，2、程序中公用文件里设置，date_default_timezone_set一下时区3、或者。。。自己写时间处理函数，在遇到时间的时候，用这个函数处理（比较
js实现前台动态添加文本框，后台获取文本框内容 171815164 文本框
<%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://w
持续集成工具 g21121 持续集成
持续集成是什么？我们为什么需要持续集成？持续集成带来的好处是什么？什么样的项目需要持续集成？... 持续集成(Continuous integration ,简称CI)，所谓集成可以理解为将互相依赖的工程或模块合并成一个能单独运行
数据结构哈希表(hash)总结永夜-极光数据结构
1.什么是hash 来源于百度百科: Hash，一般翻译做“散列”，也有直接音译为“哈希”的，就是把任意长度的输入，通过散列算法，变换成固定长度的输出，该输出就是散列值。这种转换是一种压缩映射，也就是，散列值的空间通常远小于输入的空间，不同的输入可能会散列成相同的输出，所以不可能从散列值来唯一的确定输入值。简单的说就是一种将任意长度的消息压缩到某一固定长度的消息摘要的函数。
乱七八糟程序员是怎么炼成的
eclipse中的jvm字节码查看插件地址： http://andrei.gmxhome.de/eclipse/ 安装该地址的outline 插件后重启，打开window下的view下的bytecode视图 http://andrei.gmxhome.de/eclipse/ jvm博客： http://yunshen0909.iteye.com/blog/2
职场人伤害了“上司” 怎样弥补 aijuans 职场
由于工作中的失误，或者平时不注意自己的言行“伤害”、“得罪”了自己的上司，怎么办呢？　　在职业生涯中这种问题尽量不要发生。下面提供了一些解决问题的建议：　　一、利用一些轻松的场合表示对他的尊重　　即使是开明的上司也很注重自己的权威，都希望得到下属的尊重，所以当你与上司冲突后，最好让不愉快成为过去，你不妨在一些轻松的场合，比如会餐、联谊活动等，向上司问个好，敬下酒，表示你对对方的尊重，
深入浅出url编码 antonyup_2006 应用服务器浏览器 servlet weblogic IE
出处：http://blog.csdn.net/yzhz 杨争 http://blog.csdn.net/yzhz/archive/2007/07/03/1676796.aspx 一、问题：编码问题是JAVA初学者在web开发过程中经常会遇到问题，网上也有大量相关的
建表后创建表的约束关系和增加表的字段百合不是茶标的约束关系增加表的字段
下面所有的操作都是在表建立后操作的,主要目的就是熟悉sql的约束,约束语句的万能公式 1,增加字段(student表中增加姓名字段) alter table 增加字段的表名 add 增加的字段名增加字段的数据类型 alter table student add name varchar2(10); &nb
Uploadify 3.2 参数属性、事件、方法函数详解 bijian1013 JavaScript uploadify
一.属性属性名称默认值说明 auto true 设置为true当选择文件后就直接上传了，为false需要点击上传按钮才上传。 buttonClass ” 按钮样式 buttonCursor ‘hand’ 鼠标指针悬停在按钮上的样子 buttonImage null 浏览按钮的图片的路
精通Oracle10编程SQL(16)使用LOB对象 bijian1013 oracle 数据库 plsql
/* *使用LOB对象 */ --LOB(Large Object)是专门用于处理大对象的一种数据类型，其所存放的数据长度可以达到4G字节 --CLOB/NCLOB用于存储大批量字符数据，BLOB用于存储大批量二进制数据，而BFILE则存储着指向OS文件的指针 /* *综合实例 */ --建立表空间 --#指定区尺寸为128k,如不指定，区尺寸默认为64k CR
【Resin一】Resin服务器部署web应用 bit1129 resin
工作中，在Resin服务器上部署web应用，通常有如下三种方式：配置多个web-app 配置多个http id 为每个应用配置一个propeties、xml以及sh脚本文件配置多个web-app 在resin.xml中,可以为一个host配置多个web-app <cluster id="app&q
red5简介及基础知识白糖_ 基础
简介 Red5的主要功能和Macromedia公司的FMS类似，提供基于Flash的流媒体服务的一款基于Java的开源流媒体服务器。它由Java语言编写，使用RTMP作为流媒体传输协议，这与FMS完全兼容。它具有流化FLV、MP3文件，实时录制客户端流为FLV文件，共享对象，实时视频播放、Remoting等功能。用Red5替换FMS后,客户端不用更改可正
angular.fromJson boyitech AngularJS AngularJS 官方API AngularJS API
angular.fromJson 描述: 把Json字符串转为对象使用方法: angular.fromJson(json); 参数详解: Param Type Details json string JSON 字符串返回值: 对象, 数组, 字符串或者是一个数字示例: <!DOCTYPE HTML> <h
java-颠倒一个句子中的词的顺序。比如： I am a student颠倒后变成：student a am I bylijinnan java
public class ReverseWords { /** * 题目：颠倒一个句子中的词的顺序。比如： I am a student颠倒后变成：student a am I.词以空格分隔。 * 要求： * 1.实现速度最快,移动最少 * 2.不能使用String的方法如split,indexOf等等。 * 解答：两次翻转。 */ publ
web实时通讯 Chen.H Web 浏览器 socket 脚本
关于web实时通讯，做一些监控软件。由web服务器组件从消息服务器订阅实时数据，并建立消息服务器到所述web服务器之间的连接，web浏览器利用从所述web服务器下载到web页面的客户端代理与web服务器组件之间的socket连接，建立web浏览器与web服务器之间的持久连接；利用所述客户端代理与web浏览器页面之间的信息交互实现页面本地更新，建立一条从消息服务器到web浏览器页面之间的消息通路
[基因与生物]远古生物的基因可以嫁接到现代生物基因组中吗? comsci 生物
大家仅仅把我说的事情当作一个IT行业的笑话来听吧..没有其它更多的意思如果我们把大自然看成是一位伟大的程序员,专门为地球上的生态系统编制基因代码,并创造出各种不同的生物来,那么6500万年前的程序员开发的代码,是否兼容现代派的程序员的代码和架构呢?
oracle 外部表 daizj oracle 外部表 external tables
oracle外部表是只允许只读访问，不能进行DML操作，不能创建索引，可以对外部表进行的查询，连接，排序，创建视图和创建同义词操作。 you can select, join, or sort external table data. You can also create views and synonyms for external tables. Ho
aop相关的概念及配置 daysinsun AOP
切面(Aspect): 通常在目标方法执行前后需要执行的方法（如事务、日志、权限），这些方法我们封装到一个类里面，这个类就叫切面。连接点（joinpoint） spring里面的连接点指需要切入的方法，通常这个joinpoint可以作为一个参数传入到切面的方法里面（非常有用的一个东西）。通知（Advice）通知就是切面里面方法的具体实现，分为前置、后置、最终、异常环
初一上学期难记忆单词背诵第二课 dcj3sjt126com english word
middle 中间的，中级的 well 喔，那么；好吧 phone 电话，电话机 policeman 警察 ask 问 take 拿到；带到 address 地址 glad 高兴的，乐意的 why 为什么 China 中国 family 家庭 grandmother (外)祖母 grandfather (外)祖父 wife 妻子 husband 丈夫 da
Linux日志分析常用命令 dcj3sjt126com linux log
1.查看文件内容 cat -n 显示行号 2.分页显示 more Enter 显示下一行空格显示下一页 F 显示下一屏 B 显示上一屏 less /get 查询"get"字符串并高亮显示 3.显示文件尾 tail -f 不退出持续显示 -n 显示文件最后n行 4.显示头文件 head -n 显示文件开始n行 5.内容排序 sort -n 按照
JSONP 原理分析 fantasy2005 JavaScript jsonp jsonp 跨域
转自 http://www.nowamagic.net/librarys/veda/detail/224 JavaScript是一种在Web开发中经常使用的前端动态脚本技术。在JavaScript中，有一个很重要的安全性限制，被称为“Same-Origin Policy”（同源策略）。这一策略对于JavaScript代码能够访问的页面内容做了很重要的限制，即JavaScript只能访问与包含它的
使用connect by进行级联查询 234390216 oracle 查询父子 Connect by 级联
使用connect by进行级联查询 connect by可以用于级联查询，常用于对具有树状结构的记录查询某一节点的所有子孙节点或所有祖辈节点。来看一个示例，现假设我们拥有一个菜单表t_menu，其中只有三个字段：
一个不错的能将HTML表格导出为excel,pdf等的jquery插件 jackyrong jquery插件
发现一个老外写的不错的jquery插件，可以实现将HTML 表格导出为excel,pdf等格式，地址在： https://github.com/kayalshri/ 下面看个例子，实现导出表格到excel,pdf <html> <head> <title>Export html table to excel an
UI设计中我们为什么需要设计动效 lampcy UI UI设计
关于Unity3D中的Shader的知识首先先解释下Unity3D的Shader，Unity里面的Shaders是使用一种叫ShaderLab的语言编写的，它同微软的FX文件或者NVIDIA的CgFX有些类似。传统意义上的vertex shader和pixel shader还是使用标准的Cg/HLSL 编程语言编写的。因此Unity文档里面的Shader，都是指用ShaderLab编写的代码，
如何禁止页面缓存 nannan408 html jsp cache
禁止页面使用缓存~ ------------------------------------------------ jsp:页面no cache： response.setHeader("Pragma","No-cache"); response.setHeader("Cache-Control","no-cach
以代码的方式管理quartz定时任务的暂停、重启、删除、添加等 Everyday都不同定时任务管理 spring-quartz
【前言】在项目的管理功能中，对定时任务的管理有时会很常见。因为我们不能指望只在配置文件中配置好定时任务就行了，因为如果要控制定时任务的 “暂停” 呢？暂停之后又要在某个时间点 “重启” 该定时任务呢？或者说直接 “删除” 该定时任务呢？要改变某定时任务的触发时间呢？ “添加” 一个定时任务对于系统的使用者而言，是不太现实的，因为一个定时任务的处理逻辑他是不
EXT实例 tntxia ext
（1）增加一个按钮 JSP: <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <% String path = request.getContextPath(); Stri
数学学习在计算机研究领域的作用和重要性 xjnine Math
最近一直有师弟师妹和朋友问我数学和研究的关系，研一要去学什么数学课。毕竟在清华，衡量一个研究生最重要的指标之一就是paper,而没有数学，是肯定上不了世界顶级的期刊和会议的，这在计算机学界尤其重要！你会发现，不论哪个领域有价值的东西，都一定离不开数学！在这样一个信息时代，当google已经让世界没有秘密的时候，一种卓越的数学思维，绝对可以成为你的核心竞争力. 无奈本人实在见地

探秘AlphaStar:星际争霸人工智能

AlphaStar比赛分析

星际争霸AI背景

技术解读

未来展望

你可能感兴趣的:(探秘AlphaStar:星际争霸人工智能)