昇思MindSpore

一文了解AI编译器的前世今生（赠书）

随着人工智能时代的来临，AI领域应用的大量出现也促进着领域编译的发展，最突出的表现就是多种AI编译器的普及和应用。本期将结合AI编译器的发展概述及昇思MindSpore的实践梳理出相对完整的AI编译器全视图，希望对大家有所启发。

文章主要分为四个部分：

1、AI编译器的概览

2、AI编译器的挑战

3、昇思MindSpore的实践

4、未来的展望及赠书活动

AI编译器的概览

AI编译器的定义

首先介绍一下，个人对AI编译器的一个理解：

与传统编译器相比，AI编译器是一个领域特定的编译器，有四个明显的特征：

1）Python为主的动态解释器语言前端

与传统编译器不同，AI编译器通常不需要Lexer/Parser，而是基于前端语言（主要是Python）的AST将模型解析并构造为计算图IR，侧重于保留shape、layout等Tensor计算特征信息，当然部分编译器还能保留控制流的信息。

这里的难点在于，Python是一种灵活度极高的解释执行的语言，AI编译器需要把它转到静态的IR上。

2）多层IR设计：

为什么需要多层IR设计，主要是为了同时满足易用性与高性能这两类需求。为了让开发者使用方便，框架前端(图层)会尽量对Tensor计算进行抽象封装，开发者只要关注逻辑意义上的模型和算子；而在后端算子性能优化时，又可以打破算子的边界，从更细粒度的循环调度等维度，结合不同的硬件特点完成优化。因此，多层IR设计无疑是较好的选择。

1、图编译器：如昇思MindSpore的MindCompiler（MindIR）、TF的XLA（HLO），TVM的Relay等，重点关注非循环相关的优化。除了传统编译器中常见的常量折叠、代数化简、公共子表达式等优化外，还会完成Layout转换，算子融合等优化，通过分析和优化现有网络计算图逻辑，对原有计算逻辑进行拆分、重组、融合等操作，以减少算子执行间隙的开销并且提升设备计算资源利用率，从而实现网络整体执行时间的优化。

2、算子编译器：如MindSpore AKG、CANN TBE、TVM(HalideIR)等。针对Low-level IR主要有循环变换、循环切分等调度相关的优化，与硬件intrinsic映射、内存分配等后端pass优化。其中，当前的自动调度优化主要包含了基于搜索的自动调度优化（如ansor[8]）和基于polyhedral编译技术的自动调度优化（如TC和MindAKG[9]）

3、Codegen：当前基本上收敛在LLVM上。最后还有一个是MLIR，它实际上是一种编译的基础设施。

3）面向神经网络的特定优化

1、数据类型-Tensor：AI领域，计算被抽象成张量的计算，这就意味着AI编译器中主要处理的数据类型也是张量，这个是非常重要的前提。

2、自动微分：BP是深度学习/神经网络最有代表的部分，目前相对已经比较成熟，基于计算图的自动微分、基于Tape和运算符重载的自动微分方案、基于source2source的自动微分都是现在主流的方案。

3、自动并行：随着深度学习的模型规模越来越大，模型的并行优化也成为编译优化的一部分，包括：数据并行、算子级模型并行、Pipeline模型并行、优化器模型并行和重计算等。

4）DSA芯片架构的支持

SIMT、SIMD、Dataflow：AI的训练和推理对性能和时延都非常敏感，所以大量使用加速器进行计算，所以AI编译器其实是以加速器为中心的编译器，这个也是区别于通用编译器的一个特征。

AI编译器的发展历程

我个人把它分为三个阶段：

第1阶段-朴素的AI编译器：

AI框架的早期主要是两个抽象，一个是基于张量的计算图，分为图和算子；另外一个动态图和静态图。动态图基本上和AI编译器没有太多关联，静态图采用了部分编译器的思想，比如图优化的时候会使用一些硬件无关的优化（表达式化简/常量折叠等）、硬件相关的优化（手工的算子融合）。

问题：

1、表达上：静态图的表达式非Python原生的，开发者主要通过框架提供的API进行显示构图，易用性上不好；

2、性能上：开发者定义的算子粒度未必最能发挥硬件的性能；硬件厂商的提供的缺省的算子库也未必是最优的，在模型和shape确定的情况下，可能还有更有的算子实现；DSA芯片出现加剧了性能上的挑战。

第2阶段-专用的AI编译器：

主要的两个特征：

1、表达上，动态图和静态图趋于一致，意味着AI编译的入口更加与Python原生的表达接近；

2、出现相对独立的AI编译器，聚焦在打开图和算子边界进行融合优化，发挥芯片的算力。

问题：

1、表达上，图层和算子层的表达还是分开的，算法工程师主要关注图层的表达，算子的表达和实现主要是框架开发者和芯片开发者来提供。

2、功能泛化的问题：动静转换的成功率、动态shape、稀疏、分布式并行优化等更多的需求无法满足

3、效率和性能的平衡：算子实现上在schedule、tiling、codegen上缺乏自动化手段，门槛高。

第3阶段-通用的AI编译器：

主要的特征：

1、图算统一表达；

2、更泛化的优化能力：动静统一、动态shape、稀疏、复数、自动并行等；

3、图算融合优化、算子自动生成。

总的来说，个人感觉当前的阶段还是处于2.0~2.3阶段，大家想尽快构建通用AI编译器的能力，但是还有许多关键的问题还没有完全解决。

AI编译器发展的驱动力和挑战

个人认为，AI编译器发展的驱动力和挑战主要还是三个：

1、Python的静态化

2、怎么发挥硬件的性能，特别是DSA类的芯片

3、如何处理NN的特定优化：自动微分、自动并行等等

挑战1：Python的静态化

Python静态化是指通过JIT等技术，让Python程序进行静态的编译优化，提升性能、方便部署，Python静态化是AI编译器开始工作的一个起点。

业界Python静态化的两种方式：

1、通用Python JIT虚拟机：主要是期望在Python解释执行的基础上增加JIT编译加速的能力，典型的如PyPy；不过由于前期CPython暴露了太多内部接口，导致Python JIT虚拟机兼容的困难。

2、修饰符方式的Python编译加速方案：典型的如Numba，Python JIT虚拟机的一种妥协实现方式，通过修饰符，进行部分Python语句加速。

AI框架静态化的方案普遍采用修饰符这套方案，这套方案细分下来也有三种不同的方法：

1、Tracing Based

2、ByteCode Based

3、AST Based

其中tracing和bytecode的方式接近于JIT的方式，而AST Based方式接近于AOT的方式。

AI编译器在Python静态化方面的挑战：

1、类型推导：从Python动态类型到编译器IR的静态类型

2、灵活的语法和数据类型转换：slice、dict等

3、控制流的处理

4、JIT的编译性能

5、.....

挑战2：AI编译器如何使能多样性算力，特别是如何充分发挥DSA芯片的算力

前面提到AI的训练和推理都是对性能非常敏感的，所以在AI的场景中大量用到加速器，包括CPU的SIMD单元、GPU的SIMT架构、NPU这样的专用架构等；AI编译器逐步成为发挥这些多样性算力的关键，特别是近期Dataflow+SIMD这样的DSA芯片占比逐步提升的情况下：

统计数据表明，最近出现的AI芯片中，Dataflow架构占比大于50%，这类架构的特点：

1、数据流图的执行调度更加能发挥芯片的性能，即芯片进行整图或者子图的调度，而不是像GPU那样，主流是 kernel by kernel的调度

2、较强大的Cube处理单元（类SIMD），较为复杂的内存管理机制

同时我们也看到最新NV GPU的H100架构的DSA特征也逐步明显。

AI编译器在性能优化的难度和复杂度挑战变大：

1、性能优化更加依赖图算融合优化，图层和算子层独立优化无法充分发挥芯片性能，需要图算融合优化；子图切分、子图内垂直融合优化和水平并行优化；

2、优化的复杂度提升，标量+向量+张量+加速指令、多级的存储结构，导致Schedule、Tilling、Vectorization/Tensorization复杂。

当前的AI编译器在这一块还没有一个完善的方案：

首先我们看一下AI编译器的普遍需求：

1、打开图和算子的边界，进行重新组合优化

2、多种优化手段：垂直融合优化（buffer fusion等）和水平并行（msa rammer等）优化

3、重新组合优化后的子图的代码自动生成（scheduling、tilling、vectorizing）

其次，我们看一下业界已有的方案：

1、XLA：基本上的思路是把图层下发的子图中的算子全部打开成小算子，然后基于这张小算子组成的子图进行编译优化，整体设计主要通过HLO/LLO/LLVM层层lowering实现，算子打开/子图融合优化/融合算子生成的规则都是手工提前指定。

2、TVM：分为Relay和TVM两层，Relay关注图层，TVM关注算子层，总体思路与XLA是类似的，Relay做子图的优化、TVM实现融合算子的生成，区别在于TVM是开放的架构，提供了compute和schedule分离的方案，方便定制算子生成的优化。

另外，不得不提MLIR，不过他的定位还是聚焦提供MetaIR，作为构建AI编译器的基础，如果从功能完善性的角度看，目前看还有比较大的差距。

最后总结是：AI编译器目前还没有一个完善的解决方案，仍在持续演进

挑战3：面向NN领域的特定优化—自动并行+自动微分

个人认为自动并行和自动微分这两个最为关键

自动并行依然是大模型训练的一个难题：

当前大模型训练碰到碰到的内存墙、性能墙依赖复杂的切分策略来解决，包括：

1、Scale out：多维混合并行能力，含：数据并行、算子级模型并行、流水线并行、优化器并行等

2、Scale up：重计算、Host/Devcie并行等

这种方式最大的挑战就是效率墙：如果依赖手工去配置切分策略，对算法工程师来说，门槛高，效率低；当前类似半自动并行的方式可以解决一部分效率的问题，但是真正要解放工程师还是依赖编译+寻优结合，自动化的找到并行策略。

面向未来AI+科学计算场景，自动微分的要求更高，是另外一个挑战

这里有两个大的难题：

控制流：传统的自动微分都是通过控制流展开方式来解决问题，动态图通过正向在Python侧执行进行控制流展开，一旦循环次数多的话，性能劣化；静态图的控制流自动微分目前还没有太完善的方案。

高级微分的性能：前向微分+后向微分；Jacobian matrix(雅克比)；高阶微分：Hessian matrix（海森矩阵）

昇思MindSpore的创新和实践

昇思MindSpore的AI编译器全景图

昇思MindSpore的AI编译器总共有五个特点：

1、完整的AI编译器解决方案

2、完善的Python静态化方案

3、为AI领域优化的编译器IR-MindSpore IR（函数式图形IR）

4、充分发挥硬件算力的图算融合+算子自动生成方案

5、针对大规模并行的完整编译优化方案

下面基于这几个特点，展开进行描述。

特点1：完整的AI编译器解决方案

完整主要体现在两个维度：

1、纵向提供图编译器（前端/中端/后端）以及算子编译器：

2、横向提供端云统一的编译架构：统一的IR(MindIR)、公共Pass共享

特点2：完善的Python静态化方案

前面提到AI编译器的起点就是把Python表达的AI网络和模型转化为编译器IR，但是这本身是一个非常有挑战性的工作，原因在于：

1、Python是动态类型，无法通过AST解析直接确定类型

2、Python的语法非常灵活，全量转换工作量大

当前Python静态化的主流方案有三种，如前面介绍的，Tracing based、Bytecode Based、AST Based（https://zhuanlan.zhihu.com/p/393031067）

个人判断，Tracing Based和Bytecode Based这两种JIT的方式最终会统一到Bytecode Based；而AST Based作为AOT的解决方案会与JIT一起共存。

昇思MindSpore的静态化方案当前主要采用了AST Based的AOT方式，未来也规划支持Bytecode Based的JIT方式。

昇思MindSpore静态化方案主要有三个关键点：

第1步—语法解析：从AST翻译到MindIR

昇思MindSpore定义了一套相对完整的语法解析规则来进行AST到MindIR的转换：

第2步—基于抽象释义的静态分析：完成类型推导和特化

完成了AST到MindIR的转换后，下一步的难点就是如何从Python这种解释性语言中推导出静态类型，并进行常量传播和特化，昇思MindSpore的做法比较类似Julia的JIT方式，从顶层函数图入口开始解释执行，将函数图中所有节点进行拓扑排序，根据节点的语义递归推导各节点的抽象值。当遇到函数子图时，递归进入函数子图进行解释执行，最后返回顶层函数输出节点的抽象值。

第3步—JIT Fallback：难以解析的Python语法返回Python解释器去处理

Python是解释性语言，语法比较灵活，想全量从Python转到静态IR上工作量大，难度非常高，有许多语法很难通过AST转换进行全量转换，JIT Fallback机制允许编译期遇到原生不支持语法时，通过Fallback到Python解释器去支持此语法。

（https://zhuanlan.zhihu.com/p/416643687）

特点3：为AI领域优化的编译器IR-MindSpore IR（函数式图形IR）

业界编译器的IR按照不同的分类方法，有多种类型

分类方法1-按照组织结构：

1、线性IR：三地址代码

2、图IR：V8/JVM，常用于虚拟机

3、混合IR:LLVM

分类方法2-按照编程语言的角度：

1、命令式风格：SSA

2、函数式风格：CPS/ANF

AI领域IR有其特殊的需求，包括：

1、自动微分：能够处理控制流、递归、高阶微分等复杂

2、场景隐式并行：程序能根据数据流依赖自动分析可以并行部分

3、JIT能力：编译时间要短

昇思MindSpore的解决方案-MindSpore IR(函数式图形IR)：

Functional(函数式)-更自然的自动微分实现方式和更方便的隐式并行分析能力：

1、函数作为一等公民，支持高阶函数，控制流也是特殊的函数，以统一的形式来实现微分，容易处理控制流、递归、高阶微分等复杂场景。

2、函数以无副作用的方式实现，与命令式语言相比，可基于数据依赖的偏序分析，方便的分析出程序的可并行部分，实现隐式并行的能力。

Graph based(图形IR)-更适合JIT的快速优化能力：

采用类似Sea of Nodes IR的只有一层的表示方式，控制流和数据流合一，直接表达used-def，适合JIT优化。

详细的AI框架的IR的介绍以及MindSpore IR的设计，可参见（https://zhuanlan.zhihu.com/p/263420069）

特点4：充分发挥硬件算力的图算融合+算子自动生成方案

AI芯片对AI编译器来说，主要带来两大挑战，性能和开发效率：

AI芯片的发展对AI框架的关键性能挑战：

1、由于并行度及工艺的快速提升，AI芯片计算能力相比带宽能力提升更快。需要软件通过平衡带宽的能力不足（Buffer融合 – 减少带宽）；

2、随着芯片并行度的增加，如何增加融合算子计算并行度，以提升芯片资源利用率。也成为一个重要的性能优化方向（并行融合 – 提高并行度）。

AI模型的规模和复杂度发展对算子融合的挑战：

1、由于复杂度和规模增加，完全依赖手工算子融合并实现融合算子变得不再可能；

2、业界传统采用图层和算子层严格分层独立的实现方法，为算子融合技术演进带来一定的障碍。

昇思MindSpore的解决方案：

主要是两个关键点：基于多层规约的图算融合引擎、自动算子生成。

整体的流程：基于昇思MindSpore的统一IR MindIR，通过expander的复合算子白盒化，实现对不同网络的无侵入使能和优化；在完成跨边界聚合优化后，实现多层次多维的算子融合重建；包括buffer融合，并行融合，buffer stitch等等；最后，交给算子编译器AKG，完成子图的codegen。

整个方案的构建，实际上花了比较长的时间，三年三篇顶会，从侧面上反映了这个过程。

与业界已有的AI编译器的对比：

基于多层规约的图算融合引擎：

昇思MindSpore的图算融合引擎充分吸收了当前多类算子融合的技术，并有效的把它们整合在一起。

整体的架构如下：

流程主要分为partition和fusion两个阶段。对于输入的DNN模型，在partition阶段，会先完成黑盒白化以及白盒聚合，也就是把复合算子通过扩展器扩展为基本算子的白盒子图，打开原子图边界后，完成跨边界的聚合优化以及计算逻辑优化，包括代数化简常量折叠等等。最后，按照预定的pattern以及costmodel，对计算图拆分为适合codegen的子图；

在fusion阶段，我们提供了多层级的融合方案。在layer1层，主要是完成buffer融合，将子图拆分后的融合子图交给算子编译器AKG，从loop粒度，完成循环变化、调度优化等编译优化。接着，对于AKG生成的子图kernel，通过bufferStitch按照依赖关系对其做buffer拼接，进一步减少访存次数（这部分工作其实跟阿里的Astitch理念上比较类似，实现上不同）；最后，对不存在依赖关系的子图kernel，寻求并行融合机会。

算子自动生成（AKG）

AKG基于TVM开发，但与TVM不同的是，我们是通过polyhedral实现调度自动优化。AKG的输入除了tvm中提供的dsl算子外，还支持图算融合后的子图以及MindSpore提供的python自定义算子。在通过一系列规范化的pass后，将halideIR转为poly模块中的schedule tree，并对schedule tree完成自动调度优化，自动切分，内存搬移等操作，随即转回HalideIR完成后端指令生成及后端优化。在切分策略上，提供了两种模式。对于训练场景，使用autotiling在较短时间给出相对较优的切分，对于性能极致优化场景，我们提供了tuning能力，在poly辅助计算的切分空间中，利用进化算法，costmodel等寻求最优切分。

整套方案同其他编译器相比，主要有两个优势：由于调度是自动完成的，极大降低了开发门槛；对于异构硬件、以及融合算子都能够有较好的支持。

GPU平台

已经基本实现泛化支持

1、NLP、推荐类网络收益明显：NLP类96.4%；推荐类136.6%;

2、CV类由于以卷积为主，平均30.7%。

CPU平台

已打通CPU后端支持

强化学习网络提升15~20%，典型NN网络提升17%~33%

特点5：针对大规模并行的完整编译优化方案

昇思MindSpore另一个创新是把AI编译器从单芯片支持拓展到集群支持，在编译中实现通用分布式并行及内存优化。

整体的编译流程：

未来一些开放性的问题

问题1：AI的图层优化最终是一个什么问题？

整体而言，AI图层的优化当前有三种思路：

1、编译器的优化思路，基于Pattern Match，从搜索算法的本质讲是一种贪心的算法，是局部寻优的思路

2、全局规划的思路，无论是动态规划、还是类似ILP的线性规划也好，都是采用全局寻优的思路，这里的关键是需要一个较好的cost model。

3、Tuning的思路，还是全局寻优的思路，但是弱化cost model。

未来图层的优化哪一种方式是主流，或者哪几种方式组合最优。

问题2：图算能否统一表达，统一编译优化，成为一个通用编译器

当前的AI框架下，图层和算子层是分开表达和优化的，算法工程师主要是接触图层的表达，AI框架或者芯片使能的工程师主要是接触算子的表达，但是未来在AI+科学计算的场景下，图层和算子层不再清晰，能否放在一起表达，统一优化？

问题3：完全的自动并行是否可行

在完全的自动并行方面，昇思MindSpore以及学术界都做了有益的探索，但是目前看泛化性还有一些差距，未来能否真正做到自动并行？

如何借助编译优化理论和方法，将计算图描述的深度学习算法部署在具体硬件上并让算法高效运行，是学术界和工业界一个重要的研究课题。更多AI编译技术内容在清华大学出版社新书《多面体编译理论与深度学习实践》中。

为感谢小孢子对昇思MindSpore的关注，昇思MindSpore准备了5本《多面体编译理论与深度学习实践》作为福利免费赠送。

活动规则（以下三点均需同时满足）：

1、将本篇文章转发至朋友圈并带上#昇思MindSpore，发表你对AI编译器相关看法或建议；

2、该朋友圈保留24小时（不设分组）；

3、集满88个赞。

满足以上三点即可获得《多面体编译理论与深度学习实践》一本，数量有限先到先得。

领奖规则:

1、活动时间：2023年3月20日-2023年3月24日12：00；

2、领取方式：将以上三点截图发送至昇思MindSpore公众号后台，等待工作人员审核即可。

*活动解释权归昇思MindSpore开源社区所有。

你可能感兴趣的:(技术博客,人工智能)

北京大学：2本手册，拓展AI应用深度与广度 2501_90766876 pdf
《DeepSeek与AIGC应用》对DeepSeek-R1进行了详细解读，包括其技术特性、发展历程、应用场景以及在AIGC（人工智能生成内容）领域的定位。深入剖析DeepSeek-R1在复杂逻辑推理、数学和编程任务中的优异表现，揭示其在推理密集型任务、教育、科研、知识应用和文档分析等领域的独特优势，为AIGC领域的从业者和爱好者提供了深入了解DeepSeek的窗口。《DeepSeek提示词工程和落
Transformer模型详解 Yuki-^_^ Transformer模型详解人工智能 transformer 深度学习人工智能
导读Transformer在许多的人工智能领域，如自然语言处理(NaturalLanguageProcessing,NLP)、计算机视觉(ComputerVision,CV)和语音处理(SpeechProcessing,SP)取得了巨大的成功。因此，自然而然的也吸引了许多工业界和学术界的研究人员的兴趣。到目前为止，已经提出了大量基于Transformer的相关工作和综述。本文基于邱锡鹏[1]老师近
AIGC从入门到实战：探秘：ChatGPT 到底是什么 AI天才研究院计算 AI大模型企业级应用开发实战 ChatGPT 计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
1.背景介绍1.1人工智能的浪潮近年来，人工智能(AI)发展迅猛，其应用已深入到各个领域，从自动驾驶汽车到智能家居，再到医疗诊断，AI正在改变我们的生活方式。其中，自然语言处理(NLP)作为AI的重要分支，近年来取得了显著进展，而AIGC(AI-GeneratedContent)正是NLP领域的一颗璀璨明珠。1.2AIGC的兴起AIGC指的是利用AI技术自动生成内容，包括文本、图像、音频、视频等。
C# 牵手DeepSeek：打造本地AI超能力步、步、为营 c#人工智能开发语言
一、引言在人工智能飞速发展的当下，大语言模型如DeepSeek正掀起新一轮的技术变革浪潮，为自然语言处理领域带来了诸多创新应用。随着数据隐私和安全意识的提升，以及对模型部署灵活性的追求，本地部署DeepSeek成为众多开发者和企业关注的焦点。对于C#开发者而言，将DeepSeek模型本地部署并集成到C#项目中，不仅能充分发挥C#语言在Windows平台开发的优势，还能实现高度定制化的人工智能应用，
注意力机制：让机器学会“挑重点” 人工智能计算机视觉
注意力机制：让机器学会“挑重点”前言在日常生活中，我们总是无意识地选择性地关注某些信息，而忽略其他部分。比如，听音乐时，我们可能会更关注旋律或歌词；阅读文章时，我们会优先留意标题和核心观点。这种“选择性关注”的能力，正是注意力机制的核心思想。而在人工智能领域，注意力机制则是一种让机器在处理大量数据时，能够自动识别并聚焦于关键信息的技术。注意力机制的工作原理注意力机制的工作流程可以简化为三个主要步骤
AI数据分析：用DeepSeek做数据清洗 atbigapp.com 数据分析大模型应用 AI工具人工智能数据分析数据挖掘 deepseek prompt
在当今数据驱动的时代，数据分析已成为企业和个人决策的重要工具。随着人工智能技术的快速发展，AI驱动的数据分析工具正在改变我们处理和分析数据的方式。本文将着重介绍如何使用DeepSeek进行数据清洗。数据清洗是数据分析的基础，其目的是确保数据的准确性、完整性和一致性。常见的数据问题包括：缺失值：数据中的某些字段为空。重复值：数据中存在重复记录。异常值：数据中存在明显偏离正常范围的数值。不一致性：数据
百度搜索语法羊羊一洋百度
百度搜索作为中国最大的搜索引擎，其搜索语法与谷歌搜索类似，但也有一些特有的功能。以下是一些基本的百度搜索语法：1.双引号(`""`)：用来搜索精确的短语或句子。例如，搜索`"人工智能"`会找到包含完整短语"人工智能"的结果。2.减号(-)：用来排除搜索结果中的特定词汇。例如，搜索`手机-iphone`会找到包含"手机"但不包含"iphone"的结果。3.加号(+)：用来确保搜索结果中包含特定的词汇
如何在VSCode中使用OpenAI WeiLai1112 DeepSeek vscode ide 编辑器
如何在VSCode中使用OpenAI：从集成到应用场景详解人工智能（AI）正在改变软件开发的方式，而OpenAI提供的强大模型可以帮助开发者提升编码效率、优化工作流并自动化繁琐任务。本文将详细介绍如何在VSCode（VisualStudioCode）中使用OpenAI，集成后可以做哪些事情，以及如何充分发挥OpenAI的能力来提高生产力。1.在VSCode中使用OpenAI，可以做什么？将Open
清华出版 | DeepSeek使用手册（全）艾思科蓝 AiScholar 人工智能（AI）系列人工智能大数据 ai 机器人 AI编程 AI写作算法
在科技迅猛发展的今天，人工智能技术正逐渐渗透到我们生活的每一个角落。清华大学新闻与传播学院-新媒体研究中心-元宇宙文化实验室团队最近发布了一份详尽的DeepSeek使用手册，该手册长达104页，堪称国产AI工具深度使用的标杆指南。这份教程不仅适合新手快速掌握基础操作，也为进阶用户提供了系统性方法论。免费领取104页【清华大学-DeepSeek使用手册】以下是主要内容及要点：一、DeepSeek概述
13个优秀的AI人工智能工具软件导航网站推荐 m0_68282957 人工智能搜索引擎百度
人工智能（AI）是现在科技领域的热门话题，它不仅改变了我们的生活方式，也催生了许多创新的工具和应用。AI工具可以帮助我们完成各种任务，如绘画、编程、视频制作、语音合成等，让我们的工作和娱乐更加高效和有趣。但是，面对琳琅满目的AI工具，你是否感到困惑和无从下手？你是否想要找到一个方便快捷的方式，来了解和使用各种AI工具？本文就来为大家推荐几个优秀的AI工具导航网站，让你一站式地发现和体验最新最实用的
清华出品DeepSeek保姆级超实用手册，AI进阶之路的宝藏指南 2501_90771647 pdf
资源链接：https://pan.quark.cn/s/3d4088555ca0资源链接：https://pan.quark.cn/s/df8ce3ea6f4e「DeepSeek资料大全」资源链接：https://pan.quark.cn/s/1352425b0645「完整版Dee...键整合包」链接：https://pan.quark.cn/s/7e851bca2dc2在人工智能飞速发展的时代，
自然语言处理之语法解析：BERT：自然语言处理基础理论 zhubeibei168 自然语言处理 1024程序员节自然语言处理 bert 语音识别人工智能
自然语言处理之语法解析：BERT：自然语言处理基础理论自然语言处理基础自然语言处理的定义与应用自然语言处理（NaturalLanguageProcessing，NLP）是计算机科学领域与人工智能领域中的一个重要方向。它研究如何处理和运用自然语言；自然语言认知则是指让计算机“懂”人类的语言。NLP建立于20世纪50年代，随着计算机技术的飞速发展，NLP技术在信息检索、文本挖掘、语音识别、机器翻译、情
Linux进程间的关系油菜花的菜 Linux系统编程和网络编程 linux 运维 vim
Linux进程间的关系Linux下每个进程都隶属于一个进程组，每个进程都包含PID、PGID、SID。文章目录Linux进程间的关系前言一、进程组二、会话三、ps命令查看进程间的关系四、系统资源限制五、改变工作目录和根目录六、服务器程序后台化前言提示：这里可以添加本文要记录的大概内容：例如：随着人工智能的不断发展，机器学习这门技术也越来越重要，很多人都开启了学习机器学习，本文就介绍了机器学习的基础
Deepseek相关梳理 stars and seas 人工智能
发展历程及重要节点2023年：7月17日杭州深度求索人工智能基础技术研究有限公司成立。2024年1月5日，发布首个大模型DeepSeekLLM。5月，宣布开源第二代MoE大模型DeepSeek-V2。9月5日，升级推出DeepSeekV2.5新模型。11月20日，推理模型DeepSeek-R1-Lite预览版上线。12月26日，DeepSeek-V3首个版本上线并开源。2025年1月20日，正式发
HTML AI 编程助手 wjs2024 开发语言
HTMLAI编程助手引言随着人工智能技术的飞速发展，编程领域也迎来了新的变革。HTML，作为网页制作的基础语言，与AI技术的结合，为开发者带来了前所未有的便利。本文将探讨HTMLAI编程助手的功能、应用场景以及如何利用它提高编程效率。HTMLAI编程助手概述HTMLAI编程助手是一种基于人工智能技术的辅助工具，旨在帮助开发者快速、高效地完成HTML代码编写。通过学习大量的HTML代码，AI编程助手
首发实测：地表最强AI？马斯克发布新一代AI模型Grok3 Code_流苏 AI漫谈先知实用软件与高效工具人工智能 grok3 AI实测首发测评 AI
近年来，人工智能的迅猛发展让人们对其未来充满了无限期待。尤其是以马斯克为首的企业家们，始终走在AI技术的前沿。就在近期，马斯克宣布推出新一代AI模型——Grok3。这一消息无疑引起了行业的广泛关注，大家都在猜测，这款新AI模型究竟有何独特之处，是否能够在众多强大AI模型中脱颖而出？名人说：悟已往之不谏，知来者之可追。——《归去来兮辞》陶渊明创作者：Code_流苏(CSDN)（一个喜欢古诗词和编程的
LeetCode - #219 存在重复元素 II 网罗开发 Swift vue.js leetcode 算法
网罗开发（小红书、快手、视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者：《ESP32-C3物联网工程开发实战》图书作者：《SwiftUI入门，进阶与实战》超级个体：CO
穿越AI边界：深度集成DeepSeek API与云平台的实践之路云边有个稻草人热门文章人工智能 DeepSeek 大数据集成DeepSeek API DeepSeek算法阿里云百炼平台集成
云边有个稻草人-CSDN博客随着人工智能技术的日益发展，深度学习和自然语言处理（NLP）已经在很多领域得到了广泛的应用。DeepSeek作为一款领先的大型语言生成模型，凭借其强大的推理和生成能力，已经被越来越多的开发者和行业专家所青睐。通过DeepSeek提供的API接口，开发者可以在多个领域中实现先进的自然语言理解和生成任务。本文将深入探讨如何使用Python调用DeepSeek的API接口，并
AI在农业中的应用:精准农业的新时代 AI大模型应用之禅 DeepSeek R1 &AI大模型与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
AI,农业,精准农业,机器学习,深度学习,计算机视觉,农业机器人1.背景介绍农业是人类文明的基石，也是全球经济的重要支柱。然而，随着人口增长和资源短缺，传统农业面临着诸多挑战，例如低效率、资源浪费、环境污染和气候变化的影响。为了应对这些挑战，精准农业应运而生。精准农业是指利用现代信息技术和数据分析手段，对农业生产进行精细化管理，提高资源利用效率、产量和产品质量，同时减少环境污染。人工智能（AI）作
AI 驱动的智慧大脑：打造企业动态知识库，开启高效管理新时代网罗开发人工智能 AI 大模型深度学习人工智能
网罗开发（小红书、快手、视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者：《ESP32-C3物联网工程开发实战》图书作者：《SwiftUI入门，进阶与实战》超级个体：CO
量子计算如何提升机器学习效率：从理论到实践 Echo_Wish 人工智能前沿技术量子计算机器学习人工智能
量子计算如何提升机器学习效率：从理论到实践在人工智能和机器学习的高速发展中，传统计算方法已经逐渐面临性能瓶颈。随着数据量的激增、算法复杂度的提高，传统计算机在处理某些特定任务时的效率显得捉襟见肘。而量子计算，作为一项颠覆性的技术，正逐步展现出在机器学习领域中的巨大潜力。量子计算不仅能够加速特定任务的执行，还能为一些经典算法提供更高效的解决方案。今天，我们将深入探讨量子计算如何提升机器学习效率，解析
云计算相关工作岗位有哪些，薪资怎么样？欧米说云云计算腾讯云阿里云云计算
云计算、大数据、人工智能作为新一代信息技术产业，未来发展前景不可估量，就业前途一片光明，自然薪资待遇也不会差。随着亚马逊云、阿里云、华为云等云厂商的快速发展，也产生了大量的岗位需求，同时厂商为了增强自身影响力，也设置了很多证书考试，acp、ace、hcip、hcie等等。在这里想进入相关行业大厂从事云相关的工作的同学可以先考取大厂的对应证书，增加自己简历含金量，从而进入大厂。免费领取阿里云华为认证
从零到精通：小白DeepSeek全栈入门指南好东西不迷路各自资源 AI 前端 html python
第一部分：认知准备（1-3天）1.1基础概念搭建人工智能三要素：数据/算法/算力深度学习与传统机器学习的区别神经网络基本结构（输入层/隐藏层/输出层）常用术语解析：epoch、batch、loss、accuracy1.2环境配置实战Python环境搭建（推荐Anaconda）condacreate-ndeepseekpython=3.8condaactivatedeepseek深度学习框架选择指南
查看Python库依赖关系的解决方案爱编程的喵喵 Python基础课程 python 依赖关系
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了查看Python库依赖关系的解决方案
Python编码系列—Python原型模式：深克隆与高效复制的艺术学步_技术 Python编码 python 原型模式开发语言
欢迎来到我的技术小筑，一个专为技术探索者打造的交流空间。在这里，我们不仅分享代码的智慧，还探讨技术的深度与广度。无论您是资深开发者还是技术新手，这里都有一片属于您的天空。让我们在知识的海洋中一起航行，共同成长，探索技术的无限可能。探索专栏：学步_技术的首页——持续学习，不断进步，让学习成为我们共同的习惯，让总结成为我们前进的动力。技术导航：人工智能：深入探讨人工智能领域核心技术。自动驾驶：分享自动
DeepSeek R1 详解：思维链、强化学习和蒸馏前网易架构师-高司机 2025年最新-深度学习+AI DeepSeek和AI工具深度学习 Deepseek
目录思维链强化学习蒸馏DeepSeek是如何做到的?训练过程较小模型基准为什么Deepseek很重要DeepSeekR1常见问题解答来自中国的新型大型语言模型DeepSeekR1的发布在人工智能研究界引起了轰动。这不仅仅是又一次渐进式改进。DeepSeek代表着一次重大飞跃。大多数新的人工智能模型感觉都像是小步前进，DeepSeek-R1则不同。Deepseek的基准在推理任务（数学、编码和科学）
如何在本地运行大型语言模型（LLM）：深度指南及最佳实践 m0_57781768 语言模型人工智能自然语言处理
如何在本地运行大型语言模型（LLM）：深度指南及最佳实践在当今的人工智能领域，越来越多的开发者希望能够在本地运行大型语言模型（LLM），而不依赖于云端服务。这种趋势的兴起主要源于两个重要的需求：隐私保护和成本控制。通过在本地设备上运行LLM，用户的数据不会被发送到第三方服务器，确保了数据的隐私性。同时，在长时间运行的模拟、文本生成、总结等需要大量计算资源的应用中，本地运行可以显著降低成本。本文将深
【QT开发教程】使用Qt进行跨平台（Windows、macOS、Linux、iOS和Android）开发的最佳实践 I'mAlex QT开发教程 qt 开发语言跨平台
Qt是一个强大的跨平台C++框架，使得开发者可以编写一次代码并在多个平台上运行，包括Windows、macOS、Linux、iOS和Android。在跨平台开发过程中，遵循一些最佳实践可以帮助我们提高开发效率和代码质量。本文将介绍使用Qt进行跨平台开发的最佳实践。博主简介：现任阿里巴巴嵌入式技术专家，15年工作经验，深耕嵌入式+人工智能领域，精通嵌入式领域开发、技术管理、简历招聘面试。CSDN优质
这是我的第一篇博客流川飞 c++
结束摆烂，看看自己的极限在哪里，两年后回来看自己个人介绍：我是一个大一下学期的男生，就读人工智能专业，性格活泼爱笑[face]emoji:008.png[/face]编程目标：能拿到一份满意的offer，能成为很厉害的程序员如何学习：利用晚上的水课和没课的时间学习编程，到一定水平后参加蓝桥杯类的比赛!我打算每周在编程上花费的时间：35h+我最想进入的一家IT公司：马斯克的公司!
DeepSeek怎么用，DeepSeek使用指南最全合集（保姆级教程） xiecoding.cn deepseek deepseek使用指南 deepseek怎么用 deepseek免费教学 deepseek资料合集
DeepSeek是一款由国内顶尖团队开发的人工智能大模型，旨在为用户提供高效、智能的问答和知识服务。作为国产AI模型的代表，DeepSeek不仅在自然语言处理（NLP）领域表现出色，还在多个应用场景中展现了强大的能力。与ChatGPT等国际知名模型相比，DeepSeek在中文语境下的表现尤为突出，能够更好地理解中文的复杂语义和文化背景。DeepSeek使用资源下载为了方便大家更好地学习和使用Dee
[黑洞与暗粒子]没有光的世界 comsci
无论是相对论还是其它现代物理学,都显然有个缺陷,那就是必须有光才能够计算但是,我相信,在我们的世界和宇宙平面中,肯定存在没有光的世界.... 那么,在没有光的世界,光子和其它粒子的规律无法被应用和考察,那么以光速为核心的 &nbs
jQuery Lazy Load 图片延迟加载 aijuans jquery
基于 jQuery 的图片延迟加载插件，在用户滚动页面到图片之后才进行加载。对于有较多的图片的网页，使用图片延迟加载，能有效的提高页面加载速度。版本： jQuery v1.4.4+ jQuery Lazy Load v1.7.2 注意事项：需要真正实现图片延迟加载，必须将真实图片地址写在 data-original 属性中。若 src
使用Jodd的优点 Kai_Ge jodd
1. 简化和统一 controller ，抛弃 extends SimpleFormController ，统一使用 implements Controller 的方式。 2. 简化 JSP 页面的 bind, 不需要一个字段一个字段的绑定。 3. 对 bean 没有任何要求，可以使用任意的 bean 做为 formBean。使用方法简介
jpa Query转hibernate Query 120153216 Hibernate
public List<Map> getMapList(String hql, Map map) { org.hibernate.Query jpaQuery = entityManager.createQuery(hql); if (null != map) { for (String parameter : map.keySet()) { jp
Django_Python3添加MySQL/MariaDB支持 2002wmj mariaDB
现状首先，Django@Python2.x 中默认的引擎为 django.db.backends.mysql 。但是在Python3中如果这样写的话，会发现 django.db.backends.mysql 依赖 MySQLdb[5] ，而 MySQLdb 又不兼容 Python3 于是要找一种新的方式来继续使用MySQL。 MySQL官方的方案首先据MySQL文档[3]说，自从MySQL
在SQLSERVER中查找消耗IO最多的SQL 357029540 SQL Server
返回做IO数目最多的50条语句以及它们的执行计划。 select top 50 (total_logical_reads/execution_count) as avg_logical_reads, (total_logical_writes/execution_count) as avg_logical_writes, (tot
spring UnChecked 异常官方定义！ 7454103 spring
如果你接触过spring的事物管理！那么你必须明白 spring的非捕获异常！即 unchecked 异常！因为 spring 默认这类异常事物自动回滚！！ public static boolean isCheckedException(Throwable ex) { return !(ex instanceof RuntimeExcep
mongoDB 入门指南、示例 adminjun java mongodb 操作
一、准备工作 1、下载mongoDB 下载地址：http://www.mongodb.org/downloads 选择合适你的版本相关文档：http://www.mongodb.org/display/DOCS/Tutorial 2、安装mongoDB A、不解压模式：将下载下来的mongoDB-xxx.zip打开，找到bin目录，运行mongod.exe就可以启动服务，默
CUDA 5 Release Candidate Now Available aijuans CUDA
The CUDA 5 Release Candidate is now available at http://developer.nvidia.com/<wbr></wbr>cuda/cuda-pre-production. Now applicable to a broader set of algorithms, CUDA 5 has advanced fe
Essential Studio for WinRT网格控件测评 Axiba JavaScript html5
Essential Studio for WinRT界面控件包含了商业平板应用程序开发中所需的所有控件，如市场上运行速度最快的grid 和chart、地图、RDL报表查看器、丰富的文本查看器及图表等等。同时，该控件还包含了一组独特的库，用于从WinRT应用程序中生成Excel、Word以及PDF格式的文件。此文将对其另外一个强大的控件——网格控件进行专门的测评详述。网格控件功能 1、
java 获取windows系统安装的证书或证书链 bewithme windows
有时需要获取windows系统安装的证书或证书链，比如说你要通过证书来创建java的密钥库。有关证书链的解释可以查看此处。 public static void main(String[] args) { SunMSCAPI providerMSCAPI = new SunMSCAPI(); S
NoSQL数据库之Redis数据库管理(set类型和zset类型) bijian1013 redis 数据库 NoSQL
4.sets类型 Set是集合，它是string类型的无序集合。set是通过hash table实现的，添加、删除和查找的复杂度都是O(1)。对集合我们可以取并集、交集、差集。通过这些操作我们可以实现sns中的好友推荐和blog的tag功能。 sadd：向名称为key的set中添加元
异常捕获何时用Exception，何时用Throwable bingyingao
用Exception的情况 try { //可能发生空指针、数组溢出等异常 } catch (Exception e) {
【Kafka四】Kakfa伪分布式安装 bit1129 kafka
在http://bit1129.iteye.com/blog/2174791一文中，实现了单Kafka服务器的安装，在Kafka中，每个Kafka服务器称为一个broker。本文简单介绍下，在单机环境下Kafka的伪分布式安装和测试验证 1. 安装步骤 Kafka伪分布式安装的思路跟Zookeeper的伪分布式安装思路完全一样，不过比Zookeeper稍微简单些(不
Project Euler bookjovi haskell
Project Euler是个数学问题求解网站，网站设计的很有意思，有很多problem，在未提交正确答案前不能查看problem的overview，也不能查看关于problem的discussion thread，只能看到现在problem已经被多少人解决了，人数越多往往代表问题越容易。看看problem 1吧： Add all the natural num
Java-Collections Framework学习与总结-ArrayDeque BrokenDreams Collections
表、栈和队列是三种基本的数据结构，前面总结的ArrayList和LinkedList可以作为任意一种数据结构来使用，当然由于实现方式的不同，操作的效率也会不同。这篇要看一下java.util.ArrayDeque。从命名上看
读《研磨设计模式》-代码笔记-装饰模式-Decorator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.io.BufferedOutputStream; import java.io.DataOutputStream; import java.io.FileOutputStream; import java.io.Fi
Maven学习(一) chenyu19891124 Maven私服
学习一门技术和工具总得花费一段时间，5月底6月初自己学习了一些工具，maven+Hudson+nexus的搭建，对于maven以前只是听说，顺便再自己的电脑上搭建了一个maven环境，但是完全不了解maven这一强大的构建工具，还有ant也是一个构建工具，但ant就没有maven那么的简单方便，其实简单点说maven是一个运用命令行就能完成构建，测试，打包，发布一系列功
[原创]JWFD工作流引擎设计----节点匹配搜索算法(用于初步解决条件异步汇聚问题) 补充 comsci 算法工作 PHP 搜索引擎嵌入式
本文主要介绍在JWFD工作流引擎设计中遇到的一个实际问题的解决方案，请参考我的博文"带条件选择的并行汇聚路由问题"中图例A2描述的情况(http://comsci.iteye.com/blog/339756),我现在把我对图例A2的一个解决方案公布出来，请大家多指点节点匹配搜索算法(用于解决标准对称流程图条件汇聚点运行控制参数的算法) 需要解决的问题：已知分支
Linux中用shell获取昨天、明天或多天前的日期 daizj linux shell 上几年昨天获取上几个月
在Linux中可以通过date命令获取昨天、明天、上个月、下个月、上一年和下一年 # 获取昨天 date -d 'yesterday' # 或 date -d 'last day' # 获取明天 date -d 'tomorrow' # 或 date -d 'next day' # 获取上个月 date -d 'last month' #
我所理解的云计算 dongwei_6688 云计算
在刚开始接触到一个概念时，人们往往都会去探寻这个概念的含义，以达到对其有一个感性的认知，在Wikipedia上关于“云计算”是这么定义的，它说： Cloud computing is a phrase used to describe a variety of computing co
YII CMenu配置 dcj3sjt126com yii
Adding id and class names to CMenu We use the id and htmlOptions to accomplish this. Watch. //in your view $this->widget('zii.widgets.CMenu', array( 'id'=>'myMenu', 'items'=>$this-&g
设计模式之静态代理与动态代理 come_for_dream 设计模式
静态代理与动态代理代理模式是java开发中用到的相对比较多的设计模式，其中的思想就是主业务和相关业务分离。所谓的代理设计就是指由一个代理主题来操作真实主题，真实主题执行具体的业务操作，而代理主题负责其他相关业务的处理。比如我们在进行删除操作的时候需要检验一下用户是否登陆，我们可以删除看成主业务，而把检验用户是否登陆看成其相关业务
【转】理解Javascript 系列 gcc2ge JavaScript
理解Javascript_13_执行模型详解摘要: 在《理解Javascript_12_执行模型浅析》一文中,我们初步的了解了执行上下文与作用域的概念，那么这一篇将深入分析执行上下文的构建过程，了解执行上下文、函数对象、作用域三者之间的关系。函数执行环境简单的代码:当调用say方法时，第一步是创建其执行环境，在创建执行环境的过程中，会按照定义的先后顺序完成一系列操作:1.首先会创建一个
Subsets II hcx2013 set
Given a collection of integers that might contain duplicates, nums, return all possible subsets. Note: Elements in a subset must be in non-descending order. The solution set must not conta
Spring4.1新特性——Spring缓存框架增强 jinnianshilongnian spring4
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
shell嵌套expect执行命令 liyonghui160com
一直都想把expect的操作写到bash脚本里,这样就不用我再写两个脚本来执行了,搞了一下午终于有点小成就,给大家看看吧. 系统:centos 5.x 1.先安装expect yum -y install expect 2.脚本内容: cat auto_svn.sh #!/bin/bash
Linux实用命令整理 pda158 linux
0. 基本命令　　linux 基本命令整理　　1. 压缩解压　　tar -zcvf a.tar.gz a #把a压缩成a.tar.gz 　　tar -zxvf a.tar.gz #把a.tar.gz解压成a 　　2. vim小结　　2.1 vim替换　　:m,ns/word_1/word_2/gc
独立开发人员通向成功的29个小贴士 shoothao 独立开发
概述：本文收集了关于独立开发人员通向成功需要注意的一些东西,对于具体的每个贴士的注解有兴趣的朋友可以查看下面标注的原文地址。明白你从事独立开发的原因和目的。保持坚持制定计划的好习惯。万事开头难，第一份订单是关键。培养多元化业务技能。提供卓越的服务和品质。谨小慎微。营销是必备技能。学会组织，有条理的工作才是最有效率的。 “独立
JAVA中堆栈和内存分配原理 uule java
1、栈、堆 1.寄存器：最快的存储区, 由编译器根据需求进行分配,我们在程序中无法控制.2. 栈：存放基本类型的变量数据和对象的引用，但对象本身不存放在栈中，而是存放在堆（new 出来的对象）或者常量池中（字符串常量对象存放在常量池中。）3. 堆：存放所有new出来的对象。4. 静态域：存放静态成员（static定义的）5. 常量池：存放字符串常量和基本类型常量（public static f