黯止依蓝

MLIR

方言

简介
- 操作
- 块
- 区域
- - 值范围
  - Control Flow and SSACFG Regions
- 操作与多区域（Operations with Multiple Regions）
- 闭包（Closure）
- 图形区域（Graph Regions）
- 参数和结果（Arguments and Results）
- 属性
- 类型系统
- 类型别名
- 方言类型
- - 内建类型
  - 属性
  - 属性
  - 方言属性
  - 内置方言

简介

方言（Dialects）是参与并扩展MLIR（多级中间表示，多级中间语言）生态系统的机制。它们允许定义新的操作、属性和类型。每个方言都有一个唯一的命名空间，这个命名空间会作为前缀添加到每个定义的属性、操作和类型前。例如，Affine方言定义的命名空间是：affine。

MLIR允许多个方言共存，即使这些方言不在主树结构内，也可以在一个模块内共同存在。方言由特定的传递过程产生和消费。MLIR提供了一个框架，可以在不同的方言之间进行转换，也可以在同一个方言内进行转换。

操作

MLIR引入了操作的概念，用于描述不同级别的抽象和计算。操作可以具有特定于应用程序的语义，并且是完全可扩展的，也就是说没有固定的操作列表。

每个操作由一个唯一的字符串标识来识别，例如"dim"、“tf.Conv2d”、“x86.repmovsb”、"ppc.eieio"等。操作可以返回零个或多个结果，接受零个或多个操作数。它还可以存储属性、具有属性的字典、具有零个或多个后继操作以及零个或多个封闭区域。

操作的内部表示相对简单，通常以字面形式包含所有这些元素。为了指示结果和操作数的类型，它还包括一个函数类型。

块

一个块（Block）是一个操作列表。在SSA CFG（静态单赋值形式控制流图）区域中，每个块代表一个编译器基本块，其中块内的指令按顺序执行，终结操作（terminator operations）实现基本块之间的控制流分支。

块中的最后一个操作必须是终结操作。一个只有单个块的区域可以通过在封闭操作上附加NoTerminator来免除这一要求。顶级的ModuleOp就是一个定义这种特性且其块体没有终结操作的操作的例子。

MLIR中的块接受一个块参数列表，表示方式类似于函数。块参数与由个别操作语义指定的值绑定。区域入口块的块参数也是区域的参数，这些参数的值由包含操作的语义决定。其他块的块参数由终结操作的语义决定，例如将该块作为后继者的分支。在具有控制流的区域中，MLIR利用这种结构隐式地表示控制流依赖值的传递，而无需传统SSA表示中的PHI节点的复杂细节。注意，不依赖控制流的值可以直接引用，不需要通过块参数传递。

以下是一个简单的函数示例，展示了分支、返回和块参数：

func.func @simple(i64, i1) -> i64 {
^bb0(%a: i64, %cond: i1): // 由^bb0支配的代码可以引用%a
  cf.cond_br %cond, ^bb1, ^bb2

^bb1:
  cf.br ^bb3(%a: i64)    // 分支传递%a作为参数

^bb2:
  %b = arith.addi %a, %a : i64
  cf.br ^bb3(%b: i64)    // 分支传递%b作为参数

// ^bb3从前驱接收一个参数，命名为%c，并将其与%a一起传递给bb4。
// %a直接从其定义操作引用，不通过^bb3的参数传递。
^bb3(%c: i64):
  cf.br ^bb4(%c, %a : i64, i64)

^bb4(%d : i64, %e : i64):
  %0 = arith.addi %d, %e : i64
  return %0 : i64   // 返回也是一个终结操作。
}

区域

区域是MLIR（多级中间表示）块的有序列表。区域内部的语义并不是由IR（中间表示）强加的，而是由包含该区域的操作定义的。MLIR当前定义了两种区域：SSACFG区域，用于描述块之间的控制流，以及Graph区域，不需要块之间的控制流。操作中的区域类型通过RegionKindInterface描述。

区域没有名称或地址，只有区域中包含的块有。区域必须包含在操作内，并且没有类型或属性。区域中的第一个块是一个特殊的块，称为“入口块”。入口块的参数也是区域本身的参数。入口块不能被列为任何其他块的后继块。

值范围

区域的层次结构：
区域提供了一种层次化的封装方式，这意味着你不能从一个区域跳转（branch）到另一个区域。例如，如果你有一个代码块在区域A，那么你不能直接跳转到区域B的代码块。
值的作用范围
区域自然地限制了值的可见性：
在一个区域中定义的值不会逃逸到外部的区域。比如，在内部区域定义的变量，在外部区域是不可见的。
区域内的操作：
在一个区域内的操作可以引用外部区域定义的值，但前提是这些值在包含该区域的操作中是合法的。比如，如果外部区域允许使用某个变量，那么这个变量在内部区域也是可以使用的。
限制引用的特性：
可以使用一些特性（traits）来限制引用，例如 OpTrait::IsolatedFromAbove，或者使用自定义验证器来控制这些规则。
示例解释：

"any_op"(%a) ({ // 如果 %a 在包含的区域中是可见的…
   // 那么 %a 在这里也是可见的。
  %new_value = "another_op"(%a) : (i64) -> (i64)
}) : (i64) -> (i64)

在这个例子中，如果 %a 在外部区域中是可见的，那么它在内部区域中也是可见的。

MLIR中的层次支配概念：
MLIR（多级中间表示）定义了一种广义的“层次支配”概念，用来确定一个值是否“在作用范围内”以及是否可以被某个操作使用。
在同一个区域内，值是否可以被另一个操作使用，取决于该区域的类型。
如果一个值在一个区域中定义，那么只有当一个操作的父操作在同一区域且可以使用该值时，这个值才能被使用。
一个区域的参数定义的值，可以被该区域内的任何操作使用。
一个区域中定义的值，永远不能在该区域外部使用。

Control Flow and SSACFG Regions

在MLIR中，有一种叫做SSACFG的区域，这个区域的操作就像我们写代码那样，是按顺序执行的。简单来说：

操作顺序执行：在一个操作执行前，它需要的所有数据（操作数）已经准备好并且有明确的值。操作执行后，这些数据的值保持不变，同时生成的结果也有明确的值。
操作之间的控制流：操作一个接一个地执行，直到执行到块（代码段）末尾的“终止操作”。然后，控制流会根据终止操作的指示，跳到其他地方继续执行。

控制流的进入和退出

进入区域：控制流总是从区域的第一个块（入口块）开始。
退出区域：控制流可以通过任何带有合适终止操作的块退出区域。比如，某个块的终止操作指示跳回外部操作（像函数的返回）。

实例

func.func @accelerator_compute(i64, i1) -> i64 { // 一个SSACFG区域
^bb0(%a: i64, %cond: i1): // 被 ^bb0 支配的代码可以引用 %a
  cf.cond_br %cond, ^bb1, ^bb2

^bb1:
  // 这里定义的 %value 不支配 ^bb2
  %value = "op.convert"(%a) : (i64) -> i64
  cf.br ^bb3(%a: i64)    // 分支传递 %a 作为参数

^bb2:
  accelerator.launch() { // 一个SSACFG区域
    ^bb0:
      // 嵌套在 "accelerator.launch" 下的代码区域，它可以引用 %a 但不能引用 %value。
      %new_value = "accelerator.do_something"(%a) : (i64) -> ()
  }
  // %new_value 不能在区域外引用

^bb3:
  ...
}

说明

支配关系和变量引用
支配关系（Domination）在编译原理中指一个基本块B1支配另一个基本块B2，如果每次控制流进入B2之前必定会经过B1。这个概念帮助我们理解变量的可见性和生命周期。

块^bb0

支配关系：^{bb0是函数的入口块，所以它支配所有其他块（}bb1、^bb2和bb3）。
变量引用：^{bb0中的变量%a和%cond在}bb0、^bb1、bb2和^{bb3中都可以被引用，因为这些块都被}bb0支配。

块^bb1

支配关系：^{bb1不是其他任何块的支配块，因为从}bb0到^{bb3可以通过}bb2而不经过^bb1。
变量引用：^{bb1定义了变量%value，但由于}bb1不支配^bb2和bb3，%value不能在^bb2和bb3中引用。然而，%value可以在^bb1内部引用。

块^bb2

支配关系：^bb2同样不支配其他任何块。
变量引用：^{bb2中的加速器启动区域（accelerator.launch）是一个新的嵌套区域，虽然它可以引用来自外部块（}bb0）的变量%a，但不能引用来自^{bb1的变量%value，因为}bb1不支配^bb2。

加速器启动区域（accelerator.launch 内部的 ^bb0）

支配关系：这个区域是独立的SSACFG区域，有它自己的控制流和支配关系。区域内的块^bb0支配区域内的所有操作。
变量引用：区域内的操作可以引用外部区域的变量%a，但不能引用%value，因为%value的定义在当前区域的控制流之外（即不在这个区域内的支配链上）。

块^bb3

支配关系：^{bb3既不支配也不被}bb1或^bb2支配。
变量引用：^{bb3只能引用在}bb0中定义并且被传递下来的变量%a，但不能引用^{bb1中定义的%value，因为%value的作用范围仅限于}bb1

综上所述

入口块^bb0支配所有其他块，因此它定义的变量%a和%cond在整个函数中都是可见的。
**^{bb1定义的变量%value**只能在}bb1内部引用，不能在^bb2和bb3中引用，因为^bb1不支配bb2和^bb3。
**加速器启动区域（accelerator.launch）**可以引用外部块（^{bb0）的变量%a，但不能引用来自}bb1的变量%value。
^{bb3只能引用}bb0中定义并传递下来的变量%a，但不能引用^bb1中的%value。

操作与多区域（Operations with Multiple Regions）

概念解释：
在编程中，操作（operation）可以包含多个区域（region）。区域就像是操作内部的小块代码或逻辑。当控制流到达一个操作时，这个操作可以选择将控制权传递给它内部的任何一个区域。当控制流从一个区域返回时，操作可以继续将控制权传递给其他区域。一个操作可以同时管理多个区域，甚至可以调用其他操作中的区域。
实际例子：
假设我们有一个主操作 mainOp，它包含两个子区域 regionA 和 regionB。当 mainOp 被执行时，它首先将控制权传递给 regionA。当 regionA 完成后，mainOp 将控制权传递给 regionB。

"mainOp"() ({
  // regionA
  "opA"() : () -> ()
  // regionB
  "opB"() : () -> ()
}) : () -> ()
在这个例子中，mainOp 包含了 regionA 和 regionB 两个区域，并按顺序执行它们。

闭包（Closure）

概念解释：
闭包是一种将代码块和其环境打包成一个整体的技术。区域允许我们定义创建闭包的操作，将区域的主体“打包”成一个值。闭包可以在以后执行，具体执行的方式由操作定义。如果一个操作是异步执行的，调用方需要确保等待操作完成，以保证所用的值依然有效。
实际例子：
假设我们有一个操作 createClosure，它将一个区域打包成一个闭包，并返回一个函数值。

"createClosure"() ({
  // The region to be packed as a closure
  %result = "opInClosure"() : () -> (i32)
}) : () -> (function)

在这个例子中，createClosure 将 opInClosure 操作打包成一个闭包，并返回一个函数值，可以在以后调用。

图形区域（Graph Regions）

在MLIR（多级中间表示）中，图形区域（graph region）的概念用于表示图状语义，即没有控制流但可能存在并发语义或通用有向图数据结构的情况。图形区域非常适合表示没有基本顺序的循环关系或耦合值之间的关系。例如，图形区域中的操作可以代表独立的控制线程，而值可以代表数据流。

图形区域有以下几个关键点：

单一基本块：目前，图形区域被限制为只能包含一个基本块（entry block）。虽然这种限制没有特定的语义原因，但它被添加的目的是为了简化通过的基础设施，确保处理图形区域的各种传递（passes）能够正确处理反馈循环。未来，如果有需求，可能会允许多基本块的图形区域。
操作和值的表示：在图形区域中，MLIR操作代表图中的节点，而每个MLIR值代表一个多边连接，即一个源节点和多个目标节点的连接。区域内定义的所有值都在区域内的作用域内，并且可以被区域内的其他操作访问。
操作的顺序无关性：在图形区域中，基本块内操作的顺序和区域内基本块的顺序在语义上没有意义，非终止操作可以自由重排，例如通过规范化（canonicalization）进行重排。
循环的可能性：在图形区域中，循环（cycles）可以发生在单个基本块内，也可以发生在基本块之间。

参数和结果（Arguments and Results）

概念解释：
一个区域的第一个块的参数被视为区域的参数。参数的来源由父操作的语义决定，可能对应操作本身使用的一些值。区域会生成一个（可能为空的）值列表，操作的语义定义了区域结果与操作结果之间的关系。
实际例子：
假设我们有一个操作 funcOp，它包含一个区域 funcRegion，区域的参数为 %arg1 和 %arg2。

module {
  func @main(%arg0: i32, %arg1: i32) -> i32 {
    %0 = "myFuncOp"(%arg0, %arg1) : (i32, i32) -> (i32)
    return %0 : i32
  }

  "myFuncOp"(%input1: i32, %input2: i32) -> (i32) {
    ^entry(%arg1: i32, %arg2: i32):
      %result = addi %arg1, %arg2 : i32
      return %result : i32
  }
}

关系解释

父操作 myFuncOp：
myFuncOp 是父操作，它包含一个区域。
myFuncOp 接收两个输入参数 %input1 和 %input2，类型为 i32。
区域 funcRegion：
funcRegion 是 myFuncOp 的区域。
funcRegion 的第一个基本块 ^entry 接收两个参数 %arg1 和 %arg2，这些参数直接对应父操作 myFuncOp 的输入 %input1 和 %input2。
区域参数：
^entry 基本块的参数 %arg1 和 %arg2 被视为整个区域 funcRegion 的参数。
这些参数的来源是父操作 myFuncOp 的输入 %input1 和 %input2。
区域结果：
在 ^entry 基本块内，我们执行一个加法操作 addi，计算 %arg1 和 %arg2 的和，并将结果存储在 %result。
最后，区域返回计算结果 %result，这个结果成为操作 myFuncOp 的输出。

"test.graph_region"() ({ // 一个图形区域
  %1 = "op1"(%1, %3) : (i32, i32) -> (i32)  // 这是允许的，%1 和 %3 都在作用域内
  %2 = "test.ssacfg_region"() ({
     %5 = "op2"(%1, %2, %3, %4) : (i32, i32, i32, i32) -> (i32) // 这是允许的，%1, %2, %3, %4 都定义在包含的区域内
  }) : () -> (i32)
  %3 = "op2"(%1, %4) : (i32, i32) -> (i32)  // 这是允许的，%4 在作用域内
  %4 = "op3"(%1) : (i32) -> (i32)
}) : () -> ()

属性

类型系统

在编程中，每个数据都有一个类型，比如整数、浮点数、字符串等等。MLIR也是这样，但它有一个更灵活的类型系统，允许我们定义自己的类型。
在MLIR中，类型系统是开放的，这意味着你可以定义任何你需要的类型，没有一个预先固定的类型列表。这对于不同的应用程序来说非常有用，因为你可以创建特定的类型来满足你的需求。
类型的基本构成

在MLIR中，类型可以分为几种：

类型别名（type-alias）：一个类型的替代名字。
方言类型（dialect-type）：为特定应用定义的类型。
内建类型（builtin-type）：系统预定义的一些基本类型。

类型列表有两种表示方式：

不带括号的类型列表：多个类型用逗号分隔，比如 int, float。
带括号的类型列表：可以是空的括号()，也可以是多个类型用逗号分隔并包含在括号内，比如 (int, float)。

当我们使用一个带有特定类型的值时，通常用这样的形式表示：值: 类型。

函数类型

函数类型用一个箭头->连接输入类型和输出类型。比如，一个函数接受一个整数并返回一个浮点数，可以表示为：int -> float。如果有多个输入或输出类型，可以用括号括起来，比如：(int, float) -> (string, bool)。

类型别名

类型别名就像给一个复杂类型起了一个简短的名字。比如，!avx_m128 = vector<4 x f32> 这句话定义了一个别名!avx_m128，它相当于vector<4 x f32>。以后在代码中你可以用!avx_m128来代替vector<4 x f32>，这样代码会更简洁和易读。

!avx_m128 = vector<4 x f32>

// Using the original type.
"foo"(%x) : vector<4 x f32> -> ()

// Using the type alias.
"foo"(%x) : !avx_m128 -> ()

方言类型

方言类型是一种自定义的数据类型，它可以扩展现有的类型系统。就像编程语言允许你创建自定义的类和结构体一样，方言类型允许你在特定的命名空间内创建自定义的类型。
方言类型的两种表示方式

不透明类型（Opaque Type）：
用尖括号 <> 包裹的详细内容。
例如：!tf 表示一个 TensorFlow 的字符串类型。
“不透明”指的是类型的具体内部结构或实现细节对外部系统或用户不可见。这意味着外部系统不需要知道或理解类型的具体实现，只需要知道这个类型存在并能够使用它。
简洁类型（Pretty Type）：
省略了一些冗长的符号，使其更易读。
例如：!tf.string 也是表示一个 TensorFlow 的字符串类型，但更简洁。

内建类型

内建类型就是MLIR（多级中间表示）提供的一些基础数据类型。就像编程语言里我们常见的整型、浮点型和函数类型一样，这些类型在MLIR中也是直接可以使用的，并且其他任何自定义扩展（叫做方言）都可以利用这些基础类型。

属性

属性是附加在某个操作上的额外信息。就像你给一个文件夹贴上标签一样，这些属性为操作提供了更多的背景信息或特性。这些信息可以是关于操作自身的特定数据，并且可以通过特定的方法进行访问和使用。

假设你有一个“加法操作”，你可以为这个操作添加一些属性，比如“这两个数字相加的结果是否需要四舍五入”。这个属性就存储在“加法操作”上，具体值可能是 true 或 false。你可以通过特定的方法读取这个属性并决定是否执行四舍五入。

%result = addi %a, %b : i32 { rounding = true }

属性

在编程中，属性（Attributes）是一种为操作（operation）添加额外信息的方式。想象一下，你在写一个食谱，每个步骤（操作）可能有一些特定的要求或注释（属性），这些要求或注释不能被改变，只能作为参考。

如何确定属性类型

文档和规范：通常，MLIR操作的文档和规范会明确指出哪些属性是必需的，哪些是可选的。
操作定义：在MLIR操作定义文件（.td文件）中，属性的定义通常会表明其重要性和必要性。
上下文理解：通过理解操作的上下文和行为，判断属性是否是执行该操作所必需的。

方言属性

方言属性可以看作是给你的MLIR代码添加一些自定义的标签或者注释，这些标签可以携带特定的信息。就像你给你的代码打上“重要”、“需要优化”这样的标签一样，方言属性可以携带特定的信息供后续使用。

假设你有一个自定义方言，命名空间为foo，你想要给某个操作添加一个字符串属性和一个复杂属性。

// 定义一个字符串属性
#foo>

// 定义一个复杂属性
#foo<"a123^^^" + bar>

// 在MLIR代码中使用这些属性
func @example() {
  %0 = "foo.operation"() { attr = #foo> } : () -> ()
  %1 = "foo.operation"() { complex_attr = #foo<"a123^^^" + bar> } : () -> ()
  return
}

在这个例子中，foo.operation操作使用了两个自定义的方言属性，一个是字符串属性，另一个是复杂属性。这些属性可以在后续的编译、优化或者代码生成过程中被利用。

内置方言

内置方言就像是MLIR系统提供的一些基础设施，这些基础设施包含了一些基本的工具和数据类型，所有人都可以直接使用，而不需要自己重新发明轮子。内置方言提供了一些通用的属性值和类型，这些属性和类型可以被任何方言直接使用，方便了不同方言之间的互操作。

假设你需要使用一些基本的整数和浮点数属性，这些属性是MLIR系统内置的。

func @example() {
  // 使用内置的整数属性
  %0 = "builtin.operation"() { int_attr = 42 : i32 } : () -> ()
  
  // 使用内置的浮点数属性
  %1 = "builtin.operation"() { float_attr = 3.14 : f32 } : () -> ()
  
  return
}

在这个例子中，builtin.operation操作使用了内置的整数属性和浮点数属性。因为这些属性是内置的，所以任何方言都可以直接使用它们，而不需要自己定义。

你可能感兴趣的:(MLIR)

IREE 开源项目教程束慧可Melville
IREE开源项目教程项目地址:https://gitcode.com/gh_mirrors/ire/iree1.项目介绍IREE（IntermediateRepresentationExecutionEnvironment，发音为"eerie"）是一个基于MLIR的端到端机器学习编译器和运行时工具包。IREE旨在将机器学习模型降低到统一的中间表示（IR），以满足数据中心的需求，并适应移动和边缘部署
AI编译器对比：TVM vs MLIR vs Triton在大模型部署中的工程选择学术猿之吻人工智能 mlir 量子计算 pytorch 深度学习分布式
引言：大模型部署的编译器博弈随着千亿参数大模型成为常态，推理延迟优化成为系统工程的核心挑战。本文基于NVIDIAA100与GoogleTPUv4平台，通过BERT-base（110M）和GPT-2（1.5B）的实测数据，对比TVM、MLIR、Triton三大编译框架在动态shape支持、算子融合效率、内存管理等方面的工程特性，揭示不同场景下的编译策略选择规律。一、技术架构对比分析1.1TVM：分层
mlir toy 教程(2) 红鲤鱼遇绿鲤鱼 LLVM/TVM/编译理论
本文翻译自MLIR官网TOY教程，附带个人理解与批注，内容仅用于个人学习与记录Chapter2:EmittingBasicMLIRIntroduction:Multi-LevelIntermediateRepresentation多级中间表示Othercompilers,likeLLVM(seetheKaleidoscopetutorial),offerafixedsetofpredefinedt
MLIR 学习笔记落雪霜林 mlir 笔记
参考MLIR官网、MLIR技术细节整理以及MLIR源码完成。其中一些细节可能随LLVM版本变化而变化。学到哪里写到哪里。文章目录IR结构mlir::Operationmlir::Opmlir::Blockmlir::Regionmlir::Valuemlir::Typemlir::Attribute操作定义规范（ODS）TableGen语法OpConversion方言转换Pattern模式匹配Bu
【从零开始学深度学习编译器】十二，MLIR Toy Tutorials学习笔记一 just_sort 深度学习人工智能
本笔记由学习MLIRTutorials总结而成，欢迎批评指正。Chapter1:Toy语言和ASTMLIR提供了一种Toy语言来说明MLIR的定义和执行的流程。Toy语言是一种基于张量的语言，我们可以使用它来定义函数，执行一些数学计算以及输出结果。下面要介绍的例子中限制Tensor的维度是,initializedwiththeliteralvalue.#Theshapeisinferredfrom
MLIR 黯止依蓝 MLIR
方言简介操作块区域值范围ControlFlowandSSACFGRegions操作与多区域（OperationswithMultipleRegions）闭包（Closure）图形区域（GraphRegions）参数和结果（ArgumentsandResults）属性类型系统类型别名方言类型内建类型属性属性方言属性内置方言简介方言（Dialects）是参与并扩展MLIR（多级中间表示，多级中间语言）
MLIR笔记（2） wuhui_gdnt MLIR笔记 mlir 笔记编译 llvm
3.LVM有趣的代码3.1.dyn_cast()与cast()C++支持类型间的自动转换（如operator=声明的转换），但在转换的调用链里自动转换只能调用一次，这固然是避免给编译器带来过分的复杂性，但更重要的是允许自动转换接力调用几乎很难避免出现递归调用，而且调用链过长会很快失去控制，给人带来意想不到的结果。但是，C++原生的类型转换系统对于LLVM/MLIR来说局限性太大，因此，LLVM打造
大模型工程化：面向生产环境的LLM系统架构设计桂月二二系统架构 wpf
一、高性能推理引擎设计1.1层次化计算优化1.2编译时优化示例#使用MLIR实现计算图优化withmlir.Context()asctx:module=Module.parse("""func.func@main(%input:tensor)->tensor{%cst=arith.constantdense:tensor%0=linalg.matmulins(%input,%cst:tensor,
Torch-MLIR 项目使用教程穆声淼Germaine
Torch-MLIR项目使用教程torch-mlirTheTorch-MLIRprojectaimstoprovidefirstclasssupportfromthePyTorchecosystemtotheMLIRecosystem.项目地址:https://gitcode.com/gh_mirrors/to/torch-mlir1.项目目录结构及介绍Torch-MLIR项目的目录结构遵循典型的
利用tpu-mlir工具将深度学习算法模型转成算能科技平台.bmodel模型的方法步骤陈洪伟 ##目标检测算法算能科技
目录1TPU-MLIR简介2开发环境搭建2.1下载镜像2.2下载SDK2.3创建容器2.4加载tpu-mlir3准备工作目录4onnx转mlir文件5mlir转INT8模型5.1生成校准表5.2便以为INT8对称量化模型参考文献：之前是用nntc转算能科技的模型的，这次技术支持建议我使用mlir工具进行模型转换，于是看一下mlir的介绍资料和使用方法，并做一下笔记。1TPU-MLIR简介上图就是t
MOJO语言的诞生是乔乔啊 #MOJO mojo
文章目录背景目标现状背景传统的编译器技术如LLVM和GCC并不适合现有深度学习编程语言的发展迭代，无法完全支持现代芯片架构。如今，专用机器学习加速器的标准技术是MLIR。MLIR是一个相对较新的开源编译器基础架构，最初由Google（其主要负责人转到Modular）启动，已在机器学习加速器社区广泛应用。MLIR的优势在于它能够构建领域特定编译器，特别是用于不是传统CPU和GPU的奇怪领域，例如AI
TPU-MLIR 哦豁灬 ai compiler mlir ai compiler
1、AI编译器TPU，张量处理器AI编译器，把不同框架下的搭建起来的模型，转换为统一形式的中间表达IR，然后通过IR转换成可以在特定芯片平台上运行的二进制模型Top，芯片无关层：图优化、量化、推理Tpu，芯片相关层，权重重排、算子切分、地址分配、推理2、TPU-MLIR算子按照顺序一一对应进行转换：onnx-->origin.mlir图优化：origin.mlir-->canonical.mlir
Zirgen MLIR：RISC-Zero的ZK-circuits形式化验证 mutourend zkVM zkVM
1.引言前序博客有：ZK*FM：RISCZerozkVM的形式化验证参考资料[1]2022年12月视频OpenZLTalk8:Multi-levelIRanditsutilityinZK,BrianRetford[2]2022年11月视频cirgen:MLIRbasedcompilerforzk-STARKcircuitgeneration-FrankLaub(RISCZero)对应slide[3
利用指向数据成员的指针实现容器对象数据成员的筛选 liuzongze1992 设计模式 c++
//TFv2.11.1//tensorflow\compiler\xla\mlir_hlo\lib\Dialect\mhlo\IR\hlo_ops.cc//tensorflow\compiler\xla\xla_data.proto:468//https://github.com/openxla/stablehlo/blob/main/docs/spec.md#reduce_window//htt
Load mlir(mhlo/lmhlo) and execute on GPU liuzongze1992 deep learning mlir tensorflow
main.cc#include"mlir/Dialect/Func/IR/FuncOps.h"//from@llvm-project#include"mlir/Dialect/Arith/IR/Arith.h"//from@llvm-project#include"mlir/Dialect/MemRef/IR/MemRef.h"//from@llvm-project#include"mlir/Di
MLIR笔记（5） wuhui_gdnt MLIR笔记 mlir 笔记编译
4.3.4.图区域在MLIR中，区域里类似图的语义由RegionKind::Graph来表示。对没有控制流的并发语义，以及通用有向图数据结构的建模，图区域是合适的。图区域适用于表示耦合值之间的循环关系，这些关系没有基本的序。例如，一个图区域里的操作可能表示独立线程的控制流，具有表示数据流的值。就像通常在MLIR里一样，区域的特定语义完全由它包含的操作确定。图区域可能仅包含单个基本块（入口块）。基本
编译器和 IR：LLVM IR、SPIR-V 和 MLIR 空谷-幽兰 mlir 编辑器
编译器通常是各种开发工具链中的关键组件，可提高开发人员的工作效率。编译器通常用作独立的黑匣子，它使用高级源程序并生成语义上等效的低级源程序。不过，它仍然是内部结构倾向的;内部之间流动的内容就称为中间表示（IR）。IR对编译器至关重要。就像有许多编译器一样，也有许多IR在使用中。到目前为止，我很幸运能与三个IR有直接或简介的开发经验——分别是LLVMIR、SPIR-V、MLIR，尤其是最近两个工作，
LLaMA 2端到端推理打通！来自中国团队 QbitAl llama
允中发自凹非寺量子位|公众号QbitAIBuddyCompiler端到端LLaMA2-7B推理示例已经合并到buddy-mlir仓库[1]主线。我们在BuddyCompiler的前端部分实现了面向TorchDynamo的第三方编译器，从而结合了MLIR和PyTorch的编译生态。目前，前端部分可以覆盖LLaMA计算图，转换到MLIR后我们集成了部分向量化和并行优化，并在AVX512平台上进行了测试
MLIR笔记（4） wuhui_gdnt MLIR笔记 mlir 笔记编译
4.3.3.控制流与SSACFG区域在MLIR里，区域的控制流语义由RegionKind::SSACFG表示。非正式地，这些区域支持这样的语义：区域里的操作“顺序执行”。在执行一个操作前，它的操作数有定义良好的值。在操作执行后，操作数有相同的值且结果也有定义良好的值。在操作执行后，执行基本块里的下一个操作，直到基本块末尾的终结符操作，在这个情形下将执行其他某个操作。确定下一条执行指令的是“控制流的
MLIR笔记（3） wuhui_gdnt MLIR笔记 mlir 笔记编译 llvm
4.一些ODS定义4.1.特性（trait）MLIR支持一个完全开放的生态系统，因为任意方言都可以定义适合特定抽象层次的属性（attribute）、操作（operation）以及类型（type）。特性（trait）是抽象出实现细节以及在许多不同属性/操作/类型等之间通用的属性（properties）的机制。特性可用于说明这个对象特殊的属性以及约束，包括一个操作是否有副作用，或者它的输出是否与输入有
MLIR笔记（1） wuhui_gdnt MLIR笔记 mlir 编译 llvm
1.简介MLIR是Multi-layerIR的缩写，它是基于LLVMIR发展的一个中间语言形式，是Clang/LLVM的发明者ChrisLattner在加盟谷歌后又一个重要的发明。MLIR是较之LLVMIR更为灵活的深度学习编译器架构。其他编译器，像LLVM（参考Kaleidoscopetutorial），提供一组固定的预定义的类型以及（通常低级/类RISC）指令。在发布LLVMIR之前，由特定语
TPU-MLIR——实现Chatglm2-6B大模型移植部署算能开发者社区 mlir 算法人工智能硬件工程
TPU-MLIR——实现Chatglm2-6B大模型移植部署本项目实现BM1684X部署语言大模型ChatGLM2-6B。通过TPU-MLIR编译器将模型转换成bmodel，并采用c++代码将其部署到BM1684X的PCIE环境，或者SoC环境。编译chatglm2-6B模型1.下载‘Chat-GLM2-6B’2.对该模型做两点修改：一是将config.json文件中seq_length配置为51
RISC0：Towards a Unified Compilation Framework for Zero Knowledge mutourend zkVM 零知识证明
1.引言本文主要摘自RISC0（RISCZERO）创始人BrianRetford在CompilerandComposabilityinZKP上的演讲内容。2.何为ZKVM？3.密集型计算加速策略4.MLIR参考资料[1]CompilerandComposabilityinZKP
Tutorial - 如何在MacOS 上安装MLIR以及MLIR Python Binding anniezfy MLIR macos python 编辑器
Tutorial-如何在MacOS上安装Mlir以及MLIRPythonBinding前言在习惯了在IDE中利用成熟的编译工具链运行代码和享受舒适的代码编写环境之后，我逐渐依赖于具有GUI界面的软件工具，而忽视了使用命令行直接操作程序的重要性。因此，在这次搭建环境的过程中，我深刻地感受到了自己对Unix指令的不熟悉。本文的主要目的是展示如何从源代码开始构建、手动编译整个过程的步骤，并记录我不断踩坑
docker打包container成image，然后将image上传到docker hub 我是硝酸钾 docker eureka java
第一步：停止正在运行的容器dockerstopeg:dockerstopxuanjie_mlir第二步：将对应的container打包成imagedockercommiteg：dockercommit005672e6d97axuanjie_pp:latest注意：这里还有额外的参数，您这边呢，可以按照您的需要，设置：-a:提交的镜像作者；-c:使用Dockerfile指令来创建镜像；-m:提交时的
Hello, Mojo——首次体验Mojo语言 -北天- 软件测评 mojo swift 开发语言
Hello,Mojo——首次体验Mojo语言文章目录Hello,Mojo——首次体验Mojo语言一、前言二、Mojo有哪些独特的功能使它不同于Python？三、可以在Mojo中导入和使用的Python哪些包？四、为什么参数化在Mojo中对于使用SIMD类型和硬件加速器很重要？五、Mojo中引入的特殊装饰器的目的是什么？它们如何提供对编译器优化的完全控制？六、MLIR语法如何用于在Mojo中执行操作
MLIR入门系列系列学习笔记俗世苍鹰人工智能笔记人工智能
目录1名字解释这一定义包含3个关键元素：2代码演示2.1环境准备2.2编译llvm-project2.3测试解析2.3.1源程序2.3.2将源程序生成抽象语法树(AST)3MLIR三要素3.1MLIRGen模块3.2Dialect模块3.3TableGen模块3.3.1定义一个和ToyDialect的链接3.3.2创建一个ToyDialectOperation的基类3.3.3创建ToyDialec
llvm toy 语言分析 Eloudy llvm 编译器
1.编译llvmrelease/17.x1.1下载：1.2生成构建：cmake-G"UnixMakefiles"../llvm-DLLVM_ENABLE_PROJECTS="bolt;clang;clang-tools-extra;compiler-rt;cross-project-tests;libclc;lld;mlir;openmp;polly;pstl;flang"-DLLVM_BUILD
Mojo编程语言是AI人工智能的新的编程语言软件架构师-叶秋常用软件开发工具推荐人工智能 mojo
Mojo是ChrisLattner的创业公司Modular开发的一种新的编程语言，旨在统一AI基建和异构计算。Mojo被认为是Python的超集，兼容Python生态，但添加了系统编程和编译期优化的特性，以提高性能和部署效率。Mojo基于MLIR，可以支持多种硬件加速器，包括CPU、GPU和其他xPU。Mojo编程语言的目的是成为人工智能（AI）开发的首选语言，它结合了Python的可用性和C的功
源码编译llvm Error 记录 Eloudy llvm
$cmake-G"UnixMakefiles"../llvm-DLLVM_ENABLE_PROJECTS="bolt;clang;clang-tools-extra;compiler-rt;cross-project-tests;libclc;lld;lldb;mlir;openmp;polly;pstl;flang"-DLLVM_BUILD_EXAMPLES=ON-DCMAKE_BUILD_TY
桌面上有多个球在同时运动，怎么实现球之间不交叉，即碰撞？换个号韩国红果果 html 小球碰撞
稍微想了一下，然后解决了很多bug，最后终于把它实现了。其实原理很简单。在每改变一个小球的x y坐标后，遍历整个在dom树中的其他小球，看一下它们与当前小球的距离是否小于球半径的两倍？若小于说明下一次绘制该小球（设为a）前要把他的方向变为原来相反方向（与a要碰撞的小球设为b），即假如当前小球的距离小于球半径的两倍的话，马上改变当前小球方向。那么下一次绘制也是先绘制b，再绘制a，由于a的方向已经改变
《高性能HTML5》读后整理的Web性能优化内容白糖_ html5
读后感先说说《高性能HTML5》这本书的读后感吧，个人觉得这本书前两章跟书的标题完全搭不上关系，或者说只能算是讲解了“高性能”这三个字，HTML5完全不见踪影。个人觉得作者应该首先把HTML5的大菜拿出来讲一讲，再去分析性能优化的内容，这样才会有吸引力。因为只是在线试读，没有机会看后面的内容，所以不胡乱评价了。
[JShop]Spring MVC的RequestContextHolder使用误区 dinguangx jeeshop 商城系统 jshop 电商系统
在spring mvc中，为了随时都能取到当前请求的request对象，可以通过RequestContextHolder的静态方法getRequestAttributes()获取Request相关的变量，如request, response等。在jshop中，对RequestContextHolder的
算法之时间复杂度周凡杨 java 算法时间复杂度效率
在计算机科学中，算法的时间复杂度是一个函数，它定量描述了该算法的运行时间。这是一个关于代表算法输入值的字符串的长度的函数。时间复杂度常用大O符号表述，不包括这个函数的低阶项和首项系数。使用这种方式时，时间复杂度可被称为是渐近的，它考察当输入值大小趋近无穷时的情况。这样用大写O()来体现算法时间复杂度的记法，
Java事务处理 g21121 java
一、什么是Java事务通常的观念认为，事务仅与数据库相关。事务必须服从ISO/IEC所制定的ACID原则。ACID是原子性（atomicity）、一致性（consistency）、隔离性（isolation）和持久性（durability）的缩写。事务的原子性表示事务执行过程中的任何失败都将导致事务所做的任何修改失效。一致性表示当事务执行失败时，所有被该事务影响的数据都应该恢复到事务执行前的状
Linux awk命令详解 510888780 linux
一. AWK 说明 awk是一种编程语言，用于在linux/unix下对文本和数据进行处理。数据可以来自标准输入、一个或多个文件，或其它命令的输出。它支持用户自定义函数和动态正则表达式等先进功能，是linux/unix下的一个强大编程工具。它在命令行中使用，但更多是作为脚本来使用。 awk的处理文本和数据的方式：它逐行扫描文件，从第一行到
android permission 布衣凌宇 Permission
<uses-permission android:name="android.permission.ACCESS_CHECKIN_PROPERTIES" ></uses-permission>允许读写访问"properties"表在checkin数据库中，改值可以修改上传 <uses-permission android:na
Oracle和谷歌Java Android官司将推迟 aijuans java oracle
北京时间 10 月 7 日，据国外媒体报道，Oracle 和谷歌之间一场等待已久的官司可能会推迟至 10 月 17 日以后进行，这场官司的内容是 Android 操作系统所谓的 Java 专利权之争。本案法官 William Alsup 称根据专利权专家 Florian Mueller 的预测，谷歌 Oracle 案很可能会被推迟。　　该案中的第二波辩护被安排在 10 月 17 日出庭，从目前看来
linux shell 常用命令 antlove linux shell command
grep [options] [regex] [files] /var/root # grep -n "o" * hello.c:1:/* This C source can be compiled with:
Java解析XML配置数据库连接(DOM技术连接 SAX技术连接) 百合不是茶 sax技术 Java解析xml文档 dom技术 XML配置数据库连接
XML配置数据库文件的连接其实是个很简单的问题,为什么到现在才写出来主要是昨天在网上看了别人写的,然后一直陷入其中,最后发现不能自拔所以今天决定自己完成 ,,,,现将代码与思路贴出来供大家一起学习 XML配置数据库的连接主要技术点的博客; JDBC编程 : JDBC连接数据库 DOM解析XML: DOM解析XML文件 SA
underscore.js 学习（二） bijian1013 JavaScript underscore
Array Functions 所有数组函数对参数对象一样适用。1.first _.first(array, [n]) 别名: head, take 返回array的第一个元素，设置了参数n，就
plSql介绍 bijian1013 oracle 数据库 plsql
/* * PL/SQL 程序设计学习笔记 * 学习plSql介绍.pdf * 时间：2010-10-05 */ --创建DEPT表 create table DEPT ( DEPTNO NUMBER(10), DNAME NVARCHAR2(255), LOC NVARCHAR2(255) ) delete dept; select
【Nginx一】Nginx安装与总体介绍 bit1129 nginx
启动、停止、重新加载Nginx nginx 启动Nginx服务器，不需要任何参数u nginx -s stop 快速(强制)关系Nginx服务器 nginx -s quit 优雅的关闭Nginx服务器 nginx -s reload 重新加载Nginx服务器的配置文件 nginx -s reopen 重新打开Nginx日志文件
spring mvc开发中浏览器兼容的奇怪问题 bitray jquery Ajax springMVC 浏览器上传文件
最近个人开发一个小的OA项目,属于复习阶段.使用的技术主要是spring mvc作为前端框架,mybatis作为数据库持久化技术.前台使用jquery和一些jquery的插件. 在开发到中间阶段时候发现自己好像忽略了一个小问题,整个项目一直在firefox下测试,没有在IE下测试,不确定是否会出现兼容问题.由于jquer
Lua的io库函数列表 ronin47 lua io
1、io表调用方式：使用io表，io.open将返回指定文件的描述，并且所有的操作将围绕这个文件描述　　io表同样提供三种预定义的文件描述io.stdin,io.stdout,io.stderr 　　2、文件句柄直接调用方式,即使用file:XXX()函数方式进行操作,其中file为io.open()返回的文件句柄　　多数I/O函数调用失败时返回nil加错误信息,有些函数成功时返回nil
java-26-左旋转字符串 bylijinnan java
public class LeftRotateString { /** * Q 26 左旋转字符串 * 题目：定义字符串的左旋转操作：把字符串前面的若干个字符移动到字符串的尾部。 * 如把字符串abcdef左旋转2位得到字符串cdefab。 * 请实现字符串左旋转的函数。要求时间对长度为n的字符串操作的复杂度为O(n)，辅助内存为O(1)。 */ pu
《vi中的替换艺术》-linux命令五分钟系列之十一 cfyme linux命令
vi方面的内容不知道分类到哪里好，就放到《Linux命令五分钟系列》里吧！今天编程，关于栈的一个小例子，其间我需要把”S.”替换为”S->”(替换不包括双引号)。其实这个不难，不过我觉得应该总结一下vi里的替换技术了，以备以后查阅。 1 所有替换方案都要在冒号“:”状态下书写。 2 如果想将abc替换为xyz，那么就这样 :s/abc/xyz/ 不过要特别
[轨道与计算]新的并行计算架构 comsci 并行计算
我在进行流程引擎循环反馈试验的过程中，发现一个有趣的事情。。。如果我们在流程图的每个节点中嵌入一个双向循环代码段，而整个流程中又充满着很多并行路由，每个并行路由中又包含着一些并行节点，那么当整个流程图开始循环反馈过程的时候，这个流程图的运行过程是否变成一个并行计算的架构呢？
重复执行某段代码 dai_lm android
用handler就可以了 private Handler handler = new Handler(); private Runnable runnable = new Runnable() { public void run() { update(); handler.postDelayed(this, 5000); } }; 开始计时 h
Java实现堆栈（list实现） datageek 数据结构——堆栈
public interface IStack<T> { //元素出栈，并返回出栈元素 public T pop(); //元素入栈 public void push(T element); //获取栈顶元素 public T peek(); //判断栈是否为空 public boolean isEmpty
四大备份MySql数据库方法及可能遇到的问题 dcj3sjt126com DB backup
一：通过备份王等软件进行备份前台进不去？用备份王等软件进行备份是大多老站长的选择，这种方法方便快捷，只要上传备份软件到空间一步步操作就可以，但是许多刚接触备份王软件的客用户来说还原后会出现一个问题：因为新老空间数据库用户名和密码不统一，网站文件打包过来后因没有修改连接文件，还原数据库是好了，可是前台会提示数据库连接错误，网站从而出现打不开的情况。解决方法：学会修改网站配置文件，大多是由co
github做webhooks：[1]钩子触发是否成功测试 dcj3sjt126com github git webhook
转自: http://jingyan.baidu.com/article/5d6edee228c88899ebdeec47.html github和svn一样有钩子的功能，而且更加强大。例如我做的是最常见的push操作触发的钩子操作，则每次更新之后的钩子操作记录都会在github的控制板可以看到！工具/原料 github 方法/步骤
">的作用" target="_blank">JSP中的作用蕃薯耀
JSP中<base href="<%=basePath%>">的作用 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>
linux下SAMBA服务安装与配置 hanqunfeng linux
局域网使用的文件共享服务。一.安装包： rpm -qa | grep samba samba-3.6.9-151.el6.x86_64 samba-common-3.6.9-151.el6.x86_64 samba-winbind-3.6.9-151.el6.x86_64 samba-client-3.6.9-151.el6.x86_64 samba-winbind-clients
guava cache IXHONG cache
缓存，在我们日常开发中是必不可少的一种解决性能问题的方法。简单的说，cache 就是为了提升系统性能而开辟的一块内存空间。　　缓存的主要作用是暂时在内存中保存业务系统的数据处理结果，并且等待下次访问使用。在日常开发的很多场合，由于受限于硬盘IO的性能或者我们自身业务系统的数据处理和获取可能非常费时，当我们发现我们的系统这个数据请求量很大的时候，频繁的IO和频繁的逻辑处理会导致硬盘和CPU资源的
Query的开始--全局变量,noconflict和兼容各种js的初始化方法 kvhur JavaScript jquery css
这个是整个jQuery代码的开始，里面包含了对不同环境的js进行的处理，例如普通环境，Nodejs，和requiredJs的处理方法。还有jQuery生成$, jQuery全局变量的代码和noConflict代码详解完整资源： http://www.gbtags.com/gb/share/5640.htm jQuery 源码： (
美国人的福利和中国人的储蓄 nannan408
今天看了篇文章，震动很大，说的是美国的福利。美国医院的无偿入院真的是个好措施。小小的改善，对于社会是大大的信心。小孩，税费等，政府不收反补，真的体现了人文主义。美国这么高的社会保障会不会使人变懒？答案是否定的。正因为政府解决了后顾之忧，人们才得以倾尽精力去做一些有创造力，更造福社会的事情，这竟成了美国社会思想、人
N阶行列式计算(JAVA) qiuwanchi N阶行列式计算
package gaodai; import java.util.List; /** * N阶行列式计算 * @author 邱万迟 * */ public class DeterminantCalculation { public DeterminantCalculation(List<List<Double>> determina
C语言算法之打渔晒网问题 qiufeihu c 算法
如果一个渔夫从2011年1月1日开始每三天打一次渔，两天晒一次网，编程实现当输入2011年1月1日以后任意一天，输出该渔夫是在打渔还是在晒网。代码如下： #include <stdio.h> int leap(int a) /*自定义函数leap()用来指定输入的年份是否为闰年*/ { if((a%4 == 0 && a%100 != 0
XML中DOCTYPE字段的解析 wyzuomumu xml
DTD声明始终以!DOCTYPE开头,空一格后跟着文档根元素的名称,如果是内部DTD,则再空一格出现[],在中括号中是文档类型定义的内容. 而对于外部DTD,则又分为私有DTD与公共DTD,私有DTD使用SYSTEM表示,接着是外部DTD的URL. 而公共DTD则使用PUBLIC,接着是DTD公共名称,接着是DTD的URL. 私有DTD <!DOCTYPErootSYST