FF-Studio

AI编译器之——为什么大模型需要Relax？

放在最前：

Relax 的关键创新

深度学习模型（比如 ChatGPT这种大模型）在运行时经常遇到“输入尺寸不固定”的情况。比如你问它一个问题，这次输入是10个字，下次可能是100个字。传统编译器处理这种“变来变去”的尺寸很笨——要么只能按固定尺寸优化（导致变尺寸时性能暴跌），要么每次都要重新编译（慢到没法用）。

Relax 的创新：

符号形状：让编译器学会“代数” Relax 允许编译器用“符号变量”（比如 n）表示未知的尺寸，就像代数里的未知数。比如告诉编译器：“这个张量的形状是 (n, 4)，另一个是 (n+1, 4)”。这样编译器就能理解它们的尺寸关系，像做数学题一样优化内存和计算流程，而不是两眼一抹黑。

跨层级优化：把大任务拆小，再拼起来 传统编译器优化像“一刀切”——要么全用高级抽象（但性能差），要么全用底层代码（但改不动）。Relax
允许同时用高级和低级代码，比如把一部分计算合并成高效内核（底层），另一部分保持灵活（高层）。就像修车时既能用现成零件，也能自己造零件，组合出最优方案。

接下来讲我们的故事。

一、为什么深度学习需要专门的编译器？

1.1 传统编译器的局限

在接触深度学习编译器之前，很多小伙伴会问：“为什么我们不能直接用 GCC、LLVM 这类成熟的通用编译器？”

通用编译器聚焦 CPU 指令流水，针对的是 C/C++/Rust 等通用语言，优化目标是比较均匀的 CPU 核心与指令集。
深度学习往往要在 GPU、TPU、NPU、FPGA 或移动 GPU 等多种硬件上加速，其核心是高度并行、涉及多维张量运算，需要针对张量算子的并行调度、向量化、缓存利用等进行专门的优化。
传统编译器并不会天然去做“卷积融合”或“矩阵乘法切分与并行策略搜索”等，这些对深度学习性能至关重要。

因此，深度学习编译器（ML Compiler） 兴起：如 TVM、XLA、MLIR、IREE 等。它们往往具备以下能力：

接收“深度学习计算图”（如 PyTorch、TensorFlow 等）或 IR 形式的描述；
根据目标硬件生成高效的 GPU/CPU/专用加速器内核；
可能会对算子做自动搜索和调优，寻求最大化硬件性能；
在图级、张量级做内存规划、算子融合、类型推断等高级优化，从而超越单纯的“手工库调用”模式。

1.2 大模型与“动态形状”带来的新挑战

现阶段，大模型（如 GPT-4、Llama2、CodeLlama 等）在对话、文本生成、AI 助手等方面迅猛发展。这类模型动辄数十亿到上千亿参数，且在推理时需要处理可变长度的上下文，采用Key-Value Cache等机制。这就带来了“动态形状（Dynamic Shape）”需求：

输入序列长度可变：不同对话轮次可能输入长短不一的文本；
缓存形状随推理步数变化：KV 缓存在生成更多 token 时会不断扩展；
模型中一些算子只有在运行时才知道输出大小（如 unique, non_zero 之类）；
大模型中还有多分支逻辑，可能需要在运行时决定下一步算子的执行路径。

这些特性使得编译器如果不能很好地处理动态形状，就会大幅退化：

要么只在编译期把维度视作未知，一旦到了实际执行就不得不反复调度“通用 kernel”，错失高性能；
要么在图级被迫拆分成多个静态图副本（所谓 “bucketing” 或 “多分段编译”），既浪费编译存储成本，也难维护。

基于此，业界与学术界逐渐认识到：机器学习编译器需要更精细的动态形状感知能力，不再简单地把形状标记为 any 或 -1，而应该能够在 IR 中把形状的符号维度与算术关系“显式”地表示出来，并支持相应的运算、优化、内存复用调度等。

二、Relax：面向动态形状与跨层级优化的下一代 IR

Relax 就是为了解决上述问题而提出的一种编译 IR（中间表示），它来自 TVM 项目，是继 Relay IR 之后专门为“动态形状–aware”而设计的下一代 IR。

2.1 Relax 的主要特点

一等公民的符号形状（First-class symbolic shape）
- 在 IR 中，形状（Shape）可以显式地出现，带有符号维度和符号表达式（例如 (n, 4), (n+1, m), (n//2, 256) 等）；
- 让编译器在可能的范围内进行静态分析推断；对无法在编译期确定的部分，则留待运行时做动态检查或推断。
在同一个 IR 中同时表示高层图级与底层算子级
- 传统编译器往往将“图级 IR”与“张量/循环级 IR”严格区分：先在高层做一些融合，然后一次性 Lower 到低层，丢失很多高层信息；
- Relax 允许在一个 IR 内既能描述网络的整体数据流（图级），也能内嵌或调用自定义的 TensorIR 函数（循环级或外部库），以支持跨层次的优化与信息反馈。
可组合的动态形状优化
- 算子融合（Fusion）、内存规划（Memory Planning）、Tensor 程序调度、调用外部高性能库等，都可以在 Relax 中以组合式、分阶段的方式完成；
- 对大语言模型中最常见的注意力模块、KV Cache 更新等也能做“动态形状–aware”融合和调度。

这些特点使得 Relax 能够比前代 IR（如 Relay）在大模型和复杂动态场景中拥有更灵活、更强劲的性能表现。

三、整体编译流程：从模型到可执行

模型导入（Parse/Import）
- 可能来自 ONNX、PyTorch、TensorFlow、或手写 IR 脚本；
- 得到初始的 Relax 表达，可含若干动态维度（标记为 -1 或 symbolic name）。
形状推断与校正（Shape Inference & Refinement）
- 编译器在 IR 中为每个张量插入更明确的形状注释；能在编译期确定的就确定；不能的则以符号表达式表示；
- 如果涉及“只能在 runtime 知道结果大小”的算子（如 unique），则插入 match_cast 断言或动态检查。
算子融合与分层降级
- 对可并行的 element-wise 等算子做融合，减少内核调用；
- 对部分算子调用外部高性能库（如 cuBLAS/cutlass）或自定义 TensorIR 来实现；
- 这一步是跨层可重复的，可先融合一部分，保留另一部分，后面还可继续融合，直到达成最优策略。
TensorIR 优化/自动调度
- 已经降级（lower）到 TensorIR 的子图/算子可以进一步进行循环级别的分块、向量化、并行化等调度优化；
- Auto-scheduler 工具可在此阶段搜索更优的 kernel 实现。
内存规划（Memory Planning）
- 在动态形状环境下，编译器需要尽量根据符号大小做全局分析，判断哪些张量可以复用显存/内存；
- 将生存期互斥且大小能相等（符号表达式可推断相同）的张量复用同一块内存。
生成可执行
- 最终输出一段在目标硬件上执行的函数或可执行模块；
- 在运行时，给定具体的输入形状，编译器生成的代码会做必要的动态检查，然后运行高性能内核。

对编译器而言，这些阶段可以是一系列Pass，有些 Pass 可能会重复数次，或者先做融合再做部分形状推断等，现实中可能比上图更复杂。不过，对初学者只需把握此“自上而下、分阶段优化”的大图即可。

四、Relax 核心概念：符号形状与跨层 IR

本节我们用更多示例与短代码片段，帮助读者理解 Relax 的两大核心抽象：第一类符号形状（symbolic shape）与跨层 IR（cross-level IR）。学习编译器 IR 可能会略显抽象，但理解这部分对掌握后续的优化机制很关键。

4.1 第一类符号形状（Symbolic Shape）

4.1.1 基本用法

在传统编译器或 ONNX、Relay 等前代系统中，遇到维度不确定时，常以 -1 或 any 表示。但这样会使编译期几乎无法进一步推断，导致大量潜在优化失败。Relax 的做法是：

在类型注释（annotation）里允许声明诸如 Tensor((n, 4), "float32")；
其中 n 是一个符号变量，代表“此维度在编译期不知道具体值，但它是所有后续算子里相同的那个 n”；
当多个张量都依赖 n，编译器就能判断它们形状上的关联，从而做正确的融合、内存复用等。

例如，一个函数签名可以是：

def subfunc(x: Tensor((n, 4), "f32")) -> Tensor((n*4,), "f32"):
    # x 的形状是 (n,4)，编译器知道 n 是符号维度
    ...
    # 返回一个形状 (n*4,) 的张量
    return y

这里 (n*4,) 也是一个符号表达式，表示 1D 张量，长度为 n*4。

在编译阶段，如果后面还有算子接收 subfunc 的输出，就能匹配到其输入形状需要是 (n*4,)。
在运行时，真正传进来的 x 可能是 (16,4)，则 n=16，返回张量就会实际变成 (64, )。

4.1.2 动态检查：`match_cast` 与类型断言

并不是所有维度都能在编译时精确得知表达式。某些算子（比如 unique）的输出大小只有在运行时才知道。这时为了继续后续的形状推断，可以写类似：

# 伪代码示例
def unique_and_exp(x: Tensor((n,), "f32")) -> Tensor((m,), "f32"):
    lv0 = unique(x)                         # output shape 不确定
    lv1 = match_cast(lv0, Tensor((m,), "f32"))  
    # match_cast 表示把 lv0 的形状“匹配”为 (m,)
    # 如果运行时发现 lv0 并非 1D，或与 m 不一致，就会报错
    return exp(lv1)

match_cast 告诉编译器：“我期望 lv0 最终是一维张量，并把其长度符号标记为 m。” 在编译后，执行时如果实际大小不对，就会触发动态断言错误。一旦通过，则编译器就能用 m 去表示后续算子的形状。

4.2 跨层 IR：在同一个环境中描述图级和算子级

4.2.1 call_tir / call_dps_library

在深度学习中，“算子级”常常是“CPU/GPU Kernel 代码、卷积/矩阵乘法内核、元素级 for-loop 程序”等；而“图级”则是算子之间的数据流。

传统做法：先在图级 IR（如 Relay）里写网络结构，然后“一次性” Lower 到低层（如 TensorIR）生成 kernel 代码；此时高层信息就丢了。
Relax 做法：在同一个 IR 里保留了调用低层内核的语句：
1. call_tir：调用自定义或自动生成的 TensorIR 函数；
2. call_dps_library：调用外部已经写好的库函数，采用 Destination-Passing Style（DPS）给定输出 buffer。

也就是说，Relax 在图级的函数中，可以直接把若干节点替换成一次 “call_tir(…)”，对应一个底层循环级实现。后续若还想做跨算子融合或调度变更，可以再做局部更新，而不必重新从头编译。

4.2.2 部分降级（Partial Lowering）与可组合优化

由于可以在图级 IR 与算子级 IR“共存”，所以 Relax 可以分多阶段地把一部分图节点转换为 call_tir，保留另一部分依旧是图节点：

先融合一批简单的 element-wise，生成一个合并的 TensorIR；
再观察剩余算子是否还可与之融合，或者替换为外部库；
在多轮迭代后，得到最终形态的“call_tir / call_library + 符号形状注释 + 融合调度”，极大地增大了优化的灵活度。

五、动态形状带来的关键优化：融合与内存复用

本节我们在介绍完 Relax 的核心抽象后，来看两项在大模型或变形模型里尤其重要的编译优化：算子融合和内存规划。这两者如果结合“动态形状意识（symbolic shape）”来做，往往能省下大量计算与显存资源。

5.1 动态形状–感知算子融合

5.1.1 为什么要融合

深度学习中，很多小算子如果单独执行，需要反复把中间结果写回到显存再读出来，导致大量数据搬运开销。而把多层 element-wise（如 ReLU、Add、LayerNorm 的局部操作）或者某些常见操作（如 MatMul + BiasAdd + ReLU）合并为一个 kernel，可以大幅减少中间数据的 IO，提升 GPU 利用率。

5.1.2 动态场景下的形状匹配

要做融合，需要确认被融合的算子在形状上可匹配。如果二者在编译期就是完全静态如 (128,256) -> (128,256)，这很简单。但在动态形状中，要判断 (n,256) 和 (n,256) 是不是同一个 n 还是两个无关符号，就需要依赖 Relax 对符号的统一管理。如果编译器识别它们共享同一个 n，就可安全融合。否则只能分开。

比如：

# 假设前面已有 lv0: Tensor((n,256), "f32")
lv1 = relu(lv0)          # shape (n,256)
lv2 = add(lv1, 1.0)      # shape (n,256)

如果这两个算子是都在 IR 中定义为 call_tir(“relu_fn”)、call_tir(“add_fn”)，并且编译器看到二者形状都是 (n,256)，则可以把二者合并为一个新的 fused kernel：call_tir(“relu_add_fused”)。

5.1.3 生成融合后的 TensorIR

融合后，Relax 会生成一个新的 TensorIR 函数，如 fused_relu_add. 其循环伪代码可能长这样：

@tensorir_function
def fused_relu_add(X: Buffer((n,256), "f32"), Out: Buffer((n,256), "f32")):
    for i, j in grid(n, 256):
        # ReLU
        tmp = max(X[i, j], 0.0)
        # Add(1.0)
        Out[i, j] = tmp + 1.0

随后，高层 IR 会把对 relu(…) 和 add(…) 的两个调用替换成对 fused_relu_add 的一次性调用，大大减少内核启动和中间存储的消耗。对大模型而言，类似的融合技巧能显著提高吞吐率。

5.2 动态形状–感知内存复用

5.2.1 生存期与复用分析

在大模型推理或训练中，往往有很多中间张量的大小都取决于符号维度（如 n*256、(n+1)*256 等）。如果编译器能够在图级知道某些张量“不会同时被用到”，并且它们的形状大小在运行时可确认相同，就能将它们复用同一块显存 buffer。

5.2.2 如何判断大小相等

对静态形状，如 (128,256) 与 (128,256)，很简单。对动态形状，如 (n,256) 与 (n,256)：

如果确知它们的 n 是同一个符号，就表示大小相等；
如果一个是 (n+1, 4)，另一个是 (4n+4,)，编译器可以做算术简化，判断其是否总相等；
如果仍无法在编译期确定，则需要在运行时比较符号值，若相等则复用，否则分配新的空间。

5.2.3 应用于大模型 KVCache

在大语言模型里，KVCache 占用大量显存，并且在对话生成时会不断扩充 shape。如果编译器能对其“持续存在”的部分做一次性分配，然后对其他一些临时张量做复用，就可以显著降低峰值显存。对于在手机端部署大模型这种极端场景，这种编译级内存规划尤为重要。

六、实践案例：如何用 Relax 编译一个简化的 LLM 推理

本节我们通过一个“简化的 LLM 推理”案例，示例哪些算子需要动态形状，以及 Relax 如何自动完成优化。案例中并不会展示完整的大语言模型（那包含非常多层），而是强调动态部分的核心思路。

6.1 场景与算子

我们有一个“变体的 LLM Block”，包含：
1. 嵌入层（Embedding）
2. KVCache 存取更新
3. Self-Attention（可调用外部库）
4. 一些元素级操作（ReLU、LayerNorm、Add）
对于多轮生成：past_len 会从 0 开始，一步步增长，每次生成一个新 token 就将 KVCache 扩充到 (past_len+1, hidden_dim)。

在 Relax 中，形式可能是这样：

def forward_block(x: Tensor((batch, seq_len), "int32"),
                  past_kv: Tensor((batch, heads, past_len, dim_per_head), "f16")):
    # 1. Embedding => (batch, seq_len, hidden_dim)
    emb_out = call_dps_library("my_lookup_table", [x], shape=(batch, seq_len, hidden_dim))

    # 2. Self-Attention => 需要 (batch, seq_len, hidden_dim) + past_kv
    # 输出新 token 的隐状态，以及更新后的 kv
    attn_out, new_kv = call_dps_library("cutlass_attention", 
                                        [emb_out, past_kv],
                                        # 形状注释仅示例
                                        out_shape_attn=(batch, seq_len, hidden_dim),
                                        out_shape_kv=(batch, heads, past_len+seq_len, dim_per_head))

    # 3. 对 attn_out 做一些 element-wise 操作，如 ReLU
    relu_out = call_tir(my_relu, [attn_out], Tensor((batch, seq_len, hidden_dim),"f16"))
    # 4. ... 省略更多算子

    return relu_out, new_kv

核心看点在于：

“past_len+seq_len” 这样的符号表达式可以直接写到 out_shape_kv 上；
后续所有需要 KVCache 的地方，Relax 都能将其形状与上一轮调用中传回的“new_kv”对应起来；
在编译阶段，就能识别 (batch, seq_len, hidden_dim) 这类形状为一组动态符号 (b, s, d)，并与 KVCache 维度 (b, h, p, d') 建立关联。

6.2 编译过程中的优化要点

算子融合：将 element-wise 算子（如 ReLU、BiasAdd、LayerNorm）合并，减少 GPU kernel 启动；
部分外部库：像 Attention 核心可直接调用 cutlass 或 cublas gemm，拿到更优实现；
动态形状–感知内存复用：把临时结果的形状 (b, s, d) 与其他同形张量复用（不与 KVCache 复用，因为 KVCache 需要长期保留）。
最终可执行：在 runtime，每一轮生成 token 时 seq_len=1，past_len 会随轮数不断增加，但 kernel 并不退化为最通用模式，因为 “d, b 等大部分维度是已知或可做静态特化”，只在 p 维度上做循环。

6.3 实际性能与对比

据Relax 论文和社区提供的结果：

对 Llama2-7B、13B、甚至更大规模模型，在 GPU 上或 Apple M 系列上，用 Relax 做端到端编译后，可获得与手工写 kernel 或 llama.cpp 类似、甚至更优的推理速度；
在一些 GPU（如 AMD）或移动 GPU（如苹果 Metal、Adreno、Mali）上，Relax 的移植性也表现不错，往往能超越那些只针对英伟达 CUDA 优化的手工实现。

七、在移动与嵌入式设备部署

除服务器 GPU 场景外，Relax 也非常关注在手机、平板、IoT 设备等硬件上的部署。因为这些设备内存更有限，且可能需要动态形状（如可变输入分辨率、可变语音片段长度、多轮对话上下文等）：

符号形状让编译器能精确或半精确地推断各种张量大小，并且在运行时做动态适配；
内存规划在小内存环境里尤为重要，比如将中间结果在不同算子间复用，避免反复分配；
Relax 还能生成基于 OpenCL、Vulkan、Metal、或 WebGPU 的内核，满足移动 GPU / 浏览器端加速。

这样一来，端侧大模型（如在 iOS、Android 上跑 Llama2 7B）的解决方案更加可行：

对手机而言，只要在编译期对 hidden_dim 这类较大的维度做特化，然后对 batch=1、seq_len=1 场景进行融合与调度优化，再配合 4bit/8bit 量化，就能在手机上以有限速度完成对话式推理。
这对注重隐私或离线场景的应用开发来说意义重大。

八、对照与总结：Relax 与其他编译器

编译器	动态形状支持	跨层抽象	典型特点
XLA	部分支持，但限制较多	以静态图为主	专注于 TPU 上大规模训练/推理；动态形状处理不够灵活
Relay(TVM)	有 `any` 或 `-1` 标记	单向降级	传统上更偏静态形状，对动态形状支持有限
MLIR	取决于具体 Dialect	无统一跨层 IR	通用编译基础设施，需自行扩展和封装
PyTorch compile	Symbolic shape + Inductor	没有跨层共享 IR	主要在 Python 端合并算子，算子级仍依赖库或生成 IR
Relax	完整“符号形状”概念	图级 + 算子级同层	动态形状一等公民，支持可组合的降级与优化

从上表可见，Relax 的突出特征在于把“图级 IR”和“算子级 IR”统一在一个 IR 系统中，并且对动态形状的表达力很强，这使得它在应对 LLM 推理、多变输入形状、端上部署等问题时更加从容。

九、更多代码与示例

下面给出一个更细的示例，涵盖定义 TensorIR 函数、图级调用、以及如何融合的大致流程，帮助大家直观理解。

9.1 定义一个自定义 ReLU 的 TensorIR 函数

@tensorir_function
def my_relu(
    X: Buffer((n, m), "f32"),
    Y: Buffer((n, m), "f32")
):
    # 这里 (n, m) 是符号形状
    for i, j in grid(n, m):
        with block():
            # 计算块
            Y[i, j] = max(X[i, j], 0.0)

此处 my_relu 函数描述了如何在低层循环级别执行 ReLU，用 for 循环遍历 (n, m)，对每个元素做 max(0, x[i,j])。在实际生成 GPU 代码时，编译器会根据调度将这个 for-loop 分配到 GPU block/thread。

9.2 在 Relax 中图级调用

def main_fn(x: Tensor((n, 4), "f32"),
            w: Tensor((4, 8), "f32")) -> Tensor((n, 8), "f32"):
    # x shape = (n,4), w shape = (4,8)
    with dataflow():
        # 假设有一个 MatMul 的 TensorIR 函数 matmul_fn
        lv0: Tensor((n, 8), "f32") = call_tir(
            matmul_fn, 
            [x, w], 
            Tensor((n,8), "f32")   # 输出形状注释
        )
        
        # 再调用自定义 ReLU
        lv1: Tensor((n, 8), "f32") = call_tir(
            my_relu,
            [lv0],
            Tensor((n, 8), "f32")
        )
    return lv1

call_tir(matmul_fn, [x, w], ...) 表示调用我们编写/调度好的矩阵乘法内核；
产出 (n,8) 张量后，再通过 call_tir(my_relu, [lv0], ...) 调用上面定义的 ReLU 内核；
Relax 保留了对 (n,4), (4,8), (n,8) 这几个形状的符号注释，可用于后续融合或内存复用分析。

9.3 融合（Fusion）演示

如果编译器发现 matmul_fn 与 my_relu 都是 element-wise 在输出张量 (n,8) 上执行，那么就可决定合并二者：

对于极度通用的 matmul 来说，它可能并不等同于 element-wise；但若是“matmul + scale + bias + relu”之类场景，就经常可融合。这里仅举例说明融合思路；
编译器会自动生成一个 fused_matmul_relu 的 TensorIR 函数，把 matmul 的结果值在同一个 kernel 中顺便做 ReLU；
高层 IR 的 call_tir 则更新为 call_tir(fused_matmul_relu, ...)，减少一次内存读写。

在实际大模型里，会出现类似“MatMul + LayerNorm + Dropout + Add”之类序列，只要编译器判定形状与数据流吻合，就能通过动态形状符号把它们合并到一个 kernel。

十、实用价值与未来展望

10.1 应对大模型时代的需求

高效的动态形状支持：对 GPT、Llama2、CodeLlama 等，需要处理可变序列长度与 KV 缓存；Relax 能做到在保持高效特化的同时，不必“人工静态化”。
端到端性能：结合自动调度、内存复用、算子融合，系统可在 GPU、移动设备等多种硬件平台上逼近甚至超越手工编写的 kernel 水平。
可移植性：同一套编译 IR + Pass，能分别生成 CUDA/OpenCL/Metal/Vulkan 等后端代码，而对模型开发者而言，则无需重复编写底层内核。

10.2 在移动端的部署场景

推理加速：无须将所有中间张量写回 CPU，再转换到 GPU，而是直接在 GPU 上做融合 kernel；
节省内存：动态形状感知的内存规划让“臃肿的大模型”在手机上也能艰难但可行地跑通；
多分支逻辑或多模态输入：比如 NLP + CV 混合的场景，在实时 App 中可以动态切换输入大小与算子路径。

10.3 展望

Relax 还在不断演进：

有研究者在探索分布式训练的拓展，让 IR 同时处理分块（sharding）后的大模型在多机集群上训练；
更多稀疏化、量化、剪枝策略也可与 Relax IR 结合，在图级就记录稀疏模式并在 TensorIR 里利用；
伴随硬件创新（如低精度算力引擎、AI ISP 管线等），Relax 也可通过自定义算子或库来快速适配。

总之，以符号形状为核心、跨层级抽象为骨架的编译体系，将会在未来支撑更灵活、更大规模的深度学习场景。

结语

通过本教程，相信读者可以初步理解：深度学习编译器为何需要在 IR 中“显式地表达”动态形状；又为何“跨层次”统一抽象如此关键。Relax 在这两点上都做了深入设计，并结合了可组合优化（算子融合、内存规划、自动调度、外部库调用）的理念，形成了面向大规模、动态模型部署的强力编译体系。

在实际使用中，TVM 社区也为 Relax 提供了大量实例与工具，包括：

从 PyTorch/ONNX 等前端一键导入；
内部库如 cutlass、cublas、blascpu、metalLib 等的集成；
针对 LLM（GPT、Llama2 等）或图像模型（ResNet、Yolo 等）的端到端示例。

读者如果对这条技术路线感兴趣，可前往 TVM 官方文档或 Relax 社区了解最新进展。在大模型浪潮下，让我们期待 Relax 及相关编译技术，能为更多开发者带来动态、高效、可移植的深度学习部署体验。

参考与延伸阅读

T. Chen et al. “TVM: An Automated End-to-End Optimizing Compiler for Deep Learning.” OSDI 2018.
C. Lattner et al. “MLIR: Scaling Compiler Infrastructure for Domain Specific Computation.” CGO 2021.
S. Feng et al. “TensorIR: An Abstraction for Automatic Tensorized Program Optimization.” ASPLOS 2023.
L. Zheng et al. “Ansor: Generating High-Performance Tensor Programs for Deep Learning.” OSDI 2020.
J. Shao et al. “Tensor Program Optimization with Probabilistic Programs.” NeurIPS 2022.
G. Gerganov, “llama.cpp.” https://github.com/ggerganov/llama.cpp
T. Wolf et al. “Transformers: State-of-the-Art Natural Language Processing.” EMNLP 2020.

你可能感兴趣的:(人工智能,深度学习,自然语言处理,机器学习,语言模型)

FOKS-TROT: 一个高效、易用的全功能开源知识图谱生成工具柳旖岭
FOKS-TROT:一个高效、易用的全功能开源知识图谱生成工具项目简介FOKS-TROT是一个基于Python的全功能开源知识图谱生成工具，旨在帮助研究人员和开发者快速构建具有丰富信息的知识图谱。该项目由hkx3upper在GitCode上开发并维护。通过FOKS-TROT，您可以轻松地将各种数据源（如文本文件、数据库、API）转换为结构化的知识图谱，并对其进行可视化分析和机器学习任务。此外，该工
GenAI 平台，3 分钟即可构建基于 Claude、DeepSeek 的 AI Agent DO_Community 人工智能
DigitalOcean云服务在前不久发布了GenAI平台——一个让任何团队都能在几分钟内构建和部署AI代理的平台。DigitalOcean的GenAI平台持续扩展，让人工智能驱动的开发变得更加易用、灵活且强大。近日，Digitalocean宣布将Anthropic的Claude模型和DeepSeekR1引入Digitalocean的生态系统，为你提供更多构建和部署AI应用的选择。通过Anthro
智享AI直播三代系统，马斯克旗下AI人工智能直播工具,媲美DeepSeek！ V__17671155793 人工智能
智享AI直播三代系统，马斯克旗下AI人工智能直播工具,媲美DeepSeek！在科技飞速发展的当下，人工智能正以前所未有的态势重塑着各个行业的格局。直播领域，作为信息传播与商业交互的前沿阵地，也在AI技术的赋能下迎来了颠覆性的变革。其中，马斯克旗下的智享AI直播三代系统宛如一颗璀璨的新星，横空出世，以其卓越的性能和创新的理念，迅速在竞争激烈的直播市场中崭露头角，甚至被业界誉为可媲美DeepSeek的
基于python深度学习遥感影像地物分类与目标识别、分割实践技术应用 xiao5kou4chang6kai4 深度学习遥感勘测 python 深度学习分类
专题一：深度学习发展与机器学习深度学习的历史发展过程机器学习，深度学习等任务的基本处理流程梯度下降算法讲解不同初始化，学习率对梯度下降算法的实例分析从机器学习到深度学习算法专题二深度卷积网络、卷积神经网络、卷积运算的基本原理池化操作，全连接层，以及分类器的作用BP反向传播算法的理解一个简单CNN模型代码理解特征图，卷积核可视化分析专题三TensorFlow与keras介绍与入门TensorFlow
DeepSeek与ChatGPT：会取代搜索引擎和人工客服的人工智能革命云边有个稻草人热门文章 chatgpt 搜索引擎人工智能 DeepSeek
云边有个稻草人-CSDN博客在众多创新技术中，DeepSeek和ChatGPT无疑是最为引人注目的。它们通过强大的搜索和对话生成能力，能够改变我们与计算机交互的方式，帮助我们高效地获取信息，增强智能服务。本文将深入探讨这两项技术如何结合使用，为用户提供更精准、更流畅的对话和搜索体验。目录一、介绍1.1什么是DeepSeek？1.2什么是ChatGPT？1.3DeepSeek与ChatGPT的结合：
LLM与知识图谱融合:智能运维知识库构建 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 AI大模型企业级应用开发实战 AI实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
1.背景介绍随着信息技术的飞速发展，IT运维管理面临着越来越大的挑战。海量的设备、复杂的网络环境、日益增长的数据量，使得传统的运维方式难以满足需求。为了提高运维效率和质量，智能运维应运而生。智能运维的核心是将人工智能技术应用于运维领域，通过机器学习、深度学习等算法，实现自动化、智能化的运维管理。其中，大语言模型（LLM）和知识图谱是两个重要的技术方向。LLM能够理解和生成自然语言，可以用于构建智能
知识图谱的作用及其更新方式甜瓜瓜哥面试人工智能知识图谱人工智能
知识图谱的作用及其更新方式简介作用1.语义理解和推理2.信息检索3.推荐系统4.自然语言处理5.智能对话系统更新知识图谱的过程1.数据收集2.数据清洗和处理3.知识抽取4.知识融合5.验证和评估6.部署和应用总结简介知识图谱是一种以图形结构表示知识的方法，它包含了实体（如人物、地点、事物）以及它们之间的关系。知识图谱可以用于帮助计算机理解和处理自然语言，进行信息检索，进行推荐系统等多种应用。作用1
机器学习·文本数据读写处理 AAA顶置摸鱼 python 深度学习机器学习人工智能数据处理
前言在自然语言处理的第一步，需要面对的是各种各样以不同形式表现的文本数据，比如，txt、Excel中的表格数据，还有无法直接打开的pkl文件等。针对这些不同类型的数据，可以基于Python中的基本功能函数或者调用某些库进行读写以及作一些基本的处理。一、文本数据读写方法1.读写TXT文件读取方法：read()：读取整个文件，返回字符串。readline()：逐行读取，返回字符串。readlines(
Python中LLM的知识图谱构建：动态更新与推理二进制独立开发 GenAI与Python 非纯粹GenAI python 知识图谱开发语言自然语言处理人工智能分布式机器学习
文章目录引言1.知识图谱的基本概念1.1知识图谱的定义1.2知识图谱的构建流程2.利用LLM进行知识抽取2.1实体识别2.2关系抽取2.3属性抽取3.知识融合3.1实体对齐3.2冲突消解4.知识存储5.知识推理5.1规则推理5.2基于LLM的推理6.动态更新6.1增量更新6.2实时更新7.结论引言随着人工智能技术的飞速发展，知识图谱（KnowledgeGraph,KG）作为一种结构化的知识表示方法
AI编剧系统深度解析：从算法架构到影视工业化应用实战 Coderabo DeepSeek R1模型企业级应用人工智能算法
媒体娱乐行业革命：AI编剧创意辅助系统架构解析与实战应用一、行业背景与技术架构在流媒体内容需求激增的当下，传统编剧模式面临产能瓶颈。AI编剧创意辅助系统通过自然语言处理（NLP）、生成对抗网络（GAN）和知识图谱技术，构建了包含剧本生成、情节优化、角色塑造等模块的智能创作平台。核心架构分为：知识图谱层：整合影视剧本数据库（IMSDb）、维基百科等结构化数据NLP处理层：基于Transformer的
无需配置！深脑云一键启用DeepSeek全系AI模型小深ai硬件分享人工智能深度学习服务器
解锁无限算力潜能，开启DeepSeek镜像云算力新征程！在人工智能风起云涌的时代，算力就是驱动创新的引擎，而优质的模型镜像则是引领变革的密钥。我们向您介绍一下我们的深脑云算力平台，这里汇聚了DeepSeek的各大版本镜像，为您的科研、开发与创新之路注入强大动力！强大的DeepSeek模型家族DeepSeek，作为AI领域的璀璨明星，以其卓越的性能和先进的技术架构闻名遐迩。我们的平台精心整合了Dee
AI服务器散热黑科技：让芯片“冷静”提速小深ai硬件分享人工智能深度学习服务器
AI服务器为何需要散热黑科技在人工智能飞速发展的当下，AI服务器作为核心支撑，作用重大。从互联网智能推荐，到医疗疾病诊断辅助，从金融风险预测，到教育个性化学习，AI服务器广泛应用，为各类复杂人工智能应用提供强大算力。然而，AI服务器在运行时面临着严峻的散热挑战。随着人工智能技术的不断发展，对AI服务器的计算能力要求越来越高，这使得服务器的功率密度急剧增加。以GPT-4的训练为例，它需要大量的GPU
深度应用场景：DeepSeek —— 探索AI赋能的智慧未来人工智能专属驿站人工智能
深度应用场景：DeepSeek——探索AI赋能的智慧未来随着人工智能的迅猛发展，数据的价值已不再局限于简单的存储与处理，它们正变得更加智能与高效。DeepSeek，这一创新的AI技术平台，正以其独特的深度学习能力，开启了各行各业的智能化变革。让我们走进一个由DeepSeek打造的深度应用场景，探索它如何推动未来的发展。1.智能医疗：精准诊断，拯救生命想象一下，医生们不再是唯一的诊断专家，而是与AI
卷积神经网络之AlexNet经典神经网络，实现手写数字0~9识别知识鱼丸深度学习神经网络 cnn 人工智能深度学习 AlexNet 经典神经网络
深度学习中较为常见的神经网络模型AlexNet，AlexNet是一个采用GPU训练的深层CNN，本质是种LeNet变体。由特征提取层的5个卷积层两个下采样层和分类器中的三个全连接层构成。先看原理：AlexNet网络特点采用ReLU激活函数，使训练速度提升6倍采用dropout层，防止模型过拟合通过平移和翻转的方式对数据进行增强采用LRN局部响应归一化，限制数据大小，防止梯度消失和爆炸。但后续证明批
在 DeepSeek 驱动的编程变革中抓住机遇并脱颖而出智想天开 AI技术人工智能 deep learning
公众号地址:在DeepSeek驱动的编程变革中抓住机遇并脱颖而出更多内容请关注公众号：智想天开前言在DeepSeek引领的新一轮AI技术革新中，程序员们正面临着前所未有的挑战。随着DeepSeek等人工智能工具的迅猛发展，编程领域正在发生深刻变革。这些先进的工具不仅能够自动化完成繁重的代码生成和调试任务，还能够根据大量数据提供优化建议，改变了传统编程的工作流程。虽然这些技术为提高工作效率和解放开发
项目管理新趋势！2024年，Jira与Codes你更倾向谁？ Codes_AndyLiu jira teambition redmine 项目管理软件项目管理工具项目管理 jira 国产平替
一、项目管理软件新趋势概述2024年，项目管理软件呈现出诸多新趋势，这些趋势对于项目管理的重要性日益凸显。在数字化转型方面，项目管理软件成为企业实现数字化转型的关键工具。让老板感知数据，让中层管理者感受先进，让基层员工感到舒心.人工智能与自动化在项目管理软件中的应用也越来越广泛。项目管理软件正朝着智能化、自动化的方向迈进，利用AI技术提供个性化和场景化解决方案。例如，工作周报AI化，自动化测试，代
【人工智能】提升编程效率的6种GPT实用应用技巧！保姆级讲解！ ChatGPT-千鑫人工智能 AI领域人工智能 gpt AI编程
文章目录实用教程：六大AI编程技巧解锁效率提升技巧1：快速实现需求demo操作步骤技巧2：代码审查——AI帮你提升代码质量操作步骤技巧3：错误排查——AI助你快速定位问题操作步骤技巧4：代码注释——AI帮你理解复杂逻辑操作步骤技巧5：数据整理——AI帮你高效准备测试数据操作步骤技巧6：学习未知代码库——AI助你快速掌握新工具操作步骤使用教程：全面掌握CodeMoss的高效编程工具（1）VSCode
利用人工智能增强可读性：自动为文本添加标点符号姚家湾 AI 标点符号
在数字通信时代，文本的清晰度和可读性至关重要。无论是转录口语、处理原始文本数据还是改进用户生成的内容，标点符号在传达预期信息方面都起着至关重要的作用。但是，手动编辑文本以添加标点符号可能非常耗时且容易出错。这就是人工智能(AI)发挥作用的地方，它提供了一种强大的解决方案，可以自动将标点符号插入句子中。目前，利用大模型的能力，完全可以胜任添加标点符号的工作，不需要其它特别的处理程序。参考代码from
用 TensorFlow 搭建简单的手写数字识别模型 lozhyf 工作面试学习 tensorflow 人工智能 python
一、引言手写数字识别是机器学习领域中一个经典且基础的问题，它在很多实际场景中都有广泛的应用，比如邮政系统中的邮件分拣、银行支票金额识别等。TensorFlow是一个强大的开源机器学习框架，由Google开发并维护，它提供了丰富的工具和接口，能帮助我们快速搭建和训练深度学习模型。在这篇博客中，我们将使用TensorFlow构建一个简单的神经网络模型，用于识别手写数字。二、环境准备在开始之前，你需要安
深度学习在医疗影像分析中的革命性应用 Echo_Wish 人工智能前沿技术深度学习人工智能
深度学习在医疗影像分析中的革命性应用引言医疗影像分析是现代医学中不可或缺的一部分，特别是在疾病诊断和治疗过程中发挥了至关重要的作用。随着深度学习技术的发展，医疗影像分析的效率和准确性得到了显著提升。本文将探讨如何利用深度学习技术，特别是Python编程语言，来优化医疗影像分析，展示具体的代码实例，并举例说明其实际应用效果。深度学习与医疗影像分析深度学习（DeepLearning）是一种基于人工神经
yolov8人脸识别与脸部关键点检测（代码+原理） QQ_1309399183 计算机视觉实战项目集锦 YOLO 人工智能人脸识别 yolo人脸检测
YOLOv8脸部识别是一个基于YOLOv8算法的人脸检测项目，旨在实现快速、准确地检测图像和视频中的人脸。该项目是对YOLOv8算法的扩展和优化，专门用于人脸检测任务。YOLOv8是一种基于深度学习的目标检测算法，通过将目标检测问题转化为一个回归问题，可以实现实时的目标检测。YOLOv8Face项目在YOLOv8的基础上进行了改进，使其更加适用于人脸检测。以下是YOLOv8Face项目的一些特点和
【机器学习】基于3D CNN通过CT图像分类预测肺炎 MUKAMO AI Python应用机器学习深度学习人工智能神经网络 3D CNN
1.引言1.1.研究背景在医学诊断中，医生通过分析CT影像来预测疾病时，面临一些挑战和局限性：图像信息的广度与复杂性：CT扫描生成的大量图像对医生来说既是信息的宝库也是处理上的负担。每组CT数据可能包含数百张切片，医生必须迅速审阅这些图像，以便捕捉到病变的微小细节。这种庞大的信息量要求医生在有限的时间内做出精准诊断，但同时也增加了漏诊或误诊的风险。部分容积效应也可能模糊小病变的边界，使得准确诊断变
基于Python的搜索引擎的设计与实现 AI大模型应用之禅 DeepSeek R1 &AI大模型与大数据 java python javascript kotlin golang 架构人工智能
搜索引擎,Python,爬虫,自然语言处理,信息检索,索引,算法,数据库1.背景介绍在信息爆炸的时代，海量数据无处不在，高效地获取所需信息变得至关重要。搜索引擎作为信息获取的桥梁，扮演着不可或缺的角色。传统的搜索引擎往往依赖于庞大的服务器集群和复杂的算法，对资源消耗较大，且难以满足个性化搜索需求。基于Python的搜索引擎设计，则凭借Python语言的易学易用、丰富的第三方库和强大的社区支持，为开
TensorFlow LiteRT 概览姚家湾 tensorflow 人工智能 python
LiteRT（简称LiteRuntime，以前称为TensorFlowLite）是Google面向设备端AI的高性能运行时。您可以找到适用于各种机器学习/AI任务的LiteRT就绪模型，也可以使用AIEdge转换和优化工具将TensorFlow、PyTorch和JAX模型转换为TFLite格式并运行。主要特性针对设备端机器学习进行了优化：LiteRT解决了五项关键的ODML约束条件：延迟时间（无需
机器学习（1）安装Pytorch CoderIsArt 机器学习与深度学习机器学习 pytorch 人工智能
1.安装命令pip3installtorchtorchvisiontorchaudio--index-urlhttps://download.pytorch.org/whl/cu1182.安装过程Log：Lookinginindexes:https://download.pytorch.org/whl/cu118CollectingtorchDownloadinghttps://download.
《从编程小白到人工智能大神：大学新生Python入门攻略》千帆过尽. python 人工智能
前言在如今这个技术飞速发展的时代，编程已经成为许多大学生不可或缺的技能，尤其是对于人工智能方向的学生来说，编程更是必不可少的一部分。作为一名大三学生，并且专注于Python和人工智能方向，我深知刚开始学习编程时的挑战与迷茫。希望本文能帮助作为大学新生的你们在编程入门的过程中少走弯路，提供一条清晰有效的学习路径。一、编程语言选择作为编程新手，选择一门适合自己的编程语言至关重要。对于希望进入人工智能领
【拥抱AI】如何实现AI外呼通话，并与客户达成确认奔跑草- 人工智能人工智能
实现AI外呼通话并与客户达成确认涉及多个技术组件和步骤。以下是一个基本的流程和技术方案，仅供参考。1.技术选型与准备主要技术组件语音识别（ASR）：将客户的语音转换为文本。自然语言处理（NLP）：理解和生成自然语言对话。语音合成（TTS）：将文本转换为客户可以听到的语音。呼叫平台/API：用于发起和管理电话呼叫。数据库：存储客户信息、通话记录等数据。业务逻辑层：处理对话管理和决策逻辑。2.系统架构
探索Vearch：高效的深度学习向量相似度搜索系统 scaFHIO 深度学习人工智能 python
Vearch是一个可扩展的分布式系统，用于高效搜索深度学习向量的相似度。在本文中，我们将介绍Vearch的技术背景及其核心原理，演示如何使用VearchPythonSDK进行安装和设置，并分析一些实际应用场景，最后提供一些实战建议。技术背景介绍随着深度学习技术的发展，向量相似度搜索在各类应用中变得越来越重要。从图像识别、推荐系统到自然语言处理，向量搜索可以极大地提升系统的性能。然而，随着数据量的增
27岁大龄转码秋招惨败，朋友劝我转Java来得及吗？还是继续走前端或机器学习？程序员yt java 机器学习开发语言
今天给大家分享的是一位粉丝的提问，27岁大龄转码秋招惨败，朋友劝我转Java来得及吗？还是继续走前端或机器学习？接下来把粉丝的具体提问和我的回复分享给大家，希望也能给一些类似情况的小伙伴一些启发和帮助。同学提问：211建筑本科，22年毕业后gap一年转码去了英国读的QS100的it的水硕（24年12月份毕业），转码后对就业形势认知不足，时间全花在课业上，八股文和算法准备的不充足，秋招算是惨败。读研
华为的云端训练算力与迭代效率 AI大模型应用之禅 DeepSeek R1 &AI大模型与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
华为云、云端训练、算力、迭代效率、人工智能、深度学习、模型训练、分布式训练、优化算法1.背景介绍人工智能（AI）技术近年来发展迅速，深度学习作为其核心驱动力，在图像识别、自然语言处理、语音识别等领域取得了突破性进展。然而，深度学习模型的训练需要海量数据和强大的计算资源，这成为AI技术发展面临的瓶颈之一。云计算作为一种新型的计算模式，为深度学习提供了强大的算力支持。华为云作为国内领先的云计算平台，在
ViewController添加button按钮解析。（翻译）张亚雄 c
<div class="it610-blog-content-contain" style="font-size: 14px"></div>// ViewController.m // Reservation software // // Created by 张亚雄 on 15/6/2.
mongoDB 简单的增删改查开窍的石头 mongodb
在上一篇文章中我们已经讲了mongodb怎么安装和数据库/表的创建。在这里我们讲mongoDB的数据库操作在mongo中对于不存在的表当你用db.表名他会自动统计下边用到的user是表明，db代表的是数据库添加(insert):
log4j配置 0624chenhong log4j
1) 新建java项目 2) 导入jar包，项目右击，properties—java build path—libraries—Add External jar，加入log4j.jar包。 3) 新建一个类com.hand.Log4jTest package com.hand; import org.apache.log4j.Logger; public class
多点触摸(图片缩放为例) 不懂事的小屁孩多点触摸
多点触摸的事件跟单点是大同小异的，上个图片缩放的代码，供大家参考一下 import android.app.Activity; import android.os.Bundle; import android.view.MotionEvent; import android.view.View; import android.view.View.OnTouchListener
有关浏览器窗口宽度高度几个值的解析换个号韩国红果果 JavaScript html
1 元素的 offsetWidth 包括border padding content 整体的宽度。 clientWidth 只包括内容区 padding 不包括border。 clientLeft = offsetWidth -clientWidth 即这个元素border的值 offsetLeft 若无已定位的包裹元素
数据库产品巡礼：IBM DB2概览蓝儿唯美 db2
IBM DB2是一个支持了NoSQL功能的关系数据库管理系统，其包含了对XML，图像存储和Java脚本对象表示（JSON）的支持。DB2可被各种类型的企业使用，它提供了一个数据平台，同时支持事务和分析操作，通过提供持续的数据流来保持事务工作流和分析操作的高效性。 DB2支持的操作系统 DB2可应用于以下三个主要的平台: 工作站，DB2可在Linus、Unix、Windo
java笔记5 a-john java
控制执行流程： 1，true和false 利用条件表达式的真或假来决定执行路径。例：（a==b）。它利用条件操作符“==”来判断a值是否等于b值，返回true或false。java不允许我们将一个数字作为布尔值使用，虽然这在C和C++里是允许的。如果想在布尔测试中使用一个非布尔值，那么首先必须用一个条件表达式将其转化成布尔值，例如if(a!=0)。 2，if-els
Web开发常用手册汇总 aijuans PHP
一门技术，如果没有好的参考手册指导,很难普及大众。这其实就是为什么很多技术，非常好，却得不到普遍运用的原因。正如我们学习一门技术，过程大概是这个样子： ①我们日常工作中，遇到了问题，困难。寻找解决方案，即寻找新的技术； ②为什么要学习这门技术？这门技术是不是很好的解决了我们遇到的难题，困惑。这个问题，非常重要，我们不是为了学习技术而学习技术，而是为了更好的处理我们遇到的问题，才需要学习新的
今天帮助人解决的一个sql问题 asialee sql
今天有个人问了一个问题，如下： type AD value A
意图对象传递数据百合不是茶 android 意图Intent Bundle对象数据的传递
学习意图将数据传递给目标活动; 初学者需要好好研究的 1,将下面的代码添加到main.xml中 <?xml version="1.0" encoding="utf-8"?> <LinearLayout xmlns:android="http:/
oracle查询锁表解锁语句 bijian1013 oracle object session kill
一.查询锁定的表如下语句，都可以查询锁定的表语句一： select a.sid, a.serial#, p.spid, c.object_name, b.session_id, b.oracle_username, b.os_user_name from v$process p, v$s
mac osx 10.10 下安装 mysql 5.6 二进制文件［tar.gz］征客丶 mysql osx
场景：在 mac osx 10.10 下安装 mysql 5.6 的二进制文件。环境：mac osx 10.10、mysql 5.6 的二进制文件步骤：[所有目录请从根“/”目录开始取，以免层级弄错导致找不到目录] 1、下载 mysql 5.6 的二进制文件，下载目录下面称之为 mysql5.6SourceDir；下载地址：http://dev.mysql.com/downl
分布式系统与框架 bit1129 分布式
RPC框架 Dubbo 什么是Dubbo Dubbo是一个分布式服务框架，致力于提供高性能和透明化的RPC远程服务调用方案，以及SOA服务治理方案。其核心部分包含: 远程通讯: 提供对多种基于长连接的NIO框架抽象封装，包括多种线程模型，序列化，以及“请求-响应”模式的信息交换方式。集群容错: 提供基于接
那些令人蛋痛的专业术语白糖_ spring Web SSO IOC
spring 【控制反转(IOC)/依赖注入(DI)】：由容器控制程序之间的关系，而非传统实现中，由程序代码直接操控。这也就是所谓“控制反转”的概念所在：控制权由应用代码中转到了外部容器，控制权的转移，是所谓反转。简单的说：对象的创建又容器(比如spring容器)来执行，程序里不直接new对象。 Web 【单点登录(SSO)】：SSO的定义是在多个应用系统中，用户
《给大忙人看的java8》摘抄 braveCS java8
函数式接口：只包含一个抽象方法的接口 lambda表达式：是一段可以传递的代码你最好将一个lambda表达式想象成一个函数，而不是一个对象，并记住它可以被转换为一个函数式接口。事实上，函数式接口的转换是你在Java中使用lambda表达式能做的唯一一件事。方法引用：又是要传递给其他代码的操作已经有实现的方法了，这时可以使
编程之美-计算字符串的相似度 bylijinnan java 算法编程之美
public class StringDistance { /** * 编程之美计算字符串的相似度 * 我们定义一套操作方法来把两个不相同的字符串变得相同，具体的操作方法为： * 1.修改一个字符（如把“a”替换为“b”）; * 2.增加一个字符（如把“abdd”变为“aebdd”）; * 3.删除一个字符（如把“travelling”变为“trav
上传、下载压缩图片 chengxuyuancsdn 下载
/** * * @param uploadImage --本地路径(tomacat路径) * @param serverDir --服务器路径 * @param imageType --文件或图片类型 * 此方法可以上传文件或图片.txt,.jpg,.gif等 */ public void upload(String uploadImage,Str
bellman-ford(贝尔曼-福特)算法 comsci 算法 F#
Bellman-Ford算法(根据发明者 Richard Bellman 和 Lester Ford 命名)是求解单源最短路径问题的一种算法。单源点的最短路径问题是指：给定一个加权有向图G和源点s，对于图G中的任意一点v，求从s到v的最短路径。有时候这种算法也被称为 Moore-Bellman-Ford 算法，因为 Edward F. Moore zu 也为这个算法的发展做出了贡献。与迪科
oracle ASM中ASM_POWER_LIMIT参数 daizj ASM oracle ASM_POWER_LIMIT 磁盘平衡
ASM_POWER_LIMIT 该初始化参数用于指定ASM例程平衡磁盘所用的最大权值，其数值范围为0~11，默认值为1。该初始化参数是动态参数，可以使用ALTER SESSION或ALTER SYSTEM命令进行修改。示例如下： SQL>ALTER SESSION SET Asm_power_limit=2;
高级排序:快速排序 dieslrae 快速排序
public void quickSort(int[] array){ this.quickSort(array, 0, array.length - 1); } public void quickSort(int[] array,int left,int right){ if(right - left <= 0
C语言学习六指针_何谓变量的地址一个指针变量到底占几个字节 dcj3sjt126com C语言
# include <stdio.h> int main(void) { /* 1、一个变量的地址只用第一个字节表示 2、虽然他只使用了第一个字节表示，但是他本身指针变量类型就可以确定出他指向的指针变量占几个字节了 3、他都只存了第一个字节地址，为什么只需要存一个字节的地址，却占了4个字节，虽然只有一个字节，但是这些字节比较多，所以编号就比较大，
phpize使用方法 dcj3sjt126com PHP
phpize是用来扩展php扩展模块的，通过phpize可以建立php的外挂模块,下面介绍一个它的使用方法,需要的朋友可以参考下安装（fastcgi模式）的时候，常常有这样一句命令：代码如下: /usr/local/webserver/php/bin/phpize 一、phpize是干嘛的？ phpize是什么？ phpize是用来扩展php扩展模块的，通过phpi
Java虚拟机学习 - 对象引用强度 shuizhaosi888 JAVA虚拟机
本文原文链接：http://blog.csdn.net/java2000_wl/article/details/8090276 转载请注明出处！无论是通过计数算法判断对象的引用数量，还是通过根搜索算法判断对象引用链是否可达，判定对象是否存活都与“引用”相关。引用主要分为：强引用(Strong Reference)、软引用(Soft Reference)、弱引用(Wea
.NET Framework 3.5 Service Pack 1（完整软件包）下载地址 happyqing .net 下载 framework
Microsoft .NET Framework 3.5 Service Pack 1（完整软件包） http://www.microsoft.com/zh-cn/download/details.aspx?id=25150 Microsoft .NET Framework 3.5 Service Pack 1 是一个累积更新，包含很多基于 .NET Framewo
JAVA定时器的使用 jingjing0907 java timer 线程定时器
1、在应用开发中，经常需要一些周期性的操作，比如每5分钟执行某一操作等。对于这样的操作最方便、高效的实现方式就是使用java.util.Timer工具类。 privatejava.util.Timer timer; timer = newTimer(true); timer.schedule( newjava.util.TimerTask() { public void run()
Webbench 流浪鱼 webbench
首页下载地址 http://home.tiscali.cz/~cz210552/webbench.html Webbench是知名的网站压力测试工具，它是由Lionbridge公司（http://www.lionbridge.com）开发。 Webbench能测试处在相同硬件上，不同服务的性能以及不同硬件上同一个服务的运行状况。webbench的标准测试可以向我们展示服务器的两项内容：每秒钟相
第11章动画效果（中） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
windows下制作bat启动脚本. sanyecao2314 java cmd 脚本 bat
java -classpath C:\dwjj\commons-dbcp.jar;C:\dwjj\commons-pool.jar;C:\dwjj\log4j-1.2.16.jar;C:\dwjj\poi-3.9-20121203.jar;C:\dwjj\sqljdbc4.jar;C:\dwjj\voucherimp.jar com.citsamex.core.startup.MainStart
Java进行RSA加解密的例子 tomcat_oracle java
加密是保证数据安全的手段之一。加密是将纯文本数据转换为难以理解的密文；解密是将密文转换回纯文本。　　数据的加解密属于密码学的范畴。通常，加密和解密都需要使用一些秘密信息，这些秘密信息叫做密钥，将纯文本转为密文或者转回的时候都要用到这些密钥。　　对称加密指的是发送者和接收者共用同一个密钥的加解密方法。　　非对称加密(又称公钥加密)指的是需要一个私有密钥一个公开密钥，两个不同的密钥的
Android_ViewStub 阿尔萨斯 ViewStub
public final class ViewStub extends View java.lang.Object android.view.View android.view.ViewStub 类摘要： ViewStub 是一个隐藏的，不占用内存空间的视图对象，它可以在运行时延迟加载布局资源文件。当 ViewSt