MMLU 88.5分的海螺minimax-01能平替DeepSeek?程序员:建议再看看

一、背景

近期,国产海螺大模型minimax-text-01在AI领域引发广泛关注。这款模型在Core Academic Benchmarks上表现亮眼,多项指标名列前茅,甚至被一些自媒体誉为DeepSeek的平替选择。然而,模型的实际应用效果是否与学术评测相符?让我们一起深入探讨。
MMLU 88.5分的海螺minimax-01能平替DeepSeek?程序员:建议再看看_第1张图片

二、minimax-text-01简介

minimax-text-01是一个具有4560亿参数量的大规模语言模型,每个token会激活459亿参数。从技术架构来看,该模型采用了混合注意力机制,结合了Lightning Attention、Softmax Attention和混合专家系统(MoE)。

其主要技术特点包括:

  • 采用80层网络架构
  • 64个注意力头,每个头维度为128
  • 32个专家模型组成的MoE系统
  • 支持高达400万token的推理上下文长度
  • 词表大小达200,064

在学术基准测试中,minimax-text-01展现出了令人瞩目的性能。例如在MMLU测试中达到88.5分,与顶级模型如Claude 3.5 Sonnet(88.3分)和DeepSeek V3(88.5分)处于同一水平。在C-SimpleQA任务中更是取得了67.4分的最佳成绩。

你可能感兴趣的:(LLM,人工智能,评测)