代码模型 CodeGeeX2-6B 开源,最低6GB显存,性能优于StarCoder

点击蓝字

代码模型 CodeGeeX2-6B 开源,最低6GB显存,性能优于StarCoder_第1张图片

关注我们

AI TIME欢迎每一位AI爱好者的加入!

以下内容来源于GLM大模型

我们希望每一位程序员,都能在自己机器上跑上一个自己的编程助手。

代码模型 CodeGeeX2-6B 开源,最低6GB显存,性能优于StarCoder_第2张图片

为实现这一目标,我们现将「代码生成模型 CodeGeeX2-6B」开源。同时我们也将对该模型持续进行迭代升级,以提供更加强大的代码辅助能力。

CodeGeeX2 是多语言代码生成模型 CodeGeeX 的第二代模型,基于 ChatGLM2 架构注入代码实现。

得益于 ChatGLM2 的更优性能,CodeGeeX2-6B 在多项指标上取得了较大的性能提升。与 150 亿参数的 StarCoder-15B 相比,CodeGeeX2-6B 凭借 60 亿参数便具备了近 10% 的优势。

更多特性包括:

更强大的代码能力:基于 ChatGLM2-6B 基座语言模型,CodeGeeX2-6B 进一步经过了 600B 代码数据预训练,相比一代模型,在代码能力上全面提升,HumanEval-X 评测集的六种编程语言均大幅提升 (Python +57%, C++ +71%, Java +54%, JavaScript +83%, Go +56%, Rust +321%),在Python上达到 35.9% 的 Pass@1 一次通过率,超越规模更大的 StarCoder-15B。

更优秀的模型特性:继承 ChatGLM2-6B 模型特性,CodeGeeX2-6B 更好支持中英文输入,支持最大 8192 序列长度,推理速度较一代 CodeGeeX-13B 大幅提升,量化后仅需6GB显存即可运行,支持轻量级本地化部署。

更全面的AI编程助手:CodeGeeX插件(VS Code, Jetbrains)后端升级,支持超过100种编程语言,新增上下文补全、跨文件补全等实用功能。结合 Ask CodeGeeX 交互式AI编程助手,支持中英文对话解决各种编程问题,包括且不限于代码解释、代码翻译、代码纠错、文档生成等,帮助程序员更高效开发。

更开放的协议:CodeGeeX2-6B 权重对学术研究完全开放。

代码能力评测

CodeGeeX2 作为一个多语言代码生成基座模型,代码能力较上一代大幅提升,以下是在 HumanEval,HumanEval-X, DS1000 基准上的评测结果(评价指标 Pass@k 定义与论文中一致):

代码模型 CodeGeeX2-6B 开源,最低6GB显存,性能优于StarCoder_第3张图片

代码模型 CodeGeeX2-6B 开源,最低6GB显存,性能优于StarCoder_第4张图片

代码模型 CodeGeeX2-6B 开源,最低6GB显存,性能优于StarCoder_第5张图片

量化推理性能

CodeGeeX2 与上一代相比,对部署更加友好。得益于使用 Multi-Query Attention 和 Flash Attention,推理速度更快,且量化后仅需6GB显存即可运行:

量化

代码模型 CodeGeeX2-6B 开源,最低6GB显存,性能优于StarCoder_第6张图片

推理

代码模型 CodeGeeX2-6B 开源,最低6GB显存,性能优于StarCoder_第7张图片

CodeGeeX2-6B的安装请参考官方:

https://github.com/THUDM/CodeGeeX2

 关于AI TIME 

AI TIME源起于2019年,旨在发扬科学思辨精神,邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索,加强思想碰撞,链接全球AI学者、行业专家和爱好者,希望以辩论的形式,探讨人工智能和人类未来之间的矛盾,探索人工智能领域的未来。

迄今为止,AI TIME已经邀请了1100多位海内外讲者,举办了逾550场活动,超600万人次观看。

代码模型 CodeGeeX2-6B 开源,最低6GB显存,性能优于StarCoder_第8张图片

我知道你

在看

~

b71b29fc8a1fa89811e5a43af347d1eb.gif

点击 阅读原文 直达CodeGeex2!

你可能感兴趣的:(代码模型 CodeGeeX2-6B 开源,最低6GB显存,性能优于StarCoder)