C-Eval

Windows零门槛部署DeepSeek大模型：Ollama+7B参数模型本地推理全攻略

1.1DeepSeek模型的三大核心优势中文语境霸主：在C-Eval榜单中，7B参数版本以82.3%准确率超越Llama2-13B6硬件友好：Int4量化后仅需5.2GB存储空间，GTX1060即可运行多模态扩展

zxg45·2025-03-07 09:33

LLM系列(4)：通义千问7B在Swift/DeepSpeed上微调秘诀与实战陷阱避坑指南

在诸多权威大模型能力测评基准上，如MMLU、C-Eval、GSM8K、HumanEval、WMT22，通义千问7B均取得了同参数级别开源模型中的最好表现，

汀、人工智能·2024-09-12 00:21

LLM_Home_Work_Day6

基础作业使用OpenCompass评测InternLM2-Chat-7B模型在C-Eval数据集上的性能

Rigel9527·2024-02-07 12:59

大模型学习与实践笔记（十四）

使用OpenCompass评测InternLM2-Chat-7B模型使用LMDeploy0.2.0部署后在C-Eval数据集上的性能步骤1：下载internLM2-Chat-7B模型,并进行挂载以下命令将

AllYoung_362·2024-01-30 00:05

【OpenCompass 大模型评测】学习笔记

参考学习教程【大模型评测教程】理论作业使用OpenCompass评测InternLM2-Chat-7B模型在C-Eval数据集上的性能

尘汐筠竹·2024-01-29 05:15

【书生·浦语】大模型实战营——第六次作业

使用OpenCompass评测InterLM2-chat-chat-7B模型在C-Eval数据集上的性能环境配置1.创建虚拟环境condacreate--nameopencompass--clone=/

不想动脑筋的亮亮·2024-01-23 11:39

大模型学习第六课作业

使用OpenCompass评测InternLM2-Chat-7B模型在C-Eval数据集上的性能

敲键盘的喵桑·2024-01-22 02:09

阿里开源大模型 Qwen-72B 私有化部署

Qwen模型在一系列基准数据集（例如MMLU、C-Eval、GSM8K、MATH、HumanEval、MBPP、等）上优于类似模型大小的基线模型，这些数据集评估了模

机器学习社区·2023-12-31 00:35

Llama中文社区开源预训练Atom-7B-chat大模型体验与本地化部署实测(基于CPU，适配无GPU的场景)

一、模型简介原子大模型Atom由Llama中文社区和原子回声联合打造，在中文大模型评测榜单C-Eval中位居前十（8月21日评测提交时间）。

weixin_48087464·2023-12-18 03:36

简单测试大语言模型 Yi-34B 的中日英能力

简单测试大语言模型Yi-34B的中日英能力0.背景1.中文测试2.日文测试3.英文测试0.背景简单测试一下C-Eval排行榜第一（20231129时点）的Yi-34B的中日英能力，1.中文测试问题1，回答正确

engchina·2023-12-02 11:49

解题准确率较GPT高出70% 夸克大模型多项考试评测成绩领先行

数据显示，夸克千亿级参数大模型登顶C-Eval和CMMLU两大权威榜单，夸克百亿级参数大模型同样在法律、医疗、问答等领域的性能评测中夺冠。

QbitAl·2023-11-27 09:41

依托数据、平台、知识增强等优势夸克大模型大幅降低问答幻觉率

数据显示，夸克千亿级参数大模型登顶C-Eval和CMMLU两大权威榜单，夸克百亿级参数大模型同样在法律、医疗、问答等领域的性能评测中夺冠。

CSDN云计算·2023-11-25 14:24

【GPT】中文大语言模型梳理与测评（C-Eval 、AGIEval、MMLU、SuperCLUE）

文章目录概述申请后直接使用大模型开源可本地部署通识数据集测评（C-Eval、AGIEval、MMLU、SuperCLUE）自媒体报道SuperCLUE：中文通用大模型综合性基准C-Eval：中英测评（清华上交提出

曾小蛙·2023-10-24 15:18

ChatGLM2发布，位居C-Eval榜首!

显存占用情况数理逻辑推理性能显存占用的减少量化对模型性能的影响基于P-Tuningv2的微调（官方）环境配置微调数据准备微调ChatGLM自2023年3月发布以来，就已经爆火，如今6月25日，清华二代发布（ChatGLM2），位居C-Eval

dzysunshine·2023-10-07 03:34

ARM申请在纳斯达克上市；钉钉推出AI PaaS平台；奇安信研发类AI大模型丨每日大事件...

‍大数据产业创新服务媒体——聚焦数据·改变商业企业动态云从科技：正式发布从容大模型1.5版本日前，云从科技发布从容大模型1.5版本，该版本包含十亿级、百亿级、千亿级多种模型规格，实测性能在全球大模型综合性考试评测（C-Eval

数据猿·2023-08-23 12:28

chatglm2-6b模型在9n-triton中部署并集成至langchain实践 | 京东云技术团队

一.前言近期，ChatGLM-6B的第二代版本ChatGLM2-6B已经正式发布，引入了如下新特性：①.基座模型升级，性能更强大，在中文C-Eval榜单中，以51.7分位列第6；②.支持8K-32k的上下文

京东云技术团队·2023-08-16 20:29

baichuan-7B: 开源可商用支持中英文的最好大模型

在标准的中文和英文权威benchmark（C-EVAL/MMLU）上均取得了同参数规模下的最好效果。baichuan-7B的优点在同尺寸模型中baichuan-7B达到了目前SOTA的水平。ba

·2023-08-16 19:48

chatglm2-6b模型在9n-triton中部署并集成至langchain实践 | 京东云技术团队

一.前言近期，ChatGLM-6B的第二代版本ChatGLM2-6B已经正式发布，引入了如下新特性：①.基座模型升级，性能更强大，在中文C-Eval榜单中，以51.7分位列第6；②.支持8K-32k的上下文

·2023-08-16 11:50

ChatGLM2-12B 效果怎么样？官方公布

这些数据集包括MMLU(英文)、C-Eval(中文)、GSM8K(数学)和BBH(英文)等。ChatGLM2-12B模型在这些数据集上取得了不错的成绩

AITIME论道·2023-08-10 08:20

华为鸿蒙HarmonyOS 4定档8月；ChatGPT之父的加密货币正式上线；微软必应聊天将推出重新生成答案功能|极客头条

腾讯、抖音、淘天将调整职级体系，适应新周期华为鸿蒙HarmonyOS4定档8月微信手机号可一键登录QQ安卓版C-Eval中文大模型权威排名公布继日本之后，拼多多Temu正式上线韩国ChatGPT之父

极客日报·2023-07-25 09:13

悟道·天鹰Aquila大模型更新权重，支持在 Hugging Face 平台使用！

智源社区·2023-07-22 13:05

ChatGLM-6B第二代模型开源，拿下LLM模型中文能力评估榜单第一名

在主要评估LLM模型中文能力的C-Eval榜单中，截至6月25日ChatGLM2模型以71.1的分数位居Rank0，ChatGLM2-6B模型以51.7的分数位居Ran

·2023-07-13 15:54

baichuan-7B: 开源可商用支持中英文的最好大模型

在标准的中文和英文权威benchmark（C-EVAL/MMLU）上均取得了同参数规模下的最好效果。baichuan-7B的优点在同尺寸模型中baichuan-7B达到了目前SOTA的水平。ba

coding进阶·2023-06-20 03:05

百川智能发布开源中英文大模型；GitHub调查显示92%的程序员使用AI编码工具；第一季度中国云服务支出增长6%丨每日大事件...

baichuan-7B在C-Eval、AGIEval和Gaokao中文权威评测榜单上，超过了ChatGLM-6B等其他大模型，并且在MMLU英文权威评测榜单上，领先LLaMA-7B。

数据猿·2023-06-19 16:47

【AIGC】baichuan-7B大模型

在标准的中文和英文权威benchmark（C-EVAL/MMLU）上均取得同尺寸最好的效果。百川智能发布的开源中英文大模型b

guoqiangsunshine·2023-06-19 02:28

baichuan-7B: 开源可商用支持中英文的最好大模型

在标准的中文和英文权威benchmark（C-EVAL/MMLU）上均取得了同参数规模下的最好效果。baichuan-7B的优点在同尺寸模型中baichuan-7B达到了目前SOTA的水平。ba

·2023-06-17 14:14

【AIGC】BaiChuan7B开源大模型介绍、部署以及创建接口服务

在标准的中文和英文权威benchmark（C-EVAL/MMLU）上均取得同尺寸最好的效果。huggingfacegithub部署环境系统：centos7.8.2003GPU：2*3090（24G）代

feifeiyechuan·2023-06-16 22:35

推荐频道

C-Eval

Windows零门槛部署DeepSeek大模型：Ollama+7B参数模型本地推理全攻略

LLM系列(4)：通义千问7B在Swift/DeepSpeed上微调秘诀与实战陷阱避坑指南

LLM_Home_Work_Day6

大模型学习与实践笔记（十四）

【OpenCompass 大模型评测】学习笔记

【书生·浦语】大模型实战营——第六次作业

大模型学习第六课作业

阿里开源大模型 Qwen-72B 私有化部署

Llama中文社区开源预训练Atom-7B-chat大模型体验与本地化部署实测(基于CPU，适配无GPU的场景)

简单测试大语言模型 Yi-34B 的中日英能力

解题准确率较GPT高出70% 夸克大模型多项考试评测成绩领先行

依托数据、平台、知识增强等优势夸克大模型大幅降低问答幻觉率

最新国内大模型评估结果

【GPT】中文大语言模型梳理与测评（C-Eval 、AGIEval、MMLU、SuperCLUE）

ChatGLM2发布，位居C-Eval榜首!

ARM申请在纳斯达克上市；钉钉推出AI PaaS平台；奇安信研发类AI大模型丨每日大事件...

chatglm2-6b模型在9n-triton中部署并集成至langchain实践 | 京东云技术团队

baichuan-7B: 开源可商用支持中英文的最好大模型

chatglm2-6b模型在9n-triton中部署并集成至langchain实践 | 京东云技术团队

ChatGLM2-12B 效果怎么样？官方公布

华为鸿蒙HarmonyOS 4定档8月；ChatGPT之父的加密货币正式上线；微软必应聊天将推出重新生成答案功能|极客头条

悟道·天鹰Aquila大模型更新权重，支持在 Hugging Face 平台使用！

ChatGLM-6B第二代模型开源，拿下LLM模型中文能力评估榜单第一名

baichuan-7B: 开源可商用支持中英文的最好大模型

百川智能发布开源中英文大模型；GitHub调查显示92%的程序员使用AI编码工具；第一季度中国云服务支出增长6%丨每日大事件...

【AIGC】baichuan-7B大模型

baichuan-7B: 开源可商用支持中英文的最好大模型

【AIGC】BaiChuan7B开源大模型介绍、部署以及创建接口服务

推荐频道

C-Eval

Windows零门槛部署DeepSeek大模型：Ollama+7B参数模型本地推理全攻略

LLM系列(4)：通义千问7B在Swift/DeepSpeed上微调秘诀与实战陷阱避坑指南

LLM_Home_Work_Day6

大模型学习与实践笔记（十四）

【OpenCompass 大模型评测】学习笔记

【书生·浦语】大模型实战营——第六次作业

大模型学习第六课作业

阿里开源大模型 Qwen-72B 私有化部署

Llama中文社区开源预训练Atom-7B-chat大模型体验与本地化部署实测(基于CPU，适配无GPU的场景)

简单测试大语言模型 Yi-34B 的中日英能力

解题准确率较GPT高出70% 夸克大模型多项考试评测成绩领先行

依托数据、平台、知识增强等优势 夸克大模型大幅降低问答幻觉率

最新国内大模型评估结果

【GPT】中文大语言模型梳理与测评（C-Eval 、AGIEval、MMLU、SuperCLUE）

ChatGLM2发布，位居C-Eval榜首!

ARM申请在纳斯达克上市；钉钉推出AI PaaS平台；奇安信研发类AI大模型丨每日大事件...

chatglm2-6b模型在9n-triton中部署并集成至langchain实践 | 京东云技术团队

baichuan-7B: 开源可商用支持中英文的最好大模型

chatglm2-6b模型在9n-triton中部署并集成至langchain实践 | 京东云技术团队

ChatGLM2-12B 效果怎么样？官方公布

华为鸿蒙HarmonyOS 4定档8月；ChatGPT之父的加密货币正式上线；微软必应聊天将推出重新生成答案功能|极客头条

悟道·天鹰Aquila大模型更新权重，支持在 Hugging Face 平台使用！

ChatGLM-6B第二代模型开源，拿下LLM模型中文能力评估榜单第一名

baichuan-7B: 开源可商用支持中英文的最好大模型

百川智能发布开源中英文大模型；GitHub调查显示92%的程序员使用AI编码工具；第一季度中国云服务支出增长6%丨每日大事件...

【AIGC】baichuan-7B大模型

baichuan-7B: 开源可商用支持中英文的最好大模型

【AIGC】BaiChuan7B开源大模型介绍、部署以及创建接口服务

依托数据、平台、知识增强等优势夸克大模型大幅降低问答幻觉率