E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
C-Eval
LLM系列(4):通义千问7B在Swift/DeepSpeed上微调秘诀与实战陷阱避坑指南
在诸多权威大模型能力测评基准上,如MMLU、
C-Eval
、GSM8K、HumanEval、WMT22,通义千问7B均取得了同参数级别开源模型中的最好表现,
汀、人工智能
·
2024-09-12 00:21
LLM工业级落地实践
人工智能
自然语言处理
prompt
Swifi
DeepSpeed
通义千问
Qwen
LLM_Home_Work_Day6
基础作业使用OpenCompass评测InternLM2-Chat-7B模型在
C-Eval
数据集上的性能
Rigel9527
·
2024-02-07 12:59
人工智能
大模型学习与实践笔记(十四)
使用OpenCompass评测InternLM2-Chat-7B模型使用LMDeploy0.2.0部署后在
C-Eval
数据集上的性能步骤1:下载internLM2-Chat-7B模型,并进行挂载以下命令将
AllYoung_362
·
2024-01-30 00:05
人工智能
langchain
AIGC
llama
深度学习
【OpenCompass 大模型评测】学习笔记
参考学习教程【大模型评测教程】理论作业使用OpenCompass评测InternLM2-Chat-7B模型在
C-Eval
数据集上的性能
尘汐筠竹
·
2024-01-29 05:15
学习
笔记
【书生·浦语】大模型实战营——第六次作业
使用OpenCompass评测InterLM2-chat-chat-7B模型在
C-Eval
数据集上的性能环境配置1.创建虚拟环境condacreate--nameopencompass--clone=/
不想动脑筋的亮亮
·
2024-01-23 11:39
人工智能
大模型学习第六课作业
使用OpenCompass评测InternLM2-Chat-7B模型在
C-Eval
数据集上的性能
敲键盘的喵桑
·
2024-01-22 02:09
学习
阿里开源大模型 Qwen-72B 私有化部署
Qwen模型在一系列基准数据集(例如MMLU、
C-Eval
、GSM8K、MATH、HumanEval、MBPP、等)上优于类似模型大小的基线模型,这些数据集评估了模
机器学习社区
·
2023-12-31 00:35
大模型
自然语言
CV
chatgpt
LLM
多模态
大模型
人工智能
Llama中文社区开源预训练Atom-7B-chat大模型体验与本地化部署实测(基于CPU,适配无GPU的场景)
一、模型简介原子大模型Atom由Llama中文社区和原子回声联合打造,在中文大模型评测榜单
C-Eval
中位居前十(8月21日评测提交时间)。
weixin_48087464
·
2023-12-18 03:36
llama
python
简单测试大语言模型 Yi-34B 的中日英能力
简单测试大语言模型Yi-34B的中日英能力0.背景1.中文测试2.日文测试3.英文测试0.背景简单测试一下
C-Eval
排行榜第一(20231129时点)的Yi-34B的中日英能力,1.中文测试问题1,回答正确
engchina
·
2023-12-02 11:49
LINUX
语言模型
人工智能
自然语言处理
Yi-34B
解题准确率较GPT高出70% 夸克大模型多项考试评测成绩领先行
数据显示,夸克千亿级参数大模型登顶
C-Eval
和CMMLU两大权威榜单,夸克百亿级参数大模型同样在法律、医疗、问答等领域的性能评测中夺冠。
QbitAl
·
2023-11-27 09:41
gpt
大数据
人工智能
依托数据、平台、知识增强等优势 夸克大模型大幅降低问答幻觉率
数据显示,夸克千亿级参数大模型登顶
C-Eval
和CMMLU两大权威榜单,夸克百亿级参数大模型同样在法律、医疗、问答等领域的性能评测中夺冠。
CSDN云计算
·
2023-11-25 14:24
人工智能
最新国内大模型评估结果
网址:Leaderboard|
C-Eval
:AMulti-LevelMulti-DisciplineChineseEvaluationSuiteforFoundationModelsLeaderboard-C-EvalResultsfordifferentsubjectsandtheaveragetestresultsareshownbelow.Theresultsarefromeitherzer
javastart
·
2023-10-26 03:35
大模型
自然语言
人工智能
chatgpt
语言模型
【GPT】中文大语言模型梳理与测评(
C-Eval
、AGIEval、MMLU、SuperCLUE)
文章目录概述申请后直接使用大模型开源可本地部署通识数据集测评(
C-Eval
、AGIEval、MMLU、SuperCLUE)自媒体报道SuperCLUE:中文通用大模型综合性基准
C-Eval
:中英测评(清华上交提出
曾小蛙
·
2023-10-24 15:18
AI自然语言相关
AIGC
生成式人工智能
AI开放平台
C-Eval
中文大语言模型
superCLUE
AGIEval
chatgpt
文心一言
ChatGLM
ChatGLM2发布,位居
C-Eval
榜首!
显存占用情况数理逻辑推理性能显存占用的减少量化对模型性能的影响基于P-Tuningv2的微调(官方)环境配置微调数据准备微调ChatGLM自2023年3月发布以来,就已经爆火,如今6月25日,清华二代发布(ChatGLM2),位居
C-Eval
dzysunshine
·
2023-10-07 03:34
ChatGPT
chatgpt
chatglm
ARM申请在纳斯达克上市;钉钉推出AI PaaS平台;奇安信研发类AI大模型丨每日大事件...
大数据产业创新服务媒体——聚焦数据·改变商业企业动态云从科技:正式发布从容大模型1.5版本日前,云从科技发布从容大模型1.5版本,该版本包含十亿级、百亿级、千亿级多种模型规格,实测性能在全球大模型综合性考试评测(
C-Eval
数据猿
·
2023-08-23 12:28
钉钉
人工智能
paas
云原生
云计算
chatglm2-6b模型在9n-triton中部署并集成至langchain实践 | 京东云技术团队
一.前言近期,ChatGLM-6B的第二代版本ChatGLM2-6B已经正式发布,引入了如下新特性:①.基座模型升级,性能更强大,在中文
C-Eval
榜单中,以51.7分位列第6;②.支持8K-32k的上下文
京东云技术团队
·
2023-08-16 20:29
人工智能
langchain
京东云
ChatGLM2
人工智能
AIGC
baichuan-7B: 开源可商用支持中英文的最好大模型
在标准的中文和英文权威benchmark(
C-EVAL
/MMLU)上均取得了同参数规模下的最好效果。baichuan-7B的优点在同尺寸模型中baichuan-7B达到了目前SOTA的水平。ba
·
2023-08-16 19:48
chatglm2-6b模型在9n-triton中部署并集成至langchain实践 | 京东云技术团队
一.前言近期,ChatGLM-6B的第二代版本ChatGLM2-6B已经正式发布,引入了如下新特性:①.基座模型升级,性能更强大,在中文
C-Eval
榜单中,以51.7分位列第6;②.支持8K-32k的上下文
·
2023-08-16 11:50
ChatGLM2-12B 效果怎么样?官方公布
这些数据集包括MMLU(英文)、
C-Eval
(中文)、GSM8K(数学)和BBH(英文)等。ChatGLM2-12B模型在这些数据集上取得了不错的成绩
AITIME论道
·
2023-08-10 08:20
华为鸿蒙HarmonyOS 4定档8月;ChatGPT之父的加密货币正式上线;微软必应聊天将推出重新生成答案功能|极客头条
腾讯、抖音、淘天将调整职级体系,适应新周期华为鸿蒙HarmonyOS4定档8月微信手机号可一键登录QQ安卓版
C-Eval
中文大模型权威排名公布继日本之后,拼多多Temu正式上线韩国ChatGPT之父
极客日报
·
2023-07-25 09:13
极客日报
快讯
华为
harmonyos
chatgpt
悟道·天鹰Aquila大模型更新权重,支持在 Hugging Face 平台使用!
7B开源了最新权重v0.7版本,其中AquilaChat-7B在FlagEval大模型评测中(“主观+客观”),相比6月27日发布的v0.6版本整体提升了3.23%,在MMLU、TruthfulQA、
C-Eval
智源社区
·
2023-07-22 13:05
ChatGLM-6B第二代模型开源,拿下LLM模型中文能力评估榜单第一名
在主要评估LLM模型中文能力的
C-Eval
榜单中,截至6月25日ChatGLM2模型以71.1的分数位居Rank0,ChatGLM2-6B模型以51.7的分数位居Ran
·
2023-07-13 15:54
baichuan-7B: 开源可商用支持中英文的最好大模型
在标准的中文和英文权威benchmark(
C-EVAL
/MMLU)上均取得了同参数规模下的最好效果。baichuan-7B的优点在同尺寸模型中baichuan-7B达到了目前SOTA的水平。ba
coding进阶
·
2023-06-20 03:05
chatgpt
人工智能
深度学习
nlp
百川智能发布开源中英文大模型;GitHub调查显示92%的程序员使用AI编码工具;第一季度中国云服务支出增长6%丨每日大事件...
baichuan-7B在
C-Eval
、AGIEval和Gaokao中文权威评测榜单上,超过了ChatGLM-6B等其他大模型,并且在MMLU英文权威评测榜单上,领先LLaMA-7B。
数据猿
·
2023-06-19 16:47
人工智能
【AIGC】baichuan-7B大模型
在标准的中文和英文权威benchmark(
C-EVAL
/MMLU)上均取得同尺寸最好的效果。百川智能发布的开源中英文大模型b
guoqiangsunshine
·
2023-06-19 02:28
AI
人工智能
深度学习
机器学习
baichuan-7B: 开源可商用支持中英文的最好大模型
在标准的中文和英文权威benchmark(
C-EVAL
/MMLU)上均取得了同参数规模下的最好效果。baichuan-7B的优点在同尺寸模型中baichuan-7B达到了目前SOTA的水平。ba
·
2023-06-17 14:14
【AIGC】BaiChuan7B开源大模型介绍、部署以及创建接口服务
在标准的中文和英文权威benchmark(
C-EVAL
/MMLU)上均取得同尺寸最好的效果。huggingfacegithub部署环境系统:centos7.8.2003GPU:2*3090(24G)代
feifeiyechuan
·
2023-06-16 22:35
AIGC
BaiChuan
AIGC
人工智能
深度学习
上一页
1
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他