ChatGPT 火起来了,很多企业想用 ChatGPT,但是又由于企业数据的保密性,所以本地部署开源大语言模型是不二之选。
各个企业本地部署大语言模型的第一步,就是调研哪些开源大语言模型可以商用。
大规模基础模型:表格中只罗列出参数量
大于7B
以上模型。
模型 | 大小 | 时间 | 语言 | 领域 | 下载 | 项目地址 | 机构/个人 | 结构 | 文献 | 备注 | 模型是否可以商用 |
---|---|---|---|---|---|---|---|---|---|---|---|
Baichuan-7B | 7B | 2023-06 | 中英 | ckpt | baichuan-7B | 百川智能 | Decoder | baichuan-7B 支持商用。如果将 baichuan-7B 模型或其衍生品用作商业用途,请您按照如下方式联系许可方,以进行登记并向许可方申请书面授权:联系邮箱:[email protected], 具体许可协议可见《baichuan-7B 模型许可协议》。 | |||
Chinese-Falcon-7B | 7B | 2023-06 | 中英 | ckpt | Linly | 深圳大学计算机视觉研究所 | Decoder | Blog | 模型以 Apache License 2.0 协议开源,支持商业用途。 | ||
AquilaCode-7B-TS | 7B | 2023-06 | 中英 | ckpt | Aquila | 智源研究院 | Decoder | 支持开源商用许可。Aquila系列模型的源代码基于 Apache 2.0 协议,模型权重基于《智源Aquila系列模型许可协议》,使用者在满足许可限制的情况下,可用于商业目的。 | |||
Aquila-7B | 7B | 2023-06 | 中英 | ckpt | Aquila | 智源研究院 | Decoder | 支持开源商用许可。Aquila系列模型的源代码基于 Apache 2.0 协议,模型权重基于《智源Aquila系列模型许可协议》,使用者在满足许可限制的情况下,可用于商业目的。 | |||
Chinese-LLaMA-33B | 33B | 2023-06 | 中英 | ckpt | Chinese-LLaMA-Alpaca | Yiming Cui | Decoder | Facebook官方发布的LLaMA模型禁止商用,并且官方没有正式开源模型权重(虽然网上已经有很多第三方的下载地址)。为了遵循相应的许可,目前暂时无法发布完整的模型权重,敬请各位理解(目前国外也是一样)。Facebook完全开放模型权重之后,本项目会及时更新相关策略。这里发布的是LoRA权重,可以理解为原LLaMA模型上的一个“补丁”,两者进行合并即可获得完整版权重。以下中文LLaMA/Alpaca LoRA模型无法单独使用,需要搭配原版LLaMA模型。请参考本项目给出的合并模型步骤重构模型。 | |||
TigerBot-7b-base | 7B | 2023-06 | 多语 | ckpt | TigerBot | 虎博科技 | Decoder | 如需将模型公开使用或者商用,模型服务所产生的不良影响或者有害言论由服务方负责,本项目开发者不承担任何因使用本项目(包含但不限于数据、模型、代码等)导致的危害或损失。 | |||
Panda-OpenLLaMA-7B | 7B | 2023-05 | 中英 | ckpt | pandallm | dandelionsllm | Decoder | 可商用 | |||
Panda-13B | 13B | 2023-05 | 中英 | ckpt | pandallm | dandelionsllm | Decoder | 不可商用 | |||
Panda-7B | 7B | 2023-05 | 中英 | ckpt | pandallm | dandelionsllm | Decoder | 不可商用 | |||
OpenLLaMA-13B | 13B | 2023-05 | 中英 | ckpt | Linly | 深圳大学计算机视觉研究所 | Decoder | Following LLaMA, our pre-trained weights are released under GNU General Public License v3.0 | |||
LaWGPT-7B | 7B | 2023-05 | 中英 | 法律 | ckpt | LawGPT | Pengxiao Song | Decoder | 本项目任何资源仅供学术研究使用,严禁任何商业用途。 | ||
BiLLa-7B-LLM | 7B | 2023-05 | 中英 | ckpt | BiLLa | Zhongli Li | Decoder | 本项目相关资源仅供学术研究,不得用于商业用途。 | |||
Ziya-LLaMA-7B-Reward | 7B | 2023-05 | 中英 | ckpt | Fengshenbang-LM | IDEA研究院 | Decoder | Apache License 2.0 (作者注:并未明确表明禁止商用) | |||
YuYan | 11B | 2023-04 | 中文 | ckpt | / | 网易伏羲 | Decoder | Paper | - | ||
Chinese-LLaMA-33B | 33B | 2023-04 | 中文 | ckpt | Linly | 深圳大学计算机视觉研究所 | Decoder | Blog | LLaMA 原始模型权重基于 GNU General Public License v3.0 协议,仅供研究使用,不能用于商业目的。 | ||
Chinese-LLaMA-13B | 13B | 2023-04 | 中文 | ckpt | Linly | 深圳大学计算机视觉研究所 | Decoder | Blog | LLaMA 原始模型权重基于 GNU General Public License v3.0 协议,仅供研究使用,不能用于商业目的。 | ||
Chinese-LLaMA-7B | 7B | 2023-04 | 中文 | ckpt | Linly | 深圳大学计算机视觉研究所 | Decoder | Blog | LLaMA 原始模型权重基于 GNU General Public License v3.0 协议,仅供研究使用,不能用于商业目的。 | ||
OpenChineseLLaMA | 7B | 2023-04 | 中英 | ckpt | OpenChineseLLaMA | OpenLMLab | Decoder | Non-commercial bespoke license | |||
MOSS-003 | 16B | 2023-04 | 中英 | ckpt | MOSS | 复旦大学 | Decoder | 本项目所含代码采用Apache 2.0协议,数据采用CC BY-NC 4.0协议,模型权重采用GNU AGPL 3.0协议。如需将本项目所含模型用于商业用途或公开部署,请签署本文件并填写此问卷取得授权,商用情况仅用于记录,不会收取任何费用。 | |||
BBT-2-13B-Text | 13B | 2023-04 | 中文 | 申请下载 | BBT-FinCUGE-Applications | 超对称 | Decoder | Paper | 未记述许可内容 | ||
BBT-2-12B-Text | 12B | 2023-04 | 中文 | 申请下载 | BBT-FinCUGE-Applications | 超对称 | Decoder | Paper | 未记述许可内容 | ||
Chinese-LLaMA-13B | 13B | 2023-04 | 中英 | ckpt | Chinese-LLaMA-Alpaca | Yiming Cui | Decoder | Facebook官方发布的LLaMA模型禁止商用,并且官方没有正式开源模型权重(虽然网上已经有很多第三方的下载地址)。为了遵循相应的许可,目前暂时无法发布完整的模型权重,敬请各位理解(目前国外也是一样)。Facebook完全开放模型权重之后,本项目会及时更新相关策略。这里发布的是LoRA权重,可以理解为原LLaMA模型上的一个“补丁”,两者进行合并即可获得完整版权重。以下中文LLaMA/Alpaca LoRA模型无法单独使用,需要搭配原版LLaMA模型。 | |||
flan-ul2 | 20B | 2023-03 | 多语 | ckpt | ul2 | encoder-decoder | Paper | 未记述许可内容 | |||
CPM-Bee | 10B | 2023-01 | 中英 | ckpt-10B ckpt-5B | CPM-Live | OpenBMB | Decoder | 模型训练完成后,你可以在开放使用许可下自由下载模型参数。CPM-Live使用的是包括商业化许可的开放许可。通过模型压缩和推理加速工具,你可以在自己的电脑上体验大模型的威力! | |||
BLOOM | 176B | 2022-11 | 多语 | ckpt-95000 | Megatron-DeepSpeed | BigScience | Decoder | Paper | The BigScience RAIL License | ||
BLOOMZ | 176B | 2022-11 | 多语 | ckpt-498 | Megatron-DeepSpeed | BigScience | Decoder | Paper | The BigScience RAIL License | ||
flan-t5-xxl | 11B | 2022-11 | 多语 | ckpt | t5x | encoder-decoder | paper | Apache-2.0 license | |||
CPM-Ant+ | 10B | 2022-10 | 中英 | ckpt | CPM-Live | OpenBMB | Decoder | blog | 模型训练完成后,你可以在开放使用许可下自由下载模型参数。CPM-Live使用的是包括商业化许可的开放许可。通过模型压缩和推理加速工具,你可以在自己的电脑上体验大模型的威力! | ||
GLM | 130B | 2022-10 | 中英 | 申请下载 | GLM-130B | 清华大学 | Decoder | paper | MIT License | ||
CPM-Ant | 10B | 2022-09 | 中文 | ckpt | CPM-Live | OpenBMB | Decoder | blog | 模型训练完成后,你可以在开放使用许可下自由下载模型参数。CPM-Live使用的是包括商业化许可的开放许可。通过模型压缩和推理加速工具,你可以在自己的电脑上体验大模型的威力! | ||
GLM | 10B | 2022-09 | 中文 | ckpt | GLM | 清华大学 | Decoder | paper | MIT License | ||
CodeGeeX | 13B | 2022-06 | 多语 | 申请下载 | CodeGeeX | 清华大学 | Decoder | blog | You will not use, copy, modify, merge, publish, distribute, reproduce, or create derivative works of the Software, in whole or in part, for any commercial, military, or illegal purposes. | ||
源1.0 | 245B | 2021-09 | 中文 | API申请 | Yian-1.0 | 浪潮 | Decoder | paper | 未记述许可内容 | ||
CPM-2 | 11B | 2021-06 | 中文 | 申请下载 | CPM | 智源研究院 | encoder-decoder | paper | 未记述许可内容 | ||
CPM-2 | 10B | 2021-06 | 中英 | 申请下载 | CPM | 智源研究院 | encoder-decoder | paper | 未记述许可内容 | ||
CPM-2 | 200B | 2021-06 | 中英 | 申请下载 | CPM | 智源研究院 | encoder-decoder,MOE | paper | 未记述许可内容 | ||
PanGu-Alpha | 13B | 2021-05 | 中文 | ckpt | PanGu-Alpha | 鹏城实验室 | Decoder | paper | Apache License 2.0 | ||
PanGu-Alpha | 200B | 2021-05 | 中文 | 待发布 | PanGu-Alpha | 鹏城实验室 | Decoder | paper | Apache License 2.0 | ||
PLUG | 27B | 2021-04 | 中文 | 申请下载 | AliceMind | 阿里巴巴 | encoder-decoder | Apache-2.0 license | |||
GPT-3 | 13B | 2021-04 | 中文 | 待发布 | GPT-3 | 达摩院 | Decoder | Apache-2.0 license | |||
GPT-3 | 30B | 2021-04 | 中文 | 待发布 | GPT-3 | 达摩院 | Decoder | Apache-2.0 license |
具备问答和对话等功能的大型语言模型。
模型 | 大小 | 时间 | 语言 | 领域 | 下载 | 项目地址 | 机构/个人 | 结构 | 文献 | 模型是否可以商用 |
---|---|---|---|---|---|---|---|---|---|---|
Yayi | 7B | 2023-06 | 中英 | 安全、舆情、治理等 | ckpt | Yayi | 中科闻歌 | Decoder | You will not use, copy, modify, merge, publish, distribute, reproduce, or create derivative works of the Software, in whole or in part, for any commercial, military, or illegal purposes. | |
BayLing-13B | 13B | 2023-06 | 中英 | 通用 | ckpt | BayLing | 中国科学院 | Decoder | 模型权重(增量版本)和推理代码在 GNU 通用公共许可证 v3.0(GPLv3)下发布。在线演示系统仅作为研究预览,供非商业用途使用,并受到 LLaMA 的模型许可、OpenAI 生成数据的使用条款、ShareGPT 的隐私条例以及 WMT22 的数据许可的约束。 | |
BayLing-7B | 7B | 2023-06 | 中英 | 通用 | ckpt | BayLing | 中国科学院 | Decoder | 模型权重(增量版本)和推理代码在 GNU 通用公共许可证 v3.0(GPLv3)下发布。在线演示系统仅作为研究预览,供非商业用途使用,并受到 LLaMA 的模型许可、OpenAI 生成数据的使用条款、ShareGPT 的隐私条例以及 WMT22 的数据许可的约束。 | |
MeChat | 6B | 2023-06 | 中文 | 心理 | ckpt | smile | qiuhuachuan | Encoder-Decder | CC0-1.0 license(本项目开源的中文心理健康支持通用模型由 ChatGLM-6B LoRA 16-bit 指令微调得到。) | |
ziya-13b-medical | 13b | 2023-06 | 中英 | 医学 | ckpt | MedicalGPT | Ming Xu | Decoder | 基于以上模型局限性,我们要求开发者仅将我们开源的模型权重及后续用此项目生成的衍生物用于研究目的,不得用于商业,以及其他会对社会带来危害的用途。 | |
ZhiXi-13B-Diff | 13B | 2023-06 | 中英 | 通用 | ckpt | KnowLLM | 浙江大学 | Decoder | 基于Llama | |
Anima | 33B | 2023-06 | 中文 | 通用 | ckpt | Anima | Gavin Li | Decoder | Apache-2.0 license | |
OpenLLaMA-Chinese-13B | 13B | 2023-06 | 中文 | 通用 | ckpt | OpenLLaMA-Chinese | FittenTech | Decoder | We adopt the Apache License, following OpenLLaMA’s license. | |
OpenLLaMA-Chinese-3B | 3B | 2023-06 | 中文 | 通用 | ckpt | OpenLLaMA-Chinese | FittenTech | Decoder | We adopt the Apache License, following OpenLLaMA’s license. | |
OpenLLaMA-Chinese-7B | 7B | 2023-06 | 中文 | 通用 | ckpt | OpenLLaMA-Chinese | FittenTech | Decoder | We adopt the Apache License, following OpenLLaMA’s license. | |
Taoli | 7B | 2023-06 | 中英 | 教育 | 待开源 | taoli | 北京语言大学 | Decoder | 本项目内容仅供用于学术研究,不得用于商业以及其他会对社会带来危害的用途。 | |
Lawyer-llama | 13B | 2023-06 | 中英 | 法律 | ckpt | lawyer-llama | Quzhe Huang | Decoder | 本项目内容仅供用于学术研究,不得用于商业以及其他会对社会带来危害的用途。 | |
QiZhen-CaMA-13B | 13B | 2023-06 | 中英 | 医学 | ckpt-3600 ckpt-6000 | QiZhenGPT | 浙江大学 | Decoder | 本项目相关资源仅供学术研究之用,严禁用于商业用途。 | |
扁鹊-2.0 | 6B | 2023-06 | 中文 | 医学 | ckpt | BianQue | 华南理工大学 | Encoder-Decder | **扁鹊-2.0(BianQue-2.0)**使用了ChatGLM-6B 模型的权重,需要遵循其MODEL_LICENSE,因此,本项目仅可用于您的非商业研究目的。 | |
SoulChat | 6B | 2023-06 | 中文 | 心理 | ckpt | SoulChat | 华南理工大学 | Encoder-Decder | 本项目使用了ChatGLM-6B 模型的权重,需要遵循其MODEL_LICENSE,因此,本项目仅可用于您的非商业研究目的。 | |
openbuddy-falcon-7b-v1.5 | 7B | 2023-06 | 多语 | 通用 | ckpt | OpenBuddy | OpenBuddy | Decoder | OpenBuddy-LLaMA series models are strictly prohibited for commercial use and are intended for research purposes only. For more information, please refer to the LLaMA License. | |
AtomGPT_8k_chat | 13B | 2023-06 | 中英 | 通用 | ckpt | AtomGPT | 原子回声 | Decoder | 本项目遵循apache-2.0的开源协议。使用涉及第三方代码的部分时,请严格遵循相应的开源协议。模型生成的内容受模型计算、随机性和量化精度损失等因素影响,本项目不对其准确性作出保证。对于模型输出的任何内容,本项目不承担任何法律责任,亦不对因使用相关资源和输出结果而可能产生的任何损失承担责任。 | |
AquilaChat-7B | 7B | 2023-06 | 中英 | 通用 | ckpt | Aquila | 智源研究院 | Decoder | 支持开源商用许可。Aquila系列模型的源代码基于 Apache 2.0 协议,模型权重基于《智源Aquila系列模型许可协议》,使用者在满足许可限制的情况下,可用于商业目的。 | |
YuLan-Chat-65B | 65B | 2023-06 | 中英 | 通用 | lora-ckpt | YuLan-Chat | 中国人民大学 | Decoder | YuLan-Chat uses MIT License. All data and code in this project can only be used for academic purposes. | |
YuLan-Chat-13B | 13B | 2023-06 | 中英 | 通用 | lora-ckpt | YuLan-Chat | 中国人民大学 | Decoder | YuLan-Chat uses MIT License. All data and code in this project can only be used for academic purposes. | |
Chinese-Alpaca-33B | 33B | 2023-06 | 中文 | 通用 | lora-ckpt | Chinese-LLaMA-Alpaca | Yiming Cui | Decoder | Facebook官方发布的LLaMA模型禁止商用,并且官方没有正式开源模型权重(虽然网上已经有很多第三方的下载地址)。为了遵循相应的许可,目前暂时无法发布完整的模型权重,敬请各位理解(目前国外也是一样)。Facebook完全开放模型权重之后,本项目会及时更新相关策略。这里发布的是LoRA权重,可以理解为原LLaMA模型上的一个“补丁”,两者进行合并即可获得完整版权重。以下中文LLaMA/Alpaca LoRA模型无法单独使用,需要搭配原版LLaMA模型。请参考本项目给出的合并模型步骤重构模型。 | |
TigerBot-sft | 180B | 2023-06 | 多语 | 通用 | ckpt | TigerBot | 虎博科技 | Decoder | 如需将模型公开使用或者商用,模型服务所产生的不良影响或者有害言论由服务方负责,本项目开发者不承担任何因使用本项目(包含但不限于数据、模型、代码等)导致的危害或损失。 | |
TigerBot-sft | 7B | 2023-06 | 多语 | 通用 | ckpt | TigerBot | 虎博科技 | Decoder | 如需将模型公开使用或者商用,模型服务所产生的不良影响或者有害言论由服务方负责,本项目开发者不承担任何因使用本项目(包含但不限于数据、模型、代码等)导致的危害或损失。 | |
ChatYuan-7B | 7B | 2023-06 | 中英 | 通用 | ckpt | ChatYuan-7B | ClueAI | Decoder | 不允许商业用途和其他潜在有害的使用场景。 | |
Panda-Instruct-13B | 13B | 2023-05 | 中英 | 通用 | ckpt | pandallm | dandelionsllm | Decoder | 我们要求开发者不得将我们开源的代码、数据、模型及后续用此项目生成的衍生物用于任何商业(开源可商用版本OpenPandaLLM除外)以及为社会带来危害的用途。 | |
Panda-Instruct-7B | 7B | 2023-05 | 中英 | 通用 | ckpt | pandallm | dandelionsllm | Decoder | 我们要求开发者不得将我们开源的代码、数据、模型及后续用此项目生成的衍生物用于任何商业(开源可商用版本OpenPandaLLM除外)以及为社会带来危害的用途。 | |
BiLLa-7B-SFT | 7B | 2023-05 | 中英 | 通用 | ckpt | BiLLa | Zhongli Li | Decoder | 本项目相关资源仅供学术研究,不得用于商业用途。 | |
QiZhen-ChatGLM-6B | 6B | 2023-05 | 中英 | 医学 | ckpt-2500 | QiZhenGPT | 浙江大学 | Decoder | 本项目相关资源仅供学术研究之用,严禁用于商业用途。 | |
QiZhen-Chinese-LLaMA-7B | 7B | 2023-05 | 中英 | 医学 | ckpt-3500 ckpt-6000 | QiZhenGPT | 浙江大学 | Decoder | 本项目相关资源仅供学术研究之用,严禁用于商业用途。 | |
ChatMed-Consult | 7B | 2023-05 | 中英 | 医学 | ckpt | ChatMed | michael-wzhu | Decoder | 本项目相关资源仅供学术研究之用,严禁用于商业用途。 | |
LaWGPT-7B-beta1.1 | 7B | 2023-05 | 中英 | 法律 | ckpt | LawGPT | Pengxiao Song | Decoder | 本项目任何资源仅供学术研究使用,严禁任何商业用途。 | |
LaWGPT-7B-beta1.0 | 7B | 2023-05 | 中英 | 法律 | ckpt | LawGPT | Pengxiao Song | Decoder | 本项目任何资源仅供学术研究使用,严禁任何商业用途。 | |
Cornucopia | 7B | 2023-05 | 中英 | 金融 | ckpt-linly-llama | Cornucopia-LLaMA-Fin-Chinese | yuyangmu | Decoder | 本项目相关资源仅供学术研究之用,严禁用于商业用途。 | |
Cornucopia | 7B | 2023-05 | 中英 | 金融 | ckpt-ori-fb | Cornucopia-LLaMA-Fin-Chinese | yuyangmu | Decoder | 本项目相关资源仅供学术研究之用,严禁用于商业用途。 | |
HuatuoGPT | 7B | 2023-05 | 中文 | 医学 | ckpt | HuatuoGPT | 香港中文大学 | Decoder | Paper | Apache-2.0 license |
LexiLaw | 6B | 2023-05 | 中文 | 法律 | ckpt | LexiLaw | Haitao Li | Decoder | Paper | 本项目任何资源仅供学术研究使用,严禁任何商业用途。 |
XuanYuan | 176B | 2023-05 | 中文 | 金融 | 申请下载 | XuanYuan | 度小满 | Decoder | Paper | 轩辕作为一个开源的中文金融对话模型,仅限于非商业用途的目的。 |
Ziya-LLaMA-13B-v1 | 13B | 2023-05 | 中英 | 通用 | ckpt | Fengshenbang-LM | IDEA研究院 | Decoder | Blog | 基于 LLaMA |
BLOOMChat V1.0 | 176B | 2023-05 | 多语 | 通用 | ckpt | bloomchat | SambaNova Systems | Decoder | Blog | 不太明确 |
BiLLa | 7B | 2023-05 | 中英 | 通用 | ckpt | BiLLa | Zhongli Li | Decoder | 本项目相关资源仅供学术研究,不得用于商业用途。 | |
Bactrian-X | 13B | 2023-05 | 多语 | 通用 | lora-ckpt | bactrian-x | MBZUAI | Decoder | Bactrian-X is intended and licensed for research use only. The dataset is CC BY NC 4.0 (allowing only non-commercial use) and models trained using the dataset should not be used outside of research purposes. | |
Bactrian-X | 7B | 2023-05 | 多语 | 通用 | lora-ckpt | bactrian-x | MBZUAI | Decoder | Bactrian-X is intended and licensed for research use only. The dataset is CC BY NC 4.0 (allowing only non-commercial use) and models trained using the dataset should not be used outside of research purposes. | |
Bactrian-ZH | 7B | 2023-05 | 中文 | 通用 | lora-ckpt | bactrian-x | MBZUAI | Decoder | Bactrian-X is intended and licensed for research use only. The dataset is CC BY NC 4.0 (allowing only non-commercial use) and models trained using the dataset should not be used outside of research purposes. | |
LawGPT | 6B | 2023-05 | 中文 | 法律 | lora-ckpt | LAW-GPT | hongchengliu | Encoder-Decder | 预训练模型是基于大量语料库和算法模型进行训练的,并且在训练过程中可能存在偏差、错误和不完整的信息。因此,本项目提供的预训练模型仅供参考和研究使用,并不能保证其准确性和可靠性。使用预训练模型产生的结果可能存在误差和偏差,不能用于实际应用或决策。本项目不对使用预训练模型所产生的结果承担任何责任,也不对因使用预训练模型所产生的任何损失承担责任。使用者在使用预训练模型时应自行承担风险并进行自我验证。 | |
ChatFlow-13B | 13B | 2023-05 | 中英 | 通用 | ckpt | Linly | 深圳大学计算机视觉研究所 | Decoder | Our code and documents are released under Apache Licence 2.0 Following LLaMA, our pre-trained weights are released under GNU General Public License v3.0 | |
ChatFlow-7B | 7B | 2023-05 | 中英 | 通用 | ckpt | Linly | 深圳大学计算机视觉研究所 | Decoder | Our code and documents are released under Apache Licence 2.0 Following LLaMA, our pre-trained weights are released under GNU General Public License v3.0 | |
OpenBuddy | 7B | 2023-05 | 多语 | 通用 | ckpt | OpenBuddy | OpenBuddy | Decoder | OpenBuddy-LLaMA series models are strictly prohibited for commercial use and are intended for research purposes only. For more information, please refer to the LLaMA License. | |
OpenBuddy | 13B | 2023-05 | 多语 | 通用 | ckpt | OpenBuddy | OpenBuddy | Decoder | OpenBuddy-LLaMA series models are strictly prohibited for commercial use and are intended for research purposes only. For more information, please refer to the LLaMA License. | |
YuYan-dialogue | 11B | 2023-04 | 中文 | 通用 | ckpt | / | 网易伏羲 | Decoder | paper | |
扁鹊-1.0 | 0.7B | 2023-04 | 中文 | 医学 | ckpt | BianQue | scutcyr | Encoder-Decder | 本项目仅可用于您的非商业研究目的 | |
Moss-moon-003-sft-plugin | 16B | 2023-04 | 中英 | 通用 | ckpt | MOSS | 复旦大学 | Decoder | 本项目所含代码采用Apache 2.0协议,数据采用CC BY-NC 4.0协议,模型权重采用GNU AGPL 3.0协议。如需将本项目所含模型用于商业用途或公开部署,请签署本文件并填写此问卷取得授权,商用情况仅用于记录,不会收取任何费用。 | |
moss-moon-003-sft | 16B | 2023-04 | 中英 | 通用 | ckpt | MOSS | 复旦大学 | Decoder | 本项目所含代码采用Apache 2.0协议,数据采用CC BY-NC 4.0协议,模型权重采用GNU AGPL 3.0协议。如需将本项目所含模型用于商业用途或公开部署,请签署本文件并填写此问卷取得授权,商用情况仅用于记录,不会收取任何费用。 | |
RWKV-4-Raven | 3/7/14B | 2023-04 | 中英 | 通用 | ckpt | ChatRWKV | BlinkDL | RNN | Blog | Apache-2.0 license |
Phoenix-inst-chat-7b | 7B | 2023-04 | 中文 | 通用 | ckpt | LLMZoo | 香港中文大学 | Decoder | Apache-2.0 license,DATA_LICENSE有限制 | |
Phoenix-chat-7b | 7B | 2023-04 | 中文 | 通用 | ckpt | LLMZoo | 香港中文大学 | Decoder | Apache-2.0 license,DATA_LICENSE有限制 | |
ChatPLUG | 3.7B | 2023-04 | 中文 | 通用 | ckpt | ChatPLUG | 阿里巴巴 | Encoder-Decder | Paper | Apache-2.0 license |
ChatPLUG | 240M | 2023-04 | 中文 | 通用 | ckpt | ChatPLUG | 阿里巴巴 | Encoder-Decder | Paper | Apache-2.0 license |
ChatGLM-Med | 6B | 2023-04 | 中文 | 医学 | ckpt | Med-ChatGLM | 哈尔滨工业大学 | Encoder-Decder | 基于 ChatGLM-6B | |
BenTsao | 7B | 2023-04 | 中文 | 医学 | lora-ckpt | Huatuo-Llama-Med-Chinese | 哈尔滨工业大学 | Decder | 基于 LLaMA | |
DoctorGLM | 6B | 2023-04 | 中文 | 医学 | 待更新 | DoctorGLM | xionghonglin | Encoder-Decder | 基于 ChatGLM-6B | |
Firefly-7b1 | 7B | 2023-04 | 中文 | 通用 | ckpt | Firefly | Yang JianXin | Decoder | 未记述许可内容,应该是可以商用 | |
Firefly-2b6 | 2B | 2023-04 | 中文 | 通用 | ckpt | Firefly | Yang JianXin | Decoder | 未记述许可内容,应该是可以商用 | |
firefly-1b4 | 1B | 2023-04 | 中文 | 通用 | ckpt | Firefly | Yang JianXin | Decoder | 未记述许可内容,应该是可以商用 | |
Chinese-Alpaca-13B | 13B | 2023-04 | 中文 | 通用 | lora-ckpt | Chinese-LLaMA-Alpaca | Yiming Cui | Decoder | 本项目相关资源仅供学术研究之用,严禁用于商业用途。 | |
BELLE-LLAMA-13B-2M | 13B | 2023-04 | 中文 | 通用 | ckpt | BELLE | 贝壳 | Decoder | 基于 LLaMA | |
LLaMA-65B-tuned | 65B | 2023-04 | 中文 | 通用 | 待更新 | LMFlow | 香港科技大学 | Decoder | 基于 LLaMA | |
LLaMA-33B-tuned | 33B | 2023-04 | 中文 | 通用 | ckpt | LMFlow | 香港科技大学 | Decoder | 基于 LLaMA | |
LLaMA-13B-tuned | 13B | 2023-04 | 中文 | 通用 | ckpt | LMFlow | 香港科技大学 | Decoder | 基于 LLaMA | |
LLaMA-7B-tuned | 7B | 2023-04 | 中文 | 通用 | ckpt | LMFlow | 香港科技大学 | Decoder | 基于 LLaMA | |
Chinese-Vicuna | 13B | 2023-03 | 中文 | 通用 | ckpt | Chinese-Vicuna | Facico | Decoder | Facebook官方发布的LLaMA模型禁止商用,并且官方没有正式开源模型权重(虽然网上已经有很多第三方的下载地址)。为了遵循相应的许可,目前暂时无法发布完整的模型权重,敬请各位理解(目前国外也是一样)。Facebook完全开放模型权重之后,本项目会及时更新相关策略。这里发布的是LoRA权重,可以理解为原LLaMA模型上的一个“补丁”,两者进行合并即可获得完整版权重。以下中文LLaMA/Alpaca LoRA模型无法单独使用,需要搭配原版LLaMA模型。请参考本项目给出的合并模型步骤重构模型。 | |
Chinese-Vicuna | 7B | 2023-03 | 中文 | 通用 | ckpt | Chinese-Vicuna | Facico | Decoder | Facebook官方发布的LLaMA模型禁止商用,并且官方没有正式开源模型权重(虽然网上已经有很多第三方的下载地址)。为了遵循相应的许可,目前暂时无法发布完整的模型权重,敬请各位理解(目前国外也是一样)。Facebook完全开放模型权重之后,本项目会及时更新相关策略。这里发布的是LoRA权重,可以理解为原LLaMA模型上的一个“补丁”,两者进行合并即可获得完整版权重。以下中文LLaMA/Alpaca LoRA模型无法单独使用,需要搭配原版LLaMA模型。请参考本项目给出的合并模型步骤重构模型。 | |
ChatYuan-V2 | 0.7B | 2023-03 | 中英 | 通用 | ckpt | ChatYuan | 元语智能 | Encoder-Decder | 您不得将软件全部或部分用于任何商业、军事或非法目的,包括使用、复制、修改、合并、出版、分发、复制或创建软件的衍生作品。 | |
Chinese-Alpaca-7B | 7B | 2023-03 | 中文 | 通用 | lora-ckpt | Chinese-LLaMA-Alpaca | Yiming Cui | Decoder | 本项目相关资源仅供学术研究之用,严禁用于商业用途。 | |
Luotuo | 7B | 2023-03 | 中文 | 通用 | ckpt | Chinese-alpaca-lora | 华中师范大学 | Decoder | Apache-2.0 license、基于 LLaMA? | |
BELLE-LLAMA | 7B | 2023-03 | 中英 | 通用 | ckpt | BELLE | 贝壳 | Decoder | 基于以上模型局限性,我们要求开发者仅将我们开源的代码、数据、模型及后续用此项目生成的衍生物用于研究目的,不得用于商业,以及其他会对社会带来危害的用途。 | |
BELLE-BLOOM | 7B | 2023-03 | 中英 | 通用 | ckpt | BELLE | 贝壳 | Decoder | 基于以上模型局限性,我们要求开发者仅将我们开源的代码、数据、模型及后续用此项目生成的衍生物用于研究目的,不得用于商业,以及其他会对社会带来危害的用途。 | |
ChatGLM-6B | 6B | 2023-03 | 中英 | 通用 | ckpt | ChatGLM-6B | 清华大学 | Encoder-Decder | You will not use, copy, modify, merge, publish, distribute, reproduce, or create derivative works of the Software, in whole or in part, for any commercial, military, or illegal purposes. | |
ChatRWKV | 7B | 2023-01 | 中英 | 小说 | ckpt | ChatRWKV | BlinkDL | RNN | Blog | Apache-2.0 license |
收集包含中文的多模态大模型,具备对话等功能。
模型 | 大小 | 时间 | 语言模型 | 视觉模型 | 语言 | 领域 | 下载 | 项目地址 | 机构/个人 | 文献 | 模型是否可以商用 |
---|---|---|---|---|---|---|---|---|---|---|---|
Ziya-BLIP2-14B-Visual-v1 | 14B | 2023-06 | LLaMA-13B | BLIP2 | 中英 | 通用 | ckpt | Fengshenbang-LM | IDEA研究院 | 基于 LLaMA | |
Video-LLaMA-BiLLA | 7B | 2023-05 | BiLLa-7B | MiniGPT-4 | 中英 | 通用 | ckpt | Video-LLaMA | 达摩院多语言NLP | Paper | 基于 LLaMA |
Video-LLaMA-Ziya | 13B | 2023-05 | Ziya-13B | MiniGPT-4 | 中英 | 通用 | ckpt | Video-LLaMA | 达摩院多语言NLP | Paper | 基于 LLaMA |
XrayGLM | 6B | 2023-05 | ChatGLM-6B | BLIP2-Qformer | 中英 | 医学 | ckpt-300 ckpt-3000 | XrayGLM | 澳门理工大学 | 本项目相关资源仅供学术研究之用,严禁用于商业用途。 | |
VisualGLM-6B | 6B | 2023-05 | ChatGLM-6B | BLIP2-Qformer | 中英 | 通用 | ckpt | VisualGLM-6B | 清华大学 | You will not use, copy, modify, merge, publish, distribute, reproduce, or create derivative works of the Software, in whole or in part, for any commercial, military, or illegal purposes. |
完结!