E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
chatGLM
清华开源语言大模型
ChatGLM
-6B调研
相关背景与重点整理相关背景大模型GLM介绍重点整理pretrain设置SuperGLUE多任务pretrain消融实验3.相关开源代码与数据集4.相关改进问题与延伸应用想法相关改进问题延伸应用想法参考文献1.综述性调研简介
ChatGLM
Pandy Bright
·
2023-12-21 22:48
机器学习
人工智能
自然语言处理
bert
nlp
gpt-3
文心一言
ChatGLM
-6B源码解析 之 web_demo.py
fromtransformersimportAutoModel,AutoTokenizerimportgradioasgrimportmdtex2htmltokenizer=AutoTokenizer.from_pretrained("THUDM/
chatglm
量化交易曾小健(金融号)
·
2023-12-21 20:15
大语言模型ChatGPT
-
LLM
python
人工智能
开发语言
ChatGLM
3-6B 的调用参数说明,chat 与stream_chat 接口函数的参数说明
ChatGLM
3-6B是一个语言大模型,最近在评估这个模型,但发现它的文档有限,只能从demo代码中猜测调用的参数的含义,准确度是有限的;于是,通过查看源代码来研究,目前整理笔记如下:
ChatGLM
3-
大飞飞鱼
·
2023-12-21 20:12
python
ChatGLM-6B
model.chat
python
开发语言
ChatGLM
-6B模型结构组件源码阅读
一、前言本文将介绍
ChatGLM
-6B的模型结构组件源码。
机器学习社区
·
2023-12-20 22:40
大模型
自然语言
pytorch
人工智能
python
大模型
大语言模型
整理了上百个开源中文大语言模型,涵盖模型、应用、数据集、微调、部署、评测
尤其是以
ChatGLM
、LLaMA等平民玩家都能跑起来的较小规模的LLM开源之后,业界涌现了非常多基于LLM的二次微调或应用的案例。
Python算法实战
·
2023-12-20 17:53
大模型理论与实战
大模型
语言模型
人工智能
自然语言处理
大模型
算法
微调
langchain
ChatGLM
3:打造更智能、更安全的代码解释器和工具使用体验
ChatGLM
3是由智谱AI训练的第三代大型语言模型,它不仅能理解和生成人类语言,还能执行代码、调用工具,并以markdown格式进行响应。
超级人工智能
·
2023-12-20 16:11
AI大模型
人工智能
nlp
机器学习
深度学习
AIGC
语言模型
国产AI大模型:智谱清言 vs. 文心一言
智谱清言基于智谱AI自主研发的中英双语对话模型
ChatGLM
2,通过万亿字符的文本与代码预训练,结合有监督微调技术,以通用对话的产品形态成为更懂用户的智能助手,在工作、学习和日常生活中赋能用户,解答用户各类问题
超级人工智能
·
2023-12-20 16:40
AI大模型
1024程序员节
人工智能
nlp
机器学习
AI作画
深度学习
AI编程
CodeGeeX2-6B:全新的编程助手,全方位能力升级!
这款基于
ChatGLM
2-6B架构并结合代码预训练的模型,以其更高的精度、更快的速度和更强的能力,为编程带来了一场革新。接下来,我们将一起探索这款新模型为CodeGeeX编程助手带来的升级。
超级人工智能
·
2023-12-20 16:40
AI大模型
人工智能
nlp
机器学习
AI编程
WebLangChain_
ChatGLM
:结合 WebLangChain 和
ChatGLM
3 的中文 RAG 系统
WebLangChain_
ChatGLM
介绍本文将详细介绍基于网络检索信息的检索增强生成系统,即WebLangChain。
kebijuelun
·
2023-12-20 12:10
语言模型
人工智能
langchain
chatgpt
【机器阅读理解】System Report for CCL23-Eval Task 9: HUST1037 Explore Proper Prompt Strategy for LLM in MRC
通过使用
ChatGLM
、GPT3.5和GPT4进行实验,我们发现提示语和LLM阅读理解能力之间存在相关性,提示语工程提高了每种模型的阅读理解能力。我们团队提交了系统评估结果,在三项指标和总分中均
辰阳星宇
·
2023-12-20 07:54
科研论文
prompt
策略模式
开源 AI 研发提效方案 Unit Mesh 总结
在这篇文章里,我们将总结UnitMesh的一系列项目,从国内最早开源的微调Llama、
ChatGLM
用于研发流程的Un
Phodal
·
2023-12-20 00:25
开源
人工智能
chatglm
2-6b本地部署(v0.1)
1.前置工具:安装anaconda,安装cuda/cudnn2.下载安装包和模型源码安装包:https://github.com/THUDM/
ChatGLM
2-6B模型:https://huggingface.co
alpha去下海
·
2023-12-18 21:26
chatglm
GPT实战系列-大话LLM大模型训练
探究GPT等大模型的文本生成GPT实战系列-Baichuan2等大模型的计算精度与量化GPT实战系列-GPT训练的Pretraining,SFT,RewardModeling,RLHFGPT实战系列-
ChatGLM
3
Alex_StarSky
·
2023-12-18 18:11
GPT实战系列
GPT训练
LLM
预训练
PEFT
ChatGLM
Baichuan
Qianwen
GPT实战系列-探究GPT等大模型的文本生成
GPT实战系列-Baichuan2等大模型的计算精度与量化-CSDN博客GPT实战系列-GPT训练的Pretraining,SFT,RewardModeling,RLHF-CSDN博客GPT实战系列-
ChatGLM
3
Alex_StarSky
·
2023-12-18 18:09
GPT实战系列
GPT
CoT
Baichuan
ChatGLM
LLM
文本生成
[Unity+智谱AI开放平台]调用
ChatGLM
Tuobo模型驱动AI小姐姐数字人
1.简述本篇文章主要介绍一下,在Unity端,集成智谱AI开放平台提供的
chatglm
模型api,实现AI聊天互动相关的功能。
阴沉的怪咖
·
2023-12-16 21:05
人工智能
【Datawhale组队学习】2023年11月动手学大模型应用开发 —— 第一章 大模型简介
国外的大模型有:GPT-3GPT-4PaLMGalacticaLLaMA国内的大模型有:
ChatGLM
文心一言通义千问讯飞星火尽管大型语言模型(例如拥
zadarmo_
·
2023-12-16 19:19
深度学习
学习
Chatglm
2-6b-lora&ptuning微调实践2
Chatglm
2-6B-lora&ptuning微调实践21.参考教程2.实践环境3.微调实战3.1环境安装3.2单gpu微调3.2.1lora微调**注意事项**1.lora微调代码2.lora微调代码所在位置
fengxiaoyangfeng
·
2023-12-16 16:33
chatglm2-6b
大模型实践
大模型微调
自然语言处理
chatgpt
nlp
chatglm
3部署使用
chatglm
3部署使用1.部署2.使用3.接入微信4.vue前端1.部署1.首先去github下载
chatglm
3代码。Huggingface下载模型一直失败,所以用阿里的魔塔社区下载。
我是小z呀
·
2023-12-16 04:39
AIGC
深度学习
人工智能
走向边缘智能,美格智能携手阿加犀成功在高算力AI模组上运行一系列大语言模型
美格智能发挥软硬件一体协同开发能力,融合阿加犀卓越的AI优化部署技术,在搭载高通QCS8550平台的高算力AI模组上,成功运行了一系列大语言模型,包括LLaMA-2、通义千问Qwen、百川大模型、RedPajama、
ChatGLM
2
美格智能
·
2023-12-15 23:38
人工智能
语言模型
自然语言处理
关于大模型
ChatGLM
3-6B在CPU下运行
所以对
ChatGLM
3-6B的使用做了深入了解,特别只有CPU没有GPU的本地运行,
ChatGLM
3-6B最好的选择之一。
早晨的初露
·
2023-12-15 19:25
人工智能
语言模型
chatgpt
【
ChatGLM
2-6B】问题解决cannot import name ‘Doc‘ from ‘typing_extensions‘
问题描述在运行
ChatGLM
2-6B大语言模型和使用P-Tuning训练的时候,出现如下错误cannotimportname'Doc'from'typing_extensions'问题原因因为安装的typing_extensions
太空眼睛
·
2023-12-15 18:00
人工智能
Doc
extensions
P-Tuning
ChatGLM2
typing
【
ChatGLM
2-6B】P-Tuning训练微调
机器配置阿里云GPU规格ecs.gn6i-c4g1.xlargeNVIDIAT4显卡*1GPU显存16G*1准备训练数据进入/
ChatGLM
-6B/ptuningmkdirAdvertiseGencdAdvertiseGen
太空眼睛
·
2023-12-15 18:30
人工智能
ChatGLM2
chatglm2-6b
大语言模型
P-Tuning
训练
微调
train
【
ChatGLM
2-6B】从0到1部署GPU版本
准备机器资源显卡:包含NVIDIA显卡的机器,如果是阿里云服务器可以选择ecs.gn6i-c4g1.xlarge规格硬盘:大约50G左右操作系统:CentOS7.964位CPU内存:4C16G更新操作系统sudoyumupdate-ysudoyumupgrade-y下载并安装anaconda在命令行中,输入以下命令,点击Enter,开始下载anaconda安装包。wgethttps://repo.
太空眼睛
·
2023-12-15 18:29
人工智能
ChatGLM2
GPU
NVIDIA
Pytorch
Anaconda
大语言模型
streamlit
【
ChatGLM
3】第三代大语言模型多GPU部署指南
关于
ChatGLM
3
ChatGLM
3是智谱AI与清华大学KEG实验室联合发布的新一代对话预训练模型。
太空眼睛
·
2023-12-15 18:53
人工智能
语言模型
人工智能
自然语言处理
ChatGLM
ChatGLM3
GPU
清华大学
如何基于
ChatGLM
3 构建企业级应用?
▼最近直播超级多,预约保你有收获今晚直播:《
ChatGLM
3架构设计和案例实战》—1—今晚20点
ChatGLM
3案例实战直播
ChatGLM
3提供了更强大的LLM基座,在语义、数据、推理、代码、知识等不同数据集上表现出色
musicml
·
2023-12-15 16:44
人工智能
《从GLM-130B到
ChatGLM
:大模型预训练与微调》笔记
第一部分100B参数的大模型开始出现智能涌现在code数据集上训练,增强大模型的逻辑推理能力第二部分GLM和LLaMA中采用RoPE旋转式编码BF16牺牲了数据精度(表示由10位降到7位),但扩大了数据的表示范围(有研究表明数据表示范围比精度更重要)LLaMA采用BF16训练的大部分内存占用为激活函数有个参数服务器,模型参数在参数服务器上进行更新,然后所有节点pull模型参数alpha取0.1,手
佛系调参
·
2023-12-15 13:01
自然语言处理
语言模型
自然语言处理
人工智能
LLaMA-Factory使用V100微调
ChatGLM
2报错 RuntimeError: “addmm_impl_cpu_“ not implemented for ‘Half‘
0python/aaa/LLaMA-Factory/src/train_bash.py\--stagesft\--model_name_or_path/aaa/LLaMA-Factory/models/
chatglm
2
ybdesire
·
2023-12-15 13:01
大语言模型
LLaMA-Factory
运维
llama
人工智能
chatgpt
语言模型
nlp
LLaMA-Factory用self_cognition数据微调
ChatGLM
2后,CLI运行输出乱码和报错 IndexError: piece id is out of range
/aaabbb/LLaMA-Factory/src/train_bash.py\--stagesft\--model_name_or_path/aaabbb/LLaMA-Factory/models/
chatglm
2
ybdesire
·
2023-12-15 13:01
大语言模型
LLaMA-Factory
运维
llama
python
深度学习
LLaMA-Factory可视化界面微调
chatglm
2;LoRA训练微调模型 简单案例
参考:https://github.com/huggingface/pefthttps://github.com/hiyouga/LLaMA-Factory1、LLaMA-Factory可视化界面微调
chatglm
2
loong_XL
·
2023-12-15 13:59
深度学习
深度学习
神经网络
人工智能
baichuan-7B-chat微调报错及解决记录 使用的仓库:LLaMA-Factory 2023年11月27日
LLaMA-Factoryhiyouga/LLaMA-Factory:Easy-to-useLLMfine-tuningframework(LLaMA,BLOOM,Mistral,Baichuan,Qwen,
ChatGLM
ygdzzx
·
2023-12-15 13:57
人工智能
深度学习
神经网络
自然语言处理
nlp
一文带你UI界面玩转
ChatGLM
以及Llama的微调
Lora微调的概念:lora是Low-RankAdaptation的缩写,是微软的Hu等人于2021年挂在ArXiv上(后又发表在ICLR2022上)的一篇论文《LoRA:Low-RankAdaptationofLargeLanguageModels》中提出的,通俗来讲,是一种降低模型可训练参数,又尽量不损失模型表现的大模型微调方法。为什么时隔两年,lora又突然火了一把呢?这一切都要感谢Chat
梅渍小番茄
·
2023-12-15 13:23
llama
自然语言处理
pytorch
语言模型
nlp
LLaMA-Factory微调
ChatGLM
3报错: Segmentation fault (core dumped)
SFT训练模型的命令CUDA_VISIBLE_DEVICES=0pythonsrc/train_bash.py\--stagesft\--model_name_or_pathmodels/
chatglm
3
ybdesire
·
2023-12-15 13:19
大语言模型
LLaMA-Factory
性能
llama
人工智能
安装LLaMA-Factory微调
chatglm
3,修改自我认知
安装gitclonehttps://github.com/hiyouga/LLaMA-Factory.gitcondacreate-nllama_factorypython=3.10condaactivatellama_factorycdLLaMA-Factorypipinstall-rrequirements.txt之后运行单卡训练,CUDA_VISIBLE_DEVICES=0pythonsrc
小草cys
·
2023-12-15 13:46
python
人工智能
深度学习
LangChain知识库文件格式与准确率
本文结论经过自行测试,仅供参考简介langchain使用的是faiss,bge-large-zh,基础模型为
chatglm
3-6b,测试数据接近60万。
赵昕彧
·
2023-12-15 08:36
大语言模型
langchain
自然语言处理
不用再找,这是大模型 LLM 微调经验最全总结
大家好,今天对大模型微调项目代码进行了重构,支持
ChatGLM
和
ChatGLM
2模型微调的切换,增加了代码的可读性,并且支持Freeze方法、Lora方法、P-Tuning方法、「全量参数方法」微调。
Python算法实战
·
2023-12-15 02:32
大模型
大模型理论与实战
pytorch
python
人工智能
语言模型
大模型
【玩转 TableAgent数据智能分析】-数据分析师的大模型
的新手入门指南:官网首页立刻体验问题测试问题1:问题2:问题3:问题4:问题5:通用大模型对比分析对csv数据集的支持比较:TableAgent对csv格式支持情况测试:文心一言对csv格式支持情况测试:
Chatglm
2
IT从业者张某某
·
2023-12-14 18:18
数据处理与数据分析
数据分析
LLM部署-Fastllm
huggingface接口创建模型fromtransformersimportAutoTokenizer,AutoModeltokenizer=AutoTokenizer.from_pretrained("THUDM/
chatglm
2
银晗
·
2023-12-05 10:19
python
人工智能
深度学习
RoPE旋转位置编码浅析
RoPE旋转位置编码浅析本文介绍了旋转位置编码RoPE在大模型中的广泛应用,包括Llama、Mistral7B、Baichuan、
ChatGLM
、Qwen、…等。
段智华
·
2023-12-05 08:47
ChatGPT学习
RoPE
基于Langchain的txt文本向量库搭建与检索
这里的源码主要来自于Langchain-
ChatGLM
中的向量库部分,做了一些代码上的修改和封装,以适用于基于问题和包含数据库表描述的txt文件(文件名为库表名,文件内容为库表中的字段及描述)对数据库表进行快速检索
羊城迷鹿
·
2023-12-05 00:23
自然语言处理
langchain
mac M系列芯片安装
chatGLM
3-6b模型
repo.anaconda.com/miniconda/Miniconda3-latest-MacOSX-arm64.shshMiniconda3-latest-MacOSX-arm64.sh1.2创建虚拟环境并激活创建名为
chatglm
3
晚点吧
·
2023-12-04 09:34
算法工程化
大模型
chatglm
魔塔社区
LLM大语言模型(一):
ChatGLM
3-6B试用
AMDRyzen53600X6-CoreProcessorMem:32GBGPU:RTX4060Ti16GChatGLM3代码库下载#下载代码库gitclone https://github.com/THUDM/
ChatGLM
3
Hugo Lei
·
2023-12-04 05:38
LLM工程
语言模型
人工智能
自然语言处理
LLM
chatglm
GPU
【自然语言处理】【大模型】VeRA:可调参数比LoRA小10倍的低秩微调方法
pdf/2310.11454.pdf相关博客【自然语言处理】【大模型】VeRA:可调参数比LoRA小10倍的低秩微调方法【自然语言处理】【大模型】MPT模型结构源码解析(单机版)【自然语言处理】【大模型】
ChatGLM
BQW_
·
2023-12-04 02:32
自然语言处理
自然语言处理
人工智能
LoRA
PEFT
微调
【LangChain实战】开源模型学习(1)-
ChatGLM
2-6B
介绍
ChatGLM
2-6B是开源中英双语对话模型
ChatGLM
-6B的第二代版本,在保留了初代模型对话流畅、部署门槛较低等众多优秀特性的基础之上,
ChatGLM
2-6B引入了如下新特性:更强大的性能:基于
码农丁丁
·
2023-12-03 23:12
人工智能
#
langchain
langchain
开源
人工智能
【LangChain实战】开源模型学习(2)-
ChatGLM
3
介绍
ChatGLM
3是智谱AI和清华大学KEG实验室联合发布的新一代对话预训练模型。
码农丁丁
·
2023-12-03 23:12
人工智能
#
langchain
langchain
开源
学习
Langchain-Chatchat的安装过程
参考:LLMs之RAG:LangChain-Chatchat(一款中文友好的全流程本地知识库问答应用)的简介(支持FastChat接入的
ChatGLM
-2/LLaMA-2等多款主流LLMs+多款embe
wangqiaowq
·
2023-12-03 21:31
langchain
ChatGLM
3-6B安装
1CentOS7安装Python101.1安装基础环境yum-yinstallzlib-develbzip2-developenssl-develncurses-develsqlite-develreadline-develtk-develgdbm-develdb4-devellibpcap-develxz-devellibffi-devel1.2升级OpenSSL不升级OpenSSL,pipin
MasonYyp
·
2023-12-03 16:55
python
【大模型】更强的
ChatGLM
3-6B 来了,开源可商用
【大模型】更强的
ChatGLM
3-6B来了,开源可商用简介
ChatGLM
3-6B环境配置环境搭建安装依赖代码及模型权重拉取拉取
ChatGLM
3-6B拉取
ChatGLM
3-6B模型权重及代码终端测试网页测试安装
szZack
·
2023-12-03 02:07
大语言模型
人工智能
自然语言处理
ChatGLM3-6B
大模型&AIGC
大模型干货教程看这一个就够了~2023年全网最硬核最全面的大模型公开课|大模型微调|
ChatGLM
|LangChain_哔哩哔哩_bilibiliAI产品经理养成记_哔哩哔哩_bilibili
乒乒乓乓丫
·
2023-12-02 17:07
产品经理
AIGC
ChatGLM
2-6B本地化部署
ChatGlm
2-6B部署【GPU显存建议12G以上,以下为单卡GPU环境】环境需求【当前环境未使用虚拟环境,建议使用虚拟环境安装】#安装Python3.8及以上#torch2.0对应CUDA11.7/
陈陈小网工
·
2023-12-02 12:50
语言模型
云计算
在服务器的Docker容器上部署
ChatGLM
2-6B
文件下载在https://github.com/THUDM/
ChatGLM
2-6B上进行模型的下载。
大多_C
·
2023-12-02 12:20
服务器
docker
运维
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他