E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
LLaMA
Mixture of Experts(MoE)学习笔记
不过在这之后开源社区并没有对MoE架构进行很多的探索,更多的工作还是聚焦在预训练新的大模型,在
Llama
2或其他模型上做Fine-tune,以及扩展大模型的ContextLength。12月8号
南七小僧
·
2025-02-03 12:44
人工智能
网站开发
医疗器械研发
学习
笔记
人工智能
MoE
大模型
最强开源大模型炸场!全网独一份AI大模型学习实践资源...(待会删)
Meta发布
Llama
3系列模型,号称「最强大的开源大模型」,震撼科技圈!毫不夸张地说,AI大模型正在颠覆程序员的价值!
大模型应用
·
2025-02-02 21:11
人工智能
大数据
prompt
langchain
Agent
ai大模型
LLM
本地部署LLM工具大比拼:谁才是你的智能之选?
今天,就带大家深入对比几款热门的本地部署LLM工具:ollama、Llamafile、jan、
LLaMa
.cpp、GPT4All、LMStudio,从多个关键角度剖析它们的特点与优势,助你挑选出最契合自身需求的智能伙伴
Python_金钱豹
·
2025-02-02 21:10
microsoft
ocr
人工智能
cnn
transformer
分类
国产大模型 DeepSeek,能跟 ChatGPT 一战,还不用梯子,确定不试试?
深度求索公司最新推出的自研MoE模型DeepSeek-V3,多项评测成绩超越了Qwen2.5-72B和
Llama
-3.1-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude
集成显卡
·
2025-02-02 21:38
AI/人工智能
chatgpt
什么是LLM?看这一篇就够了!
GPT、
LLaMA
、M
Python程序员罗宾
·
2025-02-02 14:50
人工智能
语言模型
AIGC
自然语言处理
在Windows上用
Llama
Factory微调
Llama
3的基本操作
这篇博客参考了一些文章,例如:教程:利用
LLaMA
_Factory微调
llama
3:8b大模型_
llama
3模型微调保存-CSDN博客也可以参考LlamaFactory的Readme:GitHub-hiyouga
蛐蛐蛐
·
2025-02-02 13:16
深度学习
Python技巧
科研工具
llama
【llm对话系统】大模型
Llama
源码分析之并行训练方案
Llama
作为当前最流行的开源大模型之一,其训练代码中采用了多种并行技术。本文将深入
Llama
的训练代码,分析其并行训练方案,主要关注参数并行和部分结构参数共享。
kakaZhui
·
2025-02-02 13:14
llama
人工智能
AIGC
chatgpt
【llm对话系统】大模型
Llama
源码分析之 LoRA 微调
本文将深入分析LoRA的原理,并结合
Llama
源码解读其实现逻辑,最后探讨LoRA的优势。2
kakaZhui
·
2025-02-02 13:14
llama
深度学习
pytorch
AIGC
chatgpt
【llm对话系统】大模型
Llama
源码分析之 Flash Attention
1.写在前面近年来,基于Transformer架构的大型语言模型(LLM)在自然语言处理(NLP)领域取得了巨大的成功。Transformer的核心组件是自注意力(Self-Attention)机制,它允许模型捕捉输入序列中不同位置之间的关系。然而,标准的自注意力机制的计算复杂度与序列长度的平方成正比,这使得它在处理长序列时效率低下。为了解决这个问题,FlashAttention被提出,它是一种高
kakaZhui
·
2025-02-02 13:43
llama
人工智能
AIGC
chatgpt
llama
.cpp LLM_CHAT_TEMPLATE_DEEPSEEK_3
llama
.cppLLM_CHAT_TEMPLATE_DEEPSEEK_31.`
LLAMA
_VOCAB_PRE_TYPE_DEEPSEEK3_LLM`2.
Yongqiang Cheng
·
2025-02-02 12:10
ggml
-
llama.cpp
-
whisper.cpp
llama.cpp
DEEPSEEK_3
【明明安装flash-attn成功,但是import的时候报错】
Thismodelingfilerequiresthefollowingpackagesthatwerenotfoundinyourenvironment:flash_attn.明明安装flash-attn成功,但是import的时候报错问题描述:运行
Llama
2
厂泉心
·
2025-02-02 12:07
python
自然语言处理
【llm对话系统】大模型
Llama
、Qwen 和 ChatGLM 的网络结构和训练方法对比
1.引言近年来,大型语言模型(LLM)取得了令人瞩目的进展,其中
Llama
、Qwen和ChatGLM是三个备受关注的开源模型。
kakaZhui
·
2025-02-02 07:54
llama
人工智能
AIGC
chatgpt
python
开源LLMs导览:工作原理、顶级LLM列表对比
4.1BERT4.2
LLaMA
(LargeLanguageModelM
万俟淋曦
·
2025-02-01 23:11
Some
Insights
人工智能
AI
生成式人工智能
大模型
LLM
chatgpt
大语言模型
深入探索
Llama
.cpp:在LangChain中使用
llama
-cpp-python
深入探索
Llama
.cpp:在LangChain中使用
llama
-cpp-python随着大语言模型(LLMs)的普及,开发者需要更有效的方法来部署和使用这些模型。
dfvcbipanjr
·
2025-02-01 16:10
python
llama
langchain
使用Ollama本地化部署DeepSeek
多模型支持:兼容多种开源模型,如
LLaMA
、DeepSeek等。高效管理:提供命令行工具,方便用户下载
·
2025-02-01 16:48
大模型llm人工智能
Llama
大型语言模型原理详解
Llama
大型语言模型是一种基于深度学习的自然语言处理模型,它在文本生成、问答、摘要等多种NLP任务中展现出强大的性能。
摆烂大大王
·
2025-01-31 11:40
llama
llama
语言模型
人工智能
中国Deepseek超
Llama
4触发Meta
恐慌模式始于DeepseekV3,它在性能测试中已经超过了
Llama
4。更让人尴尬的是
极道Jdon
·
2025-01-31 08:13
javascript
reactjs
开源大模型(LLM)下载
1、找到对应的模型文件,比如Meta-
Llama
-3-8B,然后找到下载入口2、点击模型下载,有2种下载方式,这里我们通过git下载(注意由于模型文件一般都比较大,直接使用gitclone下载时会有问题
baidu_20834545
·
2025-01-31 06:25
语言模型
【llm对话系统】大模型源码分析之
llama
模型的long context更长上下文支持
1.引言
Llama
模型的一个重要特性是支持长上下文处理。本文将深入分析
Llama
源码中实现长上下文的关键技术点,包括位置编码(positionembedding)的外推方法、注意力机制的优化等。
kakaZhui
·
2025-01-30 12:57
llama
深度学习
pytorch
AIGC
chatgpt
Llama
3:开源大模型的里程碑式突破
标题:
Llama
3:开源大模型的里程碑式突破文章信息摘要:Meta通过
Llama
3展现了开源LLM的重大突破:采用超大规模训练数据和多阶段训练方法(SFT、rejectionsampling、PPO和DPO
XianxinMao
·
2025-01-30 08:50
llama
开源
【深度分析】Deepseek为什么会这么爆火?
这场看似技术跃迁的盛宴,实则是算力霸权崩塌的末日钟声——当中国团队用1/10的显卡数量训练出性能碾压
Llama
3的模型,硅谷引以为傲的暴力堆料范式正在沦为数字时代的蒸汽机车。
精通代码大仙
·
2025-01-30 06:35
深度分析
新媒体运营
创业创新
如何评价deepseek上线的deepseek-V3模型?怎么使用?
该模型在多项评测中表现出色,超越了Qwen2.5-72B和
Llama
-3.1-405B等开源模型,并与世界顶尖的闭源模型如GPT-4o和Claude-3.5-Sonnet相媲美。
百态老人
·
2025-01-30 01:36
学习
【llm对话系统】大模型源码分析之
LLaMA
位置编码 RoPE
本文将深入探讨
LLaMA
模型中使用的RotaryEmbedding(旋转式嵌入)位置编码方法,并对比传统的Transformer位置编码方案,分析其设计与实现的优势。1.传
kakaZhui
·
2025-01-29 23:17
llama
深度学习
人工智能
AIGC
chatgpt
大模型部署工具
llama
.cpp 介绍与安装使用
1.大模型部署工具
llama
.cpp大模型的研究分为训练和推理两个部分。训练的过程,实际上就是在寻找模型参数,使得模型的损失函数最小化,推理结果最优化的过程。
大模型柳儿
·
2025-01-29 18:03
llama
服务器
人工智能
web安全
linux
安全
为什么提到各种本地化部署模型软件时总要提到
llama
.cpp?
为什么提到各种本地化部署模型软件时总要提到
llama
.cpp?
llama
.cpp是一个完整的开源项目,而不是单独的.cpp文件。
风雅GW
·
2025-01-29 18:00
人工智能
llama
人工智能
机器学习
LLM
ai
Llama
.cpp与Python的完美结合:快速入门指南
Llama
.cpp与Python的完美结合:快速入门指南引言在现代AI的浪潮中,
Llama
.cpp提供了一种便捷的方法,将大型语言模型(LLM)集成到您的项目中。
nseejrukjhad
·
2025-01-29 17:29
llama
python
开发语言
Llama
-CPP-Python 教程
Llama
-CPP-Python教程项目地址:https://gitcode.com/gh_mirrors/ll/
llama
-cpp-python1.项目介绍
Llama
-CPP-Python是一个Python
胡寒侃Joe
·
2025-01-29 17:27
RAG:AI大模型联合向量数据库和
Llama
-index,助力检索增强生成技术
RAG:AI大模型联合向量数据库和
Llama
-index,助力检索增强生成技术在大模型爆发的时代,快速准确地从大量数据中检索出有价值的信息变得至关重要。
AI学习不迷路
·
2025-01-29 10:21
人工智能
数据库
llama
语言模型
RAG
大模型
AI大模型
A7. Jenkins Pipeline自动化构建过程,可灵活配置多项目、多模块服务实战
此时我们在构建之前也要执行不可用的镜像清除操作;4.本地
LLama
大模型服务地址,如何以容器部署时作
smart_ljh
·
2025-01-29 02:01
AI大模型应用与实战
spring
boot
自动化
后端
自动化构建
服务构建
build
A6.Springboot-
LLama
3.2服务自动化构建(三)——编写Pipeline构建仓库初始化脚本
下面我们接着上一篇文章《A5.Springboot-
LLama
3.2服务自动化构建(二)——Jenkins流水线构建配置初始化设置》继续往下分析,编写Pipeline构建脚本。
smart_ljh
·
2025-01-29 00:50
AI大模型应用与实战
spring
boot
自动化
servlet
jenkins
构建
Ollama 可以设置的环境变量
Llama
3.1是Meta(Facebook的母公司)发布的一系列最先进的开源大语言模型。
Llama
3
刘贤松
·
2025-01-28 22:02
工具
服务器
运维
[论文笔记]
llama
-factory 微调qwen2.5、
llama
3踩坑
pre-tokenize的时候,会OOM解决:在yaml文件中添加streaming参数#tokenizestreaming:Truemax_steps:10000https://github.com/hiyouga/
LLaMA
-Factory
心心喵
·
2025-01-28 20:14
论文笔记
深度学习
人工智能
llamafactory0.9.0微调qwen2vl
LLaMA
-Factory/data/README_zh.mdatmain·hiyouga/
LLaMA
-Factory·GitHubEfficientlyFine-Tune100+LLMsinWebUI
Kun Li
·
2025-01-28 15:07
多模态大语言模型
lmm
qwen2vl
实验踩坑 flash_attn_2_cuda undifiend symol
报错RuntimeError:Failedtoimporttransformers.models.
llama
.modeling_llamabecauseofthefollowingerror(lookuptoseeitstraceback
崩溃李
·
2025-01-28 00:51
linux
探索
Llama
3.1:深入理解其多语言与长上下文处理能力
摘要
Llama
3.1,一款先进的语言模型,以其庞大的参数量和卓越的性能而闻名。
技术猿18870278351
·
2025-01-27 08:00
代码技术
llama
对话小羊驼vicuna
文章目录1.gpu租用2.公网网盘存储实例/数据3.登录实例4.预训练模型下载5.
llama
、alpaca、vicuna的前世今生6.对话Vicuna(1)
llama
-2-7b-hf(2)vicuna-
Always_Shine
·
2025-01-27 01:44
大模型
人工智能
深度学习
大模型
自然语言处理
Firefly-
LLaMA
2-Chinese - 开源中文
LLaMA
2大模型
数据列表训练细节增量预训练&指令微调数据格式&数据处理逻辑增量预训练指令微调模型推理权重合并模型推理部署关于github:https://github.com/yangjianxin1/Firefly-
LLaMA
2
伊织产研
·
2025-01-27 00:07
Firefly-LLaMA2
LLaMA-2
Meta
Llama
3 使用 Hugging Face 和 PyTorch 优化 CPU 推理
原文地址:meta-
llama
-3-optimized-cpu-inference-with-hugging-face-and-pytorch了解在CPU上部署Meta*
Llama
3时如何减少模型延迟2024
lichunericli
·
2025-01-27 00:37
人工智能
pytorch
llama
Llama
3本地部署的解决方案
本文主要介绍了
Llama
3本地部署的解决方案,希望对学习大语言模型的同学们有所帮助。文
herosunly
·
2025-01-27 00:36
llama3
llama
本地部署
API
解决方案
如何使用
Llama
-2-7b-chat-hf模型进行对话生成
如何使用
Llama
-2-7b-chat-hf模型进行对话生成
Llama
-2-7b-chat-hf项目地址:https://gitcode.com/mirrors/NousResearch/
Llama
-2
娄泳含
·
2025-01-27 00:36
探索
Llama
Recipes:Meta
Llama
模型的实用示例库
现在,有了
llama
-recipes这个开源项目,开发者可以轻松上手并充分利用这些模型。本文将引导您了解这个项目,它的技术优势,适用场景以及鲜明特点。项目
郁英忆
·
2025-01-27 00:05
深入解析vLLM:加速大模型推理的高效框架
深入解析vLLM:加速大模型推理的高效框架引言在现代深度学习应用中,大型语言模型(如GPT、GLM、
LLaMA
、Qwen等)的推理速度和资源利用率成为关键挑战。
秋声studio
·
2025-01-27 00:34
口语化解析
人工智能
模型调优
nlp
vLLM
Hugging Face Transformers and Meta
Llama
`src/transformers/models/
llama
`2.MetaLlama2.1.
Llama
32.2.
Llama
22.3.LlamaCookbook:TheOfficialGuidetobuildingwithLlamaMod
Yongqiang Cheng
·
2025-01-27 00:02
Large
Language
Model
(LLM)
Hugging
Face
Transformers
Meta
Llama
DeepSeek 公开新的模型权重
DeepSeek-V3是一款开源大语言模型,在关键基准测试中超越了
Llama
3.1405B和GPT-4o,尤其在编码和数学任务中成绩优异。
数据分析能量站
·
2025-01-24 19:22
机器学习
人工智能
LLaMA
Pro是什么 相比于lora full freeze有什么区别 怎么使用
LLaMAPro是一种基于
LLaMA
架构改进的大型语言模型(LLM),旨在解决大模型微调中的知识遗忘问题。
Ven%
·
2025-01-24 16:58
简单说深度学习
深度学习基础动手
深度学习速通系列
llama
transformer
深度学习
人工智能
使用Google Cloud Vertex AI进行文本和多模态生成
通过VertexAI,用户可以利用不同的基础模型,如Gemini、Palm、和
Llama
,来实现复杂的AI应用。
sagvWSRJHMNEB
·
2025-01-24 06:07
人工智能
计算机视觉
python
人工智能与人工计算的发展——孙凝晖院士
OpenAI公司推出一款人工智能对话聊天机器人ChatGPT,其出色的自然语言生成能力引起了全世界范围的广泛关注,2个月突破1亿用户,国内外随即掀起了一场大模型浪潮,Gemini、文心一言、Copilot、
LLaMA
一位安分的码农
·
2025-01-24 01:26
大语言模型
人工智能
阿里云docker镜像仓库
一、阿里云控制台搜:容器镜像服务二、选个人版,企业版收费设置命名空间andy设置仓库名例如
llama
三、使用1、登录dockerlogin--username=***registry.cn-hangzhou.aliyuncs.com2
Ai君臣
·
2025-01-24 00:52
阿里云
云计算
SGLang安装教程,部署你的大模型,性能比vllm好,实现张量并行,数据并行,加快推理速度,亲测效果好。
目前大模型部署工具主要是vllm,最近出现了SGLang,很多新开源大模型都支持SGLang的部署推理,例如deepseek-R1,Qwen2.5,Mistral,GLM-4,MiniCPM3,InternLM2,
Llama
3.2
张登杰踩
·
2025-01-23 17:03
人工智能
结对编程
python
个性化的语言模型构建思路
将开源模型(如
Llama
3、Qwen、Falcon3…等)转变为个人专属的大语言模型,通常涉及知识库的构建、微调(fine-tuning)和模型定制等步骤。
由数入道
·
2025-01-23 11:19
人工智能
语言模型
人工智能
自然语言处理
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他