E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
LLAMA
给没有登录认证的web应用添加登录认证(openresty lua实现)
我也折腾了下本地部署,ollama、vllm、
llama
.cpp都弄了下,webui也用了几个,发现nextjs-ollama-llm-ui小巧方便,挺适合个人使用的。
dgiij
·
2025-03-06 08:47
前端
openresty
lua
《深度学习实战》第12集:大模型的未来与行业应用
深度学习实战|第12集:大模型的未来与行业应用随着深度学习技术的快速发展,大模型(如GPT、
LLaMA
、Bloom等)已经成为人工智能领域的核心驱动力。
带娃的IT创业者
·
2025-03-06 01:15
深度学习实战
深度学习
深度学习突破:
LLaMA
-MoE模型的高效训练策略
为了解决这一问题,Mixture-of-Expert(MoE)模型架构应运而生,而
LLaMA
-MoE正是这一架构下的重要代表。
人工智能大模型讲师培训咨询叶梓
·
2025-03-06 01:44
深度学习
llama
人工智能
Llama-Moe
大模型
语言模型
大语言模型技术发展
摘要海外闭源模型领域竞争激烈,OpenAI保持领先地位,而开源模型如Meta的
Llama
系列也逐渐崛起。
联蔚盘云
·
2025-03-06 00:43
经验分享
llama
-cpp-python 项目常见问题解决方案
llama
-cpp-python项目常见问题解决方案
llama
-cpp-pythonPythonbindingsforllama.cpp项目地址:https://gitcode.com/gh_mirrors
蔡晶斯
·
2025-03-05 21:13
【大模型开源实战】10 分钟,教你如何用
LLama
-Factory 训练和微调大模型
在这个AI快速发展的时代,我们很高兴为大家带来LlamaFactory-一个为AI开发者和爱好者量身打造的实用工具平台。作为非计算机专业出身的开发者,我们深深受益于计算机世界的开放共享精神。今天,我们希望通过LlamaFactory为这个社区贡献我们的一份力量。LlamaFactory能为您提供什么?英文文档的AI翻译:利用大语言模型将英文文档翻译成中文,助您更便捷地获取最新技术信息。快速获取主流
Langchain
·
2025-03-05 06:40
llama
人工智能
自然语言处理
大模型
LLaMA
Factory
LLM
大语言模型
大模型本地部署
Llama
3.1:Ollama、OpenWeb UI 和 Spring AI 的综合指南
本文介绍如何使用Ollama在本地部署
Llama
3.1:8B模型,并通过OpenWebUI和SpringAI来增强模型交互体验和简化API的调用过程。
m0_74822999
·
2025-03-04 23:43
面试
学习路线
阿里巴巴
llama
ui
spring
unsloth+Colab+DeepSeek-R1-Distill-
Llama
-8B轻松上手
unsloth+Colab+DeepSeek-R1-Distill_哔哩哔哩_bilibili简介:DeepSeek-R1-Distill-
Llama
-8B是一个基于
Llama
架构的8B参数语言模型,经过深度蒸馏
AI超元域
·
2025-03-04 07:08
sql
llama
数据库
ai
人工智能
AI编程
llama
-factory ||启智平台
1.在启智平台上找到没有安装tensorflow的镜像作为基础镜像把
llama
-factory的github仓库进行下载,得到zip压缩包,上传到启智平台中,如下:2.执行命令如下进入文件夹cdLLaMA-Factory-main
失眠的树亚
·
2025-03-04 05:27
服务器
llama
大模型开发和微调工具
Llama
-Factory-->WebUI
WebUILLaMA-Factory支持通过WebUI零代码微调大模型。通过如下指令进入WebUIllamafactory-cliwebui#如果是国内,#USE_MODELSCOPE_HUB设为1,表示模型从ModelScope魔搭社区下载。#避免从HuggingFace下载模型导致网速不畅USE_MODELSCOPE_HUB=1llamafactory-cliwebui1.训练在模型开始训练之
m0_74823705
·
2025-03-04 05:56
llama
LLaMA
(Meta开源的AI模型)与Ollama(本地运行和管理大模型的工具)简介(注意这俩虽然名字相似但没有直接联系)
文章目录
LLaMA
**
Llama
系列模型发展**1.**
Llama
1(2023年2月)**2.**
Llama
2(2023年7月)**3.
Dontla
·
2025-03-04 04:54
人工智能
大模型LLM
llama
开源
人工智能
DeepSeek 1.5B 蒸馏模型的征程 6 部署(
Llama
方式)
前言DeepSeek是一款基于人工智能的搜索引擎,旨在提升用户的搜索体验。它利用先进的自然语言处理技术,通过理解查询的上下文和意图,为用户提供更精确、相关的搜索结果。与传统的搜索引擎不同,DeepSeek不仅仅依赖于关键词匹配,还能通过深度学习分析用户的需求,呈现更加智能化的搜索结果。此外,DeepSeek还具备语义理解能力,能够处理复杂的查询,并在短时间内给出最符合用户需求的答案。DeepSee
·
2025-03-03 17:17
自动驾驶算法
Llama
3.2入门基础教程(非常详细),
Llama
3.2微调、部署以及多模态训练入门到精通,收藏这一篇就够了!
9月25日Meta发布了
Llama
3.2,包括11B和90B的视觉语言模型。前排提示,文末有大模型AGI-CSDN独家资料包哦!
中年猿人
·
2025-03-03 17:49
llama
android
人工智能
语言模型
深度学习
学习
自然语言处理
python测试ollama的API接口是否可用
python测试ollama的API接口是否可用测试代码ollama_API_test.pyimportollamamodele_name="
llama
3"message="""Whyistheskyblue
王铁柱子哟-
·
2025-03-03 06:26
杂七杂八的学习笔记
python
llama
《AI大模型开发笔记》DeepSeek技术创新点
对比同级别
Llama
3-40
Richard Chijq
·
2025-03-03 03:57
AI大模型开发笔记
人工智能
笔记
llama
_factory微调QWen1.5
GitHub-hiyouga/
LLaMA
-Factory:UnifyEfficientFine-Tuningof100+LLMsUnifyEfficientFine-Tuningof100+LLMs.Contributetohiyouga
Kun Li
·
2025-03-03 02:50
大语言模型
llama
qwen
LLaMA
Factory添加新模型template的实战解析
大家好,我是herosunly。985院校硕士毕业,现担任算法研究员一职,热衷于大模型算法的研究与应用。曾担任百度千帆大模型比赛、BPAA算法大赛评委,编写微软OpenAI考试认证指导手册。曾获得阿里云天池比赛第一名,CCF比赛第二名,科大讯飞比赛第三名。授权多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法行业就业。希望和大家一起成长进步。
herosunly
·
2025-03-03 01:19
大模型
llama
factory
新模型
template
实战解析
微调DeepSeek-R1-Distill-
Llama
-8B打造sql2text大模型!小白也能十分钟打造自己的推理大模型!unsloth+Colab轻松上手
简介:DeepSeek-R1-Distill-
Llama
-8B是一个基于
Llama
架构的8B参数语言模型,经过深度蒸馏(distillation)处理,旨在提高推理效率和精度。
X.Cristiano
·
2025-03-02 23:28
DeepSeek-R1
Llama-8B
sql2text
人工智能
通过 PromptTemplate 生成干净的 SQL 查询语句并执行SQL查询语句
问题描述在使用LangChain和
Llama
模型生成SQL查询时,遇到了sqlite3.OperationalError错误。
背太阳的牧羊人
·
2025-03-02 22:22
RAG优化方法
RAG+langchain
sql
数据库
python
langchain
createsql_agent
SQLDatabase
Toolkit
构造一个工具(TravelSQLAgentTool),利用大语言模型(例如
Llama
模型)来完成 SQL 查询代理工具
完整代码:fromlangchain_core.toolsimporttoolfromlangchain_community.utilitiesimportSQLDatabasefromlangchain_core.promptsimportPromptTemplatefromlangchain_core.output_parsersimportStrOutputParserfromlangcha
背太阳的牧羊人
·
2025-03-02 22:22
agent+langchain
语言模型
llama
sql
人工智能
langchain
agent
langchain工具
Llama
2架构深度解析:Meta开源的70B参数大模型设计哲学
一、架构设计理念
Llama
2作为Meta开源的商用级大语言模型,其架构设计体现了三大核心原则:效率优先:在7B/13B/70B参数规模下保持线性计算复杂度扩展性强化:通过改进注意力机制支持4k上下文长度安全性内嵌
AI时代已来!
·
2025-03-02 14:46
llama
架构
【模型部署】大模型部署工具对比:SGLang, Ollama, VLLM,
LLaMA
.cpp如何选择?
LLaMA
.cpp:这是一个针对C++优化的
LLaMA
模型实现,特别适合在资源受限的环境中
深度求索者
·
2025-03-02 08:19
llama
人工智能
本地大模型编程实战(09)自制聊天机器人(3)
包括:使用LangGraph构建聊天机器人自动裁剪聊天历史管理聊天会话的方法以流的方式输出回复我们将同时使用
llama
3.1和deepseek做演示。
火云牌神
·
2025-03-01 15:52
AI编程实战
python
langchain
llama
deepseek
借助知识图谱和
Llama
-Index实现基于大模型的RAG
幻觉是在处理大型语言模型(LLMs)时常见的问题。LLMs生成流畅连贯的文本,但经常产生不准确或不一致的信息。防止LLMs中出现幻觉的一种方法是使用外部知识源,如提供事实信息的数据库或知识图谱。矢量数据库和知识图谱使用不同的方法来存储和表示数据。矢量数据库适合基于相似性的操作,知识图谱旨在捕捉和分析复杂的关系和依赖关系。对于LLM中的幻觉问题,知识图谱是一个比向量数据库更好的解决方案。知识图谱为L
爱吃牛油果的璐璐
·
2025-03-01 08:32
知识图谱
llama
oracle
语言模型
chatgpt
transformer
人工智能
[论文笔记] LLM大模型剪枝篇——2、剪枝总体方案
N=20(N:剪枝崩溃临界点,
LLaMA
2在45%,Mistral-7B在35%,Qwen在20%,Phi-2在25%)对后(P
心心喵
·
2025-03-01 04:25
论文笔记
剪枝
算法
机器学习
【deepseek】deepseek-r1本地部署-第三步:下载模型
二、操作1、LMStudio开发模式切换模式名字PowerUser2、下载模型模型名字DeepSeek-R1-Distill-
Llama
-8B-GGUF3、下载完成三、总结按需选择合适的bit的模型,否则会跑不动
Evenurs
·
2025-03-01 02:45
ai
deepseek
谈谈DeepSeek-v3在算力约束下的出色工作
DeepSeek-v3在算力约束下的出色工作原创渣Bzartbot2024年12月28日22:52上海寒冷的周末,加完班挤点时间读个论文吧.Deepseek-v3仅用了2048块H800GPU就超越了
Llama
3405B
强化学习曾小健
·
2025-02-28 22:19
Deepseek原理与使用
人工智能
【llm对话系统】大模型源码分析之
LLaMA
模型的 Masked Attention
然而,在自回归(autoregressive)模型中,例如
LLaMA
,我们需要对注意力进行屏蔽(Masking),以防止模型“偷看”未来的信息。
kakaZhui
·
2025-02-28 20:03
llama
人工智能
AIGC
chatgpt
python
Llama
.cpp 服务器安装指南(使用 Docker,GPU 专用)
前置条件在开始之前,请确保你的系统满足以下要求:操作系统:Ubuntu20.04/22.04(或支持Docker的Linux系统)。硬件:NVIDIAGPU(例如RTX4090)。内存:16GB+系统内存,GPU需12GB+显存(RTX4090有24GB)。存储:15GB+可用空间(用于源码、镜像和模型文件)。网络:需要互联网连接以下载源码和依赖。软件:已安装并运行Docker。已安装NVIDIA
田猿笔记
·
2025-02-28 09:37
AI
高级应用
llama
服务器
docker
llama.cpp
自编大模型系列之 01 使用 Python 从头构建
LLaMA
3 编写您自己的十亿参数LLM(教程含源码)
LLaMA
3是继Mistral之后最有前途的开源模型之一,可以解决各种任务。我之前在Medium上写过一篇博客,介绍如何使用
LLaMA
架构从头开始创建一个具有超过230万个参数的LLM。
知识大胖
·
2025-02-27 10:33
NVIDIA
GPU和大语言模型开发教程
python
llama
开发语言
Ollama微调
它支持多种流行的开源大语言模型,如
Llama
2、Qwen2.5等。在上一篇文章中我们部署Ollama,并使用简单命令管理Ollama。接下来我们学习Ollama的高级应用。
软件不硬
·
2025-02-26 19:08
LLM
tool
AIGC
大模型是如何蒸馏像Qwen-7B,
Llama
-3 这种小模型的?
1.Qwen-7B和
Llama
-3的所属公司Qwen-7B:属于阿里巴巴,是“通义千问”系列的开源模型,由阿里云团队研发。
闫哥大数据
·
2025-02-26 03:12
大模型
llama
人工智能
深入探索
llama
-cpp-python:在 LangChain 中启用本地 LLM 推理
Llama
.cpp是一个用于推理许多LLM模型的开源库,它的Python绑定——
llama
-cpp-python提供了在Python中更加便捷的接口。
aehrutktrjk
·
2025-02-26 02:06
llama
python
langchain
llama
-cpp-python本地部署并使用gpu版本
使用带编译的命令安装
llama
库#首选GGML_CUDA后续
LLAMA
_CUBLAS将删除CMAKE_ARGS="-DGGML_CUDA=on"FORCE_CMAKE=1pipinstallllama-cpp-python
i__chen
·
2025-02-26 02:03
llama
python
开发语言
部署
Llama
3.1 405B:分步指南,深入研究
Llama
最新模型
Llama
3.1 4050 亿参数模型的部署。这个强大的模型需要大量的 VRAM,特别是 4 位量化版本需要 231 G
简介今天,我们将深入研究
Llama
最新模型
Llama
3.14050亿参数模型的部署。这个强大的模型需要大量的VRAM,特别是4位量化版本需要231GB。
知识大胖
·
2025-02-25 02:47
NVIDIA
GPU和大语言模型开发教程
llama
ai
DeepSeek-R1秘籍轻松迁移,只需原始数据0.3% | 邱锡鹏团队联合出品
以
Llama
2-7B为例
·
2025-02-24 19:13
量子位
Meta官宣
Llama
3:迄今为止最强大的开源大模型
4月18日,Meta在官方博客官宣了
Llama
3,标志着人工智能领域迈向了一个重要的飞跃。此版本具有经过预训练和指令微调的语言模型,具有8B(80亿)和70B(700亿)参数,可以支持广泛的用例。
·
2025-02-24 19:09
人工智能开源
垂类大模型微调(二):使用
LLaMA
-Factory
上一篇博文和大家一起安装了
LLaMA
-Factory工具,并下载了大模型在上面进行了简单的加载和推理,今天尝试通过LoRa技术对大模型进行微调;一、训练集准备1.1介绍训练集结构这里演示对Qwen2.5
CITY_OF_MO_GY
·
2025-02-24 07:00
从零到亿大模型微调
llama
LLaMA
-Factory|微调大语言模型初探索(3),qlora微调deepseek记录
前言 上篇文章记录了使用lora微调
llama
-1b,微调成功,但是微调
llama
-8b显存爆炸,这次尝试使用qlora来尝试微调参数体量更大的大语言模型,看看64G显存的极限在哪里。
闻道且行之
·
2025-02-24 01:49
自然语言处理
语言模型
人工智能
qlora微调
llama
deepseek
将
Llama
3 与 Ollama 和 Python 结合使用 使用 Ollama API 访问这一领先模型
Meta最近发布的新法学硕士
Llama
3在人工智能领域引起了轰动。例如,请查看我对下面型号的70B版本的评论和测试。在我的测试中,
Llama
3令人印象深刻,但它们是使用聊天界面进行的。
知识大胖
·
2025-02-23 09:28
NVIDIA
GPU和大语言模型开发教程
Python源码大全
llama
python
开发语言
科普:大模型使用中的temperature 与 top-k及其它
在大语言模型(如通过Ollama运行的
llama
2模型)中,temperature和top-k是两个用于控制文本生成过程的重要参数,它们在功能上相互独立,但又共同影响着模型生成文本的随机性和多样性。
人工干智能
·
2025-02-22 23:35
大模型编程
人工智能
大模型
【2024 Dec 超实时】编辑安装
llama
.cpp并运行
llama
首先讲一下环境这是2024年12月,
llama
.cpp的编译需要cmake呜呜呜网上教程都是make跑的。反正我现在装的时候make已经不再适用了,因为工具的版本,捣鼓了很久。
AI.愚人自愈
·
2025-02-22 13:45
llm
llm
llama.cpp
大模型微调
以下是在本地部署使用
LLaMA
-Factory导出的LoRA模型,并通过Ollama运行的步骤指南:1.准备工作已训练好的LoRA模型:确保通过
LLaMA
-Factory导出了LoRA适配器文件(通常是
猴的哥儿
·
2025-02-22 12:42
机器学习
深度学习
神经网络
知识图谱
个人开发
【
Llama
3:8b】手把手教你如何在本地部署 自己的 LLM大模型
一、为什么需要本地部署属于自己的大模型?趋势:我们正处于AI人工智能时代,各行各业的公司和产品都在向AI靠拢。打造垂直领域的AI模型将成为每个公司未来的发展趋势。数据安全:在无法掌握核心算法的情况下,许多公司选择使用大公司的成熟方案。然而,这涉及到数据安全的问题。训练垂直定制化的大模型需要大量数据,而数据是公司的核心资产和基石。没有公司愿意将这些关键数据上传到外部服务器,这是公司的命脉所在。本地部
AI大模型..
·
2025-02-22 12:40
langchain
llama
人工智能
大模型
LLM
ai大模型
大模型部署
基于ChatGPT-4o信息检索、总结分析、论文写作与投稿、专利idea构思与交底书的撰写
大语言模型最新进展与ChatGPT各模型讲解1、2024AIGC技术最新进展介绍(生成式人工智能的基本概念与原理、最新前沿技术和发展趋势简介)2、国内外大语言模型(ChatGPT4O、Gemini、Claude、
Llama
3
AAIshangyanxiu
·
2025-02-22 10:26
chatgpt
python
机器学习
深度学习
哪种LLM量化方法最适合您?:GGUF、GPTQ 还是 AWQ
:GGUF、GPTQ还是AWQ1.GGUF:(GPT-GeneratedUnifiedFormat,GPT生成的统一格式)GGUF是GGML的后继者,由
llama
.cpp团队推出。
GordonJK
·
2025-02-22 05:38
人工智能
机器学习
深度学习
LLM Course系列:使用 Unsloth 高效地微调
Llama
3.1
最近发布的
Llama
3.1为模型提供了令人难以置信的性能水平,缩小了闭源模型和开放权重模型之间的差距。
橙狮科技
·
2025-02-22 04:36
LLM工程
llama
人工智能
python
尝试在exo集群下使用deepseek模型:第一步,调通
llama
exo是一个多机协同AI大模型集群软件,它可以将多种设备统一成一个强大的GPU,支持多种模型,并具有动态模型分区、自动设备发现等功能。问题实践:多机协同AI大模型集群软件exo:体验github日榜第一名的魅力!-CSDN博客在安装了exo后,一直运行没有成功,在网页运行的时候,报错让使用debug>2去调试原来可以命令行调试运行:DEBUG=9exorunllama-3.2-1b--disab
skywalk8163
·
2025-02-21 22:33
人工智能
软硬件调试
人工智能
exo
llama
NVIDIA B200:高性能 AI 计算的未来
在
Llama
270B型号上运行推理时,B200每秒可处理11,26
知识大胖
·
2025-02-21 15:01
NVIDIA
GPU和大语言模型开发教程
人工智能
nvidia
b200
Llama
都在用的RoPE有了视频版,长视频理解/检索绝佳拍档
VideoRoPE团队投稿量子位|公众号QbitAILlama都在用的RoPE(旋转位置嵌入)被扩展到视频领域,长视频理解和检索更强了。复旦大学、上海AI实验室等提出VideoRoPE,并确定了将RoPE有效应用于视频所需的四个关键特性。在长视频检索、视频理解和视频幻觉等各种下游任务中,VideoRoPE始终优于先前的RoPE变体。用三维结构保留时空关系RoPE是一种能够将相对位置信息依赖集成到s
·
2025-02-21 06:19
量子位
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他