E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
LMS
如何在DigitalOcean的H100 GPU服务器上运行DeepSeek R1 模型
在DigitalOcean,我们一直在关注开源大语言模型(L
LMs
)和商业封闭模型之间差距的不断缩小。其中一个最关键的能力就是“推理”,也就是用合乎逻辑、讲得通的方式思考问题。
DO_Community
·
2025-03-11 10:44
教程
DeepSeek
GPU
ai
大语言模型
人工智能
大语言模型原理基础与前沿 双层路由多模态融合、多任务学习和模块化架构
大语言模型原理基础与前沿:双层路由多模态融合、多任务学习和模块化架构关键词:大语言模型、双层路由、多模态融合、多任务学习、模块化架构、神经网络、自然语言处理1.背景介绍大语言模型(LargeLanguageModels,L
LMs
AI智能涌现深度研究
·
2025-03-11 09:07
AI大语言模型和知识图谱融合
Python入门实战
DeepSeek
R1
&
大数据AI人工智能
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
使用Activeloop Deep Lake构建深度学习数据仓库与向量存储
ActiveloopDeepLake是专为深度学习设计的数据仓库,可以作为向量存储使用,支持多模态数据的存储和处理,并且可以直接用于细调大型语言模型(L
LMs
)。
dgay_hua
·
2025-03-11 04:49
深度学习
人工智能
python
大语言模型原理基础与前沿 挑战与机遇
大语言模型原理基础与前沿挑战与机遇1.背景介绍大语言模型(LargeLanguageModels,L
LMs
)是近年来人工智能领域的一个重要突破。
AI大模型应用之禅
·
2025-03-11 02:07
DeepSeek
R1
&
AI大模型与大数据
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
AI Prompt 提示词工程入门指南:新手小白快速上手
近年来,人工智能(AI)发展迅猛,特别是大语言模型(L
LMs
)(如ChatGPT、Claude、Gemini、Llama等)的广泛应用,让人们可以用自然语言与AI进行互动。
机器学习司猫白
·
2025-03-11 02:37
人工智能
prompt
利用大型语言模型进行市场分析与预测
近年来,随着自然语言处理(NLP)技术的进步,大型语言模型(L
LMs
)在文本分析领域展现出强大的能力,为市场分析与预测带来了新的机遇。L
AI天才研究院
·
2025-03-10 16:27
DeepSeek
R1
&
大数据AI人工智能大模型
AI大模型企业级应用开发实战
AI实战
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
QwQ-32B通用能力测评的详细分析
QwQ-32B通用能力测评的详细分析一、测评框架与核心基准测试QwQ-32B的通用能力测评围绕三大核心评测体系展开,覆盖逻辑推理、多轮对话、复杂指令遵循、工具调用等综合能力:LiveBench(“最难L
LMs
大势下的牛马
·
2025-03-10 16:57
搭建本地gpt
QwQ
QwQ-32B
RAG
人工智能
知识库
大语言模型引擎全解析:Transformers、vLLM、Llama.cpp等,最佳选择全攻略!
近年来,大语言模型(L
LMs
)如GPT、LLaMA、BERT等已经成为人工智能领域的核心驱动力。然而,如何高效地运行和优化这些模型,成为了开发者和研究者面临的重要挑战。
大模型入门教程
·
2025-03-10 12:29
语言模型
llama
人工智能
DeepSeek
prompt
AI大模型
大模型
[arxiv论文解读]LlamaFactory:100+语言模型统一高效微调
该文档是一篇关于LLAMAFACTORY的学术论文,这是一个用于高效微调大型语言模型(L
LMs
)的统一框架。
强化学习曾小健
·
2025-03-10 07:22
#
LLM大语言模型
语言模型
人工智能
自然语言处理
使用LangChain实现最新NLP研究成果
技术背景介绍LangChain作为一个强大且灵活的开源工具,旨在简化大语言模型(L
LMs
)的开发与应用。通过对最新研究的集成,
eahba
·
2025-03-10 05:33
langchain
自然语言处理
人工智能
python
L
LMs
:L
LMs
大语言模型评估的简介(两标+六性+九维,大模型排行榜多种),两类基准—通用任务的基准(单任务【BLEU/ROUGE-MT-Bench/Chatbot Arena】、多任务【Super
L
LMs
:L
LMs
大语言模型评估的简介(两标(NLUGR指标/REBT)+六性(理解性+生成性{PPL}+多样性+泛化性+能耗性+可解释性)+九维(2大能力域【理解/生成】+3性【丰富性/多样性/适应性
一个处女座的程序猿
·
2025-03-08 19:54
NLP/LLMs
ML
资深文章(前沿/经验/创新)
自然语言处理
基础大模型
评估
Mark Github上的一个项目,VLM-R1。GRPO为什么促使MLLM在部分垂域比SFT更好的表现
项目地址:GitHub-om-ai-lab/VLM-R1:SolveVisualUnderstandingwithReinforcedV
LMs
最近做毕设,看到VLM-R1项目,一个有趣的现象:在Grounding
朱韬韬
·
2025-03-08 16:40
github
GRPO
SFT
【有啥问啥】深入浅出:大模型应用工具 Ollama 技术详解
深入浅出:大模型应用工具Ollama技术详解引言近年来,大型模型(LargeModels,L
LMs
)技术突飞猛进,在自然语言处理、计算机视觉、语音识别等领域展现出强大的能力。
有啥问啥
·
2025-03-08 00:21
大模型
科普
人工智能
深度学习
L
LMs
之Llama-3:基于Colab平台(免费T4-GPU)利用LLaMA-Factory的GUI界面(底层采用unsloth优化框架【加速训练5~30倍+减少50%的内存占用】)对llama-3
L
LMs
之Llama-3:基于Colab平台(免费T4-GPU)利用LLaMA-Factory的GUI界面(底层采用unsloth优化框架【加速训练5~30倍+减少50%的内存占用】)对llama-3-
一个处女座的程序猿
·
2025-03-07 09:41
NLP/LLMs
成长书屋
大语言模型
unsloth
LLaMA-3
LoRA
llama-factory 记录
GitHub-hiyouga/LLaMA-Factory:UnifiedEfficientFine-Tuningof100+L
LMs
&V
LMs
(ACL2024)安装gitclonehttps://github.com
嘟嘟Listing
·
2025-03-07 08:31
llama
DeepSeek独立部署对垂直行业影响力分析
实施:输入学生历史成绩和行为数据,微调Deepseek生成学习建议,集成到学校
LMS
。成果:学习效率提升20%,学生参与度提高30%。场景2:智能考试与评估描
懂AI的老郑
·
2025-03-07 03:57
DeepSeek应用
DeepSeek
智能体
【大模型基础_毛玉仁】0.系列文章
原书参考链接及目录如下:《大模型基础》Github:https://github.com/ZJU-L
LMs
/Foundations-of-L
LMs
《大模型基础
XiaoJ1234567
·
2025-03-07 00:02
大模型基础_毛玉仁
大语言模型基础
语言模型
大模型基础_毛玉仁
LLaMA-Factory使用命令
Weprovidediverseexamplesaboutfine-tuningL
LMs
.MakesuretoexecutethesecommandsintheLLaMA-Factorydirectory.TableofContentsLoRAFine-TuningQLoRAFine-TuningFull-ParameterFine-TuningMergingLoRAAdaptersandQuan
asd8705
·
2025-03-06 23:54
llama
Andrej Karpathy 最新AI讲座(3个半小时):Deep Dive into L
LMs
like ChatGPT(深入探索像ChatGPT这样的大语言模型)
【必看珍藏】2月6日,安德烈·卡帕西最新AI普及课:深入探索像ChatGPT这样的大语言模型|AndrejKarpathy视频国内地址:https://www.bilibili.com/video/BV16cNEeXEer/?spm_id_from=333.1007.0.0&vd_source=2305730152e6c9a557978924d0063b1a资料链接:ChatGPThttps://
自动驾驶小学生
·
2025-03-05 21:46
论文笔记
人工智能
chatgpt
语言模型
DeepSeek
LLM
Andrej
Karpathy
2025
基于Ubuntu+vLLM+NVIDIA T4高效部署DeepSeek大模型实战指南
一、前言:拥抱vLLM与T4显卡的强强联合在探索人工智能的道路上,如何高效地部署和运行大型语言模型(L
LMs
)一直是一个核心挑战。尤其是当我们面对资源有限的环境时,这个问题变得更加突出。
来自于狂人
·
2025-03-05 02:01
python
人工智能
pytorch
语言模型
大语言模型生成式AI学习笔记——1. 1.1 大语言模型及生成式AI项目生命周期简介——课程简介
GenerativeAIwithLargeLanguageModelsbyDeepLearning.AI&AmazonWebServicesAboutthisCourseInGenerativeAIwithLargeLanguageModels(L
LMs
预见未来to50
·
2025-03-04 18:07
机器学习
深度学习(ML/DL)
人工智能
语言模型
学习
大模型学习笔记-基于《Deep Dive into L
LMs
like ChatGPT》
模型是什么从逻辑层面理解,模型类似于函数。给定模型一个输入,它会产生一个输出。例如,垃圾邮件识别器就是一种模型。当输入一封电子邮件时,它会输出该邮件是否为垃圾邮件的判断结果。天气预测同样是一个模型,输入历史天气数据,它会输出对明天天气情况的预测。这些都是模型的实例。当然,模型的输出存在一定的准确率,其结果可能与预期高度相符,也可能偏离较大。构建数据集对于大语言模型(LLM)的训练而言,首先需要构建
XiyouLinux_Kangyijie
·
2025-03-04 18:33
学习
笔记
chatgpt
R语言广义加性模型:使用广义线性加性模型GAMs构建logistic回归
它结合了广义线性模型(GeneralizedLinearModels,简称G
LMs
)的灵活性和非线性关系的建模能力,可以适用于各种类型的响应变量,包括二元回归(logistic回归)。本文将介绍如何
TechInk
·
2025-03-04 17:52
r语言
回归
开发语言
R语言
llama_factory微调QWen1.5
GitHub-hiyouga/LLaMA-Factory:UnifyEfficientFine-Tuningof100+L
LMs
UnifyEfficientFine-Tuningof100+L
LMs
.Contributetohiyouga
Kun Li
·
2025-03-03 02:50
大语言模型
llama
qwen
SQL-o1:一种用于Text-to-SQL的自奖励启发式动态搜索方法
得益于大规模语言模型(L
LMs
)的应用,该领域取得了显著进展。然而,模型的可扩展性、生成空间的限制以及SQL生成过程中的连贯性问题仍然存在。
数之何
·
2025-03-02 12:25
人工智能
ai
语言模型
sql
【大模型】fp32 和 fp16 的区别,混合精度的原理。
L
LMs
浮点数一、fp32和fp16的区别,混合精度的原理1.fp32与fp16的对比特性fp32(单精度)fp16(半精度)位数32位(4字节)16位(2字节)内存占用高低(仅为fp32的50%)数值范围约
深度求索者
·
2025-03-02 08:20
python
pytorch
AI驱动的企业学习管理系统
传统的企业学习管理系统(LearningManagementSystem,
LMS
)往往以标准化课程和批量学习为主,难以满足员工个性化学习需求,且缺
AGI大模型与大数据研究院
·
2025-03-02 07:43
DeepSeek
R1
&
大数据AI人工智能
java
python
javascript
kotlin
golang
架构
人工智能
借助知识图谱和Llama-Index实现基于大模型的RAG
幻觉是在处理大型语言模型(L
LMs
)时常见的问题。L
LMs
生成流畅连贯的文本,但经常产生不准确或不一致的信息。防止L
LMs
中出现幻觉的一种方法是使用外部知识源,如提供事实信息的数据库或知识图谱。
爱吃牛油果的璐璐
·
2025-03-01 08:32
知识图谱
llama
oracle
语言模型
chatgpt
transformer
人工智能
如何使用Anyscale平台运行、微调和扩展大语言模型(L
LMs
)
Anyscale是一个功能强大的平台,主要用于运行、微调和扩展大语言模型(L
LMs
),并且通过生产就绪的API提供成本效益的调用服务。
eahba
·
2025-03-01 03:49
语言模型
人工智能
自然语言处理
python
【deepseek】deepseek-r1本地部署-第三步:下载模型
二、操作1、
LMS
tudio开发模式切换模式名字PowerUser2、下载模型模型名字DeepSeek-R1-Distill-Llama-8B-GGUF3、下载完成三、总结按需选择合适的bit的模型,否则会跑不动
Evenurs
·
2025-03-01 02:45
ai
deepseek
第九章 Spring AI API中文版 - Ollama Embeddings API
Ollama嵌入通过Ollama,您可以在本地运行各种大型语言模型(L
LMs
),并从中生成嵌入。SpringAI通过OllamaEmbeddingClient支持Ollama文本嵌入。
明爷们儿
·
2025-02-28 18:52
JAVA大模型
spring
人工智能
java
2.9 部署模型-大模型ACP模拟题-真题
A.vl
lms
erve"./model/qwen2_5-1_5b-instruct"--port8000B.vl
lms
erve".
admin皮卡
·
2025-02-28 17:12
阿里云大模型ACP-考试回忆
人工智能
ai
Empowering L
LMs
with Logical Reasoning: 从“语言大师”到“逻辑大师”的进化之路
让大语言模型(L
LMs
)既能说会道,又能逻辑严谨,是AI发展的下一座高峰。”开篇:语言模型的“逻辑盲区”近年来,大语言模型(L
LMs
)在自然语言处理(NLP)任务中取得了令人瞩目的成就。
步子哥
·
2025-02-28 07:19
人工智能
利用DSPy优化LangChain RAG系统的实战指南
利用DSPy优化LangChainRAG系统的实战指南技术背景介绍DSPy是一个用于大语言模型(L
LMs
)的出色框架,它引入了一个自动编译器,能够教会模型如何执行你程序中的声明性步骤。
scaFHIO
·
2025-02-28 04:01
langchain
python
使用LangChain与GPT4All模型进行交互
核心原理解析GPT4All是基于大型语言模型(L
LMs
)的开源项目,通过训练大量干净的数据,能够生成高质量的对话和回答。LangChain是一种用于简化与
bavDHAUO
·
2025-02-28 04:28
langchain
交互
python
LangChain入门:使用Python和通义千问打造免费的Qwen大模型聊天机器人
前言LangChain是一个用于开发由大型语言模型(LargeLanguageModels,简称L
LMs
)驱动的应用程序的框架。
闯江湖50年
·
2025-02-27 20:45
langchain
python
机器人
人工智能
探索 LangChain: 架构、组件和应用
OpenAI示例:fromlangchain.l
lms
importOpenAIopenai_llm=OpenAI(model_name="gpt-3.5-turbo")respo
田猿笔记
·
2025-02-27 17:23
LangChain
langchain
人工智能
大数据最全大模型入门到应用——LangChain:索引(Indexes)-[文本分割器
大模型从入门到应用》总目录LangChain系列文章:基础知识快速入门安装与环境配置链(Chains)、代理(Agent:)和记忆(Memory)快速开发聊天模型模型(Models)基础知识大型语言模型(L
LMs
2401_84182507
·
2025-02-27 17:22
程序员
langchain
大模型入门到应用——LangChain:索引(Indexes)-[文本分割器(2)
快速入门安装与环境配置链(Chains)、代理(Agent:)和记忆(Memory)快速开发聊天模型模型(Models)基础知识大型语言模型(L
LMs
)基础知识LLM的异步API、自定义LLM包装器、虚假
2301_78399616
·
2025-02-27 17:21
程序员
langchain
大语言模型原理与工程实践:Transformer 大语言模型预训练
数据处理文章目录大语言模型原理与工程实践:Transformer大语言模型预训练1.背景介绍1.1问题的由来1.2研究现状1.3研究意义1.4本文结构2.核心概念与联系2.1大语言模型(LargeLanguageModels,L
LMs
AI天才研究院
·
2025-02-27 16:18
计算
ChatGPT
transformer
DeepSeek R1、Kimi k1.5与OpenAI o1:技术架构、性能对比及应用前景深度剖析
在人工智能的浪潮中,大型语言模型(L
LMs
)已成为推动技术变革的核心引擎。
WilsonShiiii
·
2025-02-27 00:48
语言模型
gpt
L
LMs
之ReACT-Agent:ReACT-Agent简介、实现及其使用方法(MReACT/AutoReACT)、案例应用(比如采用ReAct框架让LLM稳定输出JSON格式数据)之详细攻略
L
LMs
之ReACT-Agent:ReACT-Agent简介、实现及其使用方法(MReACT/AutoReACT)、案例应用(比如采用ReAct框架让LLM稳定输出JSON格式数据)之详细攻略目录相关文章
一个处女座的程序猿
·
2025-02-27 00:46
RAG_Agent
NLP/LLMs
资深文章(前沿/经验/创新)
Agent
ReACT
深入解析 DeepSeek R1:强化学习如何驱动大模型推理能力的进化
这一思路不仅为大规模语言模型(L
LMs
)带来了新的训练范式,还在跨任务推理迁移上表现出潜力。本文将深入解析DeepSeekR1的架构、训练方法和对比实验,并从多维度审视其局限性与未来发展方向。
海棠AI实验室
·
2025-02-26 23:07
智元启示录
人工智能
deep
learning
DeepSeek-R1
AI推介-多模态视觉语言模型V
LMs
论文速览(arXiv方向):2024.07.20-2024.07.25
文章目录~1.LPGen:EnhancingHigh-FidelityLandscapePaintingGenerationthroughDiffusionModel2.HighEfficiencyImageCompressionforLargeVisual-LanguageModels3.Q-Ground:ImageQualityGroundingwithLargeMulti-modalityM
小小帅AIGC
·
2025-02-26 21:19
VLM论文时报
人工智能
语言模型
自然语言处理
大语言模型
VLM
视觉语言模型
论文推送
ThinkJSON:通过强化学习让大型语言模型(LLM)严格遵守JSON模式
标题:ThinkInsidetheJSON:ReinforcementStrategyforStrictL
LMS
chemaAdherence作者:BhavikAgarwal,IshanJoshi,ViktoriaRojkova
AI仙人掌
·
2025-02-26 20:17
人工智能
深度学习
推荐:LangChain — 构建情境感知推理应用的利器
推荐:LangChain—构建情境感知推理应用的利器langchain⚡BuildingapplicationswithL
LMs
throughcomposability⚡项目地址:https://gitcode.com
成婕秀Timothy
·
2025-02-26 19:33
百度文心大模型API保姆级教程:从入门到实战
目录文心大模型简介文心大模型vs.OpenAIGPT系列应用构建实例API集成详细步骤准备工作获取AccessToken发起API请求API的调试和常见问题的解决进阶应用安全性和最佳实践总结与未来展望随着大型语言模型(L
LMs
海棠AI实验室
·
2025-02-26 16:44
智元启示录
百度
API
文心大模型
Title: Empowering Social Network Intelligence with AI Agents
AIagents,poweredbyadvancementsinlargelanguagemodels(L
LMs
)andmultimodalAItechnologies,arerevolutionizingsocialnetworksbyofferingdeeperinsightsintouserinteractions
诗远小一
·
2025-02-26 14:28
人工智能
大数据
Ollama Open WebUI
OpenWebUI可自定义OpenAIAPIURL,连接
LMS
tudio、GroqCloud、Mistral、OpenRouter等。OpenWebUI管理员
alden_ygq
·
2025-02-25 03:51
#
大模型运维基础工具
人工智能
Lil‘Log《Extrinsic Hallucinations in L
LMs
》读后总结
博客《ExtrinsicHallucinationsinL
LMs
》由LilianWeng撰写,详细探讨了大型语言模型(L
LMs
)中“幻觉”现象的背景、原因、类型、影响及其缓解策略。
心碎小猫p
·
2025-02-25 02:42
人工智能
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他