E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
LLM
大型推理模型 (LRM) 的比较 OpenAI DeepSeek R1 Gemini 2.0
LRM)的比较OpenAIDeepSeekR1Gemini2.0阅读时长:25分钟发布时间:2025-02-06近日热文:全网最全的神经网络数学原理(代码和公式)直观解释欢迎关注知乎和公众号的专栏内容
LLM
·
2025-02-06 17:20
人工智能
Python用langchain、OpenAI大语言模型
LLM
情感分析AAPL股票新闻数据及提示工程优化应用
全文链接:https://tecdat.cn/?p=39614本文主要探讨了如何利用大语言模型(LLMs)进行股票分析。通过使用提供的股票市场和金融新闻获取数据,结合Python中的相关库,如Pandas、langchain等,实现对股票新闻的情感分析。利用大语言模型构建情感分析模型,通过提示工程等技术优化模型,最终通过可视化展示股票市场的情感倾向,为股票投资决策提供参考。关键词大语言模型;股票分
·
2025-02-06 17:10
数据挖掘深度学习机器学习
LangChain 深入指南:构建强大的
LLM
应用的核心架构
引言在当今的人工智能领域,构建强大且可扩展的语言模型(
LLM
)应用程序需要扎实的技术框架支持。LangChain是这样一个框架,旨在简化语言模型的部署、集成和运维。
nseejrukjhad
·
2025-02-06 16:19
langchain
架构
python
大模型面试必看!超详细面经指南+答案,轻松拿Offer!2025大模型上岸就靠它了!
[x]4.大模型
LLM
的架构介绍?[x]大模型(LLMs)进阶面[x]1.llama输入句子长度理论上可以无限长吗?[x]1.什么是LLMs复读机问题?[x]2.为什么会出现LLMs复读机问题?
AI大模型-大飞
·
2025-02-06 16:47
大模型
AI大模型
大模型教程
人工智能
学习
LLM
Deepseek
构建安全可靠的
LLM
应用架构
《构建安全可靠的
LLM
应用架构》关键词:大型语言模型(
LLM
),应用架构,安全性,可靠性,设计原则摘要:本文旨在深入探讨如何构建一个安全可靠的大型语言模型(
LLM
)应用架构。
AI天才研究院
·
2025-02-06 16:15
计算机软件编程原理与应用实践
java
python
javascript
kotlin
golang
架构
人工智能
大厂程序员
硅基计算
碳基计算
认知计算
生物计算
深度学习
神经网络
大数据
AIGC
AGI
LLM
系统架构设计
软件哲学
Agent
程序员实现财富自由
从零开始构建一个大语言模型-第五章第五节
第五章目录5.1评估生成文本模型5.2训练一个
LLM
5.3控制随机性的解码策略5.4在PyTorch中加载和保存模型权重5.5从OpenAI加载预训练权重5.5从OpenAI加载预训练权重此前,我们使用一个由一本短篇小说集组成的有限数据集训练了一个小型
释迦呼呼
·
2025-02-06 15:41
从零开始构建一个大语言模型
语言模型
人工智能
自然语言处理
机器学习
pytorch
DeepSeek-R1真算得上开源吗?
OpenAIo1模型证明,当
LLM
在推理时,通过增加计算量进行类似训练后,它们在数学、编程和逻辑等推理任务上的表现显著提升。然而,OpenAI推理模型的训练方法一直是秘密。
·
2025-02-06 13:37
人工智能
KRAIL: A Knowledge-Driven Framework for Base Human Reliability Analysis Integrating IDHEAS
本文是
LLM
系列文章,针对《KRAIL:AKnowledge-DrivenFrameworkforBaseHumanReliabilityAnalysisIntegratingIDHEASandLargeLanguageModels
UnknownBody
·
2025-02-06 12:15
LLM
Daily
语言模型
人工智能
有趣的项目--汇总
文章目录前言一、AI类二、前言持续记录有意思的项目,欢迎大家讨论一、AI类openglass+ollama:链接:OpenGlassAI眼镜的环境配置与实现InvidiaJetson+
LLM
:链接:生成式人工智能应用
cladel
·
2025-02-06 09:00
人工智能
SGlang 专为大模型设计的高效服务框架
SGlang是一种专为大型语言模型(
LLM
)和视觉语言模型(VLM)设计的高效服务框架,旨在提升模型的推理速度和灵活性。
kcarly
·
2025-02-06 08:52
大模型知识乱炖
LLM
大模型
SGLang
llama.cpp
LLM
_ARCH_DEEPSEEK and
LLM
_ARCH_DEEPSEEK2
`
LLM
_ARCH_DEEPSEEK`and`
LLM
_ARCH_DEEPSEEK2`2.`
LLM
_ARCH_DEEPSEEK`and`
LLM
_ARCH_DEEPSEEK2`3.
Yongqiang Cheng
·
2025-02-06 06:42
ggml
-
llama.cpp
-
whisper.cpp
llama.cpp
DEEPSEEK
DEEPSEEK2
使用vLLM部署Qwen2.5-VL-7B-Instruct模型的详细指南
使用vLLM部署Qwen2.5-VL-7B-Instruct模型的详细指南引言环境搭建安装vLLM安装依赖库下载模型启动vLLM服务器总结参考引言近年来,随着大规模语言模型(
LLM
)的快速发展,如何高效地进行模型推理成为了一个热门话题
engchina
·
2025-02-06 03:40
LINUX
vllm
qwen2.5-vl
7B
本地部署
大模型产品化第一年:战术、运营与战略
作者|EugeneYan、BryanBischof等OneFlow编译翻译|宛子琳、张雪聃、杨婷题图由SiliconCloud平台生成这是一个激动人心的时代,所有人都能够利用语言大模型(
LLM
)进行各种各样的产品构建
OneFlow深度学习框架
·
2025-02-06 03:39
业界观点
SiliconCloud
大模型
人工智能
硅基流动
前端大模型入门:编码(Tokenizer)和嵌入(Embedding)解析
本文介绍了大规模语言模型(
LLM
)中的两个核心概念:Tokenizer和Embedding。
大模型玩家
·
2025-02-06 03:38
前端
embedding
产品经理
经验分享
算法
人工智能
学习方法
大语言模型轻量化:知识蒸馏的范式迁移与工程实践
摘要在大型语言模型(
LLM
)主导人工智能发展的当下,模型参数量与推理成本的指数级增长已成为制约技术落地的核心瓶颈。
LucianaiB
·
2025-02-06 02:04
语言模型
人工智能
自然语言处理
python
大规模语言模型从理论到实践 DeepSpeed实践
大规模语言模型从理论到实践DeepSpeed实践文章目录大规模语言模型从理论到实践DeepSpeed实践1.背景介绍1.1大规模语言模型的兴起1.2训练和部署
LLM
的挑战1.3DeepSpeed:赋能
LLM
AI天才研究院
·
2025-02-06 01:59
大数据AI人工智能
AI大模型企业级应用开发实战
AI大模型应用入门实战与进阶
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
DeepSeek:探索未来的人工智能模型与技术
个人主页:一ge科研小菜鸡-CSDN博客期待您的关注1.引言近年来,大语言模型(
LLM
)迅速发展,推动了人工智能在多个领域的应用。
一ge科研小菜鸡
·
2025-02-05 22:32
人工智能
DeepSeek
LLM
大模型RAG内容安全合规检查
1.了解内容安全合规涉及的范围我们先回顾一下智能答疑机器人的问答流程。问答流程主要包括用户、智能答疑机器人、知识库、大语言模型这四个主体。涉及内容安全的关键阶段主要有:输入阶段:用户发起提问。输出阶段:机器人返回回答。知识库召回阶段:从知识库中召回相关的topK文本。针对RAG应用,内容安全合规检查方案的设计将围绕这三个阶段展开。为此,我们可以设计一套通用的合规检查机制,支持不同内容类型的检查,且
MichaelIp
·
2025-02-05 21:57
安全
人工智能
python
语言模型
自然语言处理
word2vec
chatgpt
51-59 CVPR 2024 | ChatSiM:Editable Scene Simulation for Autonomous Driving via Collaborative
LLM
上海交通大学、上海人工智能实验室、卡内基梅隆大学和清华大学联合发布EditableSceneSimulationforAutonomousDrivingviaCollaborativeLLM-Agents,基于
LLM
深圳季连AIgraphX
·
2025-02-05 18:10
aiXpilot
智驾大模型1
自动驾驶
AIGC
stable
diffusion
智慧城市
计算机视觉
大语言模型本地化部署+可视化微调
随着chatgpt的爆火,国内外的大语言模型(LargeLanguageModel,
LLM
)争先恐后,高速发展,人工智能技术也从传统的判别式人工智能逐渐转向了生成式人工智能,
LLM
作为AI的一种具体表现形式
科研小fw
·
2025-02-05 18:09
人工智能
语言模型
人工智能
自然语言处理
python
chatgpt
TensorRT-
LLM
保姆级教程(一)-快速入门
本系列将针对TensorRT-
LLM
推理进行讲解。本文为该系列第一篇,将简要概述TensorRT-
LLM
的基本特性。另外,我撰写的大模型相关的博客及配套代码均整理放置在Github:
llm
-act
大模型部署
·
2025-02-05 18:38
人工智能
transformer
产品经理
自然语言处理
kubernetes
大模型
LLM
长上下文大模型会让检索增强生成(RAG)过时吗?
大模型(
LLM
)的迅速发展对人工智能领域,尤其是自然语言处理(NLP)产生了重大影响。传统上,像检索增强生成(RAG)这样的技术通过允许模型动态访问外部知识源,在提升大语言模型能力方面发挥了重要作用。
·
2025-02-05 18:38
人工智能
Spring AI 智能体通过 MCP 集成本地文件数据
作者:刘军ModelContextProtocol(MCP)简介模型上下文协议(即ModelContextProtocol,MCP)[1]是一个开放协议,它规范了应用程序如何向大型语言模型(
LLM
)提供上下文
·
2025-02-05 18:37
云原生
LLM
算法工程师的速成指南:微调、强化学习微调与偏好微调
OpenAI近期在直播中,提到了两个新的概念:①强化学习微调(ReinforcementFine-Tuning):仅需少量高质量数据(数十到数千个),模型即可通过强化学习处理复杂任务。②偏好微调(PreferenceFine-Tuning,PFT):采用直接偏好优化(例如DirectPreferenceOptimization,DPO)算法,通过比较不同的模型输出,让AI能够学习并区分“更好”的回
大模型玩家
·
2025-02-05 16:24
算法
机器学习
深度学习
chatgpt
人工智能
ai
大模型
用 Python 微调 DeepSeek R1
用Python微调DeepSeekR1阅读时长:15分钟发布时间:2025-02-05近日热文:全网最全的神经网络数学原理(代码和公式)直观解释欢迎关注知乎和公众号的专栏内容
LLM
架构专栏知乎
LLM
专栏知乎
·
2025-02-05 13:24
程序员
DeepSeek-R1 低成本训练的根本原因是?
在人工智能领域,大语言模型(
LLM
)正以前所未有的速度发展,驱动着自然语言处理、内容生成、智能客服等众多应用的革新。
明哲AI
·
2025-02-05 11:10
AIGC
人工智能
大模型
deepseek
AI
Agent
从 0 到 1 掌握 LangChain Agents:自定义工具 +
LLM
打造智能工作流!
LangChain:从核心链条构建到动态任务分配的实战指南04-玩转LangChain:从文档加载到高效问答系统构建的全程实战05-玩转LangChain:深度评估问答系统的三种高效方法(示例生成、手动评估与
LLM
吴师兄大模型
·
2025-02-05 08:53
现代大模型技术与应用
langchain
Agents
自定义工具
python
LLM
大模型
LangChain
大语言模型
LLM
分布式训练:TensorFlow攻略与深度解析(
LLM
系列04)
文章目录大语言模型
LLM
分布式训练:TensorFlow攻略与深度解析(
LLM
系列04)1.引言2.TensorFlow分布式训练基础概念3.TensorFlow中
LLM
分布式训练的关键技术及应用4.利用
North_D
·
2025-02-05 08:20
大语言模型LLM
分布式
tensorflow
人工智能
自然语言处理
深度学习
python
神经网络
DeepSeek-R1全面超越OpenAI o1:开源大模型训练范式革新
其中,2017年Google发布的“AttentionIsAllYouNeed”论文奠定了神经网络架构的重要基础,推动了大规模语言模型(
LLM
)的突破。
·
2025-02-05 02:16
前端javascript
使用Ollama本地化部署DeepSeek
1、Ollama简介Ollama是一个开源的本地化大模型部署工具,旨在简化大型语言模型(
LLM
)的安装、运行和管理。
·
2025-02-05 02:15
大模型llm人工智能
DeepSeek 微调变得简单:使用 Python 创建自定义 AI 模型 学习针对所有用例微调 DeepSeek R1 模型
通过本文,您将了解如何将通用的DeepSeekR1模型转变为专门的、特定领域的
LLM
。
知识大胖
·
2025-02-04 22:09
NVIDIA
GPU和大语言模型开发教程
python
人工智能
学习
深度学习-98-大语言模型
LLM
之基于langchain的代理create_react_agent工具
文章目录1Agent代理1.1代理的分类1.2ReAct和Structuredchat2代理应用ReAct2.1创建工具2.1.1嵌入模型2.1.2创建检索器2.1.3测试检索结果2.1.4创建工具列表2.2初始化大模型2.3创建Agent2.4运行Agent3参考附录1Agent代理Agent代理的核心思想是使用语言模型来选择要采取的一系列动作。(1)在链中,动作序列是硬编码的。(2)在代理中,
皮皮冰燃
·
2025-02-04 18:46
深度学习
深度学习
语言模型
langchain
Kimi k1.5 : OpenAI-o1 级多模态模型
阅读时长:15分钟发布时间:2025-02-04近日热文:全网最全的神经网络数学原理(代码和公式)直观解释欢迎关注知乎和公众号的专栏内容
LLM
架构专栏知乎
LLM
专栏知乎【柏企】公众号【柏企科技说】【柏企阅文
·
2025-02-04 18:36
人工智能
Kimi k1.5 : OpenAI-o1 级多模态模型
阅读时长:15分钟发布时间:2025-02-04近日热文:全网最全的神经网络数学原理(代码和公式)直观解释欢迎关注知乎和公众号的专栏内容
LLM
架构专栏知乎
LLM
专栏知乎【柏企】公众号【柏企科技说】【柏企阅文
·
2025-02-04 18:32
人工智能
OpenAI 模型与 DeepSeek 模型使用的强化学习有何不同
OpenAI模型与DeepSeek模型使用的强化学习有何不同阅读时长:15分钟发布时间:2025-02-04近日热文:全网最全的神经网络数学原理(代码和公式)直观解释欢迎关注知乎和公众号的专栏内容
LLM
·
2025-02-04 18:02
人工智能
使用 LangChain 掌握检索增强生成 (RAG) 的终极指南:2、查询转换
查询转换查询转换的核心思想是将用户查询以一种能让大型语言模型(
LLM
)正确回答问题的方式进行翻译或转换。
Hugo_Hoo
·
2025-02-04 16:29
使用
LangChain
掌握RAG的指南
langchain
人工智能
AI编程
LangChain教程 - 系列文章
LangChain是一个专为开发大语言模型(
LLM
)应用程序设计的框架。它提供了丰富的模块化工具,支持开发者轻松构建、管理和部署复杂的
LLM
应用程序。
花千树-010
·
2025-02-04 16:56
LangChain
langchain
人工智能
机器学习
AI编程
AIGC
java
spring
LLM
大模型部署实战指南:部署简化流程
LLM
大模型部署实战指南:Ollama简化流程,OpenLLM灵活部署,LocalAI本地优化,Dify赋能应用开发1.Ollama部署的本地模型()Ollama是一个开源框架,专为在本地机器上便捷部署和运行大型语言模型
汀、人工智能
·
2025-02-04 13:00
LLM工业级落地实践
AI
Agent
人工智能
如何在本地正确部署Dify服务
Dify是一个开源的
LLM
(大型语言模型)应用开发平台,旨在为开发者提供从Agent构建到AIworkflow编排、RAG检索、模型管理等全方位的能力,从而轻松构建和运营生成式AI原生应用。
写python的鑫哥
·
2025-02-04 12:56
Python课堂
python
Dify
本地
部署
LLM
大型语言模型
框架
LlamaIndex架构设计:大模型长期记忆模块竟暗藏图数据库玄机
随着人工智能技术的不断发展,大型语言模型(
LLM
)已经在自然语言处理、文本生成、对话系统等领域取得了显著的进展。
威哥说编程
·
2025-02-04 08:52
数据库
llama
Databricks 开源
LLM
,训练只需三个小时
大数据分析公司DatabricksInc近日也加入了生成式AI领域的竞争之中,发布了一个名为Dolly的开源大型语言模型,将模型命名为Dolly是为了向第一只克隆羊多莉致敬。像ChatGPT和Bard这样的生成式AI,它们使用的数据通常来自于在成千上万不同网站,使用的数据量十分惊人,而且想要使用这些数据训练AI还需要数以千计的强大GPU在背后提供支持。Databricks希望通过开源Dolly及其
唐 城
·
2025-02-04 07:15
AI-毕业设计全套
spring
log4j
postgresql
数据库
java
DeepSeek总是崩?教你本地部署离线DeepSeek R1,保姆级教程
下面会讲到部署本地
LLM
(大模型)需要的软件,以及相应的电脑配置,这里以DeepSeeKR1各种版本为例。
朱卫军 AI
·
2025-02-03 22:35
AI编程
ai
人工智能
python
一文读懂自动编码器:类型、原理与应用
一文读懂自动编码器:类型、原理与应用近日热文:全网最全的神经网络数学原理(代码和公式)直观解释欢迎关注知乎和公众号的专栏内容
LLM
架构专栏知乎
LLM
专栏知乎【柏企】公众号【柏企科技说】【柏企阅文】目录自动编码器稀疏自动编码器
·
2025-02-03 16:03
人工智能
️ 在 Windows WSL 上部署 Ollama 和大语言模型的完整指南20241206
️在WindowsWSL上部署Ollama和大语言模型的完整指南引言随着大语言模型(
LLM
)和人工智能的飞速发展,越来越多的开发者尝试在本地环境中部署大模型进行实验。
Narutolxy
·
2025-02-03 16:09
技术干货分享
智浪初航
windows
语言模型
人工智能
深度学习:基于MindNLP的RAG应用开发
RAG(Retrieval-AugmentedGeneration,检索增强生成)是一种结合检索(Retrieval)和生成(Generation)的技术,旨在提升大语言模型(
LLM
)生成内容的准确性、
Landy_Jay
·
2025-02-03 13:47
深度学习
人工智能
大型语言模型(
LLM
)压缩技术:如何让庞然大物更轻巧?
大型语言模型(
LLM
)压缩技术:如何让庞然大物更轻巧?随着大模型在各个领域的广泛应用,我们面临的一个核心问题是——如何让这些庞大的模型在硬件资源有限的环境下运行?
空间机器人
·
2025-02-03 12:09
LLM语言模型学习笔记
语言模型
人工智能
自然语言处理
M-Ped: Multi-Prompt Ensemble Decoding for Large Language Models
本文是
LLM
系列文章,针对《M-Ped:Multi-PromptEnsembleDecodingforLargeLanguageModels》的翻译。
UnknownBody
·
2025-02-03 11:36
LLM
Daily
LLM
Prompt
prompt
语言模型
人工智能
SlimGPT: Layer-wise Structured Pruning for Large Language Models
本文是
LLM
系列文章,针对《SlimGPT:Layer-wiseStructuredPruningforLargeLanguageModels》的翻译。
UnknownBody
·
2025-02-03 11:35
LLM
Daily
LLM
Pruning
剪枝
语言模型
人工智能
使用Colpali架构掌握多模态RAG技术
传统的
LLM
面临着“幻觉”问题,即它们可能生成听起来合理但实际上错误或未经证实的信息。为了解决这个问题,检索增强生成(RAG)模型应运而生。
大模型之路
·
2025-02-03 07:33
RAG
RAG
多模态
多模态RAG
检索增强生成
LLM
什么是MOE架构?哪些大模型使用了MOE?
在人工智能快速发展的今天,大语言模型(
LLM
)的规模越来越大,参数量动辄上千亿甚至万亿。然而,更大的模型往往意味着更高的计算成本和更多的资源消耗。
明哲AI
·
2025-02-03 06:18
AIGC
架构
人工智能
大模型
MOE
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他