E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
LLM
Chapter4.1 Coding an
LLM
architecture
4ImplementingaGPTmodelfromScratchToGenerateText4.1CodinganLLMarchitecture4ImplementingaGPTmodelfromScratchToGenerateText本章节包含编写一个类似于GPT的大型语言模型(
LLM
亲持红叶
·
2025-02-08 01:53
构建大语言模型(从头开始)
gpt
python
人工智能
自然语言处理
transformer
大模型(
LLM
)微调并不复杂,数据才是关键:3个实例详解数据准备
今天咱们聊聊一个听起来很高大上的词——微调(Fine-Tuning)。听说过吗?别担心,今天我们不打算深挖那些复杂的技术细节,而是要告诉你们一个简单的事实:微调其实一点都不复杂,真正的关键在于——数据!前排提示,文末有大模型AGI-CSDN独家资料包哦!在这篇文章里,我们不仅会深入浅出地介绍什么是微调,还会通过三个具体的实例,教你们如何准备高质量的数据集,让你们的模型表现出色。准备好了吗?让我们一
程序员二飞
·
2025-02-08 01:21
深度学习
机器学习
人工智能
金融
学习
chatgpt
大数据
RAG和KAG:AI知识增强的两大“利器”
一文读懂RAG和KAG:AI知识增强的两大“利器”阅读时长:15分钟发布时间:2025-02-07近日热文:全网最全的神经网络数学原理(代码和公式)直观解释欢迎关注知乎和公众号的专栏内容
LLM
架构专栏知乎
·
2025-02-07 13:53
人工智能
LLM
速览篇【91-120】
概述文档:基于
LLM
的最新研究方向归纳这30篇内容可以发现当前LLMs在各个领域展现了强大的适应性和创新潜力,从医疗、教育、视觉任务到机器人控制、法律与政策、生成式AI、隐私保护和系统优化,LLMs的应用范围正在不断扩大
hjzhang75
·
2025-02-07 13:03
人工智能
nlp
Deep-Seek 开源项目教程
该项目利用大型语言模型(
LLM
)处理大量数据源,以收集全面的实体列表。Deep-Seek不仅支持文本生成,还特别擅长数学、代码和推理任务。项目快速启动环境准备在开始之前,请确保您
毛炎宝Gardener
·
2025-02-07 08:34
【
LLM
】Ollama:本地大模型 WebAPI 调用
Ollama快速部署安装Docker:从Docker官网下载并安装。部署Ollama:使用以下命令进行部署:dockerrun-d-p11434:11434--nameollama--restartalwaysollama/ollama:latest进入容器并下载qwen2.5:0.5b模型:进入Ollama容器:dockerexec-itollamabash在容器内下载模型:ollamapull
m0_74824496
·
2025-02-07 07:55
vip1024p
java
探秘 DeepSeek:AI 领域的创新力量
公司自2023年成立以来,便将目光聚焦于大语言模型(
LLM
)和相关技术的开发,致力于在人工智能领域开辟出一片新天地。
秉寒
·
2025-02-07 04:35
人工智能
专为RAG和AGENT而生的PDF解析新工具:PymuPDF4
LLM
利用大模型(
LLM
),结合本地知识,开发RAG或者AGENT的应用,解析PDF文档几乎是不可避免的事情。多数开发者可能习惯使用LlamaParse。这个工具虽然可以用,但总有不满意之处。
CS创新实验室
·
2025-02-07 03:56
AIGC
pdf
AIGC
Ollama安装部署deepseek
llama3模型(亲测垃圾机房都可以跑起来)下载DeepSeek-V3模型运行模型搭建Web环境OllamaOllama是一个开源的大型语言模型服务工具,旨在帮助用户在本地环境中部署和运行大规模预训练语言模型(
LLM
angel725
·
2025-02-07 02:53
llama
ai
使用DeepSeek-R1和Ollama构建RAG系统以进行本地部署
使用DeepSeek-R1和Ollama构建RAG系统以进行本地部署我们将探讨如何使用DeepSeekR1(一种针对结构化任务优化的开源推理模型)和Ollama(一种用于在本地运行
LLM
的框架)构建功能齐全的
·
2025-02-07 02:10
人工智能
大模型RAG优化方案_融合bm25和语义检索
写在前面检索增强生成(Retrieval-AugmentedGeneration,RAG)是一种将检索(Retrieval)和生成(Generation)相结合的技术,它利用检索到的相关信息来增强大型语言模型(
LLM
kakaZhui
·
2025-02-06 23:31
大模型应用案例之RAG
打造个人专属知识库bot
人工智能
llama
AIGC
chatgpt
python
Unifying Large Language Models and Knowledge Graphs: A Roadmap综述笔记-入门-知识图谱KG-大模型
LLM
论文信息标题:UnifyingLargeLanguageModelsandKnowledgeGraphs:ARoadmap作者:ShiruiPan摘要LLMs,例如chatGPT和GPT4,由于其涌现能力和泛化性,对自然语言理解和人工智能领域产生了新的冲击。然而,LLMs是一个黑箱模型,往往缺乏捕获和获得事实知识。相反,知识图谱,例如维基百科等,是有结构模型。存储着丰富的事实知识。KGs可以通过提
笨cc
·
2025-02-06 22:23
KG读论文
语言模型
知识图谱
笔记
必知!10大机器学习算法
——吴恩达近日热文:全网最全的神经网络数学原理(代码和公式)直观解释欢迎关注知乎和公众号的专栏内容
LLM
架构专栏知乎
LLM
专栏知乎【柏企】公众号【柏企科技说】【柏企阅文】1.K最近邻(KNN)KNN是一种简单却强大的分类算法
·
2025-02-06 21:56
人工智能
高效抽取PDF文件打造RAG,从LlamaParse转向PymuPDF4
llm
PymuPDF4
llm
:大型语言模型的高效PDF数据处理利器。PymuPDF4
llm
是专为大型语言模型设计的强大工具,能够将杂乱的PDF数据整理得井井有条,为你的AI项目提供有力支持。
小天才学习机打游戏
·
2025-02-06 19:38
pdf
embedding
人工智能
人机交互
transformer
目标跟踪
LLM
知识蒸馏代码讲解及训练实验
LLM
知识蒸馏代码讲解及训练实验知识蒸馏简单讲即使用大规模参数的模型对小规模参数模型进行蒸馏,且不是简单的只使用答案,是需要两个模型的logprob进行交互的,故两个模型的vocabsize必须是一样的
淡水,
·
2025-02-06 18:33
深度学习
pytorch
人工智能
nlp
python
知识蒸馏
【大模型
LLM
面试合集】训练数据_数据格式
数据格式1.SFT(有监督微调)的数据集格式?对于大语言模型的训练中,SFT(SupervisedFine-Tuning)的数据集格式可以采用以下方式:输入数据:输入数据是一个文本序列,通常是一个句子或者一个段落。每个样本可以是一个字符串或者是一个tokenized的文本序列。标签数据:标签数据是与输入数据对应的标签或类别。标签可以是单个类别,也可以是多个类别的集合。对于多分类任务,通常使用one
X.AI666
·
2025-02-06 18:28
人工智能
big
data
大型推理模型 (LRM) 的比较 OpenAI DeepSeek R1 Gemini 2.0
LRM)的比较OpenAIDeepSeekR1Gemini2.0阅读时长:25分钟发布时间:2025-02-06近日热文:全网最全的神经网络数学原理(代码和公式)直观解释欢迎关注知乎和公众号的专栏内容
LLM
·
2025-02-06 17:20
人工智能
Python用langchain、OpenAI大语言模型
LLM
情感分析AAPL股票新闻数据及提示工程优化应用
全文链接:https://tecdat.cn/?p=39614本文主要探讨了如何利用大语言模型(LLMs)进行股票分析。通过使用提供的股票市场和金融新闻获取数据,结合Python中的相关库,如Pandas、langchain等,实现对股票新闻的情感分析。利用大语言模型构建情感分析模型,通过提示工程等技术优化模型,最终通过可视化展示股票市场的情感倾向,为股票投资决策提供参考。关键词大语言模型;股票分
·
2025-02-06 17:10
数据挖掘深度学习机器学习
LangChain 深入指南:构建强大的
LLM
应用的核心架构
引言在当今的人工智能领域,构建强大且可扩展的语言模型(
LLM
)应用程序需要扎实的技术框架支持。LangChain是这样一个框架,旨在简化语言模型的部署、集成和运维。
nseejrukjhad
·
2025-02-06 16:19
langchain
架构
python
大模型面试必看!超详细面经指南+答案,轻松拿Offer!2025大模型上岸就靠它了!
[x]4.大模型
LLM
的架构介绍?[x]大模型(LLMs)进阶面[x]1.llama输入句子长度理论上可以无限长吗?[x]1.什么是LLMs复读机问题?[x]2.为什么会出现LLMs复读机问题?
AI大模型-大飞
·
2025-02-06 16:47
大模型
AI大模型
大模型教程
人工智能
学习
LLM
Deepseek
构建安全可靠的
LLM
应用架构
《构建安全可靠的
LLM
应用架构》关键词:大型语言模型(
LLM
),应用架构,安全性,可靠性,设计原则摘要:本文旨在深入探讨如何构建一个安全可靠的大型语言模型(
LLM
)应用架构。
AI天才研究院
·
2025-02-06 16:15
计算机软件编程原理与应用实践
java
python
javascript
kotlin
golang
架构
人工智能
大厂程序员
硅基计算
碳基计算
认知计算
生物计算
深度学习
神经网络
大数据
AIGC
AGI
LLM
系统架构设计
软件哲学
Agent
程序员实现财富自由
从零开始构建一个大语言模型-第五章第五节
第五章目录5.1评估生成文本模型5.2训练一个
LLM
5.3控制随机性的解码策略5.4在PyTorch中加载和保存模型权重5.5从OpenAI加载预训练权重5.5从OpenAI加载预训练权重此前,我们使用一个由一本短篇小说集组成的有限数据集训练了一个小型
释迦呼呼
·
2025-02-06 15:41
从零开始构建一个大语言模型
语言模型
人工智能
自然语言处理
机器学习
pytorch
DeepSeek-R1真算得上开源吗?
OpenAIo1模型证明,当
LLM
在推理时,通过增加计算量进行类似训练后,它们在数学、编程和逻辑等推理任务上的表现显著提升。然而,OpenAI推理模型的训练方法一直是秘密。
·
2025-02-06 13:37
人工智能
KRAIL: A Knowledge-Driven Framework for Base Human Reliability Analysis Integrating IDHEAS
本文是
LLM
系列文章,针对《KRAIL:AKnowledge-DrivenFrameworkforBaseHumanReliabilityAnalysisIntegratingIDHEASandLargeLanguageModels
UnknownBody
·
2025-02-06 12:15
LLM
Daily
语言模型
人工智能
有趣的项目--汇总
文章目录前言一、AI类二、前言持续记录有意思的项目,欢迎大家讨论一、AI类openglass+ollama:链接:OpenGlassAI眼镜的环境配置与实现InvidiaJetson+
LLM
:链接:生成式人工智能应用
cladel
·
2025-02-06 09:00
人工智能
SGlang 专为大模型设计的高效服务框架
SGlang是一种专为大型语言模型(
LLM
)和视觉语言模型(VLM)设计的高效服务框架,旨在提升模型的推理速度和灵活性。
kcarly
·
2025-02-06 08:52
大模型知识乱炖
LLM
大模型
SGLang
llama.cpp
LLM
_ARCH_DEEPSEEK and
LLM
_ARCH_DEEPSEEK2
`
LLM
_ARCH_DEEPSEEK`and`
LLM
_ARCH_DEEPSEEK2`2.`
LLM
_ARCH_DEEPSEEK`and`
LLM
_ARCH_DEEPSEEK2`3.
Yongqiang Cheng
·
2025-02-06 06:42
ggml
-
llama.cpp
-
whisper.cpp
llama.cpp
DEEPSEEK
DEEPSEEK2
使用vLLM部署Qwen2.5-VL-7B-Instruct模型的详细指南
使用vLLM部署Qwen2.5-VL-7B-Instruct模型的详细指南引言环境搭建安装vLLM安装依赖库下载模型启动vLLM服务器总结参考引言近年来,随着大规模语言模型(
LLM
)的快速发展,如何高效地进行模型推理成为了一个热门话题
engchina
·
2025-02-06 03:40
LINUX
vllm
qwen2.5-vl
7B
本地部署
大模型产品化第一年:战术、运营与战略
作者|EugeneYan、BryanBischof等OneFlow编译翻译|宛子琳、张雪聃、杨婷题图由SiliconCloud平台生成这是一个激动人心的时代,所有人都能够利用语言大模型(
LLM
)进行各种各样的产品构建
OneFlow深度学习框架
·
2025-02-06 03:39
业界观点
SiliconCloud
大模型
人工智能
硅基流动
前端大模型入门:编码(Tokenizer)和嵌入(Embedding)解析
本文介绍了大规模语言模型(
LLM
)中的两个核心概念:Tokenizer和Embedding。
大模型玩家
·
2025-02-06 03:38
前端
embedding
产品经理
经验分享
算法
人工智能
学习方法
大语言模型轻量化:知识蒸馏的范式迁移与工程实践
摘要在大型语言模型(
LLM
)主导人工智能发展的当下,模型参数量与推理成本的指数级增长已成为制约技术落地的核心瓶颈。
LucianaiB
·
2025-02-06 02:04
语言模型
人工智能
自然语言处理
python
大规模语言模型从理论到实践 DeepSpeed实践
大规模语言模型从理论到实践DeepSpeed实践文章目录大规模语言模型从理论到实践DeepSpeed实践1.背景介绍1.1大规模语言模型的兴起1.2训练和部署
LLM
的挑战1.3DeepSpeed:赋能
LLM
AI天才研究院
·
2025-02-06 01:59
大数据AI人工智能
AI大模型企业级应用开发实战
AI大模型应用入门实战与进阶
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
DeepSeek:探索未来的人工智能模型与技术
个人主页:一ge科研小菜鸡-CSDN博客期待您的关注1.引言近年来,大语言模型(
LLM
)迅速发展,推动了人工智能在多个领域的应用。
一ge科研小菜鸡
·
2025-02-05 22:32
人工智能
DeepSeek
LLM
大模型RAG内容安全合规检查
1.了解内容安全合规涉及的范围我们先回顾一下智能答疑机器人的问答流程。问答流程主要包括用户、智能答疑机器人、知识库、大语言模型这四个主体。涉及内容安全的关键阶段主要有:输入阶段:用户发起提问。输出阶段:机器人返回回答。知识库召回阶段:从知识库中召回相关的topK文本。针对RAG应用,内容安全合规检查方案的设计将围绕这三个阶段展开。为此,我们可以设计一套通用的合规检查机制,支持不同内容类型的检查,且
MichaelIp
·
2025-02-05 21:57
安全
人工智能
python
语言模型
自然语言处理
word2vec
chatgpt
51-59 CVPR 2024 | ChatSiM:Editable Scene Simulation for Autonomous Driving via Collaborative
LLM
上海交通大学、上海人工智能实验室、卡内基梅隆大学和清华大学联合发布EditableSceneSimulationforAutonomousDrivingviaCollaborativeLLM-Agents,基于
LLM
深圳季连AIgraphX
·
2025-02-05 18:10
aiXpilot
智驾大模型1
自动驾驶
AIGC
stable
diffusion
智慧城市
计算机视觉
大语言模型本地化部署+可视化微调
随着chatgpt的爆火,国内外的大语言模型(LargeLanguageModel,
LLM
)争先恐后,高速发展,人工智能技术也从传统的判别式人工智能逐渐转向了生成式人工智能,
LLM
作为AI的一种具体表现形式
科研小fw
·
2025-02-05 18:09
人工智能
语言模型
人工智能
自然语言处理
python
chatgpt
TensorRT-
LLM
保姆级教程(一)-快速入门
本系列将针对TensorRT-
LLM
推理进行讲解。本文为该系列第一篇,将简要概述TensorRT-
LLM
的基本特性。另外,我撰写的大模型相关的博客及配套代码均整理放置在Github:
llm
-act
大模型部署
·
2025-02-05 18:38
人工智能
transformer
产品经理
自然语言处理
kubernetes
大模型
LLM
长上下文大模型会让检索增强生成(RAG)过时吗?
大模型(
LLM
)的迅速发展对人工智能领域,尤其是自然语言处理(NLP)产生了重大影响。传统上,像检索增强生成(RAG)这样的技术通过允许模型动态访问外部知识源,在提升大语言模型能力方面发挥了重要作用。
·
2025-02-05 18:38
人工智能
Spring AI 智能体通过 MCP 集成本地文件数据
作者:刘军ModelContextProtocol(MCP)简介模型上下文协议(即ModelContextProtocol,MCP)[1]是一个开放协议,它规范了应用程序如何向大型语言模型(
LLM
)提供上下文
·
2025-02-05 18:37
云原生
LLM
算法工程师的速成指南:微调、强化学习微调与偏好微调
OpenAI近期在直播中,提到了两个新的概念:①强化学习微调(ReinforcementFine-Tuning):仅需少量高质量数据(数十到数千个),模型即可通过强化学习处理复杂任务。②偏好微调(PreferenceFine-Tuning,PFT):采用直接偏好优化(例如DirectPreferenceOptimization,DPO)算法,通过比较不同的模型输出,让AI能够学习并区分“更好”的回
大模型玩家
·
2025-02-05 16:24
算法
机器学习
深度学习
chatgpt
人工智能
ai
大模型
用 Python 微调 DeepSeek R1
用Python微调DeepSeekR1阅读时长:15分钟发布时间:2025-02-05近日热文:全网最全的神经网络数学原理(代码和公式)直观解释欢迎关注知乎和公众号的专栏内容
LLM
架构专栏知乎
LLM
专栏知乎
·
2025-02-05 13:24
程序员
DeepSeek-R1 低成本训练的根本原因是?
在人工智能领域,大语言模型(
LLM
)正以前所未有的速度发展,驱动着自然语言处理、内容生成、智能客服等众多应用的革新。
明哲AI
·
2025-02-05 11:10
AIGC
人工智能
大模型
deepseek
AI
Agent
从 0 到 1 掌握 LangChain Agents:自定义工具 +
LLM
打造智能工作流!
LangChain:从核心链条构建到动态任务分配的实战指南04-玩转LangChain:从文档加载到高效问答系统构建的全程实战05-玩转LangChain:深度评估问答系统的三种高效方法(示例生成、手动评估与
LLM
吴师兄大模型
·
2025-02-05 08:53
现代大模型技术与应用
langchain
Agents
自定义工具
python
LLM
大模型
LangChain
大语言模型
LLM
分布式训练:TensorFlow攻略与深度解析(
LLM
系列04)
文章目录大语言模型
LLM
分布式训练:TensorFlow攻略与深度解析(
LLM
系列04)1.引言2.TensorFlow分布式训练基础概念3.TensorFlow中
LLM
分布式训练的关键技术及应用4.利用
North_D
·
2025-02-05 08:20
大语言模型LLM
分布式
tensorflow
人工智能
自然语言处理
深度学习
python
神经网络
DeepSeek-R1全面超越OpenAI o1:开源大模型训练范式革新
其中,2017年Google发布的“AttentionIsAllYouNeed”论文奠定了神经网络架构的重要基础,推动了大规模语言模型(
LLM
)的突破。
·
2025-02-05 02:16
前端javascript
使用Ollama本地化部署DeepSeek
1、Ollama简介Ollama是一个开源的本地化大模型部署工具,旨在简化大型语言模型(
LLM
)的安装、运行和管理。
·
2025-02-05 02:15
大模型llm人工智能
DeepSeek 微调变得简单:使用 Python 创建自定义 AI 模型 学习针对所有用例微调 DeepSeek R1 模型
通过本文,您将了解如何将通用的DeepSeekR1模型转变为专门的、特定领域的
LLM
。
知识大胖
·
2025-02-04 22:09
NVIDIA
GPU和大语言模型开发教程
python
人工智能
学习
深度学习-98-大语言模型
LLM
之基于langchain的代理create_react_agent工具
文章目录1Agent代理1.1代理的分类1.2ReAct和Structuredchat2代理应用ReAct2.1创建工具2.1.1嵌入模型2.1.2创建检索器2.1.3测试检索结果2.1.4创建工具列表2.2初始化大模型2.3创建Agent2.4运行Agent3参考附录1Agent代理Agent代理的核心思想是使用语言模型来选择要采取的一系列动作。(1)在链中,动作序列是硬编码的。(2)在代理中,
皮皮冰燃
·
2025-02-04 18:46
深度学习
深度学习
语言模型
langchain
Kimi k1.5 : OpenAI-o1 级多模态模型
阅读时长:15分钟发布时间:2025-02-04近日热文:全网最全的神经网络数学原理(代码和公式)直观解释欢迎关注知乎和公众号的专栏内容
LLM
架构专栏知乎
LLM
专栏知乎【柏企】公众号【柏企科技说】【柏企阅文
·
2025-02-04 18:36
人工智能
Kimi k1.5 : OpenAI-o1 级多模态模型
阅读时长:15分钟发布时间:2025-02-04近日热文:全网最全的神经网络数学原理(代码和公式)直观解释欢迎关注知乎和公众号的专栏内容
LLM
架构专栏知乎
LLM
专栏知乎【柏企】公众号【柏企科技说】【柏企阅文
·
2025-02-04 18:32
人工智能
上一页
6
7
8
9
10
11
12
13
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他