E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
LLM
NotebookLM:Google 最新 AI 笔记助理解析与实战应用
它结合了Google的大语言模型(
LLM
)能力,帮助用户更高效地整理、理解和生成知识内容。本文将全面解析NotebookLM的技术原理、核心功能、应用场景,并提供实际使用指南,帮助
赵大仁
·
2025-02-02 23:56
人工智能
技术
大语言模型
深度学习
人工智能
语言模型
自然语言处理
机器学习
笔记
从零开始大模型开发与微调:汉字拼音数据集处理
随着深度学习技术的飞速发展,大规模语言模型(LargeLanguageModel,
LLM
)在NLP领域取得了显著的成果。
AGI大模型与大数据研究院
·
2025-02-02 22:43
大数据AI人工智能
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
AI大模型部署:Ollama与vLLM部署对比:哪个更合适?
前言近年来,大语言模型(
LLM
)的应用日益广泛,而高效的部署方案至关重要。Ollama和vLLM作为两种流行的
LLM
部署工具,各有优劣。
大模型部署
·
2025-02-02 21:11
langchain
人工智能
docker
llama
LLM
程序员
Ollama
本地部署
LLM
工具大比拼:谁才是你的智能之选?
在人工智能的浪潮中,本地部署
LLM
工具为我们开启了个性化智能交互的新大门。
Python_金钱豹
·
2025-02-02 21:10
microsoft
ocr
人工智能
cnn
transformer
分类
LLM
- 大模型 ScallingLaws 的设计 100B 预训练方案(PLM) 教程(5)
欢迎关注我的CSDN:https://spike.blog.csdn.net/本文地址:https://spike.blog.csdn.net/article/details/145356022免责声明:本文来源于个人知识与公开资料,仅用于学术交流,欢迎讨论,不支持转载。ScalingLaws(缩放法则)是大模型领域中,用于描述模型性能(Loss)与模型规模N、数据量D、计算资源C之间关系的经验规
ManonLegrand
·
2025-02-02 18:21
大模型
(LLM)
人工智能
LLM
ScalingLaws
100B
预训练
DeepNorm
EGS
微调特定于域的搜索的文本嵌入:附Python代码详解
微调特定于域的搜索的文本嵌入:附Python代码详解阅读时长:20分钟发布时间:2025-02-02近日热文:全网最全的神经网络数学原理(代码和公式)直观解释欢迎关注知乎和公众号的专栏内容
LLM
架构专栏知乎
·
2025-02-02 14:07
人工智能
AI大模型基于
LLM
的Agent架构图解
AIAgent主要依托
LLM
模型和具体的业务场景来调用相应的工具来完成任务目标,智能化程度和行业贴合度会更明显。典型案例有什么?智能核保应用,如果解决方案搭载AIAgent能力,
AI产品经理
·
2025-02-02 14:51
人工智能
深度学习
语言模型
学习
什么是
LLM
?看这一篇就够了!
本文主要介绍大语言模型(LargeLanguageModel,简称
LLM
)。
Python程序员罗宾
·
2025-02-02 14:50
人工智能
语言模型
AIGC
自然语言处理
【
llm
对话系统】大模型 Llama 源码分析之并行训练方案
1.引言训练大型语言模型(
LLM
)需要巨大的计算资源和内存。为了高效地训练这些模型,我们需要采用各种并行策略,将计算和数据分布到多个GPU或设备上。
kakaZhui
·
2025-02-02 13:14
llama
人工智能
AIGC
chatgpt
【
llm
对话系统】大模型 Llama 源码分析之 LoRA 微调
1.引言微调(Fine-tuning)是将预训练大模型(
LLM
)应用于下游任务的常用方法。然而,直接微调大模型的所有参数通常需要大量的计算资源和内存。
kakaZhui
·
2025-02-02 13:14
llama
深度学习
pytorch
AIGC
chatgpt
【
llm
对话系统】大模型 Llama 源码分析之 Flash Attention
1.写在前面近年来,基于Transformer架构的大型语言模型(
LLM
)在自然语言处理(NLP)领域取得了巨大的成功。
kakaZhui
·
2025-02-02 13:43
llama
人工智能
AIGC
chatgpt
llama.cpp
LLM
_CHAT_TEMPLATE_DEEPSEEK_3
`LLAMA_VOCAB_PRE_TYPE_DEEPSEEK3_
LLM
`2.`staticconststd::mapLLM_CHAT_TEMPLATES`3.
Yongqiang Cheng
·
2025-02-02 12:10
ggml
-
llama.cpp
-
whisper.cpp
llama.cpp
DEEPSEEK_3
【
llm
对话系统】大模型 Llama、Qwen 和 ChatGLM 的网络结构和训练方法对比
1.引言近年来,大型语言模型(
LLM
)取得了令人瞩目的进展,其中Llama、Qwen和ChatGLM是三个备受关注的开源模型。
kakaZhui
·
2025-02-02 07:54
llama
人工智能
AIGC
chatgpt
python
LLM
的实时性:迈向毫秒级响应的AI
LargeLanguageModel(
LLM
),实时性,响应时间,微服务架构,并行处理,知识图谱,优化算法,延迟最小化1.背景介绍大型语言模型(
LLM
)在自然语言处理领域取得了令人瞩目的成就,展现出强大的文本生成
AI大模型应用之禅
·
2025-02-02 06:47
AI大模型与大数据
java
python
javascript
kotlin
golang
架构
人工智能
[系统安全] 六十一.恶意软件分析 (12)
LLM
赋能Lark工具提取XLM代码的抽象语法树(初探)
您可能之前看到过我写的类似文章,为什么还要重复撰写呢?只是想更好地帮助初学者了解病毒逆向分析和系统安全,更加成体系且不破坏之前的系列。因此,我重新开设了这个专栏,准备系统整理和深入学习系统安全、逆向分析和恶意代码检测,“系统安全”系列文章会更加聚焦,更加系统,更加深入,也是作者的慢慢成长史。换专业确实挺难的,逆向分析也是块硬骨头,但我也试试,看看自己未来四年究竟能将它学到什么程度,漫漫长征路,偏向
Eastmount
·
2025-02-02 01:20
系统安全与恶意代码分析
系统安全
抽象语法树
Lark
大模型
XLM
开源LLMs导览:工作原理、顶级
LLM
列表对比
机器人、人工智能相关领域news/events(专栏目录)本文目录一、开源
LLM
是什么意思?二、开源
LLM
如何工作?
万俟淋曦
·
2025-02-01 23:11
Some
Insights
人工智能
AI
生成式人工智能
大模型
LLM
chatgpt
大语言模型
揭秘大语言模型:什么是
LLM
大模型?
前言自从去年chatgpt横空出世以来,它火爆也让大语言模型这个词变的很流行,到底什么是大语言模型,今天从初学者的角度介绍一下大语言模型的基本概念、组成部分和基本工作流程等。下面的介绍中如果涉及到一些专业术语不太理解,也没关系,只要有一个感性认识即可,毕竟我们不打算造车,只要做到自己部署开源大模型的时候,不至于脸盲就可以了。一、大语言模型特点和基本组成大语言模型(LargeLanguageMode
AGI-杠哥
·
2025-02-01 23:11
程序人生
兼职副业
web安全
语言模型
人工智能
自然语言处理
LearnLM: Improving Gemini for Learning
本文是
LLM
系列文章,针对《LearnLM:ImprovingGeminiforLearning》的翻译。
UnknownBody
·
2025-02-01 22:04
LLM
Daily
语言模型
人工智能
自然语言处理
LitGPT - 20多个高性能
LLM
,具有预训练、微调和大规模部署的recipes
文章目录一、关于LitGPT二、快速启动安装LitGPT高级安装选项从20多个
LLM
中进行选择三、工作流程1、所有工作流程2、微调
LLM
3、部署
LLM
4、评估
LLM
5、测试
LLM
6、预训练
LLM
7、继续预训练
伊织产研
·
2025-02-01 19:38
#
AI
开源项目
LitGPT
预训练
微调
部署
Meta首席科学家Yann LeCun预言:5年内AI架构将颠覆,当前大模型的4大核心缺陷
✨引言:一场颠覆AI行业的预言在2025冬季达沃斯“技术辩论”现场,Meta首席AI科学家、图灵奖得主杨立昆(YannLeCun)抛出一个震撼观点:“当前的大语言模型(
LLM
)范式将在3-5年内被淘汰。
机器小乙
·
2025-02-01 18:30
人工智能
【AI人工智能】DeepSeek R1:你需要知道的一切
,请坚持认真读完,必有收获:DeepSeekR1简要概述主要特点与能力开源与可访问性模型架构强化学习训练变体与精简模型使用案例与应用从专有模型迁移到开源模型1.DeepSeekR1简要概述大语言模型(
LLM
大名顶顶
·
2025-02-01 17:22
人工智能
人工智能
AI
DeepSeek
程序员
计算机
编程
开源
使用Ollama本地化部署DeepSeek
1、Ollama简介Ollama是一个开源的本地化大模型部署工具,旨在简化大型语言模型(
LLM
)的安装、运行和管理。
·
2025-02-01 16:48
大模型llm人工智能
LLM
-预训练:深入理解 Megatron-LM(2)原理介绍
最近在基于Megatron-LM的代码来训练大语言模型,本人觉得Megatron的代码很具有学习意义,于是大量参考了网上很多对Megatron代码的解读文章和NVIDAMegatron团队公开发布的2篇论文,并结合最近Megatron-LM代码库的更新,整理成了这几篇系列文章。Megatron-LM代码版本:23.06https://github.com/NVIDIA/Megatron-LM/tr
u013250861
·
2025-02-01 15:05
#
LLM/训练
人工智能
自定义
LLM
:LangChain与文心一言擦出火花
自定义
LLM
自定义
LLM
需要实现以下必要的函数:_call:它需要接受一个字符串、可选的停用词,并返回一个字符串。
AI领航者
·
2025-02-01 15:31
langchain
文心一言
机器学习
人工智能
chatgpt
【大模型应用开发 动手做AI Agent】Plan and Solve策略的提出
Plan-and-Solve策略的提出关键词:大模型,AIAgent,Plan-and-Solve,智能体,策略学习,强化学习,自然语言处理1.背景介绍随着人工智能技术的飞速发展,大模型(LargeLanguageModel,
LLM
杭州大厂Java程序媛
·
2025-02-01 14:22
计算机软件编程原理与应用实践
java
python
javascript
kotlin
golang
架构
人工智能
LLM
主要类别架构
LLM
主要类别架构介绍
LLM
主要类别
LLM
本身基于transformer架构。
大模型微调实战
·
2025-02-01 08:36
人工智能
langchain
自然语言处理
神经网络
深度学习
LLM
应用架构实战:基于LangChain的企业级最佳实践
前言随着ChatGPT等大语言模型的广泛应用,越来越多的企业开始将
LLM
整合到其业务系统中。然而,从概念验证(PoC)到生产环境的转换过程中,往往会遇到诸多技术挑战。
LLM教程
·
2025-02-01 05:44
langchain
大模型
人工智能
本地化部署
Agent
程序员
LLM
构建高效
LLM
应用开发架构的关键策略
文章标题:构建高效
LLM
应用开发架构的关键策略在当今快速发展的技术世界中,人工智能(AI)已经成为推动创新的核心动力。其中,大型语言模型(
LLM
)的应用开发尤为引人注目。
AI天才研究院
·
2025-02-01 05:12
计算机软件编程原理与应用实践
java
python
javascript
kotlin
golang
架构
人工智能
大厂程序员
硅基计算
碳基计算
认知计算
生物计算
深度学习
神经网络
大数据
AIGC
AGI
LLM
系统架构设计
软件哲学
Agent
程序员实现财富自由
深入探讨:如何在Python中使用流式传输技术高效调用大型语言模型
深入探讨:如何在Python中使用流式传输技术高效调用大型语言模型在现代人工智能应用中,大型语言模型(LargeLanguageModels,
LLM
)已经成为了强大的工具,能够生成高质量的自然语言文本,
m0_57781768
·
2025-01-31 19:14
python
语言模型
microsoft
【大模型入门必看】
LLM
大语言模型导读
前言在规模扩展定律(ScalingLaws)被证明对语言模型有效之后,研究者构建出了许多大语言模型。尤其是2022年底面向普通消费者的ChatGPT模型的出现,正式标志着自然语言处理进入大语言模型时代。本章将简要梳理大语言模型的技术要点以及构建过程,并且列举了可用于预训练以及微调模型的常用数据集,介绍了目前开发大语言模型常用的代码库、预训练大语言模型的步骤以及涉及的关键技术,包括数据准备阶段、模型
古-月
·
2025-01-31 16:24
LLM
大语言模型
本地部署 DeepSeek-R1 大模型
本地部署DeepSeek-R1大模型指南1.引言1.1DeepSeek-R1模型简介在人工智能的世界里,大型语言模型(
LLM
)正如一座巨大的宝库,里面储存着丰富的信息和无限的潜力。
网络安全我来了
·
2025-01-31 13:57
人工智能
AI
人工智能
A Survey on Large Language Model Acceleration based on KV Cache Management
本文是
LLM
系列文章,针对《ASurveyonLargeLanguageModelAccelerationbasedonKVCacheManagement》的翻译。
UnknownBody
·
2025-01-31 12:47
LLM
Daily
Survey
Paper
LLM
Inference
语言模型
人工智能
自然语言处理
Deepseek两项关键发现:无需人类专家介入SFT、有自己
目前尚未实现AGI,主流AI行业和公众普遍认为通过扩大纯语言模型(
LLM
)的预训练规模就能实现突破
极道Jdon
·
2025-01-31 08:13
javascript
reactjs
DeepSeek极端榨取硬件性能被曝光
DeepSeek的出现是否意味着前沿
LLM
开发不再需要大规模GPU集群?简单来说:不是的。
极道Jdon
·
2025-01-31 08:13
javascript
reactjs
Ubuntu上如何优雅下载huggingface上某个gguf模型文件
OS:Ubuntu22.04LTS需求:下载GorillaOpenfunctionsV2Q2GGUF模型到本地https://huggingface.co/gorilla-
llm
/gorilla-openfunctions-v2
晨欣
·
2025-01-31 08:40
ubuntu
linux
运维
万字长文解读生成式AI参考架构
原文:TheGenAIReferenceArchitecture本文将介绍构建端到端GenAI应用的主要架构构件和蓝图,以便为生产做好准备,并且提出了几个在实施和设计基于
LLM
的应用时需要注意的关键事项
俞凡 DeepNoMind
·
2025-01-31 07:32
程序人生
LLM
模型部署经验分享
LLM
模型部署经验分享作者:大连理工大学李凯首先,你需要选择一个合适的部署平台,这可以是本地服务器、云服务提供商(如AWS、Azure、GoogleCloud等)、边缘设备或者特定的部署服务(如HuggingFaceHub
lewis_kai
·
2025-01-31 06:56
阿里云
语言模型
开源大模型(
LLM
)下载
由于huggingface等国外网址无法访问或限制等问题,下载不了或下载速度慢。可以尝试从modespace(魔搭社区)下载。1、找到对应的模型文件,比如Meta-Llama-3-8B,然后找到下载入口2、点击模型下载,有2种下载方式,这里我们通过git下载(注意由于模型文件一般都比较大,直接使用gitclone下载时会有问题,超大文件下载后数据会缺失。可通过gitlfsclone命令)3、打开l
baidu_20834545
·
2025-01-31 06:25
语言模型
使用Ollama和Open WebUI快速玩转大模型:简单快捷的尝试各种
llm
大模型,比如DeepSeek r1
Ollama本身就是非常优秀的大模型管理和推理组件,再使用OpenWebUI更加如虎添翼!Ollama快速使用指南安装OllamaWindows下安装下载Windows版Ollama软件:Releasev0.5.7·ollama/ollama·GitHub下载ollama-windows-amd64.zip这个文件即可。可以说Windows拥抱开源真好,Windows下安装软件简单方便,开源软件直
skywalk8163
·
2025-01-31 04:38
人工智能
人工智能
ollama
DeepSeek
[特殊字符]文献阅读分享:《负面情绪更吸睛?利用大型语言模型重构新闻推荐系统中的情感框架》
本文通过实验研究,探讨了基于
LLM
的情感框架重构对用户情感、参与度和付费意愿的影响。相关工
Sheakan
·
2025-01-30 22:20
推荐系统论文阅读总结
语言模型
重构
人工智能
实战
LLM
强化学习——使用GRPO(DeepSeek R1出圈算法)
但,为了更好的理解强化学习在
LLM
训练过程中发挥的意义,也为了学习GPRO这个强化学习算法,笔者出此题目,方便大家学习理解。GRPO(GroupRela
FF-Studio
·
2025-01-30 19:54
DeepSeek
R1
算法
语言模型
人工智能
自然语言处理
机器学习
vLLM源码之分离式架构
一、vLLM分离式架构概述1.基本概念vLLM是一个用于高效地服务大语言模型(
LLM
)推理的库。其分离式架构是一种创新的设计理念,旨在优化
LLM
的运行效率。
Bj陈默
·
2025-01-30 17:38
架构
OpenAI 函数调用 功能入门
Javascript版Langchain入门作者:AI小火箭的HB我是AI小火箭的HB,我探索和写作人工智能和语言交叉点的所有事物,范围从
LLM
,聊天机器人,语音机器人,开发框架,以数据为中心的潜在空间等
AI火箭
·
2025-01-30 16:57
chatgpt
openai
DeepSeek:
LLM
在MoE训练中的无损平衡
标题:AUXILIARY-LOSS-FREELOADBALANCINGSTRAT-EGYFORMIXTURE-OF-EXPERTS来源:arXiv,2408.15664摘要对于混合专家(MoE)模型,不平衡的专家负载将导致路由崩溃或计算开销增加。现有方法通常采用辅助损耗来促进负载平衡,但较大的辅助损耗会在训练中引入不可忽略的干扰梯度,从而损害模型性能。为了在训练过程中控制负载平衡,同时不产生不希望
大模型任我行
·
2025-01-30 16:24
大模型-模型训练
人工智能
自然语言处理
语言模型
论文笔记
Deepseek技术浅析(一)
DeepSeek是北京深度求索人工智能基础技术研究有限公司推出的人工智能技术品牌,专注于大语言模型(
LLM
)的研发与应用。
爱研究的小牛
·
2025-01-30 12:58
AIGC—概述
大模型
AIGC
人工智能
深度学习
自然语言处理
【
llm
对话系统】大模型源码分析之llama模型的long context更长上下文支持
1.引言Llama模型的一个重要特性是支持长上下文处理。本文将深入分析Llama源码中实现长上下文的关键技术点,包括位置编码(positionembedding)的外推方法、注意力机制的优化等。我们将通过详细的代码解析来理解其实现原理。2.位置编码的外推实现2.1旋转位置编码(RoPE)基础Llama采用旋转位置编码(RoPE,RotaryPositionEmbedding)来编码token的位置
kakaZhui
·
2025-01-30 12:57
llama
深度学习
pytorch
AIGC
chatgpt
LLM
系列(0):行业大模型落地服务在全业务场景的应用与探索【大模型智能问答、NL2SQL、文档智能分析智能生成、AI智能体决策等】
行业大模型落地服务:在全业务场景的应用与探索1.行业大模型落地挑战及应对1.1.挑战一:有限的算力资源在政企客户场景中落地行业大模型方案,可能首先面临的一个挑战是客户的算力资源有限。算力资源作为大模型落地的前提条件,是很多客户关注的重点,也是业务团队前期与客户沟通交流的一个重点。行业大模型场景落地是否一定需要大量的GPU算力,以及需要多少的算力才能满足落地需求?GPU算力主要消耗在两个地方,一是大
汀、人工智能
·
2025-01-30 10:41
LLM工业级落地实践
人工智能
自然语言处理
prompt
NL2DSL
NL2SQL
大模型
智能问答
【
llm
对话系统】大模型 RAG 之回答生成:融合检索信息,生成精准答案
在这一步,
LLM
将融合用户问题和检索到的文档片段,生成最终的答案。这个过程不仅仅是简单的文本拼接,更需要
LLM
对检索结果进行理解、推理和整合,才能输出准确、流畅且符合用户需求的答案。
kakaZhui
·
2025-01-30 10:09
人工智能
AIGC
chatgpt
llama
ollama如何保持模型加载在内存(显存)中或立即卸载
这允许在您多次请求
LLM
时获得更快的响应时间。然而,您可能希望在5分钟内释放内存,或者希望模型无限期地保留在内存中。
点动生态云
·
2025-01-30 09:34
python
llama
语言模型
AI学习指南Ollama篇-Ollama的多模态应用探索
AI学习指南应用篇-Ollama的多模态应用探索一、引言(一)背景介绍随着大语言模型(
LLM
)的发展,多模态应用(结合文本、图像、语音等)成为新的趋势。
俞兆鹏
·
2025-01-30 09:04
AI学习指南
ai
上一页
2
3
4
5
6
7
8
9
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他