E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
LLM
23. AI-大语言模型
文章目录前言一、
LLM
1.简介2.工作原理和结构3.应用场景4.最新研究进展5.比较二、Transformer架构1.简介2.基本原理和结构3.应用场景4.最新进展三、开源1.开源概念2.开源模式3.模型权重四
真上帝的左手
·
2025-02-15 12:34
23.
AI
人工智能
语言模型
自然语言处理
RWKV Runner:让RNN-
LLM
模型触手可及
在这个信息爆炸的时代,人工智能(AI)已经成为我们生活中不可或缺的一部分,尤其是大语言模型(
LLM
)在自然语言处理中的广泛应用。
步子哥
·
2025-02-15 11:57
rnn
人工智能
深度学习
使用CerebriumAI进行大规模语言模型的推理
传统的CPU在处理大规模语言模型(
LLM
)时效率较低,GPU成为了首选。然而,自行搭建GPU环境成本高昂且维护复杂。
qahaj
·
2025-02-15 07:54
语言模型
人工智能
自然语言处理
python
AI大模型DeepSeek本地部署及使用
二:认识Ollama1.什么是OllamaOllama是一个开源的
LLM
(大型语言模型)服务工具&#
zy_xingdian
·
2025-02-15 02:41
行癫k8s教程
行癫Go教程
行癫ArgoCD系列
人工智能
Deepseek
AI
行癫
xingdian
云计算
ollama
焦损函数(Focal Loss)与RetinaNet目标检测模型详解
焦损函数(FocalLoss)与RetinaNet目标检测模型详解阅读时长:19分钟发布时间:2025-02-14近日热文:全网最全的神经网络数学原理(代码和公式)直观解释欢迎关注知乎和公众号的专栏内容
LLM
·
2025-02-14 22:31
人工智能
LLM
大模型中文开源数据集集锦(三)
文章目录1ChatGLM-Med:基于中文医学知识的ChatGLM模型微调1.1数据集1.2ChatGLM+P-tuningV2微调1.3Llama+Alpaca的Lora微调版本2LawGPT_zh:中文法律大模型(獬豸)2.1数据集2.1.1利用ChatGPT清洗CrimeKgAssitant数据集得到52k单轮问答:2.1.2带有法律依据的情景问答92k:2.1.3法律知识问答2.2模型3C
悟乙己
·
2025-02-14 13:01
付费-智能写作专栏
LLM大模型
开源
大模型
LLM
GPT
微调
大语言模型(
LLM
)快速理解
自2022年,ChatGPT发布之后,大语言模型(LargeLanguageModel),简称
LLM
掀起了一波狂潮。作为学习理解
LLM
的开始,先来整体理解一下大语言模型。
大模型猫叔
·
2025-02-14 13:59
语言模型
人工智能
自然语言处理
机器学习
LLM
大语言模型书籍教程推荐:《大模型时代》+《开源大模型食用指南》!附文档
哈喽大家好!很久都没有更新大模型这块的书了,今天给大家说一下这本:《大模型时代》,本书对大模型时代的技术、应用和产业变化进行了深入的分析和阐述。《本书》深入探讨了大型模型时代的技术演进、应用场景和产业变革。生动地阐释了ChatGPT背后的工作原理,深入解析了这一推动技术和产业变革的关键力量书中对国内外大型模型产业的布局和发展趋势进行了剖析,并对潜在的风险和泡沫进行了预警。作者简介龙志勇:曾任阿里巴
Langchain
·
2025-02-14 09:32
人工智能
langchain
大模型
自然语言处理
大语言模型
LLM
AI大模型
探索DeepSeek:开源大模型领域的中国力量
在人工智能技术迅猛发展的今天,大语言模型(
LLM
)已成为全球科技竞争的焦点。来自中国的深度求索(DeepSeek)团队凭借其开源模型系列,正在为这一领域注入新的活力。
机器学习司猫白
·
2025-02-14 09:29
开源
云原生AI Agent应用安全防护方案最佳实践(上)
当下,AIAgent代理是一种全新的构建动态和复杂业务场景工作流的方式,利用大语言模型(
LLM
)作为推理引擎。
佛州小李哥
·
2025-02-14 08:56
AWS技术
AI安全
人工智能
亚马逊云科技
aws
ai
语言模型
安全
云计算
Ollama与Vllm使用对比与优劣
Ollama和vLLM是两个用于优化大型语言模型(
LLM
)推理的框架,它们在性能、资源利用率、部署复杂性等方面各有优劣。
魔王阿卡纳兹
·
2025-02-14 08:55
大模型知识札记
数据库
服务器
ollama
vllm
使用LangChain与OpenAI API进行向量嵌入和搜索的实战教程
技术背景介绍LangChain是一个用于构建大型语言模型(
LLM
)应用的强大工具集,能够帮助开发者快速构建智能应用。结合Ope
bBADAS
·
2025-02-14 06:06
langchain
python
开发语言
ViT:2 理解CLIP
若在某个环节出现卡点,可以回到大模型必备腔调或者
LLM
背后的基础模型新阅读。而最新科技(Mamba,xLSTM,KAN)则提供了大模型领域最新技术跟踪。若对于具身智能感兴趣的请移步
庞德公
·
2025-02-14 05:33
具身智能
ViT
具身智能
深度学习
人工智能
transformer
ALBERT:轻量级的BERT,用于语言表征的自监督学习
ALBERT:轻量级的BERT,用于语言表征的自监督学习阅读时长:19分钟发布时间:2025-02-13近日热文:全网最全的神经网络数学原理(代码和公式)直观解释欢迎关注知乎和公众号的专栏内容
LLM
架构专栏知乎
·
2025-02-14 05:05
人工智能
DeepSeek与Web3:科技融合的新纪元
作为新一代
LLM
(大型语言模型),DeepSeek不仅在推理质量和成本上展现出优势,还重新定义了去中心化智能代理(AIAgent)的发展方向。
TechubNews
·
2025-02-14 04:25
web3
科技
一杯咖啡的时间学习大模型(
LLM
):LLaMA解读之旋转编码RoPE(含代码实现)
文章目录一、LLaMA的核心改进全景二、旋转位置编码(RoPE)2.1改进动机2.2数学原理2.3源码实现一、LLaMA的核心改进全景Meta开源的LLaMA模型凭借其卓越的性能表现成为大模型发展的重要里程碑。相较于标准Transformer架构,LLaMA主要在以下几个方面进行了关键改进:位置编码升级:采用旋转位置编码(RotaryPositionEmbedding,RoPE)归一化革新:对每个
Bug_makerACE
·
2025-02-14 02:52
llama
python
人工智能
nlp
pytorch
深度学习
transformer
Aider: 人工智能辅助编程的革命性工具
Aider是一个强大的AI辅助编程工具,它能让开发者在终端中与大型语言模型(
LLM
)进行结对编程,极大地提升编码效率和质量。让我们深入了解这个令人兴奋的项目,看看它如何改变着软件开发的未来。
2401_87189860
·
2025-02-14 02:20
人工智能
RAG中的双编码器与跨编码器模型
RAG中的双编码器与跨编码器模型阅读时长:19分钟发布时间:2025-02-13近日热文:全网最全的神经网络数学原理(代码和公式)直观解释欢迎关注知乎和公众号的专栏内容
LLM
架构专栏知乎
LLM
专栏知乎【
·
2025-02-14 01:01
人工智能
深度学习-108-大语言模型
LLM
之基于langchain的结构化输出功能提取结构化信息
文章目录1langchain的结构化输出1.1推荐的使用流程1.2模式定义1.3返回结构化输出1.3.1工具调用(方式一)1.3.2JSON模式(方式二)1.3.3结构化输出法(方式三)2提取结构化信息2.1定义数据模型2.2配置提示模板2.3设置执行链3参考附录1langchain的结构化输出对于许多应用程序,例如聊天机器人,模型需要直接用自然语言响应用户。然而,在某些情况下,我们需要模型以结构
皮皮冰燃
·
2025-02-14 01:44
深度学习
深度学习
语言模型
langchain
真正通俗易懂的Langchain入门学习(一)
定义:基于语言模型(
LLM
)构建应用程序的框架。核心功能:连接
LLM
与外部数据/工具、管理对话流程、自动化复杂任务。典型应用场景:聊天机器人、文档问答、数据分析助手、自动化工作流。
caridle
·
2025-02-14 00:42
智能体
langchain
学习
数据库
AI Agent智能应用从0到1定制开发Langchain+
LLM
全流程解决方案与落地实战
全栈大模型项目实战,人工智能视频课程-多模态大模型,微调技术训练营,大模型多场景实战,AI图像处理,AI量化投资,OPenCV视觉处理,机器学习,Pytorch深度学习,推荐系统,自动驾驶,训练私有大模型,
LLM
AI知识分享官
·
2025-02-14 00:41
人工智能
langchain
算法
数据挖掘
计算机视觉
机器学习
产品经理
解码DeepSeek家族系列:大语言模型赛道上的黑马传奇
DeepSeek自成立之初,便专注于开发先进的大语言模型(
LLM
)及相关技术,致力于通过数据蒸馏技术提取更精炼、有用的数据,以提升模型性能。在发展历程中,DeepSeek
大F的智能小课
·
2025-02-13 22:52
语言模型
人工智能
自然语言处理
DeepSeek R1:开启AI推理新时代,强在哪里?
DeepSeekR1:开启AI推理新时代阅读时长:19分钟发布时间:2025-02-13近日热文:全网最全的神经网络数学原理(代码和公式)直观解释欢迎关注知乎和公众号的专栏内容
LLM
架构专栏知乎
LLM
专栏知乎
·
2025-02-13 20:19
人工智能
从零开始大模型开发与微调:Miniconda的下载与安装
从零开始大模型开发与微调:Miniconda的下载与安装1.背景介绍随着人工智能和机器学习技术的快速发展,大型语言模型(LargeLanguageModel,
LLM
)已经成为当前研究和应用的热点。
AGI大模型与大数据研究院
·
2025-02-13 18:30
DeepSeek
R1
&
大数据AI人工智能
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
如何训练LLMs进行“思考”(如o1和DeepSeek-R1)
如何训练LLMs进行“思考”(如o1和DeepSeek-R1)阅读时长:19分钟发布时间:2025-02-13近日热文:全网最全的神经网络数学原理(代码和公式)直观解释欢迎关注知乎和公众号的专栏内容
LLM
·
2025-02-13 16:07
人工智能
DeepSeek与Web3:科技融合的新纪元
作为新一代
LLM
(大型语言模型),DeepSeek不仅在推理质量和成本上展现出优势,还重新定义了去中心化智能代理(AIAgent)的发展方向。
·
2025-02-13 15:02
人工智能深度学习
大语言模型
LLM
代码:PyTorch库与ChatGLM模型
文章目录通过阅读大语言模型的代码,熟悉并理解PyTorch大语言模型
LLM
代码:PyTorch库与ChatGLM模型大语言模型中的PyTorchChatGLM3-6B模型代码ChatGLMModel类总览
North_D
·
2025-02-13 12:48
大语言模型LLM
语言模型
pytorch
人工智能
python
深度学习
自然语言处理
大语言模型
LLM
大模型产品经理学习指南【2025全新版】:极致详细,一篇搞定!
前言·随着人工智能技术的蓬勃发展,尤其是大模型(LargeModel)的强势兴起,越来越多的企业对这一领域愈发重视并加大投入。作为大模型产品经理,需具备一系列跨学科的知识与技能,方能有效地推动产品的开发、优化以及市场化进程。以下是一份详尽的大模型产品经理学习路线,旨在助力你构建所需的知识体系,实现从零基础到精通的蜕变。一、基础知识阶段(一)计算机科学基础数据结构与算法:深入理解基本的数据结构(如数
大模型入门学习
·
2025-02-13 11:08
产品经理
语言模型
人工智能
DeepSeek
大模型
学习
LLM
使用Neo4j-Cypher-FT与自然语言交互
老铁们,今天我们来聊聊如何通过自然语言与Neo4j图数据库进行互动,利用的是OpenAI的
LLM
技术。这波操作可以说是相当丝滑,能让你通过自然的提问生成Cypher查询语句,执行后返回语言化的结果。
qq_37836323
·
2025-02-13 09:50
neo4j
python
大语言模型的分类及本地部署所需的硬件配置要求
1、大语言模型概念及作用大语言模型:(LargeLanguageModel,
LLM
)是一种基于深度学习的人工智能模型,它能够理解和生成自然语言[1]。
Kelaru
·
2025-02-13 07:01
LLM
基础知识
语言模型
分类
人工智能
硅基流动多模型工作流应用平台,免费2000万Token来了
硅基流动是一家专注于大规模AI计算的技术公司,提供高性能
LLM
推理和训练解决方案,助力企业高效部署AI应用。目前注册可获的2000万Token,可以使用将近60种文字对话、语音、图像生成等主流大模型。
yuntianming3906
·
2025-02-13 05:53
经验分享
初学者怎么入门大语言模型(
LLM
)
大语言模型(
LLM
)作为人工智能(AI)领域的核心技术之一,近年来受到了广泛的关注。对于初学者来说,入门
LLM
并非难事,但需要从理论学习、数学基础到实践操作逐步深入。
·
2025-02-13 02:43
大模型
LLM
+Embedding构建问答系统的局限性及优化方案
LangChain+
LLM
方案的局限性:
LLM
意图识别准确性较低,交互链路长导致时间开销大;Embedding不适合多词条聚合匹配等。
lichunericli
·
2025-02-13 01:52
人工智能
自然语言处理
语言模型
RAG-Driven Enhancement of Multimodal Electronic Health Records Analysis via Large Language Models
本文是
LLM
系列文章,针对《REALM:RAG-DrivenEnhancementofMultimodalElectronicHealthRecordsAnalysisviaLargeLanguageModels
UnknownBody
·
2025-02-12 21:50
RAG
for
LLM
Multimodal
语言模型
机器学习
人工智能
使用 Llama.cpp 和 llama-cpp-python 快速部署本地
LLM
模型
它支持多种
LLM
模型,包括可以从Hu
hgSdaegva
·
2025-02-12 20:16
llama
python
开发语言
DeepSeek-Ollama实现本地化无烦恼
它支持各种
LLM
运行器,如Ollama和OpenAI兼容的API,并内置了RAG推理引擎,使其成为强大的AI部署解决方案。star72
c_zyer
·
2025-02-12 20:11
AI
DeepSeek
运维部署
deepseek
ollama
open-webui
ai
探索 Dify:开源
LLM
应用开发平台
探索Dify:开源
LLM
应用开发平台介绍在快速发展的AI和机器学习领域,开发人员不断寻求高效的工具,以无缝地从原型过渡到生产。Dify正是在这样的背景下应运而生的。
weixin_40941102
·
2025-02-12 15:38
开源
从语言模型获取结构化数据输出的高级技巧
标题:从语言模型获取结构化数据输出的高级技巧内容:从语言模型获取结构化数据输出的高级技巧引言在使用大型语言模型(
LLM
)时,我们经常需要模型返回特定格式的结构化数据,而不仅仅是自由格式的文本。
stjklkjhgffxw
·
2025-02-12 14:29
语言模型
服务器
人工智能
TAG,一种用于复杂问题解答的统一模型
TAG,一种用于复杂问题解答的统一模型阅读时长:19分钟发布时间:2025-02-12近日热文:全网最全的神经网络数学原理(代码和公式)直观解释欢迎关注知乎和公众号的专栏内容
LLM
架构专栏知乎
LLM
专栏知乎
·
2025-02-12 13:13
人工智能
Langchain Agents
LangchainAgents文档位置:https://js.langchain.com/docs/modules/agents/Agents某些应用程序需要根据用户输入对
LLM
和其他工具进行灵活的调用链
sin(38.1727063)
·
2025-02-12 13:25
langchain
java
数据库
【Python】科研代码学习:十七 模型参数合并,safetensors / bin
知识点:save_pretrained还会新增的文件知识点:在保存模型参数时,大小发生了成倍的变化前言众所周知,
LLM
的模型参数一般保存在.safetensors或者.bin结尾的大文件但是通过一个RLHF
溢流眼泪
·
2025-02-12 10:08
【科研代码】
python
学习
开发语言
让
LLM
来评判 | 选择
LLM
评估模型
基础概念这是让
LLM
来评判系列文章的第一篇,敬请关注系列文章:基础概念选择
LLM
评估模型设计你自己的评估prompt评估你的评估结果奖励模型相关内容技巧与提示什么是评估模型?
·
2025-02-12 09:39
人工智能llm
开源模型应用落地-qwen2-7b-instruct-LoRA微调&合并-ms-swift-单机多卡-RTX 4090双卡(十五)
二、术语介绍2.1.LoRA微调LoRA(Low-RankAdaptation)用于微调大型语言模型(
LLM
)。
开源技术探险家
·
2025-02-12 04:50
开源模型-实际应用落地
#
开源模型-微调实战密码
自然语言处理
深度学习
语言模型
让
LLM
来评判 | 基础概念
基础概念这是让
LLM
来评判系列文章的第一篇,敬请关注系列文章:基础概念选择
LLM
评估模型设计你自己的评估prompt评估你的评估结果奖励模型相关内容技巧与提示什么是评估模型?
·
2025-02-12 01:31
llm人工智能
自动评估基准 | 一些评估测试集
需要注意的是:大部分数据集有些“过时”,因为它们是在
LLM
出现之前构建的,当时是为了评估语言文本的某个特定属性(如翻译、摘要),但是可能已经不适合现在的
LLM
评估方法了(现在的
·
2025-02-12 01:00
人工智能
通用辅助生成: 使用任意辅助模型加速解码
太长不看版:许多
LLM
(如gemma-2-9b、Mixtral-8x22B-Instruct-v0.1等)苦于缺乏对应小模型,而无法适用辅助生成方案。
·
2025-02-12 01:25
llm
让
LLM
来评判 | 评估你的评估结果
评估你的评估结果这是让
LLM
来评判系列文章的第三篇,敬请关注系列文章:基础概念选择
LLM
评估模型设计你自己的评估prompt评估你的评估结果奖励模型相关内容技巧与提示在生产中或大规模使用
LLM
评估模型之前
·
2025-02-12 00:20
人工智能llm
大语言模型多代理协作(MACNET)
研究发现了小世界协作现象和协作缩放定律,为
LLM
系统资源预测和优化提供了思路。研究背景与动机:大语言模型(LLMs)因神经缩放定律展现出强大能力,
ZhangJiQun&MXP
·
2025-02-12 00:51
2021
AI
python
教学
2021
论文
语言模型
人工智能
自然语言处理
新手必备!深入解析:如何使用 Ollama 下载与使用本地大语言模型
在当今数字化时代,大语言模型(
LLM
)的应用越来越广泛,从自然语言处理到文本生成,从代码辅助到智能问答,它们都展现出了强大的能力。然而,使用云端大语言模型往往面临着成本高昂、隐私泄露等问题。
大懒猫软件
·
2025-02-11 16:22
语言模型
人工智能
自然语言处理
python
llama
LLM
推理优化——PagedAttention初识篇(vLLM初识(二))
LLM
推理优化——PagedAttention初识篇(vLLM初识(二))前言在
LLM
推理优化——KVCache篇(百倍提速)中,我们已经介绍了KVCache技术的原理,从中我们可以知道,KVCache
荼荼灰
·
2025-02-11 15:44
神经网络
transformer
深度学习
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他