E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
LLM技术汇总
大型语言模型构建指南:从头开始构建大语言模型《Build a Large Language Model (From Scratch)》免费PDF
在这本富有洞察力的书中,畅销书作家塞巴斯蒂安·拉施卡(SebastianRaschka)将指导你逐步创建自己的
LLM
,用清晰的文字、图表和示例解释每个阶段。
AGI大模型学习
·
2025-01-30 05:34
语言模型
pdf
人工智能
大模型
大模型学习
大模型教程
大模型书籍
书籍推荐:《从零构建大型语言模型》附免费PDF下载
在这本富有洞察力的书中,畅销书作家塞巴斯蒂安·拉施卡(SebastianRaschka)将指导你逐步创建自己的
LLM
,用清晰的文字、图表和示例解释每个阶段。
大模型入门学习
·
2025-01-30 05:33
语言模型
pdf
人工智能
产品经理
大模型学习
大模型教程
大模型入门
LLM
based Single Agent System
LLM
-BasedSingleAgentSystem:ANewEraofIntelligentAutomation关键词:大语言模型,单智能体系统,强化学习,自然语言处理,智能自动化1.背景介绍近年来,
AGI大模型与大数据研究院
·
2025-01-30 05:03
大数据AI人工智能
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
为什么多模态大模型中使用Q-Former的工作变少了?附Q-Former结构简介
多模态大模型中需要一个输入投影模块,将视觉特征投射到
LLM
能理解的语言特征维度,这里就可以选择各种不同的模块。
同屿Firmirin
·
2025-01-30 01:01
多模态大模型
深度学习
人工智能
面试
初学者指南:借助 LangChain 构建
LLM
驱动的应用程序!
初学者指南:借助LangChain构建
LLM
驱动的应用程序!原文链接:ABeginner’sGuidetoBuildingLLM-PoweredApplicationswithLangChain!
·
2025-01-29 23:24
【
llm
对话系统】大模型源码分析之 LLaMA 位置编码 RoPE
在自然语言处理(NLP)领域,Transformer模型已经成为主流。然而,Transformer本身并不具备处理序列顺序的能力。为了让模型理解文本中词语的相对位置,我们需要引入位置编码(PositionalEncoding)。本文将深入探讨LLaMA模型中使用的RotaryEmbedding(旋转式嵌入)位置编码方法,并对比传统的Transformer位置编码方案,分析其设计与实现的优势。1.传
kakaZhui
·
2025-01-29 23:17
llama
深度学习
人工智能
AIGC
chatgpt
Mooncake:面向大语言模型服务的以 KVCache 为中心的架构
摘要Mooncake是Kimi的服务平台,Kimi是由MoonshotAI提供的领先的
LLM
服务。它采用以KVCache为中心的分解架构,将预填充和解码集群分离。
步子哥
·
2025-01-29 22:42
AGI通用人工智能
语言模型
架构
人工智能
进阶之路:从传统编程到AI大模型与Prompt驱动的爬虫技术
随着人工智能技术的发展,
LLM
大模型的出现为爬虫技术带来了新的思路。与传统的编程模式不同,使用AI大模型+prompt可以显著提高程序员的编程效率。
大模型老炮
·
2025-01-29 21:04
人工智能
prompt
爬虫
语言模型
大模型学习
AI大模型
9.1 LangChain深度解析:大模型应用开发的“万能胶水”与核心架构设计
重新定义大模型应用开发范式LangChain是一个专为大语言模型(
LLM
)应用开发设计的开源框架,由HarrisonChase于2022年创建。它被开发者社区称为“AI应用开发的乐高积木”——通过标准
少林码僧
·
2025-01-29 20:52
AI大模型应用实战专栏
langchain
gpt
人工智能
chatgpt
为什么提到各种本地化部署模型软件时总要提到 llama.cpp?
尽管名字里有“cpp”,它实际上指的是基于C++开发的一整套工具,用于高效地在本地运行大语言模型(
LLM
)。
风雅GW
·
2025-01-29 18:00
人工智能
llama
人工智能
机器学习
LLM
ai
Llama.cpp与Python的完美结合:快速入门指南
Llama.cpp与Python的完美结合:快速入门指南引言在现代AI的浪潮中,Llama.cpp提供了一种便捷的方法,将大型语言模型(
LLM
)集成到您的项目中。
nseejrukjhad
·
2025-01-29 17:29
llama
python
开发语言
[如何在LangChain中实现安全集成:最佳实践与应对策略]
这些集成使开发人员能够创建结合
LLM
(大语言模型)强大功能和外部资源交互的多样化应用。然而,安全问题不容忽视。本文将深入探讨在LangChain应用中实现安全集成的最佳实践,并
dsndnwfk
·
2025-01-29 17:56
langchain
安全
数据库
python
万字精研:大型语言模型微调Fine-Tuning技术——14种主流方法的原理、适用场景及实践指南
万字精研:大型语言模型微调Fine-Tuning技术——14种主流方法的原理、适用场景及实践指南
LLM
训练时间和的成本太过庞大,况且个人卷训练经验极为困难,不妨从微调开始搞起。
汀、人工智能
·
2025-01-29 15:40
LLM工业级落地实践
LLM技术汇总
语言模型
人工智能
自然语言处理
P-tuning
LoRA
prompt
tuning
adapter
AI Agent的性能优化:从架构到代码级别的调优
从一个性能瓶颈说起还记得去年我们的AI助手刚上线时的情况:用户:这个响应也太慢了吧,要等好几秒运营:API费用每天都在涨我:让我看看到底是哪里慢...通过分析,我发现主要有三个问题:
LLM
调用延迟高向量检索效率低内存占用过大架构层面
·
2025-01-29 15:48
人工智能机器学习
LLM
(大语言模型)——Springboot集成文心一言、讯飞星火、通义千问、智谱清言
目录引言代码完整地址入参出参ControllerServiceService实现类模型Service入参转换类文心一言实现类讯飞星火实现类通义千问实现类智谱清言实现类引言本文将介绍如何使用Java语言,结合SpringBoot框架,集成国内热门大模型API,包括文心一言、讯飞星火、通义千问、智谱清言。在开始前,请确保您已经按照各模型官网的指引,完成了相应的资源申请和配置。这些资源是调用大模型API
1telescope
·
2025-01-29 13:54
大模型
语言模型
文心一言
自然语言处理
java
spring
boot
DeepSeek-R1-Distill-Qwen-1.5B:最佳小型
LLM
?
DeepSeek掀起了生成式AI领域的风暴。首先推出DeepSeek-v3,现在推出DeepSeek-R1,这两款模型都打破了所有基准,并且完全开源。但今天我们不是在讨论这两款超级模型,而是讨论DeepSeek-R1的一个蒸馏版本——DeepSeek-R1-Distill-Qwen-1.5B,它可能是今天被低估的版本,虽然只有15亿个参数,但它悄无声息地在一些主要基准上超越了GPT-4和Claud
李孟聊人工智能
·
2025-01-29 13:53
AI
Agents实战
chatgpt
人工智能
gpt
AI
agi
DeepSeek
Qwen
为大模型提供webui界面的利器:Open WebUI 完全本地离线部署deepseek r1
它支持各种
LLM
运行程序,如Ollama和OpenAI兼容的API,内置RAG推理引擎,使其成为一个强大的AI部署解决方案。安装使用pip进行安装:pipinstallopen-w
skywalk8163
·
2025-01-29 11:53
人工智能
人工智能
deepseek
webui
RAG:AI大模型联合向量数据库和 Llama-index,助力检索增强生成技术
检索增强生成(RAG)技术,结合了传统的信息检索和最新的大语言模型(
LLM
),不仅能够回答复杂的查询,还能在此基础上生成信息丰富的内容。
AI学习不迷路
·
2025-01-29 10:21
人工智能
数据库
llama
语言模型
RAG
大模型
AI大模型
**
LLM
Gateway:您的智能对话门户**
LLMGateway:您的智能对话门户
llm
-gatewayGatewayforsecure&reliablecommunicationswithOpenAIandotherLLMproviders项目地址
芮奕滢Kirby
·
2025-01-29 09:10
LangGraph系列-1:用LangGraph构建简单聊天机器人
在快速发展的人工智能和大型语言模型(
llm
)世界中,开发人员不断寻求创建更灵活、更强大、更直观的人工智能代理的方法。
梦想画家
·
2025-01-29 06:12
机器学习
LangGraph
LangChain
2024
LLM
年度事件回顾:价格全面下跌、本地运行大模型、多模态能力爆发……
2025年伊始,Django的作者之一SimonWillison,带我们回顾了2024年AI的重磅进展,堪称大模型的“里程碑”盘点。快来看看有哪些突破,刷新了我们对AI的认知!原文很长,下面给大家列几个关键点:1、GPT-4壁垒被突破从前,GPT-4被视为无人能及的高度智能“天花板”,现在,ChatbotArea排行榜上已经有近70个模型,超过了2023年3月版本的GPT-4。谷歌的Gemini1
大模型.
·
2025-01-29 02:09
人工智能
语言模型
自然语言处理
知识图谱
架构
大模型
从零到手搓一个Agent:AI Agents新手入门精通
今日主题:当什么是Agent,与
LLM
的区别又是啥这一天,你的女朋友问你(假设我们有女朋友),宝宝,什么是Agent啊,Agent和
LLM
有什么区别呀,最近大家都在说的Agent究竟是什么,包括很多文章都在写的
大模型.
·
2025-01-29 02:09
人工智能
chatgpt
大数据
深度学习
智能体
算法
大模型
LLM
架构与优化:从理论到实践的关键技术
标题:“
LLM
架构与优化:从理论到实践的关键技术”文章信息摘要:文章探讨了大型语言模型(
LLM
)开发与应用中的关键技术,包括Transformer架构、注意力机制、采样技术、Tokenization等基础理论
XianxinMao
·
2025-01-28 20:14
人工智能
大语言模型
LLM
在地理信息GIS中应用场景
AI&地理AI大语言模型在地理中的应用主要体现在以下几个方面:一、地理信息检索与查询AI大语言模型能够理解复杂的自然语言查询,包括地名、地理位置、地理特征等,从而提供更加精准的地理信息检索服务。例如,用户可以通过自然语言输入查询某个地点的详细信息,模型能够返回包括地理位置、周边设施、交通状况等在内的全面信息。AI与地理信息检索与查询的结合为地理信息的获取和利用带来了革命性的变化。以下是对AI在地理
GISer_Jinger
·
2025-01-28 19:07
人工智能
GIS模型与应用
语言模型
人工智能
自然语言处理
arcgis
第76期 | GPTSecurity周报
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区,集成了生成预训练Transformer(GPT)、人工智能生成内容(AIGC)以及大语言模型(
LLM
)等安全领域应用的知识。
云起无垠
·
2025-01-28 15:05
GPTSecurity
人工智能
网络安全
第84期 | GPTSecurity周报
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区,集成了生成预训练Transformer(GPT)、人工智能生成内容(AIGC)以及大语言模型(
LLM
)等安全领域应用的知识。
云起无垠
·
2025-01-28 14:30
GPTSecurity
人工智能
gpt
AIGC
Azure AI-102 认证全攻略: (三十四)基本提示工程与 API 指南
基本提示工程与API指南(修订版)本指南将详细介绍如何在AzureAIStudio中配置和使用AzureOpenAI服务,从创建和管理AIHub,到部署GPT-3.5Turbo及其他大语言模型(
LLM
)
海棠AI实验室
·
2025-01-28 12:12
AI-102
认证考试全攻略
深度学习
azure
microsoft
AI-102
【AI论文】FilmAgent: 一个用于虚拟3D空间中端到端电影制作自动化的多智能体框架
受近期基于语言智能体社会的自动化决策领域进展的启发,本文提出了FilmAgent,这是一个新颖的、基于大型语言模型(
LLM
)的多智能体协作框架,旨在实现我们构建的3D虚拟空间中的端到端电影制作自动化。
东临碣石82
·
2025-01-28 08:19
自动化
运维
DeepSeek R1模型基于ollama部署
ollama中使用deepseekr13、问答示例4、python调用接口5、ollama常用命令1、安装部署ollama(windows)Ollama是一个专为本地机器设计的开源框架,旨在简化大型语言模型(
LLM
&Dirac
·
2025-01-28 04:22
机器学习笔记
python
语言模型
nlp
探索未来对话的边界:Mixture-of-Agents(MoA)——大型语言模型的集体智慧引擎
https://gitcode.com/gh_mirrors/mo/MoA在当前人工智能的浪潮中,我们迎来了一个令人兴奋的技术突破——Mixture-of-Agents(MoA),它标志着大型语言模型(
LLM
潘俭渝Erik
·
2025-01-28 04:49
SpringAI基于API对大语言模型调用
引言随着人工智能技术的迅猛发展,大型语言模型(
LLM
)在各个领域的应用越来越广泛。SpringAI作为一个旨在简化AI集成的框架,为开发者提供了高效、便捷的工具来连接和调用这些大模型。
_沉浮_
·
2025-01-28 02:00
AI
语言模型
人工智能
springAI
奖励模型:解析大语言模型的关键工具
标题:奖励模型:解析大语言模型的关键工具文章信息摘要:奖励模型是理解和审核大语言模型(
LLM
)的重要工具,通过简单的评估方式提供了模型内部表征和性能的深入洞察。
XianxinMao
·
2025-01-28 01:27
人工智能
【
llm
对话系统】大模型RAG之基本逻辑
大模型RAG之基本逻辑:让
LLM
更精准地回答你的问题(降低幻觉)你是否遇到过这样的情况:当你向
LLM
提问时,它可能会给出一些“一本正经胡说八道”的答案,或者无法回答一些特定领域的专业问题?
kakaZhui
·
2025-01-28 00:18
人工智能
数据库
AIGC
chatgpt
llama
【
llm
对话系统】基于
llm
的实时多轮对话如何做kv cache
为了提高
LLM
的响应速度和效率,我们通常会使用KVCache来存储context的向量表示,以便快速检索相关信息。
kakaZhui
·
2025-01-28 00:48
人工智能
前端
算法
chatgpt
AIGC
【
llm
对话系统】RL强化学习的技术演进与RLHF
一、强化学习基础知识强化学习(ReinforcementLearning,RL)是一种机器学习方法,它通过智能体(Agent)与环境(Environment)的交互来学习如何行动以最大化累积奖励(Reward)。1.核心概念:智能体(Agent):做出决策并采取行动的学习者。环境(Environment):智能体所处的外部世界,对智能体的行动做出反应。状态(State,S):对环境当前情况的描述。
kakaZhui
·
2025-01-28 00:47
人工智能
chatgpt
llama
【
llm
对话系统】Gradio快问快答
从问题出发1.gr.Textbox如何显示一个默认文本``pythonimportgradioasgrdefgreet(name):return"Hello"+name+“!”demo=gr.Interface(fn=greet,inputs=gr.Textbox(value=“请输入你的名字”,label=“姓名”),outputs=“text”)demo.launch()###2.如何隐藏一个
kakaZhui
·
2025-01-27 23:43
chatgpt
人工智能
AIGC
自然语言处理
深度学习-70-大语言模型
LLM
之基于大模型
LLM
与检索增强技术RAG的智能知识库
文章目录1RAG出现的背景2搭建过程2.1数据收集2.2数据处理2.2.1数据清洗与预处理2.2.2文本分块2.2.3微调数据格式统一2.3建立向量索引2.4大模型选择与微调3开源知识库项目3.1FastGPT3.2AnythingLLM3.3LangChain-Chatchat4商业化解决方案4.1百度智能云+千帆大模型知识库4.2阿里云PAI+向量检索5参考附录1RAG出现的背景自从2022年
皮皮冰燃
·
2025-01-27 21:31
深度学习
人工智能
深度学习
语言模型
Crawl4AI:用几行代码打造强大的网页爬虫
尤其是在大型语言模型(
LLM
)的研究和应用中,如何高效地抓取和整理网络数据成为了一个关键的挑战。
海豹工匠
·
2025-01-27 21:30
爬虫
如何让ChatGPT接入互联网?
一、前言使用谷歌搜索引擎实现的最终效果:搜索引擎一次返回10条搜索结果数据每条数据标题都带有链接地址,点击可跳转到对应网页;标题之后的内容为
LLM
模型根据原始网页内容整理之后输出的内容搜索引擎搜索出的内容让
Tensor维度
·
2025-01-27 17:02
AIGC
chatgpt
langchain
AIGC
语言模型
【vLLM 学习】使用 OpenVINO 安装
更多vLLM中文文档及教程可访问→https://vllm.hyper.ai/由OpenVINO驱动的vLLM支持来自vLLM支持的模型列表中的所有
LLM
模型,并且可以在所有x86-64CPU上(至少需要
HyperAI超神经
·
2025-01-27 11:21
vLLM
openvino
人工智能
python
vLLM
LLM
GPU
编程
**深度探索Semantic Kernel:为您的代码注入人工智能的灵魂**
semantic-kernelIntegratecutting-edgeLLMtechnologyquicklyandeasilyintoyourapps项目地址:https://gitcode.com/gh_mirrors/se/semantic-kernel在当前这个飞速发展的时代,大语言模型(
LLM
孙诗嘉Song-Thrush
·
2025-01-27 04:09
大语言模型
LLM
基础扫盲速通版
文章目录1.什么是
LLM
?2.
LLM
如何工作?3.
LLM
开发的关键里程碑4.训练可用
LLM
模型的完整流程5.
LLM
具备的能力6.领先的
LLM
模型包含哪些?7.建议从头开始训练
LLM
吗?
SmallerFL
·
2025-01-27 00:40
NLP&机器学习
语言模型
人工智能
自然语言处理
llm
chatgpt
Meta Llama 3 使用 Hugging Face 和 PyTorch 优化 CPU 推理
optimized-cpu-inference-with-hugging-face-and-pytorch了解在CPU上部署Meta*Llama3时如何减少模型延迟2024年4月19日万众期待的Meta第三代Llama发布了,我想确保你知道如何以最佳方式部署这个最先进的(SoTA)
LLM
lichunericli
·
2025-01-27 00:37
人工智能
pytorch
llama
Gary Marcus对2025年AI的25项预测:AGI的曙光仍未到来?
本文将深入探讨Marcus的预测,并结合实际案例进行分析,特别关注大型语言模型(
LLM
)的不足以及其对就业市场的影响。我们还会探讨一些优秀的AI写代码工具,例如Scri
lilu8888888
·
2025-01-26 22:24
人工智能
agi
百度
前端
Evaluation of OpenAI o1: Opportunities and Challenges of AGI
本文是
LLM
系列文章,针对《EvaluationofOpenAIo1:OpportunitiesandChallengesofAGI》的翻译。
UnknownBody
·
2025-01-26 16:03
LLM
Daily
LLM
Evaluation
agi
人工智能
大数据
语言模型
我从 2024 年的
LLM
应用开发实践中学到了什么?Part 1
本文作者凭借近十年的Web应用和云原生开发经验,以及2024年深度参与
LLM
应用开发的第一手经历,为我们揭示了一个重要发现:成
·
2025-01-26 12:58
Langchain本地知识库部署
2.技术选型2.1LangChainLangChain是一个开源的
LLM
(大语言模型)应用开发框架,支持多种模型和数据源,适用
MaxCode-1
·
2025-01-26 11:01
langchain
AI学习指南Ollama篇-Ollama简介
一、定义大语言模型(
LLM
)是一种基于深度学习的自然语言处理模型,能够生成文本、回答问题、翻译语言、撰写代码等。
俞兆鹏
·
2025-01-26 10:20
AI学习指南
人工智能
ollama
深入解析LangChain框架:使用Python开发
LLM
应用的全生命周期指南
深入解析LangChain框架:使用Python开发
LLM
应用的全生命周期指南前言在当前的人工智能浪潮中,大型语言模型(
LLM
)已成为众多应用的核心。
m0_57781768
·
2025-01-26 06:19
langchain
python
网络
第72期 | GPTSecurity周报
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区,集成了生成预训练Transformer(GPT)、人工智能生成内容(AIGC)以及大语言模型(
LLM
)等安全领域应用的知识。
云起无垠
·
2025-01-25 14:40
GPTSecurity
人工智能
安全
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他