E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
LLM
万字精研:大型语言模型微调Fine-Tuning技术——14种主流方法的原理、适用场景及实践指南
万字精研:大型语言模型微调Fine-Tuning技术——14种主流方法的原理、适用场景及实践指南
LLM
训练时间和的成本太过庞大,况且个人卷训练经验极为困难,不妨从微调开始搞起。
汀、人工智能
·
2025-01-29 15:40
LLM工业级落地实践
LLM技术汇总
语言模型
人工智能
自然语言处理
P-tuning
LoRA
prompt
tuning
adapter
AI Agent的性能优化:从架构到代码级别的调优
从一个性能瓶颈说起还记得去年我们的AI助手刚上线时的情况:用户:这个响应也太慢了吧,要等好几秒运营:API费用每天都在涨我:让我看看到底是哪里慢...通过分析,我发现主要有三个问题:
LLM
调用延迟高向量检索效率低内存占用过大架构层面
·
2025-01-29 15:48
人工智能机器学习
LLM
(大语言模型)——Springboot集成文心一言、讯飞星火、通义千问、智谱清言
目录引言代码完整地址入参出参ControllerServiceService实现类模型Service入参转换类文心一言实现类讯飞星火实现类通义千问实现类智谱清言实现类引言本文将介绍如何使用Java语言,结合SpringBoot框架,集成国内热门大模型API,包括文心一言、讯飞星火、通义千问、智谱清言。在开始前,请确保您已经按照各模型官网的指引,完成了相应的资源申请和配置。这些资源是调用大模型API
1telescope
·
2025-01-29 13:54
大模型
语言模型
文心一言
自然语言处理
java
spring
boot
DeepSeek-R1-Distill-Qwen-1.5B:最佳小型
LLM
?
DeepSeek掀起了生成式AI领域的风暴。首先推出DeepSeek-v3,现在推出DeepSeek-R1,这两款模型都打破了所有基准,并且完全开源。但今天我们不是在讨论这两款超级模型,而是讨论DeepSeek-R1的一个蒸馏版本——DeepSeek-R1-Distill-Qwen-1.5B,它可能是今天被低估的版本,虽然只有15亿个参数,但它悄无声息地在一些主要基准上超越了GPT-4和Claud
李孟聊人工智能
·
2025-01-29 13:53
AI
Agents实战
chatgpt
人工智能
gpt
AI
agi
DeepSeek
Qwen
为大模型提供webui界面的利器:Open WebUI 完全本地离线部署deepseek r1
它支持各种
LLM
运行程序,如Ollama和OpenAI兼容的API,内置RAG推理引擎,使其成为一个强大的AI部署解决方案。安装使用pip进行安装:pipinstallopen-w
skywalk8163
·
2025-01-29 11:53
人工智能
人工智能
deepseek
webui
RAG:AI大模型联合向量数据库和 Llama-index,助力检索增强生成技术
检索增强生成(RAG)技术,结合了传统的信息检索和最新的大语言模型(
LLM
),不仅能够回答复杂的查询,还能在此基础上生成信息丰富的内容。
AI学习不迷路
·
2025-01-29 10:21
人工智能
数据库
llama
语言模型
RAG
大模型
AI大模型
**
LLM
Gateway:您的智能对话门户**
LLMGateway:您的智能对话门户
llm
-gatewayGatewayforsecure&reliablecommunicationswithOpenAIandotherLLMproviders项目地址
芮奕滢Kirby
·
2025-01-29 09:10
LangGraph系列-1:用LangGraph构建简单聊天机器人
在快速发展的人工智能和大型语言模型(
llm
)世界中,开发人员不断寻求创建更灵活、更强大、更直观的人工智能代理的方法。
梦想画家
·
2025-01-29 06:12
机器学习
LangGraph
LangChain
2024
LLM
年度事件回顾:价格全面下跌、本地运行大模型、多模态能力爆发……
2025年伊始,Django的作者之一SimonWillison,带我们回顾了2024年AI的重磅进展,堪称大模型的“里程碑”盘点。快来看看有哪些突破,刷新了我们对AI的认知!原文很长,下面给大家列几个关键点:1、GPT-4壁垒被突破从前,GPT-4被视为无人能及的高度智能“天花板”,现在,ChatbotArea排行榜上已经有近70个模型,超过了2023年3月版本的GPT-4。谷歌的Gemini1
大模型.
·
2025-01-29 02:09
人工智能
语言模型
自然语言处理
知识图谱
架构
大模型
从零到手搓一个Agent:AI Agents新手入门精通
今日主题:当什么是Agent,与
LLM
的区别又是啥这一天,你的女朋友问你(假设我们有女朋友),宝宝,什么是Agent啊,Agent和
LLM
有什么区别呀,最近大家都在说的Agent究竟是什么,包括很多文章都在写的
大模型.
·
2025-01-29 02:09
人工智能
chatgpt
大数据
深度学习
智能体
算法
大模型
LLM
架构与优化:从理论到实践的关键技术
标题:“
LLM
架构与优化:从理论到实践的关键技术”文章信息摘要:文章探讨了大型语言模型(
LLM
)开发与应用中的关键技术,包括Transformer架构、注意力机制、采样技术、Tokenization等基础理论
XianxinMao
·
2025-01-28 20:14
人工智能
大语言模型
LLM
在地理信息GIS中应用场景
AI&地理AI大语言模型在地理中的应用主要体现在以下几个方面:一、地理信息检索与查询AI大语言模型能够理解复杂的自然语言查询,包括地名、地理位置、地理特征等,从而提供更加精准的地理信息检索服务。例如,用户可以通过自然语言输入查询某个地点的详细信息,模型能够返回包括地理位置、周边设施、交通状况等在内的全面信息。AI与地理信息检索与查询的结合为地理信息的获取和利用带来了革命性的变化。以下是对AI在地理
GISer_Jinger
·
2025-01-28 19:07
人工智能
GIS模型与应用
语言模型
人工智能
自然语言处理
arcgis
第76期 | GPTSecurity周报
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区,集成了生成预训练Transformer(GPT)、人工智能生成内容(AIGC)以及大语言模型(
LLM
)等安全领域应用的知识。
云起无垠
·
2025-01-28 15:05
GPTSecurity
人工智能
网络安全
第84期 | GPTSecurity周报
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区,集成了生成预训练Transformer(GPT)、人工智能生成内容(AIGC)以及大语言模型(
LLM
)等安全领域应用的知识。
云起无垠
·
2025-01-28 14:30
GPTSecurity
人工智能
gpt
AIGC
Azure AI-102 认证全攻略: (三十四)基本提示工程与 API 指南
基本提示工程与API指南(修订版)本指南将详细介绍如何在AzureAIStudio中配置和使用AzureOpenAI服务,从创建和管理AIHub,到部署GPT-3.5Turbo及其他大语言模型(
LLM
)
海棠AI实验室
·
2025-01-28 12:12
AI-102
认证考试全攻略
深度学习
azure
microsoft
AI-102
【AI论文】FilmAgent: 一个用于虚拟3D空间中端到端电影制作自动化的多智能体框架
受近期基于语言智能体社会的自动化决策领域进展的启发,本文提出了FilmAgent,这是一个新颖的、基于大型语言模型(
LLM
)的多智能体协作框架,旨在实现我们构建的3D虚拟空间中的端到端电影制作自动化。
东临碣石82
·
2025-01-28 08:19
自动化
运维
DeepSeek R1模型基于ollama部署
ollama中使用deepseekr13、问答示例4、python调用接口5、ollama常用命令1、安装部署ollama(windows)Ollama是一个专为本地机器设计的开源框架,旨在简化大型语言模型(
LLM
&Dirac
·
2025-01-28 04:22
机器学习笔记
python
语言模型
nlp
探索未来对话的边界:Mixture-of-Agents(MoA)——大型语言模型的集体智慧引擎
https://gitcode.com/gh_mirrors/mo/MoA在当前人工智能的浪潮中,我们迎来了一个令人兴奋的技术突破——Mixture-of-Agents(MoA),它标志着大型语言模型(
LLM
潘俭渝Erik
·
2025-01-28 04:49
SpringAI基于API对大语言模型调用
引言随着人工智能技术的迅猛发展,大型语言模型(
LLM
)在各个领域的应用越来越广泛。SpringAI作为一个旨在简化AI集成的框架,为开发者提供了高效、便捷的工具来连接和调用这些大模型。
_沉浮_
·
2025-01-28 02:00
AI
语言模型
人工智能
springAI
奖励模型:解析大语言模型的关键工具
标题:奖励模型:解析大语言模型的关键工具文章信息摘要:奖励模型是理解和审核大语言模型(
LLM
)的重要工具,通过简单的评估方式提供了模型内部表征和性能的深入洞察。
XianxinMao
·
2025-01-28 01:27
人工智能
【
llm
对话系统】大模型RAG之基本逻辑
大模型RAG之基本逻辑:让
LLM
更精准地回答你的问题(降低幻觉)你是否遇到过这样的情况:当你向
LLM
提问时,它可能会给出一些“一本正经胡说八道”的答案,或者无法回答一些特定领域的专业问题?
kakaZhui
·
2025-01-28 00:18
人工智能
数据库
AIGC
chatgpt
llama
【
llm
对话系统】基于
llm
的实时多轮对话如何做kv cache
为了提高
LLM
的响应速度和效率,我们通常会使用KVCache来存储context的向量表示,以便快速检索相关信息。
kakaZhui
·
2025-01-28 00:48
人工智能
前端
算法
chatgpt
AIGC
【
llm
对话系统】RL强化学习的技术演进与RLHF
一、强化学习基础知识强化学习(ReinforcementLearning,RL)是一种机器学习方法,它通过智能体(Agent)与环境(Environment)的交互来学习如何行动以最大化累积奖励(Reward)。1.核心概念:智能体(Agent):做出决策并采取行动的学习者。环境(Environment):智能体所处的外部世界,对智能体的行动做出反应。状态(State,S):对环境当前情况的描述。
kakaZhui
·
2025-01-28 00:47
人工智能
chatgpt
llama
【
llm
对话系统】Gradio快问快答
从问题出发1.gr.Textbox如何显示一个默认文本``pythonimportgradioasgrdefgreet(name):return"Hello"+name+“!”demo=gr.Interface(fn=greet,inputs=gr.Textbox(value=“请输入你的名字”,label=“姓名”),outputs=“text”)demo.launch()###2.如何隐藏一个
kakaZhui
·
2025-01-27 23:43
chatgpt
人工智能
AIGC
自然语言处理
深度学习-70-大语言模型
LLM
之基于大模型
LLM
与检索增强技术RAG的智能知识库
文章目录1RAG出现的背景2搭建过程2.1数据收集2.2数据处理2.2.1数据清洗与预处理2.2.2文本分块2.2.3微调数据格式统一2.3建立向量索引2.4大模型选择与微调3开源知识库项目3.1FastGPT3.2AnythingLLM3.3LangChain-Chatchat4商业化解决方案4.1百度智能云+千帆大模型知识库4.2阿里云PAI+向量检索5参考附录1RAG出现的背景自从2022年
皮皮冰燃
·
2025-01-27 21:31
深度学习
人工智能
深度学习
语言模型
Crawl4AI:用几行代码打造强大的网页爬虫
尤其是在大型语言模型(
LLM
)的研究和应用中,如何高效地抓取和整理网络数据成为了一个关键的挑战。
海豹工匠
·
2025-01-27 21:30
爬虫
如何让ChatGPT接入互联网?
一、前言使用谷歌搜索引擎实现的最终效果:搜索引擎一次返回10条搜索结果数据每条数据标题都带有链接地址,点击可跳转到对应网页;标题之后的内容为
LLM
模型根据原始网页内容整理之后输出的内容搜索引擎搜索出的内容让
Tensor维度
·
2025-01-27 17:02
AIGC
chatgpt
langchain
AIGC
语言模型
【vLLM 学习】使用 OpenVINO 安装
更多vLLM中文文档及教程可访问→https://vllm.hyper.ai/由OpenVINO驱动的vLLM支持来自vLLM支持的模型列表中的所有
LLM
模型,并且可以在所有x86-64CPU上(至少需要
HyperAI超神经
·
2025-01-27 11:21
vLLM
openvino
人工智能
python
vLLM
LLM
GPU
编程
**深度探索Semantic Kernel:为您的代码注入人工智能的灵魂**
semantic-kernelIntegratecutting-edgeLLMtechnologyquicklyandeasilyintoyourapps项目地址:https://gitcode.com/gh_mirrors/se/semantic-kernel在当前这个飞速发展的时代,大语言模型(
LLM
孙诗嘉Song-Thrush
·
2025-01-27 04:09
大语言模型
LLM
基础扫盲速通版
文章目录1.什么是
LLM
?2.
LLM
如何工作?3.
LLM
开发的关键里程碑4.训练可用
LLM
模型的完整流程5.
LLM
具备的能力6.领先的
LLM
模型包含哪些?7.建议从头开始训练
LLM
吗?
SmallerFL
·
2025-01-27 00:40
NLP&机器学习
语言模型
人工智能
自然语言处理
llm
chatgpt
Meta Llama 3 使用 Hugging Face 和 PyTorch 优化 CPU 推理
optimized-cpu-inference-with-hugging-face-and-pytorch了解在CPU上部署Meta*Llama3时如何减少模型延迟2024年4月19日万众期待的Meta第三代Llama发布了,我想确保你知道如何以最佳方式部署这个最先进的(SoTA)
LLM
lichunericli
·
2025-01-27 00:37
人工智能
pytorch
llama
Gary Marcus对2025年AI的25项预测:AGI的曙光仍未到来?
本文将深入探讨Marcus的预测,并结合实际案例进行分析,特别关注大型语言模型(
LLM
)的不足以及其对就业市场的影响。我们还会探讨一些优秀的AI写代码工具,例如Scri
lilu8888888
·
2025-01-26 22:24
人工智能
agi
百度
前端
Evaluation of OpenAI o1: Opportunities and Challenges of AGI
本文是
LLM
系列文章,针对《EvaluationofOpenAIo1:OpportunitiesandChallengesofAGI》的翻译。
UnknownBody
·
2025-01-26 16:03
LLM
Daily
LLM
Evaluation
agi
人工智能
大数据
语言模型
我从 2024 年的
LLM
应用开发实践中学到了什么?Part 1
本文作者凭借近十年的Web应用和云原生开发经验,以及2024年深度参与
LLM
应用开发的第一手经历,为我们揭示了一个重要发现:成
·
2025-01-26 12:58
Langchain本地知识库部署
2.技术选型2.1LangChainLangChain是一个开源的
LLM
(大语言模型)应用开发框架,支持多种模型和数据源,适用
MaxCode-1
·
2025-01-26 11:01
langchain
AI学习指南Ollama篇-Ollama简介
一、定义大语言模型(
LLM
)是一种基于深度学习的自然语言处理模型,能够生成文本、回答问题、翻译语言、撰写代码等。
俞兆鹏
·
2025-01-26 10:20
AI学习指南
人工智能
ollama
深入解析LangChain框架:使用Python开发
LLM
应用的全生命周期指南
深入解析LangChain框架:使用Python开发
LLM
应用的全生命周期指南前言在当前的人工智能浪潮中,大型语言模型(
LLM
)已成为众多应用的核心。
m0_57781768
·
2025-01-26 06:19
langchain
python
网络
第72期 | GPTSecurity周报
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区,集成了生成预训练Transformer(GPT)、人工智能生成内容(AIGC)以及大语言模型(
LLM
)等安全领域应用的知识。
云起无垠
·
2025-01-25 14:40
GPTSecurity
人工智能
安全
Coze,Dify,FastGPT,对比
平台介绍-FastGPT:由环界云计算公司发起,是基于大语言模型(
LLM
)的开源知识库问答系统。
云连山
·
2025-01-25 13:04
AI编程
AI编程
深度学习-97-大语言模型
LLM
之基于langchain的实体记忆和知识图谱记忆
文章目录1内存记忆Memory1.1记忆系统支持的操作1.2记忆的存储1.3记忆的查询2记忆的应用2.1设置环境变量2.2ConversationEntityMemory实体记忆2.3ConversationKGMemory知识图谱记忆2.3.1创建ConversationKGMemory2.3.2创建ConversationChain2.4ConversationBufferWindowMemo
皮皮冰燃
·
2025-01-25 12:26
深度学习
深度学习
语言模型
langchain
AI大模型提示工程(prompt)从入门到精通(非常详细),看这一篇就够了!!!
在大模型领域,输入通常被称为“提示词”(prompt),它们是引导
LLM
(大语言模型)生成相应输出的关键。对于那些能处理多样化任务的
LLM
来说,一个合理设计的prompt会极大地影响模型的表现。
功城师
·
2025-01-25 12:56
人工智能
prompt
深度学习
大模型
自然语言处理
AI大模型
提示词工程
Windows10环境下使用docker部署Dify
什么是DifyDify是一款开源的大语言模型(
LLM
)应用开发平台。它融合了后端即服务(BackendasService)和LLMOps的理念,使开发者可以快速搭建生产级的生
南南的sky
·
2025-01-25 10:14
容器
运维
AIGC
国内的AI大模型有可能超过ChatGPT吗?
例如,百度的文心一言、阿里的通义千问等大语言模型(
LLM
)已经在技术上
AIWritePaper官方账号
·
2025-01-25 08:28
Prompt
ChatGPT
AIWritePaper
chatgpt
人工智能
深度学习
AI写作
AIGC
简洁明了:介绍大模型的基本概念(大模型和小模型、模型分类、发展历程、泛化和微调)
大模型与小模型的对比2、大模型相关概念区分2.1、基础模型(FoundationModel)2.2、超大模型(Ultra-largeModel)2.3、大语言模型(LargeLanguageModel,
LLM
周杰伦_Jay
·
2025-01-25 06:10
大模型LLMs
分类
数据挖掘
人工智能
机器学习
生成对抗网络
transformer
算法
LLM
-1-chatglm-安装deepspeed报错
安装pipinstalldeepspeed报错Lookinginindexes:https://mirror.baidu.com/pypi/simpleCollectingdeepspeedUsingcachedhttps://mirror.baidu.com/pypi/packages/9f/64/4a3643f61b15dbfec1cab0172f4bdae1d45e1ab3cd73bb060
愚昧之山绝望之谷开悟之坡
·
2025-01-25 04:27
python
开发语言
第84期 | GPTSecurity周报
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区,集成了生成预训练Transformer(GPT)、人工智能生成内容(AIGC)以及大语言模型(
LLM
)等安全领域应用的知识。
·
2025-01-24 20:41
aigc
LLaMA Pro是什么 相比于lora full freeze有什么区别 怎么使用
LLaMAPro是一种基于LLaMA架构改进的大型语言模型(
LLM
),旨在解决大模型微调中的知识遗忘问题。
Ven%
·
2025-01-24 16:58
简单说深度学习
深度学习基础动手
深度学习速通系列
llama
transformer
深度学习
人工智能
【vLLM 学习】使用 OpenVINO 安装
更多vLLM中文文档及教程可访问→https://vllm.hyper.ai/由OpenVINO驱动的vLLM支持来自vLLM支持的模型列表中的所有
LLM
模型,并且可以在所有x86-64CPU上(至少需要
·
2025-01-24 16:08
深度学习-94-大语言模型
LLM
之基于langchain的链Chain的基础应用和调用方式
文章目录1Chain链的分类1.1LCELChains(链构造器)1.2LegacyChains(遗留链)2链的基础应用2.1OllamaLLM2.2是否使用chain的对比2.2.1不使用Chain2.2.2使用Chain3链的调用方式3.1通过invoke方法【推荐】3.2通过predict方法3.3通过apply方法3.4通过generate方法4参考附录1Chain链的分类为开发更复杂的应
皮皮冰燃
·
2025-01-24 14:42
深度学习
深度学习
语言模型
langchain
xiaozhi-esp32 - 基于 ESP32 的 AI 聊天机器人
它通过WebSocket或UDP协议与
LLM
、TTSAPI服务连接,实现实时语音交互功能,无需在设备上运行
LLM
,支持中文在内的多国语言、语音识别用户身份、自定义提示词和音色等功能,兼容多款ESP32开发板
小众AI
·
2025-01-24 13:02
AI开源
开源
人工智能
AI编程
上一页
5
6
7
8
9
10
11
12
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他