E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
闻达语言模型
LangChain4j 与 LLM 代理(Agent)机制的深度结合
LangChain4j与LLM代理(Agent)机制的深度结合在大
语言模型
(LLM)的应用开发中,Agent(代理)是一个强大的概念,它可以使LLM不仅仅是一个简单的对话模型,而是能够动态决策、调用工具
小张学Ai
·
2025-03-25 09:18
langchain4j学习
langchain
后端
如何在多个GPU中训练非常大的模型?
目录一、并行训练策略1.数据并行2.模型并行3.混合并行:4.上下文并行二、内存优化技术三、总结在多个GPU上训练超大规模模型(如千亿参数级
语言模型
)需要结合并行策略、内存优化技术、分布式框架。
Mr终游
·
2025-03-25 07:00
大模型
人工智能
模型量化的原因和方法
优化模型参数以适应有限内存环境为了使具有大量参数(例如Llama3.1的4050亿个参数)的大型
语言模型
在合理内存的设备上高效运行,需要对模型进行一系列优化。
潇湘馆记
·
2025-03-25 06:27
人工智能
算法
群核科技开源空间理解生成模型SpatialLM, 构建具身智能训练基座
SpatialLM是一种3D大
语言模型
,旨在处理3D点云数据并生成结构化的3D场景
·
2025-03-25 04:10
机器学习人工智能数据挖掘
轻量级AI革命:无需GPU就能运算的DeepSeek-R1-1.5B模型及其低配推荐
随着人工智能技术的快速发展,大
语言模型
已成为推动产业智能化的重要工具。在这一领域,DeepSeek系列模型凭借其创新的架构和高效的性能,成为众多开发者和企业关注的焦点。
·
2025-03-25 04:09
使用 AI 技术实现智能问答系统
本文将介绍如何利用OpenAI的大
语言模型
API来实现一个简单的智能问答系统,并会演示如何通过中转API地址http://api.wlai.vip调用大模型。
llzwxh888
·
2025-03-25 04:13
人工智能
php
开发语言
python
SFT和RLHF是什么意思?
是什么意思解决方案:SFT(SupervisedFine-Tuning,监督微调)和RLHF(ReinforcementLearningfromHumanFeedback,基于人类反馈的强化学习)是两种用于改进大型
语言模型
玩人工智能的辣条哥
·
2025-03-25 00:15
人工智能
人工智能
深度学习
机器学习
万字长文总结多模态大模型后训练
万字长文总结多模态大模型后训练作者:yearn原文:https://zhuanlan.zhihu.com/p/31278114666本文介绍下我们对多模态alignment近期一系列进展的整理和总结大
语言模型
强化学习曾小健
·
2025-03-24 21:49
人工智能
大模型的应用与微调:如何调用 LLM?从 OpenAI API 到本地部署
本篇文章将详细介绍如何调用大
语言模型
(LLM),涵盖OpenAIAPI、DeepSeek、Manus、通义千问等模型的调用方式,并探讨如何在本地部署LLM进行推理。
晴天彩虹雨
·
2025-03-24 19:02
AI
大模型
ai
语言模型
gpt
人工智能
当细致剪裁遇上大
语言模型
:从数据匹配到卓越性能的奇幻之旅
在浩如烟海的人工智能技术中,构建和调教大
语言模型
(LLMs)的过程就像是一场精心策划的奇幻冒险。本文带您走进一个鲜为人知的领域——如何利用“量身定制”的数据,让模型在知识的海洋中游刃有余。
步子哥
·
2025-03-24 18:24
AGI通用人工智能
语言模型
人工智能
自然语言处理
0 Token 间间隔 100% GPU 利用率,百度百舸 AIAK 大模型推理引擎极限优化 TPS
01什么是大模型推理引擎大模型推理引擎是生成式
语言模型
运转的发动机,是接受客户输入prompt和生成返回response的枢纽,也是拉起异构硬件,将物理电能转换为人类知识的变形金刚。
·
2025-03-24 15:38
百度云大模型gpu
AI算力要变天了?一文搞懂ASIC和GPU
从早期的简单模型训练到如今的大规模
语言模型
如ChatGPT等的出现,对算力的需求呈爆发式增长。01那什么是ASIC和GPU?ASIC:定制化
·
2025-03-24 15:08
asicgpuai芯片
R.E.D.算法:革新文本分类的半监督学习新范式
随着大型
语言模型
(LLMs)在解决问题方面的应用进入新时代,只有少数问题仍然存在不尽如人意的解决方案。
真智AI
·
2025-03-24 13:43
算法
r语言
分类
人工智能
学习
文档处理控件Aspose.Words 教程:.NET版中增强的 AI 文档摘要功能
在25.2版中,我们通过使用Anthropic生成
语言模型
进行摘要扩展了此功能。本篇内容将对此做讨论的。Aspose.wordsfor.Net最新版下载文档摘要有何新
CodeCraft Studio
·
2025-03-24 12:07
控件
文档管理
人工智能
excel
word
pdf
大模型提示词工程师的自我修养-应用二(RAG数据合成与数据多样性问题的解决) -(专题4)
1.生成数据大型
语言模型
(LLMs)具有生成连贯文本的强大能力。通过有效的提示策略,可以引导模型生成更好、一致且更有事实依据的响应。LLMs也特别适用于生成数据,这对于进行各种实验和评估非常有用。
AI专题精讲
·
2025-03-24 11:28
大模型专题系列
人工智能
【AI大模型】搭建本地大模型GPT-NeoX:详细步骤及常见问题处理
搭建本地大模型GPT-NeoX:详细步骤及常见问题处理GPT-NeoX是一个开源的大型
语言模型
框架,由EleutherAI开发,可用于训练和部署类似GPT-3的大型
语言模型
。
qzw1210
·
2025-03-24 09:13
gpt
人工智能
深度学习
LLMOps 是什么?
LLMOps(LargeLanguageModelOperations)指的是一系列用于管理、部署和优化大规模
语言模型
(LLMs)的操作和实践。
AI Agent首席体验官
·
2025-03-24 08:35
人工智能
chatgpt
使用Yeager.ai轻松构建LangChain工具和代理
它的核心组件yAgents是一个无代码的LangChain代理构建器,能够让用户轻松地集成各种
语言模型
和资源,非常适合开发者、研究人员和AI爱好者在不同应用场景中使用。
qahaj
·
2025-03-24 06:11
人工智能
langchain
python
使用Titan Takeoff进行高效的自然语言处理模型推理
特别是其推理服务器TitanTakeoff,使得在本地硬件上轻松部署大
语言模型
(LLMs)成为可能。
scaFHIO
·
2025-03-24 04:54
自然语言处理
人工智能
python
NLP高频面试题(十)——目前常见的几种大模型架构是啥样的
1.什么是LLM(大
语言模型
)?LLM通常指参数量巨大、能够捕捉丰富语义信息的Transformer模型,它们通过海量的文本数据训练而成,能够实现高度逼真的文本生成、复杂的语言理
Chaos_Wang_
·
2025-03-23 22:30
NLP常见面试题
自然语言处理
架构
人工智能
哈尔滨工业大学DeepSeek公开课人工智能:大模型原理 技术与应用-从GPT到DeepSeek|附视频下载方法
本报告深入探讨了大
语言模型
在自然语言处理(NLP)领域的核心地位及其发展历程,从基础概念出发,延伸至
语言模型
在机器翻译、拼音输入法、语音识别等任务中的关键作用。
你觉得205
·
2025-03-23 19:39
人工智能
机器学习
大数据
ai
知识图谱
python
运维
When Large Language Models Meet Speech: A Survey on Integration Approaches
主要内容研究背景:大
语言模型
(LLMs)在自然语言处理领域取得显著进展,其与语音的融合具有广泛应用前景,但缺乏相关集成方法的综述。
UnknownBody
·
2025-03-23 17:46
LLM
Daily
Survey
Paper
语言模型
人工智能
自然语言处理
向量数据库技术系列三-Chroma介绍
一、前言Chroma是一个开源的AI原生向量数据库,旨在帮助开发者更加便捷地构建大模型应用,将知识、事实和技能等文档整合进大型
语言模型
(LLM)中。
恰恰虎
·
2025-03-23 16:43
chromadb
数据库
向量
大模型Agent 和 RAG 的关系
在NLP领域,Agent通常指一个基于大
语言模型
(LLM)的
大数据追光猿
·
2025-03-23 16:38
大模型
语言模型
人工智能
学习方法
transformer
国产模型能否挑战 GPT-4?一文拆解 DeepSeek-V3 架构与实战应用
DeepSeek-V3是由中国团队DeepSeek开发的第三代大
语言模型
,它具备以下几个核心特性:开源可商用:
AI筑梦师
·
2025-03-23 16:07
人工智能学习框架
架构
深度学习
python
agi
人工智能
tensorflow
Github上神仙级大模型项目:大
语言模型
(LLM)入门学习路线图,三个月让你从大模型基础到精通!
Github项目上有一个大
语言模型
学习路线笔记,它全面涵盖了大
语言模型
的所需的基础知识学习,LLM前沿算法和架构,以及如何将大
语言模型
进行工程化实践。
AI大模型-大飞
·
2025-03-23 16:35
github
语言模型
学习
人工智能
AI大模型
程序员
AI
Agent、RAG、LangChain的概念及作用
作用:它能利用内置的大
语言模型
来做出规划,决定执行哪些步骤,以及每个步骤需要调用哪些工具(如RAG),之后调用相应的工具,最终完成任务。
北极冰雨
·
2025-03-23 16:04
大模型
人工智能
大
语言模型
微调和大
语言模型
应用的区别?
大
语言模型
微调和大
语言模型
应用的区别?关键要点微调大型
语言模型
(LLM)是调整预训练模型以适应特定任务或领域的过程,研究表明这能显著提升性能。
AI Echoes
·
2025-03-23 11:30
人工智能
深度学习
deepseek
机器学习
算法
端到端的NLP框架(Haystack)
它提供了数据预处理、文档存储、检索和生成等一系列组件,支持多种
语言模型
和检索器。
deepdata_cn
·
2025-03-23 09:13
NLP
自然语言处理
人工智能
DeepSeek、Grok 与 ChatGPT 三巨头:技术架构与应用场景的全方位解析
前言在当今人工智能领域,DeepSeek、Grok和ChatGPT作为
语言模型
的三巨头,各自凭借独特的技术架构和广泛的应用场景,在自然语言处理领域占据着重要地位。
云策量化
·
2025-03-23 08:36
Deepseek
chatgpt
deepseek
grok
探索AI模型的巅峰之战:ChatGPT、DeepSeek与Grok 3,谁才是最强?
大型
语言模型
(LLMs)如ChatGPT、DeepSeek和Grok3纷纷亮相,各展所长,为人们带来了前所未有的体验。在这场"谁是最强"的竞争中,每一方都展现出了令人惊叹的能力和独特的优势。
温暖阳光阿斌
·
2025-03-23 08:05
人工智能
chatgpt
一文说清预训练与微调:AI的双重训练法则
预训练是大型
语言模型
训练的第一步。它在资金和计算能力的支持下,通过深入分析大量的文本数据,使模型建立起语言的基本构架。在这一阶段,模型通过学习海量的书籍、文章和网页,识别出语言的语法、句法和词汇规律。
TGITCIC
·
2025-03-23 07:02
AI-大模型的落地之道
人工智能
深度学习
开发小型、专业、安全且可扩展的
语言模型
:Arcee的实用指南
技术背景介绍在现代企业中,利用
语言模型
提升效率和推动创新已成为趋势。然而,大型
语言模型
(LLMs)的高资源消耗和安全性问题,往往让企业望而却步。
fgayif
·
2025-03-23 07:00
安全
语言模型
人工智能
python
如何使用LangChain流式处理工具事件
技术背景介绍LangChain是一个用于构建和操作
语言模型
的工具库,其中astream_events()方法能帮助我们监听和处理来自模型的事件流。
fgayif
·
2025-03-23 06:50
langchain
java
前端
python
如何使用JSON输出解析器解析
语言模型
的输出
在现代AI应用中,让
语言模型
返回结构化的数据是一个重要的能力,特别是在需要进一步处理或集成的时候。本文将深入探讨如何利用JsonOutputParser来解析
语言模型
的JSON输出。
vaidfl
·
2025-03-23 04:25
json
语言模型
easyui
python
SAP ABAP 调用 DeepSeek,API Key 存在什么地方最安全?
ChatGPT3.5刚发布不久,我记得很多朋友聊起过大
语言模型
的「讨好型人格」,即倾向于迎合用户的观点、顺从用户的意愿。甚至在极端情况下,当用户对其回复提出质疑时,它会马上认怂,承认自己
汪子熙
·
2025-03-23 04:53
ABAP
百科全书
安全
ABAP
NetWeaver
思爱普
使用 Argilla 进行大
语言模型
数据管理与监控
技术背景介绍Argilla是一个开源的数据管理平台,专为大
语言模型
(LLMs)设计。它旨在通过快速的数据管理以及结合人类和机器的反馈,帮助开发者构建更强大的
语言模型
。
qahaj
·
2025-03-23 03:16
语言模型
python
人工智能
LLM:软件测试的颠覆性力量
LLM:软件测试的颠覆性力量关键词:大
语言模型
(LLM)、软件测试、人工智能、测试自动化、测试效率、质量保证、测试革新1.背景介绍在当今快速发展的软件行业中,测试一直是确保产品质量的关键环节。
AI天才研究院
·
2025-03-23 03:41
DeepSeek
R1
&
大数据AI人工智能大模型
AI大模型企业级应用开发实战
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
使用Dall-E生成图像:文本到图像的魔力
核心原理解析Dall-E利用大型
语言模型
(LLM)从用户提供的文本描述中提取详
shuoac
·
2025-03-23 03:11
计算机视觉
人工智能
python
深入了解盘古大模型:技术、应用与未来
盘古大模型是华为公司联合多家科研机构共同研发的超大规模预训练
语言模型
。该模型以中文数据为主进行训练,旨在推动中文自然语言处理(NLP)以及跨模态应用的技
Hardess-god
·
2025-03-23 02:10
Literature
review
人工智能
【人工智能之大模型】阐述生成式
语言模型
的工作机理...(二)
【人工智能之大模型】阐述生成式
语言模型
的工作机理…(二)【人工智能之大模型】阐述生成式
语言模型
的工作机理…(二)文章目录【人工智能之大模型】阐述生成式
语言模型
的工作机理...
985小水博一枚呀
·
2025-03-23 02:09
大大大模型知识点
人工智能
语言模型
自然语言处理
机器学习
神经网络
NLP高频面试题(七)——GPT和Bert的mask有什么区别?
GPT和BERT的Mask机制对比:核心区别与优化策略在NLP领域,GPT和BERT是最具代表性的预训练
语言模型
之一。
Chaos_Wang_
·
2025-03-23 02:35
NLP常见面试题
自然语言处理
gpt
bert
知识图谱中NLP新技术
以下从核心技术突破、应用场景创新及未来趋势三个层面,系统梳理知识图谱中NLP的最新进展:一、核心技术突破基于预训练模型的图谱构建与增强预训练
语言模型
与知识嵌入融合:以BERT、KEPLER为代表的模型通过联合优化知识嵌入
魔王阿卡纳兹
·
2025-03-23 02:34
知识图谱入门
大数据治理与分析
知识图谱
自然语言处理
人工智能
如何用Function Calling解锁OpenAI的「真实世界」交互能力?(附Node.js 实战)
如同给
语言模型
安装「手脚」,使其不仅能思考,还能执行具体操作。openai官方说明:https:
hongkid
·
2025-03-23 00:54
AI编程
简单理解机器学习中top_k、top_p、temperature三个参数的作用
在机器学习中,top_k、top_p和temperature是用于控制生成模型(如
语言模型
)输出质量的参数,尤其在文本生成任务中常见。
无级程序员
·
2025-03-23 00:53
机器学习
人工智能
使用Ollama部署开源大模型
Ollama是一个简明易用的本地大模型运行框架,可以一键启动启动并运行Llama3、Mistral、Gemma和其他大型
语言模型
。安装MacOS,Windows用户直接在官网下载页下载安装包即可。
好好学习 666
·
2025-03-22 22:09
开源
使用Python和LangChain构建检索增强生成(RAG)应用的详细指南
使用Python和LangChain构建检索增强生成(RAG)应用的详细指南引言在人工智能和自然语言处理领域,利用大
语言模型
(LLM)构建复杂的问答(Q&A)系统是一个重要应用。
m0_57781768
·
2025-03-22 21:33
python
langchain
搜索引擎
学习111
GitHub地址browser-use智能浏览器工具,让AI像人类一样操作浏览器,实现网页自动化网页浏览与操作、多标签页管理、视觉识别与内容提取、操作记录与重复执行、自定义动作支持、主流LLM模型支持为大
语言模型
服务的创新
麋鹿叔叔
·
2025-03-22 21:31
学习
使用LangChain实现基于LLM和RAG的PDF问答系统
目录前言一.大
语言模型
(LLM)1.什么是LLM?2.LLM的能力与特点二、增强检索生成(RAG)三.什么是LangChain?
张同学吧
·
2025-03-22 20:00
langchain
语言模型
基于ChatGPT、GIS与Python机器学习的地质灾害风险评估、易发性分析、信息化建库及灾后重建高级实践
第一章、ChatGPT、DeepSeek大
语言模型
提示词与地质灾害基础及平台介绍【基础实践篇】1、什么是大模型?
weixin_贾
·
2025-03-22 20:59
防洪评价
风险评估
滑坡
泥石流
地质灾害
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他