E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
闻达语言模型
Decoder-Only、Encoder-Only、Encoder-Decoder 区别
应用:通常用于生成任务,如
语言模型
和对话系统。代表模型:GPT(GenerativePre-trainedTransformer)特点:自回归生成:模型通过
会喘气的粽子丶
·
2025-02-18 18:44
nlp
人工智能
【带你 langchain 双排系列教程】1. langchian 基本架构与环境配置(siliconFlow Deepseek接入)
LangChain是一个用于构建和部署大模型应用的框架,涵盖了从
语言模型
(LLM)到检索增强生成(RAG)、OpenAI集成以及智能体(Agent)的全套工具链。
夜里慢慢行456
·
2025-02-18 17:35
langchain
使用OpenAI LLM与Neo4j数据库进行自然语言交互
本篇文章将介绍如何使用OpenAI的
语言模型
将自然语言问题转换成Cypher查询,并通过Neo4j数据库执行该查询,并给出自然语言的响应。
bBADAS
·
2025-02-18 16:53
neo4j
数据库
交互
python
LLM 参数解析:使用 OpenAI API 在 Python 中的实用指南(含示例)
当你使用大
语言模型
(LLM)时,可能会注意到,即使提交相同的请求,多次运行后仍然会得到不同的回应。这是因为LLM具有概率性,它们的输出基于所学到的模式和概率,而不是固定规则。
真智AI
·
2025-02-18 14:09
python
人工智能
chatgpt
Windows Docker Desktop部署MaxKB详细教程
MaxKB(MaxKnowledgeBase)是一款基于大
语言模型
(LLM)和检索增强生成(RAG)技术的开源知识库问答系统,旨在帮助企业、教育机构及研究组织高效管理知识并提供智能问答服务。
Roc-xb
·
2025-02-18 13:28
docker
容器
运维
MaxKB
AI 编程工具崛起,程序员的未来是否岌岌可危?
再者,深度学习技术的突破,尤其是大
语言模型
在代码理解与生成方面的显著进展,为AI编程提供了坚实的技术基础。最后,随着软件开发需求的不断增加,传统开发
·
2025-02-18 13:26
【目标检测】多模态航空目标检测:A SIMPLE AERIAL DETECTION BASELINE OF MULTIMODAL LANGUAGE MODELS
阅读并理解一篇论文:ASIMPLEAERIALDETECTIONBASELINEOFMULTIMODALLANGUAGEMODELS该文首次提出了一种将多模态
语言模型
应用于航空检测的简单基线方法,名为LMMRotate
慕容紫英问情
·
2025-02-18 12:46
目标检测
目标检测
人工智能
计算机视觉
《DeepSeek训练算法:开启高效学习的新大门》
在人工智能的浪潮中,大
语言模型
的发展日新月异。DeepSeek作为其中的佼佼者,凭借其独特的训练算法和高效的学习能力,吸引了众多目光。
·
2025-02-18 04:41
人工智能深度学习
使用Python中的LangChain库优化消息长度:从聊天历史到模型性能的全面指南
使用Python中的LangChain库优化消息长度:从聊天历史到模型性能的全面指南在现代人工智能应用中,大
语言模型
(LLM)扮演着越来越重要的角色,尤其是在对话系统、智能助理和其他自然语言处理任务中。
m0_57781768
·
2025-02-18 03:10
python
langchain
easyui
【LLM】大模型基础--大规模预训练
语言模型
的开源教程笔记
1.引言本文以DataWhale大模型开源教程为学习路线,进行一整个大模型的入门操作什么是
语言模型
语言模型
是一种对词元序列(token)的概率分布,可以用于评估文本序列的合理性并生成新的文本。
Langchain
·
2025-02-18 02:00
笔记
人工智能
langchain
llama
大模型
产品经理
大模型基础
大
语言模型
(LLM)如何实现上下文的长期记忆?
引言大
语言模型
(LargeLanguageModels,LLMs),如GPT-4、Claude和LLaMA等,已经在自然语言处理领域展现出卓越的能力。
·
2025-02-18 00:06
DeepSeek与ChatGPT:AI
语言模型
的全面对决
DeepSeek与ChatGPT:AI
语言模型
的全面对决引言:AI
语言模型
的时代浪潮一、认识DeepSeek与ChatGPT(一)DeepSeek:国产新星的崛起(二)ChatGPT:AI界的开拓者二、
四念处茫茫
·
2025-02-17 23:21
AI
人工智能
chatgpt
语言模型
DeepSeek的崛起之路:从技术突破到行业变革
一、DeepSeek的进化历程初创与奠基(2023-2024)作为幻方量化子公司,DeepSeek于2023年在杭州成立,专注于大
语言模型
研发。
诚信爱国敬业友善
·
2025-02-17 18:05
心得
人工智能
ai
DeepSeek
边缘AI架构提升LLM应用的响应速度
边缘AI架构提升LLM应用的响应速度关键词边缘计算、边缘AI、LLM、响应速度、模型压缩、分布式计算摘要本文探讨了如何通过边缘AI架构提升大型
语言模型
(LLM)应用的响应速度。
AI天才研究院
·
2025-02-17 15:08
计算
ChatGPT
DeepSeek
R1
&
大数据AI人工智能大模型
java
python
javascript
kotlin
golang
架构
人工智能
大厂程序员
硅基计算
碳基计算
认知计算
生物计算
深度学习
神经网络
大数据
AIGC
AGI
LLM
系统架构设计
软件哲学
Agent
程序员实现财富自由
如何在不依赖函数调用功能的情况下结合工具与大型
语言模型
当大型
语言模型
(LLM)原生不支持函数调用功能时,如何实现智能工具调度?本文通过自然语言解析+结构化输出控制的方法来实现。
Jason9510
·
2025-02-17 15:01
语言模型
人工智能
DeepSeek 混合专家(MoE)架构技术原理剖析
DeepSeek混合专家(MoE)架构技术原理剖析在人工智能快速发展的当下,大规模
语言模型
不断突破创新,DeepSeek混合专家(MoE)架构脱颖而出,成为业内关注焦点。
计算机学长
·
2025-02-17 13:15
通用大语言模型
人工智能
架构
使用多模态大
语言模型
进行深度学习的图像、文本和语音数据增强
在过去的五年里,研究方向已从传统的机器学习(ML)和深度学习(DL)方法转向利用大
语言模型
(LLMs),包括多模态方法,用于数据增强,以提高泛化能力,并在训练深度卷积神经网络时防止过拟合。
数行天下
·
2025-02-17 12:42
人工智能
语言模型
深度学习
人工智能
自然语言处理
本地部署 DeepSeek:环境准备 + 详细步骤 + 高级部署方案 + 可视化工具集成 + 故障排除手册 + 性能优化建议
前言随着人工智能技术的迅猛发展,大
语言模型
(LLM)在多个行业中的应用日益广泛,从自然语言处理、内容生成到智能客服、医疗诊断等领域,AI正在深刻改变传统的工作方式和业务流程。
Katie。
·
2025-02-17 12:08
人工智能
技术发展
ai
deepseek
人工智能
人工智能大模型
基于DeepSeek-R1的高效推理优化实战:从API封装到动态批处理
引言在LLM(大
语言模型
)应用中,推理延迟和计算资源消耗是核心痛点。
竹木有心
·
2025-02-17 11:29
人工智能
深度剖析DeepSeek本地部署:技术、实践与优化策略
其中,大
语言模型
(LLMs)作为人工智能领域的关键技术,在自然语言处理、智能客服、内容创作等众多领域展现出了强大的应用潜力,引发了学术界和产业界的广泛关注。
Abossss
·
2025-02-17 05:11
AI
论文
python
ai
人工智能
DeepSeek R1 与 OpenAI O1:机器学习模型的巅峰对决
点赞收藏❤一、引言在机器学习的广袤天地中,大型
语言模型
(LLM)无疑是最为璀璨的明珠。它们凭借卓越的语言理解与生成能力,正以前所未有的方式重塑着我们与信息交互的模式。
学无止尽5
·
2025-02-17 04:59
机器学习
人工智能
Python自学攻略:AI时代的高效学习法 —— 如何用大模型快速上手编程
借助大
语言模型
(如Deepseek、GPT、Claude、Kimi、豆包等),学习效率可以提升数倍。本文将结合实操路径、工具链和避坑指南,为你提供一套AI时代的Python速成方案。
优化小秦
·
2025-02-17 02:19
人工智能
《AI对话秘籍:5个Prompt Engineering核心技巧让DeepSeek输出质量翻倍》
然而,如何高效地与这些
语言模型
进行交互,获得准确、相关且高质量的回复,成为了应用中的一个关键挑战。这时,PromptEngineering(提示词工程)便成为了一项必不可少的技能。
Athena-H
·
2025-02-17 02:44
Prompt
Engineering
人工智能
prompt
chatgpt
gpt
ai
95%人都不知道的,或许是最全DeepSeek 提示词合集、使用技巧与代码实现全攻略【建议收藏】
一、引言DeepSeek作为一款强大的AI大
语言模型
工具,凭借其高效、灵活的特点,受到了众多开发者和用户的青睐。
大F的智能小课
·
2025-02-16 23:26
python
开发语言
人工智能
算法
【vLLM 学习】安装
vLLM是一款专为大
语言模型
推理加速而设计的框架,实现了KV缓存内存几乎零浪费,解决了内存管理瓶颈问题。
·
2025-02-16 23:25
基于 LLM 的智能运维 Agent 系统设计与实现
摘要本文详细介绍了一个基于大
语言模型
(LLM)的智能运维Agent系统的设计与实现。该系统采用多Agent协同的架构,通过事件驱动的方式实现了自动化运维流程。
LLM教程
·
2025-02-16 22:51
人工智能
embedding
LLM
python
大模型
Agent
智能体
【AI论文】随机鹦鹉在大型
语言模型
(LLM)之肩:物理概念理解的总结性评估
摘要:我们以系统的方式探讨了一个被广泛提及的问题:大型
语言模型
(LLM)真的理解它们所说的话吗?这与人们更为熟悉的术语“随机鹦鹉”息息相关。
东临碣石82
·
2025-02-16 21:16
人工智能
语言模型
自然语言处理
LLaMA3大模型技术全网最全解析——模型架构与训练方法(收录于GPT-4/ChatGPT技术与产业分析)
Meta在周四(4月18日)发布了其最新大型
语言模型
LLaMA3。该模型将被集成到其虚拟助手MetaAI中。
chenweiPhD
·
2025-02-16 21:15
人工智能
深度学习
语言模型
架构
理论一、大模型—概念
大模型全称是大型
语言模型
(LLM,LargeLanguageModel),这个“大”主要指模型结构容量大,结构中的参数多,用于预训练大模型的数据量大。一个大模型可以
伯牙碎琴
·
2025-02-16 20:31
大模型
自然语言处理
ai
Forrester发布2024年五大网络安全新威胁
大选年的叙事(舆论)操控攻击二、深度伪造引发身份安全危机三、生成式人工智能数据泄露四、人工智能软件供应链攻击五、太空成为安全战略高点数据泄露平均成本高达218万美元前言人工智能正重塑网络安全格局,武器化大
语言模型
正成为首选攻击工具
岛屿旅人
·
2025-02-16 18:18
网络安全
web安全
网络
安全
网络安全
DeepSeek正重构具身大模型和人形机器人赛道!
2024年1月20日,公司发布全球首个完全通过强化学习训练的专注于推理任务的高性能
语言模型
DeepSeek-R1
Robot251
·
2025-02-16 17:12
重构
机器人
人工智能
科技
自动驾驶
大
语言模型
常用微调与基于SFT微调DeepSeek R1指南
概述大型
语言模型
(LLM,LargeLanguageModel)的微调(Fine-tuning)是指在一个预训练模型的基础上,使用特定领域或任务的数据对模型进行进一步训练,以使其在该领域或任务上表现更好
知来者逆
·
2025-02-16 16:08
LLM
深度学习
人工智能
自然语言处理
DeepSeek
SFT
微调
(15-3)DeepSeek混合专家模型初探:模型微调
3.4模型微调在本项目中,微调脚本文件finetune.py提供了一套全面的工具,用于对DeepSeek-MoE预训练
语言模型
进行微调。
码农三叔
·
2025-02-16 16:35
训练
RAG
多模态)
人工智能
Deekseep
深度学习
大模型
transformer
什么是 Ollama?如何安装运行?一文讲清
Ollama是一个可以在本地部署和管理开源大
语言模型
的框架,由于它极大的简化了开源大
语言模型
的安装和配置细节,一经推出就广受好评,目前已在github上获得了46kstar。
程序员老冉
·
2025-02-16 13:16
人工智能
开源
语言模型
学习
程序员创富
产品经理
面试
深入解析LangChain:构建智能应用的全方位指南
包括它的背景、主要功能,以及它在当前
语言模型
开发中的意义。”你:"LangChain是一个开源框架,旨在简化和增强基于
语言模型
的应用开发。
AIGC大模型 吱屋猪
·
2025-02-16 05:12
langchain
语言模型
人工智能
自然语言处理
llama
百度
机器学习
AIGC 实战:如何使用 Docker 在 Ollama 上离线运行大模型(LLM)
Ollama简介Ollama是一个开源平台,用于管理和运行各种大型
语言模型
(LLM),例如Llama2、Mistral和Tinyllama。它提供命令行界面(CLI)用于安装、模型管理和交互。
surfirst
·
2025-02-16 04:04
LLM
架构
AIGC
docker
容器
LLM
大模型
DeepSeek-R1-Zero 与 DeepSeek-R1 的异同与优劣分析
目标均为提升
语言模型
的复杂推理能力(如数学、代码、科学推理)。基础模型:均以DeepSeek-V3-Base作为初始模型,共享相同的架构
AI生成曾小健
·
2025-02-16 04:34
Deepseek原理与使用
人工智能
大模型参数高效微调(PEFT)技术解析及微调加速实践
2023年,大模型如雨后春笋般爆发,58同城TEG-AILab作为AI平台部门,紧跟大
语言模型
技术发展步伐,打造了大
语言模型
平台,支持大
语言模型
训练和推理部署,并基于大
语言模型
平台构建了58同城生活服务领域
AI产品经理
·
2025-02-16 03:53
人工智能
自然语言处理
深度学习
语言模型
清华大学KVCache.AI团队联合趋境科技联合的KTransformers开源项目为什么那么厉害
KTransformers是一个由清华大学KVAV.AI团队开发的开源项目,旨在优化大
语言模型
(LLM)的推理性能,特别是在有限显存资源下运行大型模型。
魔王阿卡纳兹
·
2025-02-16 03:52
IT杂谈
人工智能
科技
开源
清华
DeepSeek
趋境科技
KTransformers
【2025指南】OpenAI API Key 获取攻略:从新手入门到专家级应用,一文掌握!
无论你是开发者、研究人员、内容创作者,还是仅仅对AI充满好奇,OpenAI强大的
语言模型
都能为你的工作和生活带来无限可能。本指南将手把手教你获取并使用
·
2025-02-15 18:21
【python语言应用】最新全流程Python编程、机器学习与深度学习实践技术应用(帮助你快速了解和入门 Python)
当前最新的技术动态,如大型
语言模型
和深度学习技术的发展,展示了深度学习和机器学习技术的强大潜力,成为推动创新和提升竞争力的关键。
赵钰老师
·
2025-02-15 14:20
python
机器学习
深度学习
python
机器学习
深度学习
数据分析
人工智能
本地部署的DeepSeek-R1-32B与DeepSeek-R1-7B模型效果对比
本地部署的DeepSeek-R1-32B与DeepSeek-R1-7B模型效果对比在当今人工智能快速发展的时代,大
语言模型
(LargeLanguageModel,LLM)的应用场景日益广泛。
MaxCode-1
·
2025-02-15 12:35
搭建本地gpt
Deepseek
AI-大
语言模型
Transformer架构1.简介2.基本原理和结构3.应用场景4.最新进展三、开源1.开源概念2.开源模式3.模型权重四、再谈DeepSeek前言AI一、LLMLLM(LargeLanguageModel,大
语言模型
真上帝的左手
·
2025-02-15 12:34
23.
AI
人工智能
语言模型
自然语言处理
deep seek
1.介绍:DeepSeek是一款由国内人工智能公司研发的大型
语言模型
,拥有强大的自然语言处理能力,能够理解并回答问题,还能辅助写代码、整理资料和解决复杂的数学问题。
m0_69576880
·
2025-02-15 12:59
前端
ai
RWKV Runner:让RNN-LLM模型触手可及
在这个信息爆炸的时代,人工智能(AI)已经成为我们生活中不可或缺的一部分,尤其是大
语言模型
(LLM)在自然语言处理中的广泛应用。
步子哥
·
2025-02-15 11:57
rnn
人工智能
深度学习
基于 llama-index与Qwen大模型实现RAG
文章目录llama-index核心功能工作流程Qwen技术特点核心能力RAG核心原理关键优势工作流程知识准备阶段查询处理阶段检索与重排阶段
语言模型
调用阶段实现环境准备代码实现参考LlamaIndex和Langchain
uncle_ll
·
2025-02-15 09:35
RAG
llama
rag
qwen
llm
大模型
使用CerebriumAI进行大规模
语言模型
的推理
使用CerebriumAI进行大规模
语言模型
的推理技术背景介绍在人工智能的领域中,模型推理的计算资源需求非常高。传统的CPU在处理大规模
语言模型
(LLM)时效率较低,GPU成为了首选。
qahaj
·
2025-02-15 07:54
语言模型
人工智能
自然语言处理
python
使用SparkLLM实现智能聊天:技术原理与实战演示
技术背景介绍SparkLLM是由iFlyTek提供的一种强大的
语言模型
,支持多种语言生成任务。它能够理解并生成自然语言,适用于对话系统、内容生成、智能客服等场景。核心原理解析SparkL
shuoac
·
2025-02-15 06:41
java
使用vllm docker容器部署大
语言模型
说明最近deepseek比较火,我在一台4卡4090的服务器上尝试部署了一下,记录下部署步骤。安装过程安卓docker和nvidia-container-toolkit安装19.03版本以上的docker-ce即可。安装步骤参考清华docker源上的安装步骤:DockerCE软件仓库为了在docker中使用够显卡,需要安卓nvidia-container-toolkit。在线安装请参考英伟达的官方
yuanlulu
·
2025-02-15 05:33
LLM
docker
语言模型
容器
仅用10张图片,AI就能学会识别万物?多模态小样本学习颠覆传统!
此外,CPE-CLIP和MMFL等方法通过利用预训练模型和冻结的大规模视觉
语言模型
,实现了跨会话的迁移学习和快速适应新样本。
沃恩智慧
·
2025-02-15 03:15
人工智能
深度学习
人工智能
学习
深度学习
上一页
10
11
12
13
14
15
16
17
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他