E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
语言模型
ChatGPT与DeepSeek:开源与闭源的AI模型之争
目录一、模型架构与技术原理二、性能能力与应用场景三、用户体验与部署灵活性四、成本与商业模式五、未来展望与市场影响六、总结随着人工智能技术的飞速发展,ChatGPT和DeepSeek作为两大领先的AI
语言模型
我们的五年
·
2025-03-05 16:00
游戏实现
chatgpt
人工智能
在手机制造行业中应用大
语言模型
推进智能制造
(Harnessingthepoweroflargelanguagemodelsformanufacturing|WorldEconomicForum)智能制造工厂中的机器人臂和工程师协同工作,大
语言模型
等
txzq
·
2025-03-05 15:56
AIGC
大数据
人工智能
智能制造
大语言模型
DeepSeek与ChatGPT:AI
语言模型
的全面对决与开发者洞察
在2025年的人工智能领域,DeepSeek与ChatGPT两大
语言模型
的竞争成为全球开发者关注的焦点。
硅基打工人
·
2025-03-05 14:39
AI
人工智能
chatgpt
语言模型
媒体
经验分享
自然语言处理
零基础也能看懂的ChatGPT等大模型入门解析!大模型入门到精通,看这篇就够了!
近两年,大
语言模型
LLM(LargeLanguageModel)越来越受到各行各业的广泛应用及关注。对于非相关领域研发人员,虽然不需要深入掌握每一个细节,但了解其基本运作原理是必备的技术素养。
大模型微调实战
·
2025-03-05 12:27
chatgpt
百度
人工智能
大数据
wps
学习
大模型
flash-attn安装失败解决方案
前言我们在使用大
语言模型
时,很多开源项目通常需要安装flash-attention2,但是使用pip在线安装flash-attention2时会遇到安装失败的情况,这时我们可以通过下载符合本地环境的whl
你在康什么
·
2025-03-05 09:34
ai
语言模型
【大模型学习】第二章 大模型技术中的Prompt
优化资源利用率2.核心思想与方法论2.1理解模型机制2.2结合上下文2.3迭代优化3.Prompt的典型构成3.1目标说明3.2输入数据3.3输出规范3.4示例与模板3.5语气与风格4.技术原理与实现4.1
语言模型
的预测机制
好多渔鱼好多
·
2025-03-05 09:33
AI大模型
prompt
AI
大模型
人工智能
Prompt工程指南:从入门到精通,手把手教你玩转AI大模型!
Prompt是一种基于人工智能(AI)指令的技术,通过明确而具体的指导
语言模型
的输出。在提示词工程中,Prompt的定义涵盖了任务、指令和角色三个主要元素,以确保模型生成符合用户需求的文本。
AI大模型-大飞
·
2025-03-05 09:02
prompt
人工智能
大模型教程
AI大模型
开源
chatgpt
大模型
Efficient Large Language Models: A Survey
高效的大型
语言模型
综述摘要1引言2模型为中心的方法3数据为中心的方法4LLM框架5结论摘要大型
语言模型
(LLM)在自然语言理解、语言生成和复杂推理等重要任务中表现出了非凡的能力,并有可能对我们的社会产生重大影响
UnknownBody
·
2025-03-05 09:00
Survey
Paper
语言模型
人工智能
自然语言处理
【大模型开源实战】10 分钟,教你如何用 LLama-Factory 训练和微调大模型
英文文档的AI翻译:利用大
语言模型
将英文文档翻译成中文,助您更便捷地获取最新技术信息。快速获取主流
Langchain
·
2025-03-05 06:40
llama
人工智能
自然语言处理
大模型
LLaMA
Factory
LLM
大语言模型
AI大
语言模型
(LLM):电商行业的搜索革命与未来趋势
大
语言模型
:电商行业的搜索革命与未来趋势一、大
语言模型
在电商搜索中的应用1.提升搜索精准度2.改善搜索召回率3.虚拟购物助手二、大
语言模型
与生成性AI的结合1.生成性AI:从搜索到对话式购物体验2.提升个性化推荐三
搞技术的妹子
·
2025-03-05 05:04
人工智能
语言模型
智能电视
LLM OS 系统架构详细设计
LLMOS系统架构详细设计1.背景介绍近年来,大型
语言模型
(LargeLanguageModel,LLM)取得了飞速发展,在自然语言处理、对话系统、文本生成等领域展现出卓越的性能。
AI天才研究院
·
2025-03-05 03:45
AI大模型企业级应用开发实战
系统架构
Langchain解锁LLM大
语言模型
的结构化输出能力(多种实现方案)
在LangChain解锁LLM大
语言模型
的结构化输出能力:调用with_structured_output()方法这篇博客中,我们了解了格式化LLM输出内容的必要性以及如何通过调用langchain框架中提供的
晨欣
·
2025-03-05 02:33
langchain
语言模型
人工智能
基于Ubuntu+vLLM+NVIDIA T4高效部署DeepSeek大模型实战指南
一、前言:拥抱vLLM与T4显卡的强强联合在探索人工智能的道路上,如何高效地部署和运行大型
语言模型
(LLMs)一直是一个核心挑战。尤其是当我们面对资源有限的环境时,这个问题变得更加突出。
来自于狂人
·
2025-03-05 02:01
python
人工智能
pytorch
语言模型
DeepSeek 提示词技巧深度解析:从原理到实践
深度掌握AI交互:DeepSeek提示词技巧全解析突破认知:重新理解AI对话的本质在与DeepSeek等大
语言模型
交互时,我们需要建立全新的对话范式。
悠悠空谷1615
·
2025-03-05 02:00
经验分享
深度学习
语言模型
2025年初-值得关注的几款推理模型
这款模型被定位为“迄今最智能的模型”,并首次引入了混合推理功能,结合了普通大型
语言模型
(LLM)和专门的推理模型能力。
数据分析能量站
·
2025-03-05 01:24
机器学习
人工智能
MLM: 掩码
语言模型
的预训练任务
MLM:掩码
语言模型
的预训练任务掩码
语言模型
(MaskedLanguageModel,MLM)是一种用于训练
语言模型
的预训练任务,其核心目标是帮助模型理解和预测语言中的上下文关系。
XianxinMao
·
2025-03-04 23:41
语言模型
人工智能
自然语言处理
什么是预训练
语言模型
下游任务?
这里指的是词向量本身就是预训练的
语言模型
。什么是下游任务?
衣衣困
·
2025-03-04 22:36
语言模型
人工智能
自然语言处理
DeepSeek:大模型领域的创新力量
其核心的
语言模型
架构经过精心设计与优化,能够高效处理海量文本数据,实现精准的语义理解和生成。在自然语言处理任务中,无论是基础的文本翻译、问答系统
Kurbaneli
·
2025-03-04 22:35
服务器
大
语言模型
原理与工程实践:大
语言模型
推理工程推理加速:算子优化
1.背景介绍近年来,大
语言模型
(LargeLanguageModel,LLM)在自然语言处理(NLP)领域取得了显著的进展。其中,推理(Inference)过程是大
语言模型
的核心环节之一。
AI天才研究院
·
2025-03-04 22:32
计算
DeepSeek
R1
&
大数据AI人工智能大模型
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
AI Agent,大模型重要落地方向
OpenAI将AIAgent定义为,以大
语言模型
为大脑驱动,具有自主理解感知、规划、记忆和使用工具的能力,能自动化执行完成复杂任务的系统。
IT猫仔
·
2025-03-04 19:15
人工智能
语言模型
架构
搜索引擎
机器学习
LangChain数据代理(Agents)与Function Calling解析
数据代理(Agents):赋予模型行动力的FunctionCalling在LangChain的生态中,数据代理(Agents)是一个关键部分,它将
语言模型
的能力从“回答问题”拓展为“主动行动”,为自动化和复杂任务处理带来了巨大优势
一个头发很多的程序员
·
2025-03-04 18:08
langchain实战
langchain
python
人工智能
语言模型
prompt
大
语言模型
生成式AI学习笔记——1. 1.1 大
语言模型
及生成式AI项目生命周期简介——课程简介
GenerativeAIwithLargeLanguageModelsbyDeepLearning.AI&AmazonWebServicesAboutthisCourseInGenerativeAIwithLargeLanguageModels(LLMs),you’lllearnthefundamentalsofhowgenerativeAIworks,andhowtodeployitinreal
预见未来to50
·
2025-03-04 18:07
机器学习
深度学习(ML/DL)
人工智能
语言模型
学习
让AI团队来分析股票!一份可以参考的简单研报——基于Python的CrewAI库
OpenAI将AIAgent定义为“以大
语言模型
为大脑驱动的系统,具备自主理解、感知、规划、记忆和使用工具的能力,能够自动化执行完成复杂任务的系统。”
Ra1n_Su
·
2025-03-04 18:03
ai
人工智能
python
大模型学习笔记-基于《Deep Dive into LLMs like ChatGPT》
构建数据集对于大
语言模型
(LLM)的训练而言,首先需要构建
XiyouLinux_Kangyijie
·
2025-03-04 18:33
学习
笔记
chatgpt
BERT 和 Milvus 构建智能问答系统的全面技术解析,涵盖从原理到实践的完整流程
下面Python代码示例和优化策略:一、技术栈协作原理BERT的语义编码能力BERT作为预训练
语言模型
,通过双向Transformer结构将文本转换为高维向量(如768维),捕捉上下文语义信息。
·
2025-03-04 14:28
AI大模型-提示工程学习笔记22-元提示(meta-prompting)
Meta-Prompting的解决方案2.Meta-Prompting的工作流程(1)元提示输入(2)提示生成(3)提示评估(可选)(4)提示选择(可选)(5)任务执行3.Meta-Prompting的关键组件(1)大
语言模型
9命怪猫
·
2025-03-04 13:22
AI
人工智能
机器学习
ai
prompt
Helix 是开源的私有 GenAI 堆栈,用于构建具有声明性管道、知识 (RAG)、API 绑定和一流测试的 AI 应用程序。
从
语言模型
到图像模型等,Helix以符合人体工程学、可扩展的方式为您的业务带来最好的开源AI,同时优化GPU内存和延迟
2301_78755287
·
2025-03-04 13:50
人工智能
医院信息科医疗语言大模型开发的风险洞察与避坑策略
例如,在疾病诊断环节,大
语言模型
可以通过对患者症状、病史等文本信息的分析,快速给出可能的疾
Allen_LVyingbo
·
2025-03-04 09:57
医疗高效编程研发
健康医疗
人工智能
互联网医院
python
开源
微调DeepSeek-R1打造SQL语言转自然语言大模型!小白也能十分钟打造自己的推理大模型!unsloth+Colab+DeepSeek-R1-Distill-Llama-8B轻松上手
unsloth+Colab+DeepSeek-R1-Distill_哔哩哔哩_bilibili简介:DeepSeek-R1-Distill-Llama-8B是一个基于Llama架构的8B参数
语言模型
,经过深度蒸馏
AI超元域
·
2025-03-04 07:08
sql
llama
数据库
ai
人工智能
AI编程
LLMR//https://github.com/microsoft/llmr?locale=zh-cn
locale=zh-cnIntroduction这个repo包含LLMR中描述的代码,实现了混合现实框架的大型
语言模型
。
开心就好啦~
·
2025-03-04 01:53
windows
LangChain入门---- Prompt
Prompt介绍LangChain中的“Prompt”是一个关键概念,指的是输入给大型
语言模型
(LLM)的文本指令或提示,用于引导模型生成特定的输出或执行特定的任务。
快乐小狗(成功上岸版
·
2025-03-04 00:21
LangChain入门
langchain
prompt
机器学习
人工智能
DeepSeek-R1:通过强化学习激励大型
语言模型
的推理能力
摘要我们介绍了第一代推理模型DeepSeek-R1-Zero和DeepSeek-R1。DeepSeek-R1-Zero是一个通过大规模强化学习(RL)训练而成的模型,无需监督微调(SFT)作为初步步骤,展示了卓越的推理能力。通过RL,DeepSeek-R1-Zero自然涌现出许多强大而有趣的推理行为。然而,它也面临诸如可读性差和语言混合等挑战。为了解决这些问题并进一步提升推理性能,我们引入了Dee
AI专题精讲
·
2025-03-03 22:05
大模型专题系列
语言模型
人工智能
自然语言处理
grok 3官网入口_grok 3国内使用指南
Grok是xAI于2023年11月推出的创新型
语言模型
。与市面上众多聊天机器人相比,Grok不只是一个简单的工具,它的推出标志着AI领域的一次重要突破。
·
2025-03-03 22:32
人工智能
人工智能开发中的数据隐私
大型
语言模型
(LLM)的发展和对通用人工智能(AGI)的追求
RA AI衍生者训练营
·
2025-03-03 19:09
ai
基于DeepSeek 的图生文最新算法 VLM-R1
目录一、算法介绍二算法部署三模型下载四算法测试五可视化脚本一、算法介绍VLM-R1:稳定且可通用的R1风格大型视觉
语言模型
自从Deepseek-R1推出以来,出现了许多专注于复制和改进它的作品。
AI算法网奇
·
2025-03-03 18:02
深度学习宝典
大模型
人工智能
计算机视觉
Llama 3.2入门基础教程(非常详细),Llama 3.2微调、部署以及多模态训练入门到精通,收藏这一篇就够了!
9月25日Meta发布了Llama3.2,包括11B和90B的视觉
语言模型
。前排提示,文末有大模型AGI-CSDN独家资料包哦!
中年猿人
·
2025-03-03 17:49
llama
android
人工智能
语言模型
深度学习
学习
自然语言处理
minikube 的 Kubernetes 入门教程--Dify
Dify是一款开源的大
语言模型
(LLM)应用开发平台。它融合了后端即服务(BackendasService)和LLMOps的理念,使开发者可以快速搭建生产级的生成式AI应用。
NightReader
·
2025-03-03 16:14
minikube
kubernetes
容器
云原生
探索vLLM Chat:作为OpenAI API替代方案的强大工具
#探索vLLMChat:作为OpenAIAPI替代方案的强大工具##引言随着生成式AI技术的发展,许多应用都依赖于强大的
语言模型
API来提供自然语言处理任务的支持。
qq_37836323
·
2025-03-03 15:41
python
AI大
语言模型
概述:从GPT到BERT的技术演进
1.背景介绍1.1什么是大
语言模型
大
语言模型
是一种基于深度学习的自然语言处理技术,它可以理解和生成人类语言。
AI智能涌现深度研究
·
2025-03-03 15:40
AI大模型应用入门实战与进阶
DeepSeek
R1
&
大数据AI人工智能
计算
大数据
人工智能
语言模型
AI
大模型
LLM
Java
Python
架构设计
Agent
RPA
Meta Platforms (原Facebook)计划推出新的大型
语言模型
以应用于人工智能
近期,有消息传出MetaPlatforms计划推出新的大型
语言模型
以应用于人工智能领域,这一举措无疑将对行业格局产生深远影响。
PM简读馆
·
2025-03-03 15:40
技术杂谈
人工智能
facebook
语言模型
本地部署大
语言模型
-DeepSeek
DeepSeek是国内顶尖AI团队「深度求索」开发的多模态大模型,具备数学推理、代码生成等深度能力,堪称"AI界的六边形战士"。HosteaseAMD9950X/96G/3.84TNVMe/1G/5IP/RTX4090GPU服务器提供多种计费模式。DeepSeek-R1-32B配置配置项规格要求CPU16核以上(如AMDRyzen9950)内存96GB硬盘960GB显卡24GB+显存(如RTX40
NightReader
·
2025-03-03 15:36
语言模型
人工智能
自然语言处理
让 DeepSeek 更“聪明”:一键解析 PDF 和 Word 文档的 GUI 小工具,轻松处理复杂文档
DeepSeek-r1:1.5b是一款强大的
语言模型
,能够根据输入的自然语言进行推理和生成,但其原生本地部署环境并不支持直接上传文档进行解析。
Python测试之道
·
2025-03-03 12:10
测试提效
python
python
人工智能
测试用例
DeepSeek 开源周五个开源项目,引领 AI 创新?
Day1:FlashMLA项目介绍FlashMLA是一个为HopperGPU设计的高效解码内核,专门用于大型
语言模型
(
LaughingZhu
·
2025-03-03 08:09
开源
人工智能
产品运营
前端
经验分享
Gemini API —— Curl 快速开发 Google Gemini 中国版!
https://gemini.danielmind.techGeminiAPI快速入门教程GeminiAPI是一种强大的生成式
语言模型
,支持文本生成、多模态输入(文字+图片)、多轮对话等功能。
这儿有一堆花
·
2025-03-03 08:08
ai
人工智能
googlecloud
大模型隐空间推理论文阅读笔记
1.1摘要1.2引言TrainingLargeLanguageModelstoReasoninaContinuousLatentSpace一.简介机构:Meta代码:任务:特点:方法:1.1摘要现状:大
语言模型
往往局限在
猴猴猪猪
·
2025-03-03 03:57
AIGC
python
实验记录
人工智能
深度学习
LangChain学习笔记
LangChain是一个用来开发大型
语言模型
(LLM)应用的框架,为了简化构建基于LLM的应用,它能够为开发LLM应用带来如下能力:根据给定的Prompt方便构建上下文,并连接到LLM,得到更加符合查询的回答结果在构建整个基于
xiaomu_347
·
2025-03-03 02:22
LLM——AIGC
学习
笔记
LangChain解锁LLM大
语言模型
的结构化输出能力:调用 with_structured_output() 方法
什么是LLM的结构化输出能力?在一些工业级LLM应用或比较复杂的LLM应用编排环节,我们需要用LLM的输出作为下一环节的输入,而这个过程往往对LLM输出的格式有一定要求,比如JSON、XML、YAML、CSV、Markdown表格和HTML等比较常见的格式。因此我们需要通过各种方式手段让LLM具备符合我们期望的结构化输出能力,即模型能够按照用户指定的格式或规则生成内容(而不仅仅是自由形式的文本)的
晨欣
·
2025-03-03 02:50
langchain
语言模型
人工智能
大模型技术:重塑未来的力量
以ChatGPT为例,这款由OpenAI开发的大型
语言模型
,首次实现了基于语言的智能涌现,推动了通用人工智能的技术飞跃和快速进化。
每天五分钟玩转人工智能
·
2025-03-03 00:10
人工智能
机器学习
深度学习
大模型
深度学习-136-LangGraph之应用实例(五)构建RAG问答系统同时从不同的角度对比优化效果
文章目录1大
语言模型
2小粒度分割文档2.1处理文本构建Document2.2向量存储2.3创建图2.4测试调用3大粒度分割文档3.1构建Document3.2向量存储3.3创建图3.4测试调用4总结与优化
皮皮冰燃
·
2025-03-02 23:59
深度学习
深度学习
人工智能
LangGraph
RAG
微调DeepSeek-R1-Distill-Llama-8B打造sql2text大模型!小白也能十分钟打造自己的推理大模型!unsloth+Colab轻松上手
简介:DeepSeek-R1-Distill-Llama-8B是一个基于Llama架构的8B参数
语言模型
,经过深度蒸馏(distillation)处理,旨在提高推理效率和精度。
X.Cristiano
·
2025-03-02 23:28
DeepSeek-R1
Llama-8B
sql2text
人工智能
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他