E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
R1
DeepSeek
R1
简单指南:架构、训练、本地部署和硬件要求
DeepSeek推出的LLM推理新策略DeepSeek最近发表的论文DeepSeek-R1中介绍了一种创新的方法,通过强化学习(RL)提升大型语言模型(LLM)的推理能力。这项研究在如何仅依靠强化学习而不是过分依赖监督式微调的情况下,增强LLM解决复杂问题的能力上,取得了重要进展。DeepSeek-R1技术概述模型架构DeepSeek-R1不是一个单独的模型,而是包括DeepSeek-R1-Zer
爱喝白开水a
·
2025-02-28 07:52
人工智能
AI大模型
DeepSeek
R1
DeepSeek
算法
人工智能训练
大模型部署
有效使用DeepSeek-R1的7大技巧:提升AI助手效能的秘诀
本文将结合实际案例,分享7大有效的
R1
使用技巧,帮助你像CSDN大牛一样高效利用AI助手。技巧1:提出明确的要求技巧阐述:在与DeepSeekR1交互时,清晰明确的表达是关键。
小李独爱秋
·
2025-02-27 09:55
Deepseek
AIGC
AI编程
prompt
扣子和DIfy调用deepseek对比分析
近日,与网络高人学习,用Coze调用deepseek火山引擎版满血
R1
大模型,可以构建自己的业务级智能体,觉得还挺好玩的。
ISDF-CodeInkVotex
·
2025-02-27 06:30
人工智能+
科技前沿杂谈
人工智能
使用 frp 实现内网穿透:从零到一的完整指南
字节跳动火山引擎官方,免费抵扣3625万tokens,畅享
R1
与V3模型!参与入口:点击进入为什么需要内网穿透?
山风wind
·
2025-02-27 05:58
人工智能
frp
deepseek
内网穿透
人工智能
http
基于LangChain4j调用火山引擎DeepSeek
R1
搭建RAG知识库实战指南
基于LangChain4j调用火山引擎DeepSeekR1搭建RAG知识库实战指南基于LangChain4j调用火山引擎DeepSeekR1搭建RAG知识库实战指南基于LangChain4j调用火山引擎DeepSeekR1搭建RAG知识库实战指南一、注册火山引擎账号二、RAG技术核心原理三、环境与工具准备1.核心组件2.依赖配置(Maven)四、代码实现步骤步骤1:初始化DeepSeek模型步骤2
山风wind
·
2025-02-27 05:53
人工智能
火山引擎
deepseek
langchain
langchain4j
RAG
知识库
数据仓库
DeepSeek
R1
、Kimi k1.5与OpenAI o1:技术架构、性能对比及应用前景深度剖析
在人工智能的浪潮中,大型语言模型(LLMs)已成为推动技术变革的核心引擎。DeepSeekR1、Kimik1.5和OpenAIo1作为这一领域的先锋代表,以其独特的技术架构和卓越的性能,引领着行业的发展方向。深入剖析这三款模型,不仅能让我们把握LLMs的技术脉搏,更能为未来的技术创新和应用拓展提供有力支撑。深度拆解技术架构DeepSeekR1:强化学习驱动的革新之路DeepSeekR1的核心在于对
WilsonShiiii
·
2025-02-27 00:48
语言模型
gpt
深入解析 DeepSeek
R1
:强化学习如何驱动大模型推理能力的进化
引言在AI竞赛日益激烈的时代,DeepSeek-AI推出了DeepSeekR1,试图以强化学习(RL)直接训练推理能力,而非仅依赖传统的监督微调(SFT)。这一思路不仅为大规模语言模型(LLMs)带来了新的训练范式,还在跨任务推理迁移上表现出潜力。本文将深入解析DeepSeekR1的架构、训练方法和对比实验,并从多维度审视其局限性与未来发展方向。同时,我们也会在文中介绍DeepSeekR1蒸馏到多
海棠AI实验室
·
2025-02-26 23:07
智元启示录
人工智能
deep
learning
DeepSeek-R1
从零开始:使用PyTorch构建DeepSeek
R1
模型及其训练详解
本文将引导你使用PyTorch从零开始构建DeepSeekR1模型,并详细解释模型架构和训练步骤。DeepSeekR1是一个假设的模型名称,为了演示目的,我们将构建一个基于Transformer的简单文本生成模型。1.模型架构DeepSeekR1的核心是一个基于Transformer的编码器-解码器架构,包含以下关键组件:EmbeddingLayer:将输入的单词索引转换为密集向量表示。Posit
陆鳐LuLu
·
2025-02-26 19:02
pytorch
人工智能
python
04 路由表的IP分组传输过程
2.1、IP分组传输过程2.2、数据包转发过程2.3、IP分组传输过程和数据包转发的区别3、数据包的变化3.1、拓扑结构3.2、传输过程详解(主机A→主机B)3.2.1、主机A发送数据3.2.2、路由器
R1
Ctrl+C 和 Ctrl+V 的搬运工
·
2025-02-26 18:31
路由和交换技术
tcp/ip
网络协议
网络
智能路由器
深度求索:解析DeepSeek
R1
与V3模型的技术差异
深度求索:解析DeepSeekR1与V3模型的技术差异引言模型定位与核心能力DeepSeekV3应用场景及示例DeepSeekR1应用场景及示例模型架构与训练方法DeepSeekV3的架构特点DeepSeekR1的强化学习策略性能表现与基准测试DeepSeekV3的性能优势领域DeepSeekR1的性能优势领域应用场景与部署成本分析DeepSeekV3的适用场景及部署成本优势DeepSeekR1的
walkskyer
·
2025-02-26 05:53
AI探索
deepseek
deepseek-r1
deepseek-v3
671B满血版DeepSeek
R1
隐藏入口,优秀平台推荐!
DatawhaleDatawhale推荐平台:AskManyAI**DeepSeek官网挤爆了,各种前几天大火的第三方平台也接连崩溃。我整理了一下问题,可以分成3类:回答卡顿,慢的要死,半天出不来结果,得反复重试服务器崩了,不知道啥时候能修复挂羊头卖狗肉,用8B蒸馏小模型冒充DeepSeekR1满血版,回答效果很差不能联网搜索不能支持图片对话不能支持文档对话这两天找遍各个渠道,深度体验了市面上接近
·
2025-02-25 07:57
datawhale
为什么DeepSeek必须开源(以及它为何不会打败OpenAI)
这家中国AI实验室训练出了
R1
——一款开
新加坡内哥谈技术
·
2025-02-25 05:12
人工智能
深度学习
机器人
科技
语言模型
ChatGPT 中文版:国内直连免费指南(支持 GPT-4、4o、o1、o3 和 DeepSeek
R1
)【2025年2月更新】
更新时间:2025/02/25在国内能轻松使用ChatGPT中文版,无需,支持GPT-4、4o、o1、o3及中文版功能。本指南提供全面的ChatGPT中文版使用建议,涵盖国内可用的ChatGPT镜像网站推荐和详细使用教程,帮助您快速掌握ChatGPT的使用。什么是ChatGPT中文版?ChatGPT中文版是OpenAI开发的ChatGPT模型的中文版本,专为中文用户设计,提供更流畅、更精准的AI对
·
2025-02-24 14:23
chatgpt人工智能
双指针专题4:区间最大和
解释一个样例:mx=-1,l1=-1,
r1
=-
williamzhou_2013
·
2025-02-23 18:31
算法
c++
双指针
【探商宝】2025年2月科技与商业热点头条:AI竞赛、量子计算与芯片市场新格局
DeepSeek开源策略颠覆行业DeepSeek的
R1
模型凭借开源生态和技术创新,在Arena榜单升至全
探熵科技
·
2025-02-23 02:31
大数据
人工智能
经验分享
数据分析
华为昇腾服务器部署DeepSeek模型实战
服务器是配置了8块910B3的显卡,每块显卡有64GB显存,根据DeepSeekR1各个模型的参数计算,如果部署
R1
的Qwen14B版本,需要1张显卡,如果是32B版本,需要2张,Llama70B的模型需要
gzroy
·
2025-02-20 18:22
人工智能
语言模型
大模型(含deepseek
r1
)本地部署利器ollama的API操作指南
ollama介绍:Ollama是一个开源的大型语言模型(LLM)平台,旨在让用户能够轻松地在本地运行、管理和与大型语言模型进行交互。它支持多种预训练的大型语言模型(如LLaMA2、Mistral、Gemma、DeepSeek等),并提供了一个简单高效的方式来加载和使用这些模型。出现Error:somethingwentwrong,pleaseseetheollamaserverlogsfordet
·
2025-02-20 13:41
人工智能llm
DeepSeek-r1 与 RAG工作流的无缝结合:应对复杂问题的新方式
ByDeanSacoranskyandDenizAskin原文标题:推理与递归检索:Deepseek-r1、Tavily和LangGraphDeepSeek-r1的影响DeepSeek在不到一个月前公开发布了
r1
·
2025-02-19 15:28
deepseekllm
DeepSeek
R1
模型详解与微调
目录引言DeepSeekR1模型概述DeepSeekR1模型架构3.1输入层3.2编码器层3.3解码器层3.4输出层DeepSeekR1核心原理
zhangjiaofa
·
2025-02-19 11:59
DeepSeek
R1&
AI人工智能大模型
DeepSeek
R1
思维链
模型微调
在微信里使用DeepSeek的方法,效果真的不错
使用方法:小程序中搜索"秘塔AI搜索“点击‘秘塔AI搜索’把长思考
R1
点亮试问一个问题下方还会列出大纲和相关的组织和个人,很贴心大纲还可以用脑图的形现,太绝了
mcusun2000
·
2025-02-19 09:41
deepseek
deepseek
微信
搜索
Python 函数-调用函数
假设我们需要计算3个不同大小的圆的面积:
r1
=12.34r2=9.08r3=73.1s1=3.14*
r1
*r1s2=3.14*r2*r2s3=3.14*r3*r3当代码出现有规律的重复的时候,你就需要当心了
赔罪
·
2025-02-19 07:59
Python
系统学习
python
开发语言
HCIP-三层架构实验报告
一、搭建实验拓扑图二、进行配置对
r1
,r2进行IP配置及环回[r1interfaceg0/0/2[r1-GigabitEthernet0/0/2]ipaddress12.1.1.124[r1-GigabitEthernet0
会会会一飞冲天的小慧猪~ ~ ~
·
2025-02-19 04:09
网络
CSDN宣布C知道产品接入DeepSeek
R1
满血版大模型,文心一言、星火认知模型
文章目录前言一、产品升级与模式革新二、技术整合与大模型应用三、深度思考模式的核心优势四、应用场景与用户受益五、未来发展与技术创新前言亲爱的家人们,创作很不容易,若对您有帮助的话,请点赞收藏加关注哦,您的关注是我持续创作的动力,谢谢大家!有问题请私信或联系邮箱:
[email protected]
一、产品升级与模式革新CSDN宣布C知道产品接入DeepSeek大模型。通过植入“深度思考模式”,全面升级AI
周杰伦_Jay
·
2025-02-19 00:29
大模型LLMs
热点事件
文心一言
人工智能
leetcode
目标检测
机器学习
自然语言处理
生成对抗网络
Python的orm框架sqlalchemy的查询多条数据只显示第一条!!
(Base):#表名__tablename__='T_ZB_PL'#表结构INSTR_NO=Column(String(30),primary_key=True)DT=Column(DateTime)
R1
Rider丶剑心
·
2025-02-19 00:25
数据
Qwen 2.5-Max + Cline 组合,真的能替代 DeepSeek V3 和
R1
吗?实测见真章!
1.背景近年来,AI代码编辑器如Cursor和Windsurf在国内市场颇受欢迎,而开源方案Cline+DeepSeekV3也随着DeepSeekV3和
R1
的崛起逐步被开发者接受。
surfirst
·
2025-02-18 23:10
LLM
编程工具
大模型
AI编程
10分钟搭建钉钉DeepSeek AI助手:无代码实现智能对话
引言DeepSeek最近发布了两款先进的AI模型:V3和
R1
。其中V3适用于对话AI和内容生成等通用场景,
R1
则专注于编程和数学等推理任务。
ivwdcwso
·
2025-02-18 13:59
运维
钉钉
人工智能
运维
DeepSeek
AI
探秘 DeepSeek
R1
模型:跨越多领域的科技奇迹,引领智能应用新浪潮
DeepSeekR1模型功能强大,应用广泛。在自然语言处理、计算机视觉、推荐系统和医疗等领域都能发挥作用。本文介绍了其在各领域的应用场景和代码示例,助你深入了解它。目录编辑一、本篇背景:二、DeepSeekR1模型概述:2.1模型特点:2.2技术原理:三、自然语言处理领域的应用:3.1文本分类:3.1.1应用场景:3.1.2代码演示:3.2情感分析:3.2.1应用场景:3.2.2代码演示:3.3机
羑悻的小杀马特.
·
2025-02-18 09:44
AI学习
科技
deepseek
AI大模型
BGP 路由反射器配置实例(Route-Reflector)实际案例(配图+详细验证过程)
上图中,R2会通告给R3所有它从
R1
学来的EBGP路由条目。但是这些路由不会通告给R4,因为R3不会在R2和R4之间传递IBGP路由。为使R4得知这些路由,R2和R4之间就必须有一对IBGP连接。
weixin_34365417
·
2025-02-18 03:13
腾讯云目前支持4种DeepSeek开源大模型部署方案
腾讯云目前支持4种DeepSeek开源大模型部署方案1、面向开发者开箱即用的HAI方式1)参考:https://mp.weixin.qq.com/s/kZLPfXv3b1sxLSwyRVsEsg2)优势:支持
R1
szqcloud
·
2025-02-18 03:41
database
DeepSeek
R1
蒸馏版模型部署的实战教程
大家好,我是herosunly。985院校硕士毕业,现担任算法研究员一职,热衷于大模型算法的研究与应用。曾担任百度千帆大模型比赛、BPAA算法大赛评委,编写微软OpenAI考试认证指导手册。曾获得阿里云天池比赛第一名,CCF比赛第二名,科大讯飞比赛第三名。授权多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法行业就业。希望和大家一起成长进步。
herosunly
·
2025-02-18 03:09
DeepSeek从入门到精通
deepseek
大模型
人工智能
实战教程
DeepSeek
R1
vs ChatGPT o1 实测 7 大场景终极对决
R1vso1:7大场景终极对决引言你需要的不是「最好」,而是「最合适」想象一下,你面前有两把瑞士军刀:一把刀锋锐利但功能单一,另一把功能繁多但需要时间磨合。你会怎么选?人工智能模型的选择也是如此。DeepSeekR1和ChatGPTo1就像这两把军刀,它们的胜负不在绝对强弱,而在场景适配。根据实测数据,我们将通过编程、教育、创意等7个战场,解剖这两大AI巨头的真实战斗力。一、语言战场当AI成为「读
网络安全我来了
·
2025-02-18 00:09
人工智能
AI
chatgpt
DeepSeek的崛起之路:从技术突破到行业变革
2025年1月:推出
R1
系列(660B参数),通过
诚信爱国敬业友善
·
2025-02-17 18:05
心得
人工智能
ai
DeepSeek
深入了解与全面使用DeepSeek:从基础到高级应用
一、认识DeepSeek1.1DeepSeek简介DeepSeek是由深度求索公司开发的人工智能平台,它支持三种主要模式:基础模型(V3)、深度思考(
R1
)和联网搜
一位卑微的码农
·
2025-02-17 15:35
人工智能
大数据
java-ee
spring
boot
DeepSeek
R1
与 OpenAI O1:机器学习模型的巅峰对决
我的个人主页我的专栏:人工智能领域、java-数据结构、Javase、C语言,希望能帮助到大家!!!点赞收藏❤一、引言在机器学习的广袤天地中,大型语言模型(LLM)无疑是最为璀璨的明珠。它们凭借卓越的语言理解与生成能力,正以前所未有的方式重塑着我们与信息交互的模式。DeepSeekR1和OpenAIO1作为其中的佼佼者,代表了当前技术的前沿水准,在架构设计、训练方法、性能表现以及应用场景等诸多层面
学无止尽5
·
2025-02-17 04:59
机器学习
人工智能
DeepSeek与ChatGPT的全面对比
然而,近期中国AI初创公司DeepSeek推出的
R1
模型,以其高效性和低成本,迅速引起全球关注。
测试者家园
·
2025-02-17 03:52
人工智能
ChatGPT
DeepSeek
ChatGPT
DeepSeek
人工智能
质量效能
大语言模型常用微调与基于SFT微调DeepSeek
R1
指南
概述大型语言模型(LLM,LargeLanguageModel)的微调(Fine-tuning)是指在一个预训练模型的基础上,使用特定领域或任务的数据对模型进行进一步训练,以使其在该领域或任务上表现更好。微调是迁移学习的一种常见方法,能够显著提升模型在特定任务上的性能。在大型语言模型(LLM)的微调中,有几种常见的方法,包括SFT(监督微调)、LoRA(低秩适应)、P-tuningv2和**Fre
知来者逆
·
2025-02-16 16:08
LLM
深度学习
人工智能
自然语言处理
DeepSeek
SFT
微调
DeepSeek接入Python,一般电脑也能飞速跑,确实可以封神了!
你好,我是郭震今天这篇教程介绍:DeepSeep最新推理模型
R1
接入Python编程,在本地电脑从零搭建方法。1这样做有哪些好处?
算法channel
·
2025-02-15 14:49
python
开发语言
deepseek本地部署需要多少显卡资源
华为昇腾环境(MindIE)参考资料:https://modelers.cn/models/MindIE/deepseekv3部署DeepSeek-V3、
R1
模型浮点权重至少需要4台Atlas800IA2
yuanlulu
·
2025-02-15 06:45
LLM
国产算力/昇腾
自然语言处理
deepseek
LLM
大语言模型
昇腾
人工智能
DeepSeek
R1
:引领未来教育革命的自适应学习路径规划系统
自适应学习路径规划概述自适应学习路径规划是指通过分析用户的学习行为和需求,动态调整学习内容和顺序,以提供个性化、高效的学习体验。在当今快速发展的教育科技领域,这一概念变得尤为重要。随着人工智能技术的进步,特别是深度学习和强化学习的应用,我们能够更加精准地识别学习者的需求,并据此设计出最适合他们的学习路径。利用先进的算法和模型来实现对学习路径的智能化管理。该系统能够实时监控学习者的进度,根据其表现调
Coderabo
·
2025-02-14 18:38
DeepSeek
R1模型企业级应用
学习
人工智能
机器学习
算法
python
深度学习
用 Python 实现 DeepSeek
R1
本地化部署
DeepSeekR1以其出色的表现脱颖而出,不少朋友想将其本地化部署,网上基于ollama的部署方式有很多,但今天我要带你领略一种全新的方法——使用Python实现DeepSeekR1本地化部署,让你轻松掌握,打造属于自己的AI小助手。硬件环境要想让DeepSeekR1顺畅运行,硬件得跟上。你的电脑至少得配备8GB内存,要是想运行更大的模型,比如7B及以上的,那最好有更强劲的CPU和GPU,内存也
喜-喜
·
2025-02-14 18:33
人工智能
python
DeepSeek
transformer
更上层楼!仅用2GB资源,让最火的DeepSeek-R1在本机上奔跑!
现在,
R1
模型可以通过DeepSe
LinkTime_Cloud
·
2025-02-14 03:31
Le Chat 1100tok/s闪电回答,ChatGPT 4o和DeepSeek
R1
被秒杀?
2023年,当全球科技界还在ChatGPT引发的AI狂潮中沉浮时,一场来自欧洲的"静默革命"正悄然改变游戏规则。法国人工智能公司MistralAI推出的聊天机器人LeChat以"比ChatGPT快10倍"的惊人宣言震动业界,其背后承载的不仅是技术突破,更折射出全球AI版图重构的深层暗涌。一、法兰西奇迹:Mistral的逆袭密码在巴黎第十区一栋不起眼的办公楼里,Mistral团队用9个月时间创造了令
LinkTime_Cloud
·
2025-02-14 03:59
chatgpt
DeepSeek
Le
Chat
DeepClaude:结合 DeepSeek
R1
和 Claude AI 各自优势开发的 AI 应用平台,支持 API 调用和零延迟的即时响应
❤️如果你也关注AI的发展现状,且对AI应用开发感兴趣,我会每日分享大模型与AI领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术!微信公众号|搜一搜:蚝油菜花大家好,我是蚝油菜花,今天跟大家分享一下DeepClaude这个高性能的开源AI应用开发平台,深度集成了DeepSeekR1和Claude模型。快速阅读DeepClaude是一个高性能的开源AI应用开发平台,结合了Deep
蚝油菜花
·
2025-02-14 02:25
每日
AI
项目与应用实例
人工智能
人工智能开源
ARM常用汇编语法
指令格式操作指令目的操作数源操作数1、MOV指令MOVR0,
R1
//@表示寄存器
R1
的数据拷贝给R0寄存器MOVR0,#0x10//@表示将立即数0x10赋值给寄存器R0//注:立即数指的是在立即寻址方式指令中给出的源操作数
sjxpf922
·
2025-02-14 01:46
ARM
arm
DeepSeek
R1
:开启AI推理新时代,强在哪里?
DeepSeekR1:开启AI推理新时代阅读时长:19分钟发布时间:2025-02-13近日热文:全网最全的神经网络数学原理(代码和公式)直观解释欢迎关注知乎和公众号的专栏内容LLM架构专栏知乎LLM专栏知乎【柏企】公众号【柏企科技说】【柏企阅文】你是否曾好奇,AI模型是如何学会拆解数学问题,或是一步步解释代码的呢?在过去几年,许多公司开发出了大型语言模型(LLM),它们能创作文章、翻译语言、编写
·
2025-02-13 20:19
人工智能
Python 中调用 DeepSeek API 的方法,一文讲述
通过Python调用DeepSeek的
R1
大模型API,即使没有编程基础也能轻松上手。详见:Python调用DeepSeekAPI(R1&V3)的方法,超详细教程
清尘沐歌
·
2025-02-13 11:05
deepseek
api
Deepseek
今日AI和商界事件(2025-02-05)
今日AI领域的相关事件主要包括以下几个方面:一、DeepSeek引发全球关注性能与成本优势:DeepSeek推出的
R1
模型性能出色,成本较低,在全球AI行业引发震动。
LS_learner
·
2025-02-13 09:51
AI和商界事件
人工智能
如何在VSCode中免费使用DeepSeek
R1
:本地大模型编程助手全攻略
目录一、DeepSeekR1为何值得开发者关注?1.1开源的推理王者1.2性能实测对比二、三步搭建本地AI编程环境2.1硬件准备指南2.2三大部署方案详解方案一:LMStudio(新手友好)方案二:Ollama(Docker玩家首选)方案三:Jan(跨平台利器)2.3常见报错解决方案三、VSCode深度集成实战3.1插件选型建议3.2配置详解(以Cline为例)3.3高效使用技巧四、开发者进阶路线
tamak
·
2025-02-12 19:38
vscode
ide
编辑器
DeepSeek
DeepSeek多模型在帮助中心的实战应用
本文将探讨如何在帮助中心中使用DeepSeek的多种模型,包括基础模型(V3)、深度思考模型(
R1
)和联网搜索模式,以处理不同类型的问题。
·
2025-02-12 17:20
人工智能
在自己电脑上部署deepseek
r1
模型
文章目录在mac电脑上部署在windows电脑上部署一:先下载ollama二:下载部署Deepseek模型三:可视化图文交互界面Chatbox在mac电脑上部署总结:1、目标:类似的GUI界面使用;2、软件选用:ollama、deepseekr1模型、anythingllm;开干:以我的Macbookpro为例安装ollama访问ollama网站https://ollama.com,点击downl
step by step.
·
2025-02-12 14:28
AI
ai
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他