E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
R1
国家超算平台上线DeepSeek -
R1
系列模型:开启AI新征程
2025年初,科技圈发生了一件大事:国家超算平台上线了DeepSeek-R1系列模型。这事儿就像在科技池塘里扔了颗大石头,激起了好大的水花,对人工智能(AI)领域影响深远。一、DeepSeek-R1系列模型究竟啥来头DeepSeek-R1系列模型是DeepSeek这家公司研发的。它用了强化学习训练,推理的时候会反复思考验证,思维链能有好几万字长。在数学、代码编写和复杂逻辑推理这些方面,表现相当厉害
CodeJourney.
·
2025-02-06 08:25
数据库
人工智能
算法
人工智能
快速入门DeepSeek V3和DeepSeek
R1
1.什么是DeepSeek?DeepSeek是一个强大的编码助手应用,通过DeepSeekAPI,可以帮助开发者更高效地处理对话生成、文件操作和代码修改。它能读取本地文件,创建新文件,实时修改已有文件,并将所有内容以结构化的JSON格式返回。如果你不想看下面冗长的介绍,而是想直接copy就用,可以参考下面代码仓库:github.com/XiaomingX/d…如果你觉得不错,欢迎star,fork
奔向理想的星辰大海
·
2025-02-05 20:23
架构
python
语言模型
DeepSeek
R1
技术报告关键解析(5/10):知识蒸馏:如何让小模型也能具备强推理能力?
1.什么是知识蒸馏?知识蒸馏(KnowledgeDistillation)是一种让小模型从大模型学习的技术,类似于一位资深老师将自己的知识浓缩后,传授给学生。大模型通常计算量大、推理速度慢,而小模型虽然计算资源消耗更少,但推理能力往往不如大模型。通过知识蒸馏,小模型可以继承大模型的推理能力,同时保持较低的计算成本。在DeepSeek-R1训练过程中,研究人员通过知识蒸馏,让较小的模型也能具备较强的
董董灿是个攻城狮
·
2025-02-05 19:43
人工智能
计算机视觉
CNN
用 Python 微调 DeepSeek
R1
用Python微调DeepSeekR1阅读时长:15分钟发布时间:2025-02-05近日热文:全网最全的神经网络数学原理(代码和公式)直观解释欢迎关注知乎和公众号的专栏内容LLM架构专栏知乎LLM专栏知乎【柏企】公众号【柏企科技说】【柏企阅文】微调前的准备工作在正式开始微调大语言模型之前,我们先来了解一下技术前提条件和设置要求。Python库和框架微调大语言模型需要用到以下Python库和框架:
·
2025-02-05 13:24
程序员
在LINUX机器上 在线安装DeepSeek
R1
与测试
在线安装Ollama[root@cloud2work]#curl-fsSLhttps://ollama.com/install.sh|sh>>>Installingollamato/usr/local>>>DownloadingLinuxamd64bundle##############################################################87.3%启动O
云道轩
·
2025-02-05 11:13
人工智能
怎么在家用笔记本上轻松部署和使用DeepSeek
R1
?
DeepSeekR1是由国内团队开发的高性能开源大模型。详细介绍可以看这里:[甚至比OpenAI-O1表现更好!我测了DeepSeekR1,结论只有两个字:牛逼!]那本文将介绍其蒸馏版本在普通家用笔记本上的部署和使用,之所以选择蒸馏版本,是因为蒸馏版本通过模型蒸馏技术实现了算力需求的大幅降低。而且在数学、编程等领域表现出众,可处理复杂逻辑推理任务,如果你不了解蒸馏技术文末也会提供相关的拓展知识运行
程序员辣条
·
2025-02-05 10:32
人工智能
LLama
AI产品经理
大模型学习
大模型
DeepSeek
大模型部署
DeepSeek 微调变得简单:使用 Python 创建自定义 AI 模型 学习针对所有用例微调 DeepSeek
R1
模型
简介当每个人都竞相在ChatGPT上构建应用程序时,精明的开发人员正在悄悄发现DeepSeek-R1的微调功能,这是一颗隐藏的宝石,可以将通用人工智能转变为专业的数字专家。通过本文,您将了解如何将通用的DeepSeekR1模型转变为专门的、特定领域的LLM。推荐文章《使用DeepseekZeroCodingExperience创建类似飞扬的小鸟游戏》权重1,DeepSeek《如何在本地电脑上安装和
知识大胖
·
2025-02-04 22:09
NVIDIA
GPU和大语言模型开发教程
python
人工智能
学习
[Windows] DeepSeek
R1
本地部署 web-ui 可以断网
[Windows]DeepSeekR1本地部署web-ui可以断网链接:https://pan.xunlei.com/s/VOIFdto-QAquUn3GE7ecJPpyA1?pwd=uss7#DeepSeekR1来了,追平o1!它现在不但比OpenAI开放,也比它有活力它的功能堪称全能,日常写作、翻译、问答轻松拿捏,独特的“深度思考”模式加上联网搜索,在编程、解题、文献解读等复杂任务里也游刃有余
私人珍藏库
·
2025-02-04 21:35
学习
揭秘DeepSeek
R1
大模型:它如何像人类一样“思考”?
在人工智能领域,大模型正在掀起一场认知革命。从聊天对话到代码生成,从数据分析到创意写作,大模型的能力边界不断被突破。而近期备受关注的DeepSeekR1,凭借更高效的推理能力和更低能耗,成为行业焦点。今天,我们将深入它的“大脑”,看看它是如何工作的!DeepSeek官网:https://www.deepseek.com1.DeepSeekR1的“大脑结构”:Transformer进化版所有大模型的
大模型扬叔
·
2025-02-04 20:00
学习
自然语言处理
prompt
人工智能
hugging
face怎么用
DeepSeek
R1
重塑行业标准:BIM智能审查效率提升300%的实战解密
DeepSeekR1驱动的BIM模型智能审查技术深度解析与实践指南第一章BIM智能审查技术概述建筑信息模型(BIM)的智能化审查是建筑行业数字化转型的核心环节。传统人工审查方式存在效率低、标准不统一、易遗漏等问题,DeepSeekR1框架支持的智能审查系统通过以下技术突破实现革新:多源异构数据融合:支持IFC/RVT/DWG等格式的自动转换语义特征解析引擎:基于深度学习的构件特征识别准确率达98.
Coderabo
·
2025-02-04 20:55
DeepSeek
R1模型企业级应用
人工智能
DeepSeek
R1
赋能智能建造:施工安全风险预判系统全栈开发实战与创新解析
基于DeepSeekR1的智能施工安全风险预判系统构建与实战一、施工安全风险预判技术概述在建筑工程领域,安全风险预判是保障施工人员和财产安全的关键环节。传统的人工巡检方式存在效率低、覆盖面窄、响应滞后等问题。DeepSeekR1智能分析系统通过融合计算机视觉、物联网传感技术和深度学习算法,构建了多维度的风险预警体系。本系统具备以下核心功能:实时视频监控分析(安全装备检测、危险区域入侵识别)设备状态
Coderabo
·
2025-02-04 20:55
DeepSeek
R1模型企业级应用
安全
DeepSeek
R1
赋能全球航运智能化:基于多目标优化的路径规划实战解析
DeepSeekR1赋能全球航运智能化:基于多目标优化的路径规划实战解析引言:航运路径优化的重要性全球贸易90%的货物通过海运完成,每年产生约10亿吨碳排放。传统航线规划依赖船长经验,常导致5-15%的额外燃料消耗。本文基于DeepSeekR1智能系统,提出融合多目标优化的智能路径规划方案,结合实例详解算法实现。问题建模与数学描述优化目标函数minimizeF(x)=[f₁(x),f₂(x),f₃
Coderabo
·
2025-02-04 20:55
DeepSeek
R1模型企业级应用
人工智能
机器学习
算法
python
DeepSeek
R1
AI 论文翻译
摘要原文地址:DeepSeekR1AI论文翻译我们介绍了我们的第一代推理模型,DeepSeek-R1-Zero和DeepSeek-R1。DeepSeek-R1-Zero是一个通过大规模强化学习(RL)训练的模型,且在此过程中未使用监督微调(SFT)作为预处理步骤,展现出了显著的推理能力。通过RL,DeepSeek-R1-Zero自然而然地展现了许多强大且引人注目的推理行为。然而,它也遇到了一些挑战
·
2025-02-04 14:27
后端java
在CentOS服务器上部署DeepSeek
R1
在CentOS服务器上部署DeepSeekR1,并通过公网IP与其进行对话,可以按照以下步骤操作:一、环境准备系统要求:CentOS8+(需支持AVX512指令集)。硬件配置:GPU版本:NVIDIA驱动520+,CUDA11.8+。CPU版本:至少16核处理器,64GB内存。存储空间:原始模型需要30GB,量化后约8-20GB。安装基础工具:更新系统并安装必要的编译工具:一定要买GPU服务器。s
蓝染k9z
·
2025-02-04 09:30
deepseek
服务器
centos
linux
人工智能
deepseek
DeepSeek-
R1
原理介绍
DeepSeek-R1是由DeepSeek公司推出的一款基于强化学习(RL)的开源推理模型,其核心原理和特点如下:1.核心技术与架构强化学习驱动:DeepSeek-R1是首个完全通过强化学习训练的大型语言模型,无需依赖监督微调(SFT)或人工标注数据。它采用组相对策略优化(GRPO)算法,通过奖励机制和规则引导模型生成结构化思维链(CoT),从而提升推理能力。多阶段训练流程:模型采用冷启动阶段、强
kcarly
·
2025-02-04 08:50
大模型知识乱炖
杂谈
DeepSeek
R1
原理介绍
DeepSeek
R1
AI 模型到底牛在哪里?
DeepSeekR1模型的优势原文地址:DeepSeekR1模型的优势最近都说DeepSeekR1模型很牛,到底牛在哪里?卓越的推理能力数学推理:在AIME2024数学竞赛中,DeepSeekR1取得了79.8%的pass@1得分,略微超过OpenAI-o1-1217。在MATH-500基准测试上,它获得了97.3%的高分,与OpenAI-o1-1217的性能相当,并且显著优于其他模型。代码推理:
老马啸西风
·
2025-02-04 06:04
java
DeepSeek
R1
AI 论文翻译
摘要原文地址:DeepSeekR1AI论文翻译我们介绍了我们的第一代推理模型,DeepSeek-R1-Zero和DeepSeek-R1。DeepSeek-R1-Zero是一个通过大规模强化学习(RL)训练的模型,且在此过程中未使用监督微调(SFT)作为预处理步骤,展现出了显著的推理能力。通过RL,DeepSeek-R1-Zero自然而然地展现了许多强大且引人注目的推理行为。然而,它也遇到了一些挑战
老马啸西风
·
2025-02-04 06:04
java
教你本地部署离线DeepSeek
R1
,保姆级教程
最近DeepSeek由于受到大量DDOS攻击,加上访问过热,总是会出现服务器繁忙、无法加载的情况,于是乎我测试在本地电脑部署DeepSeekR1模型,居然测试成功了,而且速度并不比APP慢。下面会讲到部署本地LLM(大模型)需要的软件,以及相应的电脑配置,这里以DeepSeeKR1各种版本为例。软件配置我选择了Ollama作为本地运行LLM的工具,这是一个非常出名的开源软件,Github上有12万
朱卫军 AI
·
2025-02-03 22:35
AI编程
ai
人工智能
python
DeepSeek
R1
AI 论文翻译
摘要原文地址:DeepSeekR1AI论文翻译我们介绍了我们的第一代推理模型,DeepSeek-R1-Zero和DeepSeek-R1。DeepSeek-R1-Zero是一个通过大规模强化学习(RL)训练的模型,且在此过程中未使用监督微调(SFT)作为预处理步骤,展现出了显著的推理能力。通过RL,DeepSeek-R1-Zero自然而然地展现了许多强大且引人注目的推理行为。然而,它也遇到了一些挑战
·
2025-02-03 20:09
后端java
DeepSeek
R1
AI 模型到底牛在哪里?
DeepSeekR1模型的优势原文地址:DeepSeekR1模型的优势最近都说DeepSeekR1模型很牛,到底牛在哪里?卓越的推理能力数学推理:在AIME2024数学竞赛中,DeepSeekR1取得了79.8%的pass@1得分,略微超过OpenAI-o1-1217。在MATH-500基准测试上,它获得了97.3%的高分,与OpenAI-o1-1217的性能相当,并且显著优于其他模型。代码推理:
·
2025-02-03 20:07
后端java
Ollama 部署 DeepSeek -
r1
教程:Windows 与 Linux 篇
在人工智能技术飞速发展的今天,能够在本地部署并使用先进的模型成为许多技术爱好者和专业人士的追求。DeepSeek-r1以其出色的性能备受关注,借助Ollama工具,我们可以方便地在Windows和Linux系统上完成部署。下面就为大家详细介绍具体步骤。一、准备工作在开始部署之前,需要确保已经安装了Ollama。如果尚未安装,请按照以下对应系统的安装方法进行操作。(一)Windows系统安装Olla
Fgaoxing
·
2025-02-03 12:36
windows
linux
人工智能
小南每日 AI 资讯 |美国与日本企业联合投资“星际之门”项目| 罗永浩老师最新初创项目上线! | 25/01/24
以下是近期AI领域的几项重大进展,涵盖技术创新、行业合作以及AI在各个领域的应用:1.AI技术创新与产品发布DeepSeek发布开源模型
R1
,挑战传统开发模式中国初创公司深度求索(DeepSeek)于1
小南AI学院
·
2025-02-03 07:27
人工智能
microsoft
数模测评:doubao1.5>deepseek-v3>gpt-o1
本次测试了当前评价最高的三款大模型doubao1.5、gpt-o1、deepseek-v3(
r1
崩溃),都是采用无提示词的硬核提问方式,测试视频如下。
您好啊数模君
·
2025-02-03 00:29
gpt
数学建模
deepseek
doubao
在Windows下安装Ollama并体验DeepSeek
r1
大模型
在Windows下安装Ollama并体验DeepSeekr1大模型Ollama在Windows下安装Ollama官网:Ollama·GitHub下载Windows版Ollama软件:Releasev0.5.7·ollama/ollama·GitHub下载ollama-windows-amd64.zip这个文件即可。可以说Windows拥抱开源真好,Windows下安装软件简单方便,开源软件直接到G
skywalk8163
·
2025-02-02 22:13
人工智能
windows
ollama
DeepSeek
人工智能
物理测试暴击AI圈,DeepSeek
R1
稳超o1、Claude,我们已进入RL黄金时代
我让
R1
详细解释勾股定理。这一切都是AI在不到30秒时间里一次性完成的,没出任何错。简单来说,its
AI生成曾小健
·
2025-02-02 21:38
LLM大语言模型
人工智能
零门槛在本地解锁DeepSeek
R1
:Ollama+OpenWebUI终极部署手册
纯干货教程,无需GPU也能玩转大模型!三平台通用教程带你20分钟搭建私有AI大脑一、环境准备:Ollama全平台安装指南▍Windows玩家专属通道1.访问Ollama官网下载.exe安装包2.双击安装后自动创建环境变量3.Win+R打开CMD验证安装:ollama--version▍macOS极简操作#一行命令搞定安装curl-fsSLhttps://ollama.ai/install.sh|s
程序员辣条
·
2025-02-02 18:17
人工智能
大模型
LLama
AI产品经理
大模型学习
DeepSeek
大模型教程
DeepThink
R1
本地部署全攻略:零基础小白指南。
离线运行AI,免费使用OpenAI级别推理模型本教程将手把手教你如何在本地部署DeepThinkR1AI模型,让你无需联网就能运行强大的AI推理任务。无论你是AI新手还是资深开发者,都可以轻松上手!目录DeepThinkR1介绍安装Ollama(AI运行环境)下载并安装DeepThinkR1模型在终端运行DeepThinkR1使用Chatbox浏览器UI交互创建你的专属AI伙伴进阶玩法:离线AI编
白马区块Crypto100
·
2025-02-02 14:21
Solana
AI
套利策略交易
人工智能
deepseek
DeepSeek
AI助手
微软为 Copilot+ PC 提供经过提炼的 DeepSeek
R1
模型
今天,微软宣布将
R1
的精简版本引入Copilot+PC。精简模型将首先提供给搭载骁龙X芯片的设备、搭载英特尔酷睿Ultra200V处理器的设备,然后是搭载AMDRy
吴脑的键客
·
2025-02-02 13:47
人工智能
microsoft
copilot
deepseek
R1
14b显存占用
RTX2080ti11G显卡,模型7b速度挺快,试试14B也不错。7B显存使用5.6G,14B显存刚好够,出文字速度差不多。打算自己写个移动宽带的IPTV播放器,不知道怎么下手,就先问他了。
容沁风
·
2025-02-02 09:16
deepseek
rtx2080ti
[250125] DeepSeek 发布开源大模型
R1
,性能比肩 OpenAI o1 | 希捷推出高达 36TB 的硬盘
DeepSeek发布开源大模型
R1
,性能比肩OpenAIo1DeepSeek正式发布了DeepSeek-R1大模型,并同步开源了模型权重,其性能对标OpenAIo1正式版。
x-cmd
·
2025-02-02 09:13
daily
blog
开源
deepseek
llm
openai
ai
硬件
存储
如何使用DeepSeek
R1
以下是如何使用DeepSeekR1的详细步骤:###一、注册DeepSeek账户1.**访问官方网站**:-打开浏览器,访问[chat.deepseek.com](http://chat.deepseek.com)。2.**注册账户**:-使用电子邮件、Google账户或+86手机号码在DeepSeek官方网站上注册一个账户。###二、选择合适的模型1.**登录账户**:-使用注册的账户登录Dee
Loving_enjoy
·
2025-02-02 04:35
实用技巧
人工智能
DeepSeek
R1
Ollama本地化部署全攻略:三步实现企业级私有化大模型部署
前言Ollama作为当前最受欢迎的本地大模型运行框架,为DeepSeekR1的私有化部署提供了便捷高效的解决方案。本文将深入讲解如何将HuggingFace格式的DeepSeekR1模型转换为Ollama支持的GGUF格式,并实现企业级的高可用部署方案。文章包含完整的量化配置、API服务集成和性能优化技巧。—一、基础环境搭建1.1系统环境要求操作系统:Ubuntu22.04LTS或CentOS8+
Coderabo
·
2025-02-02 00:45
DeepSeek
R1
Ollama
DeepSeek
R1
本地化部署与联网功能实战指南:从零搭建智能对话系统
前言在人工智能技术快速发展的今天,如何将先进的对话模型DeepSeekR1部署到本地环境并赋予其联网能力,成为许多开发者和企业关注的重点。本文将深入讲解完整的本地化部署流程,并通过实例代码演示如何为模型添加实时网络访问功能。一、环境准备与基础架构1.1硬件需求推荐配置:NVIDIAGPU(RTX3090或更高)+32GB内存+50GB存储空间最低配置:CPU(支持AVX2指令集)+16GB内存+3
Coderabo
·
2025-02-01 18:32
python
DeepSeek
R1
大模型迎来2025开年大作:deepseek-R1与deepseek-R1-Zero
DeepSeek-R1遵循MITLicense,允许用户通过蒸馏技术借助
R1
训练其他模型。
Funny_AI_LAB
·
2025-02-01 18:02
大模型
人工智能
ai
llama
语言模型
【AI人工智能】DeepSeek
R1
:你需要知道的一切
我们将在本博客中介绍的关于DeepSeekR1的所有你需要知道的一切内容,请坚持认真读完,必有收获:DeepSeekR1简要概述主要特点与能力开源与可访问性模型架构强化学习训练变体与精简模型使用案例与应用从专有模型迁移到开源模型1.DeepSeekR1简要概述大语言模型(LLM)研究领域正在迅速发展,每一个新模型都在推动机器能力的边界。DeepSeekR1是由DeepSeek于2025年1月20日
大名顶顶
·
2025-02-01 17:22
人工智能
人工智能
AI
DeepSeek
程序员
计算机
编程
开源
DeepSeek
R1
简易指南:架构、培训、本地部署和硬件要求
CSS技巧与案例详解vue2与vue3技巧合集VueUse源码解读DeepSeek团队近期发布的DeepSeek-R1技术论文展示了其在增强大语言模型推理能力方面的创新实践。该研究突破性地采用强化学习(ReinforcementLearning)作为核心训练范式,在不依赖大规模监督微调的前提下显著提升了模型的复杂问题求解能力。技术架构深度解析模型体系:DeepSeek-R1系列包含两大核心成员:D
·
2025-02-01 16:49
前端javascript
「DeepSeek接班OpenAI」,最新开源的
R1
推理模型,让AI圈爆了
来源:前沿科技分享圈近日,AI领域迎来了一次重大突破,DeepSeek正式推出了其最新研发的开源推理模型——DeepSeek-R1。这一模型在数学、代码和自然语言推理等关键任务上的表现,已经能够与OpenAI的o1正式版相媲美,引发了AI研究者和从业者的广泛关注。多阶段训练:创新的模型架构DeepSeek-R1的训练方式采用了多阶段循环的策略,具体包括基础训练、强化学习(RL)、微调等多个阶段。这
人工智能学家
·
2025-02-01 06:23
人工智能
DeepSeek
R1
:AI领域的新标杆
标题:DeepSeekR1:AI领域的新标杆文章信息摘要:DeepSeek的
R1
模型在性能上与OpenAI的o1模型相当,甚至在某些方面更具优势,尤其在成本控制上表现出色。
XianxinMao
·
2025-02-01 06:23
人工智能
DeepSeek 推出全新推理模型 R1-Lite 预览版
R1
系列模型采用强化学习训练,推理过程中包含大量反思和验证,思维链长度可达数万字。该系列模型在数学、代码以及各种复杂逻辑推理任务上,取得了媲美o1-preview的推理效果。
三花AI
·
2025-01-31 22:47
三花AI
人工智能
DeepSeek 系列之 无需互联网即可在本地运行 DeepSeek
R1
简介问:想尝试DeepSeekR1吗?问:担心隐私问题?问:更喜欢离线交互,而不需要持续的互联网连接?Ollama和ChatboxAI为您提供保障!推荐文章《如何在本地电脑上安装和使用DeepSeekR-1》权重1,DeepSeek《Nvidia系列之使用NVIDIAIsaacSim和ROS2的命令行控制您的机器人》权重1,NVIDIAIsaacSim《CrewAI教程之07什么是Memory记忆
知识大胖
·
2025-01-31 19:21
NVIDIA
GPU和大语言模型开发教程
deepseek
llama
ollama
知识图谱
DeepSeek
R1
与OpenAI o1深度对比
文章目录引言技术原理DeepSeekR1OpenAIo1性能表现官方数据推理任务知识密集型任务通用能力价格对比应用场景科研与技术开发自然语言处理(NLP)企业智能化升级教育与培训数据分析与智能决策部署与集成DeepSeekR1OpenAIo1伦理考量DeepSeekR1OpenAIo1未来展望DeepSeekR1OpenAIo1引言在科技飞速发展的当下,人工智能领域中的大型语言模型(LLMs)正以
码事漫谈
·
2025-01-31 13:01
AI
人工智能
机器学习
本地部署Deepseek
R1
最近DeepseekR1模型也是彻底火出圈了,但是线上使用经常会受到各种限制,有时候还会连不上,这里我尝试本地部署了Deepseek的开源
R1
模型,具体的操作如下:首先登陆ollama平台,Ollama.ollama
电棍233
·
2025-01-31 11:38
ai
Deepseek两项关键发现:无需人类专家介入SFT、有自己
ARCPrize基金会对DeepSeek发布的R1-Zero和
R1
“推理”系统的分析。ARCPrize基金是谁?ARCPrize基金会旨在定义、衡量并激励新的AGI(通用人工智能)想法。
极道Jdon
·
2025-01-31 08:13
javascript
reactjs
【deepseek】本地部署DeepSeek
R1
模型:使用Ollama打造个人AI助手
一、简介DeepSeekR1是一个强大的开源语言模型,通过Ollama可以轻松实现本地部署。本文将详细介绍如何在本地部署和使用DeepSeekR1模型,并结合PageAssist插件实现更便捷的AI交互体验。二、环境准备硬件要求GPU显存要求:7B模型:8-12GB显存14B模型:12GB以上显存32B模型:建议16GB以上显存建议使用NVIDIA显卡SSD硬盘空间:建议预留50GB以上软件要求安
大表哥汽车人
·
2025-01-31 06:23
人工智能
大语言模型学习笔记
人工智能
deepseek
使用Ollama和Open WebUI快速玩转大模型:简单快捷的尝试各种llm大模型,比如DeepSeek
r1
Ollama本身就是非常优秀的大模型管理和推理组件,再使用OpenWebUI更加如虎添翼!Ollama快速使用指南安装OllamaWindows下安装下载Windows版Ollama软件:Releasev0.5.7·ollama/ollama·GitHub下载ollama-windows-amd64.zip这个文件即可。可以说Windows拥抱开源真好,Windows下安装软件简单方便,开源软件直
skywalk8163
·
2025-01-31 04:38
人工智能
人工智能
ollama
DeepSeek
【DeepSeek】复现DeepSeek
R1
?快来看这个Open
R1
项目实践指南~
OpenR1项目基于DeepSeek-R1的技术报告和方法论,公开并复现
R1
的训练管线,并且希望所有开发者都能在这个基础上搭建自己的研究或应用。
FF-Studio
·
2025-01-30 19:24
DeepSeek
R1
语言模型
自然语言处理
深度学习
人工智能
实战LLM强化学习——使用GRPO(DeepSeek
R1
出圈算法)
——关于使用Unsloth库、LoRa微调及GRPOTrainer自定义奖励函数实现“只输出10个英语单词”的探索为什么要进行“只输出10个英文单词”的极端尝试?在大模型的训练或微调当中,大多数场景我们都希望它能“自由发挥”,给出越丰富越好的答案。但,为了更好的理解强化学习在LLM训练过程中发挥的意义,也为了学习GPRO这个强化学习算法,笔者出此题目,方便大家学习理解。GRPO(GroupRela
FF-Studio
·
2025-01-30 19:54
DeepSeek
R1
算法
语言模型
人工智能
自然语言处理
机器学习
阿里巴巴Qwen团队发布AI模型,可操控PC和手机
订阅:https://rengongzhineng.io/这周,科技界的目光几乎都被DeepSeek的
R1
模型吸引,但阿里巴巴并没有袖手旁观。1月
新加坡内哥谈技术
·
2025-01-30 08:50
人工智能
深度学习
语言模型
学习
Hugging Face挑战DeepSeek,AI开源竞赛升级!
订阅:https://rengongzhineng.io/DeepSeek的
R1
推理模型刚刚引发全球轰动,开源AI界的“顶流”HuggingFac
新加坡内哥谈技术
·
2025-01-30 05:03
人工智能
深度学习
语言模型
学习
火出圈的DeepSeeK
R1
详解
各位宝子们,新年好!模型特性DeepSeek-R1是一款创新的AI推理模型,具有多项独特特性:高性能推理能力:在数学、代码和自然语言推理等任务上表现出色,性能对标OpenAIo1正式版。强化学习驱动的训练:采用大规模强化学习技术,仅需极少量标注数据,显著提升推理能力。长链推理(CoT)支持:思维链长度可达数万字,能逐步分解复杂问题,通过多步骤逻辑推理解决问题。模型蒸馏支持:允许用户利用模型输出训练
清风AI
·
2025-01-29 17:58
深度学习
人工智能
神经网络
python
计算机视觉
conda
上一页
2
3
4
5
6
7
8
9
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他