E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
记忆训练
一文搞定多种Deepseek R1 部署方法,总有一款适合你
它不仅在数学、编程、自然语言推理等任务上全面对标甚至超越了OpenAI的o1,而且
训练
成本仅
sznormal
·
2025-02-11 04:21
人工智能
JavaScript 高阶
介绍10个高级JavaScript技巧,包括解构赋值、Currying、防抖与节流、
记忆
化、代理对象、生成器、控制台使用、结构化克隆、自执行函数和标记模板字符串,旨在提高开发效率和代码质量。
一只理智恩
·
2025-02-11 04:21
js
javascript
开发语言
ecmascript
DeepSeek R1为什么能
DeepSeekR1模仿人类思考方式的核心在于其纯强化学习
训练
方式,这种方式更接近人类通过试错和反馈来学习的过程。与GPT等传统模型依赖大量标注数据进行监督学习不同,Dee
森焱森
·
2025-02-11 03:48
人工智能
算法
【AI学习】LLM的发展方向
Scalinglaw,以前主要集中在LLM的预
训练
方面。一段时间有个说法,
bylander
·
2025-02-11 03:47
AI学习
人工智能
学习
gpt
【AI学习】DeepSeek为什么强?
四个方面:模型的智能水平、
训练
成本、推理成本和用户体验。一、DeepSeek的智能水平DeepSeekV3的智能水平,技术报告展现的性能对比图:是什么导致了DeepSeek的模型性能,是模型架构吗?
bylander
·
2025-02-11 03:17
AI学习
人工智能
学习
gpt
k折交叉验证(k-fold Cross-validation)
交叉验证,顾名思义,就是重复的使用数据,把得到的样本数据进行切分,组合为不同的
训练
集和测试集,用
训练
集来
训练
模型,用测试集来评估模型预测的好坏。
向大厂出发
·
2025-02-11 03:43
python
开发语言
Kfold交叉验证心得
因为k越大我们验证的次数就越多,最后取出来的平均数越能代表
训练
模型的准确度。但是k是需要在一个限度之内的。k太大有两个坏处。1.容易给机器造成过重负担,花费大量时间。
野营者007
·
2025-02-11 02:41
感想
Machine
Learning
KFold
GEE
训练
教程——基于sentinel-1数据的筛选和可视化操作
rightValue,rightField,leftValue)Arguments:Returns:FilterupdateMask(mask)Arguments:Returns:Image代码解释代码结果简介GEE
训练
教程
此星光明
·
2025-02-11 02:11
GEE教程训练
sentinel
gee
javascript
数据
预处理
筛选
可视化
GEE
训练
教程——基于全球人口数据、夜间灯光数据和sentinel-2数据的可视化
VCMCFG函数ee.Filter.inList(leftField,rightValue,rightField,leftValue)Arguments:Returns:Filter代码解释代码结果简介GEE
训练
教程
此星光明
·
2025-02-11 02:41
GEE教程训练
javascript
gee
sentinel
人口
夜间灯光
数据
可视化
GEE
训练
教程——基于Sentinel-2数据的SAVI 和 NDVI 图层添加到地图上的可视化分析
目录简介指数函数expression(expression,map)Arguments:Returns:Image代码解释代码结果简介GEE
训练
教程——基于Sentinel-2数据的SAVI和NDVI图层添加到地图上的可视化分析指数
此星光明
·
2025-02-11 02:40
GEE教程训练
开发语言
sentinel
gee
savi
ndvi
可视化
教程
【LangChain编程:从入门到实践】构建
记忆
系统
【LangChain编程:从入门到实践】构建
记忆
系统关键词:LangChain,编程范式,
记忆
系统,对话系统,AI,NLP,知识库,推理1.背景介绍在人工智能领域,对话系统的研究与应用已经取得了显著的进展
杭州大厂Java程序媛
·
2025-02-11 01:57
DeepSeek
R1
&
AI人工智能与大数据
java
python
javascript
kotlin
golang
架构
人工智能
RLHF代码解读
参考资料参考资料代码RLHF
训练
流程SFT 将人类打好标签的数据输入到一个预
训练
的模型,进行languagemodeling。
木木木马马
·
2025-02-11 00:25
大模型学习
语言模型
LeetCode-移除元素、删除有序数组中的重复项
LeetCode-移除元素、删除有序数组中的重复项移除元素数组暴力for循环双指针法双指针(快慢指针)双指针优化(对撞指针)【快慢指针】26.删除有序数组中的重复项务必清晰理解
记忆
每个变量、每个函数的定义
Emily_ASL
·
2025-02-11 00:48
python
leetcode
算法
python
大模型入门(六)—— RLHF微调大模型
2)
训练
奖励模型奖励模型是输入一个文本序列,模型给出符合人类偏好的奖励数值,这个奖励数值对于后面的强化学习
训练
非常重要。构建奖励模型的
训练
数据一般是同一个数据用不同的语言模型生成结果,然后人工打分。
LLM.
·
2025-02-10 23:17
人工智能
语言模型
机器学习
自然语言处理
LLM
大模型
RLHF
DeepSeek联邦学习(Federated Learning)基础与实践
联邦学习(FederatedLearning,FL)是一种在分布式环境中
训练
模型的技术,允许多个设备或节点在不共享原始数据的情况下协同
训练
模型。
Evaporator Core
·
2025-02-10 23:44
DeepSeek快速入门
人工智能
深度学习
python
tornado
dash
DeepSeek自监督学习基础与实践
自监督学习(Self-SupervisedLearning,SSL)是一种利用未标注数据进行模型
训练
的技术。
Evaporator Core
·
2025-02-10 23:43
Python开发经验
DeepSeek快速入门
深度学习
学习
机器学习
人工智能
AI 场景下,函数计算 GPU 实例模型存储最佳实践
作者:有松当前,函数计算FC已被广泛应用在各种AI场景下,函数计算支持通过使用容器镜像部署AI推理应用,并且提供多种选项来访问
训练
好的模型。
·
2025-02-10 23:53
云原生
使用U-Net处理Postdam数据集进行语义分割任务 如何从准备数据到
训练
和评估一个基于U-Net的模型。
训练
使用遥感影像分析研究语义分割数据集
使用U-Net处理Postdam数据集进行语义分割任务如何从准备数据到
训练
和评估一个基于U-Net的模型。
计算机C9硕士_算法工程师
·
2025-02-10 22:07
语义分割
unet
Neural Radiance Fields (NeRF) 和 3D Gaussian Splatting区别
它通过
训练
一个神经网络来预测给定3D位置和观察
鬼马行天
·
2025-02-10 19:44
深度学习/AIGC
3d
AIGC
“轻松上手!5分钟学会用京东云打造你自己的专属DeepSeek”
\#从第⼀步骤到第四步骤是完成DeepSeek本地部署和使⽤,可以满⾜中⼩企业环境的稳定使⽤,第五步骤为基于AnythingLLM和本地数据进⾏
训练
(基于本地数据搭建本地知识库):⼀:京东云GPU云主机环境准备
·
2025-02-10 18:11
京东云deepseek
深度学习-医学影像诊断
我们将构建一个简单的卷积神经网络(CNN)模型,使用公开的肺炎X光影像数据集进行
训练
和评估。
小赖同学啊
·
2025-02-10 18:37
人工智能
深度学习
人工智能
【AI论文】LIMO:推理中少即是多
传统观点认为,复杂的推理任务需要大量的
训练
数据(超过10万例)。然而,我们证明,令人惊讶的是,仅需极少的示例就能有效激发复杂的数学推理能力。
东临碣石82
·
2025-02-10 16:55
人工智能
力扣周赛:第419场周赛
第三题后面补题自己AC了,第三个居然是个hard题,居然暴力+
记忆
化就AC了。第四题不会做,面试机试也不会考这么难的,第四题就不补了。
布布要成为最强的人
·
2025-02-10 16:24
力扣
测试专栏
leetcode
算法
java
lambda
数据结构
2025最新ChatGPT、DeepSeek等大语言模型助力高效办公、论文与项目撰写、数据分析、机器学习与深度学习建模等深度科研应用
这些模型通过深度学习和大规模语料库
训练
,能够帮助科研人员高效地筛选文献、生成论文内容、进行数据分析和优化机器学习模型。
梦想的初衷~
·
2025-02-10 16:53
AI大语言
人工智能
chatgpt
语言模型
数据分析
【资料分享】清华大学《DeepSeek:从入门到精通》官方指南:解锁AI时代的核心生产力工具
这份104页的指南不仅是一本工具手册,更是一部AI思维
训练
指南,涵盖从基础操作到高阶提示语设计
灵犀拾荒者
·
2025-02-10 16:22
资料分享
人工智能
ai
算法
【果树农药喷洒机器人】Part5:实例分割模型
训练
与试验分析
原创文,转载请注明出处文章目录一、试验环境二、模型
训练
三、试验结果与分析3.1模型结构优化的有效性分析3.2与其他实例分割模型的比较分析总结一、试验环境本章试验在Wind
嵌小超
·
2025-02-10 14:37
AIoT项目实战
机器学习
机器人
人工智能
DeepSpeed 在三台T4卡上部署deepseek-r1:32b
如果你只需要使用DeepSpeed在三台T4卡上部署deepseek-r1:32b模型进行推理,而不进行
训练
,可以按照以下步骤进行部署。推理部署的重点是利用多台机器和多块GPU来加速模型的推理过程。
MonkeyKing.sun
·
2025-02-10 14:33
deepspeed
模型
ProtoBuf 官方文档(二)- 语法指引(proto2)
翻译查阅外网资料过程中遇到的比较优秀的文章和资料,一是作为技术参考以便日后查阅,二是
训练
英文能力。
n大橘为重n
·
2025-02-10 13:27
C++
ProtoBuf
protobuf
rpc
序列化数据结构
《具身智能时代:机器人具身抓取技术的前沿探索与应用综述》
自2022年GPT等大模型的爆发以来,人工智能领域以语言模型为代表的预
训练
模型在多个领域掀起了创新浪潮。
笑傲江湖2023
·
2025-02-10 13:53
机器人
openssl源码编译输出库-guidance-傻瓜式教程
快速链接:.个人博客笔记导读目录(全部)付费专栏-付费课程【购买须知】:密码学实践强化
训练
–【目录】目标:下载openssl源码编译输出目标版本,例如使用AndroidNDK编译输出Android使用的
代码改变世界ctw
·
2025-02-10 13:53
密码学实践强化训练
openssl
命令行
加解密
deepseek和chatgpt能力对比
如果你是对比DeepSeek与OpenAI(如GPT-4)、Claude、Gemini之类的模型,以下是一些可能的优劣点:优点:中文优化较好:相比一些主要基于英文
训练
分享是一种传递,一种快乐
·
2025-02-10 12:51
chatgpt
DeepSeek和ChatGPT的优劣或者区别(答案来DeepSeek和ChatGPT)
DeepSeek的答案DeepSeek与ChatGPT作为当前两大主流AI模型,在架构设计、性能表现、应用场景等方面存在显著差异,以下从多个维度进行对比分析:一、架构与
训练
效率架构设计DeepSeek:
笑傲江湖2023
·
2025-02-10 12:45
chatgpt
人工智能
一切皆是映射:量子机器学习与传统元学习的融合
然而,AI仍然面临着一些瓶颈,例如:数据依赖性:AI模型通常需要大量的
训练
数据才能达到良好的性能,而获取和标注这些数据往往成本高昂。
AI天才研究院
·
2025-02-10 11:41
DeepSeek
R1
&
大数据AI人工智能大模型
AI大模型企业级应用开发实战
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
Pennylane学习笔记(1)-学习目标
前言学习语言的过程中,需要不断地回顾和练习,加深
记忆
,从而融会贯通。
叶非花
·
2025-02-10 11:41
Pennylane编程系列
学习
神经网络的
训练
过程详解
在深度学习领域中,
训练
一个神经网络是一项复杂但系统的工作过程。下面将从基本概念到具体步骤逐步阐述神经网络的
训练
方法一、神经网络的基本概念神经网络的结构输入层:接收外部数据,通常为多维向量。
西洲啊
·
2025-02-10 10:31
AI
神经网络
人工智能
深度学习
使用accumulate step节省显卡内存
使用前提:单卡,模型+batch=1的数据能跑起来使用accumulatestep的意思就是,每次forward较小的batch,如batch=4,每4steps再更新一次参数,
训练
结果等效于batch
前程似锦蝈蝈
·
2025-02-10 09:57
python
机器学习
人工智能
从小白开始的动态规划
一、动态规划的核心思想动态规划(DP)通过拆分问题+
记忆
化计算解决复杂问题,核心步骤为:定义状态:用变量(如dp[i])表示子问题的解状态转移方程:建立子问题之间的关系式初始化:确定基础情况的初始值计算顺序
不想编程小谭
·
2025-02-10 07:58
算法
c++
算法
动态规划
ai大模型学习和实践
1.3以下方法被用于处理序列数据的是1.4注意力机制是什么2、变革里程碑:transformer的崛起2.1Transformer模型和注意力机制的关系2.2Transformer模型和注意力机制在数据
训练
上有差异
编程ID
·
2025-02-10 07:26
AI
人工智能
学习
基于yolo的自定义模型
训练
YOLOv8自定义模型
训练
全流程指南,包含数据准备、标注、
训练
的详细步骤和可视化说明一、数据准备流程图graphTDA[拍摄商品照片]-->B[数据标注]B-->C[划分数据集]C-->D[配置YAML
阿拉斯攀登
·
2025-02-10 06:18
图像处理
机器学习
YOLO
计算机视觉
目标检测
视觉检测
打造智能体育赛事分析:YOLO目标检测系统详解
2.项目目标构建一个能够自动检测体育赛事中的目标的系统实现一个用户友好的UI界面使用YOLOv8/v7/v6/v5模型进行检测提供完整的
训练
数据集二、环境准备
A等天晴
·
2025-02-10 06:17
计算机视觉
YOLO
目标检测
人工智能
人工智能应用-智能驾驶精确的目标检测和更高级的路径规划
1.环境准备首先,确保安装了以下库:pipinstalltensorflowopencv-pythonnumpymatplotlib2.目标检测(使用预
训练
的深度学习模型)目标检测可以使用预
训练
的深度学习模
小赖同学啊
·
2025-02-10 05:41
人工智能
人工智能
目标检测
计算机视觉
【论文精读】《Towards Deep Learning Models Resistant to Adversarial Attacks》
本文的核心贡献包括:1)定义攻击模型和扰动集以优化模型参数;2)强调网络容量对对抗鲁棒性的影响;3)提出对抗
训练
作为提升模型鲁棒性的关键方法。本文为深度学习模型的对抗鲁
智算菩萨
·
2025-02-10 03:25
深度学习
人工智能
大模型学习笔记 - LLM 对齐优化算法 DPO
LLM-DPOLLM-DPODPO概述DPO目标函数推导DPO目标函数梯度的推导DPO概述大模型预
训练
是从大量语料中进行无监督学习,语料库内容混杂,
训练
的目标是语言模型损失,任务是nexttokenprediction
JL_Jessie
·
2025-02-10 03:54
学习
笔记
算法
LLM
自监督的主要学习方法
自监督学习是一种机器学习方法,其中模型从未标注的数据中学习生成标签,通常通过构造预
训练
任务或预测任务来从数据的内部结构中提取信息。
一只波加猹~
·
2025-02-10 03:54
自监督学习
自监督
算力机房选择RoCE还是InfiniBand(IB)
前言超高带宽、超低延迟、超高可靠,这是大模型
训练
对于网络的要求。多年来,TCP/IP协议一直是互联网通信的支柱,但对于AI网络来说,TCP/IP在某些方面存在着致命的缺点。
helpme流水
·
2025-02-10 03:52
人工智能
云计算
AI大模型:一文搞懂大模型文件存储格式新宠GGUF
在日常AI模型
训练
过程中,
训练
好的模型权重通常需要以一种格式存储在磁盘中。
Llama-Turbo
·
2025-02-10 01:37
人工智能
llama
自然语言处理
知识图谱
语言模型
LLM
大模型
一切皆是映射:域适应在DQN中的研究进展与挑战
然而,DRL的成功往往依赖于大量高质量的
训练
数据,而这些数据在现实世界中往往难以获取或成本高昂。这使得DRL的应用受到了很大的限制。域适应(DomainAdaptation)作为迁移学习的一
AI天才研究院
·
2025-02-10 00:33
计算
AI大模型企业级应用开发实战
ChatGPT
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
解决Pytorch的cuDNN error: CUDNN_STATUS_NOT_INITIALIZED
目录1.问题报错2.可能原因2.1GPU内存不足2.2缓存问题2.3CUDA和Pytorch版本不兼容2.4CUDA和cuDNN版本不兼容3.验证CUDA是否可用4.参考1.问题报错在使用GPU加速模型
训练
的过程中经常会遇到这样的错误
Jurio.21
·
2025-02-10 00:31
Python
科研经验
Pytorch
pytorch
人工智能
python
GPU
CUDA
cuDNN
景联文科技:专业数据采集标注公司 ,助力企业提升算法精度!
随着人工智能技术加速落地,高质量数据已成为驱动AI模型
训练
与优化的核心资源。据统计,全球AI数据服务市场规模预计2025年突破200亿美元,其中智能家居、智慧交通、医疗健康等数据需求占比超60%。
景联文科技
·
2025-02-09 23:55
科技
DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning论文解读
文章目录前言一、摘要二、引言三、贡献1.贡献后
训练
:基础模型的大规模强化学习蒸馏:较小的模型也可以很强大2.评估结果概览reasoningtasksknowledgeohters四、方法1.Overview2
tangjunjun-owen
·
2025-02-09 23:54
paper解读
DeepSeek
R1
DeepSeek
zero
大语言模型
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他