E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
2018多校联合训练
DeepSeek自监督学习基础与实践
自监督学习(Self-SupervisedLearning,SSL)是一种利用未标注数据进行模型
训练
的技术。
Evaporator Core
·
2025-02-10 23:43
Python开发经验
DeepSeek快速入门
深度学习
学习
机器学习
人工智能
AI 场景下,函数计算 GPU 实例模型存储最佳实践
作者:有松当前,函数计算FC已被广泛应用在各种AI场景下,函数计算支持通过使用容器镜像部署AI推理应用,并且提供多种选项来访问
训练
好的模型。
·
2025-02-10 23:53
云原生
使用U-Net处理Postdam数据集进行语义分割任务 如何从准备数据到
训练
和评估一个基于U-Net的模型。
训练
使用遥感影像分析研究语义分割数据集
使用U-Net处理Postdam数据集进行语义分割任务如何从准备数据到
训练
和评估一个基于U-Net的模型。
计算机C9硕士_算法工程师
·
2025-02-10 22:07
语义分割
unet
AI这么牛,百度股价为什么没上去呀,2020年开始一路跌
AI这么牛,百度股价没上去呀,2020年开始一路跌,实际上从
2018
年开始就不行了。
专注VB编程开发20年
·
2025-02-10 22:05
百度
搜索引擎
AI
计算机科学基础知识入门
1998年1月,“中国计算机学会”与清华大学、中国科学院共同组建的“清华计算机科学技术协会”、“北京计算技术促进中心”(后改称“北京计算智造中心”)
联合
成立了“中国计算机科学技术学会”。
AI天才研究院
·
2025-02-10 19:47
Python实战
自然语言处理
人工智能
语言模型
编程实践
开发语言
架构设计
Neural Radiance Fields (NeRF) 和 3D Gaussian Splatting区别
它通过
训练
一个神经网络来预测给定3D位置和观察
鬼马行天
·
2025-02-10 19:44
深度学习/AIGC
3d
AIGC
“轻松上手!5分钟学会用京东云打造你自己的专属DeepSeek”
\#从第⼀步骤到第四步骤是完成DeepSeek本地部署和使⽤,可以满⾜中⼩企业环境的稳定使⽤,第五步骤为基于AnythingLLM和本地数据进⾏
训练
(基于本地数据搭建本地知识库):⼀:京东云GPU云主机环境准备
·
2025-02-10 18:11
京东云deepseek
深度学习-医学影像诊断
我们将构建一个简单的卷积神经网络(CNN)模型,使用公开的肺炎X光影像数据集进行
训练
和评估。
小赖同学啊
·
2025-02-10 18:37
人工智能
深度学习
人工智能
【AI论文】LIMO:推理中少即是多
传统观点认为,复杂的推理任务需要大量的
训练
数据(超过10万例)。然而,我们证明,令人惊讶的是,仅需极少的示例就能有效激发复杂的数学推理能力。
东临碣石82
·
2025-02-10 16:55
人工智能
2025最新ChatGPT、DeepSeek等大语言模型助力高效办公、论文与项目撰写、数据分析、机器学习与深度学习建模等深度科研应用
这些模型通过深度学习和大规模语料库
训练
,能够帮助科研人员高效地筛选文献、生成论文内容、进行数据分析和优化机器学习模型。
梦想的初衷~
·
2025-02-10 16:53
AI大语言
人工智能
chatgpt
语言模型
数据分析
【资料分享】清华大学《DeepSeek:从入门到精通》官方指南:解锁AI时代的核心生产力工具
由清华大学新闻与传播学院、元宇宙文化实验室
联合
出品的《DeepSeek:从入门到精通》,系统解析了国产开源通用人工智能平台DeepSeek的核心功能与实战技巧。
灵犀拾荒者
·
2025-02-10 16:22
资料分享
人工智能
ai
算法
【洛谷】P4779 单源最短路径(标准版+弱化版) Dijkstra堆优化
题目背景
2018
年7月19日,某位同学在NOIDay1T1归程一题里非常熟练地使用了一个广为人知的算法求最短路。然后呢?
追风者_
·
2025-02-10 15:46
最短路径
队列
洛谷
【果树农药喷洒机器人】Part5:实例分割模型
训练
与试验分析
原创文,转载请注明出处文章目录一、试验环境二、模型
训练
三、试验结果与分析3.1模型结构优化的有效性分析3.2与其他实例分割模型的比较分析总结一、试验环境本章试验在Wind
嵌小超
·
2025-02-10 14:37
AIoT项目实战
机器学习
机器人
人工智能
DeepSpeed 在三台T4卡上部署deepseek-r1:32b
如果你只需要使用DeepSpeed在三台T4卡上部署deepseek-r1:32b模型进行推理,而不进行
训练
,可以按照以下步骤进行部署。推理部署的重点是利用多台机器和多块GPU来加速模型的推理过程。
MonkeyKing.sun
·
2025-02-10 14:33
deepspeed
模型
ProtoBuf 官方文档(二)- 语法指引(proto2)
翻译查阅外网资料过程中遇到的比较优秀的文章和资料,一是作为技术参考以便日后查阅,二是
训练
英文能力。
n大橘为重n
·
2025-02-10 13:27
C++
ProtoBuf
protobuf
rpc
序列化数据结构
《具身智能时代:机器人具身抓取技术的前沿探索与应用综述》
自2022年GPT等大模型的爆发以来,人工智能领域以语言模型为代表的预
训练
模型在多个领域掀起了创新浪潮。
笑傲江湖2023
·
2025-02-10 13:53
机器人
openssl源码编译输出库-guidance-傻瓜式教程
快速链接:.个人博客笔记导读目录(全部)付费专栏-付费课程【购买须知】:密码学实践强化
训练
–【目录】目标:下载openssl源码编译输出目标版本,例如使用AndroidNDK编译输出Android使用的
代码改变世界ctw
·
2025-02-10 13:53
密码学实践强化训练
openssl
命令行
加解密
deepseek和chatgpt能力对比
如果你是对比DeepSeek与OpenAI(如GPT-4)、Claude、Gemini之类的模型,以下是一些可能的优劣点:优点:中文优化较好:相比一些主要基于英文
训练
分享是一种传递,一种快乐
·
2025-02-10 12:51
chatgpt
华为云 + 硅基流动搭建满血版 Deepseek-R1 部署指南
而华为云与硅基流动
联合
推出的基于昇腾云服务的DeepSeekR1推理服务,更是为大家带来了更优的使用体验和部署方案。今天,我就来详细介绍一下如何基于华为云与硅基流动部署满血版Deepseek-R1。
Vincent_Han
·
2025-02-10 12:20
华为云
Deepseek
Python:用sys.stdin和sys.stdout从文件中读写数据
UTF-8"""@version:python3.x@author:曹新健@contact:
[email protected]
@software:PyCharm@file:0925ex.py@time:
2018
书院二层楼
·
2025-02-10 12:50
Python基础知识
Python基础知识
DeepSeek和ChatGPT的优劣或者区别(答案来DeepSeek和ChatGPT)
DeepSeek的答案DeepSeek与ChatGPT作为当前两大主流AI模型,在架构设计、性能表现、应用场景等方面存在显著差异,以下从多个维度进行对比分析:一、架构与
训练
效率架构设计DeepSeek:
笑傲江湖2023
·
2025-02-10 12:45
chatgpt
人工智能
硅基流动与华为云
联合
推出基于昇腾云的DeepSeek R1&;V3推理服务
经过硅基流动和华为云团队连日攻坚,现在,双方
联合
首发并上线基于华为云昇腾云服务的DeepSeekR1/V3推理服务。
光锥智能
·
2025-02-10 12:14
华为云
一切皆是映射:量子机器学习与传统元学习的融合
然而,AI仍然面临着一些瓶颈,例如:数据依赖性:AI模型通常需要大量的
训练
数据才能达到良好的性能,而获取和标注这些数据往往成本高昂。
AI天才研究院
·
2025-02-10 11:41
DeepSeek
R1
&
大数据AI人工智能大模型
AI大模型企业级应用开发实战
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
神经网络的
训练
过程详解
在深度学习领域中,
训练
一个神经网络是一项复杂但系统的工作过程。下面将从基本概念到具体步骤逐步阐述神经网络的
训练
方法一、神经网络的基本概念神经网络的结构输入层:接收外部数据,通常为多维向量。
西洲啊
·
2025-02-10 10:31
AI
神经网络
人工智能
深度学习
使用accumulate step节省显卡内存
使用前提:单卡,模型+batch=1的数据能跑起来使用accumulatestep的意思就是,每次forward较小的batch,如batch=4,每4steps再更新一次参数,
训练
结果等效于batch
前程似锦蝈蝈
·
2025-02-10 09:57
python
机器学习
人工智能
ai大模型学习和实践
1.3以下方法被用于处理序列数据的是1.4注意力机制是什么2、变革里程碑:transformer的崛起2.1Transformer模型和注意力机制的关系2.2Transformer模型和注意力机制在数据
训练
上有差异
编程ID
·
2025-02-10 07:26
AI
人工智能
学习
基于yolo的自定义模型
训练
YOLOv8自定义模型
训练
全流程指南,包含数据准备、标注、
训练
的详细步骤和可视化说明一、数据准备流程图graphTDA[拍摄商品照片]-->B[数据标注]B-->C[划分数据集]C-->D[配置YAML
阿拉斯攀登
·
2025-02-10 06:18
图像处理
机器学习
YOLO
计算机视觉
目标检测
视觉检测
打造智能体育赛事分析:YOLO目标检测系统详解
2.项目目标构建一个能够自动检测体育赛事中的目标的系统实现一个用户友好的UI界面使用YOLOv8/v7/v6/v5模型进行检测提供完整的
训练
数据集二、环境准备
A等天晴
·
2025-02-10 06:17
计算机视觉
YOLO
目标检测
人工智能
人工智能应用-智能驾驶精确的目标检测和更高级的路径规划
1.环境准备首先,确保安装了以下库:pipinstalltensorflowopencv-pythonnumpymatplotlib2.目标检测(使用预
训练
的深度学习模型)目标检测可以使用预
训练
的深度学习模
小赖同学啊
·
2025-02-10 05:41
人工智能
人工智能
目标检测
计算机视觉
【论文精读】《Towards Deep Learning Models Resistant to Adversarial Attacks》
本文的核心贡献包括:1)定义攻击模型和扰动集以优化模型参数;2)强调网络容量对对抗鲁棒性的影响;3)提出对抗
训练
作为提升模型鲁棒性的关键方法。本文为深度学习模型的对抗鲁
智算菩萨
·
2025-02-10 03:25
深度学习
人工智能
大模型学习笔记 - LLM 对齐优化算法 DPO
LLM-DPOLLM-DPODPO概述DPO目标函数推导DPO目标函数梯度的推导DPO概述大模型预
训练
是从大量语料中进行无监督学习,语料库内容混杂,
训练
的目标是语言模型损失,任务是nexttokenprediction
JL_Jessie
·
2025-02-10 03:54
学习
笔记
算法
LLM
自监督的主要学习方法
自监督学习是一种机器学习方法,其中模型从未标注的数据中学习生成标签,通常通过构造预
训练
任务或预测任务来从数据的内部结构中提取信息。
一只波加猹~
·
2025-02-10 03:54
自监督学习
自监督
算力机房选择RoCE还是InfiniBand(IB)
前言超高带宽、超低延迟、超高可靠,这是大模型
训练
对于网络的要求。多年来,TCP/IP协议一直是互联网通信的支柱,但对于AI网络来说,TCP/IP在某些方面存在着致命的缺点。
helpme流水
·
2025-02-10 03:52
人工智能
云计算
开源音乐生成新势力:手把手教你用YuE在EC2创作AI乐曲
但就在上个月,音乐生成领域迎来了一位开源新秀——由MultimodalArtProjection(多模态艺术投影)团队与香港科技大学(HKUST)
联合
研发的YuE(乐·悦)正式开源发布。
因_果_律
·
2025-02-10 02:20
aws
云原生
AI音乐
AIGC
ai
人工智能
开源
AI大模型:一文搞懂大模型文件存储格式新宠GGUF
在日常AI模型
训练
过程中,
训练
好的模型权重通常需要以一种格式存储在磁盘中。
Llama-Turbo
·
2025-02-10 01:37
人工智能
llama
自然语言处理
知识图谱
语言模型
LLM
大模型
亚远景-从SPICE到ASPICE:汽车软件开发的标准化演进
SoftwareProcessImprovementandCapabilitydEtermination”,即“软件流程改进和能力测定”,是由国际标准化组织ISO、国际电工委员会IEC、信息技术委员会JTC1
联合
发起制定的
亚远景aspice
·
2025-02-10 00:04
汽车
一切皆是映射:域适应在DQN中的研究进展与挑战
然而,DRL的成功往往依赖于大量高质量的
训练
数据,而这些数据在现实世界中往往难以获取或成本高昂。这使得DRL的应用受到了很大的限制。域适应(DomainAdaptation)作为迁移学习的一
AI天才研究院
·
2025-02-10 00:33
计算
AI大模型企业级应用开发实战
ChatGPT
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
解决Pytorch的cuDNN error: CUDNN_STATUS_NOT_INITIALIZED
目录1.问题报错2.可能原因2.1GPU内存不足2.2缓存问题2.3CUDA和Pytorch版本不兼容2.4CUDA和cuDNN版本不兼容3.验证CUDA是否可用4.参考1.问题报错在使用GPU加速模型
训练
的过程中经常会遇到这样的错误
Jurio.21
·
2025-02-10 00:31
Python
科研经验
Pytorch
pytorch
人工智能
python
GPU
CUDA
cuDNN
Webpack 5 release版 官方文档全文翻译
Webpack5发行版(2020-10-10)webpack4在
2018
年二月份发行。在那以后我们封装了一些列特性,但是并没有引入破坏性的变化。
广兰路地铁
·
2025-02-09 23:55
长文
webpack
前端
景联文科技:专业数据采集标注公司 ,助力企业提升算法精度!
随着人工智能技术加速落地,高质量数据已成为驱动AI模型
训练
与优化的核心资源。据统计,全球AI数据服务市场规模预计2025年突破200亿美元,其中智能家居、智慧交通、医疗健康等数据需求占比超60%。
景联文科技
·
2025-02-09 23:55
科技
DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning论文解读
文章目录前言一、摘要二、引言三、贡献1.贡献后
训练
:基础模型的大规模强化学习蒸馏:较小的模型也可以很强大2.评估结果概览reasoningtasksknowledgeohters四、方法1.Overview2
tangjunjun-owen
·
2025-02-09 23:54
paper解读
DeepSeek
R1
DeepSeek
zero
大语言模型
多头注意力机制的创新优化:MLA架构解析
MLA通过低秩
联合
压缩技术,将键值对压缩为一个潜在向量,显著减少缓存容量需求,从而优化了推理效率和资源利用。关键词MLA架构,多头注意力,低秩压缩,推理效
耶耶Norsea
·
2025-02-09 23:22
网络杂烩
Deepseek
MoE揭秘
众所周不知,2025年春节爆火的DeepSeek用了MoE架构,本人才疏学浅,想从技术角度深入讲解MoE(混合专家系统)的各个方面,包括数据准备、
训练
、部署、调用时的专家调度、缓存机制等,同时扩展一些相关的技术细节和实际工程中的挑战与解决方案
9命怪猫
·
2025-02-09 23:21
软件架构
AI
人工智能
ai
【Pytorch实战教程】让数据飞轮转起来:PyTorch Dataset与Dataloader深度指南
二、Dataset:数据集的编程接口2.1自定义Dataset三要素2.2实战案例:图像分类数据集三、Dataloader:高效数据流水线3.1核心参数解析3.2数据流可视化3.3多卡
训练
支持四、综合实战
若北辰
·
2025-02-09 21:41
Pytorch实战教程
pytorch
人工智能
python
Day 6 真假美猴王:AI质检的“火眼金睛”与“乌龙大赏”--美的AI质检员一夜“开除”50名老师傅!只因发现肉眼看不见的0.01mm致命气泡!
目录一、血腥开场:微波炉内胆的“隐形杀手”二、死亡案例:AI把工人影子当“缺陷”三、AI质检段位表:从“睁眼瞎”到“钛合金眼”四、乐高教学:3步
训练
“AI质检员”五、装逼话术实战指南六、专业名词扫盲:AI
泛泛不谈
·
2025-02-09 21:39
智能制造暗黑进化史
制造
经验分享
DeepSeek Coder 的
训练
数据集是如何构建的?
DeepSeekCoder的
训练
数据集构建过程涉及多个步骤和策略,其核心目标是确保高质量、多样性和针对性的数据,以支持模型在代码生成和任务完成中的卓越表现。
百态老人
·
2025-02-09 21:09
人工智能
算法
大数据
解锁DeepSeek大模Q型:超实用提示词技巧大放送
DeepSeek大模型简介DeepSeek是由深度求索(DeepSeekInc.)团队开发的大型预
训练
语言模型,以其高效推理、多模态融合及对垂直领域的深度优化而著称。
计算机学长
·
2025-02-09 20:04
通用大语言模型
人工智能
DeepSeek创始人专访:中国的AI不可能永远跟随,需要有人站到技术的前沿
训练
成本估计只有Llama3.1405B模型的11分之一,后者的效果还不如它。
人工智能学家
·
2025-02-09 20:34
人工智能
基于机器学习的DDoS检测系统实战
基于机器学习的DDoS检测系统实战(Python+Scikit-learn)|毕业设计必备摘要:本文手把手教你从0到1实现一个轻量级DDoS攻击检测系统,涵盖数据预处理、特征工程、模型
训练
与可视化分析。
计算机毕业设计指导
·
2025-02-09 19:28
机器学习
ddos
人工智能
创建一个基于YOLOv8+PyQt界面的驾驶员疲劳驾驶检测系统 实现对驾驶员疲劳状态的打哈欠检测,头部下垂 疲劳眼睛检测识别
如何使用Yolov8创建一个基于YOLOv8的驾驶员疲劳驾驶检测系统文章目录1.数据集准备2.安装依赖3.创建PyQt界面4.模型
训练
1.数据集准备2.模型
训练
数据集配置文件(`data.yaml`)
训练
脚本
QQ_767172261
·
2025-02-09 19:54
行为类别睡觉姿态课堂等
YOLO
pyqt
上一页
33
34
35
36
37
38
39
40
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他