2018多校联合训练第37页

DeepSeek自监督学习基础与实践

自监督学习（Self-SupervisedLearning,SSL）是一种利用未标注数据进行模型训练的技术。

Evaporator Core·2025-02-10 23:43

AI 场景下，函数计算 GPU 实例模型存储最佳实践

作者：有松当前，函数计算FC已被广泛应用在各种AI场景下，函数计算支持通过使用容器镜像部署AI推理应用，并且提供多种选项来访问训练好的模型。

·2025-02-10 23:53

使用U-Net处理Postdam数据集进行语义分割任务如何从准备数据到训练和评估一个基于U-Net的模型。训练使用遥感影像分析研究语义分割数据集

使用U-Net处理Postdam数据集进行语义分割任务如何从准备数据到训练和评估一个基于U-Net的模型。

计算机C9硕士_算法工程师·2025-02-10 22:07

AI这么牛，百度股价为什么没上去呀，2020年开始一路跌

AI这么牛，百度股价没上去呀，2020年开始一路跌，实际上从2018年开始就不行了。

专注VB编程开发20年·2025-02-10 22:05

计算机科学基础知识入门

1998年1月，“中国计算机学会”与清华大学、中国科学院共同组建的“清华计算机科学技术协会”、“北京计算技术促进中心”（后改称“北京计算智造中心”）联合成立了“中国计算机科学技术学会”。

AI天才研究院·2025-02-10 19:47

Neural Radiance Fields (NeRF) 和 3D Gaussian Splatting区别

它通过训练一个神经网络来预测给定3D位置和观察

鬼马行天·2025-02-10 19:44

“轻松上手！5分钟学会用京东云打造你自己的专属DeepSeek”

\#从第⼀步骤到第四步骤是完成DeepSeek本地部署和使⽤,可以满⾜中⼩企业环境的稳定使⽤,第五步骤为基于AnythingLLM和本地数据进⾏训练(基于本地数据搭建本地知识库):⼀：京东云GPU云主机环境准备

·2025-02-10 18:11

深度学习-医学影像诊断

我们将构建一个简单的卷积神经网络（CNN）模型，使用公开的肺炎X光影像数据集进行训练和评估。

小赖同学啊·2025-02-10 18:37

【AI论文】LIMO：推理中少即是多

传统观点认为，复杂的推理任务需要大量的训练数据（超过10万例）。然而，我们证明，令人惊讶的是，仅需极少的示例就能有效激发复杂的数学推理能力。

东临碣石82·2025-02-10 16:55

2025最新ChatGPT、DeepSeek等大语言模型助力高效办公、论文与项目撰写、数据分析、机器学习与深度学习建模等深度科研应用

这些模型通过深度学习和大规模语料库训练，能够帮助科研人员高效地筛选文献、生成论文内容、进行数据分析和优化机器学习模型。

梦想的初衷~·2025-02-10 16:53

【资料分享】清华大学《DeepSeek：从入门到精通》官方指南：解锁AI时代的核心生产力工具

由清华大学新闻与传播学院、元宇宙文化实验室联合出品的《DeepSeek：从入门到精通》，系统解析了国产开源通用人工智能平台DeepSeek的核心功能与实战技巧。

灵犀拾荒者·2025-02-10 16:22

【洛谷】P4779 单源最短路径（标准版+弱化版） Dijkstra堆优化

题目背景2018年7月19日，某位同学在NOIDay1T1归程一题里非常熟练地使用了一个广为人知的算法求最短路。然后呢？

追风者_·2025-02-10 15:46

【果树农药喷洒机器人】Part5：实例分割模型训练与试验分析

原创文，转载请注明出处文章目录一、试验环境二、模型训练三、试验结果与分析3.1模型结构优化的有效性分析3.2与其他实例分割模型的比较分析总结一、试验环境本章试验在Wind

嵌小超·2025-02-10 14:37

DeepSpeed 在三台T4卡上部署deepseek-r1:32b

如果你只需要使用DeepSpeed在三台T4卡上部署deepseek-r1:32b模型进行推理，而不进行训练，可以按照以下步骤进行部署。推理部署的重点是利用多台机器和多块GPU来加速模型的推理过程。

MonkeyKing.sun·2025-02-10 14:33

ProtoBuf 官方文档（二）- 语法指引（proto2）

翻译查阅外网资料过程中遇到的比较优秀的文章和资料，一是作为技术参考以便日后查阅，二是训练英文能力。

n大橘为重n·2025-02-10 13:27

《具身智能时代：机器人具身抓取技术的前沿探索与应用综述》

自2022年GPT等大模型的爆发以来，人工智能领域以语言模型为代表的预训练模型在多个领域掀起了创新浪潮。

笑傲江湖2023·2025-02-10 13:53

openssl源码编译输出库-guidance-傻瓜式教程

快速链接:.个人博客笔记导读目录(全部)付费专栏-付费课程【购买须知】:密码学实践强化训练–【目录】目标：下载openssl源码编译输出目标版本，例如使用AndroidNDK编译输出Android使用的

代码改变世界ctw·2025-02-10 13:53

deepseek和chatgpt能力对比

如果你是对比DeepSeek与OpenAI（如GPT-4）、Claude、Gemini之类的模型，以下是一些可能的优劣点：优点：中文优化较好：相比一些主要基于英文训练

分享是一种传递，一种快乐·2025-02-10 12:51

华为云 + 硅基流动搭建满血版 Deepseek-R1 部署指南

而华为云与硅基流动联合推出的基于昇腾云服务的DeepSeekR1推理服务，更是为大家带来了更优的使用体验和部署方案。今天，我就来详细介绍一下如何基于华为云与硅基流动部署满血版Deepseek-R1。

Vincent_Han·2025-02-10 12:20

Python：用sys.stdin和sys.stdout从文件中读写数据

UTF-8"""@version:python3.x@author:曹新健@contact:[email protected]@software:PyCharm@file:0925ex.py@time:2018

书院二层楼·2025-02-10 12:50

DeepSeek和ChatGPT的优劣或者区别（答案来DeepSeek和ChatGPT）

DeepSeek的答案DeepSeek与ChatGPT作为当前两大主流AI模型，在架构设计、性能表现、应用场景等方面存在显著差异，以下从多个维度进行对比分析：一、架构与训练效率架构设计DeepSeek：

笑傲江湖2023·2025-02-10 12:45

硅基流动与华为云联合推出基于昇腾云的DeepSeek R1&；V3推理服务

经过硅基流动和华为云团队连日攻坚，现在，双方联合首发并上线基于华为云昇腾云服务的DeepSeekR1/V3推理服务。

光锥智能·2025-02-10 12:14

一切皆是映射：量子机器学习与传统元学习的融合

然而，AI仍然面临着一些瓶颈，例如：数据依赖性:AI模型通常需要大量的训练数据才能达到良好的性能，而获取和标注这些数据往往成本高昂。

AI天才研究院·2025-02-10 11:41

神经网络的训练过程详解

在深度学习领域中，训练一个神经网络是一项复杂但系统的工作过程。下面将从基本概念到具体步骤逐步阐述神经网络的训练方法一、神经网络的基本概念神经网络的结构输入层：接收外部数据，通常为多维向量。

西洲啊·2025-02-10 10:31

使用accumulate step节省显卡内存

使用前提：单卡，模型+batch=1的数据能跑起来使用accumulatestep的意思就是，每次forward较小的batch，如batch=4，每4steps再更新一次参数，训练结果等效于batch

前程似锦蝈蝈·2025-02-10 09:57

ai大模型学习和实践

1.3以下方法被用于处理序列数据的是1.4注意力机制是什么2、变革里程碑：transformer的崛起2.1Transformer模型和注意力机制的关系2.2Transformer模型和注意力机制在数据训练上有差异

编程ID·2025-02-10 07:26

基于yolo的自定义模型训练

YOLOv8自定义模型训练全流程指南，包含数据准备、标注、训练的详细步骤和可视化说明一、数据准备流程图graphTDA[拍摄商品照片]-->B[数据标注]B-->C[划分数据集]C-->D[配置YAML

阿拉斯攀登·2025-02-10 06:18

打造智能体育赛事分析：YOLO目标检测系统详解

2.项目目标构建一个能够自动检测体育赛事中的目标的系统实现一个用户友好的UI界面使用YOLOv8/v7/v6/v5模型进行检测提供完整的训练数据集二、环境准备

A等天晴·2025-02-10 06:17

人工智能应用-智能驾驶精确的目标检测和更高级的路径规划

1.环境准备首先，确保安装了以下库：pipinstalltensorflowopencv-pythonnumpymatplotlib2.目标检测（使用预训练的深度学习模型）目标检测可以使用预训练的深度学习模

小赖同学啊·2025-02-10 05:41

【论文精读】《Towards Deep Learning Models Resistant to Adversarial Attacks》

本文的核心贡献包括：1）定义攻击模型和扰动集以优化模型参数；2）强调网络容量对对抗鲁棒性的影响；3）提出对抗训练作为提升模型鲁棒性的关键方法。本文为深度学习模型的对抗鲁

智算菩萨·2025-02-10 03:25

大模型学习笔记 - LLM 对齐优化算法 DPO

LLM-DPOLLM-DPODPO概述DPO目标函数推导DPO目标函数梯度的推导DPO概述大模型预训练是从大量语料中进行无监督学习，语料库内容混杂，训练的目标是语言模型损失，任务是nexttokenprediction

JL_Jessie·2025-02-10 03:54

自监督的主要学习方法

自监督学习是一种机器学习方法，其中模型从未标注的数据中学习生成标签，通常通过构造预训练任务或预测任务来从数据的内部结构中提取信息。

一只波加猹~·2025-02-10 03:54

算力机房选择RoCE还是InfiniBand（IB）

前言超高带宽、超低延迟、超高可靠，这是大模型训练对于网络的要求。多年来，TCP/IP协议一直是互联网通信的支柱，但对于AI网络来说，TCP/IP在某些方面存在着致命的缺点。

helpme流水·2025-02-10 03:52

开源音乐生成新势力：手把手教你用YuE在EC2创作AI乐曲

但就在上个月，音乐生成领域迎来了一位开源新秀——由MultimodalArtProjection（多模态艺术投影）团队与香港科技大学（HKUST）联合研发的YuE（乐·悦）正式开源发布。

因_果_律·2025-02-10 02:20

AI大模型：一文搞懂大模型文件存储格式新宠GGUF

在日常AI模型训练过程中，训练好的模型权重通常需要以一种格式存储在磁盘中。

Llama-Turbo·2025-02-10 01:37

亚远景-从SPICE到ASPICE：汽车软件开发的标准化演进

SoftwareProcessImprovementandCapabilitydEtermination”，即“软件流程改进和能力测定”，是由国际标准化组织ISO、国际电工委员会IEC、信息技术委员会JTC1联合发起制定的

亚远景aspice·2025-02-10 00:04

一切皆是映射：域适应在DQN中的研究进展与挑战

然而，DRL的成功往往依赖于大量高质量的训练数据，而这些数据在现实世界中往往难以获取或成本高昂。这使得DRL的应用受到了很大的限制。域适应(DomainAdaptation)作为迁移学习的一

AI天才研究院·2025-02-10 00:33

解决Pytorch的cuDNN error: CUDNN_STATUS_NOT_INITIALIZED

目录1.问题报错2.可能原因2.1GPU内存不足2.2缓存问题2.3CUDA和Pytorch版本不兼容2.4CUDA和cuDNN版本不兼容3.验证CUDA是否可用4.参考1.问题报错在使用GPU加速模型训练的过程中经常会遇到这样的错误

Jurio.21·2025-02-10 00:31

Webpack 5 release版官方文档全文翻译

Webpack5发行版(2020-10-10)webpack4在2018年二月份发行。在那以后我们封装了一些列特性，但是并没有引入破坏性的变化。

广兰路地铁·2025-02-09 23:55

景联文科技：专业数据采集标注公司，助力企业提升算法精度！

随着人工智能技术加速落地，高质量数据已成为驱动AI模型训练与优化的核心资源。据统计，全球AI数据服务市场规模预计2025年突破200亿美元，其中智能家居、智慧交通、医疗健康等数据需求占比超60%。

景联文科技·2025-02-09 23:55

DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning论文解读

文章目录前言一、摘要二、引言三、贡献1.贡献后训练：基础模型的大规模强化学习蒸馏：较小的模型也可以很强大2.评估结果概览reasoningtasksknowledgeohters四、方法1.Overview2

tangjunjun-owen·2025-02-09 23:54

多头注意力机制的创新优化：MLA架构解析

MLA通过低秩联合压缩技术，将键值对压缩为一个潜在向量，显著减少缓存容量需求，从而优化了推理效率和资源利用。关键词MLA架构,多头注意力,低秩压缩,推理效

耶耶Norsea·2025-02-09 23:22

MoE揭秘

众所周不知，2025年春节爆火的DeepSeek用了MoE架构，本人才疏学浅，想从技术角度深入讲解MoE（混合专家系统）的各个方面，包括数据准备、训练、部署、调用时的专家调度、缓存机制等，同时扩展一些相关的技术细节和实际工程中的挑战与解决方案

9命怪猫·2025-02-09 23:21

【Pytorch实战教程】让数据飞轮转起来：PyTorch Dataset与Dataloader深度指南

二、Dataset：数据集的编程接口2.1自定义Dataset三要素2.2实战案例：图像分类数据集三、Dataloader：高效数据流水线3.1核心参数解析3.2数据流可视化3.3多卡训练支持四、综合实战

若北辰·2025-02-09 21:41

Day 6 真假美猴王：AI质检的“火眼金睛”与“乌龙大赏”--美的AI质检员一夜“开除”50名老师傅！只因发现肉眼看不见的0.01mm致命气泡！

目录一、血腥开场：微波炉内胆的“隐形杀手”二、死亡案例：AI把工人影子当“缺陷”三、AI质检段位表：从“睁眼瞎”到“钛合金眼”四、乐高教学：3步训练“AI质检员”五、装逼话术实战指南六、专业名词扫盲：AI

泛泛不谈·2025-02-09 21:39

DeepSeek Coder 的训练数据集是如何构建的？

DeepSeekCoder的训练数据集构建过程涉及多个步骤和策略，其核心目标是确保高质量、多样性和针对性的数据，以支持模型在代码生成和任务完成中的卓越表现。

百态老人·2025-02-09 21:09

解锁DeepSeek大模Q型：超实用提示词技巧大放送

DeepSeek大模型简介DeepSeek是由深度求索(DeepSeekInc.)团队开发的大型预训练语言模型，以其高效推理、多模态融合及对垂直领域的深度优化而著称。

计算机学长·2025-02-09 20:04

DeepSeek创始人专访：中国的AI不可能永远跟随，需要有人站到技术的前沿

训练成本估计只有Llama3.1405B模型的11分之一，后者的效果还不如它。

人工智能学家·2025-02-09 20:34

基于机器学习的DDoS检测系统实战

基于机器学习的DDoS检测系统实战（Python+Scikit-learn）｜毕业设计必备摘要：本文手把手教你从0到1实现一个轻量级DDoS攻击检测系统，涵盖数据预处理、特征工程、模型训练与可视化分析。

计算机毕业设计指导·2025-02-09 19:28

创建一个基于YOLOv8+PyQt界面的驾驶员疲劳驾驶检测系统实现对驾驶员疲劳状态的打哈欠检测，头部下垂疲劳眼睛检测识别

如何使用Yolov8创建一个基于YOLOv8的驾驶员疲劳驾驶检测系统文章目录1.数据集准备2.安装依赖3.创建PyQt界面4.模型训练1.数据集准备2.模型训练数据集配置文件(`data.yaml`)训练脚本

QQ_767172261·2025-02-09 19:54

推荐频道

2018多校联合训练