紫书训练第6页

Matlab GPU加速技术

对于大规模矩阵运算、深度学习训练或科学计算等任务，GPU加速可将计算速度提升数十至数百倍。

算法工程师y·2025-03-17 21:50

pytorch中的DataLoader

它支持数据的批量加载、随机打乱、并行加载和迭代操作，是训练深度学习模型的关键组件之一。1.基本功能DataLoader的主要职责是从数据集中提取样本，并根据设置返回一个批次的数据。

朋也透william·2025-03-17 21:48

pytorch 天花板级别的知识点你可以不会用但是不能不知道

PyTorch的高级知识涵盖了从模型优化到分布式训练的广泛内容，适合已经掌握基础知识的开发者进一步提升技能。

小赖同学啊·2025-03-17 21:17

Pytorch Dataloader入门

/utils/data/dataloader.py#L71PytorchDatasettutorial:tutorials/beginner/basics/data_tutorial.html理论：在训练模型时

gy-7·2025-03-17 21:16

AI如何创作音乐及其案例

AI创作音乐主要有以下几种方式：基于深度学习的生成模型深度神经网络：通过大量的音乐数据训练，让AI学习音乐的结构、旋律、和声、节奏等特征。

alankuo·2025-03-17 21:44

LLM-PowerHouse: 一站式大型语言模型定制训练与推理指南

然而,如何有效地训练和使用这些强大的模型仍然是一个挑战。针对这一需求,GitHub上的LLM-PowerHouse项目应运而生,为开发者、研究人员

Nifc666·2025-03-17 21:43

【sklearn 01】人工智能概述

这是一个非常大的范围，长远目标是让机器实现人工智能，但目前我们仍处在非常初始的阶段，甚至不能称为智能机器学习是指通过数据训练出能完成一定功能的模型，是实现人工智能的手段之一，也是目前最主流的人工智能实现方法深度学习则是机器学习的分支

@金色海岸·2025-03-17 20:41

【sklearn 07】sklearn工艺流程

01数据的获取02数据预处理03特征的提取04特征的选择05模型的训练06模型的评估07模型的优化

@金色海岸·2025-03-17 20:41

第三篇从入门到专业：SQL标准语法详解与高效编码规范指南

（数据操作语言）——"搬家具"2.3DCL（数据控制语言）——"配钥匙"三、SQL书写规范（避免被同事吐槽）3.1基础排版规范3.2注释规范四、新手必看避坑指南4.1常见错误4.2安全操作建议五、实战训练

随缘而动，随遇而安·2025-03-17 20:08

美国首例AI训练数据版权案：从汤森路透诉罗斯案看AI训练数据的“合理使用”

2025年2月11日，美国特拉华州联邦地区法院对汤森路透（ThomsonReuters）诉罗斯（Ross）案作出部分简易判决，认定被告罗斯公司未经授权使用受版权保护的作品训练AI法律检索工具的行为构成版权侵权

·2025-03-17 20:18

21-梯度累积原理与实现

一、基本概念在深度学习训练的时候，数据的batchsize大小受到GPU内存限制，batchsize大小会影响模型最终的准确性和训练过程的性能。

机器人图像处理·2025-03-17 19:34

【人工智能基础2】Tramsformer架构、自然语言处理基础、计算机视觉总结

文章目录七、Transformer架构1.替代LSTM的原因2.Transformer架构：编码器-解码器架构3.Transformer架构原理八、自然语言处理基础1.语言模型基本概念2.向量语义3.预训练语言模型的基本原理与方法

roman_日积跬步-终至千里·2025-03-17 19:59

【AI】使用Python实现机器学习小项目教程

通过这个项目，您将掌握机器学习的基本流程，包括数据加载、预处理、模型训练、评估和优化等步骤。论文AIGC检测，降AIGC检测，AI降重，三连私信免费获取：ReduceAIGC9折券！

丶2136·2025-03-17 18:21

LORA 微调大模型：从入门到入土

在当今人工智能领域，预训练的大模型已经成为推动技术发展的核心力量。然而，在实际项目中，我们往往会发现这些预训练模型虽然强大，但直接就去应用于一些特定的任务时，往往无法完全满足需求。

大模型.·2025-03-17 17:49

【源码阅读】olmocr中的prompts

目录一、PDF转换为训练数据二、使用微调模型三、比较差异总结一、PDF转换为训练数据让ChatGPT-4将文档（如PDF文件）转换为结构化的“银级”训练数据（silvertrainingdata）#Thisisthepromptweuseforgettingchatgpt4otoconvertdocumentsintooursilvertrainingdatadefbuild_openai_sil

海绵波波107·2025-03-17 17:46

GAN模型的Python应用——生成对抗网络

两个神经网络相互博弈，通过一次次迭代训练，最终生成器可以生成足以骗过

代码编织匠人·2025-03-17 17:15

如何使用Python实现生成对抗网络（GAN）

生成器负责生成与训练数据相似的新数据，而判别器负责判断输入数据是真实的还是由生成器生成的。这两个部分不断相互博弈，直到生成器能够生成非常逼真的数据，使判别器难以区分生成数据和真实数据。

「已注销」·2025-03-17 16:13

ST-Align：一个包含430万训练样本，涵盖了15种细粒度多模态数据集

2025-01-15，由北航大学、合肥工业大学、中科院信息工程研究所和美团等机构联合创建介绍了一种名为LLaVA-ST的多模态大型语言模型。该模型配备了一个名为ST-Align的数据集，专为细粒度时空多模态理解设计。一、研究背景近年来，多模态大型语言模型（MLLMs）在多模态理解方面取得了显著进展，能够基于图像或视频生成对话或描述。然而，对于需要基于语言输入处理视觉坐标的细粒度多模态理解任务，现有

·2025-03-17 15:12

s1K 数据集：是一个用于提升语言模型推理能力的高质量数据集。

一、研究背景近年来，语言模型（LMs）在大规模预训练的基础上取得了显著进展，其性能提升主要依赖于训练时计算资源的增加。然而，随着模型规模的不断扩大，训练成本也急剧上升。

·2025-03-17 14:37

ChatGPT智能聊天机器人实现

技术架构与工具核心模型基座模型：HuggingFaceTransformers库（如GPT-2/GPT-3.5TurboAPI/LLaMA2）轻量化方案：微软DeepSpeed或MetaFairScale（降低显存占用）训练框架

云端源想·2025-03-17 14:57

训练数据重复采样，让正负样本比例1：1

确保训练集数量相同：通过resample函数，你可以确保正训练集和负训练集的数量相同，即使其中一个集的数量小于另一个集的数量。如果n_train_num小于max_train_num，res

kimi-222·2025-03-17 14:24

【北上广深杭大厂AI算法面试题】计算机视觉篇...详解目标检测中的多尺度训练和测试?

【北上广深杭大厂AI算法面试题】计算机视觉篇…详解目标检测中的多尺度训练和测试?【北上广深杭大厂AI算法面试题】计算机视觉篇…详解目标检测中的多尺度训练和测试?

努力毕业的小土博^_^·2025-03-17 14:53

当大模型训练遇上“双向飙车”：DeepSeek开源周 DualPipe解析指南

前言在大模型训练中，传统流水线并行因单向数据流和通信延迟的限制，导致GPU利用率不足60%，成为算力瓶颈。

来自于狂人·2025-03-17 13:51

Ollama 基本概念

通过Ollama，用户能够方便地与本地部署的大型预训练模型进行交互。1.模型（Model）在Ollama中，模型是核心组成部分。

Mr_One_Zhang·2025-03-17 13:47

【go从入门到精通】探秘struct结构体转json为什么需要首字母大写？

并且深耕深度学习和数据集训练，提供商业化的视觉人工智能检测和预警系统（煤矿，工厂，制造业

前网易架构师-高司机·2025-03-17 13:47

AI 大模型应用数据中心建设：高性能计算与存储架构

AI大模型、数据中心、高性能计算、存储架构、分布式训练、GPU加速、数据管理1.背景介绍近年来，人工智能（AI）技术取得了飞速发展，特别是深度学习模型的突破性进展，催生了一系列基于大规模数据训练的强大AI

AI智能涌现深度研究·2025-03-17 12:10

Python（1）Python全方位指南：定义、应用与零基础入门实战

跨领域通吃‌：从Web开发到AI训练，覆盖90%以上技术场景。‌企业级应用‌：YouTube用Python处理视频推荐，NAS

一个天蝎座白勺程序猿·2025-03-17 10:31

AI大模型从入门到精通，2025终极指南！好卷啊，又不能躺平，只能悄悄卷你们了！

AI大模型是指使用大规模数据和强大的计算能力训练出来的人工智能模型。这些模型通常具有高度的准确性和泛化能力，可以应用于各种领域，如自然语言处理、图像识别、语音识别等。为什么要学AI大模型？

大模型教程·2025-03-17 10:30

【sklearn 04】DNN、CNN、RNN

DNNDNN（DeepNeuralNetworks，深度神经网络）是一种相对浅层机器学习模型具有更多参数，需要更多数据进行训练的机器学习算法CNNCNN（convolutionalNeuralNetworks

@金色海岸·2025-03-17 09:24

【sklearn 02】监督学习、非监督下学习、强化学习

-第二类：监督学习（supervisedlearning），监督学习指的是使用带标签的数据去训练模型，并预测未知数据的标签。监督学习有两种，当预测

@金色海岸·2025-03-17 09:54

跨域视线估计的协同对比学习（重点针对局部对比学习解释）

跨域视线估计的协同对比学习1.问题表述在视线估计领域中，跨域问题是指当训练数据和测试数据来自不同的领域（如不同的个体、光照条件、拍摄设备等）时，模型性能会显著下降。

阳光明媚大男孩·2025-03-17 09:50

DeepSeek 在代码生成方面的优势解析

文章将详细解析DeepSeek在代码生成方面的优势，包括模型架构、数据训练、优化策略、编程语言支持、推理效率等核心技术点。1.DeepSeek-Coder的模型架构优化DeepSeek-Code

草莓屁屁我不吃·2025-03-17 08:15

DeepSeek-R1模型1.5b、7b、8b、14b、32b、70b和671b有啥区别？

码笔记mabiji.com分享：1.5B、7B、8B、14B、32B、70B是蒸馏后的小模型，671B是基础大模型，它们的区别主要体现在参数规模、模型容量、性能表现、准确性、训练成本、推理成本和不同使用场景

facaixxx2024·2025-03-17 06:01

从零开始大模型开发与微调：PyCharm的下载与安装

PyTorch和TensorFlow等深度学习框架为训练和微调大型语言模型提供了强大的支持。PyCharm

AI天才研究院·2025-03-17 06:55

新手村：数据预处理-特征缩放

特征缩放可以使不同尺度的特征具有相同的量级，从而提高模型训练的效率和性能。常见的特征缩放方法包括标准化（Standardization）和归一化（Normalization）。

嘉羽很烦·2025-03-17 05:20

MindSpore：华为全场景AI框架的技术全景与生态实践

作为华为昇腾AI生态的基石，MindSpore支持端、边、云全场景覆盖，并深度融合昇腾处理器的算力特性，提供从模型开发、训练到推理部署的端到端能力。

彩旗工作室·2025-03-17 05:44

过拟合：机器学习中的“死记硬背”陷阱

它像一把双刃剑：当模型过于“聪明”时，可能会陷入对训练数据的过度依赖，从而失去处理新问题的能力。本文将从原理到实践，深入探讨过拟合的本质及应对策略。1.什么是过拟合？

彩旗工作室·2025-03-17 05:44

Python—JSON格式标签转换为TXT格式标签详细教程2（附完整代码）

这个代码主要是解析一个json文件转换成多个txt文件使用的，尤其是便于yolo训练decode_json函数中的convert函数确实是用于将坐标缩放到0-1之间的。

资源补给站·2025-03-17 01:16

AI技术学习笔记系列001：FastLanguageModel.get_peft_model 函数各参数的详细解释

FastLanguageModel.get_peft_model函数各参数的详细解释，以及企业实际微调时的选择考量：参数详解及对微调的影响1.r=32（秩）作用：控制LoRA适配器的低秩矩阵的维度（秩），直接影响可训练参数数量

新说一二·2025-03-17 00:43

PyTorch 实现 Conditional DCGAN（条件深度卷积生成对抗网络）进行图像到图像转换的示例代码

该代码包含训练和可视化部分，假设输入为图片和4个工艺参数，根据这些输入生成相应的图片。

max500600·2025-03-16 23:04

【人工智能基础2】机器学习、深度学习总结

人工智能关键技术二、机器学习基础1.监督、无监督、半监督学习2.损失函数：四种损失函数3.泛化与交叉验证4.过拟合与欠拟合5.正则化6.支持向量机三、深度学习基础1、概念与原理2、学习方式3、多层神经网络训练方法一

roman_日积跬步-终至千里·2025-03-16 23:02

一文搞懂 AI Agent 与 AI 大模型的区别

Manus：Manus定义与核心能力AI大模型AI大模型是基于深度学习架构，通过海量数据训练得到的复杂模型，像GPT-4、文心一言等。它们具备强大的知识储备和语言理解生成能力，

a小胡哦·2025-03-16 23:02

代码随想录算法训练营第 20 天 | LeetCode235. 二叉搜索树的最近公共祖先 LeetCode701.二叉搜索树中的插入操作 LeetCode 450.删除二叉搜索树中的节点

代码随想录算法训练营Day20代码随想录算法训练营第20天|LeetCode235.二叉搜索树的最近公共祖先LeetCode701.二叉搜索树中的插入操作LeetCode450.删除二叉搜索树中的节点目录代码随想录算法训练营前言

HIT最菜电控·2025-03-16 23:01

一周热点：微软攻克语音输入、文本输出难题-Phi-4-multimodal

它通过创新的架构和训练方法，实现了在不同模态之间的无缝交互，为用户提供更自然、更智能的交互体验。模型架构该模型采用多模态Transformer架构，通过LoRA（

数据分析能量站·2025-03-16 22:57

Adobe Firefly 技术浅析（三）：GANs 的改进

生成式对抗网络（GANs）在图像生成领域取得了显著的进展，但原始的GANs在训练稳定性、生成质量以及多样性方面存在一些挑战。

爱研究的小牛·2025-03-16 21:50

关于stable diffusion的lora训练在linux远程工作站的部署

在学校Arc中部署loratraining，一大问题就是依赖缺失和冲突。可以利用miniconda或者anaconda建立虚拟环境来解决。安装anaconda或者miniconda（官网上也有教程）：wgethttps://repo.anaconda.com/archive/Anaconda3-5.3.0-Linux-x86_64.shchmod+xAnaconda3-5.3.0-Linux-x8

回天一梦·2025-03-16 19:02

新手村：混淆矩阵

《PythonCrashCourse》或在线教程（如Codecademy）scikit-learn基础掌握模型训练、预测、评估的基

嘉羽很烦·2025-03-16 18:28

即插即用模块--KANLinear

在相同迭代次数下超越传统MLP，不仅训练速度更快，收敛性更好，而且在拟合复杂函数时的精度也明显提高。

苏格拉没有鞋底·2025-03-16 17:51

机器学习——正则化、欠拟合、过拟合、学习曲线

过拟合（overfitting）:模型只能拟合训练数据的状态。即过度训练。

代码的建筑师·2025-03-16 17:51

IMWeb提升营Day4 | 训练题19：顺时针打印矩阵

题目描述输入一个矩阵，按照从外向里以顺时针的顺序依次打印出每一个数字，例如，如果输入如下矩阵：12345678910111213141516则依次打印出数字1,2,3,4,8,12,16,15,14,13,9,5,6,7,11,10.12345678910111213141516123456789101112131415161718192021222324252627282930313233343

rical730·2025-03-16 17:19

推荐频道

紫书训练