GMM训练第2页

【动手学深度学习】4.10 实战Kaggle比赛：预测房价

目录4.10实战Kaggle比赛：预测房价1）数据预处理2）模型定义与训练3）模型评估与预测4）模型训练与预测提交5）示例超参数（可调）4.10实战Kaggle比赛：预测房价数据来源：Kaggle房价预测比赛

XiaoJ1234567·2025-07-10 18:07

大型语言模型中的提示工程系统综述：技术与应用

与更新模型参数不同，prompt仅通过给定指令即可引出所需的模型行为，从而实现预训练模型在下游任务中的无缝集成。

AI专题精讲·2025-07-10 17:33

神经网络初步学习3——数据与损失

区别这里不妨以图像识别为例子：（1）在传统的机器学习视角中：我们需要人工手动去设置并提取我们的特征量，例如常见的SIFT、SURF和HOG等，随后需要我们选择合适的分类器（例如：SVM、KNN等分类器）,接着把我们的参数训练出来

X Y O·2025-07-10 12:33

【目标检测】Yolov7 的 ELAN 和 E-ELAN 模块演进（涉及到分组卷积，cardinality，梯度路径）

YOLOv7的工作：新的bagoffreebies（有效的训练技巧，不会增加推理的计算量）有规划的重参数化模型（不同边缘设备架构，不同的重参数化方法）新的动态标签分配方法为了更好的理解YOLOv

Jiangnan_Cai·2025-07-10 11:55

ResNet：深度卷积神经网络的里程碑

然而，随着网络层数的增加，传统CNN面临着梯度消失、梯度爆炸以及退化等棘手问题，训练变得愈发困难。

心想事“程”·2025-07-10 10:18

卷积神经网络架构的演进：从AlexNet到EfficientNet

回溯到2012年，AlexNet在ImageNet上的Top-1准确率仅为63.3%，而如今，借助EfficientNet架构和师生训练法，我们已经能达到超过90%的准确率。

t0_54manong·2025-07-10 10:47

【AI大模型】PyTorch Lightning 简化工具

PyTorchLightning是一个轻量级的PyTorch封装库，它通过抽象训练循环的工程细节，让研究人员可以专注于模型设计和实验。以下是PyTorchLightning的核心概念和实战指南。

我爱一条柴ya·2025-07-10 09:44

【AI大模型】深入解析预训练：大模型时代的核心引擎

预训练已成为现代人工智能，尤其是自然语言处理和计算机视觉领域的基石技术。它彻底改变了模型开发范式，催生了BERT、GPT等革命性模型。本文将系统阐述预训练的核心概念、原理、方法、应用及挑战。

我爱一条柴ya·2025-07-10 09:43

MiniMind：3小时训练26MB微型语言模型，开源项目助力AI初学者快速入门

这个项目让初学者能够在3小时内从零开始训练出一个仅26.88MB大小的微型语言模型，体积仅为GPT-3的七千分之一，却完整覆盖了从数据处理到模型

nine是个工程师·2025-07-10 08:33

数字化时代练歌神器：卡拉OK点唱机应用全解析

高级版本还提供专业音效处理功能，使得卡拉OK点唱机成为业余爱好者和专业歌手的理想训练工具。1.网络点播功能的实现与应用网络点播功能改变了我们获取媒体内容的方式，赋予了用户前所未有的主动性

·2025-07-10 06:27

2025B卷 - 华为OD机试七日集训第5期 - 按算法分类，由易到难，循序渐进，玩转OD

哪吒·2025-07-10 04:38

2025B卷 - 华为OD机试七日集训第4期 - 按算法分类，由易到难，循序渐进，玩转OD（Python/JS/C/C++）

哪吒·2025-07-10 04:08

人工智能开源的大模型训练微调框架LLaMA-Factory

LLaMA-Factory是一个开源的大模型训练微调框架，具有模块化设计和多种高效的训练方法，能够满足不同用户的需求。用户可以通过命令行或Web界面进行操作，实现个性化的语言模型微调。

·2025-07-10 04:37

2025B卷 - 华为OD机试七日集训第2期 - 按算法分类，由易到难，循序渐进，玩转OD（Python/JS/C/C++）

·2025-07-10 04:36

基于大模型的急性出血坏死性胰腺炎预测技术方案

目录一、算法实现伪代码1.数据预处理与特征工程2.大模型训练（以Transformer为例）3.实时预测与动态调整二、模块流程图1.术前预测流程2.术中动态决策流程3.术后护理流程三、系统集成方案1.系统架构图

LCG元·2025-07-10 02:22

NCCL 核心集体通信操作深度解析：从原理到优化实践

目录引言：NCCL——分布式训练的通信引擎一、NCCL基础：GPU通信的“加速器”1.1NCCL与MPI的协同1.2集体通信的价值二、NCCL核心操作深度解析2.1AllGather：全局数据聚合2.1.1

清风 001·2025-07-10 00:13

【零基础学AI】第30讲：生成对抗网络(GAN)实战 - 手写数字生成

本节课你将学到GAN的基本原理和工作机制使用PyTorch构建生成器和判别器DCGAN架构实现技巧训练GAN模型的实用技巧开始之前环境要求Python3.8+需要安装的包：pipinstalltorchtorchvisionmatplotlibnumpyGPU

1989·2025-07-10 00:41

【深度学习第六期深度学习中的归一化与正则化技术：原理、实践与应用】

详细阐述它们的基本原理，包括如何调整数据分布、控制模型复杂度等；通过丰富的实例和对应代码，展示在不同网络架构中这些技术的具体实现方式，以及对模型训练和性能的影响；同时，对比分析各项技术的特点和

码上有前·2025-07-09 23:08

深度神经网络课程设计：从理论到实践

学生将通过源代码示例学习从网络架构设计、数据预处理到模型训练与评估的完整流程，并掌握深度学习的基本概念、组件及技巧。

Vita Libre·2025-07-09 22:04

算法训练营DAY29 第八章贪心算法 part02

134.加油站134.加油站-力扣（LeetCode）思路如果总消耗大于总油量，那肯定无法完成绕圈令rest=gas-cost；循环中累加这个rest记为curSUM；如果curSum出现负数，让start记为i+1；curSum归零，重新计数；遍历完后如果能完成绕圈，start记录的就是答案起始位置。classSolution{public:intcurSum=0;inttotalSum=0;i

·2025-07-09 21:27

算法训练营DAY5 第二章链表part02 补

首先补充链表part01的双链表、递归法反转链表双链表单链表中的指针域只能指向节点的下一个节点。双链表：每一个节点有两个指针域，一个指向下一个节点，一个指向上一个节点。双链表既可以向前查询也可以向后查询。关键点：注意哨兵指针的初始化，前后都指向自己；在查询函数中，使用中点下标简化查询中的cur指针移动次数，从哨兵指针开始向后移动cur指针时，需要注意for循环中“inext=sentinelNod

·2025-07-09 21:26

算法训练营DAY24 第七章回溯算法part03

93.复原IP地址93.复原IP地址-力扣（LeetCode）给定一个只包含数字的字符串，复原它并返回所有可能的IP地址格式。有效的IP地址正好由四个整数（每个整数位于0到255之间组成，且不能含有前导0），整数之间用'.'分隔。例如："0.1.2.201"和"192.168.1.1"是有效的IP地址，但是"0.011.255.245"、"192.168.1.312"和"[email protected]"是

·2025-07-09 21:26

算法训练营DAY7 第三章哈希表part02

第454题.四数相加II454.四数相加II-力扣（LeetCode）解题思路：使用unordered_map，用两个for循环遍历A与B数组所有的可能的a+b组合，以及每种组合出现的次数；接下来在两个for循环中遍历所有的target=0-(c+d)，在map中查询每个target是否出现，若出现则count+=map[target](map的键值，相当于该种target的出现次数)；最终输出c

_Coin_-·2025-07-09 21:56

代码训练营DAY13 第六章二叉树part01

理论基础二叉树种类存储方式遍历方式深度优先搜索&广度优先搜索深度：前序遍历、中序遍历、后序遍历（中间在前or中or后，左右顺序固定）广度：二叉树定义递归遍历（必须掌握）递归分析三步法1、确定递归函数的参数和返回值2、确定终止条件3、确定单层递归逻辑前序遍历144.二叉树的前序遍历-力扣（LeetCode）/***Definitionforabinarytreenode.*structTreeNod

_Coin_-·2025-07-09 21:56

AI产品经理技术篇：从传统AI到生成式AI，解密大模型的核心概念

这种转变背后，是参数规模、模型架构和训练方式的根本性革新。作为AI产品经理，理解大模型的核心概念至关重要。从“参数”的意义到“Token”的向量化，从Transfor

让我看看好学吗·2025-07-09 21:24

huggingface 笔记： Trainer

Trainer是一个为Transformers中PyTorch模型设计的完整训练与评估循环只需将模型、预处理器、数据集和训练参数传入Trainer，其余交给它处理，即可快速开始训练自动处理以下训练流程：

UQI-LIUWJ·2025-07-09 21:23

论文略读： ALPAGASUS: TRAINING A BETTER ALPACA WITH FEWER DATA

背景大模型通常需要在有监督指令数据集上进行指令微调来加强指令遵循能力但是广泛使用的数据集包含许多具有不正确或不相关响应的低质量样本，这对大模型微调具有误导性——>论文提出了一种简单有效的数据选择策略，使用ChatGPT自动识别和过滤掉低质量数据同时引入了:ALPAGASUS，它是仅对从52k训练数据中过滤出来的

·2025-07-09 21:23

深度学习之迁移学习

一、迁移学习的核心动机传统机器学习通常要求为每个新任务收集大量标注数据并从头训练模型，但现实中面临以下挑战：数据稀缺：例如医疗影像分析（罕见疾病样本少）

路溪非溪·2025-07-09 21:22

中文大模型的技术债问题

本文系统性地分析了中文大模型在数据采集、预训练、微调、评估与部署等生命周期各阶段产生的技术债类型，包括代码复杂性、数据隐患、训练流程依赖、工具链碎片化、模型解释性差、隐性资源耦合等问题，

大鹏的NLP博客·2025-07-09 20:50

LLM（大语言模型）能识别图像的核心原因:图像和文本记性特征识别且对其

LLM（大语言模型）能识别图像的核心原因:图像和文本记性特征识别且对其在于跨模态对齐技术——通过训练将图像和文本映射到同一语义空间，使语言模型能够理解视觉信息。一、为什么LLM能识别图像？

ZhangJiQun&MXP·2025-07-09 20:17

人工智能-基础篇-18-什么是RAG(检索增强生成：知识库+向量化技术+大语言模型LLM整合的技术框架)

1、核心概念大语言模型（LLM）的两大局限性：时效性不足：LLM的训练数据截止于某一时间点，无法获取最新信息（如2025年后的新事件）。知识幻觉：当问题超出模型训练数据范围时，LLM

weisian151·2025-07-09 20:47

PyTorch+CNN进行猫狗识别项目

XXX.jpg（每个文件夹含若干张图像）├──val│└──cat│└──XXX.jpg（每个文件夹含若干张图像）│└──dog└─────└──XXX.jpg（每个文件夹含若干张图像）需要对train数据集进行训练

·2025-07-09 20:46

粒子群算法的原理与实现示例

该算法通过模拟群体中个体（粒子）的运动和信息交互，在解空间中搜索最优解，具有实现简单、收敛速度快、参数少等特点，被广泛应用于函数优化、神经网络训练、工程设计等领域。一、算法

禺垣·2025-07-09 13:36

Python爬虫实战：爬取网易云音乐热评的完整教程

爬取热评可以用于：歌曲口碑分析用户情绪挖掘热门歌曲趋势追踪机器学习训练数据准备但网易云音乐对评论接口进行了加密，直接请求很难成功。本文将帮你攻克这一难点。

Python爬虫项目·2025-07-09 12:25

【零基础学AI】第33讲：强化学习基础 - 游戏AI智能体

本节课你将学到理解强化学习的基本概念和框架掌握Q-learning算法原理使用Python实现贪吃蛇游戏AI训练能够自主玩游戏的智能体开始之前环境要求Python3.8+PyTorch2.0+Gymnasium

1989·2025-07-09 11:16

python基础训练day27

python基础训练day27小白打卡第27天！题目来源这里python基础训练day27第一题（循环）第二题（进制转换）第三题（又是循环）第四题（字符串连接）第一题（循环）#809*??

·2025-07-09 11:14

一文读懂 AI 模型训练流程

一文读懂AI模型训练流程在当今数字化时代，AI技术发展得如火如荼，广泛应用于各个领域，而这背后离不开AI模型的训练。AI模型训练流程就像是一场精心策划的“智慧锻造之旅”，每一步都至关重要。

AI赋能·2025-07-09 10:42

什么是智能体（Agent）？

大语言模型是一种采用大量数据进行训练的人工智能模型，主要用于理解和生成自然语

用什么都重名·2025-07-09 10:40

【AI论文】Skywork-Reward-V2：通过人机协同实现偏好数据整理的规模化扩展

即便采用先进训练技术的方法也未能显著提升性能。我们推测，这种脆弱性主要源于偏好数据集的局限性——这些数据集往往范围狭窄、标

·2025-07-09 09:37

03 数据可视化的世界非常广阔，除了已提到的类型，还有许多更细分或前沿的可视化形式。

学习曲线（LearningCurve）用途：分析模型训练过程

晨曦543210·2025-07-09 07:17

大白话解释深度学习中多尺度特征融合及其意义

假设你想训练一个计算机程序来识别和分割这些不同的物体（汽车、巴士、行人）。

来自宇宙的曹先生·2025-07-09 05:05

Tesla的FSD 架构设计

特斯拉的FSD（完全自动驾驶）架构设计以端到端神经网络为核心，结合专用硬件加速、海量数据训练和持续OTA迭代，形成了一套高度集成的系统。

WSSWWWSSW·2025-07-09 04:30

AI初学者如何对大模型进行微调？——零基础保姆级实战指南

仅需8GB显存，三步完成个人专属大模型训练四步实战：从环境配置到模型发布步骤1：云端环境搭建（10分钟）推荐使用阿里魔塔ModelScope免费GPU资源：#注册后执行环境初始化pip3install-

·2025-07-09 02:15

「论文导读」LLM高效推理与模型量化

论文探讨如何通过优化训练数据、模型架构和推理技术，在有限硬体资源（如单一GPU或CPU）上实现高效推理。学术背景：随着大型语言模型（LLM）如GPT-3的

雷羿 LexChien·2025-07-09 00:01

代码随想录算法训练营第十三天

递归遍历二叉树的前，中，后序遍历题目链接前序遍历中序遍历后序遍历前序遍历题解classSolution{publicListpreorderTraversal(TreeNoderoot){Listlist=newArrayListlist,TreeNoderoot){if(root==null){return;}list.add(root.val);preorder(list,root.left)

天天开心(∩_∩)·2025-07-08 23:57

2025 年机器学习工作流程的 7 个 AI 代理框架

介绍机器学习从业者花费大量时间在重复性任务上：监控模型性能、重新训练流程、检查数据质量以及跟踪实验。

盖瑞理·2025-07-08 23:57

大模型开源与国产化突围：技术路径与产业机遇深度解析

本文将从技术架构、训练范式、生态建设三个维度，深入剖析大模型开源与国产化的突围路径。一、全球开源格局与中国大模型现状1.1国际开源生态的演进特征技术民主化加速：LLaMA-2（700亿参数）、BLOO

梦玄海·2025-07-08 21:13

【AI大模型】神经网络反向传播：核心原理与完整实现

一、反向传播的本质与意义反向传播（Backpropagation）是神经网络训练的核心算法，通过链式法则高效计算损失函数对网络参数的梯度，实现神经网络的优化学习。

我爱一条柴ya·2025-07-08 18:00

后端路线指导（3）：后端进阶版学习路线

进阶版路线其实才是真正扎实“基本功”的阶段，这一阶段主要需要学习微服务的开发模式、并发编程、设计模式等编程技巧，学习Spring和Redis的底层设计思想和源码，以及针对面试问的最多的部分进行的专项提升训练

绝命Coding·2025-07-08 18:58

【实战】如何训练一个客服语音对话场景VAD模型

1.引言：客服场景下的VAD模型在客服中心，每天都会产生海量的通话录音。对这些录音进行有效分析，可以用于服务质量监控、客户意图洞察、流程优化等。VAD在其中扮演着“预处理器”和“过滤器”的关键角色：提升ASR效率与准确性：只将检测到的语音片段送入ASR引擎，可以避免ASR对静音和噪声进行无效识别，减少计算资源浪费，并降低识别错误率。精确统计通话指标：如通话时长、静音时长、抢话率、响应时长等，这些都

kakaZhui·2025-07-08 17:51

推荐频道

GMM训练