记忆训练第5页

华为OD机试九日集训第2期 - 按算法分类，由易到难，循序渐进，提升编程能力和解题技巧，从而提高机试通过率

目录一、适合人群二、本期训练时间三、如何参加四、数据结构与算法大纲五、华为OD九日集训第1期第1天、逻辑分析第2天、队列第3天、双指针第4天栈第5天滑动窗口第6天、二叉树第7天、并查集第8天、矩阵第9天

哪吒·2025-03-21 02:48

模型部署实战：PyTorch生产化指南

模型部署是将训练好的模型‌投入实际应用‌的关键步骤，涉及：模型格式转换（TorchScript/ONNX）性能优化（量化/剪枝）构建API服务移动端集成本章使用ResNet18实现图像分类，并演示完整部署流程

小诸葛IT课堂·2025-03-21 01:45

H800核心性能优化技术

这些创新不仅显著提升了30%以上的能效比，更通过精细化任务调度机制，解决了深度学习训练中高并发数据处理与模型参数同步的效率瓶颈。值得关注的

智能计算研究中心·2025-03-21 01:13

【AI论文】RWKV-7“鹅”模型，具备富有表现力的动态状态演化能力

摘要：我们推出RWKV-7“鹅”，这是一种全新的序列建模架构，同时发布的还有预训练语言模型。

东临碣石82·2025-03-21 00:02

基于Python的金融领域AI训练数据抓取实战（完整技术解析）

项目背景与需求分析场景描述为训练一个覆盖全球金融市场的多模态大语言模型（LLM），需实时采集以下数据：全球30+主要证券交易所（NYSE、NASDAQ、LSE、TSE等）的上市公司公告企业财报PDF文档及结构化数据社交媒体舆情数据

海拥✘·2025-03-20 23:57

PyTorch模型训练实战指南：掌握动态图特性与工业级部署技巧

前言在深度学习领域，PyTorch凭借其动态计算图、高效的自动微分系统及高度Pythonic的设计哲学，已成为学术界与工业界的主流框架。其即时执行模式大幅简化了模型调试流程，而灵活的模块化设计则为复杂模型的构建提供了坚实基础。然而，从实验原型到工业级部署的全链路实践中，开发者仍需系统性掌握框架核心特性与工程化技巧。本文以实战为导向，深入剖析PyTorch动态图机制与自动微分原理，详解从数据预处理、

lmtealily·2025-03-20 21:37

数据分析_python进行数据筛选1_行筛选

以titanic的训练数据为例进行展示，为了简化取前十行为例首先导入模块，导入数据importpandasaspdimportnumpyasnpdf=pd.read_csv(r"C:\Users\admin

Monkey*王·2025-03-20 20:28

【万字总结】前端全方位性能优化指南（四）——虚拟DOM批处理、文档碎片池、重排规避

本章直面这一核心矛盾，以原子级操作合并、节点记忆重组、排版禁忌破解为三重武器，重构DOM更新的物理法则。

庸俗今天不摸鱼·2025-03-20 20:27

《魔兽争霸-黑潮》游戏秘籍

DECKMEOUT部队升级EVERYLITTLETHINGSHEDOES魔法升级GLITTERINGPRIZES增加黄金、木材、油量ITISAGOODDAYTODIE无敌MAKEITSO加快建筑、训练、

小魚資源大雜燴·2025-03-20 19:25

【Dive Into Stable Diffusion v3.5】1：开源项目正式发布——深入探索SDv3.5模型全参/LoRA/RLHF训练

目录1引言2项目简介3快速上手3.1下载代码3.2环境配置3.3项目结构3.4下载模型与数据集3.5运行指令3.6核心参数说明3.6.1通用参数3.6.2优化器/学习率3.6.3数据相关4结语1引言在人工智能和机器学习领域，生成模型的应用越来越广泛。StableDiffusion作为其中的佼佼者，因其强大的图像生成能力而备受关注。今天，我的开源项目DiveIntoStableDiffusionv3

Donvink·2025-03-20 19:24

开源模型应用落地-qwen模型小试-调用Qwen2-7B-Instruct-进阶篇（十二）

无论是语言模型还是多模态模型，均在大规模多语言和多模态数据上进行预训练，并通过高质量数据进行后期微调以贴近人类偏好。

开源技术探险家·2025-03-20 19:23

基于大模型的腮腺多形性腺瘤全周期诊疗方案研究报告

目录一、引言1.1研究背景与目的1.2研究现状与趋势二、大模型预测原理与方法2.1大模型概述2.2数据收集与预处理2.3模型训练与优化三、术前预测与评估3.1肿瘤特征预测3.2风险评估3.3案例分析四、

LCG元·2025-03-20 19:53

PyTorch 深度学习实战（19）：离线强化学习与 Conservative Q-Learning (CQL) 算法

在上一篇文章中，我们探讨了分布式强化学习与IMPALA算法，展示了如何通过并行化训练提升强化学习的效率。

进取星辰·2025-03-20 19:52

知识库在意图识别中扮演着数据支撑和语义理解辅助的双重角色

知识库在意图识别中扮演着数据支撑和语义理解辅助的双重角色，而训练智能客服的意图识别Agent需要结合知识库的结构化数据与机器学习技术。

PersistDZ·2025-03-20 18:47

一切皆是映射：DQN训练加速技术：分布式训练与GPU并行

1.背景介绍1.1深度强化学习的兴起近年来，深度强化学习（DeepReinforcementLearning，DRL）在游戏、机器人控制、自然语言处理等领域取得了令人瞩目的成就。作为一种结合深度学习和强化学习的强大技术，DRL能够使智能体在与环境交互的过程中学习最优策略，从而实现自主决策和控制。1.2DQN算法及其局限性深度Q网络（DeepQ-Network，DQN）是DRL的一种经典算法，它利用

AI天才研究院·2025-03-20 18:45

大规模语言模型从理论到实践分布式训练的集群架构

大规模语言模型从理论到实践分布式训练的集群架构作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着深度学习技术的飞速发展，大规模语言模型

AI智能涌现深度研究·2025-03-20 18:14

图生视频技术的发展与展望：从技术突破到未来图景

早期探索与GAN的奠基早期图生视频技术主要基于生成对抗网络（GAN），通过对抗训练生成低分辨率的视频片段。例如，DeepMind的DVD

Liudef06·2025-03-20 18:12

Hugging Face 模型格式全解析：从 PyTorch 到 GGUF

兼容性强，与PyTorch训练/推理流程深度集成。文件体积较大，加载速度较慢，存在安全

mingo_敏·2025-03-20 17:37

Python入门程序练习004：输入某年某月某日，判断这一天是这一年的第几天？

为了方便记忆，总结为：四年一闰,百年不闰,四百年再闰那么判断出闰年和平年（除了闰年其他都是平年）之后呢，其实只要记住：闰

若北辰·2025-03-20 17:04

【机器视觉】少量样本图片情况下的图片识别技术方案

以下是一些应对小样本问题的有效方案：1.数据增强（DataAugmentation）通过对现有样本进行各种变换来生成更多的训练数据，例如：几何变换：旋转、缩放、平移、翻转等。

yuanpan·2025-03-20 16:01

模型微调：让AI更懂你的魔法棒

模型微调：让AI更懂你的魔法棒✨在人工智能的世界里，模型微调（Fine-tuning）就像是一位魔法师用魔法棒对预训练模型进行“个性化改造”，让它更适应特定的任务。

带上一无所知的我·2025-03-20 14:10

聊聊关于Python与人工智能那些事

Python提供了许多用于构建和训练人工智能模型的库和框架。本文将介绍一些常见的人工智能技术以及Python在这些技术中的应用。

小G-biu-·2025-03-20 13:37

使用 TensorFlow 进行图像处理：深度解析卷积神经网络（CNN）

2.使用TensorFlow构建CNN2.1环境准备2.2加载并预处理MNIST数据集2.3构建CNN模型2.4编译和训练模型2.5评估模型3.CNN的优化与改进3.1使用数据增强3.2调整网络结构4.

一碗黄焖鸡三碗米饭·2025-03-20 12:28

集成学习（Ensemble Learning）基础知识1

4、基学习器：“好而不同”5、集成学习的两个基本问题（1）如何训练出具有差异性的多个基学习器？（2）如何将多个基学习器的预测结果集成为最终的强学习器预测结果？

代码骑士·2025-03-20 12:57

企业品牌升级秘籍：如何运用媒体直播推流打造品牌新动力？媒介盒子分享

企业应结合品牌特色，策划富有吸引力的直播内容，让观众在享受视听盛宴的同时，加深对品牌的认知与记忆。‌2、平台选择，拓宽传播渠道‌不同平台有不同的

企业软文推广·2025-03-20 12:52

实战LLM强化学习——使用GRPO（DeepSeek R1出圈算法）

然而，随着模型规模的扩大和任务复杂性的增加，传统的强化学习算法开始暴露出训练效率低、收敛速度慢等问题。为了解决这些挑战，DeepSeek公司提出了一个新的强化学习算法—

大富大贵7·2025-03-20 10:10

有了大模型为何还需要Agent智能体

记忆（

全栈你个大西瓜·2025-03-20 09:59

通过LoRA（Low-Rank Adaptation）低秩矩阵分解来高效微调权重变化

这种方法通过减少微调的参数数量来提高训练效率。

背太阳的牧羊人·2025-03-20 08:53

神经网络之参数初始化

引言：参数初始化是训练深度神经网络的一个关键步骤，目的是给网络中权重（weights）和偏置（biases）赋予初始值。

硬水果糖·2025-03-20 08:21

神经网络基础之正则化

一、正则化目的防止过拟合：当模型过于复杂（例如神经网络层数过多、参数过多）时，容易在训练数据上“记忆”噪声或细节，导致在测试数据上表现差。简化模型：正则化通过限制模型参数的大小或数量，迫

硬水果糖·2025-03-20 07:45

TDE透明加密技术：免改造实现华为云ECS中数据库和文件加密存储

在数字经济与云计算深度融合的今天，华为云ECS（弹性云服务器）已成为企业数字化转型的核心载体，承载着数据库、文件存储、AI训练等关键业务。

安当加密·2025-03-20 07:43

谈高考真题的使用（数学）

2019独角兽企业重金招聘Python工程师标准>>>在高三数学复习中，大家常说“以本为本，以纲为纲，高考真题当主粮”，就是以教材内容为根本，以“考试大纲”为准绳，以高考真题的训练为主线；抓住了本，把握了纲

weixin_34116110·2025-03-20 06:33

注意力机制：让AI拥有“黄金七秒记忆“的魔法----（点积注意力）

注意力机制：让AI拥有"黄金七秒记忆"的魔法–（点积注意力）注意⼒机制对于初学者来说有点难理解，我们⼀点⼀点地讲。现在先暂时忘记编码器、解码器、隐藏层和序列到序列这些概念。

y江江江江·2025-03-20 06:33

利用 HAI 平台进行 DeepSeek 模型训练的详细指南

摘要本文旨在为非专业用户提供在HAI平台上进行DeepSeek模型训练的详细步骤。从创建项目、上传数据集、配置训练参数到启动训练任务并监控训练过程，本文将逐步指导用户完成整个流程。

·2025-03-20 06:41

决策树算法全解析：从零基础到Titanic实战，一文搞定机器学习经典模型

Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain

吴师兄大模型·2025-03-20 04:18

Ai时代初期全球不同纬度的层级辐射现象

现象可被科学解构为以下六大维度，结合技术演进、产业实践和社会影响进行系统性分析：一、技术能力的层级跃迁模型效率革命DeepSeek研发的R1-Zero模型通过动态架构设计，将样本利用率提升40%以上，训练周期大幅缩短

龙胥伯·2025-03-20 04:48

1.1PaddleTS_环境配置：一个易用的深度时序建模的Python库

PaddleTS的主要特性包括：设计统一数据结构，实现对多样化时序数据的表达，支持单目标与多目标变量，支持多类型协变量封装基础模型功能，如数据加载、回调设置、损失函数、训练过程控制等公共方法，帮助开发

pythonQA·2025-03-20 01:27

【大模型科普】AIGC技术发展与应用实践（一文读懂AIGC）

大模型是千亿参数的深度神经网络（如ChatGPT），经海量数据训练后能完成文本生成、图像创作等复杂任务，显著提升效率，但面临算力消耗、数据偏见等挑战。

·2025-03-20 01:36

数据增强：扩充数据集提升模型泛化能力

一个泛化能力强的模型能够在未见数据上表现良好，而过拟合的模型则会在训练数据上表现出色，但在新数据上表现糟糕。

AI天才研究院·2025-03-19 23:06

数据增强：扩充数据集，提升模型的鲁棒性

数据增强：扩充数据集，提升模型的鲁棒性1.背景介绍1.1数据集的重要性在机器学习和深度学习领域中,数据集是训练模型的基础。高质量的数据集对于构建准确、鲁棒的模型至关重要。

AI天才研究院·2025-03-19 23:05

NLP高频面试题（三）——普通RNN的梯度消失和梯度爆炸问题

普通RNN（循环神经网络）的梯度消失和梯度爆炸问题是指在训练深层或长序列的RNN模型时出现的两种典型问题：一、梯度消失（VanishingGradient）梯度消失是指在反向传播过程中，梯度逐层传播时变得越来越小

Chaos_Wang_·2025-03-19 23:34

vscode连接远程服务器docker里的容器--使用remote ssh

欢仔要学习·2025-03-19 22:28

使用TensorFlow、OpenCV和Pygame实现图像处理与游戏开发

安装TensorFlowTensorFlow是一个基于数据流图的开源机器学习框架，提供了丰富的工具和库来构建和训练各种深度

UwoiGit·2025-03-19 22:25

MMScan数据集：首个最大的多模态3D场景数据集，包含层次化的语言标注

数据集的建立，不仅推动了3D场景理解的研究进展，还为训练和评估多模态3D感知模型提供了宝贵的资源。

·2025-03-19 21:28

游戏成瘾与学习动力激发策略研究——了解“情感解离”“创伤理论”

一、情感解离（EmotionalDissociation）定义：情感解离是一种心理防御机制，指个体在经历无法承受的情绪压力或创伤时，通过切断情感体验与认知、记忆或现实感知的联系来保护自我。

*TQK*·2025-03-19 21:18

深度革命：ResNet 如何用 “残差连接“ 颠覆深度学习

更令人震撼的是，ResNet将神经网络的深度推至152层，彻底打破了"深层网络无法训练"的魔咒。这场革命的核心，正是一个简单

安意诚Matrix·2025-03-19 20:46

A SURVEY ON POST-TRAINING OF LARGE LANGUAGE MODELS——大型语言模型的训练后优化综述——第9部分——应用

应用尽管预训练为大型语言模型（LLMs）赋予了强大的基础能力，但在部署于专业领域时，LLMs仍经常遇到持续的限制，包括上下文长度受限、容易产生幻觉（hallucination）、推理能力欠佳和固有的偏见

王金-太想进步了·2025-03-19 19:31

Yolov8训练自己的数据集(脱离ultralytics库)

比如在使用v8的时候需要安装ultralytics库，然后再调用YOLO进行训练或者预测，那么就有这几个问题：问题1：安装了ultralytics库后如何使用YOLO呢

爱吃肉的鹏·2025-03-19 17:22

迁移学习基础知识

简介使用迁移学习的优势：1、能够快速的训练出一个理想的结果2、当数据集较小时也能训练出理想的效果。注意：在使用别人预训练的参数模型时，要注意别人的预处理方式。

zhooooooou·2025-03-19 16:44

迁移学习入门

迁移学习1迁移学习的概念预训练模型定义:简单来说别人训练好的模型。

EmbodiedTech·2025-03-19 16:14

推荐频道

记忆训练