专项训练

深度学习篇---深度学习框架

简介特点动态计算图易于上手强大的社区支持与Python的集成度高核心组件2.TensorFlow简介特点静态计算图跨平台强大的生态系统Keras集成核心组件3.PaddlePaddle简介特点易于使用高性能工业级应用丰富的预训练模型核心组件第二部分

Ronin-Lotus·2025-01-31 21:05

DeepSeek-V3 技术报告

为了实现高效的推理和经济高效的训练，DeepSeek-V3采用了多头潜在注意力（MLA）和DeepSeekMoE架构，这些架构在DeepSeek-V2中得到了充分验证。

mingo_敏·2025-01-31 20:01

原创prompt：员工加班助手

本文原创作者：姚瑞南AI-agent大模型运营专家，先后任职于美团、猎聘等中大厂AI训练专家和智能运营专家岗；多年人工智能行业智能产品运营及大模型落地经验，拥有AI外呼方向国家专利与PMP项目管理证书。

姚瑞南·2025-01-31 19:45

修改训练配置记录

修改影响:调整此值可以显著影响模型的训练速度和最终性能。

positive546·2025-01-31 18:42

特征选择（机器学习）

伪代码示例）：2.3嵌入式（EmbeddedMethods）小示例（Lasso伪代码示例）：3.实践建议4.小结1.为什么需要特征选择在机器学习任务中，经常会遇到以下问题：特征（变量）数量过多，导致计算量大、训练速度

赵孝正·2025-01-31 18:10

YOLO系列之训练环境（GPU）搭建篇

YOLOv8专栏导航：点击此处跳转Pytorch环境配置（Windows）Anaconda安装此处下载安装即可⭐温馨提示：安装路径

w94ghz·2025-01-31 17:01

【大模型入门必看】LLM大语言模型导读

本章将简要梳理大语言模型的技术要点以及构建过程，并且列举了可用于预训练以及微调模型的常用数据集，介绍了目前开发大语言模型常用的代码库、预训练大语言模型的步骤以及涉及的关键技术，包括数据准备阶段、模型

古-月·2025-01-31 16:24

python 使用Whisper模型进行语音翻译

多尺寸预训练模型：官方提供了5个不同大小的模型（tiny,

哦里哦里哦里给·2025-01-31 15:16

python 阴暗图像亮度增强对比度增强去雾

解决时，可以在训练样本中加入类似的图像，或者手动把相关图像进行颜色变化。这里主要介绍手工颜色变化。

weixin_37763484·2025-01-31 14:06

DeepSeek优势方法策略

DeepSeek优势方法策略目录DeepSeek优势方法策略DeepSeek在训练阶段压缩时间空间复杂度的方法DeepSeek和ChatGPT在压缩时间空间复杂度上的不同之处DeepSeek能降低显卡使用的原因

ZhangJiQun&MXP·2025-01-31 14:03

基于YOLOv11无人机视角船舶检测系统：项目概述与技术实现

**实时处理能力**数据准备与模型训练1.**数据集构建**2.**模型训练**系统功能与使用方法1.**实时目标检测**2.**静态图片检测**3.**视频文件处理**4.

qq1309399183·2025-01-31 14:03

Llama大型语言模型原理详解

本文将详细解析Llama模型的原理，包括其结构、训练过程以及工作机制，帮助读者深入理解这一先进的模型。

摆烂大大王·2025-01-31 11:40

Rollup：专注类库和框架打包

文章内容输出来源：拉勾大前端高薪训练营-概述-也是一款ESModules打包器-也可以将项目中的一些散落的细小模块打包为整块代码-rollup与webpack作用类似-rollup更为小巧，仅仅是一款ESM

时解之·2025-01-31 10:06

基于Transformer的多通道肌电信号序列分类

本项目基于Transformer实现对表面肌电信号的分类，数据使用excel进行保存，使用Pytorch架构建立模型并训练，利用基于Paramiko库的SSH连接来实现对NAO机器人的远程控制。

咖啡百怪·2025-01-31 10:04

Pix2PixHD代码小白注释(1)——train.py

关于fp16AMP自动混合精度训练，见下文：AMP自动混合精度训练https://blog.csdn.net/ytusdc/article/details/122152244importtimeimportosimportnumpyasnpimporttorchfromtorch.autogradimportVariablefromcollectionsimportOrderedDictfroms

咖啡百怪·2025-01-31 10:04

PyTorch 快速入门

PyTorch是一个开源的机器学习库，它提供了丰富的工具和库，帮助我们轻松地构建、训练和测试神经网络模型。

無量空所·2025-01-31 10:02

PennyLane: 探索量子计算的新里程

由PennyLaneAI团队开发，该项目提供了一个直观且灵活的方式来设计、训练和优化涉及量子硬件的机器学习模型。其目标是让研究人员和开发者能够轻松地在本地或云端的量子计算机上进行实验。

戴艺音·2025-01-31 09:23

Deepseek两项关键发现：无需人类专家介入SFT、有自己

目前尚未实现AGI，主流AI行业和公众普遍认为通过扩大纯语言模型（LLM）的预训练规模就能实现突破

极道Jdon·2025-01-31 08:13

DeepSeek极端榨取硬件性能被曝光

AI开发者的普遍看法是，大规模GPU集群仍然是训练顶尖AI模型的关键。DeepSeek做了什么？DeepSeek的

极道Jdon·2025-01-31 08:13

GGUF 大模型文件格式

1.基础原理GGUF简介当前的大模型的参数规模较大，数以千亿的参数导致了它们的预训练结果文件都在几十GB甚至是几百GB，这不仅导致其使用成本很高，在不同平台进行交换也非常困难。

香菜烤面包·2025-01-31 07:04

书生浦语第五期

简单来说，模型部署就是将训练好的深度学习模型在特定环境中运行的过程。目前大模型部署面临的挑战计算量巨大内

晴斋1216·2025-01-31 06:27

TensorFlow 简介

它提供了一个强大的工具集，用于构建和训练各种机器学习模型。

九月十九·2025-01-31 05:14

自定义数据集使用pytorch框架实现逻辑回归并保存模型，然后保存模型后再加载模型进行预测

3.训练模型定义损失函数和优化器，然后进行模型训练。4.保存模型训练完成后，我们可以保存模型的状态字典。5.加载模型并进行预测加载保存的模型，并进行预测。

知识鱼丸·2025-01-31 04:12

使用numpy自定义数据集使用tensorflow框架实现逻辑回归并保存模型，然后保存模型后再加载模型进行预

在本篇博客中，我们将使用numpy生成一个简单的自定义数据集，并使用TensorFlow框架构建和训练逻辑回归模型。训练完成后，我们会保存模型，并演示如何加载保存的模型进行预测。

辞落山·2025-01-31 04:11

深度学习过程是什么

用差值数据对权重和偏差求偏导，这里的偏导数的值也就是使得损失减小的最佳方向，然后根据偏导数的方向和步长更新权重和偏差，对吗答：您的描述大致正确，但有一些细节需要澄清和修正，以更准确地反映深度学习中模型训练的过程

小松要进步·2025-01-31 01:15

TensorBoard可视化工具支持哪些类型的图表？

TensorBoard支持多种类型的图表，以下是详细介绍：标量图（Scalars）定义与用途：用于展示单个数值随时间（通常是训练步骤或迭代次数）的变化情况。

alankuo·2025-01-31 01:43

《解码AI大模型涌现能力：从量变到质变的智能跃迁》

随着互联网的迅猛发展，数据呈爆炸式增长，为大模型的训练提供了丰富的素材。以GPT-3为例，它的训练数据涵盖了海量的

·2025-01-31 00:42

【机器学习】如何在Jupyter Notebook中安装库以及简单使用Jupyter实现单变量线性回归的模型f

（终端或命令提示符）中安装二、使用JupyterNotebook实现单变量线性回归的模型fw,bf_{w,b}fw,b2.1工具2.2问题陈述2.3创建`x_train`和`y_train`变量2.4训练示例的数量

Lossya·2025-01-30 23:29

COCO8 数据集上训练 YOLO11n：从入门到跑路（100 轮训练实战）

前言训练YOLO11n，听起来就像是给赛博世界的“战斗天使”装上双核发动机，而COCO8数据集，则是那个小小的试验场。

星际编程喵·2025-01-30 23:27

代码随想录算法训练营第三十九天-动态规划-337. 打家劫舍 III

老师讲这是树形dp的入门题目解题思路是以二叉树的遍历（递归三部曲）再结合动规五部曲dp数组如何定义：只需要定义一个二个元素的数组，dp[0]与dp[1]dp[0]表示不偷当前节点的最大价值dp[1]表示偷当前节点后的最大价值这样可以把每个节点的状态值都表示出来但这个数组的两个值只表示当前节点的状态值递归时要使用后序遍历：使用后序遍历的原因就是要从叶子结点一层一层向上统计出来/***Definiti

taoyong001·2025-01-30 22:54

题目 1127: C语言训练-尼科彻斯定理

验证尼科彻斯定理，即：任何一个整数m的立方都可以写成m个连续奇数之和。输出典例：131313=2197=157+159+161+163+165+167+169+171+173+175+177+179+181#includeintmain(){intn,st;scanf("%d",&n);st=n*n-n+1;printf("%d*%d*%d=%d=%d",n,n,n,n*n*n,st);for(i

星海燚燚·2025-01-30 21:48

AI 大模型创业：如何利用商业优势？

第1章：AI大模型概述1.1AI大模型的概念与演进AI大模型（Large-scaleArtificialIntelligenceModels）是指通过大规模数据训练得到的复杂神经网络模型。

AI天才研究院·2025-01-30 21:46

AI绘画能取代设计师吗？

1.AI绘画的现状1.1AI绘画技术的形成与发展AI绘画的背后，离不开图像风格迁移、图文预训练模型和扩散模型这三大技术的共同推动。有点像是一位多才多艺的音乐家，利用不同

网络安全我来了·2025-01-30 20:09

【DeepSeek】复现DeepSeek R1？快来看这个Open R1项目实践指南~

OpenR1项目基于DeepSeek-R1的技术报告和方法论，公开并复现R1的训练管线，并且希望所有开发者都能在这个基础上搭建自己的研究或应用。

FF-Studio·2025-01-30 19:24

实战LLM强化学习——使用GRPO（DeepSeek R1出圈算法）

在大模型的训练或微调当中，大多数场景我们都希望它能“自由发挥”，给出越丰富越好的答案。

FF-Studio·2025-01-30 19:54

Apache Airflow 全面解析

其核心设计理念是“WorkflowsasCode”，通过编程方式定义、调度和监控复杂的数据流水线（Pipeline），适用于ETL、机器学习模型训练、数据湖管理、报表生成等场景。

由数入道·2025-01-30 18:20

DeepSeek：LLM在MoE训练中的无损平衡

现有方法通常采用辅助损耗来促进负载平衡，但较大的辅助损耗会在训练中引入不可忽略的干扰梯度，从而损害模型性能。为了在训练过程中控制负载平衡，同时不产生不希望

大模型任我行·2025-01-30 16:24

基于CNN-GRU-Attention混合神经网络的负荷预测方法（Python代码实现）

本文目录如下：目录1概述一、引言二、模型结构三、数据预处理四、模型训练与评估五、实验结果与分析六、结论与展望2运行结果3参考文献4Python代码实现及数据1概述基于CNN-GRU(convolutionalneuralnetworks-gaterecurrentunit

宇哥预测优化代码学习·2025-01-30 16:22

Deepseek技术浅析（一）

其技术涵盖了从模型架构、训练方法到应用部署的多个层面，展现出强大的创新能力和应用潜力。以下将详细介绍DeepSeek的核心技术、工作原理以及具体实现方式。

爱研究的小牛·2025-01-30 12:58

python神经网络框架有哪些,python调用神经网络模型

Caffe中的网络结构与优化都以配置文件形式定义，容易上手，无须通过代码构建网络;网络训练速度快，能够训练大型数据集与S

小明技术分享·2025-01-30 12:56

代码随想录算法训练营第五十九天| 503.下一个更大元素II、42. 接雨水

代码随想录算法训练营第五十九天|503.下一个更大元素II、42.接雨水503.下一个更大元素II解题代码42.接雨水解题代码503.下一个更大元素II题目链接：503.下一个更大元素II解题代码funcnextGreaterElements

Joanna-升·2025-01-30 10:44

LeetCode-第一题

之前从没有接触过算法题的训练，也深知自己几斤几两，所以博客里可能会有很多不成熟的、不正确的想法和观点，十分欢迎混圈的大神们赐教，但更多的还是想记录自己青涩的成长之路。叨叨半天的废话，下面还是开始进入正

Joanna-升·2025-01-30 10:43

【Leetcode 热题 100】32. 最长有效括号

新年的第二天，偷偷懒，这题就留到手边事情告一段落，专门训练动态规划的时候再写

冠位观测者·2025-01-30 09:36

Python-作业统计管理系统

模块选择2.界面设计3.模块实现五、总结六、感想七、Python源码mainexcelhandlejob一、设计目的1、教学目的本课程设计是学生学习完《Python程序设计》课程后，进行的一次全面的综合训练

Vicky__3021·2025-01-30 09:32

大语言模型原理与工程实践：残差连接与层归一化

然而，这些网络在训练过程中经常遭遇梯度消失和梯度爆炸的问题。

AI大模型应用之禅·2025-01-30 08:27

模型架构选择：从传统NLP到Transformer

模型架构选择：从传统NLP到Transformer关键词：自然语言处理(NLP),模型架构,传统NLP,Transformer,RNN,CNN,预训练模型文章目录模型架构选择：从传统NLP到Transformer1

AI天才研究院·2025-01-30 08:23

用自然语言与mysql数据库对话几种方案的思考

处于安全考虑,可训练一个本地大语言模型来完成此项任务,mysql服务器中的数据大约有两万多条记录,服务器的作用主要是记录设备的出库和回库的流水账(即以时间为序的记录),但有一些sql查询比较复杂,必须根据特定的

闲云野鹤_SG·2025-01-30 08:52

Llama 3：开源大模型的里程碑式突破

标题：Llama3：开源大模型的里程碑式突破文章信息摘要：Meta通过Llama3展现了开源LLM的重大突破：采用超大规模训练数据和多阶段训练方法（SFT、rejectionsampling、PPO和DPO

XianxinMao·2025-01-30 08:50

Transformer架构的GPU并行和之前的NLP算法并行有什么不同？

在深度学习中，GPU并行计算被广泛应用于训练神经网络，加速模型训练过程。在2017年之前，自然语言处理（NLP）领域的研究者们通常会从头开始训练模型，那时能够利用GPU进行

AI大模型学习不迷路·2025-01-30 07:49

代码随想录算法训练营第三十九天|198.打家劫舍、

题目链接：198.打家劫舍-力扣（LeetCode）思路：因为隔一家才能取，所以当前最大的价值要么是dp[i-2]+nums[i]或者是dp[i-1]classSolution(object):defrob(self,nums):""":typenums:List[int]:rtype:int"""dp=[0]*len(nums)if(len(nums)==1):returnnums[0]dp[0

jinshengqile·2025-01-30 06:41

推荐频道