预训练第7页

深度学习项目--基于DenseNet网络的“乳腺癌图像识别”，准确率90%+，pytorch复现

本文为365天深度学习训练营中的学习记录博客原作者：K同学啊前言如果说最经典的神经网络，ResNet肯定是一个，从ResNet发布后，很多人做了修改，denseNet网络无疑是最成功的一个，它采用密集型连接

羊小猪~~·2025-03-14 22:08

从零到一：Transformer模型的原理与实战之旅

1.2自注意力机制的核心1.3Transformer的结构2.实战：构建Transformer模型2.1任务目标2.2环境准备2.3数据准备2.4模型构建2.5模型训练3.推理实战：完整示例与输出结果3.1

樽酒ﻬق·2025-03-14 21:06

PyTorch 深度学习实战（13）：Proximal Policy Optimization (PPO) 算法

一、PPO算法基础PPO是OpenAI提出的一种强化学习算法，旨在解决策略梯度方法中的训练不稳定问题。PPO通过

进取星辰·2025-03-14 19:47

笔记:代码随想录算法训练营day39:LeetCode 198.打家劫舍,213.打家劫舍II,337.打家劫舍III

学习资料:代码随想录198.打家劫舍力扣题目链接思路：有点像贪心，是一个不断比较取最大路径的思路定义：偷到下标为i的这家，能偷到的最大值递推公式：选当前这家偷能得到的钱和不偷当前这家的钱作比较，选能偷到的最大金额。因为这个金额是逐一递推过来的，所以是能够代表最大值的。初始化：把第一家和第二家初始化，简单来说，因为递推公式需要i-1和i-2遍历顺序：顺着偷打印：//五部曲//定义:dp[i]为偷到第

jingjingjing1111·2025-03-14 18:07

【大模型LLM面试合集】分布式训练_总结

数据并行不仅仅指对训练的数据并行操作，还可以对网络模型梯度、权重参数、优化器状态等数据进行并行。

X.AI666·2025-03-14 17:28

2025年渗透测试面试题总结-阿里巴巴-阿里云安全（二面）（题目+回答）

目录阿里巴巴-阿里云安全二面一、职业方向与技术偏好1.安全研究vs安全研发的定位二、云安全与身份认证2.云上PKI与身份认证的关注方向三、项目实践与成果3.字节跳动训练营项目四、攻防技术深度解析4.SQL

独行soc·2025-03-14 17:25

Websoft9：为开发者打造的高效 Linux 服务器面板

多语言与框架的预集成•平台内置PHP、Python、Java、

·2025-03-14 16:55

KNN算法实例_手写识别系统

数据集我们将使用MNIST数据集，它包含60000个训练样本和10000个测试样本。每个样本是一个28x28像素的灰度图像，表示0-9之间的手写数字。

V文宝·2025-03-14 16:47

大模型高效优化技术全景解析：微调、量化、剪枝、梯度裁剪与蒸馏

Quantization）剪枝（Pruning）梯度裁剪（GradientClipping）知识蒸馏（KnowledgeDistillation）技术对比与协同策略总结与趋势1.微调（Fine-tuning）核心思想在预训练模型

时光旅人01号·2025-03-14 15:40

推理大模型：技术解析与未来趋势全景

ReasoningLLMs）是专门针对复杂多步推理任务优化的大型语言模型，具备以下核心特性：输出形式创新展示完整逻辑链条（如公式推导、多阶段分析）任务类型聚焦擅长数学证明、编程挑战、多模态谜题等深度逻辑任务训练方法升级融合强化学习

时光旅人01号·2025-03-14 15:10

LibreTranslate的本地部署与应用服务开发

最近在关注大模型预训练文章和应用服务开发，有时候需要借助翻译工具，使用起来都不太方便，就找了一下类似的常见语言的翻译方案，无意中看到一个开源翻译方案（即LibreTranslate），对于通用和计算机类内容的翻译效果还是不错的

一望无际的大草原·2025-03-14 15:08

【AI论文】TPDiff：时序金字塔视频扩散模型

基于这一洞见，我们提出了TPDiff，一个统一的框架，用于提高训练和推理效率。通过将扩散过程分为几个阶段，我们的框架在扩散过程中逐步增加帧率，仅在最后阶段采用全帧率，从而优化计算效率。

东临碣石82·2025-03-14 14:31

DeepSeek 面试题精选

以下是针对DeepSeek面试的精选问题及解答，涵盖技术原理、模型架构、训练方法和应用场景等方面，供面试准备参考：一、DeepSeek模型架构与技术原理1.请简述DeepSeek-V3模型的总体架构和主要创新点

CarlowZJ·2025-03-14 14:00

30.代码随想录算法训练营第三十天|452. 用最少数量的箭引爆气球,435. 无重叠区间,763. 划分字母区间

30.代码随想录算法训练营第三十天|452.用最少数量的箭引爆气球,435.无重叠区间,763.划分字母区间452.用最少数量的箭引爆气球-力扣（LeetCode）有一些球形气球贴在一堵用XY平面表示的墙面上

白鹭鸣鸣！·2025-03-14 14:00

从LayerNorm到RMSNorm：深度学习归一化技术的进化！qwen2.5的技术。

（RootMeanSquare,RMS）来进行归一化，避免了传统归一化方法中均值和方差的计算1.LayerNorm（层归一化）LayerNorm（层归一化）是一种用于深度学习的归一化技术，主要用于稳定训练过程

KangkangLoveNLP·2025-03-14 13:29

十种处理权重矩阵的方法及数学公式

1.权重归一化（WeightNormalization）目的：通过分离权重向量的范数和方向来加速训练。

阳光明媚大男孩·2025-03-14 13:26

【Agent实战】发票信息识别提取专家（AI +OCR技术结合ChatGPT4o能力+结构化prompt（CoT、One-shot等）+Knowledge - RAG+API工具Agent项目实践）

本文原创作者：姚瑞南AI-agent大模型运营专家，先后任职于美团、猎聘等中大厂AI训练专家和智能运营专家岗；多年人工智能行业智能产品运营及大模型落地经验，拥有AI外呼方向国家专利与PMP项目管理证书。

姚瑞南·2025-03-14 13:55

【漫话机器学习系列】137.随机搜索（Randomized Search）

随机搜索（RandomizedSearch）详解在机器学习和深度学习的模型训练过程中，超参数调优（HyperparameterTuning）是至关重要的一环。

IT古董·2025-03-14 12:50

医学人工智能影像诊断数据收集与整理

为了训练这些模型，需要大量的高质量标注数据。下面我会给出一个简单的示例流程，介绍如何收集、整理和准备医学影像数据集，并提供一些基础的Python代码示例。数据收集首先，你需要收集包含医学影像的数据集。

V搜xhliang0246·2025-03-14 12:18

GAN生成对抗网络小记

生成对抗网络（GAN）深入解析：数学原理与优化生成对抗网络（GenerativeAdversarialNetwork,GAN）是一个基于博弈论的深度学习框架，通过生成器（G）和判别器（D）之间的对抗训练

文弱_书生·2025-03-14 11:38

《一文讲透》第4期：KWDB 数据库运维（6）—— 容灾与备份

一、KWDB容灾WAL概述KWDB采用预写式日志（Write-AheadLogging，WAL），记录每个时序表的模式变更和数据变更，以实现时序数据库的数据灾难恢复、时序数据的一致性和原子性。

KaiwuDB 数据库·2025-03-14 10:28

Deepseek 你喜欢我不

**Deepseek的“情感”机制**-**输入**：你的问题“你喜欢我不”被解析为文本向量；-**处理**：通过预训练

太翌修仙笔录·2025-03-14 10:27

目前人工智能的发展，判断10年、20年后的人工智能发展的主要方向，或者带动的主要产业

中国通过DeepSeek等技术创新（如MLA注意力机制、FP8混合精度训练）突破算力瓶颈，实现与美国顶尖模型性能对标，成本降低至558万美元/项目。技术突破：量子

meisongqing·2025-03-14 09:23

一文读懂强化学习：从基础到应用

就像训练小狗，小狗做对了动作（比如坐下），就给它零食（奖励），做错了就没有零食（惩罚），慢慢地小狗就知道怎么做能得到更多零食，也就是学会了最优行为。强

LHTZ·2025-03-14 08:51

深度学习之优化器Optimizer介绍

优化器(Optimizer)是深度学习训练中非常关键的组件,它负责根据损失函数的梯度来更新模型参数,从而使模型性能不断提升。1.优化器的作用和重要性优化器是训练深度学习模型的核心组件之一。

yueguang8·2025-03-14 08:19

Python实现机器学习项目教程：房价预测

我们将使用scikit-learn库来构建并训练一个线性回归模型，预测房价。项目背景假设我们拥有一

向着开发进攻·2025-03-14 08:47

代码随想录训练营Day2|力扣977有序数组的平方、209长度最小的子数组、59螺旋矩阵

1.有序数组的平方题目链接：.-力扣（LeetCode）文章讲解：代码随想录视频讲解：双指针法经典题目|LeetCode：977.有序数组的平方_哔哩哔哩_bilibili双指针法：代码：classSolution{public:vectorsortedSquares(vector&nums){//非递减数组平方后，较大的值都分布在两端，可以利用这个特性从两边入手取值//双指针intcount=n

好名字可以让你的朋友更容易记住你498·2025-03-14 07:43

大模型中的常用名词介绍八：【特征与数据处理、伦理与公平性等】【建议收藏】

序号模块分组说明快捷访问1模型架构与基础概念介绍了【模型架构与基础概念】相关的常见名词及含义大模型中的常用名词介绍一：【模型架构与基础概念】【建议收藏】-CSDN博客2训练方法与技术介绍了【训练方法与技术

神马行空·2025-03-14 07:41

笔记:代码随想录算法训练营day42:LeetCode188.买卖股票的最佳时机IV,309.最佳买卖股票时机含冷冻期,714.买卖股票的最佳时机含手续费

学习资料:代码随想录感觉还没有把这个股票的递归变成直觉的东西.anyway,每一天的各种状态都是从上一天的各种状态中优化出来的,到最后的再选择一个最大的状态,应该是没啥问题,不会有漏掉的情况188.买卖股票的最佳时机IV力扣题目链接思路:和上一题差不多,限制上买卖次数倒比不限制买卖次数复杂了不少要给上一题的代码套个循环classSolution{public:intmaxProfit(intk,v

jingjingjing1111·2025-03-14 07:38

笔记：代码随想录算法训练营第35天： 01背包问题二维、 01背包问题一维、LeetCode416. 分割等和子集

学习资料：代码随想录这一块儿学得挺痛苦注：文中含大模型生成内容动态规划：01背包理论基础卡码网第46题思路：五部曲定义：dp[i][j]为第i个物品背包容量为j，能装下的最大价值递推公式：dp[i][j]的值等于dp[i-1][j]的值和dp[i-1][j-weight[i]]+value相比的最大值，后者为看放下当前物品+减去当前物品的容量能放下什么价值，当然，要是放不下当前物品，就算了，保持原

jingjingjing1111·2025-03-14 07:08

在windows下运行ollama用5600XT (其实旧的a卡应该都可以）步骤同时用ComfyUI + RX 5600 XT + DirectML 安装与配置

没钱也要玩AI(自能简单运用，不能训练，微调等)这张卡只有6g远远不够ai使用所以我发现好像是能和cpu一起混用的。

Zalo2·2025-03-14 07:07

webpack和vite的区别

使用esbuild进行依赖预构建，性能比基于JavaScript的工具快10-100倍。Webpack：需要分析所有模块的依赖关系并进行全量打包，导致启动和热更新速度较慢，尤其是在项目规模较大时。

阿丽塔~·2025-03-14 06:32

算法训练：2.移除元素(快慢指针)

算法原题:27.移除元素-力扣（LeetCode）移除数组元素移除一个元素时，需要将该元素之后的所有元素依次向前移动一个位置，以填补被移除元素的空位，对于静态数组来说，数组的长度是不会发生变化的，多余的数组元素不进行处理：例如{1,2,3,4}移除3,数组会得到{1，2，4，4}解题思路暴力移除通过for循环嵌套，访问到目标元素就将其后面的所有元素向前移动一格，循环往复快慢指针（本节主要内容）快慢

貝森不想秃·2025-03-14 04:20

仅用224张GPU训练，训练成本省10倍

要知道，市面上诸多效果相近的闭源视频生成模型，动辄花费数百万美元训练成本。而Open-Sora2.0，将这一数字压缩到了20万美元。

·2025-03-14 04:12

LLM 为什么需要 tokenizer？

文章目录1.LLM预训练目的1.1什么是语言模型2.Tokenizer一般处理流程（了解）3.进行Tokenizer的原因3.1one-hot的问题3.2词嵌入4.结语1.LLM预训练目的我们必须知道一个预训练目的

SmallerFL·2025-03-14 03:45

基于python的手写数字识别knn_用sklearn中的KNN实现Kaggle手写数字识别

importcsvfromsklearnimportneighbors#导入训练数据和测试数据defloadData(filename1,filename2,trainDataSet,trainTargetSet

普和司·2025-03-14 02:41

OSError: We couldn‘t connect to ‘https://huggingface.co‘ to load this file,

场景：训练bert-base-chinese下游任务：分类。

小李飞刀李寻欢·2025-03-14 01:00

DeepSeek、Grok、ChatGPT4.5和Gemini四大AI模型深度解析：谁才是你的最佳助手

一、四大金刚的看家本领1.DeepSeek：省钱小能手这个国产AI最擅长精打细算，训练成本只要557万美元（其他家动不动上亿），就像用奥拓的钱造出了奥迪。

lifire_H·2025-03-14 00:28

QwQ-32B企业级本地部署：结合XInference与Open-WebUI使用

QwQ-32B是阿里巴巴Qwen团队推出的一款推理模型，拥有320亿参数，基于Transformer架构，采用大规模强化学习方法训练而成。

大势下的牛马·2025-03-14 00:56

GitLab安装和环境配置(虚拟机环境)

一.安装Gitlab前系统预配置准备工作1.关闭firewalld防火墙#systemctlstopfirewalld#systemctldisablefirewalld2.关闭SELINUX并重启系统

tanphilip·2025-03-13 23:49

Deep Lake：人工智能时代的数据湖

它提供高效的多模态数据管理、类似Git的版本控制、强大的查询和可视化功能，并与MLOps生态系统无缝集成，助你轻松驾驭海量数据，加速模型训练！

开源项目精选·2025-03-13 22:43

PyTorch深度学习框架60天进阶学习计划 - 第18天：模型压缩技术

深度学习框架60天进阶学习计划-第18天：模型压缩技术目录模型压缩技术概述知识蒸馏详解软标签生成策略KL散度损失推导温度参数调节结构化剪枝技术通道剪枝评估准则L1-norm剪枝算法APoZ剪枝算法量化训练基础量化类型与精度

凡人的AI工具箱·2025-03-13 22:10

代码随想录算法训练营day2| 209.长度最小的子数组|59.螺旋矩阵II|区间和|开发商购买土地

209.长度最小的子数组找出该数组中满足其总和大于等于target的长度最小的子数组[numsl,numsl+1,...,numsr-1,numsr]，并返回其长度**。**如果不存在符合条件的子数组，返回0。classSolution{publicintminSubArrayLen(inttarget,int[]nums){intfast=0;//快指针intslow=0;//慢指针intsum

70ng·2025-03-13 22:09

Labelme转Voc、Coco

Q：在github找的cv代码基本都是根据现有且流行的公共数据集格式组织的训练数据集，这导致我使用labelme标注好之后需要我们重新组织数据集labelme2coco#!

小慧1024·2025-03-13 22:09

《探秘人工智能与鸿蒙系统集成开发的硬件基石》

对于模型训练任务，尤其是深度学习模型，其复杂的

·2025-03-13 20:02

第81期 | GPTSecurity周报

GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大语言模型（LLM）等安全领域应用的知识。

·2025-03-13 20:59

【智能客服】意图识别训练协作优化机制

本文原创作者：姚瑞南AI-Agent大模型运营专家，先后任职于美团、猎聘等中大厂AI训练专家和智能运营专家岗；多年人工智能行业智能产品运营及大模型落地经验，拥有AI外呼方向国家专利与PMP项目管理证书。

姚瑞南·2025-03-13 19:19

【AI】从头到脚详解如何创建部署Azure Web App的OpenAI项目

【AI】从头到脚详解如何创建部署AzureWebApp的OpenAI项目在AzureWeb应用上，您可以使用Python的OpenAI包方便快捷地调用官方API，上传您的训练数据，并利用他们的算法进行处理

小涵·2025-03-13 19:47

【LLM大模型】大模型涌现能力及 Prompt Engineering提示词

涌现能力GPT3是第一批拥有“涌现能力”的大语言模型，即模型未经特定任务的训练，但在适当的提示下，仍然能够解决某些特定领域的问题。

Langchain·2025-03-13 18:15

Prompt优化 COT/COD

例如：大模型用来画思维导图指令：帮我写一个模型训练的思维导图。背景信息：千帆ModelBuilder训练流程为框架。

陌陌623·2025-03-13 18:12

推荐频道

预训练