2018寒假训练第5页

深度革命：ResNet 如何用 “残差连接“ 颠覆深度学习

更令人震撼的是，ResNet将神经网络的深度推至152层，彻底打破了"深层网络无法训练"的魔咒。这场革命的核心，正是一个简单

安意诚Matrix·2025-03-19 20:46

A SURVEY ON POST-TRAINING OF LARGE LANGUAGE MODELS——大型语言模型的训练后优化综述——第9部分——应用

应用尽管预训练为大型语言模型（LLMs）赋予了强大的基础能力，但在部署于专业领域时，LLMs仍经常遇到持续的限制，包括上下文长度受限、容易产生幻觉（hallucination）、推理能力欠佳和固有的偏见

王金-太想进步了·2025-03-19 19:31

Yolov8训练自己的数据集(脱离ultralytics库)

比如在使用v8的时候需要安装ultralytics库，然后再调用YOLO进行训练或者预测，那么就有这几个问题：问题1：安装了ultralytics库后如何使用YOLO呢

爱吃肉的鹏·2025-03-19 17:22

迁移学习基础知识

简介使用迁移学习的优势：1、能够快速的训练出一个理想的结果2、当数据集较小时也能训练出理想的效果。注意：在使用别人预训练的参数模型时，要注意别人的预处理方式。

zhooooooou·2025-03-19 16:44

迁移学习入门

迁移学习1迁移学习的概念预训练模型定义:简单来说别人训练好的模型。

EmbodiedTech·2025-03-19 16:14

哇！5.2秒进入应用界面！Linux快速启动方案分享，基于全志T113-i国产平台

Windows开发环境：Windows764bit、Windows1064bit虚拟机：VMware15.5.5Linux开发环境：Ubuntu18.04.464bitU-Boot：U-Boot-2018.07Kernel

Tronlong创龙·2025-03-19 15:37

Dify知识库构建流程及示例

3.向量化（Embedding）嵌入模型：调用预训练

cqbelt·2025-03-19 14:54

MNIST数据集&手写数字识别

它提供了一种基于数据流图的编程模型，用于构建和训练机器学习模型。TensorFlow的核心概念是张量（Tensor）和流图（Graph）。

Zoro｜·2025-03-19 13:18

Codeforces Round 995 (Div. 3)

在这第iii天，如果Monocarp准备训练，那么他将完成aia_iai题，同样的，如果Stereocarp也在这天准备训练，那么他将完成bib_ibi题。

polarours·2025-03-19 13:17

医疗影像联邦学习可解释性算法研究

本研究以跨机构医疗影像协作场景为核心，系统性探讨联邦学习框架下可解释性算法的创新路径，重点解决医疗AI模型在分布式训练中的透明度缺失问题。

智能计算研究中心·2025-03-19 11:36

【Python】测试数据生成工具 --- Faker

Faker的应用不仅限于测试，它还广泛应用于数据分析、机器学习训练集的准备以及任何需要大量样本数据的场景。Faker安装前提：已安装python、pip安装命令如下：pipinst

·2025-03-19 11:00

融合AMD与NVIDIA GPU集群的MLOps：异构计算环境中的分布式训练架构实践

在深度学习的背景下，NVIDIA的CUDA与AMD的ROCm框架缺乏有效的互操作性，导致基础设施资源利用率显著降低。随着模型规模不断扩大而预算约束日益严格，2-3年更换一次GPU的传统方式已不具可持续性。但是Pytorch的最近几次的更新可以有效利用异构计算集群，实现对所有可用GPU资源的充分调度，不受制于供应商限制。本文将深入探讨如何混合AMD/NVIDIAGPU集群以支持PyTorch分布式训

·2025-03-19 11:59

深度学习框架PyTorch——从入门到精通（4）数据转换

转换（Transforms）很多时候，数据并不总是以训练机器学习算法所需的最终处理形式出现。所以我们需要使用变换对数据进行一些处理，使其适合训练。

Fansv587·2025-03-19 11:01

深度学习框架PyTorch——从入门到精通（5）构建神经网络

构建神经网络获取训练设备定义类模型层nn.Flattennn.Linearnn.ReLUnn.Sequentialnn.Softmax模型参数补充说明argmax神经网络是由一些层或者模块组成的，这些层和模块会对数据进行各种操作

Fansv587·2025-03-19 11:58

大语言模型的训练数据清洗策略

目录大语言模型的训练数据清洗策略1.数据去重与标准化问题解决方案示例代码（Python实现数据去重）：2.过滤有害内容问题解决方案示例代码（基于关键词过滤有害内容）：3.纠正数据不均衡问题解决方案示例代码

gs80140·2025-03-19 10:23

CTF学习法则——寒假篇新手赶快收藏吧！

对于想要在寒假期间提升CTF技能的同学们，以下是一些有效的学习法则，可以帮助你高效地进行学习和提升：1.合理规划学习时间寒假时间有限，建议制定合理的学习计划：每天固定时间学习：保持稳定的学习节奏，避免临时抱佛脚

网络安全技术分享·2025-03-19 10:50

Megatron-LM训练框架和Deepspeed训练框架最主要的异同和优劣是什么

核心异同点并行策略Megatron-LM核心：以张量并行（TensorParallelism）和流水线并行（PipelineParallelism）为主，结合数据并行。张量并行通过切分模型层（如注意力头、MLP块）到不同设备，利用NVLink高速通信提升效率。流水线并行将不同层分配到不同设备，通过P2P通信协调。DeepSpeed核心：ZeRO优化技术（ZeroRedundancyOptimize

强化学习曾小健·2025-03-19 09:15

OctoTools：一个具有复杂推理可扩展工具的智体框架

现有方法使用外部工具增强大语言模型(LLM)，但仅限于专业领域、有限的工具类型或需要额外的训练数据。本文的OctoTools，是一个无需训练、用户友好且易于扩展的

三谷秋水·2025-03-19 09:09

深度学习框架PyTorch——从入门到精通（5）自动微分

使用torch.autograd自动微分张量、函数和计算图计算梯度禁用梯度追踪关于计算图的更多信息张量梯度和雅可比乘积在训练神经网络时，最常用的算法是反向传播。

Fansv587·2025-03-19 06:20

标签转换脚本 - VOC格式转COCO格式，即voc2coco，xml2json 附VOC及COCO标签格式详解

专栏目录：YOLO训练/写作脚本目录一览|涉及标签转换、数据扩充、热力图、感受野、精度曲线、数量统计等近百个脚本文件专栏地址：YOLO训练/写作脚本——丰富文章内容，增强实验信服力，助力发文！！！

Limiiiing·2025-03-19 04:57

标签转换脚本 - VOC格式转YOLO格式，即voc2yolo，xml2txt 附VOC及YOLO标签格式详解

专栏目录：YOLO训练/写作脚本目录一览|涉及标签转换、数据扩充、热力图、感受野、精度曲线、数量统计等近百个脚本文件专栏地址：YOLO训练/写作脚本——丰富文章内容，增强实验信服力，助力发文！！！

Limiiiing·2025-03-19 04:26

自建智能算力中心 vs 第三方算力租赁：AI企业的算力博弈与最优解

从ChatGPT到DeepSeek，从自动驾驶到智能医疗，AI模型的训练和推理需求呈现指数级增长。在这场技术革命中，算力已成为企业竞争的“命脉”。

·2025-03-19 03:50

RAG 在多模态数据处理中的应用探索：结合图像与文本生成

目录引言多模态数据处理的挑战与需求数据异质性与融合难题多样化应用场景的需求RAG在图像与文本生成中的应用架构图像检索与文本生成协同跨模态特征融合与生成关键技术与实现细节图像特征提取与表示文本检索与语义理解跨模态生成模型训练应用案例分析智能设计辅助医疗影像报告生成结论引言随着信息技术的飞速发展

hy098543·2025-03-18 22:40

如何计算一个7B的模型训练需要的参数量以及训练时需要的计算资源

计算理论过程见：transformer中多头注意力机制的参数量是多少？1.模型参数量的计算7B参数模型的总参数量是70亿（7billion）。这些参数主要分布在以下几个部分：Transformer层：多头注意力机制（Multi-HeadAttention）前馈神经网络（Feed-ForwardNetwork）嵌入层（EmbeddingLayer）：词嵌入（TokenEmbeddings）位置编码（

yxx122345·2025-03-18 20:59

程序员必看！DeepSeek全栈开发实战指南：从代码生成到性能优化

这两项技术突破对程序员群体意义重大：通信效率飞跃：DeepEP通过NVLink优化实现GPU间158GB/s传输速度，后端开发者训练大模型时可节省60%集群资源推理性能突破：R1模型在H

AI创享派·2025-03-18 20:59

MM-RAIT：多模态检索增强生成（RAG）的认知革命

多模态检索增强生成（RAG）领域迎来了一项里程碑式的突破——MM-RAIT框架通过“评估-训练”双轮驱动，显著提升了主流视觉语言模型的RAG性能，增幅达27%至34%。

花生糖@·2025-03-18 20:58

五、AIGC大模型_05模型的vLLM部署与LangChain调用

0、概述要搭建一个大模型应用服务，通常需要包含以下五层结构，即：基础环境、模型层、推理层、对外接口、外挂应用在了解了模型的微调训练之后，本文将以vLLM、OpenAI、LangChain为例，介绍大模型的推理部署以及对外接口开放调用

学不会lostfound·2025-03-18 19:20

解决Python找不到ssl模块问题 No module named _ssl

python安装完毕后，提示找不到ssl模块：1234567891011[[email protected]~]$pythonPython2.7.15(default,Oct232018,18:08:43

代码之路无极限·2025-03-18 19:50

PyTorch 深度学习实战（17）：Asynchronous Advantage Actor-Critic (A3C) 算法与并行训练

本文将介绍强化学习领域的重要里程碑——AsynchronousAdvantageActor-Critic(A3C)算法，并展示如何利用PyTorch实现并行化训练来加速学习过程。

进取星辰·2025-03-18 19:17

DeepSeek 3FS 与 JuiceFS：架构与特性比较

在AI业务中，企业需要处理大量的文本、图像、视频等非结构化数据，还需要应对数据量的爆炸式增长，分布式文件系统因此成为AI训练的关键存储技术。

·2025-03-18 18:07

DeepSeek 训练数据模板生成指南

DeepSeek训练数据模板生成指南（一次生成多条高质量数据集）一、核心数据格式规范1.基础结构（JSONL格式）每条数据需包含prompt（输入指令）和completion（期望输出）两个核心字段，采用单行

He.Tech·2025-03-18 18:39

yolov4

V4贡献：亲民政策，单GPU就能训练的非常好，接下来很多小模块都是这个出发点两大核心方法，从数据层面和网络设计层面来进行改善消融实验，感觉能做的都让他给做了，这工作量不轻全部实验都是单GPU完成，不用太担心设备了

zzh-·2025-03-18 16:28

【pytorch(cuda)】基于DQN算法的无人机三维城市空间航线规划（Python代码实现）

本文目录如下：目录⛳️赠与读者1概述一、研究背景与意义二、DQN算法概述三、基于DQN的无人机三维航线规划方法1.环境建模2.状态与动作定义3.奖励函数设计4.深度神经网络训练5.航线规划四、研究挑战与展望

wlz249·2025-03-18 16:28

edger多组差异性分析_R语言统计分析微生物组数据

出版日期：2018

weixin_39961636·2025-03-18 16:57

yolov8的第一次实验报告

datasets]数据集大小:[2.68Gb]数据集描述:[数据集主要分两个类别：zdjy_ld,zdjy_gd]注释：占道经营流动，占道经营固定3.模型配置3.1基础配置·模型类型:YOLOv8·预训练模型

算法宇宙·2025-03-18 16:55

李开复：AI 2.0 时代的机遇

然而，深度学习模型的训练成本高、数据依赖性强、可解释性差等问题仍然制约着AI技术的进一步发展。李开复先生在《AI2.0时代的机遇》

AGI大模型与大数据研究院·2025-03-18 15:52

YOLOv8n-OBB使用C#在windows10进行部署（CPU）

1.训练YOLOv8-OBB模型1.1数据集制作所用标注工具：X-AnyLabeling下载链接：https://github.com/CVHub520/X-AnyLabeling/releases/download

cd_Ww777·2025-03-18 15:21

YOLOv8 的简介及C#中如何简单应用YOLOv8

端到端训练：可以直接从图像输入端到分类结果输出，简化了训练和部署过程。改进的架构：包括更深的网络结构、更复杂的特征提取方法以及更高效的

码上有潜·2025-03-18 14:46

llama.cpp 和 LLM（大语言模型）

它通过海量文本数据训练，能够生成连贯、语义丰富的文本，完成问答、创作、推理等任务。特点：参数规模大：如GPT-3（1750亿参数）、Llama-65B（650亿参数）等。

这个懒人·2025-03-18 14:12

LLaMA-Factory 微调训练

LLaMA-Factory微调训练该框架功能，标注-微调-导出-合并-部署，一整条流程都有，而且训练时消耗的gpu算力也会小一些一，安装（推荐在linux中训练，win可以用wsl+docker）gitclonehttps

zsh_abc·2025-03-18 14:40

Yolov11目标检测(ultralytics)

Yolov11目标检测（ultralytics）1.克隆仓库2.安装环境依赖3.训练、验证、推理以及onnx模型导出1.克隆仓库从官网下载Yolov11到本地。

@M_J_Y@·2025-03-18 13:02

入门网络安全工程师要学习哪些内容【2025年寒假最新学习计划】

基于入门网络安全/黑客打造的：黑客&网络安全入门&进阶学习资源包大家都知道网络安全行业很火，这个行业因为国家政策趋势正在大力发展，大有可为!但很多人对网络安全工程师还是不了解，不知道网络安全工程师需要学什么?知了堂小编总结出以下要点。网络安全工程师是一个概称，学习的东西很多，具体学什么看自己以后的职业定位。如果你以后想成为安全产品工程师，学的内容侧重点就和渗透测试工程师不一样，如果你想成为安全开发

白帽黑客2659·2025-03-18 12:29

笔记：代码随想录算法训练营Day65:LeetCode115.不同的子序列\583. 两个字符串的删除操作\72. 编辑距离

学习资料：代码随想录115.不同的子序列力扣题目链接递推公式：求的是个数而不是长度，dp[i-1][j]代表的是用i-2为结尾的s的子序列去能凑出j-1为结尾的t的子序列的方法数，代表的是dp[i][j]的上一状态，当s[i-1]==t[i-1],说明可以从dp[i-1][j-1]的代表的用i-2为结尾的s的子序列去能凑出j-2为结尾的t的子序列的方法数方法数状态各加一个数抵达dp[i][j]代表

jingjingjing1111·2025-03-18 11:13

笔记:代码随想录算法训练营day48:739. 每日温度\496.下一个更大元素 I\503.下一个更大元素II

学习资料:代码随想录单调栈适合找左边或右边比当前大或小的元素739.每日温度力扣题目链接大致意思为用栈存储当前值以及比当前的小的值,但后遇到比当前值大的值的时候再计算非常巧妙的是,最后需要等于0的时候,正好后面没有比当下大的数的那个数的位置的result保留为0,不用处理classSolution{public:vectordailyTemperatures(vector&temperatures

jingjingjing1111·2025-03-18 11:13

代码随想录算法训练营第一天 | LeetCode 704、27

文章目录前言一、LeetCode7041.闭区间2.开区间二、LeetCode271.暴力求解2.快慢指针总结前言LeetCode题目：704、27Takeaway：二分法边界处理、快慢指针一、LeetCode7041.闭区间定义target是在一个在左闭右闭的区间里，也就是[left,right]#includeclassSolution{public:intsearch(vector&nums

Bingjiaokong·2025-03-18 10:11

笔记：代码随想录算法训练营day55：LeetCode42. 接雨水、84.柱状图中最大的矩形

学习资料：代码随想录42.接雨水力扣题目链接暴力解法超时了，直接从双指针开始双指大概思路为创立两个数组记录两侧的最大值，这里的最大值是真正的最大的值，而不是最近的那个比较大的值，即所谓的按列计算，后面单调栈方法找到的是上一个较大值和下一个较大值，是所谓的按行计算，这样这个凹槽可能身处更大的凹槽中，所以每次都要乘一个宽度，类似与按层往上摞classSolution{public:inttrap(ve

jingjingjing1111·2025-03-18 10:38

代码随想录算法训练营第六十五天| 图论10

Bellman_ford队列优化算法（又名SPFA）代码随想录importcollectionsdefmain():n,m=map(int,input().strip().split())edges=[[]for_inrange(n+1)]for_inrange(m):src,dest,weight=map(int,input().strip().split())edges[src].append

Rachela_z·2025-03-18 10:34

智能科技助力健康生活：开启体育与健身的新纪元

从智能穿戴设备到虚拟现实训练系统，技术的进步为人们提供了前所未有的健身体验。而今天，我们将探讨一款强大的智能化工具——它不仅仅适用于编程开发，更能在体育与健身领域发挥巨大作用，帮助我们实现更加高效、科

inscode_010·2025-03-18 09:59

大模型与自然语言理解（NLU）：差异与联系

它们通过海量文本数据进行训练，旨在学习语言的统计规律，并能够生成流畅、连贯的文本。NLU:是NLP的一个子领域，专注于让机器

技术流 Gavin·2025-03-18 09:59

技术解析麦萌短剧《阴阳无极》：从「性别偏见下的对抗训练」到「分布式江湖的架构重构」

1.初始模型偏差：继承权剥夺与梯度冻结陈千叶（Agent_C）的成长可视为有偏数据集上的训练：特征歧视：太极门继承规则（Legacy_Rule）作为传统分类器，强行将性别（Gender_Feature）

短剧萌·2025-03-18 08:15

推荐频道

2018寒假训练