TRAIN 第2页

yolo模型coco数据集详解

深度学习文章目录深度学习前言前言instances_train2017.json和instances_val2017.json文件均分为五大部分，这五部分对应的关键字分别为info、licenses、images

工头阿乐·2025-03-19 02:38

pytorch的使用：卷积神经网络模块

input_size=28#图像的总尺寸28*28num_classes=10#标签的种类数num_epochs=3#训练的总循环周期batch_size=64#一个撮（批次）的大小，64张图片#训练集train_dataset

樱花的浪漫·2025-03-18 00:11

【人工智能】【Python】在Scikit-Learn中使用决策树算法（ID3和CART）

importnumpyasnpimportmatplotlib.pyplotaspltfromsklearn.datasetsimportload_irisfromsklearn.model_selectionimporttrain_test_splitfromsklearn.treeimportDecisionTreeClassifier

SmallBambooCode·2025-03-17 20:08

【源码阅读】olmocr中的prompts

目录一、PDF转换为训练数据二、使用微调模型三、比较差异总结一、PDF转换为训练数据让ChatGPT-4将文档（如PDF文件）转换为结构化的“银级”训练数据（silvertrainingdata）#Thisisthepromptweuseforgettingchatgpt4otoconvertdocumentsintooursilvertrainingdatadefbuild_openai_sil

海绵波波107·2025-03-17 17:46

训练数据重复采样，让正负样本比例1：1

如果n_train_num小于max_train_num，res

kimi-222·2025-03-17 14:24

数据读取错误：RuntimeError: The size of tensor a (3) must match the size of tensor b (4) at non-singleton

去除4通道图像：importcv2importosimportshutilfolder_path=R'F:\bounding_box_test\bounding_box_train'#更改为存储图片文件夹的路径

hitsz_syl·2025-03-17 07:07

95.HarmonyOS NEXT 图片约束处理教程：深入理解Constrain

HarmonyOSNEXT图片约束处理教程：深入理解Constrain1.图片约束基础1.1核心概念概念说明应用场景图片适配类型定义图片如何适应容器图片展示方式偏移约束限制图片移动范围拖拽和缩放边界检测判断是否超出显示范围图片浏览

·2025-03-17 01:15

关于stable diffusion的lora训练在linux远程工作站的部署

在学校Arc中部署loratraining，一大问题就是依赖缺失和冲突。可以利用miniconda或者anaconda建立虚拟环境来解决。

回天一梦·2025-03-16 19:02

pandas寻找四分位数及判断离群点

importpandasaspdtrain_df=pd.read_csv("train.csv")q1,q3=train_df['price'].quantile([0.25,0.75])iqr=q3-

SXxtyz·2025-03-16 18:57

三个简单最短路

题目一：E-Train题目链接：E-Train给定N个编号为1至N的城市以及M条铁路。

L_M_TY·2025-03-16 12:08

Matlab多种算法解决未来杯B的多分类问题

fori=1:length(modelNames)switchmodelNames{i}case'MultinomialLogisticRegression'B=mnrfit(X_train,Y_train

Subject.625Ruben·2025-03-16 06:05

ResNet-SE + MFCC 训练框架，包括数据加载、训练流程，以及混淆矩阵可视化示例

pipinstalltorchtorchaudiotorchvisionscikit-learnmatplotlibtqdm2.数据加载这里假设你有一个音频分类数据集，其文件结构如下：dataset/│──train

大霸王龙·2025-03-15 19:10

LLM之Colossal-LLaMA-2：源码解读(init_tokenizer.py文件)实现基于源词表的扩展、(init_model.py文件)实现过计算均值扩展模型、(prepare_pretr

→for循环去重实现词表的扩展(中文标记的新词汇)→保存新的分词模型、(init_model.py文件)实现过计算均值来扩展模型的嵌入层以适应新的词汇表，然后保存扩展后的模型、(prepare_pretrain_dataset.py

一个处女座的程序猿·2025-03-15 18:38

LLMs之Colossal-LLaMA-2：源码解读(train.py文件)基于给定数据集实现持续预训练LLaMA-2—解析命令行参数→初始化配置(分布式训练环境colossalai+训练日志+加速插

LLMs之Colossal-LLaMA-2：源码解读(train.py文件)基于给定数据集实现持续预训练LLaMA-2—解析命令行参数→初始化配置(分布式训练环境colossalai+训练日志+加速插件

一个处女座的程序猿·2025-03-15 18:38

模型的秘密武器：利用注意力改善长上下文推理能力

今天，我们就以《AttentionRevealsMoreThanTokens:Training-FreeLong-ContextReasoningwithAttention-guidedRetrieval

步子哥·2025-03-15 16:51

【Transformer-Hugging Face手册 07/10】微调预训练模型

2.1加载数据2.2训练2.2.1使用PyTorchTrainer进行训练2.3训练超参数2.4评价2.5训练类三、使用Keras训练TensorFlow模型3.1为Keras加载数据3.2将数据加载为

无水先生·2025-03-15 13:54

数据标注工具及其对预训练模型性能的影响

1.背景介绍1.1预训练模型的崛起近年来，预训练模型（Pre-trainedModels）在自然语言处理（NLP）领域取得了显著的成功。

AGI大模型与大数据研究院·2025-03-15 10:00

RV1126笔记三十七：PaddleOCR检测模型训练

PaddleOCR检测模型训练及验证测试1、准备数据集在PaddleOCR目录下新建文件夹：train_data,这个文件夹用于存放数据集的。

殷忆枫·2025-03-15 05:16

mybatisSql拼接报错

Column'id'inwhereclauseisambiguous;nestedexceptionisjava.sql.SQLIntegrityConstraintViolationException

严欣铷·2025-03-15 01:35

普通人如何利用GPT赚钱之开发虚拟助手

普通人如何利用GPT赚钱之开发虚拟助手随着人工智能技术的迅猛发展，GPT（GenerativePre-trainedTransformer）作为一种强大的语言模型，正在改变我们的生活和工作方式。

贫苦游商·2025-03-14 12:53

Spring Boot 参数校验异常与错误编码映射方案

表示公共模块参数校验错误中的第一个错误）配置文件（application.yml）yaml复制error:codes:#公共模块错误码common:param_invalid:1000#校验子错误码constraints

robin-cloud·2025-03-14 12:49

基于python的手写数字识别knn_用sklearn中的KNN实现Kaggle手写数字识别

importcsvfromsklearnimportneighbors#导入训练数据和测试数据defloadData(filename1,filename2,trainDataSet,trainTargetSet

普和司·2025-03-14 02:41

图像去雾常见数据集

该数据集提供了多种规模的子数据集，主要分为以下几部分：IndoorTraini

梦姐的编程日志·2025-03-13 13:09

普通人怎么利用GPT赚钱之创建自动化工具

对于普通人来说，利用GPT（GenerativePre-trainedTransformer）这样的语言模型来创建自动化工具，并通过这些工具赚钱，已经成为一种切实可行的方法。

贫苦游商·2025-03-13 11:24

LLM填坑：训练自己的分词器-Tokenizer

paper:https://zhuanlan.zhihu.com/p/625715830code:Chatterbox/example/TrainTokenizersExample/train_tokenizers.pyatmain

微风❤水墨·2025-03-13 08:53

使用 UpTrain 提升 LLM 应用效果的实战指南

UpTrain作为一个开源平台，提供了一系列评估功能，使得开发者能够对LLM应用进行全面的检测，并提供问题解决的指导。

qahaj·2025-03-13 04:30

《Operating System Concepts》阅读笔记：p228-p257

基于以上几个因素，选择依据为：(1)MaximizingCPUutilizationundertheconstraintthatt

codists·2025-03-13 01:34

【论文阅读】Learning Transferable Visual Models From Natural Language Supervision（2021）

摘要State-of-the-art（最先进的）computervisionsystems（计算机视觉系统）aretrainedtopredictafixedsetofpredeterminedobjectcategories

Bosenya12·2025-03-13 01:02

基于hf的trl框架的deepseek-r1-zero实现与训练

importreimporttorchfromdatasetsimportload_dataset,DatasetfromtransformersimportAutoTokenizer,AutoModelForCausalLMfromtrlimportGRPOConfig,GRPOTrainer

喂喂喂喂位·2025-03-12 20:00

运行PaddleOCR时遇到的一些问题汇总

官方文档提供了PaddleOCR的各类用例说明，但是使用中仍然会有一些问题，这里做一些总结和整理跑通train.py代码pythontools/train.py-cconfigs/rec/PP-OCRv3

江木27·2025-03-12 15:27

weka 决策树

-synopsisor-infoOutputsynopsisforclassifier(useinconjunctionwith-h)-t（trainfile，训练文件，通常训练时只需要此文件即可，会进行

marui1982·2025-03-12 11:03

51-53 CVPR 2024 | DriveWorld：通过自动驾驶世界模型进行 4D 预训练场景理解（含模型数据流梳理）

24年5月，北京大学、国防创新研究院无人系统技术研究中心、中国电信人工智能研究院联合发布了DriveWorld:4DPre-trainedSceneUnderstandingviaWorldModelsforAutonomousDriving

深圳季连AIgraphX·2025-03-12 08:43

使用OpenAI API实现自然语言处理应用

核心原理解析OpenAI的API基于强大的GPT（GenerativePre-trainedTransform

shuoac·2025-03-12 04:06

Bert的使用

Data.py#data负责产生两个dataloaderfromtorch.utils.dataimportDataLoader,Datasetfromsklearn.model_selectionimporttrain_test_split

巨鹿..·2025-03-12 00:31

一学就会的深度学习基础指令及操作步骤（5）使用预训练模型

fromtorchvision.modelsimportvgg16#VGG16模型架构的定义fromtorchvision.modelsimportVGG16_Weights#VGG16的预训练权重配置#loadtheVGG16network*pre-trained

小圆圆666·2025-03-11 19:53

AI应用基于DJL开发WEB应用对鞋分类进行预测和推理------AI

importai.djl.translate.TranslateException;importcom.alatus.djl.service.InterferenceService;importcom.alatus.djl.service.TrainService

旧约Alatus·2025-03-11 18:49

SeisMoLLM: Advancing Seismic Monitoring via Cross-modal Transfer with Pre-trained Large Language

UnknownBody·2025-03-11 12:29

git subtree 高频使用方法

高频使用方法官网添加新的子项目查看子项目的差异使用子项目克隆存储库引入超级项目更新改变分支引入子项目更新对子项目进行更改将更改推送到子项目存储库高效配置添加新的子项目subtreegitsubtreeadd--prefix=example-submodulehttps://github.com/githubtraining

NickDeCodes·2025-03-11 12:59

Training-Free Transformer Architecture Search WithZero-Cost Proxy Guided Evolution（预览版本）

摘要Transformers已表现出卓越的性能，然而，其架构设计是一个耗时的过程，需要专业知识和反复试验。因此，研究通过Transformer架构搜索(TAS)自动搜索高性能Transformers的有效方法是值得的。为了提高搜索效率，基于无训练代理的方法已在神经架构搜索(NAS)中得到广泛采用。然而，这些代理被发现不足以很好地推广到Transformer搜索空间，这一点已被多项研究和我们自己的实

境心镜·2025-03-10 18:05

Training-free Neural Architecture Searchthrough Variance of Knowledge of Deep Network Weights（预览版本）

代码位置摘要深度学习彻底改变了计算机视觉，但它使用深度网络架构取得了巨大的成功，而这些架构大多是手工制作的，因此可能不是最理想的。神经架构搜索(NAS)旨在通过遵循明确定义的优化范式来弥补这一差距，该范式系统地寻找最佳架构，给定客观标准，例如最大分类准确度。然而，NAS的主要限制是其天文数字般的计算成本，因为它通常需要从头开始训练每个候选网络架构。在本文中，我们旨在通过基于Fisher信息提出一种

境心镜·2025-03-10 08:54

AIGC实战——Transformer模型

AIGC实战——Transformer模型0.前言1.T52.GPT-3和GPT-43.ChatGPT小结系列链接0.前言我们在GPT(GenerativePre-trainedTransformer)

盼小辉丶·2025-03-10 01:31

AI芯片概述-分类、应用、技术（APU、CPU、DPU、GPU、NPU和TPU）及厂家

二、AI芯片分类1.Training(训练)2.Inference(推理)三、AI芯片应用领域四、AI芯片技术路线五、APU、CPU、DPU、GPU、NPU和TPU六、AI芯片厂家一、AI芯片是什么？

一码当前·2025-03-09 00:27

【MySQL】表的约束

在MySQL中，约束（Constraints）是指在创建表时规定的对表中数据进行限制的条件。它可以对表中某列或某几列添加一些限制条件，以保证表中的数据符合要求。MySQL中的约束包

小wanga·2025-03-09 00:46

1.6 从 GPT-1 到 GPT-3.5：一路的风云变幻

从GPT-1到GPT-3.5：一路的风云变幻人工智能的进步一直是科技领域的一个重要话题，而在自然语言处理（NLP）领域，GPT（GenerativePre-trainedTransformer）系列模型的发布

少林码僧·2025-03-08 23:03

BurpSuit官方实验室之SQL注入

BurpSuit官方实验室之SQL注入这是BurpSuit官方的实验室靶场，以下将记录个人SQL注入共17个Lab的通关过程WebSecurityAcademy:FreeOnlineTrainingfromPortSwiggerlab1

tpaer·2025-03-08 19:52

大模型RAG入门到实战基础教程（非常详细），大模型RAG入门到精通，收藏这一篇就够了！

相对于成本昂贵的“PostTrain”或“SFT”，基于RAG的技术方案往成为一种更优选择。本文从RAG架构入手，详细介绍相关技术细节，并附上一份实践案例。

AI程序猿人·2025-03-08 18:56

自然语言处理（NLP）领域大语言模型学习目录大全

GPT系列GPT-1（GenerativePre-trainedTransformer1）模型GPT-1（GenerativePre-trainedTransformer1）是OpenAI在2018年6

彬彬侠·2025-03-08 13:45

【踩坑日记15】safetensors_rust.SafetensorError: Error while deserializing header: HeaderTooLarge

Errorwhiledeserializingheader:HeaderTooLargeFile"/home/XXX/code/dreambooth_lora/train_dreambooth_lora_sdxl_advanced.py

longii11·2025-03-07 08:55

yolov8训练模型、测试视频

1、训练代码train.pyimportos#os.environ["CUDA_VISIBLE_DEVICES"]="3"#同样是选择第3块GPUfromultralyticsimportYOLO#L

灰灰学姐·2025-03-06 21:12

探索未来文本的无限可能：OLMo 开源语言模型深度解析

探索未来文本的无限可能：OLMo开源语言模型深度解析OLMoModeling,training,eval,andinferencecodeforOLMo项目地址:https://gitcode.com/

钟洁祺·2025-03-06 14:33

推荐频道

TRAIN