train 第8页

一文说清楚什么是预训练（Pre-Training）、微调（Fine-Tuning），零基础小白建议收藏！！

前言预训练和微调是现代AI模型的核心技术，通过两者的结合，机器能够在处理复杂任务时表现得更为高效和精准。预训练为模型提供了广泛的语言能力，而微调则确保了模型能够根据特定任务进行细化和优化。近年来，人工智能（AI）在各个领域的突破性进展，尤其是在自然语言处理（NLP）方面，引起了广泛关注。两项重要的技术方法——预训练和微调，成为了AI模型发展的基石。预训练通常是指在大规模数据集上进行模型训练，以帮助

小城哇哇·2025-03-22 20:26

Mysql 报错: (1364, “Field ‘id‘ doesn‘t have a default value“)

主要原因:在于主键表Id没有设置自增而报错,解决办法:设置主键自增会诱发另一个错误:Cannotchangecolumn'id':usedinaforeignkeyconstraint在于主键id已存在外键关系

Lonelypatients°·2025-03-22 15:23

MiniMind：完全从 0 训练自己的大模型

是B站UP主近在远方的远开源的一个微型语言模型，改进自DeepSeek-V2、Llama3结构，项目包含整个数据处理、pretrain、sft、dpo的全部阶段，包含混合专家(MoE)模型。

三花AI·2025-03-22 15:49

minimind2学习：（1）训练

1、数据下载参考：https://github.com/jingyaogong/minimind/tree/master2、预训练训练6个epochspythontrain_pretrain.py--epochs6

溯源006·2025-03-22 14:47

MiniMind

Pretrain数据：这是用于预训练模型的数据集，它可以帮助模型学习语言的基本结构和特征。

亚伯拉罕·黄肯·2025-03-22 14:46

LLMs之minimind：minimind源码解读(pretrain.py)——实现基于Transformer架构的大规模语言模型预训练及wandb监控—支持余弦退火学习率调度/分布式预训练/自动混

LLMs之minimind：minimind源码解读(pretrain.py)——实现基于Transformer架构的大规模语言模型预训练及wandb监控—支持余弦退火学习率调度/分布式预训练/自动混合精度优化

一个处女座的程序猿·2025-03-22 14:43

【机会约束、鲁棒优化】机会约束和鲁棒优化研究优化【ccDCOPF】研究（Matlab代码实现）

本文目录如下：目录1概述机会约束、鲁棒优化与ccDCOPF研究综述1.机会约束规划（ChanceConstrainedProgramming,CCP）在电力系统中的应用2.鲁棒优化（RobustOptimization

科研_G.E.M.·2025-03-22 11:48

深度学习与目标检测系列(三) 本文约(4万字) | 全面解读复现AlexNet | Pytorch |

数据集翻译精读主要内容：ImageNet简介：图像处理方法：3.TheArchitecture—网络结构3.1ReLUNonlinearity—非线性激活函数ReLU翻译精读传统方法及不足本文改进方法本文的改进结果3.2TrainingonMultipleG

小酒馆燃着灯·2025-03-22 10:03

MySQL基本语句

删除数据库DROPDATABASEdatabase_name;1.3选择数据库USEdatabase_name;1.4创建表CREATETABLEtable_name( column1datatypeconstraint

冉冉柟·2025-03-22 09:22

《深度剖析：BERT与GPT——自然语言处理架构的璀璨双星》

在自然语言处理（NLP）的广袤星空中，BERT（BidirectionalEncoderRepresentationsfromTransformers）与GPT（GenerativePretrainedTransformer

·2025-03-21 12:07

机器学习课堂4线性回归模型+特征缩放

importpandasaspdimportnumpyasnpimportmatplotlib.pyplotasplt#参数设置iterations=3000#迭代次数learning_rate=0.0001#学习率m_train

木尘152132·2025-03-21 09:17

数据分析_python进行数据筛选1_行筛选

的训练数据为例进行展示，为了简化取前十行为例首先导入模块，导入数据importpandasaspdimportnumpyasnpdf=pd.read_csv(r"C:\Users\admin\Desktop\train.csv

Monkey*王·2025-03-20 20:28

A SURVEY ON POST-TRAINING OF LARGE LANGUAGE MODELS——大型语言模型的训练后优化综述——第9部分——应用

应用尽管预训练为大型语言模型（LLMs）赋予了强大的基础能力，但在部署于专业领域时，LLMs仍经常遇到持续的限制，包括上下文长度受限、容易产生幻觉（hallucination）、推理能力欠佳和固有的偏见。在现实世界的应用中，这些不足显得尤为重要，因为在这些场景中，精确性、可靠性和伦理一致性是至关重要的。这些问题引发了一些根本性的探讨：(1)如何系统地提高LLM的表现以满足特定领域的需求？(2)在实

王金-太想进步了·2025-03-19 19:31

MySQL数据库外键约束：打开与关闭的艺术

其中，外键约束（ForeignKeyConstraints）扮演着重要的角色。但是，是否在任何情况下启用外键约束都是最佳选择呢？本文将深入探讨MyS

master_chenchengg·2025-03-19 07:28

yolo模型coco数据集详解

深度学习文章目录深度学习前言前言instances_train2017.json和instances_val2017.json文件均分为五大部分，这五部分对应的关键字分别为info、licenses、images

工头阿乐·2025-03-19 02:38

pytorch的使用：卷积神经网络模块

input_size=28#图像的总尺寸28*28num_classes=10#标签的种类数num_epochs=3#训练的总循环周期batch_size=64#一个撮（批次）的大小，64张图片#训练集train_dataset

樱花的浪漫·2025-03-18 00:11

【人工智能】【Python】在Scikit-Learn中使用决策树算法（ID3和CART）

importnumpyasnpimportmatplotlib.pyplotaspltfromsklearn.datasetsimportload_irisfromsklearn.model_selectionimporttrain_test_splitfromsklearn.treeimportDecisionTreeClassifier

SmallBambooCode·2025-03-17 20:08

【源码阅读】olmocr中的prompts

目录一、PDF转换为训练数据二、使用微调模型三、比较差异总结一、PDF转换为训练数据让ChatGPT-4将文档（如PDF文件）转换为结构化的“银级”训练数据（silvertrainingdata）#Thisisthepromptweuseforgettingchatgpt4otoconvertdocumentsintooursilvertrainingdatadefbuild_openai_sil

海绵波波107·2025-03-17 17:46

训练数据重复采样，让正负样本比例1：1

如果n_train_num小于max_train_num，res

kimi-222·2025-03-17 14:24

数据读取错误：RuntimeError: The size of tensor a (3) must match the size of tensor b (4) at non-singleton

去除4通道图像：importcv2importosimportshutilfolder_path=R'F:\bounding_box_test\bounding_box_train'#更改为存储图片文件夹的路径

hitsz_syl·2025-03-17 07:07

95.HarmonyOS NEXT 图片约束处理教程：深入理解Constrain

HarmonyOSNEXT图片约束处理教程：深入理解Constrain1.图片约束基础1.1核心概念概念说明应用场景图片适配类型定义图片如何适应容器图片展示方式偏移约束限制图片移动范围拖拽和缩放边界检测判断是否超出显示范围图片浏览

·2025-03-17 01:15

关于stable diffusion的lora训练在linux远程工作站的部署

在学校Arc中部署loratraining，一大问题就是依赖缺失和冲突。可以利用miniconda或者anaconda建立虚拟环境来解决。

回天一梦·2025-03-16 19:02

pandas寻找四分位数及判断离群点

importpandasaspdtrain_df=pd.read_csv("train.csv")q1,q3=train_df['price'].quantile([0.25,0.75])iqr=q3-

SXxtyz·2025-03-16 18:57

三个简单最短路

题目一：E-Train题目链接：E-Train给定N个编号为1至N的城市以及M条铁路。

L_M_TY·2025-03-16 12:08

Matlab多种算法解决未来杯B的多分类问题

fori=1:length(modelNames)switchmodelNames{i}case'MultinomialLogisticRegression'B=mnrfit(X_train,Y_train

Subject.625Ruben·2025-03-16 06:05

ResNet-SE + MFCC 训练框架，包括数据加载、训练流程，以及混淆矩阵可视化示例

pipinstalltorchtorchaudiotorchvisionscikit-learnmatplotlibtqdm2.数据加载这里假设你有一个音频分类数据集，其文件结构如下：dataset/│──train

大霸王龙·2025-03-15 19:10

LLM之Colossal-LLaMA-2：源码解读(init_tokenizer.py文件)实现基于源词表的扩展、(init_model.py文件)实现过计算均值扩展模型、(prepare_pretr

→for循环去重实现词表的扩展(中文标记的新词汇)→保存新的分词模型、(init_model.py文件)实现过计算均值来扩展模型的嵌入层以适应新的词汇表，然后保存扩展后的模型、(prepare_pretrain_dataset.py

一个处女座的程序猿·2025-03-15 18:38

LLMs之Colossal-LLaMA-2：源码解读(train.py文件)基于给定数据集实现持续预训练LLaMA-2—解析命令行参数→初始化配置(分布式训练环境colossalai+训练日志+加速插

LLMs之Colossal-LLaMA-2：源码解读(train.py文件)基于给定数据集实现持续预训练LLaMA-2—解析命令行参数→初始化配置(分布式训练环境colossalai+训练日志+加速插件

一个处女座的程序猿·2025-03-15 18:38

模型的秘密武器：利用注意力改善长上下文推理能力

今天，我们就以《AttentionRevealsMoreThanTokens:Training-FreeLong-ContextReasoningwithAttention-guidedRetrieval

步子哥·2025-03-15 16:51

【Transformer-Hugging Face手册 07/10】微调预训练模型

2.1加载数据2.2训练2.2.1使用PyTorchTrainer进行训练2.3训练超参数2.4评价2.5训练类三、使用Keras训练TensorFlow模型3.1为Keras加载数据3.2将数据加载为

无水先生·2025-03-15 13:54

数据标注工具及其对预训练模型性能的影响

1.背景介绍1.1预训练模型的崛起近年来，预训练模型（Pre-trainedModels）在自然语言处理（NLP）领域取得了显著的成功。

AGI大模型与大数据研究院·2025-03-15 10:00

RV1126笔记三十七：PaddleOCR检测模型训练

PaddleOCR检测模型训练及验证测试1、准备数据集在PaddleOCR目录下新建文件夹：train_data,这个文件夹用于存放数据集的。

殷忆枫·2025-03-15 05:16

mybatisSql拼接报错

Column'id'inwhereclauseisambiguous;nestedexceptionisjava.sql.SQLIntegrityConstraintViolationException

严欣铷·2025-03-15 01:35

普通人如何利用GPT赚钱之开发虚拟助手

普通人如何利用GPT赚钱之开发虚拟助手随着人工智能技术的迅猛发展，GPT（GenerativePre-trainedTransformer）作为一种强大的语言模型，正在改变我们的生活和工作方式。

贫苦游商·2025-03-14 12:53

Spring Boot 参数校验异常与错误编码映射方案

表示公共模块参数校验错误中的第一个错误）配置文件（application.yml）yaml复制error:codes:#公共模块错误码common:param_invalid:1000#校验子错误码constraints

robin-cloud·2025-03-14 12:49

基于python的手写数字识别knn_用sklearn中的KNN实现Kaggle手写数字识别

importcsvfromsklearnimportneighbors#导入训练数据和测试数据defloadData(filename1,filename2,trainDataSet,trainTargetSet

普和司·2025-03-14 02:41

图像去雾常见数据集

该数据集提供了多种规模的子数据集，主要分为以下几部分：IndoorTraini

梦姐的编程日志·2025-03-13 13:09

普通人怎么利用GPT赚钱之创建自动化工具

对于普通人来说，利用GPT（GenerativePre-trainedTransformer）这样的语言模型来创建自动化工具，并通过这些工具赚钱，已经成为一种切实可行的方法。

贫苦游商·2025-03-13 11:24

LLM填坑：训练自己的分词器-Tokenizer

paper:https://zhuanlan.zhihu.com/p/625715830code:Chatterbox/example/TrainTokenizersExample/train_tokenizers.pyatmain

微风❤水墨·2025-03-13 08:53

使用 UpTrain 提升 LLM 应用效果的实战指南

UpTrain作为一个开源平台，提供了一系列评估功能，使得开发者能够对LLM应用进行全面的检测，并提供问题解决的指导。

qahaj·2025-03-13 04:30

《Operating System Concepts》阅读笔记：p228-p257

基于以上几个因素，选择依据为：(1)MaximizingCPUutilizationundertheconstraintthatt

codists·2025-03-13 01:34

【论文阅读】Learning Transferable Visual Models From Natural Language Supervision（2021）

摘要State-of-the-art（最先进的）computervisionsystems（计算机视觉系统）aretrainedtopredictafixedsetofpredeterminedobjectcategories

Bosenya12·2025-03-13 01:02

基于hf的trl框架的deepseek-r1-zero实现与训练

importreimporttorchfromdatasetsimportload_dataset,DatasetfromtransformersimportAutoTokenizer,AutoModelForCausalLMfromtrlimportGRPOConfig,GRPOTrainer

喂喂喂喂位·2025-03-12 20:00

运行PaddleOCR时遇到的一些问题汇总

官方文档提供了PaddleOCR的各类用例说明，但是使用中仍然会有一些问题，这里做一些总结和整理跑通train.py代码pythontools/train.py-cconfigs/rec/PP-OCRv3

江木27·2025-03-12 15:27

weka 决策树

-synopsisor-infoOutputsynopsisforclassifier(useinconjunctionwith-h)-t（trainfile，训练文件，通常训练时只需要此文件即可，会进行

marui1982·2025-03-12 11:03

51-53 CVPR 2024 | DriveWorld：通过自动驾驶世界模型进行 4D 预训练场景理解（含模型数据流梳理）

24年5月，北京大学、国防创新研究院无人系统技术研究中心、中国电信人工智能研究院联合发布了DriveWorld:4DPre-trainedSceneUnderstandingviaWorldModelsforAutonomousDriving

深圳季连AIgraphX·2025-03-12 08:43

使用OpenAI API实现自然语言处理应用

核心原理解析OpenAI的API基于强大的GPT（GenerativePre-trainedTransform

shuoac·2025-03-12 04:06

Bert的使用

Data.py#data负责产生两个dataloaderfromtorch.utils.dataimportDataLoader,Datasetfromsklearn.model_selectionimporttrain_test_split

巨鹿..·2025-03-12 00:31

一学就会的深度学习基础指令及操作步骤（5）使用预训练模型

fromtorchvision.modelsimportvgg16#VGG16模型架构的定义fromtorchvision.modelsimportVGG16_Weights#VGG16的预训练权重配置#loadtheVGG16network*pre-trained

小圆圆666·2025-03-11 19:53

AI应用基于DJL开发WEB应用对鞋分类进行预测和推理------AI

importai.djl.translate.TranslateException;importcom.alatus.djl.service.InterferenceService;importcom.alatus.djl.service.TrainService

旧约Alatus·2025-03-11 18:49

推荐频道

train