E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
train
一文说清楚什么是预训练(Pre-
Train
ing)、微调(Fine-Tuning),零基础小白建议收藏!!
前言预训练和微调是现代AI模型的核心技术,通过两者的结合,机器能够在处理复杂任务时表现得更为高效和精准。预训练为模型提供了广泛的语言能力,而微调则确保了模型能够根据特定任务进行细化和优化。近年来,人工智能(AI)在各个领域的突破性进展,尤其是在自然语言处理(NLP)方面,引起了广泛关注。两项重要的技术方法——预训练和微调,成为了AI模型发展的基石。预训练通常是指在大规模数据集上进行模型训练,以帮助
小城哇哇
·
2025-03-22 20:26
人工智能
语言模型
AI大模型
大模型微调
预训练
agi
LLM
Mysql 报错: (1364, “Field ‘id‘ doesn‘t have a default value“)
主要原因:在于主键表Id没有设置自增而报错,解决办法:设置主键自增会诱发另一个错误:Cannotchangecolumn'id':usedinaforeignkeycons
train
t在于主键id已存在外键关系
Lonelypatients°
·
2025-03-22 15:23
MySQL
mysql
MiniMind:完全从 0 训练自己的大模型
是B站UP主近在远方的远开源的一个微型语言模型,改进自DeepSeek-V2、Llama3结构,项目包含整个数据处理、pre
train
、sft、dpo的全部阶段,包含混合专家(MoE)模型。
三花AI
·
2025-03-22 15:49
三花AI
人工智能
LLM大模型
minimind2学习:(1)训练
1、数据下载参考:https://github.com/jingyaogong/minimind/tree/master2、预训练训练6个epochspython
train
_pre
train
.py--epochs6
溯源006
·
2025-03-22 14:47
minimind学习
学习
深度学习
生成模型
MiniMind
Pre
train
数据:这是用于预训练模型的数据集,它可以帮助模型学习语言的基本结构和特征。
亚伯拉罕·黄肯
·
2025-03-22 14:46
大模型
人工智能
LLMs之minimind:minimind源码解读(pre
train
.py)——实现基于Transformer架构的大规模语言模型预训练及wandb监控—支持余弦退火学习率调度/分布式预训练/自动混
LLMs之minimind:minimind源码解读(pre
train
.py)——实现基于Transformer架构的大规模语言模型预训练及wandb监控—支持余弦退火学习率调度/分布式预训练/自动混合精度优化
一个处女座的程序猿
·
2025-03-22 14:43
NLP/LLMs
CaseCode
transformer
minimind
预训练
【机会约束、鲁棒优化】机会约束和鲁棒优化研究优化【ccDCOPF】研究(Matlab代码实现)
本文目录如下:目录1概述机会约束、鲁棒优化与ccDCOPF研究综述1.机会约束规划(ChanceCons
train
edProgramming,CCP)在电力系统中的应用2.鲁棒优化(RobustOptimization
科研_G.E.M.
·
2025-03-22 11:48
matlab
概率论
开发语言
深度学习与目标检测系列(三) 本文约(4万字) | 全面解读复现AlexNet | Pytorch |
数据集翻译精读主要内容:ImageNet简介:图像处理方法:3.TheArchitecture—网络结构3.1ReLUNonlinearity—非线性激活函数ReLU翻译精读传统方法及不足本文改进方法本文的改进结果3.2
Train
ingonMultipleG
小酒馆燃着灯
·
2025-03-22 10:03
深度学习
目标检测
pytorch
AlexNet
人工智能
MySQL基本语句
删除数据库DROPDATABASEdatabase_name;1.3选择数据库USEdatabase_name;1.4创建表CREATETABLEtable_name( column1datatypecons
train
t
冉冉柟
·
2025-03-22 09:22
mysql
数据库
oracle
《深度剖析:BERT与GPT——自然语言处理架构的璀璨双星》
在自然语言处理(NLP)的广袤星空中,BERT(BidirectionalEncoderRepresentationsfromTransformers)与GPT(GenerativePre
train
edTransformer
·
2025-03-21 12:07
人工智能深度学习
机器学习课堂4线性回归模型+特征缩放
importpandasaspdimportnumpyasnpimportmatplotlib.pyplotasplt#参数设置iterations=3000#迭代次数learning_rate=0.0001#学习率m_
train
木尘152132
·
2025-03-21 09:17
机器学习
线性回归
python
数据分析_python进行数据筛选1_行筛选
的训练数据为例进行展示,为了简化取前十行为例首先导入模块,导入数据importpandasaspdimportnumpyasnpdf=pd.read_csv(r"C:\Users\admin\Desktop\
train
.csv
Monkey*王
·
2025-03-20 20:28
python
数据分析
pandas
A SURVEY ON POST-
TRAIN
ING OF LARGE LANGUAGE MODELS——大型语言模型的训练后优化综述——第9部分——应用
应用尽管预训练为大型语言模型(LLMs)赋予了强大的基础能力,但在部署于专业领域时,LLMs仍经常遇到持续的限制,包括上下文长度受限、容易产生幻觉(hallucination)、推理能力欠佳和固有的偏见。在现实世界的应用中,这些不足显得尤为重要,因为在这些场景中,精确性、可靠性和伦理一致性是至关重要的。这些问题引发了一些根本性的探讨:(1)如何系统地提高LLM的表现以满足特定领域的需求?(2)在实
王金-太想进步了
·
2025-03-19 19:31
语言模型
人工智能
自然语言处理
MySQL数据库外键约束:打开与关闭的艺术
其中,外键约束(ForeignKeyCons
train
ts)扮演着重要的角色。但是,是否在任何情况下启用外键约束都是最佳选择呢?本文将深入探讨MyS
master_chenchengg
·
2025-03-19 07:28
sql数据库
数据库
mysql
yolo模型coco数据集详解
深度学习文章目录深度学习前言前言instances_
train
2017.json和instances_val2017.json文件均分为五大部分,这五部分对应的关键字分别为info、licenses、images
工头阿乐
·
2025-03-19 02:38
深度学习
YOLO
pytorch的使用:卷积神经网络模块
input_size=28#图像的总尺寸28*28num_classes=10#标签的种类数num_epochs=3#训练的总循环周期batch_size=64#一个撮(批次)的大小,64张图片#训练集
train
_dataset
樱花的浪漫
·
2025-03-18 00:11
pytorch
cnn
pytorch
深度学习
计算机视觉
【人工智能】【Python】在Scikit-Learn中使用决策树算法(ID3和CART)
importnumpyasnpimportmatplotlib.pyplotaspltfromsklearn.datasetsimportload_irisfromsklearn.model_selectionimport
train
_test_splitfromsklearn.treeimportDecisionTreeClassifier
SmallBambooCode
·
2025-03-17 20:08
机器学习
人工智能
python
算法
scikit-learn
决策树
机器学习
ai
【源码阅读】olmocr中的prompts
目录一、PDF转换为训练数据二、使用微调模型三、比较差异总结一、PDF转换为训练数据让ChatGPT-4将文档(如PDF文件)转换为结构化的“银级”训练数据(silver
train
ingdata)#Thisisthepromptweuseforgettingchatgpt4otoconvertdocumentsintooursilver
train
ingdatadefbuild_openai_sil
海绵波波107
·
2025-03-17 17:46
#
大模型
pdf
训练数据重复采样,让正负样本比例1:1
如果n_
train
_num小于max_
train
_num,res
kimi-222
·
2025-03-17 14:24
机器学习
人工智能
深度学习
数据读取错误:RuntimeError: The size of tensor a (3) must match the size of tensor b (4) at non-singleton
去除4通道图像:importcv2importosimportshutilfolder_path=R'F:\bounding_box_test\bounding_box_
train
'#更改为存储图片文件夹的路径
hitsz_syl
·
2025-03-17 07:07
单例模式
计算机视觉
opencv
95.HarmonyOS NEXT 图片约束处理教程:深入理解Cons
train
HarmonyOSNEXT图片约束处理教程:深入理解Cons
train
1.图片约束基础1.1核心概念概念说明应用场景图片适配类型定义图片如何适应容器图片展示方式偏移约束限制图片移动范围拖拽和缩放边界检测判断是否超出显示范围图片浏览
·
2025-03-17 01:15
harmonyos-next
关于stable diffusion的lora训练在linux远程工作站的部署
在学校Arc中部署lora
train
ing,一大问题就是依赖缺失和冲突。可以利用miniconda或者anaconda建立虚拟环境来解决。
回天一梦
·
2025-03-16 19:02
stable
diffusion
python
经验分享
pandas寻找四分位数及判断离群点
importpandasaspd
train
_df=pd.read_csv("
train
.csv")q1,q3=
train
_df['price'].quantile([0.25,0.75])iqr=q3-
SXxtyz
·
2025-03-16 18:57
python
三个简单最短路
题目一:E-
Train
题目链接:E-
Train
给定N个编号为1至N的城市以及M条铁路。
L_M_TY
·
2025-03-16 12:08
算法
最短路
Dijkstra
Floyd
Matlab多种算法解决未来杯B的多分类问题
fori=1:length(modelNames)switchmodelNames{i}case'MultinomialLogisticRegression'B=mnrfit(X_
train
,Y_
train
Subject.625Ruben
·
2025-03-16 06:05
算法
分类
机器学习
数学建模
未来杯
matlab
人工智能
**ResNet-SE + MFCC** 训练框架,包括 **数据加载、训练流程**,以及 **混淆矩阵** 可视化示例
pipinstalltorchtorchaudiotorchvisionscikit-learnmatplotlibtqdm2.数据加载这里假设你有一个音频分类数据集,其文件结构如下:dataset/│──
train
大霸王龙
·
2025-03-15 19:10
系统分析业务
矩阵
python
线性代数
人工智能
机器学习
深度学习
LLM之Colossal-LLaMA-2:源码解读(init_tokenizer.py文件)实现基于源词表的扩展、(init_model.py文件)实现过计算均值扩展模型、(prepare_pretr
→for循环去重实现词表的扩展(中文标记的新词汇)→保存新的分词模型、(init_model.py文件)实现过计算均值来扩展模型的嵌入层以适应新的词汇表,然后保存扩展后的模型、(prepare_pre
train
_dataset.py
一个处女座的程序猿
·
2025-03-15 18:38
CaseCode
NLP/LLMs
精选(人工智能)-中级
Colossal
LLaMA-2
自然语言处理
LLMs之Colossal-LLaMA-2:源码解读(
train
.py文件)基于给定数据集实现持续预训练LLaMA-2—解析命令行参数→初始化配置(分布式训练环境colossalai+训练日志+加速插
LLMs之Colossal-LLaMA-2:源码解读(
train
.py文件)基于给定数据集实现持续预训练LLaMA-2—解析命令行参数→初始化配置(分布式训练环境colossalai+训练日志+加速插件
一个处女座的程序猿
·
2025-03-15 18:38
NLP/LLMs
精选(人工智能)-中级
Colossal-AI
LLaMA-2
大语言模型
自然语言处理
模型的秘密武器:利用注意力改善长上下文推理能力
今天,我们就以《AttentionRevealsMoreThanTokens:
Train
ing-FreeLong-ContextReasoningwithAttention-guidedRetrieval
步子哥
·
2025-03-15 16:51
人工智能
自然语言处理
深度学习
语言模型
【Transformer-Hugging Face手册 07/10】 微调预训练模型
2.1加载数据2.2训练2.2.1使用PyTorch
Train
er进行训练2.3训练超参数2.4评价2.5训练类三、使用Keras训练TensorFlow模型3.1为Keras加载数据3.2将数据加载为
无水先生
·
2025-03-15 13:54
人工智能高级阶段
人工智能综合
transformer
深度学习
人工智能
数据标注工具及其对预训练模型性能的影响
1.背景介绍1.1预训练模型的崛起近年来,预训练模型(Pre-
train
edModels)在自然语言处理(NLP)领域取得了显著的成功。
AGI大模型与大数据研究院
·
2025-03-15 10:00
DeepSeek
R1
&
大数据AI人工智能
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
RV1126笔记三十七:PaddleOCR检测模型训练
PaddleOCR检测模型训练及验证测试1、准备数据集在PaddleOCR目录下新建文件夹:
train
_data,这个文件夹用于存放数据集的。
殷忆枫
·
2025-03-15 05:16
RV1126项目实战
笔记
mybatisSql拼接报错
Column'id'inwhereclauseisambiguous;nestedexceptionisjava.sql.SQLIntegrityCons
train
tViolationException
严欣铷
·
2025-03-15 01:35
sql
mybatis
数据库
普通人如何利用GPT赚钱之开发虚拟助手
普通人如何利用GPT赚钱之开发虚拟助手随着人工智能技术的迅猛发展,GPT(GenerativePre-
train
edTransformer)作为一种强大的语言模型,正在改变我们的生活和工作方式。
贫苦游商
·
2025-03-14 12:53
普通人利用AI搞钱系列
gpt
人工智能
深度学习
机器人
AIGC
Spring Boot 参数校验异常与错误编码映射方案
表示公共模块参数校验错误中的第一个错误)配置文件(application.yml)yaml复制error:codes:#公共模块错误码common:param_invalid:1000#校验子错误码cons
train
ts
robin-cloud
·
2025-03-14 12:49
spring
spring
boot
spring
cloud
基于python的手写数字识别knn_用sklearn中的KNN实现Kaggle手写数字识别
importcsvfromsklearnimportneighbors#导入训练数据和测试数据defloadData(filename1,filename2,
train
DataSet,
train
TargetSet
普和司
·
2025-03-14 02:41
图像去雾常见数据集
该数据集提供了多种规模的子数据集,主要分为以下几部分:Indoor
Train
i
梦姐的编程日志
·
2025-03-13 13:09
图像处理
深度学习
人工智能
普通人怎么利用GPT赚钱之创建自动化工具
对于普通人来说,利用GPT(GenerativePre-
train
edTransformer)这样的语言模型来创建自动化工具,并通过这些工具赚钱,已经成为一种切实可行的方法。
贫苦游商
·
2025-03-13 11:24
普通人利用AI搞钱系列
gpt
自动化
运维
人工智能
算法
机器学习
LLM填坑:训练自己的分词器-Tokenizer
paper:https://zhuanlan.zhihu.com/p/625715830code:Chatterbox/example/
Train
TokenizersExample/
train
_tokenizers.pyatmain
微风❤水墨
·
2025-03-13 08:53
LLM
&
AIGC
&
VLP
人工智能
使用 Up
Train
提升 LLM 应用效果的实战指南
Up
Train
作为一个开源平台,提供了一系列评估功能,使得开发者能够对LLM应用进行全面的检测,并提供问题解决的指导。
qahaj
·
2025-03-13 04:30
python
《Operating System Concepts》阅读笔记:p228-p257
基于以上几个因素,选择依据为:(1)MaximizingCPUutilizationunderthecons
train
tthatt
codists
·
2025-03-13 01:34
读书笔记
操作系统
【论文阅读】Learning Transferable Visual Models From Natural Language Supervision(2021)
摘要State-of-the-art(最先进的)computervisionsystems(计算机视觉系统)are
train
edtopredictafixedsetofpredeterminedobjectcategories
Bosenya12
·
2025-03-13 01:02
论文阅读
基于hf的trl框架的deepseek-r1-zero实现与训练
importreimporttorchfromdatasetsimportload_dataset,DatasetfromtransformersimportAutoTokenizer,AutoModelForCausalLMfromtrlimportGRPOConfig,GRPO
Train
er
喂喂喂喂位
·
2025-03-12 20:00
deepseek
python
AIGC
运行PaddleOCR时遇到的一些问题汇总
官方文档提供了PaddleOCR的各类用例说明,但是使用中仍然会有一些问题,这里做一些总结和整理跑通
train
.py代码pythontools/
train
.py-cconfigs/rec/PP-OCRv3
江木27
·
2025-03-12 15:27
PaddleOCR
python
ocr
计算机视觉
图像处理
paddle
weka 决策树
-synopsisor-infoOutputsynopsisforclassifier(useinconjunctionwith-h)-t(
train
file,训练文件,通常训练时只需要此文件即可,会进行
marui1982
·
2025-03-12 11:03
机器学习
51-53 CVPR 2024 | DriveWorld:通过自动驾驶世界模型进行 4D 预训练场景理解 (含模型数据流梳理)
24年5月,北京大学、国防创新研究院无人系统技术研究中心、中国电信人工智能研究院联合发布了DriveWorld:4DPre-
train
edSceneUnderstandingviaWorldModelsforAutonomousDriving
深圳季连AIgraphX
·
2025-03-12 08:43
aiXpilot
智驾大模型1
自动驾驶
人工智能
AIGC
stable
diffusion
计算机视觉
智慧城市
使用OpenAI API实现自然语言处理应用
核心原理解析OpenAI的API基于强大的GPT(GenerativePre-
train
edTransform
shuoac
·
2025-03-12 04:06
自然语言处理
人工智能
python
Bert的使用
Data.py#data负责产生两个dataloaderfromtorch.utils.dataimportDataLoader,Datasetfromsklearn.model_selectionimport
train
_test_split
巨鹿..
·
2025-03-12 00:31
深度学习记录
bert
人工智能
深度学习
一学就会的深度学习基础指令及操作步骤(5)使用预训练模型
fromtorchvision.modelsimportvgg16#VGG16模型架构的定义fromtorchvision.modelsimportVGG16_Weights#VGG16的预训练权重配置#loadtheVGG16network*pre-
train
ed
小圆圆666
·
2025-03-11 19:53
深度学习
人工智能
python
卷积神经网络
AI应用基于DJL开发WEB应用对鞋分类进行预测和推理------AI
importai.djl.translate.TranslateException;importcom.alatus.djl.service.InterferenceService;importcom.alatus.djl.service.
Train
Service
旧约Alatus
·
2025-03-11 18:49
#
AI
#
Spring-Boot框架
spring
boot
微服务
spring
cloud
后端
mybatis
stable
diffusion
chatgpt
上一页
4
5
6
7
8
9
10
11
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他