E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
TRAIN
yolo模型coco数据集详解
深度学习文章目录深度学习前言前言instances_
train
2017.json和instances_val2017.json文件均分为五大部分,这五部分对应的关键字分别为info、licenses、images
工头阿乐
·
2025-03-19 02:38
深度学习
YOLO
pytorch的使用:卷积神经网络模块
input_size=28#图像的总尺寸28*28num_classes=10#标签的种类数num_epochs=3#训练的总循环周期batch_size=64#一个撮(批次)的大小,64张图片#训练集
train
_dataset
樱花的浪漫
·
2025-03-18 00:11
pytorch
cnn
pytorch
深度学习
计算机视觉
【人工智能】【Python】在Scikit-Learn中使用决策树算法(ID3和CART)
importnumpyasnpimportmatplotlib.pyplotaspltfromsklearn.datasetsimportload_irisfromsklearn.model_selectionimport
train
_test_splitfromsklearn.treeimportDecisionTreeClassifier
SmallBambooCode
·
2025-03-17 20:08
机器学习
人工智能
python
算法
scikit-learn
决策树
机器学习
ai
【源码阅读】olmocr中的prompts
目录一、PDF转换为训练数据二、使用微调模型三、比较差异总结一、PDF转换为训练数据让ChatGPT-4将文档(如PDF文件)转换为结构化的“银级”训练数据(silver
train
ingdata)#Thisisthepromptweuseforgettingchatgpt4otoconvertdocumentsintooursilver
train
ingdatadefbuild_openai_sil
海绵波波107
·
2025-03-17 17:46
#
大模型
pdf
训练数据重复采样,让正负样本比例1:1
如果n_
train
_num小于max_
train
_num,res
kimi-222
·
2025-03-17 14:24
机器学习
人工智能
深度学习
数据读取错误:RuntimeError: The size of tensor a (3) must match the size of tensor b (4) at non-singleton
去除4通道图像:importcv2importosimportshutilfolder_path=R'F:\bounding_box_test\bounding_box_
train
'#更改为存储图片文件夹的路径
hitsz_syl
·
2025-03-17 07:07
单例模式
计算机视觉
opencv
95.HarmonyOS NEXT 图片约束处理教程:深入理解Cons
train
HarmonyOSNEXT图片约束处理教程:深入理解Cons
train
1.图片约束基础1.1核心概念概念说明应用场景图片适配类型定义图片如何适应容器图片展示方式偏移约束限制图片移动范围拖拽和缩放边界检测判断是否超出显示范围图片浏览
·
2025-03-17 01:15
harmonyos-next
关于stable diffusion的lora训练在linux远程工作站的部署
在学校Arc中部署lora
train
ing,一大问题就是依赖缺失和冲突。可以利用miniconda或者anaconda建立虚拟环境来解决。
回天一梦
·
2025-03-16 19:02
stable
diffusion
python
经验分享
pandas寻找四分位数及判断离群点
importpandasaspd
train
_df=pd.read_csv("
train
.csv")q1,q3=
train
_df['price'].quantile([0.25,0.75])iqr=q3-
SXxtyz
·
2025-03-16 18:57
python
三个简单最短路
题目一:E-
Train
题目链接:E-
Train
给定N个编号为1至N的城市以及M条铁路。
L_M_TY
·
2025-03-16 12:08
算法
最短路
Dijkstra
Floyd
Matlab多种算法解决未来杯B的多分类问题
fori=1:length(modelNames)switchmodelNames{i}case'MultinomialLogisticRegression'B=mnrfit(X_
train
,Y_
train
Subject.625Ruben
·
2025-03-16 06:05
算法
分类
机器学习
数学建模
未来杯
matlab
人工智能
**ResNet-SE + MFCC** 训练框架,包括 **数据加载、训练流程**,以及 **混淆矩阵** 可视化示例
pipinstalltorchtorchaudiotorchvisionscikit-learnmatplotlibtqdm2.数据加载这里假设你有一个音频分类数据集,其文件结构如下:dataset/│──
train
大霸王龙
·
2025-03-15 19:10
系统分析业务
矩阵
python
线性代数
人工智能
机器学习
深度学习
LLM之Colossal-LLaMA-2:源码解读(init_tokenizer.py文件)实现基于源词表的扩展、(init_model.py文件)实现过计算均值扩展模型、(prepare_pretr
→for循环去重实现词表的扩展(中文标记的新词汇)→保存新的分词模型、(init_model.py文件)实现过计算均值来扩展模型的嵌入层以适应新的词汇表,然后保存扩展后的模型、(prepare_pre
train
_dataset.py
一个处女座的程序猿
·
2025-03-15 18:38
CaseCode
NLP/LLMs
精选(人工智能)-中级
Colossal
LLaMA-2
自然语言处理
LLMs之Colossal-LLaMA-2:源码解读(
train
.py文件)基于给定数据集实现持续预训练LLaMA-2—解析命令行参数→初始化配置(分布式训练环境colossalai+训练日志+加速插
LLMs之Colossal-LLaMA-2:源码解读(
train
.py文件)基于给定数据集实现持续预训练LLaMA-2—解析命令行参数→初始化配置(分布式训练环境colossalai+训练日志+加速插件
一个处女座的程序猿
·
2025-03-15 18:38
NLP/LLMs
精选(人工智能)-中级
Colossal-AI
LLaMA-2
大语言模型
自然语言处理
模型的秘密武器:利用注意力改善长上下文推理能力
今天,我们就以《AttentionRevealsMoreThanTokens:
Train
ing-FreeLong-ContextReasoningwithAttention-guidedRetrieval
步子哥
·
2025-03-15 16:51
人工智能
自然语言处理
深度学习
语言模型
【Transformer-Hugging Face手册 07/10】 微调预训练模型
2.1加载数据2.2训练2.2.1使用PyTorch
Train
er进行训练2.3训练超参数2.4评价2.5训练类三、使用Keras训练TensorFlow模型3.1为Keras加载数据3.2将数据加载为
无水先生
·
2025-03-15 13:54
人工智能高级阶段
人工智能综合
transformer
深度学习
人工智能
数据标注工具及其对预训练模型性能的影响
1.背景介绍1.1预训练模型的崛起近年来,预训练模型(Pre-
train
edModels)在自然语言处理(NLP)领域取得了显著的成功。
AGI大模型与大数据研究院
·
2025-03-15 10:00
DeepSeek
R1
&
大数据AI人工智能
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
RV1126笔记三十七:PaddleOCR检测模型训练
PaddleOCR检测模型训练及验证测试1、准备数据集在PaddleOCR目录下新建文件夹:
train
_data,这个文件夹用于存放数据集的。
殷忆枫
·
2025-03-15 05:16
RV1126项目实战
笔记
mybatisSql拼接报错
Column'id'inwhereclauseisambiguous;nestedexceptionisjava.sql.SQLIntegrityCons
train
tViolationException
严欣铷
·
2025-03-15 01:35
sql
mybatis
数据库
普通人如何利用GPT赚钱之开发虚拟助手
普通人如何利用GPT赚钱之开发虚拟助手随着人工智能技术的迅猛发展,GPT(GenerativePre-
train
edTransformer)作为一种强大的语言模型,正在改变我们的生活和工作方式。
贫苦游商
·
2025-03-14 12:53
普通人利用AI搞钱系列
gpt
人工智能
深度学习
机器人
AIGC
Spring Boot 参数校验异常与错误编码映射方案
表示公共模块参数校验错误中的第一个错误)配置文件(application.yml)yaml复制error:codes:#公共模块错误码common:param_invalid:1000#校验子错误码cons
train
ts
robin-cloud
·
2025-03-14 12:49
spring
spring
boot
spring
cloud
基于python的手写数字识别knn_用sklearn中的KNN实现Kaggle手写数字识别
importcsvfromsklearnimportneighbors#导入训练数据和测试数据defloadData(filename1,filename2,
train
DataSet,
train
TargetSet
普和司
·
2025-03-14 02:41
图像去雾常见数据集
该数据集提供了多种规模的子数据集,主要分为以下几部分:Indoor
Train
i
梦姐的编程日志
·
2025-03-13 13:09
图像处理
深度学习
人工智能
普通人怎么利用GPT赚钱之创建自动化工具
对于普通人来说,利用GPT(GenerativePre-
train
edTransformer)这样的语言模型来创建自动化工具,并通过这些工具赚钱,已经成为一种切实可行的方法。
贫苦游商
·
2025-03-13 11:24
普通人利用AI搞钱系列
gpt
自动化
运维
人工智能
算法
机器学习
LLM填坑:训练自己的分词器-Tokenizer
paper:https://zhuanlan.zhihu.com/p/625715830code:Chatterbox/example/
Train
TokenizersExample/
train
_tokenizers.pyatmain
微风❤水墨
·
2025-03-13 08:53
LLM
&
AIGC
&
VLP
人工智能
使用 Up
Train
提升 LLM 应用效果的实战指南
Up
Train
作为一个开源平台,提供了一系列评估功能,使得开发者能够对LLM应用进行全面的检测,并提供问题解决的指导。
qahaj
·
2025-03-13 04:30
python
《Operating System Concepts》阅读笔记:p228-p257
基于以上几个因素,选择依据为:(1)MaximizingCPUutilizationunderthecons
train
tthatt
codists
·
2025-03-13 01:34
读书笔记
操作系统
【论文阅读】Learning Transferable Visual Models From Natural Language Supervision(2021)
摘要State-of-the-art(最先进的)computervisionsystems(计算机视觉系统)are
train
edtopredictafixedsetofpredeterminedobjectcategories
Bosenya12
·
2025-03-13 01:02
论文阅读
基于hf的trl框架的deepseek-r1-zero实现与训练
importreimporttorchfromdatasetsimportload_dataset,DatasetfromtransformersimportAutoTokenizer,AutoModelForCausalLMfromtrlimportGRPOConfig,GRPO
Train
er
喂喂喂喂位
·
2025-03-12 20:00
deepseek
python
AIGC
运行PaddleOCR时遇到的一些问题汇总
官方文档提供了PaddleOCR的各类用例说明,但是使用中仍然会有一些问题,这里做一些总结和整理跑通
train
.py代码pythontools/
train
.py-cconfigs/rec/PP-OCRv3
江木27
·
2025-03-12 15:27
PaddleOCR
python
ocr
计算机视觉
图像处理
paddle
weka 决策树
-synopsisor-infoOutputsynopsisforclassifier(useinconjunctionwith-h)-t(
train
file,训练文件,通常训练时只需要此文件即可,会进行
marui1982
·
2025-03-12 11:03
机器学习
51-53 CVPR 2024 | DriveWorld:通过自动驾驶世界模型进行 4D 预训练场景理解 (含模型数据流梳理)
24年5月,北京大学、国防创新研究院无人系统技术研究中心、中国电信人工智能研究院联合发布了DriveWorld:4DPre-
train
edSceneUnderstandingviaWorldModelsforAutonomousDriving
深圳季连AIgraphX
·
2025-03-12 08:43
aiXpilot
智驾大模型1
自动驾驶
人工智能
AIGC
stable
diffusion
计算机视觉
智慧城市
使用OpenAI API实现自然语言处理应用
核心原理解析OpenAI的API基于强大的GPT(GenerativePre-
train
edTransform
shuoac
·
2025-03-12 04:06
自然语言处理
人工智能
python
Bert的使用
Data.py#data负责产生两个dataloaderfromtorch.utils.dataimportDataLoader,Datasetfromsklearn.model_selectionimport
train
_test_split
巨鹿..
·
2025-03-12 00:31
深度学习记录
bert
人工智能
深度学习
一学就会的深度学习基础指令及操作步骤(5)使用预训练模型
fromtorchvision.modelsimportvgg16#VGG16模型架构的定义fromtorchvision.modelsimportVGG16_Weights#VGG16的预训练权重配置#loadtheVGG16network*pre-
train
ed
小圆圆666
·
2025-03-11 19:53
深度学习
人工智能
python
卷积神经网络
AI应用基于DJL开发WEB应用对鞋分类进行预测和推理------AI
importai.djl.translate.TranslateException;importcom.alatus.djl.service.InterferenceService;importcom.alatus.djl.service.
Train
Service
旧约Alatus
·
2025-03-11 18:49
#
AI
#
Spring-Boot框架
spring
boot
微服务
spring
cloud
后端
mybatis
stable
diffusion
chatgpt
SeisMoLLM: Advancing Seismic Monitoring via Cross-modal Transfer with Pre-
train
ed Large Language
摘要深度学习的最新进展给地震监测带来了革命性变化,但开发一个能在多个复杂任务中表现出色的基础模型仍然充满挑战,尤其是在处理信号退化或数据稀缺的情况时。本文提出SeisMoLLM,这是首个利用跨模态迁移进行地震监测的基础模型,它无需在地震数据集上进行直接预训练,就能充分发挥大规模预训练大语言模型的强大能力。通过精心设计的波形标记化处理和对预训练GPT-2模型的微调,SeisMoLLM在DiTing和
UnknownBody
·
2025-03-11 12:29
LLM
Daily
Multimodal
语言模型
人工智能
自然语言处理
git subtree 高频使用方法
高频使用方法官网添加新的子项目查看子项目的差异使用子项目克隆存储库引入超级项目更新改变分支引入子项目更新对子项目进行更改将更改推送到子项目存储库高效配置添加新的子项目subtreegitsubtreeadd--prefix=example-submodulehttps://github.com/github
train
ing
NickDeCodes
·
2025-03-11 12:59
git
git
github
Train
ing-Free Transformer Architecture Search WithZero-Cost Proxy Guided Evolution(预览版本)
摘要Transformers已表现出卓越的性能,然而,其架构设计是一个耗时的过程,需要专业知识和反复试验。因此,研究通过Transformer架构搜索(TAS)自动搜索高性能Transformers的有效方法是值得的。为了提高搜索效率,基于无训练代理的方法已在神经架构搜索(NAS)中得到广泛采用。然而,这些代理被发现不足以很好地推广到Transformer搜索空间,这一点已被多项研究和我们自己的实
境心镜
·
2025-03-10 18:05
transformer
深度学习
人工智能
Train
ing-free Neural Architecture Searchthrough Variance of Knowledge of Deep Network Weights(预览版本)
代码位置摘要深度学习彻底改变了计算机视觉,但它使用深度网络架构取得了巨大的成功,而这些架构大多是手工制作的,因此可能不是最理想的。神经架构搜索(NAS)旨在通过遵循明确定义的优化范式来弥补这一差距,该范式系统地寻找最佳架构,给定客观标准,例如最大分类准确度。然而,NAS的主要限制是其天文数字般的计算成本,因为它通常需要从头开始训练每个候选网络架构。在本文中,我们旨在通过基于Fisher信息提出一种
境心镜
·
2025-03-10 08:54
免训练
深度学习
人工智能
NAS
AIGC实战——Transformer模型
AIGC实战——Transformer模型0.前言1.T52.GPT-3和GPT-43.ChatGPT小结系列链接0.前言我们在GPT(GenerativePre-
train
edTransformer)
盼小辉丶
·
2025-03-10 01:31
AIGC
transformer
深度学习
AI芯片概述-分类、应用、技术(APU、CPU、DPU、GPU、NPU和TPU)及厂家
二、AI芯片分类1.
Train
ing(训练)2.Inference(推理)三、AI芯片应用领域四、AI芯片技术路线五、APU、CPU、DPU、GPU、NPU和TPU六、AI芯片厂家一、AI芯片是什么?
一码当前
·
2025-03-09 00:27
AI基础
人工智能
分类
数据挖掘
【MySQL】表的约束
在MySQL中,约束(Cons
train
ts)是指在创建表时规定的对表中数据进行限制的条件。它可以对表中某列或某几列添加一些限制条件,以保证表中的数据符合要求。MySQL中的约束包
小wanga
·
2025-03-09 00:46
MySQL
mysql
android
adb
1.6 从 GPT-1 到 GPT-3.5:一路的风云变幻
从GPT-1到GPT-3.5:一路的风云变幻人工智能的进步一直是科技领域的一个重要话题,而在自然语言处理(NLP)领域,GPT(GenerativePre-
train
edTransformer)系列模型的发布
少林码僧
·
2025-03-08 23:03
AI大模型应用实战专栏
gpt
gpt-3
BurpSuit官方实验室之SQL注入
BurpSuit官方实验室之SQL注入这是BurpSuit官方的实验室靶场,以下将记录个人SQL注入共17个Lab的通关过程WebSecurityAcademy:FreeOnline
Train
ingfromPortSwiggerlab1
tpaer
·
2025-03-08 19:52
从入门到入狱
web安全
sql
web
后端
数据库
大模型RAG入门到实战基础教程(非常详细),大模型RAG入门到精通,收藏这一篇就够了!
相对于成本昂贵的“Post
Train
”或“SFT”,基于RAG的技术方案往成为一种更优选择。本文从RAG架构入手,详细介绍相关技术细节,并附上一份实践案例。
AI程序猿人
·
2025-03-08 18:56
人工智能
AI大模型
AI
RAG
LLM
大语言模型
大模型入门
自然语言处理(NLP)领域大语言模型学习目录大全
GPT系列GPT-1(GenerativePre-
train
edTransformer1)模型GPT-1(GenerativePre-
train
edTransformer1)是OpenAI在2018年6
彬彬侠
·
2025-03-08 13:45
大模型
自然语言处理
NLP
大模型
LLM
GPT
BERT
GLM
【踩坑日记15】safetensors_rust.SafetensorError: Error while deserializing header: HeaderTooLarge
Errorwhiledeserializingheader:HeaderTooLargeFile"/home/XXX/code/dreambooth_lora/
train
_dreambooth_lora_sdxl_advanced.py
longii11
·
2025-03-07 08:55
开发语言
后端
yolov8训练模型、测试视频
1、训练代码
train
.pyimportos#os.environ["CUDA_VISIBLE_DEVICES"]="3"#同样是选择第3块GPUfromultralyticsimportYOLO#L
灰灰学姐
·
2025-03-06 21:12
深度学习
神经网络
YOLO
python
机器学习
探索未来文本的无限可能:OLMo 开源语言模型深度解析
探索未来文本的无限可能:OLMo开源语言模型深度解析OLMoModeling,
train
ing,eval,andinferencecodeforOLMo项目地址:https://gitcode.com/
钟洁祺
·
2025-03-06 14:33
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他