E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
文本分类训练集
【Datawhale】AI夏令营第三期——基于论文摘要的
文本分类
笔记(上)
暑期参加了Datawhale的第三期AI夏令营,学习的是NLP方向,在此期间,我们通过比赛打榜的形式进行NLP的学习。今天,主要分享和记录一下这一期夏令营的学习历程和笔记。文章目录赛题背景赛题任务赛题数据集评价指标解题思路任务一:机器学习方法Baseline1.导入模块2.特征提取2.1基于TF-IDF提取2.2基于BOW2.3停用词3.划分数据集4.选择机器学习模型5.数据探索5.1使用pand
心无旁骛~
·
2023-09-02 11:00
深度学习基础
机器学习
机器学习
人工智能
自然语言处理
深度学习
【Datawhale】AI夏令营第三期——基于论文摘要的
文本分类
笔记(下)
笔记上部分请看【Datawhale】AI夏令营第三期——基于论文摘要的
文本分类
笔记(上)文章目录一、深度学习Topline1.1数据预处理1.2模型训练1.3评估模型1.4测试集推理1.5后续改进二、大模型
心无旁骛~
·
2023-09-02 11:58
深度学习基础
人工智能
人工智能
分类
笔记
ModaHub魔搭社区——决胜大模型时代,算力、网络、向量数据库缺一不可
高性能、高弹性与高稳定的算力,对于网络速度与稳定性要求也非常高,在
训练集
群中,一旦网络有波动
LCHub低代码社区
·
2023-09-02 10:26
《向量数据库指南》
数据库
人工智能
WinPlan
机器学习
向量数据库
MIlvus
Cloud
Milvus
YOLO数据集划分(
训练集
、验证集、测试集)
1.将
训练集
、验证集、测试集按照7:2:1随机划分1.项目准备1.在项目下新建一个py文件,名字就叫做splitDataset1.py2.将自己需要划分的原数据集就放在项目文件夹下面以我的为例,我的原数据集名字叫做
Dragon_0010
·
2023-09-02 02:13
YOLO
深度学习
机器学习
人工智能
python
[深度学习]1. 深度学习知识点汇总
深度学习常见知识点1.测试精度和训练精度在深度学习中,测试精度和训练精度是两个重要的指标,它们分别代表了模型在测试集上的分类正确率和
训练集
上的分类正确率。
MyLight1109
·
2023-09-01 21:23
深度学习
深度学习
人工智能
fasttext的简单介绍
测试facebook开源的基于深度学习的对
文本分类
的fastText模型fasttextpython包的安装:1pipinstallfasttext第一步获取分类文本,文本直接用的清华大学的新闻分本,
夜空中最亮的星_6c64
·
2023-09-01 14:42
基于yolov5的交通标志牌的目标检测研究——源码及文档
并将数据集进行分割,其中
训练集
:6664条;验证集:1919条,测试集:986条数据集。首先,部署好基于Pytorch的GPU
王小王-123
·
2023-09-01 14:01
YOLO
目标检测
人工智能
计算机视觉
交通标志牌
随机森林random forest
大概意思是,从
训练集
中随机抽样n个,然后将这n个组建成树,树按照特征值来划分左右树,寻找最优分类的左右树,按照Gini指数的计算问题,假如将原始数据集D切割两部分,分别为D1和D2,则Gini(D|切割
accosmos
·
2023-09-01 13:47
AI
随机森林
人工智能
算法
KNN(k邻近)
优点:精度高、对异常值不敏感、无数据输入假定缺点:计算复杂度高、空间复杂度高适用数据范围:数值型和标称型算法比较简单下面写两个例子:文本型
训练集
:importmathfromnumpyimport*from
accosmos
·
2023-09-01 13:14
AI
机器学习
文本标注技术方案(NLP标注工具)
它为
文本分类
、序列标记和序列到序列任务提供注释功能。您可以创建用于情感分析、命名实体识别、文本摘要等的标记数据。只需创建一个项目,上传数据,然后开始注释。您可以在数小时内构建数据集。
地铁程序员
·
2023-08-31 14:07
自然语言处理
人工智能
使用 BERT 进行
文本分类
(03/3)
一、说明在使用BERT(2)进行
文本分类
时,我们讨论了什么是PyTorch以及如何预处理我们的数据,以便可以使用BERT模型对其进行分析。在这篇文章中,我将向您展示如何训练分类器并对其进行评估。
无水先生
·
2023-08-31 11:45
LLM和ChatGPT
bert
分类
人工智能
[机器学习]分类算法系列①:初识概念
分类和回归数据集分类数据集回归数据集返回类型3、sklearn转换器和估计器3.1、转换器三种方法的区别3.2、估计器3.2.1、简介3.2.2、API3.3、工作流程1、概念整个系列中总共需要掌握的内容:知道数据集的分为
训练集
和测试集知道
逐梦苍穹
·
2023-08-31 08:35
人工智能
机器学习
分类
人工智能
分类算法
python
“Why Should I Trust You?” Explaining the Predictions of Any Classifier阅读笔记
2.背景[1]^{[1]}[1]3.LIME解释单个样本3.1总体思想3.2构建可解释的数据表示[1]^{[1]}[1]3.3可解释性和忠实度的权衡3.4局部采样3.5稀疏线性解释3.6使用SVM进行
文本分类
喝过期的拉菲
·
2023-08-31 02:22
深度学习
笔记
BERT 上的动态量化
BERT,或者说Transformers的双向嵌入表示法,是一种预训练语言表示法的新方法,可以在许多流行的自然语言处理(NLP)任务(例如问题解答,
文本分类
,和
yanglamei1962
·
2023-08-30 13:51
bert
人工智能
深度学习
COCO-stuff用法
image
训练集
图片train2017.zip、验证集图片val2017.zip,分别解压出train2017/和val2017/,然后统一放去images/(可以放软链接,见[5])。
HackerTom
·
2023-08-30 09:03
机器学习
COCO-stuff
COCO
python
dataset
中文情感分类
本文通过ChnSentiCorp数据集介绍了
文本分类
任务过程,主要使用预训练语言模型bert-base-chinese直接在测试集上进行测试,也简要介绍了模型训练流程,不过最后没有保存训练好的模型。
NLP工程化
·
2023-08-30 09:49
自然语言处理
文本分类
自然语言处理
PyTorch
Transformer
特征选择,归一化以及交叉验证中应当注意的问题
特征选择、归一化以及交叉验证中应当注意的问题前言为什么要划分
训练集
,验证集和测试集?是先做特征选择还是先划分
训练集
-验证集-测试集?是先做归一化还是先划分
训练集
-验证集-测试集?
MasterQKK 被注册
·
2023-08-30 08:51
Machine
Learning
工程
机器学习
深度学习
练瑜伽适合那些人群
宝妈族,瑜伽爱好者,一技之能,时间自由着户外瑜伽户外瑜伽户外瑜伽集中
训练集
中
训练集
中
训练集
中训练瑜伽最适合体重过高,身体过胖,失眠患者,精神压力过大,神经性头疼,胆固醇偏高的人,周身疼痛,全身酸痛,肩部以及颈部都感到酸痛
TB瑜伽
·
2023-08-30 04:53
Task3 基于机器学习的
文本分类
基于机器学习的
文本分类
在本章我们将开始使用机器学习模型来解决
文本分类
。机器学习发展比较广,且包括多个分支,本章侧重使用传统机器学习,从下一章开始是基于深度学习的
文本分类
。
ochipe
·
2023-08-30 04:56
桃子叶片病害识别(图像连续识别和视频识别,Python代码,pyTorch框架,深度卷积网络模型,很容易替换为其它模型,带有GUI识别界面)
数据集分为三类健康的桃子叶片,251张桃疮痂病一般,857张桃疮痂病严重,770张2.项目文件第一个文件夹(data):装载的是原始图像第二个文件夹(piture):装载的是经hf.py对data文件夹处理后,生成的
训练集
和测试
深度学习的奋斗者
·
2023-08-29 21:22
生物技术与深度学习结合
python
pytorch
开发语言
利用多种机器学习方法对爬取到的谷歌趋势某个关键词的每日搜索次数进行学习
目录(1)导入相关模块与爬取到的数据(2)划分
训练集
与测试集(3)保存真实值并对数据进行标准化(4)调用模块(5)回归交叉验证、计算评价指标(
带我去滑雪
·
2023-08-29 20:11
机器学习之python
机器学习
谷歌指数
如何基于自己训练的Yolov5权重,结合DeepSort实现目标跟踪
1、deepsort的
训练集
是否必须基于逐帧视频?我经过尝试,发现非连续性的图像仍可以作为
训练集
。一个实例(如指定某个人、某辆车等)对应一个train\test文件夹即可。当然,逐帧效果更佳。
测测爱绘绘
·
2023-08-29 08:40
图像处理
YOLO
目标跟踪
人工智能
《机器学习深度学习》实战训练营开课了
课程介绍:《机器学习深度学习》实战训练营开课了_哔哩哔哩_bilibili《机器学习深度学习》实战训练营开课了授课内容:机器学习,深度学习,
文本分类
,计算机视觉,时间序列预测课程目录:回归任务:基于机器学习大气数据的污染物
甜辣uu
·
2023-08-29 07:35
机器学习
深度学习
人工智能
时间序列预测
实战训练营
python
乱糟糟的YOLOv8-detect和pose训练自己的数据集
我之前搞v7的环境,直接pipinstallultralytics1.detect在detect文件夹下新建一个dataset放图片(jpg)和yolo格式的标签(txt)
训练集
和测试集直接分好,再新建一
思艺妄为
·
2023-08-29 06:58
YOLO
决策树(CLS, ID3, CART, 随机森林, 参数详解),一篇就够了
概念(引入Bootstrap/Bagging/RF)RF流程RF特点RF如何选Feature数量随机森林RF调参概况与基本概念概况原则:判断的越快越好,决策树尽量不要太深,保证好的泛化能力,同时又保证
训练集
上准确率
Machine Liang
·
2023-08-29 06:55
决策树
机器学习
算法
cart分类回归树
深度学习常见算法伪码
反向传播算法反向传播算法的三步骤(1)前馈计算每一层的净输入()和激活值(),直到最后一层;(2)反向传播计算每一层的误差项();(3)计算每一层参数的偏导数,并更新参数.算法伪码输入:
训练集
={(()
百步送剑
·
2023-08-29 05:04
学习
深度学习
关于disriminative 和 generative这两种模型
,如果使用NaiveBayes的话,不同特征x1,x2...之间相互独立的话,其实是很容易出现较大的偏差的,因为不同特征变量xi之间实际是存在联系的,并不是独立的当然,generativemodel在
训练集
很少
诚威_lol_中大努力中
·
2023-08-29 02:57
人工智能
人工智能
李宏毅机器学习中文课程作业一:预测PM2.5值
一、作业要求给定
训练集
train.csv,要求根据前9个小时的空气监测情况预测第10个小时的PM2.5含量。
idotc
·
2023-08-29 02:54
机器学习
机器学习
回归
预测
Task8 循环神经网络
利用Text-RNN模型来进行
文本分类
。RecurrentConvol
_一杯凉白开
·
2023-08-29 00:31
吴恩达机器学习——正则化
下图是一个回归问题的例子:第一个模型是一个线性模型,欠拟合,不能很好地适应我们的
训练集
;第三个模型是一个四次方的模型,过于强调拟合原始数据,而丢失了算法的本质:预测新数据。
SCY_e62e
·
2023-08-29 00:26
7月14、15日训练总结
射门练习要求在有对抗的条件下完成射门俱乐部内部教学比赛比赛进行中射门训练射门
训练集
体照
yueye张立博
·
2023-08-28 23:19
探索MediaPipe自定义机器学习模型
MediaPipe支持人脸识别、目标检测、图像分类、人像分割、手势识别、
文本分类
、语音分类。每个模块都有对应的模型,但是原有模型可能比较大、推理耗时比较长,我们可以自定义模型来进行进行优化。
徐福记456
·
2023-08-28 19:05
AI与ML
自定义MediPipe模型
Tensorflow2.0搭建网络八股
目录引言:keras与Tensorflow2.0结合一、六步法1.导入头文件:import2.收集处理
训练集
和测试集:train,test:3.描述各层网model=tf.keras.models.Sequential
孤狼灬笑
·
2023-08-28 12:48
tensorflow
人工智能
python
欠拟合和过拟合
欠拟合:所建的学习模型和
训练集
和测试集中均表现不佳,增加和组合特征改善过拟合:所建的学习模型在训练样本中表现优越,在测试数据集中表现不佳,增加并清洗数据(减少噪声),减少维度欠拟合解决方法:1.添加其他特征项
Vurtex
·
2023-08-28 10:02
深度学习在自然语言处理中的十大应用领域
文章目录1.机器翻译2.
文本分类
3.命名实体识别4.问答系统5.文本生成6.情感分析7.语言生成与处理8.信息检索与摘要9.文本纠错与修复10.智能对话系统总结欢迎来到AIGC人工智能专栏~深度学习在自然语言处理中的十大应用领域
IT·陈寒
·
2023-08-28 08:23
机器学习入门
AIGC人工智能
深度学习
自然语言处理
人工智能
自然语言处理(NLP)技术的例子
文本分类
:
文本分类
将文本分成不同的类别,它可以被应用到垃圾邮件过滤、新闻分类、社交媒体分析等领域。
AbelZ_01
·
2023-08-28 08:38
知识分享
自然语言处理
人工智能
专题2-改善深层神经网络:超参数调试、正则化以及优化Week1
创造高质量的
训练集
、验证集和测试集有助于提高循环效率。
训练集
/验证集/测试集的划分之前的小数据时代:
训练集
与测试集分别为70%与3
xiaobaoma
·
2023-08-28 06:27
从VAE到Diffusion生成模型详解(1):变分自编码器VAE
文章目录1.生成式模型简介2.PixelRNN/CNN3.VAE3.1自编码器AE3.2VAE基本原理3.3VAE公式推导4.参考1.生成式模型简介什么是生成式模型给定
训练集
,产生与
训练集
同分布的新样本
orangerfun
·
2023-08-28 06:55
计算机视觉
计算机视觉
图像分类之食物分类(NCWU机器学习课程设计)
2.1.3机器学习数据分析2.1.4机器学习模型部署2.2深度学习方法2.1.1深度学习数据处理2.1.2深度学习模型训练2.2.3深度学习数据分析2.2.4深度学习模型部署1.实验要求1.任务描述数据分为
训练集
Gosling123456
·
2023-08-28 06:25
机器学习
分类
深度学习
opencv
计算机视觉
(7)方差与偏差
度量了同样大小的
训练集
变动导致的学习性能的变化,刻画了数据扰动所造成的影响。偏差与方差另一个是噪声,表达了当前任务的学习算法所能达到的期望误差的下界,刻画了学习问题本身的难度。
顽皮的石头7788121
·
2023-08-28 05:16
文本分类
任务
文章目录引言1.
文本分类
-使用场景2.自定义类别任务3.贝叶斯算法3.1预备知识3.2贝叶斯公式3.3贝叶斯公式的应用3.4贝叶斯公式在NLP中的应用3.5贝叶斯公式-
文本分类
3.6代码实现3.7贝叶斯算法的优缺点
@kc++
·
2023-08-28 05:12
Natural
Language
Processing
分类
数据挖掘
人工智能
自然语言处理
python
深度学习
机器学习
ATT-CNN实现修改--循环变矩阵乘法
上周接触了一下
文本分类
,了解的不多,学习了一下ATT-CNN用于
文本分类
的代码,发现了一些问题,写这篇博客记录一下。首先描述下代码中实现
文本分类
(句子为单样本)的方式:1、中
愿better
·
2023-08-28 04:35
MVSNet 和 PatchMatchNet 的DTU数据集 几个不同之处 一定要注意
文章目录1测试集数据加载不同2
训练集
数量分辨率不同1测试集数据加载不同1.MVSNet的DTU测试数据集和PatchmatchNet测试数据集不一样;区别在于数据加载,前者cams文件最后是最小深度和间隔
R-G-B
·
2023-08-28 04:30
三维重建
MVS系列
DTU数据集不同之处
MVSNet的DTU数据集
PatchMatchNet
测试集
数据加载不同
训练集
数量
分辨率不同
机器学习理论笔记(二):数据集划分以及模型选择
文章目录1前言2经验误差与过拟合3
训练集
与测试集的划分方法3.1留出法(Hold-out)3.2交叉验证法(CrossValidation)3.3自助法(Bootstrap)4调参与最终模型5结语1前言欢迎来到蓝色是天的机器学习笔记专栏
蓝色是天
·
2023-08-27 23:34
蓝色是天的机器学习笔记
机器学习
笔记
人工智能
数据集
验证数据集
An Effective Deployment of Contrastive Learning in Multi-label Text Classification (ACL2023)
AnEffectiveDeploymentofContrastiveLearninginMulti-labelTextClassification(ACL2023)在多标签
文本分类
中一种有效的对比学习应用论文代码
CodeWang_NC
·
2023-08-27 21:55
文献阅读
人工智能
深度学习
论文阅读
统计学补充概念-15-k -最近邻(kNN)
在这种算法中,当要预测新样本的标签或数值时,它会查找与该样本最接近的
训练集
中的k个邻居,并根据这些邻居的标签(分类问题)或数值(回归问题)来进行预测。
丰。。
·
2023-08-27 14:22
统计学补充概念
统计学
数据分析
大数据
逻辑回归
机器学习实战之用 Scikit-Learn 正则化方法解决过拟合详解
你是不是在模型训练中遇到过这样的问题:在
训练集
上表现得极好,但在测试集上效果不佳?这就是过拟合的问题。过拟合是模型在训练过程中学到了数据的“噪声”而非规律,导致在未知数据上表现不佳。
Rocky006
·
2023-08-27 12:57
机器学习
scikit-learn
深度学习
自动化
人工智能
BERT 模型微调实战:使用Transformers微调BERT模型实现问答和
文本分类
任务
一、BERT介绍BERT(BidirectionalEncoderRepresentationsfromTransformers)是一种预训练的自然语言处理模型,由Google于2018年发布。BERT模型的核心是Transformer编码器,它可以在大规模语料库上进行无监督预训练,然后通过微调在各种NLP任务上进行微调。BERT模型是一种双向的深度学习模型,它可以同时考虑上下文中的所有单词,从而
技术狂潮AI
·
2023-08-27 08:24
LLM应用实战
bert
分类
人工智能
Bagging 和 Boosting 的区别
1)样本选择上:Bagging:
训练集
是在原始集中有放回选取的,从原始集中选出的各轮
训练集
之间是独立的。Boosting:每一轮的
训练集
不变,只是
训练集
中每个样例在分类器中的权重发生变化。
_曹杰
·
2023-08-26 21:29
机器学习的测试和验证(Machine Learning 研习之五)
更好的选择是将数据分为两组:
训练集
和测试集。顾名思义,您使用
训练集
训练模型,并使用测试集测试模型。新案例的错误率称为泛化错误(或样本外错误),通过在测试
甄齐才
·
2023-08-26 18:53
人工智能(AI)
机器学习
人工智能
测试集
训练集
数据集
神经网络
CNN
上一页
28
29
30
31
32
33
34
35
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他