E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
文本分类训练集
GPT-1、GPT-2和GPT-3模型详解及其进化之路
GPT的核心思想是先通过无标签的文本去训练生成语言模型,再根据具体的NLP任务(如文本蕴涵、QA、
文本分类
等),来通过有标签的数据对模型进行fine-tuning。
-柚子皮-
·
2023-10-26 12:16
LLM
gpt
人工智能
大模型
GPT-2
大模型训练框架
taishan1994/pytorch-distributed-NLP:pytorch分布式训练(github.com)pytorch-distributed-NLPpytorch单机多卡分布式训练-中文
文本分类
Kun Li
·
2023-10-26 07:18
深度机器学习组件
算法部署
人工智能
深度学习
机器学习
分布式训练
BN层总结与实际作用
提出BN层的目的深度学习的一个重要假设是独立同分布假设(IID),这个假设不仅适用于
训练集
和测试集,也适用于同一网络的不同层之间,即假设每一层的输入在经过与权重相乘和非线性激活后,输出(即下一层的输入)
qq184861643
·
2023-10-26 07:32
#
deep-learning
deeplearning4j训练推理案例2023——手写数字识别
文章目录1.minist数据集2.依赖包3.手写数字训练与推理4.扩展阅读deeplearning4j自带学习案例项目deeplearning4j-examples1.minist数据集下载链接6W
训练集
jwolf2
·
2023-10-26 05:41
java
ai
deep
learning
【Gensim概念】01/3 NLP玩转 word2vec
它提供了一系列用于处理文本数据的算法和工具,包括主题建模、相似性计算、
文本分类
、聚类等。在人工智能和自然语言处理领域,Gensim是一个流行的工具,用于处理大量的文本和语料库。
无水先生
·
2023-10-26 02:37
NLP高级和ChatGPT
人工智能
自然语言处理
word2vec
人工智能
文本多任务分类
文本分类
是一个很普遍问题,但是往往同一个数据源有多个category需要进行分类。
远洋之帆
·
2023-10-26 01:45
机器学习
Text Classification via Large Language Models
Abstract表达大模型在
文本分类
上做的不好。原因:1、处理复杂语境时缺少推理能力。(e.g…类比、讽刺)2、限制学习的上下文的token数。
菜菜小堡
·
2023-10-25 07:07
1024程序员节
2018-06-29
python实现
文本分类
-CSDN博客;根据这个实现分类吧;编码问题真的很烦;彻底搞懂Python的字符编码-CSDN博客终于把分类的代码全写完了,不过,精确率是57%,哈哈哈哈哈,要不要这么低,是不是因为
训练集
比较少
哈uhau花花
·
2023-10-25 07:48
sklearn-5模型评估与改进
交叉验证特点1数据被多次划分,且需要训练多个模型k折交叉验证k由用户指定,通常取5-10,将数据均分为k份,每份叫做折,然后开始训练数据,训练k次,每第k次训练时,取第k折数据作为测试集,其他数据均为
训练集
peter6768
·
2023-10-25 06:38
机器学习
人工智能
深度学习
MATLAB——Decision Tress决策树程序
PV三相并网逆变器%%I.清空环境变量clearallclcwarningoff%%II.导入数据第一列是序号第二列是良性还是恶性(乳腺癌)后面是特征属性30个loaddata.mat%%%1.随机产生
训练集
程高兴
·
2023-10-25 06:19
MATLAB
matlab
决策树
开发语言
MATLAB——极限学习机参考程序
欢迎关注“电击小子程高兴的MATLAB小屋”%%I.清空环境变量clearallclc%%II.
训练集
/测试集产生%%%1.导入数据loadiris_data.mat%%%2.随机产生
训练集
和测试集P_train
程高兴
·
2023-10-25 06:18
MATLAB
matlab
神经网络
机器学习
周志华《机器学习》课后习题解析(第四章):决策树
作者|我是韩小琦链接|https://zhuanlan.zhihu.com/p/446666944.1试证明对于不含冲突数据(即特征向量完全相同但标记不同)的
训练集
,必存在与
训练集
一致(即训练误差为0)
风度78
·
2023-10-24 20:06
Python深度学习实战-基于Sequential方法搭建BP神经网络实现分类任务(附源码和实现效果)
实现功能第一步:导入模块:importtensorflowastf第二步:制定输入网络的
训练集
和测试集第三步:搭建网络结构:tf.keras.models.Sequential()第四步:配置训练方法:
数据杂坛
·
2023-10-24 16:19
深度学习
python
深度学习
神经网络
分类
全梯度下降算法从零实现,基于Numpy
,其数学形式如下:对上述的能量函数求偏导:由于是最小化风险函数,所以按照每个参数θ的梯度负方向来更新每个θ:具体的伪代码形式为:从上面公式可以注意到,它得到的是一个全局最优解,但是每迭代一步,都要用到
训练集
所有的数据
Lornatang
·
2023-10-24 08:36
Python深度学习实战-基于tensorflow.keras六步法搭建神经网络(附源码和实现效果)
实现功能第一步:importtensorflowastf:导入模块第二步:制定输入网络的
训练集
和测试集第三步:tf.keras.models.Sequential():搭建网络结构第四步:model.compile
数据杂坛
·
2023-10-24 07:26
深度学习
python
深度学习
tensorflow
介绍基于Transformer的目标检测算法
Transformer是一种自注意力机制的神经网络架构,能够处理序列数据并进行高效的翻译和
文本分类
等任务。在目标检测领域,也有一些基于Transformer的算法被提出。
战神哥
·
2023-10-24 06:28
目标检测
transformer
算法
深度学习
计算机视觉
YOLO-V8训练自己的数据集之数据集划分
目录六、划分数据集6.1、模型训练数据集划分概述6.1.1、数据集划分介绍6.1.2、划分数据集的原因、作用及常用方法6.2、划分数据集常见示例6.3、数据集划分实操演示6.3.1、将数据集划分为
训练集
和验证集
电阻电容及电线
·
2023-10-24 02:04
YOLO
人工智能
深度学习
目标检测
机器学习(3)--特征工程之数据降维
3.神经网络【之后补充,它也有降维的作用】1.特征选择特征选择原因冗余:部分特征的相关度高,容易消耗计算性能噪声:部分特征对预测结果有负影响概念:特征选择就是单纯地从提取到的所有特征中选择部分特征作为
训练集
特征
Ona_Soton
·
2023-10-24 01:09
机器学习
机器学习
python
概率论
决策树完成图片分类任务
数据集要求:
训练集
和验证集(要求分好)图片放置规则:一个总文件夹放类别名称的子文件夹其中子文件夹为存放同一类别图片举个例子分类动物则总文件夹名称为动物子文件夹为猫狗猪猪。。。
:)�东东要拼命
·
2023-10-23 21:17
算法
决策树
分类
算法
机器学习
图像分类
图像增强方向开源数据集汇总
真实世界模糊图像数据集下载链接:http://suo.nz/2nk7w2
训练集
:182个不同场景的3,758个图像对。测试集:50个不同场景的980个图像对。
极市平台
·
2023-10-23 19:25
开源数据集汇总
计算机视觉
人工智能
深度学习
数据集
机器学习
图像增强
机器学习中的多分类问题
例如,将图像分类为不同的物体,将
文本分类
为不同的主题,将音频分类为不同的语音等。多分类问题可以被视为二分类问题的扩展
梦回丶故里
·
2023-10-23 13:17
机器学习
机器学习
分类
人工智能
基于self-attention的LSTM时间序列预测Python程序
单变量,多变量输入,自由切换2、单步预测,多步预测,自动切换3、基于Pytorch架构4、多个评估指标(MAE,MSE,R2,MAPE等)5、数据从excel文件中读取,更换简单6、标准框架,数据分为
训练集
黑科技小土豆
·
2023-10-23 11:27
深度学习
lstm
python
人工智能
风险模型 - 稳定性指标阈值由来
风险模型-稳定性指标阈值由来问题由来PSI定义与参考指标卡方分布卡方检验PSIPSI究竟服从什么分布问题由来当我们完成模型搭建以后,会查看
训练集
与测试集的PSI,实施一段时间后还会看模型实施这段时间中新模型针对新客户的打分分布情况
JerryFoo
·
2023-10-23 07:35
风险模型-理论
风险模型
-
PSI参考阈值由来
Sklearn——5折交叉验证评估模型性能
iamseancheney/pythonbooks/blob/master/Pandas%20Cookbook%20%EF%BC%8DTheodore%20Petrou.pdftrain_test_split函数:划分
训练集
与测试集
星辰丨致青春
·
2023-10-23 00:30
机器学习
朴素贝叶斯分类器(Naive Bayes Classifier)
它是一种有监督学习算法,常用于
文本分类
、垃圾邮件过滤、情感分析等问题。朴素贝叶斯分类器假设特征之间相互独立(条件独立性假设),这是“朴素”(Naive)之处,因为在现实情况中,特征之间可能存在相关性。
亿星海
·
2023-10-23 00:55
算法
神经网络的问题总结
进展:神经网络在图像分类、
文本分类
、音频分类等方面取得了显著进展,特别是深度卷积神经网络(CNN)在图像分类中的应用。回归问题:特点:用于预测连续数值输出,通常与数值预测和回归分析有关。
Chen_Chance
·
2023-10-22 17:34
神经网络
人工智能
深度学习
比较5个点的4种分布
(A,B)---5*30*2---(1,0)(0,1)让网络的输入只有5个节点,AB
训练集
各由5张二值化的图片组成,让A中有5个点,B全是0,排列组合,统计迭代次数并排序。
黑榆
·
2023-10-22 17:01
用分类实现衰变
结构加法
非线性
应用化学
用结构加法比较4个结构的顺序
(A,B)---5-30-2---(1,0)(0,1)让网络的输入只有5个节点,AB
训练集
各由5张二值化的图片组成,让A中有5个点,B全是0。统计迭代次数并排序。
黑榆
·
2023-10-22 17:01
用分类实现衰变
结构加法
迭代
应用化学
全0行对迭代次数的影响
3*30*2---(1,0)(0,1)4(A,B)---3*30*2---(1,0)(0,1)5(A,B)---3*30*2---(1,0)(0,1)做3个网络,让网络的输入都只有3个节点,一个网络的
训练集
有
黑榆
·
2023-10-22 17:57
用分类实现衰变
神经网络
迭代次数
调参
FastText:Bag of Tricks for Efficient Text Classification
FastText:BagofTricksforEfficientTextClassification摘要简而言之,FastText快而准,标准多核CPU就能满足很多
文本分类
需求,是一个不错的baseline
张寂黯
·
2023-10-22 14:04
AIpaperSummary
自然语言处理
人工智能
【论文笔记】Bag of Tricks for Efficient Text Classification
这篇文章写的是Facebook推出的FastText,能够快速在海量文本数据上进行分类任务和表示学习,可以用一个普通的多线程CPU在十分钟内训练百万级的语料,一分钟内将五十万
文本分类
到三十万个类别中。
theoreoeater
·
2023-10-22 14:34
论文笔记
自然语言处理
fasttext
NLP
文本分类
Bag of Tricks for Efficient Text Classification(Fasttext)
Fasttext历史意义:1、提出一种新的
文本分类
方法-Fasttext,能够快速进行
文本分类
,效果较好2、提出一种新的使用子词的词向量训练方法,能够在一定程度上解决oov问题3、将Fasttext开源使得工业界和学术界能够快速的使用
BUPT-WT
·
2023-10-22 14:34
NLP
Paper
(36)[EACL] Bag of Tricks for Efficient Text Classification
计划完成深度学习入门的126篇论文第三十六篇,FAIR的TomasMikolov等发表的在
文本分类
的Bag技巧的论文。
gdtop818
·
2023-10-22 14:03
深度学习论文系列博客
Bag of Tricks for Efficient Text Classification(FastText)
HierarchicalsoftmaxN-gramfeatures实验任务一sentimentanalysis任务二tagprediction总结fasttext词向量优势摘要本文提出了一种简单有效的
文本分类
和表示学习方法
云淡风轻__
·
2023-10-22 14:33
Bag of Tricks for Efficient Text Classification (fastText) 学习笔记
fastText是可以应用在带监督的
文本分类
问题的语言模型,准确率可以与深度学习相提并论,且速度更快。它有两个突出的优点:因为调用了简单的线性模型而不是神经网络模型,所以它在保持了高精度的情况下,大
ffffatgoose
·
2023-10-22 14:33
fastText
NLP paper精读(六)——Bag of Tricks for Efficient Text Classification
fastTextAbstractIntroductionModelarchitectureHierarchicalsoftmaxN-gramfeaturesExperimentDiscussionandconclusion一点思考ReferenceAbstract本文提出了一种简单高效的
文本分类
基线方法
技术宅zch
·
2023-10-22 14:32
NLP
Fasttext (Bag of Tricks for Efficient Text Classification) 阅读笔记
论文原文BagofTricksforEfficientTextClassification论文信息EACL2017论文解读HytnChen更新时间2020-02-23
文本分类
相关方法用作
文本分类
的卷积神经网络
Nstar-LDS
·
2023-10-22 14:01
NLPer阅读笔记
深度学习
机器学习
自然语言处理
Bag of Tricks for Efficient Text Classification
文章摘要这篇文章为
文本分类
提供了一个简单又高效的模型,fasttext。这个模型在效果上能比肩复杂的深度学习模型的同时,在速度上又快了几个量级。
AI深入浅出
·
2023-10-22 14:30
Bag of Tricks for Efficient Text Classification论文阅读及实战
四、参考资料本文目录(仅做浏览用,暂时不支持页面内跳转)一、Fasttext算法综述Fasttext是FacebookAIResearch2016年推出的
文本分类
和词训练工具,其源码已经托管在Github
CurryCoder
·
2023-10-22 14:29
NLP
【论文阅读】Bag of Tricks for Efficient Text Classification
摘要这篇论文探索了一个简单有效的
文本分类
的baseline。实验表明快速
文本分类
器fastTextfastTextfastText与深度学习分类器在准确度方面等价,并且训练和评估过程要快。
沐兮Krystal
·
2023-10-22 14:57
NLP
论文阅读
机器学习
深度学习
Bag of Tricks for Efficient Text Classification(FastText)
主要的有点就是快,用途就是用于
文本分类
,模型结构如上,主要是通过embedding将文本转换成向量,然后进行mean-pooling,然后输入到hidden隐向量中,通过softmax输出多分类,损失函数是对数似然损失函数
WitsMakeMen
·
2023-10-22 14:55
语言模型
fasttxt
自然语言处理---迁移学习
fasttext介绍作为NLP工程领域常用的工具包,fasttext有两大作用:进行
文本分类
、训练词向量。在保持较高精度的情况下,快速的进行训练和预测是fasttext的最大优势。
lichunericli
·
2023-10-22 12:18
自然语言处理
自然语言处理
迁移学习
人工智能
WEKA把分类(Classification)和回归(Regression)
观察
训练集
中的实例,可以建立起预测的模型。有了这个模型,我们就可以新的输出未知的实例进行预测了,衡量模型的好坏就在于预测的准确程度。在WEKA中,
Saudade_lh
·
2023-10-22 02:52
【机器学习】集成学习方法:Bagging(随机森林)+Boosting(AdaBoost)
产生背景:一般的机器学习算法都是“单打独斗”,影响其性能(尤其是泛化性)的因素有很多,比如
训练集
中样本过少、样本分布不均匀等;除此以外,不同的机器学习方法也针对了不同类型的数据,但由于真实数据是未知的,
Lies.
·
2023-10-21 21:43
机器学习
机器学习
集成学习
随机森林
人工智能
为什么嵌入通常优于TF-IDF:探索NLP的力量
NLP中的重要任务之一是
文本分类
,我们根据文本的内容将
文本分类
为不同的类别。过去,流行的
文本分类
方法之一是TF-IDF方法。然而,随着深度学习的出现,另一种称为词嵌入的方法变得越来越流行。
无水先生
·
2023-10-21 21:48
LLM和ChatGPT
人工智能
tf-idf
自然语言处理
人工智能
softmax-pytorch
softmax和分类模型内容包含:softmax回归的基本概念如何获取Fashion-MNIST数据集和读取数据softmax回归模型的从零开始实现,实现一个对Fashion-MNIST
训练集
中的图像数据进行分类的模型使用
fortune835
·
2023-10-21 21:30
pytorch
深度学习
python
Transformers基本组件(一)快速入门Pipeline、Tokenizer、Model
借助Transformers工具包,可以非常方便的调用主流预训练模型解决实际的下游任务,如
文本分类
、文本匹配、命名实体识别、阅读理解、文
undo_try
·
2023-10-21 18:55
#
深度学习
深度学习
python
(西瓜书)一元线性归回代码详解
所以我们自己生成一些样本,假设true_fun是理想线性回归函数return1.5*X+0.2np.random.seed(0)#随机种子n_sample=30#生成30个样本点"""生成随机数据作为
训练集
xiao_haohao
·
2023-10-21 13:25
线性代数
机器学习
sklearn
机器学习-K-近邻(KNN)算法
在KNN算法中,当我们需要对一个未知数据点进行分类时,它会与
训练集
中的各个数据点进行特征比较,并找到与之最相似的前K个数据点。然后根据这K个数据点的类别来确定未知数据点所属的类别。
Yan-英杰
·
2023-10-21 11:56
python
大数据
人工智能
matlab
算法
Python 数据集:乳腺癌数据集(from sklearn.datasets import load_breast_cancer)。
(1)将样本集划分为70%的
训练集
,30%作为测试集,分别用逻辑回归算法和KNN算法(需要先对数据进行标准化)建模(不指定参数),输出其测试结果的混淆矩阵,计算其准确率、查全率和假正率。
蒙娜丽莎的Java
·
2023-10-21 10:10
面试
学习路线
阿里巴巴
sklearn
python
机器学习
spring
boot
分布式
上一页
18
19
20
21
22
23
24
25
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他