E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
粗糙集特征选择
【Python】随机森林算法——东北大学大数据班数据挖掘实训四
注:准确度=预测正确的数与样本总数的比【注:可以做一些
特征选择
的工作,来提高准确度】importh2ofromh2o.estimators.random_forestimportH2ORando
爱做梦的鱼
·
2020-09-10 20:29
机器学习
python
随机森林(Random Forest)
(RandomForest)随机森林是一个最近比较火的算法,它有很多的优点:在数据集上表现良好在当前的很多数据集上,相对其他算法有着很大的优势它能够处理很高维度(feature很多)的数据,并且不用做
特征选择
在训练完后
weixin_30732487
·
2020-09-10 19:20
【NLP】自然语言处理 完整流程
自然语言处理完整流程第一步:获取语料1、已有语料2、网上下载、抓取语料第二步:语料预处理1、语料清洗2、分词3、词性标注4、去停用词三、特征工程1、词袋模型(BoW)2、词向量第四步:
特征选择
第五步:模型训练
__盛夏光年__
·
2020-09-10 18:54
NLP
python
机器学习(三)之数据表示和特征工程:One-Hot编码、分箱处理、交互特征、多项式特征、单变量非线性变换、自动化
特征选择
文章目录0本文简介1分类变量1.1One-Hot编码1.2数字可以编码分类变量2分箱、离散化、线性模型与树3交互特征与多项式特征3.1交互特征3.2多项式特征4单变量非线性变换5自动化
特征选择
5.1单变量统计
snail@
·
2020-09-10 17:35
机器学习
Python数据挖掘—分类—随机森林
RandomForest):随机森林是一个包含多个决策树的分类器,并且其输出的类别是由个别数输出的类别的众数而定优点:适合离散型和连续型的属性数据;对海量数据,尽量避免了过度拟合的问题;对高维数据,不会出现
特征选择
困难的问题
anrao9657
·
2020-09-10 12:34
【机器学习】【
特征选择
】3.相关性过滤
相关性过滤方差挑选完毕之后,我们就要考虑下一个问题:相关性了希望选出与标签相关且有意义的特征三种常用的方法来评判特征与标签之间的相关性:卡方,F检验,互信息。卡方过滤专门针对离散型标签(即分类问题)的相关性过滤卡方检验类feature_selection.chi2计算每个非负特征和标签之间的卡方统计量,并依照卡方统计量由高到低为特征排名可以标准化后再做再结合feature_selection.Se
chentao326
·
2020-09-01 21:48
机器学习
python
机器学习
数据分析
人工智能
手写数字识别项目报告
3、因为已经压缩了大量信息,
特征选择
上要全部像素都用。4、对图像进行预测建模。然后进行交叉验证,训练后在训练集上做准确率测试,最后在验证集上做泛化能力测试。
基科菜鸡
·
2020-08-26 23:24
特征选择
过滤法单变量
特征选择
通过单变量统计检验选择特征SelectKBest只保留K个最高分的特征SelectPercentile只保留用户指定的百分比的最高得分的特征使用常见的单变量统计检验分类:使用chi2
番茄要去皮
·
2020-08-26 15:03
机器学习
Kaggle:Home Credit Default Risk 特征工程构建及可视化(2)
关于数据的探索及可视化的工作,本篇博客将围绕如何构建特征工程展开叙述,原文链接地址:StartHere:AGentleIntroduction1简介特征工程是指一个基因过程,可以涉及特征构建:从现有数据中添加新特征和
特征选择
weixin_30859423
·
2020-08-26 15:22
机器学习中的“维度”是什么?
“维度”这个词在机器学习里面,应该是一个高频词,它经常出现在人们的视野中,比如说随机森林是通过随机抽取特征来建树,以避免高维计算;再比如说,sklearn中导入特征矩阵,必须是至少二维;
特征选择
的目的是通过降维来降低算法的计算成本
是菜菜和菊安酱呀
·
2020-08-26 15:22
用Python和scikit-learn来介绍机器学习
用Python和scikit-learn来介绍机器学习用Python和scikit-learn来介绍机器学习数据加载数据正则化
特征选择
算法开发LR朴素贝叶斯K最近邻决策树支持向量机怎样优化算法参数数据加载当我们学习机器学习的时候
天外飞仙6
·
2020-08-26 14:52
机器学习
Python
特征工程基础知识总结概述
文章目录异常值处理缺失值处理数据分桶数据转换特征构造
特征选择
过滤式包裹式嵌入式PCA降维技术特征工程(FeatureEngineering)对特征进行进一步分析,并对数据进行处理。
斗士(Carroll)
·
2020-08-26 13:53
机器学习
机器学习(二)
六、机器学习中的
特征选择
:6.1什么是
特征选择
?
小陈工
·
2020-08-26 13:52
Python
机器学习
最短路径--弗洛伊德(Floyd)算法
要解决这类问题,我们要根据图的特点和问题的
特征选择
不同的算法。我们首先来介绍第一种计算最短路径长度的算法——Floyd算法。F
walker lee
·
2020-08-26 12:20
九度OJ
最短路径
Floyd
弗洛伊德算法
九度OJ
目标检测 | Anchor free的目标检测进阶版本
该论文的出发点还是在样本选择和FPN
特征选择
层面。背景_Anchorfree是目标检测领域的一个研究热点,其主要可以分为anchor-point和keypoint两类。后者在往往在一个高
计算机视觉研究院
·
2020-08-26 12:01
【算法】多特征融合粒子滤波
多特征融合粒子滤波多特征融合粒子滤波1.多特征1.1颜色特征1.2边缘特征1.3纹理特征1.4光流特征1.5小波特征2.融合2.1基于
特征选择
的融合方法2.2基于多特征信息加权的融合方法2.3特征信息自适应融合
WeiGordon
·
2020-08-26 11:30
算法
收藏 | 精华文章汇总:代码实践篇
【周末AI课堂】|机器学习你会遇到的“坑”第1-2讲过拟合问题:理论篇代码篇第3-4讲如何进行
特征选择
:理论篇代码篇第5-6讲线性降维方法:理论篇代码篇第7-8讲非线性降维方法:理论篇代码篇第9-10讲核技巧
读芯术
·
2020-08-25 17:30
机器学习:决策树(一)——原理与代码实现
一般分为三个步骤:
特征选择
,决策树生成,决策树剪枝。熵与条件熵熵是度量随机变量不确定性(集合不纯度)的一种指标。
a16111597162163
·
2020-08-25 16:54
[机器学习笔记] 11.
特征选择
与稀疏学习
11.1子集搜索与评价子集选择,子集评价11.2过滤式选择11.3包裹式选择11.4嵌入式选择与L1正则11.5稀疏表示与字典学习11.6压缩感知这都啥乱七八糟的
Ryiiiin
·
2020-08-25 12:39
机器学习
学习笔记
读书笔记
数据挖掘实战(二)—
特征选择
特征工程又包含了FeatureSelection(
特征选择
)、FeatureExtraction(特征提取)和Featureconstruction(特征构造)等子问题
happy1yao
·
2020-08-25 09:21
数据挖掘
【听课笔记】数据挖掘竞赛——特征工程中的开发与技巧
课程中这位老师首先简单介绍了时间序列预测任务,然后讲了特征工程的常见操作主要包括数据清洗、特征构造和
特征选择
。最后老师分享了
春风惹人醉
·
2020-08-25 09:09
学习笔记
数据挖掘
数据建模
数据分析
大数据
机器学习
super-parameters
L1范数是指向量中各个元素绝对值之和,也有个美称叫“稀疏规则算子”(Lassoregularization)(L0,L1可以实现参数矩阵W的稀疏化,即更多的0值,这样有利于****
特征选择
(FeatureSelection
榆鸦k
·
2020-08-25 08:18
Scikit中的
特征选择
,XGboost进行回归预测,模型优化的实战
前天偶然在一个网站上看到一个数据分析的比赛(sofasofa),自己虽然学习一些关于机器学习的内容,但是并没有在比赛中实践过,于是我带着一种好奇心参加了这次比赛。赛题:足球运动员身价估计比赛概述本比赛为个人练习赛,主要针对于于数据新人进行自我练习、自我提高,与大家切磋。练习赛时限:2018-03-05至2020-03-05任务类型:回归背景介绍:每个足球运动员在转会市场都有各自的价码。本次数据练习
大黄大黄大黄
·
2020-08-25 06:44
使用Boruta进行
特征选择
特征选择
(featureselsection)是机器学习最重要的步骤,如果说算法决定了模型的下线,那么特征就决定模型的上线;另外,需要注意不是说用尽可能多的特征得出的模型表现越好,有些时候数个特征就能得到理想的结果
Neptuneyut
·
2020-08-25 01:56
Machine
Learning
R
秋招总结问题一:为什么需要
特征选择
?
特征选择
有哪些?
1.为什么需要
特征选择
?
特征选择
有哪些?第一个问题: ①在现实任务中经常会遇到维数灾难问题,属性过多造成的。②可以降低学习任务的难度。不相关的特征就是噪声。
猪先生1994
·
2020-08-25 01:13
2019校招
MaxCompute SQL原理解析及性能调优
ODPS)SQL的基于mapreduce是如何实现的及一些使用小技巧,回顾了mapreduce各个阶段可能产生的问题及相应的处理方法,同时介绍了一些应对数据倾斜的处理方法,最后介绍了一些关于数据集构造、
特征选择
的技巧帮助减少资源利用
weixin_34302798
·
2020-08-24 20:48
用xgboost模型对特征重要性进行排序
如何根据xgboost模型得到的特征重要性,在scikit-learn进行
特征选择
。梯度提升算法是如何计算特征重要性的?使用梯度提升算法的好处是在提升树被创建后,可以相对直接地得
waitingzby
·
2020-08-24 16:40
机器学习
xgboost
特征重要性排序
特征选择
机器学习(12)--
特征选择
特征选择
(排序)对于数据科学家、机器学习从业者来说非常重要。好的
特征选择
能够提升模型的性能,更能帮助我们理解数据的特点、底层结构,这对进一步改善模型、算法都有着重要作用。
SpringHeather
·
2020-08-24 16:27
机器学习
【python】Logistics模型预测银行贷款违约
模型理论重要参考一、模型输入:二、
特征选择
:
特征选择
是模型成功的基础性重要工作。一般特征筛选方法有(1)看模型系数显著性(F值大、P值小)(2)递归特征消除:反复构建模型,根据变量系数
空城0707
·
2020-08-24 14:26
data
mining/machine
learning
数据准备:变量筛选-理论篇
在上一篇文章《数据准备:数据预处理》中,我们提到降维主要包括两种方式:基于
特征选择
的降维和基于维度转换的降维,其中基于
特征选择
的降维通俗的讲就是特征筛选或者变量筛选,是指从多个特征(变量)中筛选出显著的特征
dengnai9214
·
2020-08-24 14:30
机器学习中的“维度”是什么?
“维度”这个词在机器学习里面,应该是一个高频词,它经常出现在人们的视野中,比如说随机森林是通过随机抽取特征来建树,以避免高维计算;再比如说,sklearn中导入特征矩阵,必须是至少二维;
特征选择
的目的是通过降维来降低算法的计算成本
CDA数据分析师培训
·
2020-08-24 10:20
20200323零基础入门数据挖掘 - 二手车交易价格预测笔记(3)
特征选择
主要有两个功能:减少特征数量、降维,使模型泛化能力更强,减少过拟合增强对特征和特征值之间的理解常见的特征工程包括下方内容:3.1异常处理:通过箱线图(或3-Sigma)分析删除
zjlingdi
·
2020-08-24 05:46
20200401零基础入门数据挖掘 - 二手车交易价格预测笔记(4)
线性回归模型:线性回归对于特征的要求;处理长尾分布;理解线性回归模型;4.2模型性能验证:评价函数与目标函数;交叉验证方法;留一验证方法;针对时间序列问题的验证;绘制学习率曲线;绘制验证曲线;4.3嵌入式
特征选择
zjlingdi
·
2020-08-24 05:46
PSO算法
特征选择
MATLAB实现(单目标)
PSO进行进行
特征选择
其主要思想是:将子集的选择看作是一个搜索寻优问题(wrapper方法),生成不同的组合,对组合进行评价,再与其他的组合进行比较。这样就将子集的选择看作是一个是一个优化问题。
Reacubeth
·
2020-08-24 04:29
机器学习
徐奕的专栏
机器学习
机器学习
PSO
特征选择
文本
特征选择
这里介绍两种常用的
特征选择
方法:互信息一个常用的方法是计算文档中的词项t与文档类别c的互信息MI,MI度量的是词的存在与否给类别c带来的信息量,互信息的基本定义如下:应用到文本
特征选择
:U、C都是二值随机变量
梦幻之窗
·
2020-08-24 04:08
机器学习
机器学习
建模调参——天池Datawhale零基础入门数据挖掘- 二手车交易价格预测
二手车交易价格预测内容介绍1.线性回归模型线性回归对于特征的要求;处理长尾分布理解线性回归模型;2.模型性能验证评价函数与目标函数交叉验证方法留一验证方法针对时间序列问题的验证绘制学习率曲线绘制验证曲线3.嵌入式
特征选择
weixin_45158756
·
2020-08-24 04:53
天池比赛
二手车预测价格
零基础学机器学习
数据的准确性对模型效果的重要性
今天讲一个性别预测问题,采用LR模型,
特征选择
(App的安装、卸载、操作、昵称、手机颜色、手机型号、手机前置摄像头使用、镜子App使用等维度)。
JackieChen1992
·
2020-08-24 02:57
机器学习&数据挖掘
Python之新闻分类
能够对文本数据进行预处理能够通过Python统计词频,生成词云图能够通过方差分析,进行
特征选择
。能够根据文本内容,对文本数据进行分类。
数据分析痴迷者
·
2020-08-24 01:38
数据分析实战
面试总结(360)
a.做
特征选择
;b.加入正则项,在特征维数很多的时候效果更明显;c.增大样本数量;d.交叉验证;e.特征离散化;f.去除异常值,LR对异常值敏感。一个高维特征怎么挑选出最有效的TopK特征。
MaggieYue
·
2020-08-24 00:56
找工作
数据挖掘实战:二手车交易价格预测之模型调参
讲述各种模型以及模型的评价和调参策略线性回归模型:线性回归对于特征的要求;处理长尾分布;理解线性回归模型;模型性能验证:评价函数与目标函数;交叉验证方法;留一验证方法;针对时间序列问题的验证;绘制学习率曲线;绘制验证曲线;嵌入式
特征选择
空腹熊猫
·
2020-08-24 00:01
数据挖掘实战
HPStream
但是传统的
特征选择
算法需要遍历整个数据集,并且计算复杂度相当大。本文提出的高维度投影流聚类通过在流处理过程中不断的
xiongraorao
·
2020-08-24 00:01
零基础入门数据挖掘 - 二手车交易价格预测 数据的特征工程
1、数据理解;2、数据清洗;3、特征构造;4、
特征选择
;5、类别不平衡。数据理解的主要目的:1、定序数据:描述性质a)定类:按名称分类---血型、城市。b)定序:有序分类--成绩(ABC)。
beautiful_well
·
2020-08-23 23:56
数据挖掘-Task3 特征工程
数据挖掘-Task3特征工程特征工程目标1内容介绍1.1数据理解1.2数据清洗1.3特征构造1.4
特征选择
1.5类别不平衡2代码示例2.1数据理解2.1.1加载库2.1.2加载数据2.1.3预览数据2.2
ClFH
·
2020-08-23 23:20
天池竞赛
nlp入门之文本表示
nlp入门之文本表示文章目录nlp入门之文本表示1one-hot编码2词袋模型(BagofWords)3n-gram模型4TF-IDF5对TF-IDF用于
特征选择
时的一点讨论5.1TF-IDF的缺点4.1TF-IDF
lankuohsing
·
2020-08-23 23:25
理论学习
零基础入门数据挖掘-二手车交易价格预测之特征工程
目录0前言1数据预处理1.1处理缺失值1.2异常值处理2
特征选择
3特征提取4特征构建0前言 何为特征工程呢?顾名思义,就是**对原始数据进行一系列工程处理,将其提炼为特征,作为输入供算法和模型使用。
Elenstone
·
2020-08-23 23:24
天池
零基础入门数据挖掘-二手车交易价格预测之建模调参
目录0前言1学习内容1.1线性回归模型1.2模型性能验证:1.3嵌入式
特征选择
:1.4模型对比:1.5模型调参:1.6推荐教材0前言零基础入门数据挖掘-二手车交易价格预测之赛题与数据零基础入门数据挖掘-
Elenstone
·
2020-08-23 23:24
天池
数据挖掘
python
机器学习
使用R完成决策树分类
传统的ID3和C4.5一般用于分类问题,其中ID3使用信息增益进行
特征选择
,即递归的选择分类能力最强的特征对数据进行分割,C4.5唯一不同的是使用信息增益比进行
特征选择
。
肥萝卜使大力
·
2020-08-23 23:41
R
Processing
数据挖掘
基于变长PSO的高维
特征选择
算法(VLPSO)概述
原文:http://www.omegaxyz.com/2018/09/16/vlpso/简介原文:Variable-Lengthparticleswarmoptimisationforfeatureselectiononhigh-dimensionalclassificationVLPSO是BinhTran和BingXue等人发在人工智能顶尖杂志上IEEETransactionsonEvoluti
Reacubeth
·
2020-08-23 23:07
机器学习
徐奕的专栏
机器学习
基于
特征选择
(PSO+CTree)的网络入侵检测
针对KDD数据集采用onehot编码进行特征值转换,存在冗余特征的问题,本文提出采用粒子群算法结合决策树实现
特征选择
以及检测分类。
机器鱼
·
2020-08-23 22:26
机器学习
网络入侵检测
特征选择
机器学习
python
算法
数据挖掘
机器学习之决策树学习笔记分享
决策树思维导图
特征选择
特征选择
是为了选取具有分类能力的特征,选取准则为信息增益或信息增益比信息增益def:特征A对训练数据D的信息增益为g(D,A),定义为集合D的经验熵H(D)和特征A给定条件下D的经验条件熵
weixin_45827175
·
2020-08-23 22:11
机器学习
上一页
31
32
33
34
35
36
37
38
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他