E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
#特征选择
集成学习之Bagging和RF
一、什么是随机森林二、随机森林的两个随机三、随机森林算法过程四、为什么如此受欢迎五、随机森林算法的优缺点六、RF
特征选择
*****************************************
小小orange
·
2023-03-24 06:32
python之特征工程
天池AI学习-详情模型融合:天池AI学习-直播(干货)结合Scikit-learn介绍几种常用的
特征选择
方法-weepon的博客-CSDN博客使用sklearn做单机特征工程-一起大数据
钢能锅
·
2023-03-23 15:40
机器学习 | 吴恩达机器学习第三周学习笔记
machine-learning/home/welcome第三周PPT下载密码:8o4e上一篇博客主要介绍了第二周的课程的内容,包括多变量线性回归,使用梯度下降法求解多变量线性回归的实用技巧,特征缩放与模型
特征选择
并介绍了多项式回归
CoreJT
·
2023-03-21 07:58
林轩田机器学习
机器学习
逻辑回归
过拟合
正则化
吴恩达
特征工程
主要分为如下几点:数据理解数据清洗特征构造
特征选择
类别不平衡1.数据理解目的:探索数据,了解数据,主要在EDA阶段完成。2.数据清洗目的:提高数据质量,降低算法用错误数据建模的风险。
allen成
·
2023-03-20 11:04
遗传算法原理及案例解析
二、算法应用旅行商问题、求目标函数的全局最大值点问题、
特征选择
三、遗传算法求解步骤设定初始固定规模的种群,种群由每个个体组成,计算每个个体的适应度函数,
heda3
·
2023-03-20 07:47
机器学习
遗传算法
特征选择
最优化问题
GA
旅行商问题
数据挖掘笔记-1
第一章绪论1.1什么是数据挖掘KDD:KnowledgeDiscoveryinDatabase数据输入->数据预处理->数据挖掘->后处理->信息获取数据预处理包括:
特征选择
维归约规范化选择数据子集后处理包括
Track48
·
2023-03-18 07:30
数据挖掘
数据挖掘
七、降维
部分特征对预测结果有影响主要方法:1、Filter过滤式(VarianceThreshold)方差大小,考虑所有样本这个特征的数据情况2、Embedded嵌入式(正则化,决策树)3、Wrapper(包裹式)4、神经网络1数据降维之
特征选择
一闪一闪亮日日日日日日
·
2023-03-16 15:27
粒子群优化算法(PSO)之基于离散化的
特征选择
(FS)(一)
前言:在机器学习中,离散化(Discretization)和
特征选择
(FeatureSelection,FS)是预处理数据的重要技术,提高了算法在高维数据上的性能。
人工智能遇见磐创
·
2023-03-14 14:43
机器学习专题:
特征选择
(R)
载入数据library(readr)#载入数据sampleTraits<-read_csv("2-datTraits_95.csv",col_names=T)#datExpr1<-read_csv("6-DEGset-95_DEseq_miRBAse_batch_scale.csv",col_names=T)#用于box#datExpr2<-read_csv("5-DEGset_95_DEseq_
挽山
·
2023-03-14 04:38
数据清洗和
特征选择
数据清洗和
特征选择
数据清洗和特征挖掘的工作是在灰色框中框出的部分,即“数据清洗=>特征,标注数据生成=>模型学习=>模型应用”中的前两个步骤。灰色框中蓝色箭头对应的是离线处理部分。
吃肉的小馒头
·
2023-03-11 18:34
机器学习
算法
机器学习
人工智能
PCA降维
当数据特征较多时,基本有两种方法:1PCA降维2FeatureSelection(
特征选择
)PCA降维PCA降维的思路:(假设从2维降到1维)image.png(红、蓝分别代表两个维度,叉叉代表样本)维度红
LZhan
·
2023-03-10 18:17
特征选择
的方法
特征选择
的好处便于理解和可视化数据,降低计算及存储压力,对抗维数灾难提高准确率,增加模型泛化能力;总结一三大主流方法:过滤式,包裹式,嵌入式;过滤式:对特征重要性(方差,互信息,相关系数,卡方检验)排序选择
闫阿佳
·
2023-03-10 01:43
数据预处理之归一化,标准化,数据降维之
特征选择
归一化以上为归一化的原理接下来将展示出归一化的代码fromsklearn.preprocessingimportMinMaxScalermm=MinMaxScaler()data=mm.fit_transform([[90,2,10,40],[60,4,15,40],[75,3,13,46]])data打印结果为:如果将上述代码的**mm=MinMaxScaler()**改为mm=MinMaxSc
Thefan1
·
2023-03-01 07:13
数据预处理
机器学习
FRE 和 随机森林 特征重要性
#使用ref进行
特征选择
fromsklearn.linear_modelimportLinearRegression,Ridgefromsklearnimportsvmfromsklearn.feature_selectionimportRFElr
萌新待开发
·
2023-02-22 13:52
ᕦ
机器学习
ᕤ
1024程序员节
随机森林
特征
RFE
简单的数据分析
简单的数据分析-数据预处理_哔哩哔哩_bilibili的笔记数据预处理的常用流程:去除唯一属性,处理缺失值,属性编码,数据标准化正则化,
特征选择
,主成分分析。
ᝰꫛꪮꪮꫜ748
·
2023-02-22 02:19
java
数据库
前端
R语言
特征选择
方法——最佳子集回归、逐步回归|附代码数据
p=5453最近我们被客户要求撰写关于
特征选择
方法的研究报告,包括一些图形和统计输出。
·
2023-02-20 22:04
R语言
特征选择
方法——最佳子集回归、逐步回归|附代码数据
p=5453最近我们被客户要求撰写关于
特征选择
方法的研究报告,包括一些图形和统计输出。
·
2023-02-20 22:04
数据预处理1:无量纲化especially for Scaler
模块preprocessing:几乎包含数据预处理的所有内容模块Impute:填补缺失值专用模块feature_selection:包含
特征选择
的各种方法的实践模块decomposition:包含降维算法
Aksinia
·
2023-02-17 16:10
机器学习技法
python
实例(1)——特征工程
前言:机器学习工程师一半的时间花在数据的清洗、
特征选择
、降维等数据处理上面,下面就以邮件过滤系统为例,介绍一下机器学习模型构建前的一些非常重要的工作。
飘涯
·
2023-02-17 12:11
【应用】【正则化】L1、L2正则化
L1正则化的作用:
特征选择
从可用的特征子集中选择有意义的特征,化简机器学习问题。
八号线土著
·
2023-02-17 00:41
机器学习
正则化
L1正则化和L2正则化
从数学的角度来说,加正则化项就相当于加约束条件,加了约束条件使很多的参数分量wi=0w_i=0wi=0(相当于
特征选择
)从而降低模型复杂度,也就是防止因为参数过多导致的过拟合现象机器学习内容Lp
二胖_pro
·
2023-02-17 00:39
ML
机器学习
正则化
python
人工智能
深度学习
特征选择
——TF-IDF原理以及利用其进行特征筛选
TF-IDF原理以及利用其进行特征筛选原理TF-IDF即termfrequency-inversedocumentfrequency,词频-逆文本频率TF词频:容易理解,频率高能够在一定程度上反应该词的重要性.IDF逆文本频率:若某一个词在所有文本中都出现,或出现的频率过高,则也有可能是虚词这种重要性不高却频率很高的词,此时单纯依靠词频来判断词的重要性就不可靠了.所以引入了IDF逆文本频率这一个量
sherpahu
·
2023-02-07 13:06
机器学习
机器学习-特征工程 基础知识总结
特征工程包括【特征构造】【数值处理】【
特征选择
】1.【特征构造】数据和特征决定了机器学习的上限:切片静态特征,切片聚合特征,时序聚合特征2.
yamgyutou
·
2023-02-07 11:48
机器学习
XGBoost feature importance特征重要性-实战印第安人糖尿病数据集
如何使用XGBoost计算的特征重要性进行
特征选择
。梯度提升中的特征重要性使用梯度提升
python机器学习建模
·
2023-02-07 11:37
python生物信息学
python
机器学习
糖尿病
xgboost
特征重要性
机器学习入门 --- 集成算法
(x)f(x)=\frac{1}{M}\sum_{m=1}^{M}f_m(x)f(x)=M1m=1∑Mfm(x)全称:BootstrapAggregation经典代表算法:随机森林随机:数据采样随机,
特征选择
随机数据采样随机
六之
·
2023-02-06 21:53
python
机器学习
算法
决策树
机器学习
随机森林------random forest
主要总结下三种
特征选择
的优缺点。ID3基于信息增益做
特征选择
,所以很容易受到某一特征特征值数量的干扰。信息增益会偏向于属性值多的那一个属性。所以C4.5采用了信息率作为
特征选择
的标准。
独步计院
·
2023-02-06 19:01
机器学习
随机森林
特征选择
bootstrap
机器学习
算法
数据处理的部分方法
诊断数据异常值,并进行剔除③主成分分析、线性判别分析、局部保留投影等作用:用于多维数据的降维处理(比如一个二维的数据,我现在只想要一维或者其中的一部分)④均值,方差分析,协方差分析等统计方法作用:数据截取或
特征选择
Record growth...
·
2023-02-06 10:12
数学建模
聚类
算法
特征选择
特征选择
和降维计算一样,都能有效的减轻维数灾难问题,事实上,
特征选择
和降维计算是处理高维数据的两大主流技术什么是
特征选择
对于一个学习任务来说,给定属性值,其中有些属性很关键、很有用,另一些属性则可能没什么用
LY豪
·
2023-02-06 08:53
影像组学ibex_影像组学技术方法
来源:放射学实践作者:史张、刘崎影像组学概念从影像图像中提取的全部特征就是“影像组学”,而通过
特征选择
后所挑选出那些具有预测价值特征集合通常被称为“影像组学标签(radiomicsignature)”。
雷头东
·
2023-02-05 21:26
影像组学ibex
特征选择
方法之主成分分析
为什么要进行
特征选择
?
彭祥.
·
2023-02-05 15:32
学习记录
python
机器学习
sklearn
机器学习算法:
特征选择
神器FeatureSelector
转载自:https://www.itcodemonkey.com/article/5560.html来自:优达学城Udacity(微信号:youdaxue),作者:WilliamKoehrsen,译者:之肴FeatureSelector完整的代码放在GitHub上(https://github.com/WillKoehrsen/feature-selector),欢迎任何contributions
隐士飞猪
·
2023-02-05 10:04
【机器学习】用户画像
用户画像-案例基于用户搜索关键词数据为用户打上标签(年龄,性别,学历)整体流程(一)数据预处理编码方式转换对数据搜索内容进行分词词性过滤数据检查(二)
特征选择
建立word2vec词向量模型对所有搜索数据求平均向量
♚人间海
·
2023-02-05 07:53
python
机器学习
使用谱聚类(spectral clustering)进行
特征选择
在本文中,我们将介绍一种从相关特征的高维数据中选择或提取特征的有用方法。谱聚类是一种基于图论的聚类方法,通过对样本数据的拉普拉斯矩阵的特征向量进行聚类,从而达到对样本数据聚类的目的。谱聚类可以理解为将高维空间的数据映射到低维,然后在低维空间用其它聚类算法(如KMeans)进行聚类本文使用2021-2022年常规赛NBA球员的赛季数据。从特征之间的相关矩阵中绘制一个图表,显示可能相似的特征组,然后将
·
2023-02-04 11:12
人工智能机器学习聚类特征提取
数据分析-task 2(特征工程)
task2任务要求特征衍生特征挑选:分别用IV值和随机森林等进行
特征选择
……以及你能想到特征工程处理使用IV值
特征选择
defcalcWOE(dataset,col,target):#对特征进行统计分组subdata
简书Sandra
·
2023-02-04 08:40
To Cognize is to Categorize: Cognition is Categorization
1、重新编码和
特征选择
有两种增强分类能力的方法。其一是增加对事物认识的维度,有联觉的人因为可以对事物从多个感觉进行识别,所以其分类能力高。但其局限性在于每个维度都无法达到单一维度的精确率。
辰_123
·
2023-02-04 01:04
信用评分卡建模:样本不均衡处理方法总结
样本不均衡会在
特征选择
,模型训练,评估指标等环节均产生严重影响,降低模型性能。本文依次从数据层,算法层和模型评估层介绍样本不均衡的处理方法。一数据层1.数据层下采样方法1)随机下采
小·幸·运
·
2023-02-03 16:49
机器学习
评分卡模型
机器学习
特征:什么是特征和
特征选择
?
后面是正文,关于特征和
特征选择
的几种方式!在machinelearning(机器学习)中,特征工程是重中之重,我们今天就来简单介绍一下特征工程里面
MXuDong
·
2023-02-03 14:59
机器学习/深度学习
特征工程
【特征工程】重要特征识别理论(特征筛选)
文章目录前言一、
特征选择
过程二、
特征选择
方法1.过滤式选择2.包裹式选择3.嵌入式选择三、特征重要性前言 从众多影响因素中识别出重要因素的过程可以视为一个
特征选择
过程。
Bigdataxy
·
2023-02-03 14:50
特征工程
python
人工智能
数据挖掘
笔记——机器学习入门
文章目录机器学习概述什么是机器学习机器学习算法分类机器学习开发流程机器学习框架数据集获取获取sklearn自带数据集的方法数据集划分特征工程特征工程步骤:特征提取特征预处理归一化标准化(常用这种方式无量纲化)特征降维
特征选择
主成分分析
小佘要加油
·
2023-02-02 10:00
机器学习
python
人工智能
特征选择
技术总结
本文还可以帮助你解答以下的面试问题:什么是
特征选择
?说出特性选择的一些好处你知道哪些
特征选择
技巧?区分单变量、双变量和多变量分析。我们能用PCA来进行
特征选择
吗?
·
2023-02-01 11:40
python 英语分词_基于Python NLTK库进行英文文本预处理
具体流程包括文本分词、去除停用词、词干抽取(词形还原)、文本向量表征、
特征选择
等步骤,以消除脏数据对挖掘分析结果的影响。本文仅针对英文文本,中文文本暂时还没有研究过。
weixin_39801356
·
2023-02-01 08:36
python
英语分词
主成分分析
在有限的数据集下,过高的数据维数会导致维度灾难;降维的方法包括特征提取和
特征选择
;主成分分析是将原始共线性的特征转化为相互正交的特征,从而实现特征提取。
李奕辰的爸爸
·
2023-02-01 05:20
天池&Datawhale-零基础入门数据挖掘Task4
线性回归模型:线性回归对于特征的要求;处理长尾分布;理解线性回归模型;2、模型性能验证:评价函数与目标函数;交叉验证方法;留一验证方法;针对时间序列问题的验证;绘制学习率曲线;绘制验证曲线;3、嵌入式
特征选择
微微微微辣
·
2023-02-01 03:59
点云智能分类研究进展与展望
本文从基元类型、提取特征、
特征选择
与分类器等3个视角概括了点云信息提取的相关研究现状,总结出点云信息提取存在
氧艺
·
2023-01-31 15:52
点云
点云智能处理
点云催化剂
分类算法
【知识学习】马氏距离 Mahalanobis Distance
协方差的意义2.马氏距离2.1概述2.2公式2.3实际意义2.4局限性2.4.1协方差矩阵必须满秩【不平衡数据少数类一般都不是】2.4.2不能处理非线性流形(manifold)的问题【线性流形和非线性流形,
特征选择
是线性降维吗
qq_44122600
·
2023-01-31 13:34
Knowledge
learning
数据挖掘
机器学习
人工智能
【文献阅读】数据重采样+
特征选择
(1)
目录1面向不均衡数据的多分类集成算法1.1两阶段采样1.2算法整体框架1.3实验1.4期刊2基于多阶段混合集成的中小企业信用风险评价3基于边界自适应SMOTE和FocalLoss函数改进LightGBM的信用风险预测模型3.1摘要3.2改进的过采样方法3.3基于FocalLoss改进的LightGBM算法(1)LightGBM算法(2)FLLightGBM算法3.4基于BA-SMOTE和FLLig
Tabitha_Xing
·
2023-01-31 13:58
Literature
reading
人工智能
深度学习
机器学习第三课_数据预处理2
特征工程又包含了DataPreProcessing(数据预处理)、FeatureExtraction(特征提取)、FeatureSelection(
特征选择
)和Featureconstruction(特征构造
素心似锦
·
2023-01-30 14:40
五、数据挖掘流程简明笔记
目录1、机器学习概述2、入门案例示例3、问题定义4、特征工程4.1数据理解4.2数据预处理4.2.1数据清洗4.2.2数据转换4.2.3
特征选择
4.2.3.1单变量特征选定:卡方检验(chi-squared
Norni
·
2023-01-30 07:39
python
机器学习
深度学习
数据分析
数据挖掘
风控模型特征重要性与稳定性的分析|基于python的实操演示(示例Toad库)
常规化模型开发过程中,模型开发阶段和模型上线调用阶段的数据的使用逻辑的流程如下:在以上的开发阶段中,我们最绕不开的就是特征的选择开发与选择,在本周较早时间,我们给大家讲解了特征筛选的内容:→_→风控模型开发的
特征选择
与常用数据源介绍今天我们再跟大家讲解特征的稳定性与重要性分析
番茄风控
·
2023-01-30 04:56
番茄风控大数据公众号
风控模型特征
python的实操演示
风控大数据
toad -评分卡模型
Toad简介一个可以用作数据探查、
特征选择
和评分卡模型建模的python工具包。
m0_37709767
·
2023-01-30 04:09
机器学习
上一页
8
9
10
11
12
13
14
15
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他