E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
#特征选择
决策树算法(五)
APIclasssklearn.tree.DecisionTreeClassifier(criterion=’gini’,max_depth=None,random_state=None)criterion
特征选择
标准
王涛涛.
·
2022-12-24 18:07
决策树
机器学习
python
Python数据分析-数据挖掘(准备数据——数据建模——模型评估——模型应用)
2.1找到数据2.2数据探索2.3数据清洗2.3.1缺失值处理2.3.2异常值的处理2.3.3数据偏差2.3.4数据标准化2.3.5
特征选择
2.4构建
大炮不想学习
·
2022-12-24 18:20
数据分析学习
数据挖掘
数据分析
人工智能
特征选择
-方差过滤 (学习笔记)
方差过滤找到方差大有区分度的特征,过滤掉那些特征方差较小的特征。比如一个特征本身的方差很小,就表示样本在这个特征上基本没有差异,可能特征中的大多数值都一样,甚至整个特征的取值都相同,那这个特征对于样本区分没有什么作用。所以可以设置一个过滤的阈值,过滤掉那些方差小的特征,从而达到特征筛选的目的。注意不要将重要的特征过滤掉。适用于稀疏矩阵(数值为0的元素数目远远多于非0元素的数目,并且非0元素分布没有
corina_qin
·
2022-12-24 16:24
python
python
一文读懂ID3、C4.5、CART
ID3算法的核心思想就是以信息增益来度量
特征选择
,选择信息增益最大的特征进行分裂。算法采用自顶向下的贪婪搜索遍历可能的决策树空间(C4.5也是贪婪搜索)。
one-莫烦
·
2022-12-24 11:05
机器学习
决策树
机器学习
算法
决策树与随机森林
一、决策树决策树包括3个步骤:
特征选择
决策树的生成(决策树局部最优)决策树的剪枝(决策树全局最优)1.
特征选择
特征选择
的准则是信息增益或者信息增益比、Gini指数。
JNYxiaocao
·
2022-12-24 08:59
机器学习
随机森林
决策树
小结
非独立同分布 大数据
有限资源的情况下,快速开展非独立同分布大数据数据总是依赖的,分布发生变化=》适应大数据发展趋势算法,思维|—–|–Non-IID进展|–概念|–数据表达|–离散|–K-Means|–图形特征体现|–统计学,
特征选择
banrieen
·
2022-12-24 07:57
特征选择
----皮尔逊(Pearson)相关系数
目录1、皮尔逊(Pearson)相关系数2、斯皮尔曼spearman相关系数斯皮尔曼相关系数定义corr()函数的用法corr可选的方式有三种:1)pearson:相关系数来衡量两个数据集合是否在一条线上面,即针对线性数据的相关系数计算,针对非线性数据便会有误差。2)spearman:非线性的,非正太分析的数据的相关系数1、皮尔逊(Pearson)相关系数1、协方差能完美的解释两个变量之间相关的方
温旧酒一壶~
·
2022-12-24 07:55
不良分析
菜菜机器学习笔记
python
sklearn库主要模块功能简介
sklearnsklearn,全称scikit-learn,是python中的机器学习库,建立在numpy、scipy、matplotlib等数据科学包的基础之上,涵盖了机器学习中的样例数据、数据预处理、模型验证、
特征选择
温旧酒一壶~
·
2022-12-24 07:24
机器学习python包
sklearn
python
机器学习
python大数据之随机森林(回归与分类)
优点:处理高纬度的数据,并且不用做
特征选择
,当然也可以使用随机森林做特征筛选。模型泛化能力强对不平衡数据集来说,可以平衡误差。对缺失值,异常值不敏感。缺点:当数据噪声比较大时,
addict_jun
·
2022-12-24 03:11
python
python
大数据
随机森林
知识图谱 ——距离变换模型
(L0范数很难优化求解)L1范数是指向量中各个元素绝对值之和L2范数是指向量各元素的平方和然后求平方根L1范数可以进行
特征选择
,即让特征的系数变为0.L2范数可以防止过拟合,提升模型的泛化能力,有助于处理
叫我小鱼就好
·
2022-12-23 14:52
知识图谱
人工智能
《遥感原理与应用》总结——遥感图像自动识别分类
目录遥感图像自动识别分类1.基础知识2.特征变换及
特征选择
3.监督分类4.非监督分类5.非监督分类与监督分类的结合6.分类后处理和误差分析7.提高分类精度的方法8.基于目标的信息提取遥感图像自动识别分类遥感图像自动分类的重要性
百年一遇大变局
·
2022-12-23 10:18
遥感原理与应用
机器学习
深度学习
python
【天池学习笔记】二手车交易价格预测
评测标准1.5结果格式总结2.Baseline3.探索性数据分析EDA3.1介绍3.2常用绘图3.3相关性,独立性分析3.4问题解答3.5代码总结4.特征工程4.1数据理解4.2数据清洗4.3特征构造4.4
特征选择
Junieson
·
2022-12-23 09:34
数据竞赛
数据挖掘
大数据
机器学习
python
人工智能
一文介绍机器学习中的三种
特征选择
方法
广义的特征工程一般可分为三个环节:特征提取、
特征选择
、特征衍生,三个环节并无明确的先手顺序之分。本文主要介绍三种常用的
特征选择
方法。机器学习中的特征需要选择,人生又何尝不是如此?
AI科技大本营
·
2022-12-23 09:52
算法
python
机器学习
人工智能
数据分析
Python机器学习
特征选择
(完全版)
1
特征选择
的目的机器学习中
特征选择
是一个重要步骤,以筛选出显著特征、摒弃非显著特征。
算法进阶
·
2022-12-23 09:14
python
python
算法
机器学习
数据挖掘
数据分析
【机器学习基础】
特征选择
的Python实现(全)
1
特征选择
的目的机器学习中
特征选择
是一个重要步骤,以筛选出显著特征、摒弃非显著特征。
风度78
·
2022-12-23 09:42
人工智能
python
机器学习
深度学习
数据挖掘
李宏毅机器学习hw1~4作业 强化点
李宏毅机器学习hw1~4作业强化点总结李宏毅机器学习hw11.
特征选择
2.激活函数3.学习率李宏毅机器学习hw2HMM李宏毅机器学习hw31.dropout2.目标检测Loss设置3.模型融合李宏毅机器学习
沅沅要努力学习啊!!!
·
2022-12-22 18:42
李宏毅机器学习
机器学习
人工智能
sklearn
深度学习
随机森林模型代码_基于随机森林和深度自编码高斯混合模型的无监督入侵检测方法...
该方法重点在于使用随机森林算法进行
特征选择
,一方面更加注重对结果重要的特征,另一方面消除无关特征对检测结果的干扰
weixin_39530288
·
2022-12-22 13:15
随机森林模型代码
高光谱遥感图像空谱联合分类方法研究--基于光谱,空间,空谱的DBN+LR
1.引言针对高光谱数据量大,特征维数高的特点降低维度的方法:两种方法:一种是
特征选择
,一种是特征提取。
特征选择
是找到原始波段的一个合适的子集,特征提取是在变换后的特征空间中寻找一个真子集。
Kun Li
·
2022-12-22 13:20
深度学习处理遥感影像
【领域泛化】论文介绍《Learning to balance specificity and invariance for in and out of domain generalization》
Learningtobalancespecificityandinvarianceforinandoutofdomaingeneralization》论文地址摘要核心思想动机DMG方法通过领域特征编码的
特征选择
激励领域特异性代码实现论文引用论文地址
TopologyXL
·
2022-12-22 10:17
领域泛化
深度学习
人工智能
迁移学习
(5) 李航《统计学习方法》基于Python实现——决策树
决策树学习通常包括3个步骤:
特征选择
,决策树的生成和决策树的修剪。优点:模型具有可读性,解释性较强,分类速度快,准确性高,可以处理连续和种类字段,不需要任何领域知
奥卡姆的剃刀
·
2022-12-21 17:06
机器学习
Python
python
决策树
统计学习方法
机器学习 | 决策树+模型评估
通过一个决策树案例,着重从
特征选择
、剪枝等方面描述决策树的构建,讨论并研究决策树模型评估准则。
Grace__Sun
·
2022-12-21 17:03
机器学习
机器学习
你要的机器学习常用评价指标,以备不时之需
导读在机器学习中,我们前期经过数据采集、数据清洗,中期进行特征分析、
特征选择
,后期对处理好的数据集分割,将数据集划分为训练集、验证集、测试集,最后基于划分好的数据集进行训练调优,并选择性能最好的模型。
一颗磐石
·
2022-12-21 15:04
机器学习
机器学习
评价指标
ROC
召回率
精度
【机器学习】基于天气数据集的XGBoost分类与预测
目录一、学习知识点概要二、学习内容代码1.导入库2.对离散变量进行编码3.利用XGBoost进行训练与测试4.利用XGBoost进行
特征选择
5.模型调参三、学习问题与解答四、学习思考与总结一、学习知识点概要首先
elif:
·
2022-12-20 14:00
机器学习
机器学习
分类
python
boost
数据分析
数据挖掘-决策树算法+代码实现(七)
决策树通常有三个步骤:
特征选择
、决策树的生成、决策树的修剪。用决策树分类:从根节点开始,对
Lingxw_w
·
2022-12-20 11:34
数据挖掘和数据分析
算法
决策树
数据挖掘
Python:opencv画点、圆、线、多边形、矩形
简介:机器学习视觉方向一般都需要在图像中添加标注框,标注框有着很大的用处,特别是对图像中某些需要关注的特征起到圈定的效果,方便对
特征选择
进行处理。
玩转测试开发
·
2022-12-20 03:40
jenkins
python
centos
cnn文本分类python实现_CNN文本分类
这其中的思想就是,降维或者说是
特征选择
,通过前面的卷积层或者池化层将重要的特征选取出来,然后全连接进行分类。特征是最重要的。论文所提出的模型结构如下图所示:1,
weixin_39721853
·
2022-12-19 19:38
cnn文本分类python实现
线性回归——基本使用和特点分析
线性回归的原型:y=wx+b代价函数:最小二乘法构造(y-y')**2.sum()目标函数:对代价函数求导=0,找全局最小值对应W值线性回归特点:线性回归一定是一条直线,可能容易欠拟合;线性回归求解效率高
特征选择
Sophia&Anna
·
2022-12-19 13:32
机器学习
线性回归
python
[机器学习导论]——第四课——
特征选择
文章目录第四课——
特征选择
特征选择
动机
特征选择
方法概述过滤式选择(Filtermethod)单变量过滤多变量过滤包裹式选择(Wrappermethod):apple:嵌入式选择(Embeddedmethod
雨落俊泉
·
2022-12-19 09:45
#
机器学习入门
机器学习
特征选择
sklearn入门——回归树
重要参数、属性及接口criterion回归树衡量分支质量的指标,支持的标准有三种:1)输入“mse”使用均方误差(meansquarederror),父节点和子节点之间的均方误差的差额来作为
特征选择
的标准
陈笨蛋@
·
2022-12-19 07:27
sklearn学习
机器学习
python
sklearn 2.回归树
只是回归树里没有标签分布是否均衡的问题2.参数:criterion回归树衡量分枝质量的指标,支持的标准有三种:1)输入"mse"使用均方误差meansquarederror(MSE),父节点和叶子节点之间的均方误差的差额被用来作为
特征选择
的标准
smile~。
·
2022-12-19 07:56
机器学习
python
数据预处理Part1——数据清洗
文章目录一、数据预处理二、数据清洗1、缺失值处理1.1丢弃缺失值1.2补全缺失值1.3真值转换1.4不处理1.5
特征选择
2、异常值2.1异常值处理2.2保留异常数据的情况2.2.1异常值正常反映了业务运营结果
weixin_43060843
·
2022-12-18 18:40
数据预处理
机器学习
数据分析
深度学习神经网络学习日记
wn)weightdecayL1Regularization:拉普拉斯分布左右对称L2Regularization:高斯分布w的平方项拉普拉斯分布正则化能够使得模型更倾向于得到稀疏参数稀疏参数的优点在
特征选择
上优化器
WJY991202
·
2022-12-18 17:51
深度学习
神经网络
学习
机器学习-特征中的相关性及相关系数、卡方检验、互信息
在机器学习中,对于
特征选择
的方法分为三类:过滤式(Filter),包裹式(Wrapper),和嵌入式(Embedding)。
taoKingRead
·
2022-12-18 16:06
机器学习
协方差
机器学习
python
算法
数据挖掘
如何知道特征的重要性
特征选择
是机器学习中的核心概念之一,它极大地影响模型的性能。用于训练机器学习模型的数据功能对可达到的性能有很大的影响。不相关或部分相关的特征可能会对模型性能产生负面影响。
你今天机器学习了么
·
2022-12-18 16:04
算法
6--半监督学习
本周学习内容:学习
特征选择
与稀疏学习部分内容学习半监督学习部分内容1
特征选择
在现实任务中属性过多则会造成维数灾难的问题,若能在所有特征中选取更重要的一部分特征来进行构建模型,则该问题将会减轻,另外去除不相关的特征往往也会降低学习任务的难度
pepsi_w
·
2022-12-18 14:00
周报
学习
机器学习
算法
PCA人脸识别降维+PCA实现噪音过滤--from 菜菜机器学习
PCA与
特征选择
的区别在于
特征选择
后的特征矩阵是可读的,而PCA降维之后的新特征向量是不可读的,PCA是将已存在的特征进行压缩,降维完毕后的特征不是原本特征矩阵中的任何一个特征,而是通过某些方式组合起来的新特征
talle2021
·
2022-12-18 10:22
机器学习
python
机器学习
sklearn
数据挖掘第二课
数据挖掘第二课facebook案例导入数据1.数据预处理1.1描述性统计1.2哑变量生成2.数据可视化分析3.
特征选择
3.1相关系数3.2熵(基尼系数)的指标4.模型拟合1.logistic回归2.决策树
wonder1322
·
2022-12-18 08:29
学习笔记
算法
数据挖掘
【分类器】
二、高复杂性数据三、
特征选择
四、
特征选择
分类总结前言在实际应用中,为了挖取数据中隐藏的有用数据,一般会对搜集到的原始数据集进行分析分类处理,流程图如图1.1所示,具体的基本步骤包括以下四步:(1)采取数据采集手段获取用户数据
资源存储库
·
2022-12-18 00:30
AI
【python数据处理基础】--数据读取、清洗数据
因此我们需要对数据进行可视化展示,
特征选择
,特征构建等一系列操作。本文的目的是针对像作者一样初步涉及到数据处理工作的读者们提供一个简单、直接的python数据处理基础操作。
树梅也称覆盆子
·
2022-12-17 21:29
数据处理
python
机器学习笔记(七)-主成分分析PCA
weixin_42555080本次代码的环境:运行平台:WindowsPython版本:Python3.xIDE:PyCharm一、前言解决模型过拟合问题的基本方法有:增加数据量正则化降维直接降维:人工的
特征选择
线性降维
Blessy_Zhu
·
2022-12-17 14:19
机器学习
PCA主成分分析
SVD奇异值分解
最大投影方差
最小重构距离
经典主成分分析CPC
PCA
模式识别 第7、8章 特征的选择和提取
每一个特征对应特征空间的一个维度;特征越多,特征空间的维度越高原则:在保证分类效果的前提下用尽量少的特征来完成分类基本概念(1)特征形成:由仪器直接测量出来的数值,或者是根据仪器的数据进行计算后的结果(2)
特征选择
一直在努力的小宁
·
2022-12-17 11:03
模式识别
算法
python
人工智能
基于
特征选择
的遗传算法(Matlab代码实现)
个人主页:研学社的博客欢迎来到本博客❤️❤️博主优势:博客内容尽量做到思维缜密,逻辑清晰,为了方便读者。⛳️座右铭:行百里者,半于九十。本文目录如下:目录1概述
荔枝科研社
·
2022-12-16 23:11
单
多目标智能算法
matlab
开发语言
绿盟SecXOps安全智能分析技术白皮书 定义内涵
数据预处理是指在数据分析之前,对数据进行的清洗、筛选、转换、
特征选择
和提取等一系列必要处理操作的过程。技术背景数据预处理的常见方法有数据清洗、数据转换、
特征选择
、数据降噪和数据增强。
m0_73803866
·
2022-12-16 17:03
人工智能
算法
系统学习CV-lesson2-偏差方差
逻辑回归交叉熵函数无偏估计梯度下降的由来梯度下降反向传播批量梯度下降方差-偏差泛化误差模型学习期望和均值偏差方差偏差与方差噪声欠拟合过拟合策略正则化稀疏性稀疏性与过拟合L1与L2L1/L2正则项与线性回归
特征选择
网格搜索多重共线性矩阵求导模型评价指标分类问题
aoaoGofei
·
2022-12-16 17:01
深度学习与计算机视觉
计算机视觉
数据预处理 定义内涵
数据预处理是指在数据分析之前,对数据进行的清洗、筛选、转换、
特征选择
和提取等一系列必要处理操作的过程。技术背景数据预处理的常见方法有数据清洗、数据转换、
特征选择
、数据降噪和数据增强。
maoguan121
·
2022-12-16 17:28
人工智能
算法
机器学习:xgboost原理及实践
3.Boosting和Bagging3.1偏差-方差分解3.2Bagging3.3Boosting4.GBDT5.Xgboost5.1xgboost实现5.1xgboost
特征选择
5.2xgboost超参数优化
阳阳yyx
·
2022-12-16 15:59
机器学习算法
xgboost
数据预处理的常见方法
数据预处理是指在数据分析之前,对数据进行的清洗、筛选、转换、
特征选择
和提取等一系列必要处理操作的过程。技术背景数据预处理的常见方法有数据清洗、数据转换、
特征选择
、数据降噪和数据增强。
securitypaper
·
2022-12-16 13:06
人工智能
算法
《机器学习算法竞赛实战》学习笔记4.特征工程
特征工程主要分为:数据预处理、特征变换、特征提取、
特征选择
四部分特征工程数据预处理缺失值处理异常值处理特征变换连续变量无量纲化连续变量数据变换类别特征转换不规则特征变换特征提取多值特征类别相关的统计特征数值相关的统计特征时间特征
特征选择
特征关联性分析特征重要性分析封装方法特征工程
全自动学习机器
·
2022-12-16 13:32
机器学习
算法
学习
Python数据分析之特征处理笔记五——特征预处理(特征降维及特征衍生)
2.3特征降维2.3.1基本思想与
特征选择
的思想有着异曲同工之妙,都是希望在保留足够信息量的前提下获得比较精简的数据,以提高模型的运算速度。二者的不同之处就是降维的方式:
特征选择
是是直接删除冗余或不相
୧⍤⃝ Nakupenda
·
2022-12-16 09:41
机器学习
数据分析
数据分析
数据挖掘
机器学习
python
Python数据分析之特征处理笔记三——特征预处理(
特征选择
)
书接上文,进行数据清洗过程后,我们得到了没有空值、异常值、错误值的数据,但想要用海量的数据来建立我们所需要的算法模型,仅仅是数据清洗的过程是不够的,因为有的数据类型是数值,有的是字符,怎样将不同类型的数据联系起来?以及在保证最大化信息量的前提下,怎样得到便于分析的数据?这就是特征预处理要做的工作。一、理论基础1.基本概念特征预处理是数据预处理过程的重要步骤,是对数据的一个的标准的处理,几乎所有的数
୧⍤⃝ Nakupenda
·
2022-12-16 09:40
数据分析
机器学习
python
数据分析
机器学习
随机森林
决策树
上一页
13
14
15
16
17
18
19
20
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他