E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
特征工程-数据降维
数据降维
:主成分分析法(PCA)
手执烟火以谋生,心怀诗意以谋爱目录1.原理介绍2.步骤详解2.1获取数据2.2数据中心化(标准化)2.3求协方差矩阵2.4计算协方差矩阵的特征值和特征向量2.5确定主成分个数2.6计算主成分3.案例分析3.1题目简介3.2读取数据3.3中心化数据3.4求协方差矩阵3.5计算特征值3.6计算特征值对应的特征向量3.7确定主成分个数并计算主成分矩阵3.8计算主成分(降维后数据)4.完整代码(Java)
离陌lm
·
2022-12-12 16:23
数学建模
机器学习
深度学习
java
美国大学生数学建模竞赛
数学建模
NNI 自动调参使用。
NNI(NeuralNetworkIntelligence)是一个轻量而强大的工具,可以帮助用户自动化:超参调优,架构搜索,模型压缩,
特征工程
。本文只简单介绍如何超参数调优。1原理
JiangHe1997
·
2022-12-12 16:52
python
机器学习
深度学习
数据降维
:主成分分析算法(PCA)
数据降维
概念
数据降维
是在数据挖掘和信号处理任务中,对输入数据进行预处理的常用手段,其目的在于从高维的输入数据中找出能够代表数据特性、能够有利于分类的低维特征。
YysJyj
·
2022-12-12 16:51
算法
数据挖掘
机器学习
每天五分钟机器学习:经典的降维算法——主成分分析法PCA
将二维
数据降维
到一维,关键就是找到一个方向向量,然后把所有的数据都投射到该向量上,那么什么样的方向向量最好呢?
幻风_huanfeng
·
2022-12-12 16:46
每天五分钟玩转机器学习算法
算法
人工智能
python
数据挖掘
高维数据PCA降维可视化(KNN分类)
数据做好类别分类后,通过二维图或者三维图进行可视化,对于高维数据可以通过PCA(PrincipalComponentAnalysis),即主成分分析方法,是一种使用最广泛的
数据降维
算法。
Klein-
·
2022-12-12 15:05
python3
数据挖掘
数据分析
机器学习
sklearn
python
什么才是一个好的
特征工程
?
文章目录
特征工程
例子参考资料
特征工程
“上面的多项式特征是根据它们与目标数据的匹配程度来选择的。考虑这个问题的另一种方法是,一旦我们创建了新特性,我们仍然在使用线性回归。
CodeSlogan
·
2022-12-12 13:27
AI
机器学习
python
人工智能
Python数据分析之
特征工程
目录一、数据清洗:1、数据样本采集(抽样)2、异常值处理识别异常值和重复值直接丢弃(包括重复数据)集中值指代(除异常值外的均值、中位数、众数等等)插值根据不同特征值的具体形式处理二、特征预处理1、特征选择——剔除与标注不相关或者冗余的特征过滤思想(设置过滤的阈值)包裹思想(递归特征消除法算法—RFE—resavefeatureelimination)嵌入思想(正则化——系数反应特征重要程度)2、特
啊心个。
·
2022-12-12 12:38
笔记
python
数据分析
数据挖掘
scikit-learn
Lesson 10 : 主成分分析和因子分析
PCA(
数据降维
),EFA(发现潜在结构)一、主成分分析查看数据是否完整library(psych)complete.cases(USJudgeRatings)Step1、判断主成分个数:碎石图library
自律的萱小主
·
2022-12-12 12:55
零基础
r语言
PCA人脸识别个人理解及步骤
PCA人脸识别个人理解及步骤前言PCA,即主成分分析,是一种
数据降维
的方法,也是一种古老而经典的人脸识别的算法。理解PCA算法的原理和步骤,对我们的思维启发还是很有帮助的。
_Daibingh_
·
2022-12-12 10:18
人脸识别
脸部识别
算法
文本分类--普通分类
2问题总结文本分类的一般流程;3解决思路3.1文本的特征提取特征选择是
特征工程
中的重要一
FibonacciCode
·
2022-12-12 09:13
自然语言处理
【
特征工程
】多项式特征PolynomialFeatures(将数据变化为多项式特征)
使用sklearn.preprocessing.PolynomialFeatures来进行特征的构造。它是使用多项式的方法来进行的,如果有a,b两个特征,那么它的2次多项式为(1,a,b,a^2,ab,b^2)。PolynomialFeatures有三个参数degree:控制多项式的度interaction_only:默认为False,如果指定为True,那么就不会有特征自己和自己结合的项,上面的
小胡同1991
·
2022-12-12 08:57
机器学习
Python
python
数据挖掘框架(结构化数据)
一、数据探索数据量数据缺失情况描述性统计特征理解特征分布周期性分析对比分析相关性分析训练集和测试集的分布一致性二、数据预处理缺失值处理异常值处理内存优化三、
特征工程
1.ID特征处理需要考虑训练集和测试集数据拆分方式
1289902828
·
2022-12-12 00:47
数据挖掘
数据挖掘
机器学习
人工智能
Python中的时序分析工具包推荐(2)
导读在前期推文Python中的时序分析工具包推荐(1)中介绍了时序分析的三个工具包,分别侧重于时序
特征工程
、基于sklearn的时序建模和更为高级的时序建模工具。
小数志
·
2022-12-11 23:18
机器学习
大数据
python
机器学习
人工智能
数据分析
PCA原理及OpenCV实现
通过
数据降维
可以实现数据的压缩,同时方便数据分析和提高算法的处理速度。PCA的原理就是通过正交变换,最大化样本协方差阵的对角元素,最小化非对角元素。但是PCA应用本身是基于一定
不吃鸳鸯锅
·
2022-12-11 23:12
opencv
计算机视觉
人工智能
时间序列分析的关键问题
特征提取利用深度神经网络或者传统
特征工程
的方法,例如卷积、多尺度卷积或者PCA降维法。
xiaobin199cs
·
2022-12-11 22:09
深度学习
机器学习
神经网络
python机器学习
逻辑回归目标值:连续型的数据-回归问题线性回归,岭回归目标值:无-无监督学习聚类k-means分类问题指的是分类别,辨别是什么回归问题指的一系列数据预测机器学习开发流程开发流程都是一样数据获取数据处理
特征工程
机器学习算法训练
爱吃鸡的小鸡
·
2022-12-11 18:54
学习
人工智能
sklearn的系统学习——PCA降维(案例及完整python代码)
PCA(PrincipalComponentAnalysis),即主成分分析方法,是一种使用最广泛的
数据降维
算法。下文将列出三个案例,分别是人脸识别、降噪和处理手写数据集。
weiAweiww
·
2022-12-11 15:00
机器学习
python
sklearn
学习
数据挖掘实战(1)——手写数字识别
文章目录1导包2数据准备3数据规范化4划分数据集5训练5查看结果6
数据降维
并画出决策边界7混淆矩阵8学习曲线9验证曲线1导包importtimeimportpickleimportnumpyasnpimportmatplotlib.pyplotaspltimportpandasaspdfromcollectionsimportCounterfromsklearn.datasetsimportloa
热爱旅行的小李同学
·
2022-12-11 12:57
#
数据挖掘
人工智能
sklearn
数据挖掘
分类
python
机器学习
python降维方法_python大战机器学习——
数据降维
注:因为公式敲起来太麻烦,因此本文中的公式没有呈现出来,想要知道具体的计算公式,请参考原书中内容降维就是指采用某种映射方法,将原高维空间中的数据点映射到低维度的空间中1、主成分分析(PCA)将n维样本X通过投影矩阵W,转换为K维矩阵Z输入:样本集D,低维空间d输出:投影矩阵W算法步骤:1)对所有样本进行中心化操作2)计算样本的协方差矩阵3)对协方差矩阵做特征值分解4)取最大的d个特征值对应的特征向
weixin_39528697
·
2022-12-11 11:35
python降维方法
分类算法————sklearn转换器和估计器
目录1转换器-
特征工程
的父类2估计器(sklearn机器学习算法的实现)3sklearn模型的保存和加载API1转换器-
特征工程
的父类把
特征工程
的接口称之为转换器fit_transform()两个函数的封装
荷泽泽
·
2022-12-11 10:06
机器学习
python
抓住训练集中真正有用的样本,提升模型整体性能!
因此,相似的研究早在我们还要做
特征工程
的时期就已经层出不穷。而到了DNN时代,在做任务的我们不需
zenRRan
·
2022-12-11 09:19
大数据
算法
python
计算机视觉
神经网络
某教育平台线上课程用户行为数据分析报告
目录项目背景分析思路1.链路分析2.指标拆解探索数据(EDA)数据处理用户活跃度分析1.区域维度2.时间维度用户流失分析流失预警模型1.流失用户定义2.
特征工程
3.特征筛选4.数据建模完整代码下载项目背景此数据集来自于
amanoaki
·
2022-12-11 08:11
数据分析
数据挖掘
人工神经网络理论、设计及应用_人工神经网络到底能干什么?到底在干什么?...
转的别人的,觉得写的很好,明白了人工神经网络与传统机器学习、深度学习是个什么关系,是否需要
特征工程
,转的地址是:http://www.broadview.com.cn/article/419380www.broadview.com.cn1
weixin_39801356
·
2022-12-11 07:52
人工神经网络理论
设计及应用
机器学习面试题总结
文章目录https://github.com/zhengjingwei/machine-learning-interview一、机器学习相关1、基本概念2、经典机器学习**
特征工程
**解答**一、机器学习相关
neronjust
·
2022-12-11 05:13
PCA
数据降维
、数据重建计算步骤
-1*M得到去均值的数据N*M二、计算N*M矩阵的特征协方差矩阵M*M三、计算协方差矩阵的特征值M*1与特征向量M*M四、对特征值按从大到小排序,选择前D个特征值对应的特征向量组成主成分向量D*M五、
数据降维
用输入数据
_阿尔伯特
·
2022-12-11 01:16
python
机器学习
风控特:关系网络
特征工程
入门实践
风控业务背景常规RFM时间切片统计特征侧重于纵向维度量化用户风险,而关系网络特征则从横向维度来评估。纵向是指同一用户在不同时间段上的行为异常风险;横向是指在同一个时间段里聚集的不同用户放在一起评估风险。因此,关系网络特征可作为常规RFM特征的一个有力补充,为风控模型带来可预见的增量效果。芝麻信用分中的人脉关系维度可以给我们带来很多启发,其又细分为人脉圈稳定性、社交影响力指数和信用环境指数三个子指标
hellozhxy
·
2022-12-11 01:05
机器学习
风控特征的关系网络
特征工程
入门实践
风控业务背景常规RFM时间切片统计特征侧重于纵向维度量化用户风险,而关系网络特征则从横向维度来评估。纵向是指同一用户在不同时间段上的行为异常风险;横向是指在同一个时间段里聚集的不同用户放在一起评估风险。因此,关系网络特征可作为常规RFM特征的一个有力补充,为风控模型带来可预见的增量效果。芝麻信用分中的人脉关系维度可以给我们带来很多启发,其又细分为人脉圈稳定性、社交影响力指数和信用环境指数三个子指标
Pysamlam
·
2022-12-11 01:35
风控特征—关系网络
特征工程
入门实践
“本文业务角度分享了风控业务中构建关系特征的一些实践经验,包括数据源分析,关系网络和特征的构建,特征性能的评估以及线上方案的落实。”作者:求是汪在路上来源:知乎专栏风控模型算法。编辑:happyGirl风控业务背景常规RFM时间切片统计特征侧重于纵向维度量化用户风险,而关系网络特征则从横向维度来评估。纵向是指同一用户在不同时间段上的行为异常风险;横向是指在同一个时间段里聚集的不同用户放在一起评估风
Datawhale
·
2022-12-11 01:04
ML03数据预处理
title:数据预处理与
特征工程
date:2021-04-11tags:ML基础categories:dataAnalysistypora-root-url:.
weixin_41905232
·
2022-12-10 21:07
机器学习
机器学习
朴素贝叶斯算法:对文本进行分类
二、使用贝叶斯算法对文本进行分类1、获取数据2、划分数据集3、
特征工程
(文本特征处理)4、朴素贝叶斯预估器流程5、模型评估6、结果7、完整代码三、总结一、什么是朴素贝叶斯算法?
Mae_strive
·
2022-12-10 19:53
分类
算法
python
主成分分析(principal component analysis, PCA)公式
主成分分析(principalcomponentanalysis,PCA)公式主成分分析摘要什么是主成分求解PCA的公式数学证明程序验证参考文献主成分分析摘要主成分分析作为一种常见的
数据降维
(dimensionreduction
kdaHugh
·
2022-12-10 18:51
机器学习
线性代数
Python
主成分分析和协方差矩阵
文章目录前言理论分析(一).构建线性空间(二).实现最近重构性(三).实现最大可分性(四).最大化协方差矩阵(五).Numpy库实现主成分分析前言本文主要介绍机器学习中的无监督学习
数据降维
方法:主成分分析法
Sun-sky
·
2022-12-10 18:21
机器学习
机器学习算法竞赛实战-学习总结
背景机器学习在大多数时候只是数学统计,数据相关的
特征工程
直接决定了模型的上限,而算法只是不断地逼近这个上限而已。
一銤阳光
·
2022-12-10 16:45
机器学习
机器学习
算法
学习
K-近邻(KNN)算法
目录前言1、kNN算法总结2、三要素2.1.距离度量:描述最邻近2.2.k的大小2.3.分类规则3场外:kNN最重要的
特征工程
——特征归一化前言kNN是一种基本的分类和回归方法,本文探讨的是KNN的分类方法
一本糊涂张
·
2022-12-10 03:18
机器学习
算法
python
人工智能
训练集和测试集样本分布一致性的判断方法
在实战中,
特征工程
几乎需要一半以上的时间,是很重要的一个部分。缺失值处理、异常值处理、数据标准化、不平衡等问题大家应该都已经手到擒来小菜一碟了,
lizz2276
·
2022-12-09 19:44
python
算法
任务1 - 线性回归算法梳理
过拟合欠拟合(方差和偏差以及各自解决办法)、交叉验证1.机器学习流程机器学习是一个数据流转、分析以及得到结果的过程,它的整个流程大致可以分为六个步骤,按照数据流自上而下的顺序排列分别是:场景解析、数据预处理、
特征工程
R_TRIG
·
2022-12-09 19:34
基于SARIMA、XGBoost和CNN-LSTM的时间序列预测对比
利用统计测试和机器学习分析和预测太阳能发电的性能测试和对比本文将讨论通过使用假设测试、
特征工程
、时间序列建模方法等从数据集中获得有形价值的技术。
deephub
·
2022-12-09 18:52
python
深度学习
时间序列
泰坦尼克号预测结果分析报告
目录提出问题(BusinessUnderstanding)理解数据(DataUnderstanding)采集数据导入数据查看数据集信息数据清洗(DataPreparation)数据预处理
特征工程
(FeatureEngineering
郭苗苗772266
·
2022-12-09 18:16
数据挖掘
python
数据分析
数据挖掘机器学习[六]---项目实战金融风控之贷款违约预测
相关文章:
特征工程
详解及实战项目【参考】数据挖掘---汽车车交易价格预测[一](测评指标;EDA)数据挖掘机器学习---汽车交易价格预测详细版本[二]{EDA-数据探索性分析}数据挖掘机器学习---汽车交易价格预测详细版本
汀、
·
2022-12-09 15:52
数据挖掘-机器学习
数据挖掘
机器学习
sklearn
boosting
数据分析
机器学习思维导图(基于sklearn)
机器学习算法分类机器学习开发流程
特征工程
数据集
特征工程
介绍分类算法sklearn转换器和估计器K-近邻算法模型选择与调优朴素贝叶斯算法决策树集成学习方法之随机森林回归与聚类算法线性回归过拟合与欠拟合带有
Gavid-jh
·
2022-12-09 13:10
machine
learning
机器学习
思维导图
sklearn
机器学习算法基础 2
数据降维
特征选择特征选择就是单纯地从提取到的所有特征中选择部分特征作为训练集特征,特征在选择前和选择后可以改变值、也不改变值,但是选择后的特征维数肯定比选择前小,毕竟我们只选择了其中的一部分特征。
eddiechen10081
·
2022-12-09 13:37
机器学习
深度学习
pandas
人工智能
算法
二手车价格预测
二手车价格预测查看要求查看原始数据导入数据查看数据日期格式转化是否存在空值
特征工程
使用天数数据分箱选择特征字段处理测试数据特别注意构建模型模块导入数据预处理模型搭建Lasso模型Ridge模型BayesianRidge
qq_41553076
·
2022-12-09 12:13
python
机器学习
人工智能
深度学习
数据挖掘
论文笔记(微表情识别):Micro-Attention for Micro-Expression Recognition
(此种整合可以减少参数数量)
特征工程
的方法更适合离线,端到端的方法更适合快速、实时、线上的场合。(本文运用的是基于深度学习思想的用于微表情识别的端到端网络,在训练上
芍子zi
·
2022-12-09 05:36
论文阅读笔记
深度学习
计算机视觉
LDA判别分析和PCA主成分分析之
数据降维
原理:线性判别分析(LinearDiscriminantAnalysis,简称LDA)是一种经典的监督学习的
数据降维
方法,也叫做Fisher线性判别(FisherLinearDiscriminant,FLD
韩立 •
·
2022-12-09 02:37
多元统计
java
servlet
服务器
主成分分析 PCA 线性判别分类LDA
降维是将高维度的数据保留下最重要的一些特征,去除噪声和不重要的特征,从而实现提升数据处理速度的目的PCA(PrincipalComponentAnalysis),即主成分分析方法,是一种使用最广泛的
数据降维
算法
k+
·
2022-12-09 02:36
机器学习
主成分分析
PCA
线性判别分类LDA
数据降维
——主成分分析PCA
一:预备知识向量向量的内积与投影:两个向量A,B内积的计算公式为:A▪B=∣A∣∣B∣cos(α)A▪B=|A||B|cos(α)A▪B=∣A∣∣B∣cos(α)1)向量内积的几何解释就是:向量A在向量B上的投影长度(∣A∣cos(α)|A|cos(α)∣A∣cos(α))乘以向量B的模特别的,如果一个向量如a是某个坐标轴的单位向量,那么两个向量的内积a▪ba▪ba▪b就是向量在此坐标轴上的坐标值
qq_16608563
·
2022-12-09 02:05
机器学习
数据降维
方法(主成分分析PCA、线性判别分析LDA)
数据降维
1、特征变换1.1、特征提取2、维数缩减2.1、维度灾难2.2、维度缩减2.3、线性降维法2.3.1、主成分分析(PCA)2.3.1.1、数学分析2.3.1.2、算法步骤2.3.1.3、可区分性
北山杉林
·
2022-12-09 02:32
机器学习
模式识别
算法
python
特征工程
-- 数据分桶 Task3
数据分桶数据分桶是一种数据预处理技术,用于减少次要观察误差的影响,是一种将多个连续值分组为较少数量的“桶”的方法。例如,例如我们有一组关于人年龄的数据,如下图所示:现在我们希望将他们的年龄分组到更少的间隔中,可以通过设置一些条件来实现:分桶的数据不一定必须是数字,它们可以是任意类型的值,如“猫”、“狗”等。分桶也可用于图像处理,通过将相邻像素组合成单个像素,可用于减少数据量。一般在建立分类模型时,
VCanna
·
2022-12-08 17:01
数据挖掘
数据分析
【机器学习】
特征工程
的最佳实践
特征工程
是为机器学习创建新输入功能的过程,是改进预测模型的最有效方法之一。提出功能很困难,耗时,需要专业知识。“应用机器学习”基本上是
特征工程
。
ChenVast
·
2022-12-08 17:58
Machine
Learning
机器学习算法理论与实战
机器学习
特征工程
数据挖掘
图像数据的
特征工程
一提到
特征工程
,我们立即想到是表格数据。但是我们也可以得到图像数据的特征,提取图像中最重要的方面。这样做可以更容易地找到数据和目标变量之间的映射。这样可以使用更少的数据和训练更小的模型。
deephub
·
2022-12-08 17:27
python
特征工程
特征提取
深度学习
上一页
27
28
29
30
31
32
33
34
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他