E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
特征工程-数据降维
python pca降维数据的保存,PCA
数据降维
原理及python应用(葡萄酒案例分析)
目录主成分分析(PCA)——以葡萄酒数据集分类为例1、认识PCA(1)简介
数据降维
的一种方法是通过特征提取实现,主成分分析PCA就是一种无监督数据压缩技术,广泛应用于特征提取和降维。
国观智库
·
2022-11-21 18:43
python
pca降维数据的保存
PCA降维代码实现
背景主成分分析(PrincipalComponentsAnalysis),简称PCA,是一种
数据降维
技术,用于数据预处理。
vincent_hahaha
·
2022-11-21 18:12
机器学习
机器学习-PCA
数据降维
详解
机器学习-PCA
数据降维
详解01PCA降维思路02PCA降维的本质03代码实现及过程讲解01PCA降维思路Step01:零均值化处理Step02:计算协方差矩阵Step03:构建降维矩阵Step04:利用降维矩阵对初始数据进行降维
知帷
·
2022-11-21 18:38
机器学习
机器学习
python
人工智能
PCA
PCA实现降维的过程
PCA将相关性高的变量转变为较少的独立新变量,实现用较少的综合指标分别代表存在于各个变量中的各类信息,既减少高维数据的变量维度,又尽量降低原变量数据包含信息的损失程度,是一种典型的
数据降维
方法。
Brice Loskie
·
2022-11-21 18:23
data
mining
python
算法
机器学习实战——PCA降维
文章目录1降维技术2PCA2.1移动坐标轴2.2在NumPy中实现PCA3示例:利用PCA对半导体制造
数据降维
4总结Dimensionalityreductiontechniques降维降维是对数据高维度特征的一种预处理方法
SKYWALKERS_2397
·
2022-11-21 16:56
机器学习
人工智能
python
数据特征预处理
"""
特征工程
的数据处理:1.异常数据处理(采用数据清洗);1)删除含有异常值的记录;2)将异常值视为缺失值,交给缺失值处理方法来解决;3)用平均值修正;4)不处理2.数据不平衡处理(数据增强)2.1离散数据异常
小白进阶---持续充电中
·
2022-11-21 16:10
机器学习
java
python
javascript
机器学习与数据挖掘实验四:基于
特征工程
的支持向量机分类实验【详细原理+python代码】
机器学习与数据挖掘实验二:以信息增益为划分准则构造决策树【例题求解】机器学习与数据挖掘实验三:基于CNN(VGG,GoogLeNet)的海面舰船图像分类【详细原理+python代码】机器学习与数据挖掘实验四:基于
特征工程
的支持向量机分类实验
oax_knud
·
2022-11-21 15:30
python机器学习
python
数据挖掘
机器学习与数据挖掘实验三:基于 CNN (VGG,GoogLeNet)的海面舰船图像分类【详细原理+python代码】
机器学习与数据挖掘实验二:以信息增益为划分准则构造决策树【例题求解】机器学习与数据挖掘实验三:基于CNN(VGG,GoogLeNet)的海面舰船图像分类【详细原理+python代码】机器学习与数据挖掘实验四:基于
特征工程
的支持向量机分类实验
oax_knud
·
2022-11-21 15:29
python机器学习
python
cnn
神经网络
深度学习
机器学习与数据挖掘实验二:以信息增益为划分准则构造决策树【例题求解】
机器学习与数据挖掘实验二:以信息增益为划分准则构造决策树【例题求解】机器学习与数据挖掘实验三:基于CNN(VGG,GoogLeNet)的海面舰船图像分类【详细原理+python代码】机器学习与数据挖掘实验四:基于
特征工程
的支持向量机分类实验
oax_knud
·
2022-11-21 15:59
python机器学习
决策树
数据挖掘
python
《深度学习入门》(俗称:鱼书)读书笔记-第四章(神经网络的学习)
但神经网络uo可以直接将原始数据进行学习,避免了人力的
特征工程
。特征量:可以从输入数据中准确提取出重要数据的转换器。不同的
呆瓜种呆瓜
·
2022-11-21 14:49
PCA分析法的python主要代码
一PCA分析法介绍可以理解为是一种降维的思想,将M列
数据降维
成对应的N列数据,用主要的几个字段解释整体方差变异也可以理解为一种低维度的映射,举例将三维的数据找到一个二维映射面,同时可以尽力解释出较多的信息来举例如下图所示
安吉尼尔
·
2022-11-21 12:00
机器学习
python
机器学习
sklearn
主成分分析(PCA)方法步骤以及代码详解
本节将讲述常见的
数据降维
方法PCA,减少数据集的变量数量,同时保留尽可能多的信息。1.什么
薄的算法之芯
·
2022-11-21 12:26
算法
线性代数
机器学习
数据挖掘
scikit-learn
机器学习基础01--scikit-learn库的运用使用库中的数据集与make_blobs/moons/circles的使用
它包含众多的机器学习算法,主要分为六大类:分类、回归、聚类、
数据降维
、模型选择和数据预处理。使用Scikit--Learn库中的数据集数据集名称调用方式适用算法鸢尾花数据集lo
Alex_fxb
·
2022-11-21 12:04
scikit-learn
python
机器学习面试知识点总结
文章目录计算学习理论过拟合与欠拟合过拟合欠拟合偏差与方差最大似然估计与贝叶斯估计极大似然估计贝叶斯决策论贝叶斯估计
特征工程
与特征选择
特征工程
逐层归一化特征选择模型融合融合策略评估方法与评价指标评估方法评价指标优化算法正则化深度模型中的优化采样聚类与降维聚类降维
siyan985
·
2022-11-21 11:25
机器学习
机器学习
人工智能
机器学习模型融合方法综述
来自:NLP情报局我理解的Kaggle比赛中提高成绩主要有3个地方:1)
特征工程
,2)调参,3)模型融合。
zenRRan
·
2022-11-21 11:21
算法
机器学习
人工智能
深度学习
java
计算机视觉和机器学习 - 我所想知道的一切
特征工程
。像素级别的几何特征:haar角点。统计特征:HOG,sift。图像分割。算法:mean-shift,最小割。图像分类。场景分类。算法:svm/决策树/xgboost图像检测。
mlshenhua
·
2022-11-21 11:43
人工智能
神了,用 Python 预测世界杯决赛,发现准确率还挺高
文章目录技术提升数据集的准备模块和数据集的导入探索性数据分析和
特征工程
俄罗斯世
Python数据开发
·
2022-11-21 11:12
机器学习
python
开发语言
xgboost简单介绍_XGBOOST模型介绍
前面的文章谈了谈这次比赛非技术方面的收获,对数据集的初步了解和
特征工程
的处理,今天主要介绍这次使用的模型--XGBOO
一直成长
·
2022-11-21 08:42
xgboost简单介绍
跟着Cell学单细胞转录组分析(五):单细胞转录组marker基因鉴定及细胞群注释
完成
数据降维
和细胞聚类后,最主要的环节和工作就是确定各个细胞群,明确是什么类型的细胞,正群的细胞定群很关键,涉及到整个研究,所以这一步宁愿多费时间,也不要出错。
TS的美梦
·
2022-11-21 07:23
单细胞
聚类
数据挖掘
机器学习
数据分析
决策树系列(四)——基于决策树算法实现员工离职率预测
文章目录基于决策树算法实现员工离职率预测一、引入工具包二、数据加载三、数据预处理3.1重复值处理3.2缺失值处理3.3异常值处理四、特征选择4.1删除明显无关特征4.2查看数值型特征相关性4.3类别型特征探索性分析五、
特征工程
类别型特征转换六
初一·
·
2022-11-21 07:07
数据挖掘
python
机器学习
人工智能
算法
特征工程
:tsfresh构造时间序列特征
本文基本上是对tsfresh官方文档的部分翻译。kaggle上使用可以参考tsfresh-features-and-regression-blendFeatureextractionsettings对于懒人:让我计算一些特征!要计算一组全面的特征,请调用tsfresh.extract_features()方法而不传递default_fc_parameters或kind_to_fc_paramete
wbzhang233
·
2022-11-21 07:05
Kaggle
python
特征工程
时间序列
tsfresh
时间序列-第三方库:tsfresh【特征提取、特征选择】
tsfresh用于从时间序列和其他序列数据中进行系统
特征工程
。这些数据的共同点是它们按自变量排序。最常见的自变量是时间(时间序列)。
u013250861
·
2022-11-21 07:35
时间序列(Time
Series)
python
开发语言
时间序列 工具库学习(1) tsfresh特征提取、特征选择
tsfresh用于从时间序列和其他序列数据[1]中进行系统
特征工程
。这些数据的共同点是它们按自变量排序。最常见的自变量是时间(时间序列)。
Tony Einstein
·
2022-11-21 06:51
时间序列
python
时间序列
特征选择
tsfresh
天池长期赛:二手车价格预测(422方案分享)
前言一、赛题介绍及评测标准二、数据探索(EDA)1.读取数据、缺失值可视化2.特征描述性统计3.测试集与验证集数据分布4.特征相关性三、数据清洗四、
特征工程
1.构建时间特征2.匿名特征交叉3.平均数编码五
wjzeroooooo
·
2022-11-21 05:27
数据挖掘
Python
大数据
python
数据挖掘
天池学习赛——金融风控-贷款违约预测(02)
对数据进行探索性数据分析,理解变量的数据分布特点,有助于我们更好的了解数据,便于对数据进行预处理以及
特征工程
,构建更精确的模型。接下来对贷款违约预测数据进行EDA,探索其数据花园的秘密(滑稽)。
ARTHES.TANG
·
2022-11-21 05:56
数据分析
python
可视化
机器学习
天池-金融风控训练营-task1-赛题理解
训练营金融风控,15天30小时,6个任务,分为赛题解析、EDA、
特征工程
、建模与调参和模型融合五大主块,最后一部分是参与实际竞赛,快来为简历加分吧。https://tianchi.aliyun.
nikita_zj
·
2022-11-21 05:14
模型
人工智能
数据挖掘
从零学习机器学习七:聚类算法
3.1k-means聚类步骤3.2案例练习3.3小结4模型评估4.1误差平方和(SSE)4.2”肘“方法-K值确定4.3轮廓系数法(SC)4.4CH系数4.5总结5算法优化5.1优缺点5.2Canopy算法5.9总结6
特征工程
火航
·
2022-11-21 05:41
机器学习
算法
sklearn
机器学习
聚类算法
机器学习之分类问题实战(基于UCI Bank Marketing Dataset)
本文基于UCI机器学习数据库中的银行营销数据集,从对数据集进行探索,数据预处理和
特征工程
,到学习模型的评估与选择,较为完整的展示了解决分类问题的大致流程。
weixin_30568715
·
2022-11-21 03:26
人工智能
r语言
python
机器学习实战:Bank Marketing银行对客户订阅理财产品的预测
文章目录概要一、分析训练集整体情况二、
特征工程
1.创造特征2.筛选特征三、数据处理四、模型预测概要该数据与一家葡萄牙银行机构的直接营销活动(电话)有关。分类目标是预测客户是否会订阅定期存款(变量y)。
敞清
·
2022-11-21 03:20
servlet
机器学习——从基本概念到入手
从基本概念到入手基本概述什么是机器学习什么是数据集机器学习的算法怎么分类监督学习无监督学习数据集Sklearn数据集的基本操作小数据集的获取大数据集的获取获取数据的返回类型数据集的划分sklern划分数据集API
特征工程
特征提取字典特征提取文本特征提取中文特征提取
甩一手好枪
·
2022-11-21 03:32
机器学习
python
数据挖掘机器学习[七]---2021研究生数学建模B题空气质量预报二次建模求解过程:基于Stacking机器学习混合模型的空气质量预测{含码源+pdf文章}
相关文章:
特征工程
详解及实战项目【参考】数据挖掘---汽车车交易价格预测[一](测评指标;EDA)数据挖掘机器学习---汽车交易价格预测详细版本[二]{EDA-数据探索性分析}数据挖掘机器学习---汽车交易价格预测详细版本
汀、
·
2022-11-21 01:03
数据挖掘-机器学习
数据挖掘
数据分析
sklearn
boosting
数据挖掘机器学习[五]---汽车交易价格预测详细版本{模型融合(Stacking、Blending、Bagging和Boosting)}
题目出自阿里天池赛题链接:零基础入门数据挖掘-二手车交易价格预测-天池大赛-阿里云天池相关文章:
特征工程
详解及实战项目【参考】数据挖掘---汽车车交易价格预测[一](测评指标;EDA)数据挖掘机器学习-
汀、
·
2022-11-21 01:33
数据挖掘-机器学习
数据挖掘
数据分析
机器学习
boosting
sklearn
实战十四:基于线性回归预测环境空气质量 代码+数据
评测标准:利用均方根误差(RMSE)评价模型Baseline概述:原始特征中的AQI和PM2.5和目标变量IPRC之间具有很强的正相关性,本baseline没有做进一步的
特征工程
,直接用线性回归对数值型特征进行训练与预测成绩截图
甜辣uu
·
2022-11-21 00:17
机器学习实战100例
线性回归
算法
人工智能
python
5--California House Prices(使用MLP)
本来应该先了解
特征工程
的,这里为了简单直接对复杂特征进行丢弃。5.1数据集的准备同示例一样,有两种方法。由于该数据集不大,所以选择直接下载到本地后上传到google云盘使用。因为之
pepsi_w
·
2022-11-21 00:32
深度学习
深度学习
python
神经网络
【大数据实战项目八】使用机器学习算法进行预测分析并进行网上部署
使用机器学习算法进行预测分析9.1数据探索式分析9.1.1环境配置与数据读入9.1.2探究延误航班有多少数据量9.1.3探究出发延期到达提前的数据量9.1.4探究延误的平均时间9.1.5探究延误的原因9.2
特征工程
百木从森
·
2022-11-20 23:50
数据分析师
big
data
机器学习
模型部署
机器学习主成分分析
数据降维
PCA主要通过把数据从高维映射到低维来降低特征维度找线的方法,让点到直线距离最小PCA原理及实现从k=2->1k=3->2(降维)注意1:虽然PCA有
a1111111111ss
·
2022-11-20 23:29
机器学习
主成分分析
算法
机器学习
跟李沐学AI:实用机器学习 | 第二章
收集数据->标注/清洗数据->数据变换->
特征工程
->模型训练2.1探索性数据分析EDA(Exploratorydataanalysis)seaborn可以画的matplotlib多data=pd.read_csv
ZzzGo!
·
2022-11-20 21:56
跟李沐学AI
笔记整理
python
开发语言
常用机器学习算法汇总比较(完)
该系列的前八篇文章:机器学习入门系列(2)–如何构建一个完整的机器学习项目(一)机器学习数据集的获取和测试集的构建方法
特征工程
之数据预处理(上)
特征工程
之数据预处理(下)
特征工程
之特征缩放&特征编码
特征工程
spearhead_cai
·
2022-11-20 18:36
机器学习
算法
如何构建一个完整的机器学习项目
机器学习
CNN
GBDT
梯度下降
Boosting
深度学习导论与应用实践(机器学习篇)
深度学习导论与应用实践(机器学习篇)前言机器学习概述机器学习基本定义和基本术语数据预处理数据清洗数据集拆分机器学习三要素1、模型判别模型和生成模型概率模型和非概率模型机器学习方法概述数据集分类方法数据集不平衡
特征工程
前言本章较为详细
唐十
·
2022-11-20 18:23
2022暑期集训
深度学习
人工智能
神经网络与深度学习 Class 13:卷积神经网络
目录13.1深度学习基础13.2图像识别与深度学习13.3图像卷积13.4卷积神经网络13.1深度学习基础
特征工程
:尽可能选择和构建出好的特征,使得机器学习算法能够达到最佳性能深度神经网络:有多层隐含层的神经网络深度学习三要素
By4te
·
2022-11-20 16:25
Python
机器学习
深度学习
神经网络
cnn
计算机视觉课程报告
计算机视觉,借助机器学习、深度学习等方法,应用专业医师的种类丰富、深度钻研的医学知识,提取医学领域的
特征工程
,就可以对医学数据,包括影像、传感器数据,做出高准确率的医学判断。
是kiki呀
·
2022-11-20 15:24
计算机视觉
人工智能
【学习笔记】《Python深度学习》第四章:机器学习基础
文章目录1机器学习的四个分支1.1监督学习1.2无监督学习1.3自监督学习1.4强化学习2评估机器学习模型2.1训练集、验证集和测试集2.2注意事项3数据预处理、
特征工程
和特征学习3.1神经网络的数据预处理
Schanappi
·
2022-11-20 11:19
深度学习笔记
python
深度学习
【机器学习】UMAP:强大的可视化&降维工具
作者:杰少UMAP:强大的可视化&异常检测工具简介
数据降维
最为重要的是降低数据的维度的同时尽可能保有大量的原始信息,而其中最为大家熟知的是PCA和tSNE,但是这二者都存在一些问题,PCA的速度相对很快
风度78
·
2022-11-20 09:10
可视化
人工智能
机器学习
python
大数据
机器学习——
特征工程
、特征抽取
文章目录
特征工程
1数据集1.1数据集的获取2sklearn数据集2.1sklearn数据的获取2.2sklearn数据集的返回值2.3sklearn数据集的划分2.4对sklearn数据的使用3
特征工程
枯木南
·
2022-11-20 05:37
机器学习-Python
python
scikit-learn
pandas
kaggle- 鸟声识别竞赛学习笔记
kaggle-鸟声识别竞赛学习笔记背景自身困境优胜解决方案思路分析后处理
特征工程
聚合模型额外数据集自身提升方向题外话背景是次kaggle比赛英文名叫为"CornellBirdCallIdentification
船医41
·
2022-11-20 04:10
kaggle
机器学习
深度学习
人工智能
pytorch
神经网络
模型融合方法概述¶
模型融合方法概述¶在比赛中提高成绩主要有3个地方
特征工程
调参模型融合1.Voting¶模型融合其实也没有想象的那么高大上,从最简单的Voting说起,这也可以说是一种模型融合。
处女座程序员的朋友
·
2022-11-20 03:53
14种分类算法进行文本分类实战
文章来源于:http://www.52phm.cn/blog/detail/19前言本篇文本分类实战训练是以完整的文本分类项目流程来写的,比较适合进阶和提高《获取数据》——《数据分析和处理》——《
特征工程
与选择
52phm社区
·
2022-11-20 03:40
python
深度学习
人工智能
机器学习
文本分类
拆解qlib的dataset,使用代码方式加载数据集
今天的主题是手动
特征工程
,qlib的
特征工程
是基于表达式的,不像传统策略使用pandas的dataframe里的计算函数,或者Ta-lib来计算——传统方式适合因子数比较少,比如一个策略不会超过3-5个因子
AI量化投资实验室
·
2022-11-20 02:24
建立自己的算法交易事业
python
pandas
开发语言
数据建模初入门笔记
班级成绩案例之大数据分析相关矩阵热图柱状图直方图散点图UCI肿瘤数据集之大数据分析准备阶段数据集模型训练预测结果UCI观影数据集之大数据分析读取CSV数据清理统计数据与作图Kaggle竞赛之“泰坦尼克号”大数据分析准备工作数据清洗探索可视化
特征工程
基本建模和评估炼丹集成方法预测前言
望向天空的恒毅
·
2022-11-20 02:09
小白的成长
数据挖掘
机器学习
人工智能
数据建模
pytorch 图像分割的交并比_深度学习黑客竞赛神器:基于 PyTorch 图像
特征工程
的深度学习图像增强...
图像增强是一个非常有效的方法我们可以在任何场合使用图像增强进行深度学习——黑客竞赛、工业项目等等我们还将使用PyTorch建立一个图像分类模型,以了解图像增强是如何形成图片的介绍在深度学习黑客竞赛中表现出色的技巧(或者坦率地说,是任何数据科学黑客竞赛)通常归结为
特征工程
weixin_39602891
·
2022-11-20 02:35
pytorch
图像分割的交并比
上一页
34
35
36
37
38
39
40
41
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他