E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
特征工程-数据降维
【阶段三】Python机器学习26篇:机器学习项目实战:LightGBM回归模型
本项目应用LightGBM回归算法进行项目实战,整体流程包括数据收集、数据预处理、探索性数据分析、
特征工程
、模型构建及优化、模型评估。数据收集本次建模数据来源于网络,数据项统计如下:编号
胖哥真不错
·
2023-01-14 10:57
python
人工智能
LightGBM回归模型
入门到项目实战
【阶段三】Python机器学习27篇:机器学习项目实战:
数据降维
:主成分分析PCA、基本原理与PCA模型:人脸识别
本篇的思维导图:
数据降维
:主成分分析PCA建立模型分析特征数据时,很可能会面临特征数据维度过大的问题。
胖哥真不错
·
2023-01-14 10:57
python
人工智能
主成分分析PCA
PCA模型:人脸识别
python机器学习入门笔记分享
人脸识别自然语言处理:语音识别语义识别1-2机器学习工作流程定义[***]数据自动分析获得模型预测从数据中自动分析获得模型,并利用模型对未知数据进行预测2.工作流程[****]1.获取数据2.数据基本处理3.
特征工程
m0_64892604
·
2023-01-14 07:24
python
人工智能
【时序预测】1、概述
由于我们需要应用特定的数据预处理和
特征工程
技术来处理时间序列数据,因此这种基本的时间结构使时间序列问题更具有挑战性。
找不到没用过的名字了
·
2023-01-14 00:44
机器学习
人工智能
大数据分析案例-基于多元线性回归算法构建广告投放收益模型
如果文章对你有帮助的话,欢迎评论点赞收藏加关注+目录1.项目背景2.项目简介2.1研究目的及意义2.2研究方法与思路2.3技术工具3.算法原理4.项目实施步骤4.1理解数据4.2探索性数据分析4.3数据预处理4.4
特征工程
艾派森
·
2023-01-13 18:47
数据分析
大数据
数据分析
python
数据挖掘
pandas
简述事务的概念与事务的特征_
特征工程
工具总结(5)——Featuretools
Featuretools是执行自动化
特征工程
的框架。Featuretools是由FeatureLabs公布的开源项目。它擅长于将时间和关系数据集转换为机器学习的特征矩阵。
weixin_39636057
·
2023-01-13 18:16
简述事务的概念与事务的特征
python tools库_独家 | 用Python Featuretools库实现自动化
特征工程
(附链接)
本文简要介绍
特征工程
的基本组成部分,并用直观的示例理解它们,最后给出使用PythonFeaturetools库实现自动化
特征工程
的操作过程。
weixin_39769228
·
2023-01-13 18:46
python
tools库
Feature Tools:自动特征构造
特征工程
基本概念
特征工程
意味着从现有的数据中构造额外特征,这些特征通常分布在多张相关的表中。
特征工程
需要从数据中提取相关信息并将其存入单张表格中,然后被用来训练机器学习模型。
猪逻辑公园
·
2023-01-13 18:15
机器学习
Feature Tools:自动
特征工程
(翻译)
sudopip3installmatplotlib-ihttps://pypi.mirrors.ustc.edu.cn/simple/1.说明此文为翻译转载-项目文献-原文代码2.正文机器学习模型只能从我们给定的数据中学习,所以构造一个和任务相关的特征是至关重要的,参见优质论文《AFewUsefulThingstoKnowaboutMachineLearning》。然而,人工特性工程是一项冗长乏味
mydear_11000
·
2023-01-13 18:45
python Featuretools实现自动
特征工程
importfeaturetoolsasftfromfeaturetools.selectionimportremove_low_information_featuresimportpandasaspdimportnumpyasnpfilename='data/ds76_tx_All_Data_74_2018_0912_070949.txt'defdatashop_to_entityset(fil
Adm1rat1on
·
2023-01-13 18:45
机器学习
Feature Tools:可自动构造机器学习特征的Python库
目前,很多机器学习项目的模型选择开始转向自动化,而
特征工程
仍然主要以人工为主。这个过程的重要性可能比模型选择更重要,人工得到的特征总带有一定的局限性。
hellozhxy
·
2023-01-13 18:43
机器学习
用 Python Featuretools 库实现自动化
特征工程
(给Python开发者加星标,提升Python技能)英文:PrateekJoshi,翻译:数据派/张玲简介在机器学习黑客马拉松和竞赛中,
特征工程
的质量通常是进入排行榜10强和无缘50强的重要区别,因此,
Python开发者
·
2023-01-13 18:43
FeatureTools官方文档——Get Start 之用实体集表示数据
它们对于为
特征工程
准备原始的结构化数据集非常有用。尽管Featuretools中的许多函数将实体和关系作为不同的参数,但建议创建一个EntitySet,以便你可以根据需要更轻松地操作数据。
影子飞扬
·
2023-01-13 18:13
数据分析及特征工程
技术文章翻译
Featuretools 学习1 - 官方入门文档
featuretools是实现自动
特征工程
的框架。它擅长将时间和关系数据集转换为用于机器学习的特征矩阵。参考官方链接:WhatisFeaturetools?
__Lynn__
·
2023-01-13 18:12
Featuretools
机器学习
python
Featuretools 学习3 - 深度特征合成
深度特征合成深度特征合成(DeepFeatureSynthesis,DFS)是一种用于对关系和时间数据执行
特征工程
的自动化方法。输入数据DFS需要结构化的数据集才能执行
特征工程
。
__Lynn__
·
2023-01-13 18:12
Featuretools
python
机器学习
常用AI/机器学习模型可解释技术与工具
通过模型可解释,可以指导
特征工程
的优化、检测偏差、增强模型使用者对模型的可信度。Anaconda资深数据科学家SophiaYang总结了8种模型可解释常用技术和工具,对其主要特征进行了概述。
Baihai IDP
·
2023-01-13 17:20
技术干货
python
人工智能
算法
机器学习sklearn-数据预处理与
特征工程
一、概述数据不给力,再高级的算法都没有用。数据挖掘的五大流程:获取数据数据预处理数据预处理是从数据中检测,纠正或删除损坏,不准确或不适用于模型的记录的过程可能面对的问题有:数据类型不同,比如有的是文字,有的是数字,有的含时间序列,有的连续,有的间断。也可能,数据的质量不行,有噪声,有异常,有缺失,数据出错,量纲不一,有重复,数据是偏态,数据量太大或太小数据预处理的目的:让数据适应模型,匹配模型的需
Heiko_Lee
·
2023-01-13 16:36
笔记
sklearn
机器学习
python
机器学习--常用的
特征工程
方法
1、特征选择介绍(1)特征选择的定义对当前学习任务有价值的属性称为是“相关特征”,没有价值的属性称为是“无关特征”,从给定的特征集中选择出相关特征子集的过程,就称为是“特征选择”。其中还有一种特征称为是“冗余特征”,这些特征指的是可以从其他特征中推演出来的特征。(2)特征选择的重要性特征选择是一个“数据预处理”过程,它的重要性体现在两个方面:1)减轻维度灾难问题。2)去除无关特征可以降低学习的难度
星辰如月
·
2023-01-13 16:03
机器学习基础-30:
特征工程
与模型选择
机器学习的
特征工程
与模型选择机器学习原理与实践(开源图书)-总目录,建议收藏,告别碎片阅读!1数据预处理数据预处理包括:数据清洗、数据格式转换和领域知识收集等。
MTVideoAI
·
2023-01-13 16:03
机器学习专题
机器学习原理与实践
特征工程
模型选择
机器学习
机器学习--常用的
特征工程
方法
机器学习–常用的
特征工程
方法:https://blog.csdn.net/qq_44930315/article/details/103074289【机器学习】
特征工程
七种常用方法:https://blog.csdn.net
愚昧之山绝望之谷开悟之坡
·
2023-01-13 16:22
笔记
术语
深度学习
人工智能
【3 - 数据预处理】菜菜sklearn机器学习
《菜菜的机器学习sklearn课堂》_哔哩哔哩_bilibili第一期:sklearn入门&决策树在sklearn中的实现第二期:随机森林在sklearn中的实现第三期:sklearn中的数据预处理和
特征工程
第四期
如何原谅奋力过但无声
·
2023-01-13 15:26
机器学习
sklearn
python
推荐排序模型4—— Deep&Cross Network(DCN)及python(DeepCTR)实现
DCN(DeepCrossNetwork)在学习特定阶数组合特征的时候效率非常高,而且同样不需要
特征工程
,引入的额外的复杂度也是微乎其微的。
端坐的小王子
·
2023-01-13 15:26
推荐系统
机器学习
机器学习
ctr
推荐系统
Kaggle出了一本竞赛书(500页)!
Kaggle的介绍,各种Kaggle的建模问题以及建模的技巧,同时还讲述如何利用Kaggle的经历来构建你的简历等:了解Kaggle是如何运作,如何充分利用来自两位专家级Kaggle大师的比赛;通过集成、
特征工程
Datawhale
·
2023-01-13 13:12
人工智能
机器学习
java
大数据
编程语言
使用xgboost建立评分卡
目录1.
特征工程
1.1数据维度1.2特征衍生1.3离散处理1.3.1one-hot编码1.3.2WOE编码1.4特征筛选1.4.1solveKS1.4.2solvePSI1.4.3迭代特征筛选1.4.4
一直在路上ing
·
2023-01-13 01:19
机器学习
风控
机器学习
数据挖掘
prompt范式
1-范式发展历程:P1.非神经网络时代的完全监督学习(FullySupervisedLearning,Non-NeuralNetwork)--
特征工程
P2.基于神经网络的完全监督学习(FullySupervisedLearning
Jeu
·
2023-01-13 01:49
自然语言处理
小样本学习
自然语言处理
数据科学在量化金融中的应用:指数预测(下)
接下来,本篇会重点介绍
特征工程
、模型选择和训练、模型评估和模型预测的详细过程,并对预测结果进行分析总结。
·
2023-01-12 17:16
数据科学数据库云原生
关于局部敏感哈希算法(LSH)的应用场景
LSH最大的作用是对海量高维
数据降维
(一般流程是先为这些大型的文本建立词库,然后通过降维的具体算法,如minHash,stableHash这些,为每个大型文本构建签名矩阵,然后使用Jacaard,这些进行相似度计算
飞火流云
·
2023-01-12 17:44
机器学习
知识图谱
算法
构建企业级推荐系统(03):推荐算法团队介绍(万字长文)
创作不易,点赞关注支持一下吧✌目录一、推荐团队组成1.数据处理与
特征工程
开发人员2.推荐算法研究人员3.推荐算法工程实践人员4.支撑组件开发人员二、与推荐系统密切相关的其他团队1.基
数据与智能
·
2023-01-12 16:22
构建企业级推荐系统
推荐算法
推荐系统
智能推荐
团队搭建
数据处理
sklearn 随机森林_图解随机森林算法
注意:我们不涉及建模中涉及的预处理或
特征工程
步骤,只查看当我们使用sklearn的RandomForestClassifier包调用.fit()和.transform()方法时,算法中会发生什么。
weixin_39968436
·
2023-01-12 00:58
sklearn
随机森林
sklearn随机森林
随机森林算法python代码
机器学习的一般框架
管理开发环境jupyter:编写整个数据处理流程pycharm:远程编写调试代码ipdb:pycharmdubug时偶尔出现一些bug,可以用结合ipdb补充解决数据开发六步data数据的获得、清洗、
特征工程
等预处理在这一步做
FibonacciCode
·
2023-01-11 23:36
深度学习算法
python
深度学习
大数据分析案例-基于KNN算法对茅台股票进行预测
如果文章对你有帮助的话,欢迎评论点赞收藏加关注+目录1.项目背景2.项目简介2.1研究目的与意义2.2研究方法与思路2.3技术工具3.算法原理4.项目实施步骤4.1理解数据4.2探索性数据分析4.3数据预处理4.4
特征工程
艾派森
·
2023-01-11 17:56
数据分析
python
数据挖掘
大数据
数据分析
【机器学习】
特征工程
中常见的特征编码
类别特征(CategoricalFeatures)编码方式OneHotEncoding(独热编码)独热编码,又称为一位有效编码。其方法是使用N位状态寄存器来对N个状态进行编码,每个状态都由他独立的寄存器位,并且在任意时候,其中只有一位有效。可以这样理解,对于每一个特征,如果它有m个可能值,那么经过独热编码后,就变成了m个二元特征。并且,这些特征互斥,每次只有一个激活。如果数据是离散的,而且是无序的
黎小强同学
·
2023-01-11 16:35
机器学习
python
人工智能
机器学习笔记4:
特征工程
一、
特征工程
概述“数据决定了机器学习的上限,而算法只是尽可能逼近这个上限”,这里的数据指的就是经过
特征工程
得到的数据。
腾阳
·
2023-01-11 08:54
机器学习笔记
机器学习
sklearn中的数据预处理和
特征工程
1概述数据不给力,再高级的算法都没有用1.1数据预处理与
特征工程
数据挖掘的五大流程:获取数据数据预处理:从数据中检测、纠正或删除损坏、不正确或不适用于模型的记录的过程。
momokofly
·
2023-01-11 07:48
机器学习
机器学习
深度学习
《图机器学习》-Node Embeddings
EncoderandDecoder三、RandomWalkApproachesforNodeEmbeddings一、GraphRepresentationLearning在传统的图机器学习中,依赖于手工
特征工程
快乐活在当下
·
2023-01-11 00:59
图机器学习
人工智能
深度学习
03_机器学习相关笔记——
特征工程
(3)
03_机器学习相关笔记——
特征工程
(3)在许多实际问题中常常需要面对欧中高维特征,简单地两两组合容易存在参数过多,过拟合的问题。可以使用基于决策树的方式来寻找有效的组合特征。
等风来随风飘
·
2023-01-10 21:06
百面机器学习阅读笔记
人工智能
05_机器学习相关笔记——
特征工程
(5)
05_机器学习相关笔记——
特征工程
(5)Word2Vec输出层N维表示词汇表中有N个单词,通过Softmax激活函数计算每个单词的生成概率,并最终获得概率最大的单词。
等风来随风飘
·
2023-01-10 21:06
百面机器学习阅读笔记
人工智能
04_机器学习相关笔记——
特征工程
(4)
04_机器学习相关笔记——
特征工程
(4)主体模型,用于从文本库中发现有代表性的主题,得到每个主题上面词的分布特性,并且能够计算出每篇文章的主题分布。
等风来随风飘
·
2023-01-10 21:05
百面机器学习阅读笔记
人工智能
深度学习
讲座笔记:Representation Learning on Networks
1传统机器学习传统机器学习需要进行很多的
特征工程
我们希望模型自动学习特征,而不是用人为
特征工程
的方式1.1目标1.2难点graph更复杂,CNN和RNN很难直接应用——>复杂的拓扑结构(不像CNN有网格的概念
UQI-LIUWJ
·
2023-01-10 17:01
讲座笔记
人工智能
深度学习
项目一 Part 4.2 基于网格搜索的超参数优化实战
【Kaggle】TelcoCustomerChurn电信用户流失预测案例第四部分导读 在案例的第二、三部分中,我们详细介绍了关于
特征工程
的各项技术,
特征工程
技术按照大类来分可以分为数据预处理、特征衍生
Grateful_Dead424
·
2023-01-10 15:12
机器学习
人工智能
数据挖掘
机器学习
O2O优惠券核销-模型预测
目录一、项目背景与目标二、数据描述三、问题分析四、数据探索与预处理五、
特征工程
(构造特征)5.1特征构造-整体数据5.1.1时间特征5.1.2优惠券特征5.1.3预测目标值构造5.2数据划分-时间滑窗5.3
十二十二呀
·
2023-01-10 15:00
数据分析笔记
python
决策树
cnn-lstm介绍(2)
CNN具有注意最明显的特征,因此在
特征工程
中得到了广泛的应用。LSTM有,按时间顺序扩张的特性,广泛应用于时间序列中。
不觉云
·
2023-01-10 11:01
深度学习
学习笔记(17):第二章:线性回归-
特征工程
:共享单车骑行量预测
立即学习:https://edu.csdn.net/course/play/10178/216924?utm_source=blogtoeduin17mask什么意思15:30fit-transform是什么意思
weixin_45414304
·
2023-01-10 09:06
研发管理
数据结构与算法
Batch normalization
具体解释可以看这里:
特征工程
中的「归一化」有什么作用?
weixin_30437847
·
2023-01-10 07:40
人工智能
Scikit-Learn实现线性回归数据分析
pandas来读取数据2、生成X,y数据3、划分训练集和测试集4、运行Scikit-Learn的线性模型5、对模型进行评价6、交叉验证7、画图观察真实值与预测值的变化关系数据源是单车共享数据,前期已经实现了
特征工程
fly_Xiaoma
·
2023-01-09 18:38
machineLearning
【啃书】【阿里云天池大赛赛题解析】目录
算法与业务结合的开发步骤:业务理解->数据探索->
特征工程
->模型训练->模型验证->特征优化->模型融和。其中蕴含着模型的重构与参数的优化。实际业务场景应用机器学习,有不同的步骤,但分类不同。
八号线土著
·
2023-01-09 16:59
阿里云
机器学习
【读书向】阿里云天池大赛赛题解析——
特征工程
【读书向】阿里云天池大赛赛题解析——
特征工程
目录【读书向】阿里云天池大赛赛题解析——
特征工程
特征工程
数据预处理与特征处理pivot标准化归一化区间缩放法定量特征二值化哑编码多项式变换特征降维方差选择法相关系数法卡方检验互信息法递归特征消除法
挚爱FXJ
·
2023-01-09 16:58
读书向
机器学习
python
数据挖掘
feature engnineering
特征工程
特征工程
数值型变量standardizationlog_transformation(使其符合正态分布)polynomialfeatures分类型变量orinigalencoderonehotencoder
樱武苏
·
2023-01-09 15:31
机器学习
python
人工智能
机器学习总结-基于sklearn包
流程集成学习数据预处理(
特征工程
)1.处理负值(oroutlier)标记有问题的特征,但是不删去defgetres1(row):returnlen([xforxinrow.valuesiftype(x)
zaprily
·
2023-01-09 14:00
总结
sklearn
python
机器学习
机器学习学习路径
机器学习流程:数据准备→探索数据→
特征工程
→建模→模型评估→部署应用探索特征Python机器学习:select_dtypes()筛选特定数据类型的字段_紫昂张的博客-CSDN博客Python机器学习:value_counts
紫昂张
·
2023-01-09 14:17
数据分析知识体系
深度学习
人工智能
上一页
20
21
22
23
24
25
26
27
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他