E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
特征工程-数据降维
NLP项目实战—京东健康智能分诊文本分类项目
文章目录引言一、项目的描述与目标二、项目框架三、文本预处理与
特征工程
1.文本预处理2.
特征工程
2.1基于词向量的
特征工程
2.2基于人工定义的特征四、三个任务1.project12.project23.project3
哎呦-_-不错
·
2022-11-19 04:13
#
nlp项目
NLP学习
NLP
文本分类
项目
李宏毅机器学习笔记:深度学习入门简介 反向传播
p=13学习笔记总结深度学习和传统机器学习处理特征的差异;做传统机器学习必须要做
特征工程
来选择合适的输入特征,但深度学习是可以不用事先做
特征工程
,而是在隐藏层中完成特征选择抽取深度学习本质就是神经网络的进一步延伸
麻麻在学习
·
2022-11-19 02:17
神经网络
深度学习
机器学习
从以模型为中心的人工智能到以数据为中心的人工智能《From Model-CentricAl to Data-Centric Al)
原文>>>【学术讲座】从以模型为中心的人工智能到以数据为中心的人工智能【内容概要】1、Model-CentricAI与Data-CentricAl的区别2、Data-CentricAI之
特征工程
(连续特征与离散特征
吹翻书页的风
·
2022-11-19 02:28
机器学习
数据语言
统计分析
深度学习
人工智能
【机器学习技巧】之
特征工程
:数字编码以及One-hot独热编码的几种方式(sklearn与pandas处理方式)
本文主要对OneHot独热编码进行了简单介绍,同时介绍了在sklearn与pandas中进行数字编码以及One-hot独热编码的几种方式。目录1.OneHot独热编码介绍1.1为什么要用One-hot编码?1.2One-hot举例1.3One-hot使用范围创建基础数据2.sklearn机器学习中Onehot编码方式2.1将分类特征进行数字编码---LabelEncoder将分类特征数字化2.2O
阿_旭
·
2022-11-17 15:59
机器学习实战
sklearn
python
Onehot编码
数字编码
【阿旭机器学习实战】【24】信用卡用户流失预测实战
目录问题描述1.读取数据并分离特征与标签2.
特征工程
2.1删除无用特征2.2将字符串特征进行编码2.3对特征数据进行归一化3.建模预测与评估问题描述依据某国外匿名化处理后的真实数据集,通过建
阿_旭
·
2022-11-17 15:29
机器学习实战
人工智能
分类算法模型
收藏|多指标时序预测方式及时序
特征工程
总结
背景现如今,随着企业业务系统越来越复杂,单指标时间序列预测已不能满足大部分企业需求。在复杂的系统内,如果采用单一的指标进行时间序列预测,由于各个指标相互作用的关系,因此会因为漏掉部分指标因素导致出现预测精确度下降的情况。基于以上背景,多指标时间序列预测出现了。多指标时间序列预测可以将目标值涉及到的所有因素均考虑在内,因此提高了预测的准确性。时间序列概念时间序列是一组按照时间发生先后顺序进行排列的数
·
2022-11-17 10:52
LSTM 时间序列预测+股票预测案例(Pytorch版)
文章目录LSTM时间序列预测股票预测案例数据特征对收盘价(Close)单特征进行预测1.导入数据2.将股票数据收盘价(Close)进行可视化展示3.
特征工程
4.数据集制作5.模型构建6.模型训练7.模型结果可视化
零碎@流年絮语
·
2022-11-17 09:06
Deep
learning
lstm
pytorch
python
这或许是全网最全时间序列
特征工程
构造的文章了
由此可见,
特征工程
在机器学习中占有相当重要的地位。在实际应用当中,可以说
特征工程
是机器学习成功的关键。那
特征工程
是什么?
Python数据挖掘
·
2022-11-17 07:44
机器学习
python
开发语言
数据挖掘
神经网络
特征工程
2022年Python顶级自动化
特征工程
框架⛵
特征工程
一般是手动完成,不仅依赖于工程师的丰富经验,也非常耗时。因此『自动化
特征工程
』可以自动生成大量候选特征,帮助数据科学家显著提升了工作效率和模型效果。
·
2022-11-16 23:24
风控建模二、
特征工程
---风控
本节主要将风控中比较常见的
特征工程
。目录目录一、分箱1.1Best-KS1.2卡方分箱法(ChiMerge)二、WOE和IV2.1两种woe处理分类问题。
沐自礼
·
2022-11-16 20:59
风控
人工智能
机器学习
人工智能
机器学习
数据挖掘
算法
python
数据预处理和
特征工程
数据预处理:从数据中检测、纠正、删除损坏的不准确的或者不适用于模型记录的过程目的:让数据更加适应模型,匹配模型需求
特征工程
:将原始数据转换为更能代表预测模型的潜在问题的
特征工程
。
可怜又无助的迪迪迪
·
2022-11-16 13:00
机器学习sklearn
机器学习
python
sklearn-数据预处理与
特征工程
1数据预处理Preprocessing&Imputepreprocessing.MinMaxScaler数据归一化MinMaxScaler有一个重要参数,feature_range,控制我们希望把数据压缩到的范围,默认是[0,1]。使用feature_range控制参数范围当X中的特征数量非常多的时候,fit会报错并表示,数据量太大了我计算不了,此时使用partial_fit作为训练接口,scal
CHEN的小喵
·
2022-11-16 13:29
笔记
机器学习
数据预处理与
特征工程
—10.图像切割与特征提取
文章目录引言一、图像切割二、特征提取1.各阶颜色矩的计算公式三、python实现水质图像数据—百度网盘链接提取码:1234引言 本文以水质图像为例,进行图像切割与特征提取一、图像切割 一般情况下,采集到的水样图片包含盛水容器,且容器颜色与水体颜色差异较大,同时水体位于图片中央,所以为了提取水色特征,就需要提取水样图片中央部分具有代表意义的图像,具体实施方式是提取水样图像中央101×101像素的
哎呦-_-不错
·
2022-11-16 13:29
#
数据预处理与特征工程
图像切割
基于颜色矩提取图像特征
特征提取
数据挖掘
大数据导论第二章——数据预处理与
特征工程
一、数据预处理数据预处理的目标*数据预处理的目标就是要从数据分析要解决的问题出发,产生高质量的、能够满足分析需求、提高分析质量的数据集。从现实生活中收集到的原始数据都是低质量的数据集,会存在数据缺失、有噪音等问题;而用低质的数据直接进行分析得到的分析结果也是低质的。为了得到可靠的分析结果,首先得有高质量的数据集,因此数据预处理的目标就是得到高质量的数据集。评价数据集的指标:(从数据收集与数据处理两
banna127
·
2022-11-16 13:58
大数据
数据挖掘
数据预处理与
特征工程
概述
文章目录前言一、数据挖掘的五大流程1.获取数据2.数据预处理3.
特征工程
4.建模,测试模型并预测出结果5.上线,验证模型效果二、sklearn中的数据预处理和
特征工程
总结前言加油,坚持住,跟着菜菜继续学一
功夫大笨鲨
·
2022-11-16 13:25
数据预处理与特征工程
1024程序员节
sklearn
数据挖掘
梳理数据预处理与
特征工程
全流程
上面是一个经典的数据分析流程,而我想要研究的,其实就是图中的数据探索、预处理、
特征工程
,换句话说,就是拿到数据之后,到建模之前,我
JessssseYule
·
2022-11-16 13:55
数据科学
数据预处理与
特征工程
数据预处理与
特征工程
一、数据预处理在利用机器学习处理问题的过程中,通常会对原始数据进行数据清洗操作来提高数据质量。这一过程被称为数据预处理。
abtgu
·
2022-11-16 13:23
机器学习
人工智能
【2022版】基于矩阵分解的PCA 白化&ZCA白化
【2022版】基于矩阵分解的PCA白化&ZCA白化@author:Heisenberg主成分分析(principalcomponentanalysis,PCA)是一种常用的
数据降维
算法。
SUFEHeisenberg
·
2022-11-16 11:02
Data
Processing
Coding
statistics
矩阵
线性代数
【机器学习基础】数学推导+纯Python实现机器学习算法18:奇异值分解SVD
Python机器学习算法实现Author:louwillMachineLearningLab奇异值分解(SingularValueDecomposition,SVD)作为一种常用的矩阵分解和
数据降维
方法
风度78
·
2022-11-15 13:09
机器学习——
特征工程
(3分钟的超详细介绍)
目录1什么是
特征工程
?2数据预处理和特征处理2.1数据预处理2.2特征处理3特征降维3.0什么是特征降维?
Joker_咖啡逗
·
2022-11-15 11:48
机器学习比赛必备知识
python
机器学习
其他
【机器学习】目标函数总结
二、机器学习算法分类三、有监督学习的目标函数概述1.分类问题2.回归问题3.数据生成模型四、无监督学习的目标函数1.聚类2.
数据降维
五、强化学习参考链接一、为什么需要目标函数?
想变厉害的大白菜
·
2022-11-15 09:06
机器学习
机器学习
聚类
算法
数据挖掘机器学习[四]---汽车交易价格预测详细版本{嵌入式特征选择(XGBoots,LightGBM),模型调参(贪心、网格、贝叶斯调参)}
题目出自阿里天池赛题链接:零基础入门数据挖掘-二手车交易价格预测-天池大赛-阿里云天池相关文章:
特征工程
详解及实战项目【参考】数据挖掘---汽车车交易价格预测[一](测评指标;EDA)数据挖掘机器学习-
汀、
·
2022-11-15 09:00
数据挖掘-机器学习
数据挖掘
数据分析
机器学习
sklearn
boosting
机器学习中的目标函数总结
无监督学习算法通常通过优化一个目标函数完成
数据降维
或聚类。强化学习算法在训练时通过最大化奖励值得到策略函数,然后用策略函数确定每种状态下要执行的动作。多任务学习、半监督学习的核
zenRRan
·
2022-11-15 09:58
算法
聚类算法
计算机视觉
机器学习
人工智能
特征工程
之PCA降维(主成分分析)总结
目录1.PCA是什么2.算法思路详细推算特征值分解优缺点参考链接:1.PCA是什么PCA是什么?PCA(PrincipalComponentAnalysis)是一种常用的数据分析方法如上图所示,原来是三维的数据,通过分析找出两个主成分PC1和PC2,那么直接在这两个主成分的方向上就可以形成一个平面,这样就可以把我们三位的样本点投射到这一个平面上(如右图)。那么此时的PC1和PC2都不单单是我们的其
赵孝正
·
2022-11-15 08:55
特征工程
PCA
降维
特征工程
——主成分分析(PCA)的原理解析
目录一、使用最大方差理论解析PCA原理1、原理解析:2、总结:二、最小平方误差理论解析PCA原理1、原理解析2、总结在机器学习领域中,我们对原始数据进行特征提取,有时会得到比较高维的特征向量。在这些向量所处的高维空间中,包含很多的冗余和噪声。我们希望通过降维的方式来寻找数据内部的特性,从而提升特征表达能力,降低训练复杂度。主成分分析(PrincipalComponentsAnalysis,PCA)
Ma Sizhou
·
2022-11-15 08:25
特征工程
机器学习
Pyspark
特征工程
--PCA
PCA:主成分分析classpyspark.ml.feature.PCA(k=None,inputCol=None,outputCol=None)主成分分析是设法将原来众多具有一定相关性(比如P个指标),重新组合成一组新的互相无关的综合指标来代替原来的指标。PCA训练模型以将向量投影到前k个主成分的低维空间model.explainedVariance:返回由每个主成分解释的方差比例向量01.创建
Gadaite
·
2022-11-15 08:54
ML基础
spark
机器学习
大数据
主成分分析结果成分不显著_【数据分析】特征处理-主成分分析
特征工程
参考文章:https://www.cnblogs.com/infaraway/p/8645133.htmlwww.cnblogs.com主成分分析流程主成分分析包含以下流程:1、原始数据标准化。
难得加油
·
2022-11-15 08:53
主成分分析结果成分不显著
spark ml
特征工程
之主成分分析(pca)
简介主成分分析(PCA)是一种统计方法。通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量,转换后的这组变量叫主成分。sparkML特体相应的AP进行处理。实战1.spark工程的pom文件引用UTF-8UTF-82.112.3.0org.apache.sparkspark-sql_${scala.version}${spark.version}org.apache.sparkspa
test-abc
·
2022-11-15 07:20
spark特征工程
spark
特征工程
:PCA主成分分析(实例)
1.特征转换的介绍样本特征只能从原始数据集中选择吗?答案是否定的。我们可以对原有特征进行组合,转化和提取获取新的特征。其实生活中有很多这样的例子比如:从三维空间到二维平面->用单个摄像头捕获数据时,就像把数据集压入一个二维空间:[x,y,z]->[CI,C2]->在特征转换中,一开始就不认为原始特征空间是最好的。->可能用更少的特征可以更好的描述数据。下面介绍几个概念:(维度缩减)特征转换、特征选
开始King
·
2022-11-15 07:46
机器学习
线性代数
机器学习
矩阵
矩阵的特征:主成分分析(PCA)
在机器学习领域中,我们要进行大量的
特征工程
,将物品的特征转换成计算机所能处理的各种数据。通常,如果我们增加物品的特征,就有可能提升机器学习的效果。
人邮异步社区
·
2022-11-15 07:14
矩阵
pca降维
特征向量
程序员学数学
机器学习——
特征工程
之主成分分析PCA
2、主要应用场景:数据压缩;消除冗余;消除数据噪声;
数据降维
,可视化3、理论基础:最大投影方差理论、最小投影距离理论和坐标轴相关度理论4、直观理解:找出数据里最主要的成分,代替原始数据并使损失尽可能的小
羽落黎纹
·
2022-11-15 07:13
机器学习
特征工程
-主成分分析PCA
文章目录简介步骤均值协方差矩阵特征值和特征向量第一主成分python代码简介主成分分析(PrincipleComponentAnalysis,PCA)是常用的降维方法,用较少的互不相关的新变量来反映原变量所表示的大部分信息,有效解决维度灾难问题。一种直观的解释是,主成分是对所有样本点的一种投影,且我们希望投影后可以尽可能的分开,即使得投影后样本点的方差最大化。不难理解,方差越大,越能反映数据特征。
吾仄lo咚锵
·
2022-11-15 07:10
人工智能
人工智能
数据分析
主成分分析
python
【知识图谱 赵军 学习笔记】第六章 关系抽取
第六章关系抽取任务概述任务分类任务难点相关测评限定域关系抽取基于模板的关系抽取方法基于机器学习的关系抽取方法有监督的关系抽取方法基于
特征工程
的方法基于核函数的方法基于神经网络的方法开放域关系抽取任务概述关系抽取是指自动识别实体之间具有的某种语义关系
JYNjyn666
·
2022-11-14 13:45
知识图谱
赵军
学习笔记
人工智能-第三阶段-k近邻算法1-算法理论、kd树、鸢尾花数据
机器学习(数据科学库):matplotlib、numpy、pandas、seaborn获取数据集—数据基本处理—
特征工程
—机器学习—模型评估1.1k-近邻简介KNN根据你的邻居来推断出你的类别多个邻居中
海星?海欣!
·
2022-11-14 09:03
人工智能
算法
人工智能
近邻算法
python
人工智能--k近邻算法2-归一化、交叉验证、网格搜索、数据分割方法总结、两案例实现
1.7
特征工程
-特征值预处理1.7.1介绍通过一些转换函数奖特征数据转换为更加适合算法模型的特征数据过程为什么要进行归一化/标准化?
海星?海欣!
·
2022-11-14 09:03
人工智能
人工智能
近邻算法
python
人工智能--机器学习概述、motplotlib的使用-折线图、散点图、柱状图、饼图
机器学习步骤:获取数据–数据基本处理–
特征工程
–机器学习(算法)–模型评估与调优人工智能三要素:数据、算法、计算力CPU控制单元多,计算单元少—更适合IO密集型任务GPU计算单元多----更适合计算密集型任务机器学习是人工智能的一个实现途径深度学习是机器学习的一个方法发展而来人工智能图灵测试
海星?海欣!
·
2022-11-14 09:32
人工智能
人工智能
计算机视觉
matlab svd降维测试数据集,
数据降维
--SVD&CUR
矩阵的秩秩即维度SVD使用SVD降维SVD示例WehaveusedthreecolumnsforU,Σ,andV,thecolumnsofUandVcorrespondtoconcepts.Thefirstis“sciencefiction”andthesecondis“romance.”Itishardertoexplainthethirdcolumn’sconcept,butitdoesn’t
评述员詹俊
·
2022-11-13 18:09
matlab
svd降维测试数据集
【Designing ML Systems】第 5 章 :
特征工程
大家好,我是Sonhhxg_柒,希望你看完之后,能对你有所帮助,不足请指正!共同学习交流个人主页-Sonhhxg_柒的博客_CSDN博客欢迎各位→点赞+收藏⭐️+留言系列专栏-机器学习【ML】自然语言处理【NLP】深度学习【DL】foreword✔说明⇢本人讲解主要包括Python、机器学习(ML)、深度学习(DL)、自然语言处理(NLP)等内容。如果你对这个系列感兴趣的话,可以关注订阅哟文章目录
Sonhhxg_柒
·
2022-11-13 14:05
机器学习(ML)
人工智能
深度学习
唐宇迪机器学习课程笔记:随机森林
重新考虑
特征工程
,引入新特征后观察结果走势。对随机森林算法进行调参,找到最合适的参数掌握机器学习中两种经典调参方法,对当前模型进行调节#数据读取importpandasaspdfea
小黑无敌
·
2022-11-13 11:05
python
机器学习
sklearn中的数据预处理和
特征工程
----【1】代码及参数解释【学习笔记】
特征工程
将特征转换成更能代表预测模型潜在问题的过程方法:挑选最相关的、提取特征、创造特征:降维或者计算问题:特征间有相关性、特征和标签无关、太多或者太小、干脆无法
JamePrin
·
2022-11-12 11:24
机器学习
sklearn
机器学习
数据分析
python
数据预处理和
特征工程
一、概述1.数据预处理与
特征工程
数据挖掘的五大流程:(1).获取数据(2).数据预处理数据预处理是从数据中检测,纠正或删除损坏,不准确或不适用于模型的记录的过程可能面对的问题有:数据类型不同,比如有的是文字
Garcia-zhang
·
2022-11-12 11:54
sklearn
机器学习
数据挖掘
数据预处理与
特征工程
(一)----归一化与标准化
数据预处理与
特征工程
(一)----归一化与标准化相关数据集均放置在本人的csdn文件中,如有需要,可免费下载。内容来自老师上课的课件。
折纸成诗
·
2022-11-12 11:24
基础
机器学习
【菜菜的sklearn课堂笔记】数据预处理和
特征工程
-数据预处理-数据无量纲化 & 缺失值
视频作者:菜菜TsaiTsai链接:【技术干货】菜菜的机器学习sklearn【全85集】Python进阶_哔哩哔哩_bilibili数据挖掘的五大流程:获取数据数据预处理数据预处理是从数据中检测,纠正或删除损坏,不准确或不适用于模型的记录的过程可能面对的问题有:数据类型不同,比如有的是文字,有的是数字,有的含时间序列,有的连续,有的间断。也可能,数据的质量不行,有噪声,有异常,有缺失,数据出错,量
烧灯续昼2002
·
2022-11-12 11:24
菜菜的sklearn课堂
sklearn
python
机器学习
算法
数据挖掘
数据预处理和
特征工程
1--无量纲化:数据归一化、标准化
数据不给力,再高级的算法都没有用。教程和sklearn中的数据,都堪称完美。现实中的数据,离使用的完美数据集,相差十万八千里数据挖掘的五大流程:获取数据数据预处理数据预处理是从数据中检测,纠正或删除损坏,不准确或不适用于模型的记录的过程可能面对的问题有:数据类型不同,比如有的是文字,有的是数字,有的含时间序列,有的连续,有的间断。也可能,数据的质量不行,有噪声,有异常,有缺失,数据出错,量纲不一,
海星?海欣!
·
2022-11-12 11:23
数据挖掘
数据挖掘
机器学习
sklearn
机器学习流程
)CSVHDF5(二进制)JSON获取数据(spark)数据集分类将本地数据导入spark连接pyspark创建RDD或DataFrom二数据的基本处理数据去重缺失值处理异常值处理数据集分割数据抽样三
特征工程
特征提取数据离散化和
劫径
·
2022-11-12 11:19
机器学习
降维算法实战项目(1)—使用PCA对二维
数据降维
(Python代码+数据集)
一、PCA算法PCA算法为主成分分析算法,在数据集中找到“主成分”,可以用于压缩数据维度。我们将首先通过一个2D数据集进行实验,以获得关于PCA如何工作的直观感受,然后在一个更大的图像数据集上使用它。PCA算法的好处如下:1.使得数据集更易使用2.降低算法的计算开销3.去除噪声4.使得结果更易理解线性回归和神经网络算法,都可以先使用PCA对数据进行降维。关于PCA算法的理论部分,可以参考我之前的博
旅途中的宽~
·
2022-11-11 23:20
机器学习系列文章
python
机器学习
PCA算法
降维
【机器学习】基于PCA/LDA的
数据降维
和可视化(二维+三维)
基于PCA/LDA的
数据降维
和可视化IntroductionProjectIntroFileIntroToolsIntroCode&DatasetLinkProcessPreparationsofImportsInitializationofdataPCAtwo-dimensionalthree-dimensionalLDAtwo-dimensionalthree-dimensionalVisua
夹小汁
·
2022-11-11 23:49
机器学习
python
机器学习
pca降维
机器学习--高维
数据降维
方法并使用Iris数据集进行降维演示
文章目录前言一、主成分分析(PCA)1.说明2.【例1】基于主成分分析对Iris数据集降维:二、奇异值分解(SVD)1.说明2.【例2】基于奇异值分解对Iris数据集降维。三、线性判别分析(LDA)1.说明2.【例3】基于线性判别式分析对Iris数据集降维四、局部线性嵌入(LLE)1.说明2.【例4】基于局部线性嵌入对Iris数据集降维五、拉普拉斯特征映射(LE)1.说明2.【例5】基于拉普拉斯特
马里奥w
·
2022-11-11 23:49
机器学习
【动手学深度学习Pycharm实现8】Pytorch神经网络参数的保存与读取
前言很久没更新了,第一个原因是学校的课程任务,第二个原因是在kaggle实战去了,我参加的是泰坦尼克那个比赛,调了快一周的代码,收获也是不小,感受最大的就是:在机器学习的任务中,非常非常重要的就是
特征工程
Stick_2
·
2022-11-11 23:19
深度学习
神经网络
pytorch
使用python简单实现三种常见的降维方法:PCA、t-SNE和Umap(降到二维进行可视化)
三种常见的降维方法:PCA、t-SNE和Umap1.PCA主成分分析方法(PrincipalComponentAnalysis,PCA)是一种使用最广泛的
数据降维
算法。
风灬陌
·
2022-11-11 23:16
Python
算法
python
算法
上一页
37
38
39
40
41
42
43
44
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他