E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
特征工程-数据降维
特征工程
与表示学习:人工 vs 自动
相关概念正因为数据表示的重要性,机器学习一般有两种思路来提升原始数据的表达:特征学习(featurelearning),又叫表示学习(representationlearning)或者表征学习,一般指的是自动学习有用的数据特征
特征工程
Rnan-prince
·
2022-11-22 14:44
特征工程
表示学习
精通
特征工程
—— 2.简单得数字奇特技巧
文章目录1.二值化2.区间量化(分箱)3.对数变换4.特征缩放归一化5.交互特征6.特征选择精通
特征工程
pdf:链接:https://pan.baidu.com/s/11AFe7LgjYnf56XcpI_wNKw
倩mys
·
2022-11-22 14:13
数据挖掘
机器学习——
特征工程
——交互特征(多项式特征)
一、交互特征定义两个特征的乘积可以组成一对简单的交互特征,这种相乘关系可以用逻辑操作符AND来类比,它可以表示出由一对条件形成的结果:“该购买行为来自于邮政编码为98121的地区”AND“用户年龄在18和35岁之间”。这种特征在基于决策树的模型中极其常见,在广义线性模型中也经常使用。简单线性模型使用独立输入特征,,…,的线性组合来预测结果变量:。很容易对线性模型进行扩展,使之包含输入特征的两两组合
xia ge tou lia
·
2022-11-22 14:10
机器学习
pyhton
特征工程
特征工程
特征工程
在实际工作中获取到的数据往往不那么理想,可能会存在非数值类型的文本数据、重复值、缺失值、异常值及数据分布不均衡等问题,因此,在进行数学建模前还需要对这些问题进行处理,这项工作称为
特征工程
。
Mr李小四
·
2022-11-22 14:34
机器学习
sklearn
python
数据分析案例-基于随机森林模型探究电商网站推销商品的影响因素
导入模块3.1.2获取数据3.2数据描述性分析3.2.1查看数据维度3.2.2查看数据类型3.3数据预处理3.4数据可视化分析3.4.1客户产品购买情况分析3.4.2客户属性分析3.5建立模型3.5.1
特征工程
艾派森
·
2022-11-22 13:23
数据分析
python
数据分析
数据挖掘
机器学习
随机森林
C++ opencv图像直方图
图像直方图概念图像有很多基础概念,在我们学习的过程中因为一些原因无法涉及,但这并不代表它们不重要今天,我们就来介绍一个概念——图像直方图图像直方图,是图像处理中很重要的一个基础概念,有很多的算法,比如传统的
特征工程
打酱油的;
·
2022-11-22 13:51
C++
opencv
计算机视觉
图像处理
opencv
AE和VAE
主要用于数据去噪、可视化降维(类比PCA可以进行比较)损失函数:自动编码器是数据相关的,自动编码器的过程是有损的,损失函数正是用来衡量由于压缩而损失掉的信息,一般使用L2损失流程:编码器进行
数据降维
后,
机器学习我来学
·
2022-11-22 13:09
模式识别与机器学习
深度学习
计算机视觉
时间序列预测 | Python实现LightGBM模型时间序列预测
|Python实现LightGBM模型时间序列预测基本介绍程序设计总结基本介绍创建一个基于LightGBM并且适合个人使用的时间序列的快速建模程序.程序设计在查看单变量空间中树的其他实现时都会看到一些
特征工程
小橘算法屋
·
2022-11-22 12:38
时间序列分析(Python)
数据统计分析
数据分析应用
python
深度学习
时序模型
人工智能基础(十)K近邻算法
如何计算你到你的"邻居"的距离一般时候,都是使用欧氏距离1.2k近邻算法api初步使用1.sklearn优势:1.文档多,且规范2.包含的算法多3.实现起来容易2.sklearn中包含内容分类、聚类、回归
特征工程
模型选择
San.ferry.▣
·
2022-11-22 09:16
人工智能
python
机器学习
大数据
数据分析
经典机器学习备忘录
文章目录一、
特征工程
1.1特征处理1.1.1特征清洗1.1.2去量纲1.1.3离散化1.1.4缺失值处理1.1.5特征变换1.2特征选择1.2.1过滤法(filter)1.2.2包装法(wrapper)
東方海竹
·
2022-11-22 08:48
机器学习
人工智能
(CVPR 2017)VoxelNet: End-to-End Learning for Point Cloud Based 3D Object Detection
在这项工作中,我们消除了对3D点云的手动
特征工程
的需要,并提出了VoxelNet,这是一种通用的3D检测网络,它将特征提取和边界框预测统一到单阶段、端到端可训练的深度网
fish小余儿
·
2022-11-22 08:02
3D目标检测
深度学习
3d
人工智能
点云
神经网络
机器学习学习笔记(六)之朴素贝叶斯算法
,单词作为特征四、拉普拉斯平滑系数五、APIsklearn.naive_bayes.MultinomialNB(alpha=1.0)朴素贝叶斯分类alpha:拉普拉斯平滑系数六、案例获取数据划分数据集
特征工程
worden丶
·
2022-11-22 07:49
机器学习学习笔记
机器学习
python
Alexnet 学习笔记
Alexnet放在开头:对
特征工程
、机器学习、计算机视觉感兴趣的同学可以加个关注,一起学习、一起交流、一起进步图像分类问题上的经典之作,包含了很多重要的概念及网络训练的技巧(ImageNetClassificationwithDeepConvilutionalNeuralNetwork–AlexKrizhevsky
彩虹编程
·
2022-11-22 06:58
经典网络
TensorFlow
学习
计算机视觉
深度学习
维基百科的语料库下载以及信息提取笔记
目录前言一、前提知识1-1、中文维基百科的下载1-2、抽取正文内容,繁体转换为简体1-2-1、抽取正文内容1-2-2、繁体转换为简体1-3、
特征工程
1-4、训练词向量二、实战训练总结前言中文语料库一般都是极为稀少的
ㄣ知冷煖★
·
2022-11-22 05:24
自然语言处理
深度学习
自然语言处理
python
由“特征提取”引入“卷积神经网络”
2.针对此难题,机器学习中催生了"
特征工程
"的方法。Ps:
特征工程
存在问题:在于不同的数据、不同的问题中的好的特征都是不同的。
一个菜鸟的成长史
·
2022-11-22 05:35
特征提取
深度学习
卷积神经网络
Matlab中特征降维主成分分析(PCA)使用方法(整套流程)
1.PCA简介:PCA(PrincipalComponentAnalysis)主成分分析方法是一种常见的
数据降维
方法。数据维度过高可能会使得模型效果不佳。
Karthus_冲冲冲
·
2022-11-22 04:27
Matlab
机器学习
matlab
开发语言
机器学习
特征工程
系列之降维:用PCA压缩数据
引言降维是关于摆脱“无信息的信息”的同时保留关键点。有很多方法可以定义“无信息”。PCA侧重于线性依赖的概念。我们将数据矩阵的列空间描述为所有特征向量的跨度。如果列空间与特征的总数相比较小,则大多数特征是几个关键特征的线性组合。如果在下一步管道是一个线性模型,然后线性相关的特征会浪费空间和计算能力。为了避免这种情况,主成分分析尝试去通过将数据压缩成更低维的线性来减少这种“绒毛”子空间。在特征空间中
小小谢先生
·
2022-11-22 03:34
特征工程系列学习
人工智能-机器学习-
特征工程
我们用泰坦尼克号事件生还者信息举例,采用KNN算法预测某个人的生还率,采用KNN临近算法数据链接:泰坦尼克号csv数据集一.利用pandas观察数据情况我们先看下数据:各列对应字端的含义为:passengerId:表示乘船编号surverved:表示是否存活,0为死亡,1为生存(此列为标签)pclass:客舱等级name:名字sex:性别age:年龄sibsp:兄弟姐妹数和配偶数parch:船上父
纯洁的小魔鬼
·
2022-11-22 03:34
人工智能
机器学习
数据分析
泰坦尼克号
特征工程
机器学习算法基础1-数据的
特征工程
3.机器学习的应用场景二、数据集的组成1.历史数据是什么格式2.可用数据集3.常用数据集数据的结构组成三、数据的
特征工程
1.
特征工程
是什么2.
特征工程
的意义3.scikit-learn库介绍4.数据的特征抽取
哎呦-_-不错
·
2022-11-22 03:03
机器学习
数据特征工程
百面机器学习—1.
特征工程
插眼:百面机器学习—1.
特征工程
百面机器学习—2.
特征工程
与模型评估要点总结百面机器学习—3.逻辑回归与决策
哎呦-_-不错
·
2022-11-22 03:03
#
《百面机器学习》
百面机器学习
特征工程
特征工程
介绍
特征工程
介绍作者:林泽龙1
特征工程
是什么?优秀的模型往往取决于优秀的特征提取,而特征提取就需要涉及到
特征工程
了。
特征工程
是的目的是最大限度地从原始数据中提取特征以供算法和模型使用。
MoModel
·
2022-11-22 03:02
机器学习
人工智能
python
特征工程
【机器学习】
特征工程
概述
特征工程
“数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。”1.概念维基百科:
特征工程
是利用数据领域的相关知识来创建能够使机器学习算法达到最佳性能的特征的过程。
喜欢打酱油的老鸟
·
2022-11-22 02:31
人工智能
特征工程
特征工程
系列:特征筛选的原理与实现
文章系列:
特征工程
系列:数据清洗
特征工程
系列:特征筛选的原理与实现
特征工程
系列:特征预处理
特征工程
系列:特征构造
特征工程
系列:时间特征构造以及时间序列特征构造前言数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已
安替-AnTi
·
2022-11-22 02:01
机器学习
特征工程
特征处理
【
特征工程
】1 关于推荐系统中的
特征工程
在多数数据和机器学习的blog里,
特征工程
FeatureEngineering都很少被提到。
squeue2019
·
2022-11-22 02:29
机器学习
机器学习
特征工程
特征工程
(七)—特征学习RBM
1、MNIST数据集"""MNIST数据集,包括6000个0-9手写数字图像,以及学习的真实值此处使用很低级的特征,而不是解释性很好的特征。每一个数据点包括784个特征(灰度图像的像素值)"""importnumpyasnpimportmatplotlib.pyplotasplt%matplotlibinlinefromsklearnimportlinear_model,datasets,metr
undo_try
·
2022-11-22 02:25
#
特征工程
学习
python
numpy
特征工程
(五)—(1)特征选择_更好的特征
在
特征工程
中,什么是更好的特征呢?
undo_try
·
2022-11-22 02:55
#
特征工程
python
开发语言
特征工程
(五)—(2)特征选择_基于统计的特征选择
基于统计的特征选择基于统计的特征选择,可以使用皮尔逊相关系数、假设检验来帮助我们进行特征选择。1、基于皮尔逊系数皮尔逊相关系数会测量列和列之间的线性关系,该系数在-1~1之间变化,0代表没有线性关系,-1和1代表线性关系很强。注意:皮尔逊相关系数要求每列是正态分布的,如果数据集很大(超过500阈值),根据中心极限定理,很大程度上也可以忽略这个要求。"""基于统计的特征选择可以使用皮尔逊相关系数、假
undo_try
·
2022-11-22 02:55
#
特征工程
python
pandas
数据分析
数据挖掘流程(三):
特征工程
特征工程
是利用数据领域的相关知识来创建能够使机器学习算法达到最佳性能的特征的过程。
特征工程
流程:这些过程不是必须全部要有,需要根据业务需求和数据格式特点,适宜调整!
天狼啸月1990
·
2022-11-22 02:22
数据挖掘
数据挖掘
特征工程
特征工程
一、
特征工程
简介二、特征构建三、数据预处理四、特征选择五、特征提取一、
特征工程
简介1.1
特征工程
是什么?
特征工程
是这样一个过程:将数据转换为能更好地表示潜在问题的特征,从而提高机器学习性能。
mayanli123
·
2022-11-22 02:21
数据挖掘
数据挖掘
特征工程
特征工程
基本概述与简单实践
简介数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已好的数据和特征能够让机器学习事半功倍,甚至大大减轻算法的工作。想象一下极端情况,如果用全世界猫狗的照片来训练一个猫狗分类器,他将做到万无一失,反观如果只有几张猫狗照片来训练,甚至都不是猫狗的照片去训练猫狗分类器,那结果必定无法让人满意。手头的数据一般都是有限,但特征是需要我们去提取的,选出好的有意义的特征能够让数据的质量大大提高,
b1ackc4t
·
2022-11-22 02:49
数据挖掘
特征工程
数据挖掘
数据分析
关于
特征工程
方法和应用的总结
目录
特征工程
1.1数据结构化数据非结构化数据1.2常用特征处理方法1.2.1类别特征独热编码哈希编码标签编码频数编码Label-count编码目标编码嵌套法NaN编码多项式编码扩展编码合并编码1.2.2
yougwypf1991
·
2022-11-22 02:18
人工智能
机器学习
机器学习
特征工程
特征
特征工程
(六)—(1)利用PCA进行特征转换
(1)鸢尾花数据集的手动处理PCA利用了协方差矩阵的特征值分解过程如下:(1)创建数据集的协方差矩阵(2)计算协方差矩阵的特征值(3)保留前K个特征值(按照特征值降序排列)(4)要保留的特征向量转换新的数据点1、加载鸢尾花数据集importmatplotlibasmpl#解决中文乱码mpl.rcParams['font.sans-serif']=[u'SimHei']mpl.rcParams['a
undo_try
·
2022-11-22 02:47
#
特征工程
python
matplotlib
深度学习—卷积神经网络(CNN)全笔记,附代码
机器学习流程
特征工程
的作用特征如何提取为什么需要深度学习深度学习的应用深度学习缺点传统算法与深度学习编辑计算机视觉计算机视觉面临的挑战机器学习常规套路K近邻K近邻计算流程K近邻分析数据库样例:CIFAR
高山仰止_
·
2022-11-22 01:40
CNN卷积神经网络
神经网络
深度学习
cnn
python
图像处理
机器学习笔记(7)— 学习率、
特征工程
、多项式回归
目录判断梯度下降是否收敛如何设置学习率
特征工程
多项式回归判断梯度下降是否收敛梯度下降的任务是找到能够使代价函数J最小的参数w和b,通常做法是绘制代价函数图(通过训练集计算出的),并且标出梯度下降每次迭代时
AUG-
·
2022-11-22 00:54
机器学习
学习
回归
机器学习与数据挖掘实验一:牛顿法,梯度下降实现对数几率回归【详细原理+python代码】
机器学习与数据挖掘实验二:以信息增益为划分准则构造决策树【例题求解】机器学习与数据挖掘实验三:基于CNN(VGG,GoogLeNet)的海面舰船图像分类【详细原理+python代码】机器学习与数据挖掘实验四:基于
特征工程
的支持向量机分类实验
oax_knud
·
2022-11-21 23:52
python机器学习
python
数据挖掘
逻辑回归
Spark.SQL时间序列缺失值填充与异常值处理
n-sigma盖帽5.平滑方法3.总结本文为销量预测第3篇:缺失值填充与异常值处理第1篇:PySpark与DataFrame简介第2篇:PySpark时间序列数据统计描述,分布特性与内部特性第4篇:时间序列
特征工程
第
fitzgerald0
·
2022-11-21 22:45
机器学习
PySpark销量预测实战
机器学习
大数据
python
机器学习算法基础-day01
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档机器学习算法基础-day010.机器学习概述1.Scikit-learn与
特征工程
1.1数据的来源与类型1.2数据的特征抽取1.2.1分类特征变量提取
weixin_47049321
·
2022-11-21 21:12
机器学习
算法
python
机器学习概述与
特征工程
文章目录1.机器学习概述1.机器学习工作流程学习目标1什么是机器学习2机器学习工作流程2.1获取到的数据集介绍2.2数据基本处理2.3
特征工程
2.4机器学习2.5模型评估3小结2机器学习算法分类学习目标
开心码农小王。
·
2022-11-21 21:11
机器学习
机器学习
人工智能
深度学习
机器学习9-案例1:银行营销策略分析
文章目录1.数据说明与预处理2.探索性分析3.数据的预处理与
特征工程
4.模型训练5.模型评价数据及代码连接—提取码:12341.数据说明与预处理importpandasaspdimportmatplotlib.pyplotasplt
哎呦-_-不错
·
2022-11-21 21:41
#
机器学习基础
机器学习
python
银行营销策略分析
黑马程序员机器学习Day2学习笔记
一.转换器和预估器二.KNN算法网格搜索和交叉验证KNN案例:Facebook预测签到位置朴素贝叶斯联合概率、条件概率与相互独立决策树信息熵回顾传统机器学习算法流程:1.获取数据2.数据处理3.
特征工程
文鸿开源工作室
·
2022-11-21 21:40
深度学习
机器学习
算法
黑马程序员
KNN
贝叶斯
机器学习——【2】史上最全“
特征工程
“介绍
2.1数据集2.1.1可用数据集Kaggle网址:https://www.kaggle.com/datasetsUCI数据集网址:http://archive.ics.uci.edu/ml/scikit-learn网址:http://scikit-learn.org/stable/datasets/index.html#datasets(1)Scikit-learn工具介绍Python语言的机器学
泰勒一号
·
2022-11-21 21:40
机器学习
机器学习
机器学习算法+代码
概述1、机器学习研究方向传统预测图像识别自然语言处理2、数据集构成数据集=特征值+目标值监督学习:目标值为类别属于分类问题目标值为连续数据属于回归问题无监督学习无目标值3、机器学习流程获取数据数据处理
特征工程
机器学习模型
点击领取椭圆
·
2022-11-21 21:40
笔记
python
机器学习
机器学习【KNN案例、API、总结】
2scikit-learn中数据集介绍2.1scikit-learn数据集API介绍2.1.1sklearn小数据集2.1.2sklearn大数据集2.2sklearn数据集返回值介绍2.3查看数据分布2.4数据集的划分二
特征工程
OneTenTwo76
·
2022-11-21 21:40
机器学习
机器学习
python
sklearn
机器学习基础课 (3):机器学习案例之K-近邻(附详细python代码注释)
数据集Sklearn数据集数据集划分接口介绍(API)分类数据集回归数据集
特征工程
的步骤实例化(实例化的是一个转换器类)用fit_transform获得转换后的数据集转化器和估计器转化器Fit_transform
Y_蒋林志
·
2022-11-21 21:38
机器学习基础课笔记
机器学习
算法
python
【机器学习】线性回归实战案例三:股票数据价格区间预测模型(国外+国内数据)
国外+国内数据)案例三:股票数据价格区间预测模型(国外+国内数据)2.3.1模块加载与忽略警告设置2.3.2加载数据和数据筛选2.3.3探索式数据分析(EDA)2.3.4探究字段之间的关联性2.3.5
特征工程
百木从森
·
2022-11-21 21:37
数据分析师
机器学习
线性回归
股票价格区间预测
谷歌
茅台
机器学习-day2
分类算法目标值:类别1、sklearn转换器和预估器2、KNN算法3、模型选择与调优4、朴素贝叶斯算法5、决策树6、随机森林3.1sklearn转换器和估计器转换器估计器(estimator)3.1.1转换器-
特征工程
的父类
爱吃肉的鸽子
·
2022-11-21 21:36
sklearn
机器学习
python
机器学习Day2:花的
特征工程
-案例代码
#coding=utf-8importpandasaspdfromsklearn.decompositionimportPCA#读取四张表的数据prior=pd.read_csv("./data/order_products__prior.csv")products=pd.read_csv("./data/products.csv")orders=pd.read_csv("./data/order
py初学者123
·
2022-11-21 21:06
python
人工智能
常用的特征选择方法
作者:城东链接:
特征工程
到底是什么?-城东的回答来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。目录1
特征工程
是什么?2数据预处理2.1无量纲化2.1.1标准化2.1
__矮油不错哟
·
2022-11-21 21:06
图像处理
特征选择方法最全总结!
一、背景介绍在处理结构型数据时,
特征工程
中的特征选择是很重要的一个环节,特征选择是选择对模型重要的特征。它的好处[2]在于:●减少训练数据大小,加快模型训练速度。●减少模型复杂度,避免过拟合。
Datawhale
·
2022-11-21 21:53
机器学习
深度学习
python
人工智能
数据挖掘
三种常见的特征选择方法
特征选择特征选择是
特征工程
里的一个重要问题,其目标是寻找最优特征子集。
bugmaker.
·
2022-11-21 21:52
机器学习
python
人工智能
上一页
33
34
35
36
37
38
39
40
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他