E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
特征工程-数据降维
详解 sklearn 中 TSNE可视化
详解sklearn中TSNE可视化
数据降维
与可视化——t-SNETSNE的参数函数参数表:返回对象的属性表:优化t-SNEBarnes-Hutt-SNE实例HelloWorldS曲线的降维与可视化手写数字的降维可视化
数据降维
与可视化
Avery123123
·
2022-12-04 21:37
补充知识
Machine Learning(Lesson2 一个完整的机器学习项目)
文章目录引言项目项目概览划定问题性能指标开始写代码了看一下数据
特征工程
创建训练集、测试集准备训练用的数据自定义转换器(打包数据清洗过程)模型训练参数测试结束作业(你可以现在去,也可以再学学去)引言这一章的学习是最基础也是最重要的一个章节
季马宝宝
·
2022-12-04 20:47
机器学习
python
机器学习
数据挖掘
sklearn
基于神经网络进行
数据降维
基于神经网络进行
数据降维
前言一:自编码器介绍二:常见神经网络简介三:基于BPNN的自编码降维实验四:基于CNN的自编码降维实验五:总结前言机器学习方法降维可以说非常多了,无论是线性还是非线性,而且各有各的优势存在
月~时光之笛
·
2022-12-04 17:29
数据挖掘
机器学习
深度学习笔记文章
python
算法
机器学习
深度学习
编辑器
《Python深度学习》第四章笔记
《Python深度学习》第四章笔记1.机器学习的四个分支2.评估机器学习模型2.1简单的留出验证2.2K折验证2.3带有打乱数据的重复K折验证3.数据预处理、
特征工程
、特征学习3.1神经网络的数据预处理
烟雨行客
·
2022-12-04 15:34
深度学习
python
人工智能
“
特征工程
”相关面试知识点总结-百面机器学习系列1
提示:在准备机器学习算法工程师面试的过程中,我主要参考《百面机器学习》去巩固自己的基础知识。本系列博客将以该书为主题,并以八股文的方式去概述整本书的内容,以尽量减少读者们的阅读作量,并方便读者可以随时随地的记忆背诵。建议:我还是认为读者们可以提前买一本《百面机器学习》,从前到后完全看一遍,然后再看我的博客去记忆背诵会更好些哈。文章目录问题1:为什么需要对数值类型的特征做归一化?问题2:怎样处理类别
八股文的搬运工
·
2022-12-04 14:59
机器学习面试知识点系列
《百面机器学习》读后总结
第一章
特征工程
主要讲的是特征的归一化、特征的预处理(编码类型:序号
wanfuchun
·
2022-12-04 14:26
机器学习
百面机器学习
机器学习
面试
机器学习知识总结(百面机器学习)
文章目录
特征工程
特征归一化类别型特征高维组合特征文本表示模型Word2Vec图像数据不足的处理方法模型评估准确率精准率与召回率平方根误差ROC曲线距离评估A/B测试模型评估方法超参数调优过拟合和欠拟合经典算法支持向量机逻辑回归决策树降维
iwtbs_kevin
·
2022-12-04 14:55
机器学习实战
机器学习
算法面试
Kaggle泰坦尼克号比赛项目详解
Kaggle泰坦尼克号比赛项目详解项目背景目标数据字典一、基础字段二、衍生字段(部分,在后续代码中补充)
特征工程
特征分析一、导入必要库二、导入数据三、查看数据四、查看字段信息五、查看字段统计数据六、查看船舱等级与幸存量的关系七
夜的乄第七章
·
2022-12-04 13:05
数据分析
机器学习
分类算法
sklearn
泰坦尼克
数据预处理与
特征工程
—1.不均衡样本集采样—SMOTE算法与ADASYN算法
文章目录一、第一种思路:平衡采样1.SMOTE算法2.SMOTE与RandomUnderSampler进行结合3.Borderline-SMOTE与SVMSMOTE4.ADASYN5.平衡采样与决策树结合二、第二种思路:使用新的指标 在训练二分类模型中,例如医疗诊断、网络入侵检测、信用卡反欺诈等,经常会遇到正负样本不均衡的问题。直接采用正负样本非常不均衡的数据集进行训练学习会遇到很多问题。使用不
哎呦-_-不错
·
2022-12-04 12:15
#
数据预处理与特征工程
不均衡样本集
平衡采样
SMOTE
ADASYN
特征工程
特征工程
背景特征是什么
特征工程
概述
特征工程
的意义特征要考虑的因素特征的分类
特征工程
的构成特征构建常用方法对表格数据的预处理特征提取4随机森林背景在之前学习机器学习技术中,很少关注
特征工程
(FeatureEngineering
小小程序猿abner
·
2022-12-04 12:14
特征工程
之数据预处理(下)
该系列的前三篇文章:机器学习入门系列(2)--如何构建一个完整的机器学习项目(一)机器学习数据集的获取和测试集的构建方法
特征工程
之数据预处理(上)上篇文章介绍了如何处理缺失值和图片数据扩充的问题,这篇文章会介绍另外两种情况
AirZH??
·
2022-12-04 12:41
人工智能
数据结构与算法
大数据
特征工程
- 你不知道的特征筛选
不管是在机器学习,还是深度学习场景中,特征决定了模型效果的天花板。在互联网公司中,总会有那么些团队专门去做用户画像,他们提取用户落下的日志,转化成能够精准描述用户的特征,这部分特征可以自己组内提出,也可以是算法组提出,将用户用一连串的特征去表示,来达到某种特定模型上线最好的效果。做特征,需要紧紧围绕目标去做特征,而不是为了做特征而做特征,不合适的特征后续的存储、维护问题很多,以信息流推荐场景为例,
ZhuNian的学习乐园
·
2022-12-04 12:08
图与推荐
数据挖掘
机器学习
人工智能
机器学习
算法
机器学习之
特征工程
特征工程
-概念
特征工程
是一个面向十分广的概念,只要是在处理数据就可以认为是在做
特征工程
。个人理解,真正意义上的
特征工程
还是
数据降维
和数据升维的过程。而前期对数据的处理过程:需要哪些数据?数据如何存储?
奔跑的大西吉
·
2022-12-04 12:34
机器学习
特征工程
之数据预处理(笔记)
特征工程
:对原始数据进行一系列工程处理,将其提炼为特征,作为输入供算法和模型使用。
特征工程
的目的:去除原数据中的杂项和冗余,设计更高效的特征以刻画要求解的问题和预测模型之间的关系。
张五儿
·
2022-12-04 12:03
第五课 机器学习中的
特征工程
本系列是七月算法机器学习课程笔记文章目录1
特征工程
与意义2数据与特征处理2.1数据采集2.2数据清洗2.3数据采样2.4特征处理2.4.1数值型2.4.2类别型2.4.3时间型2.4.3文本型2.4.4
约定写代码
·
2022-12-04 12:33
机器学习
机器学习
特征处理
02_
特征工程
前奏—数据清洗
文章目录一、预处理二、清洗异常样本数据2.1格式内容错误数据清洗2.2逻辑错误清洗2.3去除不需要的数据2.4关联性验证三、数据不均衡3.1数据不平衡3.2对多数类别样本删除3.2.1解决方案一—设置损失函数的权重3.2.2解决方案二—下采样/欠采样3.2.2.1比赛技巧3.2.3解决方案三—ENN3.2.4解决方案四—RENN3.2.5解决方案五—TomekLinkRemoval3.3对少数类别
IT-cute
·
2022-12-04 12:32
数据分析
python
数据挖掘
数据分析
ML - 贷款用户逾期情况分析2 -
特征工程
1(数据预处理)
Task5(
特征工程
1-数据预处理)-数
落木~
·
2022-12-04 12:31
Machine
Learning
特征工程
一文读懂
特征工程
转载自https://blog.csdn.net/v_july_v/article/details/81319999一文读懂
特征工程
作者:July1什么是
特征工程
有这么一句话在业界广泛流传:数据和特征决定了机器学习的上限
SCS199411
·
2022-12-04 12:31
机器学习
机器学习
特征工程
机器学习:从入门到脊椎康复
贝叶斯分类,决策树与随机森林,逻辑回归目标值:连续型的数据(回归问题)回归:线性回归,岭回归2.无监督学习:目标值:无(无监督学习)聚类:k-means四.机器学习开发流程1.获取数据2.数据处理3.
特征工程
玛卡巴卡巴
·
2022-12-04 12:58
python
sklearn
特征工程
- 当你遇到正负样本不均
在做
特征工程
时,有一部分的数据集会出现样本类别分布不均匀的情况,这种时候如果直接做分类,会使得模型只会学习到大样本类别数据的信息,无法学习小样本的数据,这样模型的预测效果和泛化能力都不是最优。
ZhuNian的学习乐园
·
2022-12-04 12:58
数据挖掘
python
算法
Xgboost回归四种调参方法及Python简单实现
前言Xgboost对
特征工程
和数据处理比较友好,相比之下调参成为用好Xgboost重要的一环,本文分别从参数、调参方法、Python实现的维度进行梳理,作为调参思路的记录。
井底哇哇
·
2022-12-04 11:26
回归
机器学习
算法
python
逻辑回归分类器(linear_model.LogisticRegression)
正则化下面建立两个逻辑回归,来看一下L1正则化和L2正则化:1.导入库2.导入数据3.建立L1,L2两个正则化的实例化并训练4.逻辑回归的重要属性coef_:查看每个特征所对应参数5.使用学习曲线查看2.2逻辑回归中的
特征工程
m0_50572604
·
2022-12-04 10:14
逻辑回归学习笔记
逻辑回归
机器学习
深度学习
均值归一化_机器学习中数据特征的处理 归一化vs标准化,哪个更好
众所周知,
特征工程
是将原始数据转换为数据集的过程。有各种可用的功能工程技术。
weixin_39928106
·
2022-12-04 09:05
均值归一化
机器学习中的
特征工程
机器学习中的
特征工程
什么是
特征工程
数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。
梦码城
·
2022-12-04 06:04
机器学习
机器学习
数据挖掘
聚类
人工智能
深度学习
机器学习 分类、回归、聚类、
特征工程
区别
一、分类和回归的区别简单理解分类和回归的区别在于输出变量的类型不同。定量输出称为回归,或者说是连续变量预测;定性输出称为分类,或者说是离散变量预测。举个例子:预测明天的气温是多少度,这是一个回归任务;预测明天是阴、晴还是雨,就是一个分类任务。二、回归和聚类的区别二者解决的具体问题不一样**分类算法的基本功能是做预测。**我们已知某个实体的具体特征,然后想判断这个实体具体属于哪一类,或者根据一些已知
May Hacker
·
2022-12-04 06:30
聚类
分类
【推荐系统】WOE、IV、OR值、信息增益、卡方检验
目录特征起因评分卡模型中的IV和WOE详解信息增益OR值卡方检验GaussRank高基数数据特征起因
特征工程
综述常看常新工业级推荐系统中的
特征工程
-杨旭东的文章-知乎评分卡模型中的IV和WOE详解IV值衡量了某个特征对目标的影响程度风控模型
littlemichelle
·
2022-12-04 03:07
推荐系统
推荐算法
pytorch——实现自编码器和变分自编码器
文章目录
数据降维
主成分分析(PCA)自编码器(AE)变分自编码器(VAE)pytorch实现AE实现自编码器网络结构实现AE对MNIST数据集的处理VAE实现变分自编码器网络结构实现VAE对MNIST数据集的处理本文只设计简单的介绍和
Mr. Wanderer
·
2022-12-04 02:59
机器学习
sklearn学习06——PCA
、引入相关库2.2、利用PCA降维2.3、不同主成分个数对应的可解释方差分析(ExplainedVariance)总结前言主成分分析(principalcomponentanalysis)是一种常见的
数据降维
方法
hitsugaya837
·
2022-12-03 20:38
sklearn
机器学习
python
多元时间序列
特征工程
的指南
使用Python根据汇总统计信息添加新特性,本文将告诉你如何计算几个时间序列中的滚动统计信息。将这些信息添加到解释变量中通常会获得更好的预测性能。简介自回归多变量时间序列包含两个或多个变量,研究这些数据集的目的是预测一个或多个变量,参见下面的示例。上图是包含9个变量的多变量时间序列。这些是智能浮标捕捉到的海洋状况。大多数预测模型都是基于自回归的。这相当于解决了一个监督学习回归任务。该序列的未来值是
·
2022-12-03 11:14
人工智能面试总结-
特征工程
B站:啥都会一点的研究生公众号试读:啥都会一点的研究生目录说说你知道的
特征工程
?说说遇到缺值的情况如何处理?说说机器学习中解决样本不均衡问题的方法?说说深度学习中解决样本不均衡问题的方法?
啥都生
·
2022-12-03 09:09
深度学习
机器学习面试总结
人工智能
机器学习
算法
面试
知识图谱:【知识图谱问答KBQA(三)】——Prompt Learning
一.NLP范式NLP技术的发展可分为4个阶段/范式,如下图:1.全监督学习(非神经网络)仅在目标任务的输入输出样本数据集上训练特定任务模型,其严重依赖
特征工程
。
J_Xiong0117
·
2022-12-03 09:23
基础理论
python
自然语言处理
知识图谱
深度学习
人工智能
Python 11种
数据降维
算法快速实现,手把手教学
文章目录环境要求有哪些降维算法LDAMDS听说点进蝈仔帖子的都喜欢点赞加关注~~老规矩,地址送上。Github项目地址:https://github.com/heucoder/dimensionality_reduction_alo_codes项目作者简介Heucoder,目前是哈尔滨工业大学计算机技术在读硕士生,主要活跃于互联网领域,知乎昵称为「超爱学习」,其github主页地址为:https:
易烊千蝈
·
2022-12-03 06:35
人工智能
Python相关
算法
机器学习
python
数据降维
快速入门
基于 Python 的 11 种经典
数据降维
算法
这里有个GitHub项目整理了使用Python实现了11种经典的数据抽取(
数据降维
)算法,包括:PCA、LDA、MDS、LLE、TSNE等,并附有相关资料、展示效果;非常适合机器学习初学者和刚刚入坑数据挖掘的小伙伴
小白学视觉
·
2022-12-03 06:58
算法
python
机器学习
人工智能
数据分析
手把手教会机器学习(三)——回归(基于Pandas)
Python机器学习(三)——回归Python机器学习(一)——
特征工程
Python机器学习(二)——数据可视化Python机器学习(四)——分类这一节,我们将一起探讨线性回归模型,在使用线性回归中我们一般的流程如下
高星熠
·
2022-12-02 18:42
笔记
机器学习
python
机器学习
人工智能
pandas
【数据准备和
特征工程
】特征选择
【数据准备和
特征工程
】特征选择1.删除低方差的特征2.单变量特征选择3.递归特征消除4.使用SelectFromModel选择特征4.1基于L1的特征选择4.2基于树的特征选择5.顺序特征选择6.作为管道一部分的特征选择
独行者~
·
2022-12-02 17:59
机器学习
数据科学
sklearn
机器学习
python
数据分析
人工智能
【数据准备和
特征工程
】特征变换
【数据准备和
特征工程
】特征变换1.特征数值化1.1Replace()函数1.2Sklearn包中的LabelEncoder1.3category_encoders包2.特征二值化2.1手动设置2.2Sklearn
独行者~
·
2022-12-02 17:58
机器学习
数据科学
sklearn
python
机器学习
数据分析
人工智能
【数据准备和
特征工程
】数据清理
【数据准备和
特征工程
】数据清理1.基本概念2.转换数据类型3.处理重复数据4.处理缺失数据a.检查缺失数据b.直接删除缺失数据c.用指定值填补缺失数据d.根据规律填补缺失值5.离群数据5.1通过可视化Box-plotScatter-plot5.2
独行者~
·
2022-12-02 17:28
机器学习
数据科学
python
数据挖掘
机器学习
数据分析
人工智能
安排!最全算法的项目流程!
算法项目的全流程:1.确定业务场景,2.该场景使用哪些算法比较合适(查找资料)3.数据处理和
特征工程
根据业务需求对数据进行处理(比如去重,去空等,查看数据是否满足模型要求,特征列和记录是否完整有效,每个行业的数据都不一样根据实际业务来处理
陈谦
·
2022-12-02 13:34
算法
机器学习
人工智能
人工智能(6)人工智能的应用
AutoAI是一个有助于数据准备,
特征工程
和超参数优化的平台。神经符号AI的演变也是另一个重要方面。神经符号AI是将数据驱动方法和基于知识的方法相结合的领域之一。
千梦千微雨
·
2022-12-02 13:58
人工智能
案例:房价预测模型
3.
特征工程
。特征选择和特征融合。4.模型构建。特征标准化,交叉验证,GBoost和Xgboost。5.模型评价。1.数据清洗1.1数据分类。
pmzqpmh
·
2022-12-02 12:21
第一章 | 加州房价数据集 | 端到端的机器学习 | 回归问题 | tensorflow2.6+sklearn | 学习笔记
目录1.实验目标2.数据集展示3.设计系统4.探索数据5.代码部分5.1划分数据集5.2探索训练集5.3
特征工程
5.3.1数值类型处理5.3.2文本类型处理5.3.3sklearn数值流水线处理5.4模型部分
加油strive
·
2022-12-02 12:47
机器学习实战
sklearn
机器学习
python
你想知道的
特征工程
,机器学习优化方法都在这了!收藏!
文章目录1.
特征工程
有哪些?
mantchs
·
2022-12-02 12:39
machine
learning
特征工程
机器学习优化方法
模型评估
算法
机器学习
特征工程
/数据预处理超全面总结(持续更新ing...)
但是深度学习的话,那也有很大概率会用到
特征工程
。因此在此做出总结,以资借鉴。本文仅考虑结构化数据,不对使用图像、文本等非结构化数据进行表征、特征提取的工作进行介绍。
特征工程
是玄学。
诸神缄默不语
·
2022-12-02 11:07
人工智能学习笔记
sklearn
人工智能
特征工程
数据预处理
pandas
特征工程
的处理小结
特征工程
的处理小结基本的数据特征:预处理1、查看数据的基本信息data.info:查看数据的基本结构组成和对应的属性data.shape:查看数据的行数和列数data.head(n):显示数据的前n行data.columns
zhangjiyubang
·
2022-12-02 00:08
torch
python
python
数据分析
pytorch
lasso特征选择python_[机器学习] 特征选择简明指南
而
特征工程
又至少占据了数据预处理的半壁江山,在实际的数据工程工作中,无论是出于解释数据或是防止过拟合的目的,特征选择都是很常见的工作。
丧心病狂刘老湿
·
2022-12-01 20:21
lasso特征选择python
2.数据预处理
杨正洪;郭良越;刘玮.人工智能与大数据技术导论清华大学出版社.Kindle版本.在拿到任务和数据后,应该先做数据预处理的基本流程,包括探索性分析、数据清洗和
特征工程
。
Land欧阳
·
2022-12-01 16:24
人工智能
人工智能
数据预处理
特征工程
数据清洗
实战微博互动预测之三_xgboost答疑解惑
1.说明 前两篇完成了
特征工程
的相关工作:加入用户的统计特征,分析文本信息内容,并作为新特征加入了数据集。
lusic01
·
2022-12-01 13:52
2022吴恩达机器学习课程学习笔记(第一课第二周)
)多维特征向量化用于多元线性回归的梯度下降法多元线性回归的实现正规方程特征缩放特征大小、参数大小以及梯度下降之间的关系特征缩放定义特征缩放实现判断梯度下降是否收敛画学习曲线图自动收敛测试如何设置学习率
特征工程
多项式回归多维特征上周我们学习了单特征线性回归模型
Ys能保研
·
2022-12-01 13:22
机器学习
机器学习
人工智能
【高维
数据降维
】奇异值分解SVD
高维
数据降维
之奇异值分解SVD高维
数据降维
是指采用某种映射方法,降低随机变量的数量,例如将数据点从高维空间映射到低维空间中,从而实现维度减少。
梦什
·
2022-12-01 11:46
高维数据降维
python
机器学习
机器学习系列(3)_
特征工程
01数据预处理
参考链接:1、scikit-learn官网2、sklearn提供的自带的数据集3、Kaggle官网4、数据挖掘——无量纲化文章目录一、数据中台二、sklearn中的数据预处理与
特征工程
三、数据无量纲化(
abc123susie
·
2022-12-01 04:37
【Phthon】
#
【机器学习】
机器学习
python
sklearn
上一页
29
30
31
32
33
34
35
36
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他