E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
特征工程-数据降维
06
特征工程
- 特征选择
05
特征工程
-缺省值填充当做完特征转换后,实际上可能会存在很多的特征属性,比如:多项式扩展转换、文本数据转换等等,但是太多的特征属性的存在可能会导致模型构建效率降低,同时模型的效果有可能会变的不好,那么这个时候就需要从这些特征属性中选择出影响最大的特征属性作为最后构建模型的特征属性列表
白尔摩斯
·
2023-06-09 03:42
FFA 2022 专场解读 - 流批一体 & 平台建设 & AI
特征工程
FlinkForwardAsia2022将于11月26-27日在线上举办,议程内容正式上线!FFA2022官网:https://flink-forward.org.cn/流批一体流批一体专场由来自快手、京东、数禾、Shopee、蚂蚁集团等企业的技术专家为你呈现流批一体的大规模应用实践案例,详细拆解落地难点和应对方案。另有来自阿里巴巴的技术专家手把手教你如何基于HiveSQLonFlink构建流批一
Apache Flink
·
2023-06-08 23:26
人工智能
《精通
特征工程
》学习笔记(4):分类变量:自动化时代的数据计数
1.分类变量分类变量是用来表示类别或标记的。在实际的数据集中,类别的数量总是有限的。类别可以用数字表示,但与数值型变量不同,分类变量的值是不能被排序的。(作为行业类型,石油和旅游之间是分不出大小的。)它们又称为无序变量。2.分类变量的编码分类变量中的类别通常不是数值型的。1例如,眼睛的颜色可以是“黑色”“蓝色”和“褐色”,等等。因此,需要一种编码方法来将非数值型的类别转换为数值。我们很容易想到,可
Tony Einstein
·
2023-06-08 11:50
特征工程
分类
python
特征压缩
数据泄露
特征编码
数据降维
方法介绍(二)
数据降维
方法介绍:第一种方法:多维尺度分析算法(二)姓名:何源学号:21011210073学院:通信工程学院【嵌牛导读】多维尺度分析算法发展【嵌牛鼻子】多维尺度分析算法【嵌牛提问】多维尺度算法有哪些?
科技小白不能再白了
·
2023-06-08 09:56
自编码器(Autoencoder)应用场景
**
数据降维
**:自编码器可以用
A等天晴
·
2023-06-08 04:45
机器学习
python
人工智能
《精通
特征工程
》学习笔记(7):自动特征生成:图像特征提取和 深度学习
因此,与文本相比,图像和音频上的特征提取和
特征工程
要困难得多。计算机视觉研究的重点是人工定义的用于提取良好图像特征的流程。
Tony Einstein
·
2023-06-08 01:43
特征工程
深度学习
python
图像特征提取
自动特征生成
cv
卷积神经网络python_TensorFlow深度学习之卷积神经网络CNN
CNN作为一个深度学习架构被提出的最初诉求是降低对图像数据预处理的要求,避免复杂的
特征工程
。在卷积神经网络中,第一个卷积层会直接接受图像像素级的输入,每一层卷积(滤波器)都会提取数据
weixin_39929813
·
2023-06-07 23:49
卷积神经网络python
【从零开始学推荐】
特征工程
制作特征和标签,转成监督学习问题我们先捋一下基于原始的给定数据,有哪些特征可以直接利用:文章的自身特征,category_id表示这文章的类型,created_at_ts表示文章建立的时间,这个关系着文章的时效性,words_count是文章的字数,一般字数太长我们不太喜欢点击,也不排除有人就喜欢读长文。文章的内容embedding特征,这个召回的时候用过,这里可以选择使用,也可以选择不用,也可以
小月亮等风来
·
2023-06-07 23:32
精通数据科学笔记 生成式模型
假设特征是条件独立,可用于文本分类,常作为原子模型与其他模型联结(connectionism)判别式分析:假设特征类别已知的条件下服从正态分布,允许自变量之间有相关关系,只能处理连续型变量,常用来进行
数据降维
和联结其他模型
techfei
·
2023-06-07 20:20
Datawhale Task3
特征工程
学习笔记
Datawhale零基础入门数据挖掘-Task3
特征工程
三、
特征工程
目标3.1
特征工程
目标对于特征进行进一步分析,并对于数据进行处理完成对于
特征工程
的分析,并对于数据进行一些图表或者文字总结并打卡。
Wen Yu
·
2023-06-07 20:47
Python
Datawhale 零基础入门数据挖掘-Task3
特征工程
笔记
Datawhale零基础入门数据挖掘-Task3
特征工程
¶三、
特征工程
目标Tip:此部分为零基础入门数据挖掘的Task3
特征工程
部分,带你来了解各种
特征工程
以及分析方法,欢迎大家后续多多交流。
小木屋_doh
·
2023-06-07 20:47
大数据
python
数据挖掘训练营特征学习笔记
本学习笔记为阿里云天池龙珠计划数据挖掘训练营的学习内容,学习链接为:-天池实验室-实时在线的数据分析协作工具,享受免费计算资源(aliyun.com)一、学习知识点概要对于特征进行进一步分析,并对于数据进行处理完成对于
特征工程
的分析
cp4Garvey
·
2023-06-07 20:14
数据挖掘
人工智能
天池龙珠数据挖掘训练营 Task3 学习笔记(
特征工程
)
天池龙珠数据挖掘训练营学习笔记天池龙珠数据挖掘训练营Task1学习笔记(赛题理解)天池龙珠数据挖掘训练营Task2学习笔记(数据分析)天池龙珠数据挖掘训练营Task3学习笔记(
特征工程
)天池龙珠数据挖掘训练营
cndrip
·
2023-06-07 20:43
机器学习
数据挖掘
特征工程
特征工程
(FeatureEngineering):将数据在转换为能更好的表示潜在问题的特征,从而提高机器学习性能。1.数据理解目的:探索数据,了解数据,主要在EDA阶段完成。
csdnccfcsp
·
2023-06-07 20:09
数据分析
机器学习
《精通
特征工程
》学习笔记(5):数据(特征)降维
1.
数据降维
通过自动数据收集和特征生成技术,可以快速获取大量特征,但不是所有特征都是有用的。
数据降维
就是在保留重要信息的同时消除那些“无信息量的信息”。
Tony Einstein
·
2023-06-07 20:38
特征工程
机器学习
python
PCA
数据降维
谱分析
Python3数据分析与挖掘建模(1)python数据分析的流程与概述
特征工程
:根据问题的需求和数据的特点,对原始数据进行特征提取、转换和选择,以便
鮀城小帅
·
2023-06-07 19:46
python
python
数据分析
开发语言
数据库与仓库
《精通
特征工程
》学习笔记(3):特征缩放的效果-从词袋到tf-idf
1.TF-IDF原理tf-idf是在词袋方法基础上的一种简单扩展,它表示词频-逆文档频率。tf-idf计算的不是数据集中每个单词在每个文档中的原本计数,而是一个归一化的计数,其中每个单词的计数要除以这个单词出现在其中的文档数量。词袋bow(w,d)=单词w在文档d中出现的次数tf-idf(w,d)=bow(w,d)*N/(单词w出现在其中的文档数量)N是数据集中的文档总数。分数N/(单词w出现在其
Tony Einstein
·
2023-06-07 19:36
特征工程
sklearn
python
语言模型
分类
word2vec
时间序列分析与异常检测:使用RNN监测Nginx访问量
项目背景和动机1.2、RNN在时间序列分析中的应用1.3、本项目的整体思路2、数据介绍2.1、数据来源和类型2.2、数据集特征和统计描述2.3、问题定义和目标3、数据预处理3.1、数据清洗3.2、绘制图像3.3、
特征工程
无敌小怪兽_Zz
·
2023-06-07 14:21
AI实战解析:项目实践与技巧
rnn
nginx
人工智能
循环神经网络
关于MLOps中的数据工程,你一定要知道的.......
1.数据收集2.数据探索3.数据处理4.
特征工程
5.暗线背景:21世纪以来,以Hadoop、Spark、Hive为代表的大数据工具,和以GoogleCloud、AWS、阿里云、华为云等为代表的公共云奠定了当今数据生态系统的基础
狐狸的帽子
·
2023-06-07 14:47
技术学习
机器学习
自动化
企业架构
人工智能
新闻推荐_
特征工程
在使用gensim训练word2vec的时候,有几个比较重要的参数size:表示词向量的维度。window:决定了目标词会与多远距离的上下文产生关系。sg:如果是0,则是CBOW模型,是1则是Skip-Gram模型。workers:表示训练时候的线程数量min_count:设置最小的iter:训练时遍历整个数据集的次数注意训练的时候输入的语料库一定要是字符组成的二维数组,如:[[‘北’,‘京’,‘
58506fd3fbed
·
2023-06-07 12:44
机器学习——
特征工程
——对数转换、Box-Cox转换
一、对数转换1、概念对数函数可以对大数值的范围进行压缩,对小数值的范围进行扩展。x越大,log(x)增长得越慢。如对下图一这个分布进行对数变换,较小数据之间的差异将会变大(因为对数函数的斜率很大),而较大数据之间的差异将减少(因为该分布中较大数据的斜率很小)。如果你拓展了左尾的差异,减少了右尾的差异,结果将是方差恒定、形状对称的正态分布(无论均值大小如何)。我们以如下数据为例。biz_file=o
xia ge tou lia
·
2023-06-07 11:00
机器学习
pyhton
机器学习——
特征工程
对于机器学习
特征工程
的知识,你是怎样理解“特征”在机器学习中,特征(Feature)是指从原始数据中提取出来的、用于训练和测试机器学习模型的各种属性、变量或特点。
他不是混子QAQ
·
2023-06-07 11:26
机器学习
人工智能
python
ML算法——KNN随笔【机器学习】【全国科技工作者日创作】
9.1、理论部分9.2、实现9.2.1、KNN手写实现9.2.2、KNNsklearn实现9.3、案例9、K-NearestNeighbors(KNN)9.1、理论部分K最邻近算法把一个物体表示成向量【
特征工程
来杯Sherry
·
2023-06-07 05:57
机器学习
Python
机器学习
算法
Lesson14---卷积神经网络
14.1深度学习基础14.1.1深度学习的基本思想
特征工程
:尽可能选择和构建出好的特征,使得机器学习算法能够达到最佳性能。
YoLo-8
·
2023-06-07 01:08
神经网络与深度学习
cnn
深度学习
人工智能
第十五届“华中杯”大学生数学建模挑战赛-C 题 空气质量预测与预警-思路解析
思路提要:首先需要对给出的数据进行基本的数据处理(数据读取与查看、空缺值填补、异常值剔除等),接着需要筛选与PM2.5浓度变化有关的因素,该题实质是
特征工程
(筛选),常用的方法有方差过滤、卡方检验、相关系数
lichensun
·
2023-06-07 00:45
数学建模
机器学习
python
大数据
深度学习
信用贷款违约预测
通过可视化发现和业务理解构造相应
特征工程
刻画违约用户画像,最后进行建模预测。importnumpyasnpimportmatplotlibimportmatplotlib.pypl
Bai0206
·
2023-04-21 13:10
基于 Flink ML 搭建的智能运维算法服务及应用
摘要:本文整理自阿里云计算平台算法专家张颖莹,在FlinkForwardAsia2022AI
特征工程
专场的分享。
·
2023-04-21 10:27
flink算法运维云计算阿里云
【python】选择特征达成
数据降维
使用特征选择的方式进行
数据降维
。VT——方差选择法首先计算每个特征的方差,对于未到阈值的方差特征做消除处理。
青木1909
·
2023-04-21 06:13
机器学习
python
机器学习
sklearn
t-SNE算法可视化数据和卷积层
目录一、可视化数据二、可视化卷积层一、可视化数据t-SNE算法是一种用于
数据降维
和可视化的非线性方法。
酒与花生米
·
2023-04-21 06:37
Pytorch学习笔记
python
t-sne
卷积层可视化
数据降维
Principal Components Analysis (PCA) and Factor Analysis (FA) 主成分分析与因子分析
数据降维
目的:找到正确的分析指标,同时减少数据损失(许多变量间可能会出现相关,但是我们不能盲目提出剔除变量)n维空间中的n个点一定能在一个n-1维子空间中分析PCAandFAbothobjectives
FLL_SEA
·
2023-04-20 20:37
知识图谱(七)——事件抽取
事件抽取的定义3、相关评测和语料资源二、限定域事件抽取1、基于模式匹配的事件抽取方法1)有监督的事件模式匹配2)弱监督的事件模式匹配3)优缺点:2、基于机器学习的事件抽取方法1)有监督事件抽取方法(1)基于
特征工程
的方法
__盛夏光年__
·
2023-04-20 17:44
知识图谱
知识图谱
知识图谱
事件抽取
人口普查数据集独热编码转换
人口普查数据集独热编码转换描述在机器学习中,数据的表示方式对于模型算法的性能影响很大,寻找数据最佳表示的过程被称为“
特征工程
”,在实际应用中许多特征并非连续的数值,比如国籍、学历、性别、肤色等,这些特征被称为离散特征
九灵猴君
·
2023-04-20 13:19
机器学习
python
机器学习
pandas
R -- 用psych包做主成分分析
主成分分析主成分分析是一种
数据降维
方式,他将大量相关变量转化为一组很少的不相关的变量,这些不相关的变量称为主成分。
All_Will_Be_Fine噻
·
2023-04-20 09:28
统计学
R
r语言
ML之PySpark:基于PySpark框架针对boston波士顿房价数据集利用lightgbm算法(评估)实现房价回归预测案例应用
PySpark框架针对boston波士顿房价数据集利用lightgbm算法(评估)实现房价回归预测案例应用#1、定义数据集#1.1、创建SparkSession连接#1.2、读取数据集#2、数据预处理/
特征工程
一个处女座的程序猿
·
2023-04-19 22:26
ML
BigData/Cloud
Computing
DataScience
回归
机器学习
PySpark
数据挖掘实践(金融风控-贷款违约预测)Task1&2
Link:数据挖掘实践(金融风控)文章目录Task1赛题理解2天赛题要求赛题数据字段表评测标准提交结果个人理解思路比赛流程参考代码比赛指标Task2EDA3天Task3
特征工程
3天Task4建模与调参3
rr_forever
·
2023-04-19 18:49
Datawhale
数据分析
python
机器学习
B.数据挖掘机器学习[三]---汽车交易价格预测详细版本{
特征工程
、交叉检验、绘制学习率曲线与验证曲线}
【机器学习入门与实践】入门必看系列,含数据挖掘项目实战:数据融合、特征优化、特征降维、探索性分析等,实战带你掌握机器学习数据挖掘专栏详细介绍:【机器学习入门与实践】合集入门必看系列,含数据挖掘项目实战:数据融合、特征优化、特征降维、探索性分析等,实战带你掌握机器学习数据挖掘。本专栏主要方便入门同学快速掌握相关知识。声明:部分项目为网络经典项目方便大家快速学习,后续会不断增添实战环节(比赛、论文、现
汀、人工智能
·
2023-04-19 18:17
数据挖掘-机器学习
数据挖掘
数据分析
sklearn
机器学习
boosting
机器学习实战——
特征工程
+xgboost股票预测
前言用上证50只股票的以上特征训练xgb模型预测当天的close。代码见文末["open","high","low","volume","price_change","ma5","ma10","ma20","p_change","v_ma5"
只会git clone的程序员
·
2023-04-19 17:57
算法玩具
机器学习
人工智能
python
机器学习
特征工程
文章目录一、数据预处理1.缺失值处理1.1删除1.2统计值填充1.3前后向值填充1.4直接忽略1.5模型预测2.异常值处理二、特征提取1.数值型特征提取1.1标准化与缩放1.1.1标准化(Standardization)1.1.2归一化(Normalization)1.1.3区间缩放(scaling)1.2非线性标准化(log)1.3分桶2.类别型特征提取2.1序号编码(OrdinalEncodi
不忘初欣丶
·
2023-04-19 10:19
机器学习
机器学习
人工智能
算法
不看错过好几亿!5分钟学会用Python预测美股价格
5分钟学会用Python预测美股价格预测股票价格
特征工程
将使用这三种机器学习模型来预测股票:简单线性分析,二次判别分析(QDA)K最近邻(KNN)。首先,先编写几个函数功能:高低百分比和百分比变化。
python大大
·
2023-04-19 07:50
matlab
数据降维
和重构_核主成分分析(Kernel PCA, KPCA)的MATLAB 实现
前言核主成分分析(KPCA)是一种非线性数据处理方法,其核心思想是通过一个非线性映射把原始空间的数据投影到高维特征空间,然后在高维特征空间中进行基于主成分分析(PCA)的数据处理。KPCA通常有以下主要应用:降维特征提取去噪故障检测由于KPCA的原理已经有很多文章介绍了,本文不再赘述,侧重是介绍KPCA的MATLAB实现。KPCA建模流程KPCA的建模流程如下[1]:获取训练数据计算核矩阵核矩阵中
weixin_39626162
·
2023-04-19 02:50
matlab
数据降维和重构
matlab
高斯迭代代码
matlab交通通行量模型
主成分分析matlab代码
核主元分析 KPCA及matlab代码
代码的文章转载链接:f核主元分析(KernelPrincipalComponentAnalysis,KPCA)–MATLAB中文论坛(ilovematlab.cn)原博主处有打包matlab代码对于简单的
数据降维
FDA_sq
·
2023-04-19 02:19
算法
matlab
特征工程
(八)
特征工程
案例分析(2)—利用逻辑回归预测泰坦尼克号生存率
泰坦尼克号将乘客分为一等舱、二等舱、三等舱三个等级,等级不同决定了安全设施、娱乐设施、餐饮等的不同,对生存率有一定影响。那是个绅士的年代,船难时,很多男士放弃逃生机会优先女士孩子逃生,然后慷慨赴死,性别年龄也是影响生存率的因素之一。根据背景初步判断船舱等级、乘客年龄、性别是影响生存率的因素。一些人比其他人更有可能生存,比如妇女,儿童和上层阶级。什么样的人在泰坦尼克号中更容易存活?下载数据地址如下:
undo_try
·
2023-04-19 02:44
#
特征工程
逻辑回归
python
机器学习
Wide&Deep论文翻译
通过特征交叉带来的Memorization(记忆能力)非常有效和可解释,然后generalization(泛化能力)需要更多的
特征工程
的成本。
独影月下酌酒
·
2023-04-19 01:17
推荐算法
机器学习
人工智能
算法
DeepFM论文翻译
尽管有很大进步,现有的方法无论对低阶还是高阶的交叉特征,似乎还是有很强的bias,或者需要专门的
特征工程
。本文,我们证明了得出一个能强化高阶和低阶交叉特征的端到端模型是可能的。
独影月下酌酒
·
2023-04-19 01:44
推荐算法
算法
机器学习
DeepFM论文详解
目前的CTR预估模型,实质上都是在“利用模型”进行
特征工程
上狠下功夫。传统的LR,简单易解释,但特征之间信息的挖掘需要大量的人工
特征工程
来完成。
你不定积分没加C�
·
2023-04-19 01:44
神经网络
推荐系统
2021-04-16
接下来一般要结合模型的效果以及
特征工程
等来分析数据的实际建模情况,根据自己的一些理解,查阅文献,对实际问题做出判断和深入的理解。引导数据科学从业者进行数据处理以及
特征工程
的
4d2551dd443a
·
2023-04-18 19:31
【机器学习实践系列二】数据挖掘-二手车价格交易预测(含EDA探索、
特征工程
、特征优化、模型融合等)
探索载入各种数据科学以及可视化库载入数据总览数据概况判断数据缺失和异常了解预测值的分布特征分为类别特征和数字特征,并对类别特征查看unique分布数字特征分析类别特征分析用pandas_profiling生成数据报告
特征工程
导入数据删除异常值特征构造
汀、人工智能
·
2023-04-18 15:41
数据挖掘-机器学习
机器学习
数据挖掘
python
机器学习笔记(一)之
特征工程
、特征处理方法、特征构建
特征工程
特征使用方案可用性评估特征获取方案特征处理特征清洗预处理单个特征多特征衍生变量特征处理特征构建特征提取方法特征使用方案这里我们要思考要实现我们的目标需要哪些数据答:基于我们的专业知识,尽可能找出对因变量有影响的所有自变量
Charity_st
·
2023-04-18 10:58
python
机器学习与深度学习
机器学习
笔记
人工智能
2019饿了么算法秋招面试经验
特征工程
的具体方式有哪些。
特征工程
怎么加入到神经网络中。
特征工程
怎么加入到机器学习方法中。GBDT和xgb的
MarioBai
·
2023-04-18 06:12
机械学习模型训练常用代码(随机森林、聚类、逻辑回归、svm、线性回归、lasso回归,岭回归)
一、数据处理(
特征工程
)更多pandas操作请参考添加链接描述pandas对于文件数据基本操作导入的包sklearnpip3install--index-urlhttps://pypi.douban.com
南师大蒜阿熏呀
·
2023-04-18 00:49
回归
随机森林
聚类
上一页
12
13
14
15
16
17
18
19
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他