E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
特征工程
特征工程
-特征预处理
特征工程
-DataPreProcessing(数据预处理)-FeatureExtraction(特征提取)-FeatureSelection(特征选择)-Featureconstruction(特征构造
maybelillian_gu
·
2023-10-26 00:02
sknearl-7处理文本数据
本章代码大部分没跑,只供学习第四节
特征工程
里提到,有连续特征和离散特征,对于文本数据,文本特征可以看作第三种特征1用字符串表示的数据类型2例子电影评论情感分析给定一个影评(输入),输出影评是正面还是负面
peter6768
·
2023-10-25 06:39
机器学习
人工智能
sklearn
sklearn-4
特征工程
与数据表示
1分类变量任务根据美国人年龄,工作,教育水平等特征判定这人年收入比50000美元大还是小问题有的特征不是数值型,比如性别(男或女),工作类型等,而监督学习模型需要都是数值型的特征,可以通过one-hot编码解决1.1one-hot编码(虚拟变量)举例,如何用one-hot表示星期几?创七个特征分别表示周一到周末,如果是周一,则周一特征值为1,其他全为0如何使用one-hot1pandas(更方便)
peter6768
·
2023-10-25 06:08
机器学习
人工智能
机器学习——
特征工程
之分类变量
机器学习——
特征工程
之分类变量前言分类变量的编码1、one-hot编码2、虚拟编码3、效果编码处理大型分类变量1、特征散列化2、分箱计数总结前言关于
特征工程
,已经对空值、数值型和文本数据的处理做了大致方法的说明
macan_dct
·
2023-10-25 00:25
特征工程
机器学习
特征工程
【算法竞赛学习】数字中国创新大赛智慧海洋建设-Task3
特征工程
智慧海洋建设-Task3
特征工程
此部分为智慧海洋建设竞赛的
特征工程
模块,通过
特征工程
,可以最大限度地从原始数据中提取特征以供算法和模型使用。
jaeden_xu
·
2023-10-24 20:08
数据分析挖掘
算法
人工智能
机器学习
特征工程
系列:特征构造
文章系列:
特征工程
系列:数据清洗
特征工程
系列:特征筛选的原理与实现
特征工程
系列:特征预处理
特征工程
系列:特征构造
特征工程
系列:时间特征构造以及时间序列特征构造前言数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已
安替-AnTi
·
2023-10-24 15:36
机器学习
特征工程
在机器学习应用中,
特征工程
扮演着重要的角色,可以说
特征工程
是机器学习应用的基础。在机器学习界流传着这样一句话:“数据和特征决定决定了机器学习算法的上限,而模型和算法只是不断逼近这个上限而已”。
编程回忆录
·
2023-10-24 05:06
特征工程
之特征选择(6)----降维算法PCA初探
文章目录维度的概念降维的目的:PCA的信息衡量指标----可解释性方差降维过程简述降维算法与前面的特征选择算法的区别sklearn中的降维算法示例导入相关库提取特征和标签降维探索降维后的数据总结维度的概念对于ndarray对象和series对象,shape返回的数据中有几个数据就是几维对于dataframe对象,列数就是维度数,即维度=shape[1]降维算法的降维指的是,降低特征矩阵中的特征的数
iostreamzl
·
2023-10-24 02:43
机器学习
#
sklearn
python
机器学习
数据分析
特征工程
新星计划
机器学习(3)--
特征工程
之数据降维
三、降维这里的维度指降低特征的数量【这里的降维不是指数组的维度】方式:1.特征选择2.主成分分析3.神经网络【之后补充,它也有降维的作用】1.特征选择特征选择原因冗余:部分特征的相关度高,容易消耗计算性能噪声:部分特征对预测结果有负影响概念:特征选择就是单纯地从提取到的所有特征中选择部分特征作为训练集特征,特征在选择前和选择后可以改变值、也不改变值,但是选择后的特征维数肯定比选择前小,毕竟我们只选
Ona_Soton
·
2023-10-24 01:09
机器学习
机器学习
python
概率论
微软开源mlsys库之NNI
一、总览NNI(NeuralNetworkIntelligence)是一个轻量但强大的工具包,帮助用户自动的进行
特征工程
,神经网络架构搜索,超参调优以及模型压缩。
加油11dd23
·
2023-10-24 01:43
4个可以写进简历的京东 NLP 项目实战
项目一、京东健康智能分诊项目第一周:文本处理与
特征工程
|BagofWords模型|从tf-idf到Word2Vec|SkipGram与CBOW|HierarhicalSoftmax与NegativeSampling
Amusi(CVer)
·
2023-10-23 13:16
神经网络
人工智能
机器学习
编程语言
深度学习
机器学习中常见的
特征工程
处理
一、
特征工程
特征工程
(FeatureEngineering)对特征进行进一步分析,并对数据进行处理。常见的
特征工程
包括:异常值处理、缺失值处理、数据分桶、特征处理、特征构造、特征筛选及降维等。
DB_UP
·
2023-10-23 01:25
数据分析挖掘
机器学习
人工智能
一个完整机器学习项目流程总结
机器学习的
特征工程
和模型训练通常都是一件非常耗时的过程,胡乱尝试时间成本是非常高的。深入理解要处理的问题,能避免走很多弯路。
高永峰_GYF
·
2023-10-22 21:40
Bag of Tricks for Efficient Text Classification(Fasttext)
提出一种新的使用子词的词向量训练方法,能够在一定程度上解决oov问题3、将Fasttext开源使得工业界和学术界能够快速的使用Fasttext深度学习文本分类模型:优点:效果好,能达到非常好的效果,不用做
特征工程
BUPT-WT
·
2023-10-22 14:34
NLP
Paper
机器学习终极指南:统计和统计建模03/3 — 第 -3 部分
系列上文:机器学习终极指南:
特征工程
(02/2)—第-2部分一、说明在终极机器学习指南的第三部分中,我们将了解统计建模的基础知识以及如何在Python中实现它们,Python是一种广泛用于数据分析和科学计算的强大编程语言
无水先生
·
2023-10-22 01:58
数学建模
机器学习
人工智能
金融风控-- >申请评分卡模型-- >
特征工程
(特征分箱,WOE编码)
这篇博文主要讲在申请评分卡模型中常用的一些
特征工程
方法,申请评分卡模型最多的还是logsitic模型。
村头陶员外
·
2023-10-21 16:38
金融风控
金融
特征分箱-WOE编码
论文分享 -->强化学习-->Playing Atari with Deep Reinforcement Learning
对于一些高维复杂场景,状态特征很难通过人工
特征工程
的方式提取
村头陶员外
·
2023-10-21 16:07
强化学习
论文
人工智能
强化学习
机器学习笔记AN01--提高机器学习模型准确率的八大方法简单总结
3.
特征工程
学这一步骤有助于从现有数据
EL33
·
2023-10-21 12:42
《Python自然语言处理-雅兰·萨纳卡(Jalaj Thanaki)》学习笔记:05
特征工程
和NLP算法
05
特征工程
和NLP算法5.1理解
特征工程
5.1.1
特征工程
的定义5.1.2
特征工程
的目的5.1.3一些挑战5.2NLP中的基础特征5.2.1句法解析和句法解析器5.2.2词性标注和词性标注器理解词性标注和词性标注器的概念一步步开发词性标注器即插即用现有词性标注器使用词性标注作为特征挑战
miniAI学堂
·
2023-10-21 11:48
2017年度
自然语言处理
特征工程
Stanford
spaCy
【2 - 随机森林 - 原理部分】菜菜sklearn机器学习
《菜菜的机器学习sklearn课堂》_哔哩哔哩_bilibili第一期:sklearn入门&决策树在sklearn中的实现第二期:随机森林在sklearn中的实现第三期:sklearn中的数据预处理和
特征工程
第四期
如何原谅奋力过但无声
·
2023-10-21 04:24
#
菜菜sklearn
sklearn
python
学习scikit-learn
scikit-learn网址:http://scikit-learn.org/stable/datasets/index.html#datasets一、
特征工程
特征工程
或特征提取或特征发现是利用领域知识从原始数据
Xuyuting
·
2023-10-21 02:21
学习
scikit-learn
机器学习
数据准备和
特征工程
数据准备和
特征工程
1.感知数据1-1文件中的数据1.1.1CSV文件pd.read_csv(csv_file,index_col=0)index_col=1默认读取数据的第一列是索引df_new.to_csv
德玛西亚biubiubiu~
·
2023-10-21 02:48
python
机器学习
数据分析
数据挖掘
与
特征工程
大战之特征选择
特征选择主要有两个功能:减少特征数量、降维,使模型泛化能力更强,减少过拟合增强对特征和特征值之间的理解介绍几种常用的特征选择方法,它们各自的优缺点和问题:1、去掉取值变化小的特征Removingfeatureswithlowvariance这应该是最简单的特征选择方法了:假设某特征的特征值只有0和1,并且在所有输入样本中,95%的实例的该特征取值都是1,那就可以认为这个特征作用不大。如果100%都
csdnccfcsp
·
2023-10-21 02:44
机器学习
python
特征工程
的方法和步骤
目录0.示意图1.特征类别1.1.类别特征1.2.数值特征1.3.时间特征1.4.空间特征1.5.自然语言处理1.6.深度学习/神经网络1.7.图特征1.7.Leakage1.8.统计聚合1.9.自动化
特征工程
褚骏逸
·
2023-10-21 02:28
#
deep_learning
python
算法
机器学习
人工智能
深度学习
python
深度学习八股文: 模型训练全过程及各阶段的原因
数据预处理:数据通常需要进行预处理,包括标准化、归一化、缩放、
特征工程
等。预处理的目的是使数据对模型训练更有利,以及确保数据的一致性和可用性。模型选择和设计:选择适当的深度学习模型结构,如卷积神
运气好到爆
·
2023-10-20 10:16
深度学习
人工智能
快速入门python机器学习
机器学习算法分类1.3.1总结1.3.2练习1.3.3机器学习算法分类1.4机器学习开发流程(了解)1.5学习框架和资料介绍1.5.1机器学习库与框架1.5.2书籍资料1.5.3提深内功(但不是必须)
特征工程
清风微泫
·
2023-10-19 21:40
#
快速入门python机器学习
python
sklearn
微软Azure AI Gallery 预测性维护案例
目录1.简介2.数据准备与
特征工程
2.1数据准备数据集数据采集数据标签2.2
特征工程
3.模型训练与评估3.1回归模型3.2二分类模型3.3多分类模型微软AzureAIGallery1.简介预测性维护是一个综合性的概念
yahua_king
·
2023-10-19 19:37
机器学习
预测性维护
机器学习
数据分析
【黑马程序员】机器学习
-近邻算法、贝叶斯分类、决策树与随机森林、逻辑回归(2)目标值是连续型的数据:回归问题线性回归、岭回归2、非监督学习:(1)没有目标值聚类k-means二、机器学习开发流程1、获取数据2、数据处理3、
特征工程
我感觉。
·
2023-10-18 07:08
机器学习
人工智能
算法
33 机器学习(一):
特征工程
文章目录机器学习需要用到的包的介绍机器学习做什么深度学习做什么常见的概念数据介绍数据类型数据的来源数据的构成
特征工程
one-hot编码接口集特征提取DictVectorizerCountVectorizerTfidfVectorizer
Micoreal
·
2023-10-17 19:40
个人python流程学习
机器学习
人工智能
【推荐系统技术实现】
依据信息化系统软件模块化层次化设计思路,给出了推荐系统功能模块结构框图,主要包含以下几个层级模块:基础数据
特征工程
推荐算法推荐服务效能评价管理界面服务调度日志采集系统监控其中基础数据、
特征工程
、推荐算法
陈实如
·
2023-10-17 08:39
推荐系统
推荐算法
人工智能
数据挖掘
系统架构
泰坦尼克之灾_Kaggle
二、数据探索1.首先导入数据库和数据:2.观察数据,查看数据各列数据类型,数据大小以及缺失值状况3.查看老人小孩(假定13岁以下为小孩)的人数占比三、
特征工程
缺失值处理,按照以下原则对缺失值进行处理:1
艾马丫
·
2023-10-16 22:49
基于LMDB电影影评数据集进行情感分类
基于LMDB电影影评数据集进行情感分类文章目录基于LMDB电影影评数据集进行情感分类数据集介绍数据预处理:词频表的构造
特征工程
代码整理附录数据集介绍 标签数据集包含5万条IMDB影评,专门用于情绪分析。
xx_Mike
·
2023-10-16 20:40
机器学习
分类
机器学习
人工智能
掌握 Scikit-Learn: Python 中的机器学习库入门
的核心组件与结构安装与配置验证安装数据表示与预处理特征矩阵和目标向量数据处理估计器模型的选择思考问题的本质研究数据的分布判断任务的复杂性分类问题回归问题监督学习分类算法回归算法无监督学习模型的评估训练集和验证集分类模型评估回归模型评估
特征工程
特征选择特征提取概述机器学习
我是小白呀
·
2023-10-16 18:04
2024
Python
最新基础教程
#
机器学习
python
机器学习
scikit-learn
O2O优惠券预测
O2O优惠券预测赛题理解赛题类型解题思路数据探索理论知识数据可视化分布
特征工程
赛题
特征工程
思路模型训练与验证赛题理解赛题类型本赛题要求提交的结果是预测15天内用券的概率,这是一个连续值,但是因为用券只有用与不用两种情况
盖盖的博客
·
2023-10-16 14:49
读书笔记
信息可视化
阿里云
O2O优惠券预测
Kaggle泰坦尼克预测分析
对我的分数提升最大的主要有两块:
特征工程
:主要为离散型变量的排序赋值,特征组合和PCA模型融合:主要为加权平均和Stacking1.探索性可视化(ExploratoryVisualization)2.数据清洗
但偏偏雨渐渐丶
·
2023-10-15 15:54
解决Python中的ModuleNotFoundError: No module named ‘sklearn
scikit-learn(简称sklearn)是一个非常流行的Python机器学习库,提供了许多用于数据预处理、
特征工程
、模型训练和评估等方面的工具。然而,有时候在导入skl
冰雪之境
·
2023-10-15 09:07
Python
python
sklearn
开发语言
Python
特征选择 Python代码
在海量特征时,
特征工程
选择是必要的。
特征工程
很大程度上决定了模型的效果和模型的稳定性。
特征工程
中包函内容很多,包括数据分析,特征组合变换,特征选择和特征降维等等的技
nbszg
·
2023-10-14 19:54
python
机器学习
机器学习
python
数据分析
【案例】从kaggle的房价预测模型案例中了解深度学习模型,即如何学习深度学习模型
这些学习到的表示可以替代人工设计的特征,从而避免“
特征工程
”。深度学习主要要解决的是如何让机器能够模仿人脑的思考方式。从而摆脱原来的固有数据库比较的限制。让机器能够通过深度学习理解这个不断变化的世界。
Scalzdp
·
2023-10-14 11:54
深度学习
学习
人工智能
【机器学习】sklearn特征选择(feature selection)
文章目录
特征工程
过滤法(Filter)方差过滤相关性过滤卡方过滤F验表互信息法小结嵌入法(Embedded)包装法(Wrapper)
特征工程
特征提取(featureextraction)特征创造(featurecreation
高 朗
·
2023-10-14 08:19
机器学习
机器学习
sklearn
人工智能
时间序列预测包含深度学习机器学习
目录介绍时间序列分析基本概念核心概念时间序列预处理
特征工程
在时间序列预测中的应用常见的时间序列预测方法预测方法的分类概念单变量预测移动平均模型指数平滑简单指数平滑二指数平滑三指数平滑Xgboost模型ARIMA
Snu77
·
2023-10-14 02:47
时间序列预测专栏
python
算法
深度学习
机器学习
pytorch
建立数据科学基础设施的绝佳指南 数据工程师都该人手一册
《Effective数据科学基础设施》由Netflix工程师VilleTuulos撰写,以Metaflow为对象,介绍了数据科学所需要的基础设施,囊括数据准备、
特征工程
、模型训练、模型部署、服务和持续监控等环节
清图
·
2023-10-13 21:27
数据科学
大数据科学
中文邮件分类[朴素贝叶斯、支持向量机、Logistic,TF-IDF,词袋模型]
读研第一次写博客,会不定时将自己做的小项目分享到这,加油第二次更改增加了
特征工程
,新加文本长度和符号比例两个特征,预测精确度达到了95.7%,比原来增加了2.1%,见本文第6节由于有人问起代码测试有问题
Walker@Bruce Lee
·
2023-10-13 09:50
分类
python
数据挖掘
机器学习
机器学习-概述与贝叶斯算法
机器学习的一般步骤:数据搜集、数据清洗、
特征工程
、数学建模。数据划分:训练集、验证集、测试集。K折交叉验证:解决数据量不够大问题,解决参数调优问题。深度学习不用做
特征工程
,传统机器学习要。
小蒋的技术栈记录
·
2023-10-13 06:06
机器学习
机器学习
算法
人工智能
深度学习笔记(python 面向对象高级编程)
【ML机器学习|DL深度学习|CV计算机视觉|NLP自然语言处理】_哔哩哔哩_bilibili机器学习流程数据获取
特征工程
(最核心的部分)建立模型评估与应深度学习解决了怎么提取特征?
NightHacker
·
2023-10-12 07:15
深度学习
深度学习
人工智能
自然语言处理
特征工程
分析常见方法
1概述
特征工程
是一个超集,它包括特征提取、特征构建和特征选择这三个子模块。在实践当中,每一个子模块都非常重要,忽略不得。
Kellem_
·
2023-10-12 01:09
【AI】深度学习——人工智能、深度学习与神经网络
文章目录0.1如何开发一个AI系统0.2表示学习(特征处理)0.2.1传统特征学习特征选择过滤式包裹式L1L_1L1正则化特征抽取监督的特征学习无监督的特征学习
特征工程
作用0.2.2语义鸿沟0.2.3表示方式关联
AmosTian
·
2023-10-10 15:11
AI
#
深度学习
#
机器学习
人工智能
深度学习
激活函数
神经网络
二手车价格预测
拟合各种分布并作图2.2.2偏度和峰度偏度skewness峰度kurtosis2.3数值特征和类别特征2.3.1数值型特征分析相关性分析2.3.2类别型特征分析3、数据处理异常处理(nσ原则)数据分桶4、
特征工程
nolabel
·
2023-10-09 12:35
机器学习
竞赛
机器学习
特征工程
—PCA与SVD降维基础
对于一张表,维度可以是样本数量,也可以是特征数量,一般情况是特征数量特征矩阵:特指二维数据,只有行列,构成表,通常是dataframe降维:降低特征矩阵的特征数量,可以将高维数据转化为三维以下数据进行可视化,并且加快算法的运行。sklearn中使用decomposition模块进行降维操作。主成分分析=降维=PCA,SVD:降维后包含特征的主成分,无用特征可能是噪音。sklearn中有两种降维方式
单手法拉利
·
2023-10-08 19:27
sklearn
机器学习
python
机器学习入门(六)——
特征工程
(上)
1.0whatis
特征工程
?关于
特征工程
比较官方的定义为:
特征工程
是利用数据领域的相关知识来创建能够使机器学习算法达到最佳性能的特征的过程。
yyoung0510
·
2023-10-08 01:02
金融风控之贷款违约预测挑战赛 Task3
1、导入数据略2、查看数据略3、
特征工程
fromtqdmimporttqdmfromsklearn.preprocessingimportLabelEncoderfromsklearn.feature_selectionimportSelectKBest
怕热的波波
·
2023-10-07 14:24
上一页
4
5
6
7
8
9
10
11
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他