E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
特征工程
【数据准备和
特征工程
】特征变换
【数据准备和
特征工程
】特征变换1.特征数值化1.1Replace()函数1.2Sklearn包中的LabelEncoder1.3category_encoders包2.特征二值化2.1手动设置2.2Sklearn
独行者~
·
2022-12-02 17:58
机器学习
数据科学
sklearn
python
机器学习
数据分析
人工智能
【数据准备和
特征工程
】数据清理
【数据准备和
特征工程
】数据清理1.基本概念2.转换数据类型3.处理重复数据4.处理缺失数据a.检查缺失数据b.直接删除缺失数据c.用指定值填补缺失数据d.根据规律填补缺失值5.离群数据5.1通过可视化Box-plotScatter-plot5.2
独行者~
·
2022-12-02 17:28
机器学习
数据科学
python
数据挖掘
机器学习
数据分析
人工智能
安排!最全算法的项目流程!
算法项目的全流程:1.确定业务场景,2.该场景使用哪些算法比较合适(查找资料)3.数据处理和
特征工程
根据业务需求对数据进行处理(比如去重,去空等,查看数据是否满足模型要求,特征列和记录是否完整有效,每个行业的数据都不一样根据实际业务来处理
陈谦
·
2022-12-02 13:34
算法
机器学习
人工智能
人工智能(6)人工智能的应用
AutoAI是一个有助于数据准备,
特征工程
和超参数优化的平台。神经符号AI的演变也是另一个重要方面。神经符号AI是将数据驱动方法和基于知识的方法相结合的领域之一。
千梦千微雨
·
2022-12-02 13:58
人工智能
案例:房价预测模型
3.
特征工程
。特征选择和特征融合。4.模型构建。特征标准化,交叉验证,GBoost和Xgboost。5.模型评价。1.数据清洗1.1数据分类。
pmzqpmh
·
2022-12-02 12:21
第一章 | 加州房价数据集 | 端到端的机器学习 | 回归问题 | tensorflow2.6+sklearn | 学习笔记
目录1.实验目标2.数据集展示3.设计系统4.探索数据5.代码部分5.1划分数据集5.2探索训练集5.3
特征工程
5.3.1数值类型处理5.3.2文本类型处理5.3.3sklearn数值流水线处理5.4模型部分
加油strive
·
2022-12-02 12:47
机器学习实战
sklearn
机器学习
python
你想知道的
特征工程
,机器学习优化方法都在这了!收藏!
文章目录1.
特征工程
有哪些?
mantchs
·
2022-12-02 12:39
machine
learning
特征工程
机器学习优化方法
模型评估
算法
机器学习
特征工程
/数据预处理超全面总结(持续更新ing...)
但是深度学习的话,那也有很大概率会用到
特征工程
。因此在此做出总结,以资借鉴。本文仅考虑结构化数据,不对使用图像、文本等非结构化数据进行表征、特征提取的工作进行介绍。
特征工程
是玄学。
诸神缄默不语
·
2022-12-02 11:07
人工智能学习笔记
sklearn
人工智能
特征工程
数据预处理
pandas
特征工程
的处理小结
特征工程
的处理小结基本的数据特征:预处理1、查看数据的基本信息data.info:查看数据的基本结构组成和对应的属性data.shape:查看数据的行数和列数data.head(n):显示数据的前n行data.columns
zhangjiyubang
·
2022-12-02 00:08
torch
python
python
数据分析
pytorch
lasso特征选择python_[机器学习] 特征选择简明指南
而
特征工程
又至少占据了数据预处理的半壁江山,在实际的数据工程工作中,无论是出于解释数据或是防止过拟合的目的,特征选择都是很常见的工作。
丧心病狂刘老湿
·
2022-12-01 20:21
lasso特征选择python
2.数据预处理
杨正洪;郭良越;刘玮.人工智能与大数据技术导论清华大学出版社.Kindle版本.在拿到任务和数据后,应该先做数据预处理的基本流程,包括探索性分析、数据清洗和
特征工程
。
Land欧阳
·
2022-12-01 16:24
人工智能
人工智能
数据预处理
特征工程
数据清洗
实战微博互动预测之三_xgboost答疑解惑
1.说明 前两篇完成了
特征工程
的相关工作:加入用户的统计特征,分析文本信息内容,并作为新特征加入了数据集。
lusic01
·
2022-12-01 13:52
2022吴恩达机器学习课程学习笔记(第一课第二周)
)多维特征向量化用于多元线性回归的梯度下降法多元线性回归的实现正规方程特征缩放特征大小、参数大小以及梯度下降之间的关系特征缩放定义特征缩放实现判断梯度下降是否收敛画学习曲线图自动收敛测试如何设置学习率
特征工程
多项式回归多维特征上周我们学习了单特征线性回归模型
Ys能保研
·
2022-12-01 13:22
机器学习
机器学习
人工智能
机器学习系列(3)_
特征工程
01数据预处理
参考链接:1、scikit-learn官网2、sklearn提供的自带的数据集3、Kaggle官网4、数据挖掘——无量纲化文章目录一、数据中台二、sklearn中的数据预处理与
特征工程
三、数据无量纲化(
abc123susie
·
2022-12-01 04:37
【Phthon】
#
【机器学习】
机器学习
python
sklearn
深度学习-神经网络基础
1.机器学习的流程:数据获取->
特征工程
->建立模型->评估与应用。
菜鸟的进步历程
·
2022-12-01 01:01
深度学习
神经网络
深度学习
ML入门2
ML入门2二.
特征工程
1.特征提取2.特征预处理3.特征降维3.1什么是降维可以参考数据分析时候的数组降维,将二维数组转换为一维数组,这里降低的是嵌套层数。而特征的降维,是降低特征的个数。
垃圾桶里也挺好
·
2022-12-01 00:09
机器学习
sklearn
python
【菜菜的sklearn课堂笔记】逻辑回归与评分卡-逻辑回归中的
特征工程
视频作者:菜菜TsaiTsai链接:【技术干货】菜菜的机器学习sklearn【全85集】Python进阶_哔哩哔哩_bilibili当特征的数量很多的时候,我们出于业务考虑,也出于计算量的考虑,希望对逻辑回归进行特征选择来降维。比如,在判断一个人是否会患乳腺癌的时候,医生如果看5~8个指标来确诊,会比需要看30个指标来确诊容易得多。业务选择说到降维和特征选择,首先要想到的是利用自己的业务能力进行选
烧灯续昼2002
·
2022-11-30 15:25
菜菜的sklearn课堂
逻辑回归
sklearn
python
算法
常用AI/机器学习模型可解释技术与工具
通过模型可解释,可以指导
特征工程
的优化、检测偏差、增强模型使用者对模型的可信度。Anaconda资深数据科学家SophiaYang总结了8种模型可解释常用技术和工具,对其主要特征进行了概述。
·
2022-11-30 12:12
Keras深度学习记录3——深度学习工作流程
深度学习工作流程一、深度学习术语二、评估深度学习模型2.1训练集、验证集和测试集2.1.1简单的留出验证三、数据预处理、
特征工程
和特征学习3.1神经网络的数据预处理3.1.1向量化3.1.2值标准化3.1.3
五颗粒粒
·
2022-11-30 08:09
Keras学习
神经网络
python
机器学习
tensorflow
【竞赛项目详解】二手车交易价格预测(附源码)
文章目录1项目简介2项目分析2.1数据分析(EDA)2.2难点分析2.3可行性方案分析3方案设计3.1
特征工程
3.2模型构建与训练4结果分析5源码链接1项目简介赛题以预测二手车的交易价格为任务,数据来自某交易平台的二手车交易记录
小鹏聊智驾
·
2022-11-30 07:13
竞赛项目
机器学习
数据分析
【机器学习入门】(12)
特征工程
:特征选择、数据降维、PCA
各位同学好,今天我和大家分享一下python机器学习中的特征选择和数据降维。内容有:(1)过滤选择;(2)数据降维PCA;(3)sklearn实现那我们开始吧。一个数据集中可能会有以下问题:(1)冗余:部分特征的相关度高,由于A与B之间有某种计算公式使它们相关联,A特征的变化会导致B特征的变化,容易消耗计算性能,只需要存在一个特征就可以了。(2)噪声:部分特征对预测结果有负影响,需要剔除一些与预测
立Sir
·
2022-11-29 17:28
python机器学习
python
机器学习
sklearn
数据分析
人工智能
【ML
特征工程
】第 6 章 :降维:用 PCA 压缩数据薄饼
大家好,我是Sonhhxg_柒,希望你看完之后,能对你有所帮助,不足请指正!共同学习交流个人主页-Sonhhxg_柒的博客_CSDN博客欢迎各位→点赞+收藏⭐️+留言系列专栏-机器学习【ML】自然语言处理【NLP】深度学习【DL】foreword✔说明⇢本人讲解主要包括Python、机器学习(ML)、深度学习(DL)、自然语言处理(NLP)等内容。如果你对这个系列感兴趣的话,可以关注订阅哟文章目录
Sonhhxg_柒
·
2022-11-29 17:26
机器学习的特征工程
人工智能
深度学习
事件抽取研究方向
神经网络方法的优势在于能够自动学习构建特征,从而避免了繁琐的
特征工程
。事件组成:触发词、事件类型、论元及论元角色。事件抽取子任务:触发词识别、事件类型分类、论元识别和角色分类任务。
北巷!!
·
2022-11-29 17:43
NLP
深度学习
自然语言处理
逻辑回归评分卡实战-toad
此处导入的数据集为已完成
特征工程
的数据集,
特征工程
思路可以参考:天池-金融风控训练营-task3-
特征工程
_nikita_zj的博客-CSDN博客天池-金融风控训练营-task3-
特征工程
https:/
nikita_zj
·
2022-11-29 11:42
模型
数据分析
逻辑回归
算法
机器学习
9.5.3、Spark Mllib_
特征工程
处理
特征工程
对数据进行处理ctDemo05Rando{defmain(args:Array[String]):Unit={valspark:SparkSession=SparkSession.builder
Loves_dccBigData
·
2022-11-29 11:46
Dcc09
Scala
&
Spark-原创
spark
mllib
big
data
【Spark MLlib】(二)Spark MLlib
特征工程
- 提取、转换和选择
SparkMLlib中关于特征处理的相关算法,大致分为以下几组:提取(Extraction):从“原始”数据中提取特征转换(Transformation):缩放,转换或修改特征选择(Selection):从较大的一组特征中选择一个子集局部敏感哈希(LocalitySensitiveHashing,LSH):这类算法将特征变换的各个方面与其他算法相结合。文章目录一、特征的提取1.1TF-IDF1.2
云 祁
·
2022-11-29 11:08
#
----
Spark
MLlib
机器学习
使用SPARK进行
特征工程
文章目录
特征工程
预处理特征选择归一化离散化Embedding向量计算效果对比
特征工程
在机器学习领域,有一条尽人皆知的“潜规则”:Garbagein,garbageout。
bugmaker.
·
2022-11-29 11:38
spark
spark
大数据
python
常见深度学习算法总结
针对机器学习算法需要领域专家进行
特征工程
,模型泛化性能差的问题,提出了NN可以从数据的原始特征学习特征表示,无需进
mosan123
·
2022-11-29 07:11
数据挖掘
天池安泰杯金融科技挑战赛冠军方案/零基础风控学习赛TOP方案分享
详细的
特征工程
+个人理解前言1赛题理解2数据预处理2.1缺失值分析2.2编码选择3
特征工程
3.1可解释特征3.2组合交叉特征3.3暴力特征4模型融合4.1模型选取4.2特征筛选4.3差异化模型和stacking
庐州小火锅
·
2022-11-29 06:47
算法比赛经验分享
天池算法比赛
金融风控
python
机器学习
数据挖掘
算法
人工智能
一个完整的深度学习图像分割例子(三):数据准备
数据预处理应该属于
特征工程
的范畴,是人工智能必备的步骤,我们通常将数据划分为训练集,验证集,测试集,训练过程就是让模型从训练集中学习经验,然后在验证集和测试集中评估模型,最终在未见过的数据中评估模型泛化能力
计算机视觉大讲堂
·
2022-11-29 05:22
一个完整的深度学习图像分割例子
深度学习
人工智能
计算机视觉
《知识图谱》赵军 阅读笔记(六)——第六章 关系抽取
任务分类6.1.3任务难点6.1.3相关评测6.2限定域关系抽取6.2.1基于模板的关系抽取方法6.2.2基于机器学习的关系抽取方法6.2.2.1基于机器学习的关系抽取方法1基于机器学习的关系抽取方法基于
特征工程
的方法
not_simple_name
·
2022-11-28 23:14
知识图谱学习
黄佳《零基础学机器学习》chap1笔记
1.2云环境入门实践:推断加州房价1.3基本的机器学习术语1.4python和机器学习框架1.5机器学习项目实战架构1.5.1问题定义1.5.2数据的收集和预处理1.原始数据的准备2.数据的预处理3.
特征工程
和
临风而眠
·
2022-11-28 17:32
机器学习
python
人工智能
数据挖掘的五大流程之数据预处理&
特征工程
想象一下未来美好的一天,你学完了菜菜的课程,成为一个精通各种算法和调参调库的数据挖掘工程师了。某一天你从你的同事,一位药物研究人员那里,得到了一份病人临床表现的数据。药物研究人员用前四列数据预测一下最后一数据,还说他要出差几天,可能没办法和你一起研究数据了,希望出差回来以后,可以有个初步分析结果。于是你就看了看数据,看着很普通,预测连续型变量,好说,导随机森林回归器调出来,调参调呀调,MSE很小,
CDA·数据分析师
·
2022-11-28 14:13
推荐模型-上下文感知-2017:Deep&Cross(DCN)【替换Wide&Deep的Wide部分;Wide还需要人工
特征工程
,而Cross可以进行特征的自动交叉,避免了基于业务理解的人工特征组合】
《原始论文:Deep&CrossNetworkforAdClickPredictions》Deep&Cross模型(DCN)其实就是对Wide&Deep模型中Wide部分进行改进的模型。Wide&Deep模型原理很简单,但是最主要的是要掌握Wide&Deep这种线性和非线性,处理高维稀疏向量和embedding稠密向量的方式,能够使得模型同时具有泛化能力和记忆能力。能够根据最新数据在最短时间内以最
u013250861
·
2022-11-28 13:09
#
RS/上下文推荐(FM系列)
推荐系统
推荐系统CTR预估学习路线:深度模型
推荐系统CTR预估学习路线:从LR到FM/FFM探索二阶特征的高效实现推荐系统CTR预估学习路线:利用树模型自动化
特征工程
推荐系统CTR预估学习路线:深度模型推荐系统CTR预估学习路线:引入注意力机制作者
炼丹笔记
·
2022-11-28 13:35
炼丹笔记
大数据
算法
神经网络
机器学习
人工智能
推荐系统(Recommender System)笔记 01:推荐系统的演化
MatrixFactorization)逻辑回归(LogisticRegression)自动特征交叉的解决方案POLY2模型-特征交叉的开始FM模型-隐向量特征交叉FFM模型-引入特征域*从POLY2到FFM的演化过程GBDT+LR-
特征工程
MYJace
·
2022-11-28 13:30
学习笔记
推荐系统
机器学习
深度学习
推荐系统
NLP学习(十六)-NLP实战之文本分类多算法对比分析实战-tensorflow2+Python3
特征工程
:第二步是
特征工程
,将原始数据集被转换为用于训练机器学习模型的平坦特征(flatfeatures),并从现有数据特征创
安然烟火
·
2022-11-28 12:08
NLP
神经网络
python
机器学习
深度学习
Pyspark
特征工程
--IDF
IDF计算给定文档集合的逆文档频率(IDF)classpyspark.ml.feature.IDF(minDocFreq=0,inputCol=None,outputCol=None)minDocFreq:一个术语应该出现在其中进行过滤的最小文档数IDF是一种适合于数据集并生成IDFModel的estimator。IDFModel采用特征向量(通常由HashingTF或CountVectorize
Gadaite
·
2022-11-28 11:09
spark
大数据
数据挖掘
特征工程
——常用的特征筛选方法
特征筛选分类问题中筛选与离散标签相关性较强的连续变量——方差分析基本流程代码实现相关内容特征筛选(关键)回归问题中筛选与连续标签呈线性关系的连续变量——F检验(f_regression)计算过程特征筛选(关键)互信息法(mutualinformation)离散变量的互信息计算连续变量的互信息计算连续变量与离散变量的互信息计算最近邻计算函数计算过程(关键)分类问题中筛选与离散标签相关性较强的连续变量
同道而为之。
·
2022-11-28 11:08
人工智能
python
大数据
特征工程
——连续特征离散化分箱
常见的分箱方法背景等宽分箱等频分箱聚类分箱(关键)有监督分箱背景 在实际模型训练过程中,对连续型字段进行离散化处理,也就是将连续性字段转化为离散型字段。连续字段的离散过程如下所示: 离散之后字段的含义将发生变化,原始字段Income代表用户真实收入状况,而离散之后的含义就变成了用户收入的等级划分,0表示低收入人群、1表示中等收入人群、2代表高收入人群。连续字段的离散化能够更加简洁清晰的呈现特征
同道而为之。
·
2022-11-28 11:08
python
人工智能
特征工程
——连续变量和分类变量的统计特征衍生
特征衍生连续变量和分类变量的统计衍生双变量分组统计特征衍生函数连续变量和分类变量的统计衍生aggs_num={'num':['mean','var','max','min','skew','median','Q1','Q2']}#Q1是上四分位数,Q2是下四分位数aggs_cat={'cat':['mean','var','max','min','median','count','nunique'
同道而为之。
·
2022-11-28 11:38
分类
python
特征工程
tf-idf_
特征工程
-保留和删除的内容
特征工程
tf-idfThenextstepafterexploringthepatternsindataisfeatureengineering.Anyoperationperformedonthefeatures
weixin_26746401
·
2022-11-28 11:35
python
机器学习
java
人工智能
算法
【ML
特征工程
】第 7 章 :通过K-Means 模型堆叠进行非线性特征化
大家好,我是Sonhhxg_柒,希望你看完之后,能对你有所帮助,不足请指正!共同学习交流个人主页-Sonhhxg_柒的博客_CSDN博客欢迎各位→点赞+收藏⭐️+留言系列专栏-机器学习【ML】自然语言处理【NLP】深度学习【DL】foreword✔说明⇢本人讲解主要包括Python、机器学习(ML)、深度学习(DL)、自然语言处理(NLP)等内容。如果你对这个系列感兴趣的话,可以关注订阅哟文章目录
Sonhhxg_柒
·
2022-11-28 11:03
机器学习的特征工程
kmeans
算法
【ML
特征工程
】第 8 章 :自动化特征化器:图像特征提取和深度学习
大家好,我是Sonhhxg_柒,希望你看完之后,能对你有所帮助,不足请指正!共同学习交流个人主页-Sonhhxg_柒的博客_CSDN博客欢迎各位→点赞+收藏⭐️+留言系列专栏-机器学习【ML】自然语言处理【NLP】深度学习【DL】foreword✔说明⇢本人讲解主要包括Python、机器学习(ML)、深度学习(DL)、自然语言处理(NLP)等内容。如果你对这个系列感兴趣的话,可以关注订阅哟文章目录
Sonhhxg_柒
·
2022-11-28 11:03
机器学习的特征工程
深度学习
自动化
人工智能
【ML
特征工程
】第 9 章 :回到特征:构建学术论文推荐器
大家好,我是Sonhhxg_柒,希望你看完之后,能对你有所帮助,不足请指正!共同学习交流个人主页-Sonhhxg_柒的博客_CSDN博客欢迎各位→点赞+收藏⭐️+留言系列专栏-机器学习【ML】自然语言处理【NLP】深度学习【DL】foreword✔说明⇢本人讲解主要包括Python、机器学习(ML)、深度学习(DL)、自然语言处理(NLP)等内容。如果你对这个系列感兴趣的话,可以关注订阅哟文章目录
Sonhhxg_柒
·
2022-11-28 11:03
机器学习的特征工程
microsoft
人工智能
(推荐系统)Wide&Deep算法:Wide & Deep Learning for Recommender Systems
摘要为改进经典推荐算法对
特征工程
的高依赖性以及深度学习方案因产生过多冗余信息而计算量增大的问题,Cheng等人提出了一种可以兼备记忆性以及泛化性的深度学习模型:Wide&Deep。
PYIPHANG
·
2022-11-28 11:00
推荐算法
论文笔记
机器学习
数据挖掘
深度学习
Spark ml
特征工程
参考:https://www.jianshu.com/p/e662daa8970ahttps://blog.csdn.net/qq_34531825/article/details/52415838https://blog.csdn.net/qq_34531825/article/details/52431264https://blog.csdn.net/u013090676/article/de
purisuit_knowledge
·
2022-11-28 11:28
机器学习
ml
特征工程
【ML
特征工程
】第 4 章 :特征缩放的影响:从词袋到 Tf-Idf
大家好,我是Sonhhxg_柒,希望你看完之后,能对你有所帮助,不足请指正!共同学习交流个人主页-Sonhhxg_柒的博客_CSDN博客欢迎各位→点赞+收藏⭐️+留言系列专栏-机器学习【ML】自然语言处理【NLP】深度学习【DL】foreword✔说明⇢本人讲解主要包括Python、机器学习(ML)、深度学习(DL)、自然语言处理(NLP)等内容。如果你对这个系列感兴趣的话,可以关注订阅哟文章目录
Sonhhxg_柒
·
2022-11-28 10:45
机器学习的特征工程
tf-idf
最全NLP中文文本分类实践(下)——Voting和Stacking的模型融合实现
当然,有很多方法可以提升模型的表现,包括
特征工程
、调参、模型融合等。在这篇文章中,主要介绍针对模型融合的实践内容,即对多个baseline按一定的方法进行“融合”以期达到指标的提升。
我是你博哥啊
·
2022-11-28 08:09
模型融合
自然语言处理
python
机器学习
python泰坦尼克号数据预测_Python机器学习预测泰坦尼克号乘客生存率(kaggle项目)...
提出问题(BusinessUnderstanding)理解数据(DataUnderstanding)数据清洗(DataPreparation)
特征工程
(FeatureEngineering)获取相关系数
weixin_39943202
·
2022-11-27 21:30
python泰坦尼克号数据预测
上一页
23
24
25
26
27
28
29
30
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他