E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
特征工程-数据降维
机器学习项目的完整流程:①数学建模、②获取数据、③数据预处理、④
特征工程
、⑤模型的选择、⑥模型训练、⑦模型调优、⑧模型评价、⑨模型融合、⑩上线
一、抽象成数学问题明确问题是进行机器学习的第一步。机器学习的训练过程通常都是一件非常耗时的事情,胡乱尝试时间成本是非常高的。这里的抽象成数学问题,指的我们明确我们可以获得什么样的数据,目标是一个分类还是回归或者是聚类的问题,如果都不是的话,如果划归为其中的某类问题。二、获取数据数据决定了机器学习结果的上限,而算法只是尽可能逼近这个上限。数据要有代表性,否则必然会过拟合。而且对于分类问题,数据偏斜不
u013250861
·
2023-11-06 15:01
机器学习/ML
机器学习
算法
深度学习推荐系统-NFM
NFM0.结论NFM是FM的神经网络化尝试NFM用神经网络代替FM中二阶隐向量交叉的操作,相比于FM,NFM的表达能力和特征交叉能力更强局限性在于结构与PNN近似,
特征工程
层面的优化尝试几乎穷尽,模型进一步提升的空间非常小
Q_cy
·
2023-11-05 20:12
文章推荐系统 | 七、构建离线文章特征和用户特征
接下来,我们还要为排序阶段的各种排序模型做数据准备,通过
特征工程
将画像数据进一步加工为特征数据,以供排序模型
小王子特洛伊
·
2023-11-05 13:56
2019-05-18某某面试
三面1:一个小姐姐,问了很多
特征工程
的,glove怎么做的,协同过滤怎么做的,你用的特征哪些重要度比较高,为什么模型没用glove,你踩过的坑是
不将就_215a
·
2023-11-05 11:03
阿里云天池大赛赛题(机器学习)——阿里云安全恶意程序检测(完整代码)
目录赛题背景全代码(ML和DL)
特征工程
进阶与方案优化代码
特征工程
进阶部分基于LightGBM的模型验证模型测试深度学习解决方案:TextCNN建模代码数据读取数据预处理TextCNN网络结构TextCNN
全栈O-Jay
·
2023-11-05 06:18
人工智能
Python
机器学习
阿里云
安全
阿里云安全恶意程序检测之数据探索
特征工程
文本预处理不同于传统的
solejay
·
2023-11-05 06:45
阿里云
阿里云安全恶意程序检测
阿里云安全恶意程序检测赛题理解赛题介绍赛题说明数据说明评测指标赛题分析数据特征解题思路数据探索数据特征类型数据分布箱型图变量取值分布缺失值异常值分析训练集的tid特征标签分布测试集数据探索同上数据集联合分析file_id分析API分析
特征工程
与基线模型构造特征与特征选择基于数据类型的方法基于多分析视角的方法特征选择构造线下验证集评估穿越训练集和测试集的特征性差异训练集和测试集是分布差异性基线模型特
盖盖的博客
·
2023-11-05 06:10
读书笔记
阿里云
云计算
多分类
天池大赛
机器学习
【推荐与广告】积累与发现
文章目录特征计算广告业务计费方式竞价策略评价指标广告归因综合介绍DMP推荐算法概述协同过滤深度推荐矩阵分解SVDLFM分解机文本主题模型基于图的推荐排序学习简介PairwiseCTR预估CTR校准数据优化FTRL多任务学习丹核心思想特征推荐系统的
特征工程
数据分析经典分析方法
dominic_z
·
2023-11-04 03:19
机器学习与数据挖掘
python
特征工程
(二)——特征选择
实际工作中,
特征工程
是去除数据中的杂质,提炼为更合理的特征,供算法和模型使用。
特征工程
主要包括特征归一化、类型特征的表示、特征选择及非结构化数据的表示。本文主要介绍特征选择的常用方法。现实
叫我e卵石
·
2023-11-03 20:52
深度学习推荐系统-DeepCrossing
DeepCrossing1.动机这个模型就是一个真正的把深度学习架构应用于推荐系统中的模型了,2016年由微软提出,完整的解决了
特征工程
、稀疏向量稠密化,多层神经网络进行优化目标拟合等一系列深度学习再推荐系统的应用问题
Q_cy
·
2023-11-03 09:02
Python机器学习实战(一)
文章目录基于逻辑回归实现乳腺癌预测基于k-近邻算法实现鸢尾花分类基于决策树实现葡萄酒分类基于朴素贝叶斯实现垃圾短信分类基于支持向量机实现葡萄酒分类基于高斯混合模型实现鸢尾花分类基于主成分分析实现鸢尾花
数据降维
基于奇异值分解实现图片压缩基于逻辑回归实现乳腺癌预测
数据攻城小狮子
·
2023-11-03 09:05
Python数据分析
挖掘与可视化
python
机器学习
人工智能
机器学习
目录准备
特征工程
:scikit-learn介绍:数据特征抽取:热编码:适合类别型数据处理方式sklearn特征抽取API字典特征抽取文本特征抽取TF_IDF(评估重要性):数据特征预处理:通过数学算法把数据转为算法要求的数据归一化算法
性感奎爷在线写代码
·
2023-11-02 19:00
python基础语法
算法工程师每天都在干嘛?
相信大部分算法工程师每天的工作都是:提出技术方案->收集数据->预处理数据->撰写
特征工程
->模型训练->调参->看结果->调参->看结果->重新收集数据->预处理数据->收集更多数据->调参->调参-
Amusi(CVer)
·
2023-11-02 01:13
百度
算法
人工智能
大数据
机器学习
新闻推荐项目02-数据分析
数据分析数据分析的价值主要在于熟悉了解整个数据集的基本情况包括每个文件里有哪些数据,具体的文件中的每个字段表示什么实际含义,以及数据集中特征之间的相关性,在推荐场景下主要就是分析用户本身的基本属性,文章基本属性,以及用户和文章交互的一些分布,这些都有利于后面的召回策略的选择,以及
特征工程
_龙雀
·
2023-11-01 22:27
特征工程
实践总结
特征工程
是将原始数据,通过业务逻辑理解、数据变换、特征交叉与组合等方式,量化成模型训练和预测可直接使用的特征的过程。其中主要包括了数据认知,数据清洗,特征构建,特征选择四个部分。
caomengsi
·
2023-11-01 14:53
论文阅读 - DCGNN: Dual-Channel Graph Neural Network for Social Bot Detection
现有的方法可以分为
特征工程
和基于深度学习的方法,它们主要关注静态特征,例如帖子特征和用户档案。
无脑敲代码,bug漫天飞
·
2023-11-01 12:59
社交机器人检测
论文阅读
深入浅出的TensorFlow可视化工具TensorBoard用法教程(一)
1.TensorBoard的主要功能生成折线图展示图像播放音频生成直方图观察神经网络(数据流图)
数据降维
分布图1.1生成折线图当我们要对模型的正确率、loss值、学习速度等标量进行可视化时,经常会用到折线图
草尖上的舞动
·
2023-11-01 09:41
CS224W3.1——节点Embedding
传统图机器学习流程是这样的:从之前的文章中,我们看到了如何将机器学习与
特征工程
结合起来,对节点、链接和图形进行预测。在本文中,我们将重点介绍一种称为图表示学习的新技术,它可以减轻对
特征工程
的需求。
阿牛大牛中
·
2023-11-01 05:57
图神经网络
embedding
机器学习
推荐算法
人工智能
神经网络
知识图谱
Azure机器学习 - 在 Azure 机器学习中上传、访问和浏览数据
设置内核三、下载使用的数据四、创建工作区的句柄五、将数据上传到云存储空间六、访问笔记本中的数据七、创建新版本的数据资产八、清理资源机器学习项目的开始阶段通常涉及到探索性数据分析(EDA)、数据预处理(清理、
特征工程
TechLead KrisChang
·
2023-10-31 21:55
人工智能
azure
机器学习
microsoft
人工智能
机器学习之
特征工程
机器学习之
特征工程
转载自:点击打开链接在这个振奋人心的程序员节日里,我决定认真地写一篇文章来纪念一下自己这长达六年程序员史。
jiangjiane
·
2023-10-31 08:21
机器学习
特征工程
机器学习-
特征工程
一、
特征工程
介绍1.1什么是特征数值特征(连续特征)、文本特征(离散特征)1.2特征的种类1.3
特征工程
特征是机器学习可疑直接使用的,模型和特征之间是一个循环过程;实际上
特征工程
就是将原始数据处理成机器学习可以直接使用数据的过程
lalajh
·
2023-10-31 08:19
机器学习
人工智能
滴滴大数据算法大赛Di-Tech2016参赛总结
https://www.jianshu.com/p/4140be00d4e3题目描述建模方法
特征工程
我的几次提升方法从其他队伍那里学习到的提升方法总结和感想神经网络方法的一点思考大数据量与分布式计算的一点思考参加比赛和学习知识的对比最后的感受趣事写在前面我是一个之前
weixin_30325071
·
2023-10-31 06:35
机器学习之逻辑回归(Logistic Regression)
逻辑回归一、逻辑回归理论概述二、sklearn逻辑回归的使用1.正则化参数2.
特征工程
(可解释的特征降维):embedded3.梯度下降:重要参数max_iter4.二元回归和多元回归重要参数:solver
`AllureLove
·
2023-10-31 02:42
机器学习
python
机器学习
数据分析
逻辑回归
基于【逻辑回归】的评分卡模型金融借贷风控项目实战
完整的模型开发所需流程包括:获取数据,数据清洗和
特征工程
,模型开发,模型检验和评估,模型上线,模型检测和报告。
数字生命Allen
·
2023-10-31 02:38
逻辑回归
算法
机器学习
ML&DEV[9] | gRPC初体验
往期回顾:ML&DEV[4]|机器学习进阶线路ML&DEV[5]|系统理解
特征工程
ML&DEV[6]|算法工程师Linux必知必会ML&
机智的叉烧
·
2023-10-30 18:37
数据预处理之数据规约
目录一、前言二、PCA的主要参数:三、数据归约任务1四、数据规约任务2一、前言PCA(PrincipalComponentAnalysis),即主成分分析方法,是一种使用最广泛的
数据降维
算法。
那个叫马尔的大夫
·
2023-10-30 17:50
数据采集与预处理
人工智能
【机器学习】项目数据处理部分
文章目录前言项目理解数据探索
特征工程
总结前言本文参考《阿里云天池大赛赛题解析》,拿到一个项目或者赛题,使用机器学习来进行预测分类,需要以下七个步骤:项目(赛题)理解数据探索
特征工程
模型训练模型验证特征优化模型融合本本是数据处理
高 朗
·
2023-10-30 10:09
机器学习
机器学习
人工智能
数据挖掘
python数据趋势算法_基于 Python 的 11 种经典
数据降维
算法
这里有个GitHub项目整理了使用Python实现了11种经典的数据抽取(
数据降维
)算法,包括:PCA、LDA、MDS、LLE、TSNE等,并附有相关资料、展示效果;非常适合机器学习初学者和刚刚入坑数据挖掘的小伙伴
weixin_39777540
·
2023-10-29 14:12
python数据趋势算法
python降维之时间类型数据的处理_【Python算法】
数据降维
概述
数据降维
概述1.
数据降维
概述所谓的
数据降维
就是指采用某种映射方法,将原高维空间中的数据点映射到低维度的空间中,可以解决大规模特征下的数据显示问题,使得数据集更易使用,降低后续算法的计算,消除噪声影响并使得结果更易理解
weixin_39989980
·
2023-10-29 14:12
基于 Python 的 11 种经典
数据降维
算法|KPCA降维算法
KPCA(kernelPCA)KPCA是核技术与PCA结合的产物,它与PCA主要差别在于计算协方差矩阵时使用了核函数,即是经过核函数映射之后的协方差矩阵。引入核函数可以很好的解决非线性数据映射问题。kPCA可以将非线性数据映射到高维空间,在高维空间下使用标准PCA将其映射到另一个低维空间。KPCA降维算法展示详细内容可参见《Python机器学习》之特征抽取——kPCA:https://blog.c
Luara_lyy
·
2023-10-29 14:12
数据挖掘
python
python
机器学习
数据
特征工程
| 基于PCA算法(Python)
随着数据量的不断增加和数据维度的不断扩展,如何进行高效的
数据降维
处理成为了一个热门话题。在数据分析领域,PCA算法作为一种常用的
数据降维
方法,可以对多个特征进行降维,提高计算效率和降低存储空间需求。
算法如诗
·
2023-10-29 14:42
数据特征工程(DFE)
算法
python
开发语言
特征工程
——
数据降维
基于特征选择的降维基于特征选择的降维指的是根据一定规则和经验,直接选取原有维度的一部分参与到后续的计算和建模过程,用选择的维度代替所有维度,整个过程不产生新的维度。基于特征选择的降维方法有4种思路:·经验法:根据业务专家或数据专家的以往经验、实际数据情况、业务理解程度等进行综合考虑。业务经验依靠的是业务背景,从众多维度特征中选择对结果影响较大的特征;而数据专家则依靠的是数据工作经验,基于数据的基本
李代数
·
2023-10-29 14:42
python
算法
机器学习
数据分析
数据
特征工程
| 基于KPCA算法(Python)
当我们处理高维数据时,经常会遇到维度灾难的问题,即许多算法无法有效处理高维数据,且计算不仅变得更加复杂,还存在过拟合和维数诅咒等问题。因此,如何有效地降低数据维度是一个关键问题。为此,很多学者提出了各种降维算法,其中主成分分析(PCA)是最常见的一种方法。然而,在许多应用中,由于数据并不是线性可分的,因此PCA的优化目标并不能很好地适应这些数据。在这种情况下,核主成分分析(KPCA)算法被广泛使用
算法如诗
·
2023-10-29 14:41
数据特征工程(DFE)
算法
python
开发语言
机器学习(一) —— 机器学习基础
Python——机器学习机器学习(一)——机器学习基础一、数据集1.1加载数据集1.2划分数据集二、
特征工程
2.1特征预处理(归一化/标准化)2.2特征降维(特征选择/主成分分析/线性判别器)2.3特征提取
share16
·
2023-10-29 09:41
机器学习
python
python 机器学习(一)机器学习概述与
特征工程
同步更新在个人网站:http://www.wangpengcufe.com/machinelearning/pythonml-pythonml1/一、机器学习概述1.1、什么是机器学习?机器学习是从数据中自动分析获得规律(模型),并利用规律对未知数据进行预测1.2、为什么需要机器学习?解放生产力,智能客服,可以不知疲倦的24小时作业解决专业问题,ET医疗,帮助看病提供社会便利,例如杭州的城市大脑1
王小鹏的随笔
·
2023-10-29 09:41
python
机器学习
特征工程
算法
大数据
机器学习
sklearn进行机器学习 ( 一天掌握 )
目录文章目录目录机器学习
特征工程
特征抽取skearn数据集使用字典特征提取文本特征抽取中文文本特征抽取中文分词中文文本特征抽取-自动分词TF-IDF特征预处理归一化标准化(大数据用)特征降维特征选择主成分分析
鼠小米
·
2023-10-29 09:40
机器学习
sklearn
机器学习
python
Python机器学习从零开始(三)数据准备
目录1.数据预处理1.1调整数据尺度1.2正态化数据1.3标准化数据1.4二值数据2.数据特征选定2.1单变量特征选定2.2递归特征消除2.3
数据降维
2.4特征重要性总结特征选择时困难耗时的,也需要对需求的理解和专业知识的掌握
靖墨c
·
2023-10-29 09:10
机器学习实战
python
机器学习
人工智能
算法
机器学习的练功心法(三)——
特征工程
文章目录致谢3
特征工程
3.1Sklearn工具及数据集3.2数据集3.3数据集的划分3.4
特征工程
介绍3.4.1为什么需要
特征工程
3.4.2什么是
特征工程
3.4.3特征提取3.4.3.1字典特征提取3.4.3.2
ArimaMisaki
·
2023-10-29 09:40
机器学习
算法
人工智能
机器学习
python
一文看懂
特征工程
顺便将自己对
特征工程
的所有理解系统地整理出来,给自己做个笔记,也给未来的小白做个领路。这便文章不仅有对
特征工程
系统的解析,还会有python代码的实例演示,让我们一起出发吧!
是猪哥不是诸葛
·
2023-10-29 07:53
计算机视觉
TF2.0.keras深度学习
TF2.0神经网络实战教学
机器学习
人工智能
深度学习
机器学习常见降维方法及Python示例汇总【附完整代码】
这次我就整理了一部分
数据降维
相关的论文以及常用降维技术的Python示例
深度之眼
·
2023-10-29 01:02
深度学习干货
人工智能干货
人工智能
机器学习
数据降维
数据
特征工程
| 主成分分析(Python)
特征抽取(featureextraction)和特征选择(featureselection)不一样,特征抽取是从原特征集中推导出有用的信息构成新的特征集。特征选择是从原特征集中选择一部分子集作为训练特征。特征抽取将数据集从一个特征空间投影到了一个更低维度的特征空间。主成分分析(principalcomponentanalysis,PCA)是一种的无监督线性变换技术,主要用于特征抽取和降维。假设原始
算法如诗
·
2023-10-28 23:42
数据特征工程(DFE)
python
主成分分析
图解机器学习
特征工程
文章目录引言
特征工程
1.特征类型1.1结构化vs非结构化数据1.2定量vs定性数据2.数据清洗2.1数据对齐2.2缺失值处理原文链接:https://www.showmeai.tech/article-detail
赵孝正
·
2023-10-28 20:39
特征工程
机器学习
人工智能
机器学习
特征工程
:处理缺失值填充的5大技巧
大家好,本文分享Pandas中缺失值填充的5大技巧:填充具体数值,通常是0填充某个统计值,比如均值、中位数、众数等填充前后项的值基于SimpleImputer类的填充基于KNN算法的填充数据importpandasaspdimportnumpyasnpdf=pd.DataFrame({"A":list(range(1,9)),"B":list(range(5,13)),"C":list(range
Python数据挖掘
·
2023-10-28 17:23
机器学习
机器学习
python
pandas
机器学习之路:FaceBook预测案例分析----->KNN算法的应用与调优
小白的机器学习之路(二)引子学习机器学习基础:从理论到实践了解机器学习机器学习的定义机器学习的分类机器学习的基本原理掌握数据预处理数据清洗特征选择
特征工程
分类算法sklearn转换器和预估器KNN算法获取数据数据集划分
特征工程
是一个Bug
·
2023-10-28 02:25
机器学习
算法
人工智能
【无标题】
具体步骤:一、读取数据集二、数据分析三、数据清洗四、
特征工程
五、模型训练与验证六、输出结果七、小结参考链接:https://datawhaler.feishu.cn/docx/C6jvdEwsSo3JMwxFj1
LucyFang2020
·
2023-10-28 00:49
python
开发语言
特征工程
优化
参考链接https://www.bilibili.com/video/BV1WN4y1k7R1/?buvid=XU0E30D0C6006B7F1EE1425156434CFEC440F&from_spmid=tm.recommend.0.0&is_story_h5=false&mid=fMtk7pz9LsVpSyGt0Mcizg%3D%3D&p=1&plat_id=116&share_from=u
LucyFang2020
·
2023-10-28 00:18
python
机器学习项目实战
Titanic幸存者预测-监督学习分类1.数据准备2.数据加载及处理1.加载结构化的训练集2.处理缺失值,异常值3.
特征工程
4.逻辑回归算法训练模型5.模型性能评估6.模型持久化6.1sklearn0.21
laufing
·
2023-10-27 18:22
人工智能
机器学习
机器学习(python)笔记整理
目录一、数据预处理:1.缺失值处理:2.重复值处理:3.数据类型:二、
特征工程
:1.规范化:2.归一化:3.标准化(方差):三、训练模型:如何计算精确度,召回、F1分数一、数据预处理:1.缺失值处理:在数据中存在缺失值的情况下
小辉懂编程
·
2023-10-27 08:24
机器学习
笔记
机器学习之数据预备、清洗与
特征工程
一、概念:二、为什么要进行预处理:1-1数据预处理简介为什么要进行预处理:数据预处理的功能:①数据集成(DataIntegration)详解:②数据变换(BataTrartsformstian)详解:③数据清洗(DataCleaning)详解:④数据简化(Datasimplify)详解:a、维归约(dimensionlity):b、数量归约(numerosityreduction):c、数据压缩(
平原2018
·
2023-10-27 02:28
机器学习
数据清洗
特征工程
-特征预处理
特征工程
-DataPreProcessing(数据预处理)-FeatureExtraction(特征提取)-FeatureSelection(特征选择)-Featureconstruction(特征构造
maybelillian_gu
·
2023-10-26 00:02
上一页
4
5
6
7
8
9
10
11
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他