E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
特征工程
为何开展数据清洗、
特征工程
和数据可视化、数据挖掘与建模?
1.2为何开展数据清洗、
特征工程
和数据可视化、数据挖掘与建模视频为《Python数据科学应用从入门到精通》张甜杨维忠清华大学出版社一书的随书赠送视频讲解1.2节内容。
数据科学作家
·
2023-12-06 14:30
数据挖掘
人工智能
机器学习
python
深度学习
数据分析
大数据
python机器学习
文章目录机器学习1.sklearn库1.1使用sklearn库提供的数据集1.2数据集的划分1.3
特征工程
1.3.1特征抽取1.3.1.1字典特征提取:类别->one-hot编码1.3.1.2文本特征抽取
FF_y
·
2023-12-05 20:52
python
ORers‘ Bling Chat | 【高光聊天记录集锦-01】:运小筹读者群里那些热烈的讨论
关于置信水平如何取值的问题2.关于各类solver的讨论3.关于最小冲突集、冲突集的讨论4.关于MP论文的讨论5.关于gurobi的log(1)5.关于gurobi的log(2)6.关于双层规划的讨论7.关于
特征工程
方面的讨论
刘兴禄
·
2023-12-04 23:14
运筹优化理论与实践
运小筹推文
公众号文章和代码
运筹优化
优化
Gurobi
强化学习
KNN 最邻近
介绍既可以做回归也可以做分类k邻近的3要素(1)选择合适的K(一般选奇数):通过交叉验证来选(2)距离选择:欧式距离、曼哈顿距离、余弦值、相关度(3)决策规则:投票、均值算法流程(1)把一个物体表示成向量:
特征工程
李静数据分析
·
2023-12-04 03:49
推荐系统大规模
特征工程
与FEDB的Spark基于LLVM优化
今天给大家分享第四范式在推荐系统大规模
特征工程
与Spark基于LLVM优化方面的实践,主要包括以下四个主题。
第四范式开发者社区
·
2023-12-03 18:06
Spark
python
hadoop
spark
大数据
flink
基于hadoop的商品推荐系统_推荐系统大规模
特征工程
与FEDB的Spark基于LLVM优化
今天给大家分享第四范式在推荐系统大规模
特征工程
与Spark基于LLVM优化方面的实践,主要包括以下四个主题。
weixin_39541212
·
2023-12-03 18:05
基于hadoop的商品推荐系统
6.Python数据分析项目之音乐推荐系统
可以用直接查看方式isnull、图像查看方式查看缺失值missingno)、查看数值类型特征与非数值类型特征、一次性绘制所有特征的分布图像预处理缺失值处理(填充)拆分数据(获取有需要的值)、统一数据格式、
特征工程
想成为数据分析师的开发工程师
·
2023-12-03 13:56
数据分析-统计分析
python
数据分析
人工智能
算法
机器学习
算法工程师面试八股(搜广推方向)
偏差与方差LayerNormalization和BatchNormalizationSVM数据不均衡特征选择排序模型树模型进行
特征工程
的原因GBDTLR和GBDTRF和GBDTXGBoost二阶泰勒展开优势为什么快防止过拟合处理缺失值树停止生长条件处理不平衡数据树剪枝选择最佳分裂点
贪钱算法还我头发
·
2023-12-03 03:29
Data
Structures
and
Algorithms
算法工程师
面经
搜索广告推荐
机器学习
深度学习
TTiki-Taka: Attacking and Defending Deep Learning-based Intrusion Detection Systems 论文分析
AttackingandDefendingDeepLearning-basedIntrusionDetectionSystems论文分析摘要神经网络在网络入侵检测系统(NIDS)的发展中越来越重要,因为它们具有实现高检测精度的潜力,同时需要有限的
特征工程
Gu Hui
·
2023-12-02 05:43
笔记
深度学习
神经网络
网络安全
一文讲透Python机器学习
特征工程
中的特征标准化
在Python中,可通过scikit-learn模块中的StandardScaler()函数实现对特征的标准化处理。StandardScaler()函数处理的数据对象同样是每一列,也就是每一维特征。StandardScaler()函数通过去除平均值和缩放到单位方差来标准化特征,将样本特征值转换为标准正态分布,因此该方法也被称为Z-score方法,也是默认的数据标准化处理方法。该方法和整体样本的分布
数据科学作家
·
2023-12-02 02:43
人工智能
python
机器学习
数据分析
数据挖掘
开发语言
大数据
【仓库】一文看懂
特征工程
在金融风控中的应用
https://baijiahao.baidu.com/s?id=1592286435017247094&wfr=spider&for=pc
麒麟楚庄王
·
2023-12-01 20:27
机器学习之决策树及随机森林
特征工程
:提取、选择
贾斯汀玛尔斯
·
2023-11-28 22:25
数据湖
机器学习
决策树
随机森林
一维卷积网络用于HAR(hunman activity recognition)
而难点在于,这种
特征工程
需要在该领域拥有深厚的专
阿委困的不能行
·
2023-11-28 21:28
阿里云安全恶意程序检测(速通三)
阿里云安全恶意程序检测
特征工程
进阶与方案优化pivot特征构建pivot特征pivot特征构建时间pivot特征构建细节特点业务理解和结果分析结合模型理解业务多分类问题预测结果分析
特征工程
进阶基于LightGBM
盖盖的博客
·
2023-11-27 19:40
读书笔记
阿里云
特征工程
恶意程序检测
天池大赛
2023年全国职业院校技能大赛-赛题第01套-GZ033 大数据应用开发
完全分布式安装配置子任务二:SparkonYarn安装配置子任务三:HBase分布式安装配置任务B:离线数据处理(25分)子任务一:数据抽取子任务二:数据清洗子任务三:指标计算任务C:数据挖掘(10分)子任务一:
特征工程
子任务二
你可知这世上再难遇我
·
2023-11-26 13:48
各类赛项赛题比赛综合任务书
大数据
数据采集
数据挖掘
机器学习基础知识,numpy学习,分类和回归初识
内容机器学习基本知识
特征工程
特征工程
内容监督学习一般使用标称型和数值型两种目标变量知识表示聚类密度估计思路numpy的使用array对象array对象的属性创建array的方法代码演示array本身支持的操作
crocodilian2
·
2023-11-26 12:09
笔记
机器学习
回归
分类
python
numpy
3d在线展示线上VR全景展示系统
商迪3D打造的VR全景展示系统采用3D大数据可视化挖掘、分析以及
特征工程
等技术,对业务背景进行调研和3D可视化场景的规划,对结构化和非结构化数据进行全量分析,完成信息化系统的3D全景展示,VR全景展示系统实质性的提升信息化系统的洞察力和应急分析处理能力
商迪3D
·
2023-11-25 23:56
vr
3d
轻松入门自然语言处理系列 专题9 基于
特征工程
+CRF的实体识别
文章目录前言一、使用CRF进行实体识别1.数据标注基础2.实体识别方案和原理3.CRF实体识别简单应用二、CRF算法剖析总结前言CRF(ConditionalRandomFields)是一种基于统计学习的序列标注模型,适用于自然语言处理任务中的序列标注问题,如词性标注、命名实体识别、句法分析等。其中,命名实体识别就是一种实体识别任务,它的目的是从一段文本中识别出包含人名、地名、组织机构名等实体信息
cutercorley
·
2023-11-25 20:58
轻松入门自然语言处理系列
自然语言处理
CRF
条件随机场
命名实体识别
NER
轻松入门自然语言处理系列 项目3 基于Linear-CRF的医疗实体识别
文章目录前言一、项目概况1.项目描述2.数据描述3.项目框架二、核心技术1.实体识别数据标注2.文本
特征工程
3.CRF模型4.BiLSTM-CRF模型三、项目实施1.读取数据2.数据标注3.文本
特征工程
cutercorley
·
2023-11-25 20:57
轻松入门自然语言处理系列
自然语言处理
人工智能
【转】【重要】推荐系统之数据与
特征工程
原文链接:推荐系统之数据与
特征工程
原文作者丨gongyouliu来自大数据与人工智能推荐系统是机器学习的一个子领域,并且是一个偏工程化、在工业界有极大商业价值的方向。
Just Jump
·
2023-11-25 14:05
推荐系统
特征工程
机器学习
推荐系统
特征工程
特征工程
(1)
特征工程
的简介
特征工程
入门与实践笔记
特征工程
是什么将数据转换为能更好的表示潜在问题的特征,从而提高机器学习性能
特征工程
内容转换数据的过程
特征工程
适用于任何阶段的数据,通常将数据处理成表格形式,数据组织成行(观察值)列
Campbell001
·
2023-11-25 14:34
特征工程
机器学习
推荐系统
特征工程
的万字理论
作者丨gongyouliu编辑丨lily这是作者的第25篇文章,约2.2w字,阅读需120分钟推荐系统是机器学习的一个子领域,并且是一个偏工程化、在工业界有极大商业价值的方向。大量应用于提供toC类产品的互联网企业服务中,通过推荐系统为用户提供精准的个性化服务。推荐系统通过推荐算法来为用户生成个性化推荐结果,而推荐算法依赖数据输入来构建算法模型。本篇文章我们来讲解推荐系统所依赖的数据,怎么处理这些
Pysamlam
·
2023-11-25 14:34
机器学习——1.Sklearn:
特征工程
目录scikit-learn数据集API介绍sklearn小数据集sklearn大数据集sklearn数据集的使用数据集的划分
特征工程
特征抽取/特征提取特征提取API字典特征提取文本特征提取中文文本特征值抽取停用词中文文本特征值抽取分词处理文本特征抽取
买奶茶的小孩
·
2023-11-24 05:52
机器学习
sklearn
机器学习
python
成为AI产品经理——模型构建流程(下)
目录1.模型训练2.模型验证3.模型融合4.模型部署上节课我们讲了模型设计、
特征工程
,这节课我们来讲模型构建剩下的三个部分:模型训练、模型验证和模型融合。
爱学习的时小糖
·
2023-11-24 02:07
AI产品经理
人工智能
产品经理
深度学习
成为AI产品经理——模型构建过程(上)
目录一、背景1.对内2.对外二、模型构建过程1.模型设计2.
特征工程
①数据清洗②特征提取数值型数据标签/描述类数据特征非结构化数据(处理文本特征)网络关系型数据③特征选择④训练集/测试集一、背景虽然产品经理不需要参与到模型构建工作中
爱学习的时小糖
·
2023-11-24 02:37
AI产品经理
产品经理
天猫用户重复购买预测——
特征工程
天猫用户重复购买预测——
特征工程
1.
特征工程
1.1概念1.2特征归一化1.3类别型特征转换1.4高维组合特征的处理1.5组合特征1.6文本表示模型2.赛题
特征工程
思路3.
特征工程
构造3.1工具包导入3.2
Rocket,Qian
·
2023-11-24 01:45
机器学习项目
数据科学比赛
特征工程
天猫复购预测
python
机器学习
天池大赛
Course1-Week2-多输入变量的回归问题
-多输入变量的回归问题1.向量化和多元线性回归1.1多维特征1.2向量化1.3用于多元线性回归的梯度下降法2.使梯度下降法更快收敛的技巧2.1特征缩放2.2判断梯度下降是否收敛2.3如何设置学习率3.
特征工程
虎慕
·
2023-11-23 19:39
#
机器学习-吴恩达
回归
数据挖掘
人工智能
今天感悟
没有好的数据清洗,整合以及
特征工程
能力,再牛的模型他也出不来。图片发自App所以大家还是一步一个脚印吧。慢慢来,或许比较快!
Fred吴
·
2023-11-23 14:40
机器学习常规操作流程(代码解读)
目录1.
特征工程
1.1常用方法1.2这些方法有没有考虑特征间的相关度模型精度低1.
特征工程
解读下面的代码scaler=StandardScaler()X_scaled=scaler.fit_transform
赵孝正
·
2023-11-23 00:39
机器学习算法
特征工程
机器学习
人工智能
特征工程
完整指南 - 第一部分
苏米特·班迪帕迪亚一、说明
特征工程
是利用领域知识从原始数据中提取特征的过程。这些功能可用于提高机器学习算法的性能。本篇叙述在特征选择过程的若干数据处理。
无水先生
·
2023-11-22 11:42
机器学习
人工智能
数据挖掘和量化分析
python
人工智能
机器学习
更加优雅的因子挖掘技术之自动化
特征工程
图片一、为什么要自动化
特征工程
对机器学习有一些了解的小伙伴一定听过“GarbageinGarbageout”,也就是说模型的表现很大程度上依赖于喂给算法的数据质量。
Joe量化
·
2023-11-22 05:03
【机器学习】
特征工程
:特征选择、数据降维、PCA
各位同学好,今天我和大家分享一下python机器学习中的特征选择和数据降维。内容有:(1)过滤选择;(2)数据降维PCA;(3)sklearn实现那我们开始吧。一个数据集中可能会有以下问题:(1)冗余:部分特征的相关度高,由于A与B之间有某种计算公式使它们相关联,A特征的变化会导致B特征的变化,容易消耗计算性能,只需要存在一个特征就可以了。(2)噪声:部分特征对预测结果有负影响,需要剔除一些与预测
TwcatL_tree
·
2023-11-22 01:40
深度学习
人工智能
机器学习
机器学习
人工智能
机器学习算法(4)—— 决策树算法
决策树算法1决策树介绍2信息熵3决策树划分依据3.1信息增益3.2信息增益率3.3基尼指数3.4小结4.cart剪枝4.1为何要cart剪枝4.2常用的剪枝方法5.
特征工程
—特征提取5.1字典特征提取5.2
夏木夕
·
2023-11-20 16:00
机器学习
决策树
算法
python中的NumPy和Pandas往往都是同时使用,NumPy和Pandas的在数据分析中的联合使用
numpy的介绍与用法二、pandas的介绍与用法三、numpy与pandas的联合使用说明四、numpy与pandas的联合使用程序代码4.1读取CSV文件并进行数据清洗,如去除NaN值4.2矩阵操作和
特征工程
小桥流水---人工智能
·
2023-11-20 15:18
Python程序代码
python
numpy
pandas
深度学习入门(第一天)——深度学习必备知识点
一、深度学习要解决的问题人工智能、机器学习、深度学习的区别于联系机器学习的流程:数据提取
特征工程
建立模型评估与应用
特征工程
可以说是建模过程中,最重要的部分。
学术菜鸟小晨
·
2023-11-20 09:30
深度学习入门
深度学习
人工智能
FATE -
特征工程
综述
HeteroFeatureBinning======================Featurebinningordatabinningisadatapre-processingtechnique.Itcanbeusetoreducetheeffectsofminorobservationerrors,calculateinformationvaluesandsoon.Currently,wep
DigitalForensic
·
2023-11-19 12:16
贷款违约预测-Task3
特征工程
Task3
特征工程
此部分为零基础入门金融风控的Task3
特征工程
部分,带你来了解各种
特征工程
以及分析方法,欢迎大家后续多多交流。
致Great
·
2023-11-19 05:40
【Datawhale Ai 夏令营】用户新增预测挑战赛:分类器比较和
特征工程
系列文章目录【DatawhaleAi夏令营】用户新增预测挑战赛baseline文章目录系列文章目录[【DatawhaleAi夏令营】用户新增预测挑战赛baseline](https://blog.csdn.net/weixin_44471994/article/details/132368562)前言一、模型选择1.SGDClassifier2.DecisionTreeClassifier3.Mu
Turing_well
·
2023-11-17 03:14
Datawhale
Ai
训练营
人工智能
Datawhale AI夏令营 - NLP实践:基于论文摘要的文本分类与关键词抽取挑战赛——基础篇
A:在许多机器学习问题中,
特征工程
的重要性不容忽视。如果
特征工程
能够充分捕捉数据的关键特征,那么机器学习算法也能够表现良好。
学软件的小铃铛
·
2023-11-17 03:44
人工智能
自然语言处理
python
机器学习算法实战实战案例代码详解
文章目录1.问题建模数据预处理结果分析数据探索
特征工程
特征选择模型融合1.问题建模导入库importnumpyasnpimportpandasaspdfromsklearn.model_selectionimportKFoldfromsklearn.metricsimportmean_squared_errorfromsklearn.preprocessingimportOneHotEncoder
Unicornlyy
·
2023-11-17 03:13
机器学习
python学习
机器学习
算法
人工智能
用户画像与用户分层
用户画像,不论Persona还是Profile,都是
特征工程
的典型应用,即通过数据分析和挖掘从用户的各类数据中提取共性特点的过程。用户画像分为两类:静态属性画像和动态兴趣画像。
rubyw
·
2023-11-17 02:31
数据运营
用户运营
图神经网络--图嵌入表示学习
图嵌入表示学习图神经网络图嵌入表示学习一、图嵌入简介二、基本框架(编码器+解码器)2.1编码器2.2解码器三、基于随机游走的方法3.1随机游走的概念3.2随机游走的步骤四、Node2Vec五、矩阵分解一、图嵌入简介传统机器学习(
特征工程
无盐薯片
·
2023-11-16 18:57
图神经网络
神经网络
学习
机器学习
机器学习——
特征工程
机器学习面试题汇总与解析——
特征工程
本章讲解知识点什么是
特征工程
数据预处理特征缩放特征编码特征选择特征提取本专栏适合于Python已经入门的学生或人士,有一定的编程基础。
华为云计算搬砖工
·
2023-11-14 18:08
机器学习面试题汇总与解析
机器学习
人工智能
Kaggle-Tricks自用总结
基础特征:【kaggle】
特征工程
trick-CSDN博客训练策略梯度:gradient_clip_val-CSDN博客数据增强:CutMix&Mixup详解与代码实战_cutmix代码_华为云开发者联盟的博客
思考实践
·
2023-11-14 09:21
人工智能
机器学习
深度学习
人工智能
Kaggle
Tricks
数据增强
数据预处理
因子分解机 FM
因子分解机FM模型的核心作用可以概括为三个与其他模型对比FFM(场感知分解机,Field-awareFactorizationMachine)背景DeepFMFM/FFM与其它模型对比背景在人工方式的
特征工程
浮汐
·
2023-11-12 16:03
ML
LR、Poly2、FM、FFM
1.LRLR的linearMargin:假设特征之间是相互独立的,忽略了featurepair等高阶信息;在LR中,特征组合等高阶信息是通过
特征工程
在特征侧引入的,那么有哪些模型不需要通过
特征工程
自动学习高阶信息呢
dili8870
·
2023-11-12 16:12
人工智能
python
特征工程
插件_Python数据科学:全栈技术详解5-
特征工程
(上)
配套学习教程:数据科学实战:Python篇https://edu.hellobi.com/course/270前文传送门:本章从商业数据分析和挖掘的角度详细地介绍了
特征工程
及其使用的响应方法:数据预处理
weixin_39908616
·
2023-11-11 21:22
python特征工程插件
特征工程
使用卡方检测的作用
卡方检验主要可以用于处理计数数据的拟合问题。具体说,它可以检验单变量多项分类上的实计数和理论次数分布之间的差异显著性。它是卡方检验中的一个主要测试指标,卡方检验是一种用途很广的计数资料的假设检验方法,它属于非参数检验的范畴,主要是比较两个及两个以上样本率(构成比)以及两个分类变量的关联性分析,其根本思想就是在于比较理论频数和实际频数的吻合程度或拟合优度问题。卡方值是非参数检验中的一个统计量,主要用
cuisidong1997
·
2023-11-11 00:29
python
TensorFlow(1):深度学习的介绍
1深度学习与机器学习的区别学习目标:知道深度学习与机器学习的区别区别:深度学习没有特征提取1.1特征提取方面机器学习的
特征工程
步骤是要靠手动完成的,而且需要大量领域专业知识深度学习通常由多个层组成,它们通常将更简单的模型组合在一起
不死鸟.亚历山大.狼崽子
·
2023-11-10 03:07
TensorFlow
深度学习
tensorflow
人工智能
从零开始学习机器学习五:决策树算法&
特征工程
决策树&
特征工程
目标1简介1.1认识决策树2分类原理2.1熵2.2决策树的划分依据一-信息增益2.3决策树的划分依据二-信息增益率2.4决策树的划分依据三-基尼值和基尼指数2.5常见决策树类型比较3cart
火航
·
2023-11-09 22:19
机器学习
算法
决策树
机器学习
上一页
2
3
4
5
6
7
8
9
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他