E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
woe分箱
Titanic细节记录一
iloc的区别不同的排序方式sort_valuessort_indexDataFrame相加describe函数查看数据基本信息查看多个列的数据时使用列表处理缺失值的几种思路dropnafillna去重手段
分箱
BIT_mk
·
2023-08-10 00:48
数据分析
pandas
数据分析
【玩转pandas系列】pandas加载数据,
分箱
操作和时间序列,绘制图形
知识目录前言一、加载数据1-加载CSV文件2-加载Excel文件3-加载数据库数据二、
分箱
1-等宽
分箱
2-等频
分箱
三、时间序列1-Timestamp和Period的创建2-索引和切片3-属性和移动4-频率转换
向阳花花花花
·
2023-08-07 18:46
Python数据分析
pandas
机器学习
使用toad对数据进行
分箱
处理
Toad的主要功能极大简化了建模中最重要最费时的流程,即特征筛选和
分箱
。
AIGC人工智残
·
2023-08-05 00:22
数据分析
数据分析
数据分箱
数据挖掘项目:金融银行风控信用评分卡模型(下篇)
以下是银行信用评分卡建模分析下篇的内容,包括采用两种方法进行数据
分箱
,然后构建模型,进行模型评估,最后评分卡建立这四部分。其中如果有一些地方分析的不正确,希望大家多多指正!
Soda kun
·
2023-07-31 19:01
数据分析
数据挖掘
机器学习
金融
python
数据挖掘项目:金融银行风控信用评分卡模型(上篇)
GiveMeSomeCredit,有15万条的样本数据,网上的分析说明有很多,本人结合其他大佬的方法,对数据进行细致的分析,主要分析在EDA环节,之后尝试使用toad这个评分卡的库,以及使用quct结合卡方检验
分箱
的方法
Soda kun
·
2023-07-31 19:59
python
数据挖掘
机器学习
数据分析
金融
天堂
“
woe
,
woe
——”神秘的呼唱,仿若天边的神灵低语。奇异的音调幻化成两头小鬼,缓缓地将一扇巨大的门开启,呈现出辽远又瑰丽的画面。
迟钝的琥珀
·
2023-07-31 09:27
2022-07-15
十三;愚蠢的复仇入秋以来不断听见要抽我们回城的消息,这一天终于来到了,七八年十月八日是我们在乡下生活的最后一天,临近中午矿务局来两辆卡车接我们回家,我和大家刚把部
分箱
子装满正要上车的时候,带队王旭东(此时张玉良早已调回露天
w山蒙w
·
2023-07-30 20:56
0923 chapter 5
几个术语变量、值、观测、表格数据5.3变动条形图:分类变量geom_bar直方图:连续变量(直方图对x轴进行等宽
分箱
)geom_histogram典型值异常值(确定异常值的原因)p70练习题1.首先把x
森尼啊
·
2023-07-27 17:02
sns.regplot 和 sns.distplot你知道多少
顺便说下直方图和条形图区别:直方图:先
分箱
,然后计算每个
分箱
频数的数据分布。直方图一般用于数字特征(连续型);条形图一般用于
python程序员小'鹏
·
2023-07-22 10:10
可视化
python
人工智能
机器学习
数据挖掘
应用商店数据分析报告
评论、价格和APP大小均作
分箱
处理,方便绘图和可视化。三、分析报告幻灯片1.JPG幻灯片2.JPG幻灯片3.JPG幻灯片4.JPG幻灯
努力进步的大白菜
·
2023-07-19 15:30
信也科技面经
2020.9.15投递2020.9.18笔试七道主观题3or4概率统计题目、1道编程填空题目、1道风控模型分析题目、1道机器学习题目2020.9.25一面有些记不太清除了自我介绍挖实习经历:风控相关:解释一些
WOE
kaka22
·
2023-07-18 00:21
为什么要进行数据
分箱
?(转)
比如在建立申请评分卡模型时用logsitic作为基模型就需要对连续变量进行离散化,离散化通常采用
分箱
法。
孙虾米
·
2023-06-23 16:37
Python学习——数据排序及
分箱
pd.cut\pd.qcut
文章目录1排序1.1按照索引排序df.sort_index1.2按照值进行排序df.sort_values1.3数值型数据快速排序df.nlargest2
分箱
(离散化)2.1pd.cut2.1.1均匀切分
云晓-
·
2023-06-22 10:11
python基础知识
python
学习
数学建模
宏基因组
分箱
软件metaWRAP报错记录与解决方法
最近学习微生物宏基因组
分箱
(binning),按官方文档安装metaWRAP,踩了一堆坑,记录一下报错及解决方法:1.metaWRAP安装安装教程及下载地址:GitHub-bxlab/metaWRAP:
ygyxl
·
2023-06-21 04:21
【2019-04-21】
WOE
WOE
是对原始自变量的一种编码形式。要对一个变量进行
WOE
编码,需要首先把这个变量进行分组处理(也叫离散化、
分箱
等等,说的都是一个意思)。
FridayQun
·
2023-06-19 21:43
pandas---
分箱
(离散化处理)、绘图、交叉表和透视表
1.
分箱
分箱
操作就是将连续型数据离散化。
python(爱看动漫的程序猿)
·
2023-06-18 20:08
pandas
pandas
python
数学建模
数据挖掘各流程中常用方法总结(二)
数据挖掘各流程中的常用方法(二)数据预处理特征选择特征编码分类型特征独热编码(One-hotEncoder)标签编码(labelEncoder)序列编码(OrdinalEncoder)数值型特征取整和缩放
分箱
特征标准化
云流寂川
·
2023-06-14 19:53
数据挖掘方法
数据挖掘
python
机器学习
13. 数据变换:考试成绩要求正态分布合理吗?
可采用
分箱
,聚类和回归的方法。数据聚集:对数据进行汇总
进击的原点
·
2023-04-21 11:23
学院金融风控的步骤集合
申请评分卡在互联网金融业的重要性和特性3.贷款申请环节的数据介绍和描述4.非平衡样本问题的定义和解决方法5.过抽样和欠抽样,SMOTE算法第二课:申请评分卡中的数据预处理和特征衍生1.构建信用风险类型的特征2.特征的
分箱
分箱
的优点
美环花子若野
·
2023-04-20 15:15
基于Python的贷款逾期预测与信用评分卡建立
使用python实现10个特征变量的卡方
分箱
并得到对应
分箱
WOE
及VI值,根据特征重要
叉菌
·
2023-04-18 04:03
DeepFM 工程实现 tensorflow
先总结一下代码,后续再补上原理数据说明以一个二分类模型为例,特征全部是离散变量,连续变量都做了
分箱
离散化处理,预测用户是否会购买某一款商品,部分特征预览如下特征预览.png数据预处理对样本每一行进行转化
xiaogp
·
2023-04-15 20:38
用户贷款违约预测-Top1方案-单模0.9414
用户贷款违约预测-Top1方案-0.9414赛题描述特征工程分组统计
分箱
标准化归一化类别特征二阶组合模型搭建构建模型进行训练和预测赛题描述用户贷款违约预测,分类任务,label是响应变量。
Kilig*
·
2023-04-15 10:08
Python
机器学习
人工智能
如何使用 NodeDialog 在 NodeModel 中实现自己的算法
因此,输出是原始表,并为每个实例(即行)附加了
分箱
信息。该节点还需要一个对话框,因为用户应该能够确定bin的数量,并指定应该对值进行
分箱
的列。
总写bug的程序员
·
2023-04-13 06:37
knime
算法
java
【数据分析师-数据分析项目案例二】泰坦尼克号生还者预测案例
泰坦尼克号生还者预测案例1数据1.1数据下载1.2数据字段介绍2数据加载和基本的ETL2.1模块导入和数据加载2.2数据清洗2.2.1缺失值处理2.2.2分类数据独热编码和数值数据
分箱
3数据探索式分析3.1
百木从森
·
2023-04-12 05:36
数据分析师
python
机器学习
事故预测
分类
kaggle
2021-02-10 Xgboost超参调整
但考虑到对变量
分箱
方法影响效果,其次变量未必都是线性化(采用
WOE
替换可以消化),最后线性模型的上限未知。在决策树的升级版本Xgboost,在Kaggle比赛中曾经屡战奇功的模型工具提上议程。
春生阁
·
2023-04-12 02:37
Matplotlib和Seaborn之折线图
在散点图中,所有数据点都会绘制出来,而在折线图中,每个唯一x值或x值的
分箱
仅绘制一个点(就像直方图一样)。
IntoTheVoid
·
2023-04-11 05:22
python
分箱
分类代码_
分箱
统计,数据频率统计,数据分类
importpandasaspdscore_list=[63,67,73,84,88,97,70,85,68,96,95,60,83,70,77,86,83,94,100,82]print(score_list)bins=[50,70,90,100]res=pd.cut(score_list,bins)res1=pd.cut(score_list,bins,labels=["及格","中等","优
weixin_39551462
·
2023-04-09 01:27
python分箱分类代码
pd.cut和qcut
cut一般是进行等宽(距)
分箱
(离散化),qcut进行等频
分箱
cutpandas.cut(x,bins,right=True,labels=None,retbins=False,precision=3)
Python_QB
·
2023-04-09 01:24
pandas
使用pd.cut进行
分箱
操作
1.表格2.需求对表格中,a列下所有的数据进行
分箱
处理,使得每个箱子中出现的a的数值个数是一样的3.代码如下deftest():df=pd.DataFrame({'a':[1.0,1.29,1.59,1.9,2.2,2.5,2.7,3.4,4.0
dair6
·
2023-04-09 01:47
python相关问题
sql
数据库
database
Python 数据清洗:pd.cut()
分箱
统计
目的:对原始数据的商品金额进行区间划分,统计各个区间的订单数解决思路:
分箱
使用pd.cut()pd.cut(x,bins,right=True,labels=None,retbins=False,precision
bingbangx
·
2023-04-09 01:10
Python
大数据
大数据第一课(满分作业)——泰坦尼克号生存者预测(Titanic - Machine Learning from Disaster)
2数据获取3数据分析3.1数据字段分析3.2导入数据3.3数据清洗(预处理)3.3.1缺失值处理3.3.2分类数据独热编码和数值数据
分箱
3.4生存概率3.5性别与存
know634
·
2023-04-08 02:44
【Python】【机器学习】
python
scikit-learn
大数据
数据挖掘实验(二)数据预处理【等深
分箱
与等宽
分箱
】
文章目录一、
分箱
平滑的原理二、Matlab代码实现1.等深
分箱
代码运行结果2.等宽
分箱
代码运行结果一、
分箱
平滑的原理(1)
分箱
方法在
分箱
前,一定要先排序数据,再将它们分到等深(等宽)的箱中。
nefu-ljw
·
2023-04-06 14:01
数据挖掘/机器学习
从零开始学Matlab
数据挖掘
数据预处理
分箱
matlab
(三) 数据预处理
数据质量:准确性,完整性,时效性,一致性,可信性,可解释性数据清理:填写缺失值,光滑噪声数据,识别或删除离群点1,缺失值image.png2,光滑2.1,
分箱
image.png2.2,回归2.3,离群点分析
奇点_wu123
·
2023-04-06 10:24
(转)逻辑回归中常用的概念:
WOE
、IV详解
为了挑选并构造出对目标变量有较高预测力的自变量,需要对变量进行
WOE
编码,通过IV值的看变量的贡献。
达微
·
2023-04-06 06:11
Pandas数据分析-数据整理data wrangling, since 2022-05-16
(2022.05.16Mon)数据
分箱
分箱
指的是将连续值转化为离散值的过程,Pandas指令有cut,qcut,value_count和between,用于将连续数据转换为离散数据。
Mc杰夫
·
2023-03-31 10:04
Pandas
分箱
离散化方法:qcut()和cut()的用法
当q为整数时,代表
分箱
数。labels接收array型或False型数据,默认取值为None.这个参数需要和retbins参数一起使用。当labels=False时,只返回
分箱
的索引。
Sun_Sherry
·
2023-03-29 19:35
Python
47_Pandas使用cut和qcut函数进行
分箱
处理
47_Pandas使用cut和qcut函数进行
分箱
处理
分箱
处理(binDivision)是将连续值除以任意边界值,将其划分为类别,再将其转换为离散值的处理。它通常作为机器学习的预处理完成。
饺子大人
·
2023-03-29 19:25
Pandas
python
pandas
数据挖掘
机器学习
人工智能
自学DAMA-DMBOK2之对Zachman企业架构框架的解读分享
最近在学习DAMA数据管理知识体系指南这本书,现在学习到第四章数据架构的内容,在阅读过程中发现书中有些翻译还是比较难以理解的,比如对于Zachman企业架构框架的理解,下面就把我的个人理解与大家进行
分箱
zzong2020
·
2023-03-29 04:33
大数据
架构
卡方检验
今天我们公司的一个做数据的女孩子问我卡方检验问题,女孩子的问题不管怎么样都要回答的,也帮他解决了,虽然这是一个简单的统计方法,正好我最近打算梳理一下用LR做评分卡
WOE
那部分就把卡方检验梳理一下。
智能互连
·
2023-03-26 21:06
机器学习中的特征工程(三)---- 序数和类别特征处理方法
主要包含LabelEncoder、One-Hot编码、DummyCoding、FeatureHasher以及要重点介绍的
WOE
编码。序数特征处理序数特征指的是有序但无尺度的特征。
HaloZhang
·
2023-03-24 11:38
python Matplotlib库基础
数据可视化入门Pyplot绘图自定义配置文件rcParams创建绘图窗口绘制子图绘制饼图绘制折线图绘制条形图绘制散点图绘制热点图绘制箱型图绘制分类图背景显示绘图窗口DataFrame绘图堆叠柱状图面积图六边形
分箱
图附录
波啵菠波
·
2023-03-24 01:01
Python
可视化
python
可视化
数据可视化
matplotlib
2020-02-22乌比冈湖效应(Lake Wobegon Effect)
woebegone是美国幽默作家盖瑞森·凯勒虚构的草原小镇,说这个小镇上所有人的水平都比平均水平更好,英文
Woe
译为很惨的样子,begone是烦恼都烟消云散。
芡实
·
2023-03-20 06:07
第二十四周杂记
周四工作遇到一件不顺的事儿,因为船名改变,漏看了一票的
分箱
计划。心情有点儿紧张,好像刚工作时的低压心情又回来了。毕竟也经过这么多年锻炼,应对措施还有
urna
·
2023-03-18 08:16
第二十六周杂记
周一火车上接到同事电话,有票货做漏了
分箱
,导致费用产生。心情立马跌倒低谷。周二一整天心情起起伏伏,出了一件事故,要折腾好几天。吃到了闻名已久的锦州烧烤,略咸。炒方便面很好吃。
urna
·
2023-03-16 22:51
【数据挖掘】数据变换与离散化讲解与实战(超详细 附源码)
常用的数据平滑方法有
分箱
、回归和聚类等方法2.属性构造属性构造是通过由给定的属性构造新的属性并添加到属性集中,以帮助
showswoller
·
2023-03-16 20:07
数据挖掘
数据挖掘
人工智能
python
数据分析
谈谈
WOE
和IV
谈谈
WOE
和IV[
WOE
]weightofevidence,即证据权重;[IV]informationvalue,即信息价值。WOEWOE是对原始自变量的一种编码形式。
Bigvan
·
2023-03-16 07:26
信也科技面试—— 风控模型
使用LR模型的话是否会做变量
分箱
或者其他预处理?我:不推荐对连续变量做
分箱
,该操作并不能提高模型性能,反而
米老鼠他姘头
·
2023-03-12 17:02
风控建模之
woe
分箱
一、自动
分箱
-粗
分箱
方法介绍约定初始化
分箱
的个数为10。定义:,代表箱子。
woe
的含义是什么呢?我们可以想一下,假如不对变量进行
分箱
,即只有一箱,那么该箱的
woe
值是多少呢?答案是。
7NIC7
·
2023-03-12 03:44
Lending Club贷款不良率单因子
WOE
/IV分析
参考信用评分卡模型,对风险因素的量化分析可以采用
WOE
(WeightofEvidence)和IV(InformationValue)评价。
马骋
·
2023-03-10 23:39
【精通特征工程】学习笔记(四)
【精通特征工程】学习笔记Day4&2.22&D5章&P65-81页5、分类变量:自动化时代的数据计数分类变量是用来表示类别或标记的,又称为无序变量大型分类变量,
分箱
计数5.1分类变量的编码分类变量中的类别通常不是数值型的
小小孩儿的碎碎念
·
2023-03-09 16:54
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他