E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
离散化
最核心的特征工程方法-分箱算法
假设数据的分箱逻辑是大于50为0,小于50为1,那么最终数据会变成1,1,0,1,0,数据就
离散化
了。当然分箱有很多方式,大致作用就是把连续数据按照一定的规则
离散化
。
李博Garvin
·
2019-03-22 16:00
机器学习
【Atcoder】AGC019 B-F简要题解
所有在起终点之间按
离散化
后的xxx值为下标,求解LIS。当每行或者每列都有障碍且构成一整个LIS时,不得不走一个半圆环。*D.Sh
ccosi
·
2019-03-21 19:44
妙
计数DP
概率与期望
atcoder
推荐算法(三)基于标签的算法--CTR预估
3、在排序ranking场景下,评估指标经常是AUC4时间预处理:映射为不同的时间段5、如果某一列的类别太多,(1)先做聚类;(2)
离散化
ElsaRememberAllBug
·
2019-03-20 15:26
python
推荐
逻辑回归1_殊途同归的推导——极大似然概率和最小损失函数,以及正则化简介
殊途同归的推导——极大似然概率和最小损失函数,以及正则化简介2018.12.042不要只是掉包侠——手把手实现logistics算法3善用现有轮子——sklearn中的logistics如何调参4连续特征
离散化
冬瓜_HY
·
2019-03-20 14:28
树状数组 模板3 求逆序对(非
离散化
)
离散化
的树状数组:https://blog.csdn.net/A_Pathfinder/article/details/88042960这里就提一下和普通树状数组的区别,这里是用要查询的数当作下标,而普通树状数组是直接顺序下标放值
A_Pathfinder
·
2019-03-18 16:25
模板
树形结构
逻辑回归为什么要对特征进行
离散化
逻辑回归属于广义线性模型,表达能力有限,单变量
离散化
为N个后,每个变量有单独的权重,相当于为模型引入了非线性,,能够提高模型表达力,加大拟合,离散特征的增加和减少都很容易,易于模型的快速迭代;(2)速度快
凯旋的皇阿玛
·
2019-03-18 14:12
机器学习面试题
大数据之数据预处理
1.数据处理的主要操作2.
离散化
与连续化3.特征提取与构造4.数据选择与构造5.缺失值的处理6.多重共线性和内生性1.数据处理的主要操作映射与收集数据:我们获得数据后需要对数据的每一列都定义属性,这样才方便我们接下来的数据处理
顾鹏pen
·
2019-03-17 20:00
Codeforces Round #545 (Div. 2) C. Skyscrapers
题解题目大意,n*m矩阵每个位置作为一个独立的询问,问将当前行和列的数值拼在一起
离散化
为1~x的数值,要求x最小,最后输出每个位置的x。
CaprYang
·
2019-03-15 11:36
_数据结构_
Codeforces
一篇文章搞懂扫描线算法(线段树) HDU1542
离散化
操作目标首先这个扫描线算法解决的是什么问题?
Mr. Water
·
2019-03-13 00:23
算法
P3114 [USACO15JAN]踩踏Stampede
害我调好久,还以为样例错了对于每头奶牛,我们求出它经过\(y\)轴的时间段,然后
离散化
一下,将奶牛按照从低到高的顺序排序,区间上记录最新经过的奶牛,如果当前奶牛的区间都已经被覆盖过了,那么说明完全被遮挡
子谦。
·
2019-03-12 10:00
pandas - 数据
离散化
学习目标应用cut、qcut实现数据的区间分组应用get_dummies实现数据的哑变量矩阵应用:找出股票的涨跌幅异动(异常)值1为什么要
离散化
(了解)连续属性
离散化
的目的是为了简化数据结构,数据
离散化
技术可以用来减少给定连续属性值的个数
梦因you而美
·
2019-03-12 08:35
数据挖掘
数据离散化
pandas
cut
qcut
value_counts
get_dummies
AI学习---特征工程【特征抽取、特征预处理、特征降维】
帮助我们使得算法性能更好发挥性能而已sklearn主要用于特征工程pandas主要用于数据清洗、数据处理特征工程包含如下3个内容:1、特征抽取/特征提取|__>字典特征抽取,应用DiceVectorizer实现对类别特征进行数值化、
离散化
小a玖拾柒
·
2019-03-08 21:00
IV值计算及分箱
1.离散的优势:(1)
离散化
后的特征对异常数据有很强的鲁棒性:比如一个特征是年龄>30是1,否则0。
Baron_ND
·
2019-03-08 13:30
数据挖掘
Python
属性(特征)
离散化
的方法
前面转载了一篇博文,这里自己再进行一下补充和梳理属性(特征)
离散化
是指设置若干离散的划分点,将属性的取值化为一个个区间,再用离散值表示,一般取整数表示,为了计算机的识别常用的
离散化
的方法一、非监督方法1
Laurel1115
·
2019-03-07 18:18
数据挖掘/机器学习算法原理
数据挖掘/机器学习领域中连续,离散,连续化,
离散化
到底是什么含义
那么数据挖掘、机器学习中用于描述属性(特征)的”连续“,”离散“,”连续化“,”
离散化
“的这几个词到底是什么含义呢?
Laurel1115
·
2019-03-07 17:18
数据挖掘/机器学习算法原理
hdu6447 YJJ's Salesman(线段树/树状数组+背包+
离散化
)
题目(0,0)到(1e9,1e9)的网格上有若干个点,点(xi,yi)有一个权值vi,网格点数n#include#include#include#includeusingnamespacestd;typedeflonglongll;constintmaxn=5e5+10;constintmaxm=1e5+10;intt;intn,X[maxm];intdat[maxn],res;mapid;str
Code92007
·
2019-03-05 22:50
线段树(权值线段树)/树状数组
逻辑回归实践总结三
一、为什么对某些特征进行
离散化
?有些特征虽然也是数值型,但是其值相加减是没有意义的,也需要转换成离散型。
delltower
·
2019-03-04 21:07
lr
逻辑回归实践总结三
一、为什么对某些特征进行
离散化
?有些特征虽然也是数值型,但是其值相加减是没有意义的,也需要转换成离散型。
delltower
·
2019-03-04 21:07
lr
特征编码one-hot与dummy的区别与联系
在模型的训练过程中,我们会对数据集的连续特征进行
离散化
操作,如使用简单的LR模型,然后对
离散化
后的特征进行one-hot编码或哑变量编码。这样通常会使得我们模型具有较强的非线性能力。
Rachel_nana
·
2019-03-03 12:43
python
POJ 1752 Advertisement (
离散化
+差分约束)
AdvertisementTimeLimit:1000MSMemoryLimit:10000KTotalSubmissions:1086Accepted:403SpecialJudgeDescriptionTheDepartmentofRecreationhasdecidedthatitmustbemoreprofitable,anditwantstoselladvertisingspacealo
LSD20164388
·
2019-03-02 09:14
图论
林欣浩《数学有意思》
第一讲离散与抽象“离散”即“
离散化
”(discretization),把连续形式的数学问题转化成离散形式的过程。“抽象”即“抽象化”
linda2021
·
2019-02-28 18:07
SSD - Single Shot MultiBox Detector 论文解读
arxiv.org/pdf/1512.02325.pdfgithub:https://github.com/balancap/SSD-Tensorflow文章基本思路:SSD的基本思路是将目标检测的Bbox的输出空间
离散化
为多个不同尺度的
JerryZhang__
·
2019-02-25 22:26
Object
Detection
2019-02-22 连续特征的
离散化
:在什么情况下将连续的特征
离散化
之后可以获得更好的效果?
www.zhihu.com/question/31989952/answer/541845822.https://blog.csdn.net/u010358304/article/details/80693541连续特征
离散化
的基本假设
做一只乐观的小猴子
·
2019-02-25 14:21
离散化
+dfs+连通块计数 HDU 5925 Coconuts
Describe多组测试t输入一个map大小X*Y,map中有n个障碍点,输入n个障碍点的坐标,问map有几个连通块Solution如果地图不大完全可以dfs/bfs去做,但是X,Y【1,1e9】就需要进行
离散化
可见障碍点
Df_cjc
·
2019-02-21 18:54
算法思想
1.5特征(feature)
连续变量的
离散化
,包括:Bina
Fortuna_i
·
2019-02-14 20:07
Spark
Spark从入门到精通9 -- Spark Streaming
SparkStreaming使用
离散化
流(discretizedstream)作为抽象表示,叫做DStream。类似于Spark中的RDD,用于存储实时流数据。
开着小马奔腾哟
·
2019-02-14 11:51
大数据
hdu1565 方格取数(1) (状压dp入门)
题目题解先预处理所有合法状态(不相邻的)再预处理所有合法状态的sum值然后枚举上一行向下一行的转移其实自己的代码dp[i][state[j]]可以开成dp[i][j]以缩小空间,毕竟是
离散化
过的j,n=
Code92007
·
2019-02-12 15:56
状压dp
主席树(知识学习+板子总结)
新来的值只会新开一条链,对于第一棵树而言,即普通的权值线段树,或者理解成一条链也无妨结构体的权值线段树写法利用前缀和的方法统计[l,r]内各个数出现的数量前提保证a1-an均在1-n之间如果不在1-n之间就
离散化
一下搞成
Code92007
·
2019-02-04 16:22
知识点总结
主席树(知识学习+板子总结)
新来的值只会新开一条链,对于第一棵树而言,即普通的权值线段树,或者理解成一条链也无妨结构体的权值线段树写法利用前缀和的方法统计[l,r]内各个数出现的数量前提保证a1-an均在1-n之间如果不在1-n之间就
离散化
一下搞成
Code92007
·
2019-02-04 16:22
知识点总结
ApacheCN 数据科学/人工智能/机器学习知识树 2019.2
合作or侵权,请联系【fonttian】|请抄送一份到预处理
离散化
等值分箱等量分箱独热one-hot标准化最小最大m
飞龙
·
2019-02-04 00:00
tensorflow
python
数据科学
机器学习
人工智能
自然语言理解过程的人工智能模型猜想
有一个物体,出现在我们的眼睛前面,我们的视觉系统读取这个物体之后,把这个物体的信息分解为一个个的碎片然后
离散化
,分布式存储在神经网络中,这个过程好像我们吃一个食物,要用牙齿把食物嚼碎吞下,然后消化的的模式那么
comsci
·
2019-01-31 16:29
人工智能思考
python数据分析与挖掘(二十二)--- Pandas高级处理-数据
离散化
4.7高级处理-数据
离散化
学习目标目标应用cut、qcut实现数据的区间分组应用get_dummies实现数据的one-hot编码应用找出股票的涨跌幅异动(异常)值内容预览4.7.1什么是数据的
离散化
4.7.2
python爬虫人工智能大数据
·
2019-01-28 21:42
python
数据分析
python
数据分析
线性探查法(
离散化
建图+拓扑排序)
先呈上原题链接题意:在大学里选修过数据结构的同学大部分都知道hashhashhash算法的线性探查法:假设有一个元素互不相同的正整数数组a[1…n]a[1\ldotsn]a[1…n],我们用以下方法得到数组b[1…n]b[1\ldotsn]b[1…n]:初始时b[i]b[i]b[i]都为−1-1−1,我们对i=1…ni=1\ldotsni=1…n依次插入a[i]a[i]a[i],假设现在要插入的数
BNUbeginner
·
2019-01-26 19:12
图论
CCPC-Wannafly Winter Camp Day5 E.Fast Kronecker Transform(
离散化
+NTT)
题目思路来源dls题解先
离散化
,把a和b搞进一个序列,然后排序去重,把a和b赋为rank值然后遍历这个不重复的序列,两个大于1W就建2e5数列用NTT搞,否则直接暴力既然要在ai和bj值相同,下标i+j
Code92007
·
2019-01-25 19:40
FFT/NTT/FWT/FMT
Python matplotlib,数据可视化,绘制直方图,hist
直方图一般对连续型数据根据区间进行
离散化
,然后统计各个区间上的频率或频数。
houyanhua1
·
2019-01-23 18:06
Python+
用python3从零开始开发一款烧脑射击游戏#2
小方块在屏幕上的相对位置发生了变化,那就代表它移动了与连续的现实世界不同的是,计算机内部的世界是
离散化
的,我们其实并没有真的去移动初始的小方块而是在屏幕上不断的擦去旧的小方块,画出新位置上的小方块,玩家看起来就像它在移
李相赫的乐芙兰
·
2019-01-22 20:07
pandas数据规整化:清理,转换,合并,重塑
重塑合并数据集pandas.mergepandas.concatpandas.combine_first重塑和轴转向旋转stack和unstackpivot数据转换移除重复数据函数或映射处理数据替换值重命名轴索引
离散化
和面元划分检查和过滤异常值排列和随机采样哑变量字符串操作
zk仔的博客
·
2019-01-18 11:21
python_数据分析
4.pandas数据预处理(完)(数据清洗:重复值、异常值、缺失值;标准化、哑变量、
离散化
、无监督分箱)
笔记说明:本文是我的学习笔记,大部分内容整理自黄红梅,张良均等.Python数据分析与应用[M].北京:人民邮电出版社,2018:133-163.还有部分片断知识来自网络搜索补充。目录0.数据来源0.1说明1.清洗数据1.1检测与处理重复值1.1.1记录重复1.1.2特征重复1.2检测与处理缺失值1.2.1删除法1.2.2替换法1.2.3插值法1.3检测与处理异常值1.3.1正态分布的3σ原则1.
贫僧不懂
·
2019-01-14 17:35
python数据分析与应用
离散化
+树状数组
#includeusingnamespacestd;structnode{intval,pos;}a[10];intn,b[10],sum[103];boolcmp(nodea,nodeb){returna.val0){rec+=sum[pos];pos-=pos&(-pos);}returnrec;}intmain(){cin>>n;for(inti=1;i>a[i].val;a[i].pos=
_Jim_
·
2019-01-05 10:44
ACM笔记-5代数
【[NOI2016]区间】
发现自己的
离散化
姿势一直有问题今天终于掌握了正确的姿势虽然这并不能阻挡我noip退役爆零的历史进程还是先来看看
离散化
怎么写吧,我以前都是这么写的for(std::set::iteratorit=s.begin
asuldb
·
2019-01-01 21:00
【树状数组】【BJOI2016】回转寿司
题目告诉我们要求连续区间价值大于等于l,小于等于r的数量,我们考虑使用前缀和维护以sum[i]为结尾的符合条件的区间数量即sum[i]-r至sum[i]-l这段区间中所包含的前面的前缀和的数量我们考虑使用数组
离散化
维护不把
Dy_Dream
·
2018-12-30 12:47
数据结构
树状数组
滴滴KDD2018:强化学习派单
原文链接:https://segmentfault.com/a/1190000017558635白话解读离线learning部分本质上是将任意时刻任意空间位置
离散化
为时空网格,根据派单记录(含参加调度但无单的司机
weixin_33795093
·
2018-12-29 01:09
滴滴KDD2018:强化学习派单
白话解读离线learning部分本质上是将任意时刻任意空间位置
离散化
为时空网格,根据派单记录(含参加调度但无单的司机)计算该时空网格到当天结束时刻的预期收入。关键问题:怎么计算预期收入?
丹追兵
·
2018-12-29 00:00
lbs
Python:数据
离散化
- 等宽及等频
在处理数据时,我们往往需要将连续性变量进行
离散化
,最常用的方式便是等宽
离散化
,等频
离散化
,在此处我们讨论
离散化
的概念,只给出在python中的实现以供参考1.等宽
离散化
使用pandas中的cut()函数进行划分
冰糖炖冰糖
·
2018-12-22 17:20
Python
Python
数据离散化
POJ 2528 Mayor's posters (线段树+
离散化
+区间覆盖)
题意:n(n#include#includeusingnamespacestd;constintmaxn=10005;intvis[maxn>1;if(m>=L){update(L,R,C,l,m,rt>1;query(l,m,rt1){lsh[mm++]=lsh[i-1]+1;}}sort(lsh,lsh+mm);for(inti=0;i
Dilly__dally
·
2018-12-12 20:24
线段树
【机器学习】面试大题
5.ML项目流程6.LR为什么要对特征
离散化
?7.怎么防止过拟合?8.L
two_star
·
2018-12-05 11:34
机器学习
机器学习
Python-多目标图像分割和中心计算
在图像处理中高斯滤波一般有两种实现方式:一种是用
离散化
窗口滑窗卷积,另一种是通过傅里叶变换。最常见的就是第一种滑窗实现,只有当
离散化
的窗口非常大,用滑窗计算量非常
Leemboy
·
2018-12-01 22:56
湍流模型小小总结(RANS)
CFD的本质收现金是将流场区域
离散化
,即所谓的画网格,认为网格内的流场变量是均匀的,因此任何比流场网格尺寸还小的流场结构是无法模拟出来的。DNS在工程中为啥不行?
唉那个什么
·
2018-11-30 17:26
概率机器人(Probabilistic Robotics)笔记 Chapter 8: 栅格定位与蒙特卡洛定位(Grid and Monte Carlo Localization)
如果划分粗糙,则
离散化
时信息丢失会影响滤波器表现。第二个算法叫蒙特卡洛定位(MCL)算法,也
DaqianC
·
2018-11-13 00:06
概率机器人笔记
概率机器人(Probabilistic Robotics)笔记 Chapter 8: 栅格定位与蒙特卡洛定位(Grid and Monte Carlo Localization)
如果划分粗糙,则
离散化
时信息丢失会影响滤波器表现。第二个算法叫蒙特卡洛定位(MCL)算法,也
DaqianC
·
2018-11-13 00:06
概率机器人笔记
上一页
47
48
49
50
51
52
53
54
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他