E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
样本容量
【十三】景区人流量统计:python日志生成+logstash+kafka+storm+mysql+springBoot+高德地图
2.手机移动网络信令:移动通信信令(数据
样本容量
大,覆盖范围广,数据稳定可靠)对信令信息的相应字段进行分析、挖掘、并结合GIS技术实现自定义区域实时人流量的智能化统
jy02268879
·
2018-08-01 23:23
mysql
python3
storm
zookeeper
logstash
kafka
Storm
【机器学习】机器学习常见符号
机器学习常见符号符号名称符号名称R实数集Rnn维实数向量空间H希尔伯特空间X输入空间Y输出空间x∈X输入,实例y∈Y输出,标记X输入随机变量Y输出随机变量T={(x1,y1),(x2,y2),···,(xN,yN)}训练数据集N
样本容量
ChenVast
·
2018-07-31 17:34
Machine
Learning
机器学习算法理论与实战
【机器学习】机器学习常见符号
机器学习常见符号符号名称符号名称R实数集Rnn维实数向量空间H希尔伯特空间X输入空间Y输出空间x∈X输入,实例y∈Y输出,标记X输入随机变量Y输出随机变量T={(x1,y1),(x2,y2),···,(xN,yN)}训练数据集N
样本容量
ChenVast
·
2018-07-31 17:34
Machine
Learning
机器学习算法理论与实战
2.应用于线性回归中的梯度下降方法
(1)线性回归①hypothesis:θi:模型参数②线性回归(单变量)所构函数:m:训练集
样本容量
;h(x(i)):预测值;y(i):真实值。
revere-wei
·
2018-06-30 11:56
Machine
Learning
机器学习(一)基础常用损失函数、评价指标、距离、指标
机器学习(一)1.基础1.1数据集划分方式留出法按正负例比例划分数据集,多次训练模型取平均交叉验证k折交叉验证形成k个数据集,每次取其中的1k1k作为验证集Bootstrapping每次从
样本容量
为D的集合重复的取元素
Dynomite
·
2018-06-27 15:16
机器学习
机器学习(一)基础常用损失函数、评价指标、距离、指标
机器学习(一)1.基础1.1数据集划分方式留出法按正负例比例划分数据集,多次训练模型取平均交叉验证k折交叉验证形成k个数据集,每次取其中的1k1k作为验证集Bootstrapping每次从
样本容量
为D的集合重复的取元素
Dynomite
·
2018-06-27 15:16
机器学习
统计学中几种简单的检验方式
(1)单总体检验是检验一个样本的平均数与一个已知的总体平均数的差异是否显著,当总体分布是正态分布,如总体标准差未知且
样本容量
cuitzjd
·
2018-06-21 09:15
统计学
岭回归,Lasso回归和弹性网回归理论及特点
线性回归模型 线性回归是回归分析中最基本的一类回归问题,对于一般的线性回归模型来说,假设预测变量的个数为pp,
样本容量
为NN,则:{yi=β0+β1xi1+⋯+βpxip+ϵiϵi∼N(0,σ2),i=
知道不_zkl
·
2018-05-25 10:40
机器学习
样本容量
的确定
•
样本容量
:样本中个体的数目或组成抽样总体的单位数。•必要
样本容量
:亦称必要样本单位数,是指满足调查目的要求的情况下,至少需要选择的样本单位数。
Rosa_zz
·
2018-03-15 08:29
工具使用
机器学习笔记之R语言基础5(T,F检验)
–当总体分布是正态分布,如总体标准差未知且
样本容量
小于30,那么样本平均数与总体平均数的离差统计量呈t分布。
鲁鲁酱1996
·
2017-11-17 22:19
机器学习之R语言基础
Keras 学习心得
基础知识batch_size:Keras常用mini-batch更新权重方式,既可以克服SGD(随机梯度下降)的陷入局部最优情况,也可以解决批梯度(每轮均把所有样本遍历一次)的
样本容量
过大问题。
manbabe
·
2017-11-17 16:24
Keras
统计学
这里之所以选择t检验而不是z检验,是因为符合两个条件:总体标准偏差未知
样本容量
小于30,本次实验对象为24人可参考以下判断流程图:要求样本来自近似正态分布的总体,是t检验的一个假设前提。
lianzhanshu
·
2017-11-17 10:19
斯皮尔曼等级相关(Spearman Rank Correlation)
斯皮尔曼等级相关对数据条件的要求没有积差相关系数严格,只要两个变量的观测值是成对的等级评定资料,或者是由连续变量观测资料转化得到的等级资料,不论两个变量的总体分布形态、
样本容量
的大小如何,都可以用斯皮尔曼等级相关来进行研究
贾公子
·
2017-11-02 17:27
spark
R语言程序
######验证:无论随机变量原来服从哪种分布,只要
样本容量
足够大,#########其均数都会服从正态分布###1.正态分布####a<-rnorm(10000,0,1)#生成一个数据量很大的正态分布的数据
寂岚峰
·
2017-10-02 22:35
R语言
期望与概率
对于离散的事件A1,A2,A3...An,则定义其期望为P(A)×A,这里可以推出,若概率为P(A),设此概率为pq,则不妨设
样本容量
为q,则其发生次数为p,从而其期望为A×pq,若其样本为等地位的,则其期望中
Demon_Rieman
·
2017-09-15 20:12
期望与概率dp
R随机抽样
随机抽样1.有放回抽样与无放回抽样#x为总体向量n为
样本容量
#replace=F表示无放回抽样replace=T表示放回抽样#prob可以设置不等概率抽样#sample(x,n,replace=F,prob
没想好呢111
·
2017-08-10 13:58
R
如何打乱训练样本和测试样本的顺序
在matlab下进行操作的步骤如下:(训练
样本容量
为1500)第一步,产生一个随机数组,数组是1到1500的随机数第二步,对原始数据进行行移动第三步,得到新产生的随机数据如上图所示,数据格式是1710*
wind_wind123
·
2017-07-18 12:07
深度学习
300人告诉你到底要不要买平价精华之王芭乐雅Balea
究其原因就是你参考的评论
样本容量
太少了!个别评论导致了你的错误判断!
pinkpinksummer
·
2017-06-05 17:21
集成学习以及分类样本不均衡问题
常见做法如下所示:1)加入数据样本扰动:例如bagging算法的输入样本重采样(有放回的采样出与原始
样本容量
相同的新
LY_ysys629
·
2017-06-02 20:22
机器学习
概率论基础
样本容量
:样本中个体的数目。样本空间:也称事件空间,随机事件E的所有基本结果组成的集合为E的样本空间。样本空间的元素称为样本点或基本事件。例如:设[随机试验]E为“抛一颗骰子,观察出现的点数”。
嘿_顾小白
·
2017-05-30 21:28
应用统计学与R语言实现学习笔记(五)——参数估计
Chapter5Estimation1.参数估计的一般问题2.区间估计ConfidenceIntervals3.
样本容量
的确定1.参数估计的一般问题正如前面介绍的,统计学的两大分支,分别是描述统计和推断统计
胖胖雕
·
2017-05-07 23:20
R语言
统计学
#MOOC#优达学城(Udacity)描述统计学入门课程结课
这门课程讲了这些内容:统计研究方法基本统计概念:平均值、中位数、众数、样本、总体、标准偏差、标准误差、方差、
样本容量
、正态分布、Z-Score、极差、异常值等等……计算简单的概率利用柱状图、直方图、线形图等可视化方法探索数据调查分布情况和特定
Larus
·
2017-03-27 00:43
jdk版本要不要升级的探讨
为什么很多Java程序员都不愿意升级到最新的jdk1.答主先去把统计学好,
样本容量
10也能得出很多这样的结论?
xingguang666
·
2017-03-11 16:16
oracle
method
interface
编程类
SPSS——均 值 检 验 (Compare Means)——单一样本T检验
置信区间正态总体、方差未知、小样本情况下如果总体服从正态分布,无论
样本容量
大小,样本均值的抽样分布都服从正态分布。
liuyuan_jq
·
2016-07-08 21:00
spss
均值检验
单一样本T检验
Coursera机器学习-第十周-Large Scale Machine Learning
下面是一个区分混淆词组的例子:但是,大数据存在一个问题,当
样本容量
m=1,000时还行,但是当m=100,000,000呢?请看一下梯度下降的更新公式:计算一个
豆芽炒粉丝
·
2016-06-23 15:21
机器学习
计算学习理论笔记
未考虑模型的泛化能力假设不存在噪声干扰DNF是可学习的,但是k-DNF却不是严格的一致性将导致过拟合PAC研究batchmodel情景,模型假设为:训练数据和测试数据独立同分布数据有标签基本的问题为:-得到符合要求的假设需要的
样本容量
foolsnowman
·
2016-05-08 23:00
PAC
VC维
出错边界
计算学习理论
机器学习算法---kNN算法
缺点:1.当
样本容量
不平衡是,输入有个新样本,该样本的K个邻值中大容量样本占多数,对分类不利;2.计算量过大,需要计算待分类文本到每个样本的距离。改进办法:1.实现对样本属
chinwuforwork
·
2016-05-06 18:45
机器学习
Python学习-机器学习实战-ch06 支持向量机
当
样本容量
很大时,这些方法往往变得非常低效。本章还涉及支持向量机的最优化求解方法。==============================================
从兮
·
2016-04-25 00:00
python学习
效应大小:effect size(ES)
ES是衡量处理效应大小的指标,与显著性检验不同,这些指标是不受
样本容量
影响的。它表示不同处理下的总体均值之间差异的大小,可以在不同研究之间进行比较。
Honglei_Ren
·
2016-04-13 15:31
SparkML之假设性检验(一)
假设检验有以下三种:2、Z检验(已知,μ未知)Z检验是一般用于大样本(即
样本容量
大于30)标准正态分布的平均值差异
legotime
·
2016-04-10 16:00
spark
Matrix
机器学习算法 原理、实现与实战——模型评估与模型选择
X),训练误差是模型Y=f^(X)Y=f^(X)关于训练数据集的平均损失:Remp(f^)=1N∑i=1NL(yi,f^(xi))Remp(f^)=1N∑i=1NL(yi,f^(xi))其中NN是训练
样本容量
a6225301
·
2016-04-09 19:00
大数据和统计的区别
一般统计方法中依据的中值定理和大数定律阐明我们可以通过增大
样本容量
,且多次抽取样本使得结果更加
lifuxiangcaohui
·
2016-04-07 14:00
错题记录(1)-数理统计(含概率)
1、假设出现正面的次数是X,则X服从二项分布,二项分布的方差是np(1-p);同样可信度的置信区间的长度随着
样本容量
n的增加而减少;2、相关系数ρXY取值在-1到1之间,ρXY=0时,称X,Y不相关;|
qjc937044867
·
2016-04-02 16:00
机器学习算法---kNN算法
缺点:1.当
样本容量
不平衡是,输入有个新样本,该样本的K个邻值中大容量样本占多数,对分类不利;2.计算量过大,需要计算待分类文本到每个样本的距离。改进办法:1.实现对样本属
chinwuforwork
·
2016-03-29 20:53
算法
python
机器学习
常见假设检验类型对比
下面各用一句话总结常用的几种假设检验的适应情况,方便查验:Ttest小样本量(
样本容量
小于30)时用以比较两个平均值的差异是否显著Ztest大样本量(
样本容量
大于30)时用以比较两个平均值的差异是否显著卡方检验用以检验实验观测值与理论推断值是否一直
zbc1090549839
·
2016-02-26 20:00
数据
统计检验
机器学习-KNN 算法
K-NearestNeighbour 一、主要目的 在样本空间中,找到与待估计的样本最临近的K个邻居,用这几个邻居的类别来估计待测样本的类别二、适用性
样本容量
比较大的类域的自动分类
anualday
·
2015-12-10 12:00
什么是T检验(T Test)
什么是T检验 T检验 T检验是用于小样本(
样本容量
小于30)的两个平均值差异程度的检验方法。它是用T分布理论来推断差异发生的概率,从而判定两个平均数的差异是否显著。
·
2015-11-13 13:21
test
rank sum test 秩和检验
后来曼—惠特尼将其应用到两
样本容量
不等(n1不等于n2)的情况,因而又称为曼—惠特尼U检验。这种方法主要用于比较两个独立样本的差异。
·
2015-11-02 13:18
test
完成动态根据类别动态填充区域颜色
主要思想: 1.输出区域ID及其特征(颜色、纹理、形状等); 2.人机交互选择样本,为了方便起见,X个地物均选择Y个样本,总共是X*Y个
样本容量
; 3.建立分类器对所有区域进行类别标定。
·
2015-10-30 10:24
动态
JMeter性能测试基础 (2) - 变量的使用
在使用JMeter进行性能测试时,一般情况下要保证
样本容量
尽可能大,这样才能得到一个比较合理的结果。
T.//王大胖
·
2015-09-07 21:00
李航统计学习方法笔记1 统计学习方法概论
当
样本容量
小时,经验风险最小化会产生过拟合
helh522
·
2015-03-16 10:14
机器学习:k-近邻算法
但是,k-近邻算法在分类时有个主要的不足:当样本不平衡时,如一个类的
样本容量
很大,而其
巴别塔工人
·
2014-12-11 22:00
机器学习
机器学习:KNN算法(MATLAB实现)
(统计出现的频率)该算法比较适用于
样本容量
比较大的类域的自动分类,而那些
样本容量
较小的类域采用这种算法比较容易产生误分当K值较小时可能产生过拟合,因为训
wenyusuran
·
2014-06-27 17:00
k近邻法的实现:kd树
实现k近邻法时,主要考虑的问题是如何对训练数据进行快速k近邻搜索,尤其时在训练
样本容量
大或者特征空间维数高的情况下。k近邻最简单的实现方法是计算出输入实例与所有样本的距离,然后选择其中最近的k个。
冬浓
·
2014-05-23 11:49
机器学习(Machine
Learning)
SPSS-多重响应-频率和交叉表案例分析(问卷调查分析)
希望跟大家讨论一下SPSS-多重响应--频率和交叉表分析,希望大家能够多提点提点在云南电信网上营业厅做了一个关于“客户不使用电信3g业务的原因有哪些的问卷调查,问题所示:这份问卷调查总更有35人参与,
样本容量
偏少
·
2014-05-10 13:00
PS
使用R完成均值检验
单样本均值检验当
样本容量
小于30时使用t检验,当
样本容量
大于30时使用Z检验Z检验使用例子:library(UsingR) x<-rnorm(50,0,5) simple.z.test(x,5)运行结果
yucan1001
·
2014-04-13 15:00
数理统计知识回顾
2.点估计、区间估计3.假设检验4.单因素方差分析1基本概念样本、总体与统计量研究对象的全体称为总体,总体对应一个随机变量X和分布F(x)单个研究对象称为个体n个个体称为样本(X1,⋯,Xn),称n为
样本容量
一般地
yazhaolv
·
2013-12-02 12:00
R语言
数学建模
信息熵与信息增益的概念
(p(xi))(i=1,2,..n)=-∑p(xi)*log(p(xi))(i=1,2,..n)其中log的底数是2.公式的理解是:p(i)表示第i个变量出现的概率,则1/p(i)表示若p(i)发生的
样本容量
u011321908
·
2013-09-26 18:00
数据挖掘
信息论
用Twitter追踪世界情绪变化
现有的相关研究不是太过主观,就是
样本容量
太小,都无法证明结论的普遍性。但是Twitter的存在为研究者们提供了新的研究方法。
(author unknown) Demojiang
·
2011-10-09 12:00
twitter
世界
情绪
数据的收集,整理和描述
除了使用表格战士数据,还可以用条形图,扇形图来描述数据. 4:对所有成员调查叫做全面调查,全部成员叫做总体,总体有多个各个组成,抽样调查是从整体中抽出一部分成员,被抽取的那些个体组成一个样本,样本中个体的数目叫做
样本容量
pztx1992
·
2009-02-04 12:22
职场
数学
休闲
上一页
1
2
3
4
5
6
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他