电竞杰森斯坦森

7-统计学-推断统计分析

推断统计

是研究如何利用样本数据来推断总体特征的统计方法

从样本信息外推到总体，以最终获得对所感兴趣问题的解答

内容目录

统计学的几个概念
概率分布
抽样分布
参数估计
假设检验

统计学的几个概念

1 变量

1 分类变量

无序分类变量

说明事物类别的一个名称，如性别有男女两种，二者无大小之分，无顺序之分，还有如血型、民族等

有序分类变量

也是说明事物类型的一个名称，但是有次序之分，例如：满意度分为满意一般不满意，三者是有顺序的，但是无大小之分

2 数值型变量

连续型变量

取值范围是一个区间，它可以在该区间中连续取值，即连续型变量可以取到区间中的任意值，并且有度量单位。例如：身高、年龄、体重、金额

离散型变量

取值范围是有限个值或者一个数列构成的，表示分类情况，如：企业数量产品数量等

总结：

无序分类变量：无大小之分，无顺序之分，仅知道属于哪个类别

有序分类变量：无大小之分，但是有顺序之分，各个类别客户划分等级

连续型变量：有大小之分，一定区间范围内取值个数无法确定

离散变量：有小大之分，一定区间范围内取值个数是有限的，可数的。

2 概率

随机事件：随机现象某种可能的观察结果称为随机事件

概率：刻画随机事件发生可能性大小，取值介于0-1之间，是经过大量的重复的独立的实验而得出的结论。

小概率事件

在统计学中，如果随机事件发生的概率小于或等于0.05，则认为是一个小概率事件，表示该事件在大多数情况下不会发生，并且一般认为小概率事件在一次随机抽样中不会发生，这就是小概率原理。小概率原理是推断统计的基础。

经典案例：

瞎猫碰上死耗子

3 随机变量

随机事件的数量化

比如：还是抛硬币，出现正面，我们定义为“成功”，记为1，出现反面定义为“失败”，记为0,，那{0，1}就是本次实验的结果的量化值，为随机变量

离散型随机变量：随机变量X可以一一列举出来，在一定区间范围内X是有限个，可数的

例如抛硬币，X可取1或0

连续型随机变量：随机变量X无法一一列举，在一定区间范围内是无限个,

例如：统计北京市30岁以上男性身高，每个人的身高都不一样，测量单位一定的情况下，数据是连续的

4 总体和样本

总体：根据研究目的确定的所有个体某指标观察值（测量值）的集合

样本：在一个较大范围的研究对象中随机抽出一部分个体进行观察或预测，这些个体的测量值构成的集合称为样本。

大多数统计研究只能接触到样本，例如：灯泡检验是否合格只能通过样本

例：
任务
检验某批生产的所有灯泡是否达到合格率，某批生产的所有灯泡就是总体
随机从中抽取5%的灯泡进行检验，随机抽取的5%的灯泡就是样本

5 随机抽样

在抽样研究中，随机抽取一部分个体进行观察和测量的过程称为随机抽样

随机抽样的本质：每个个体最终是否入选在抽样进行前是不可知的，但是其入选的可能性是确切可知的（每个个体被抽到的概率是相等的）

注：随机≠随便

暗箱中有5个球，3个黄的，2个白的，1个红的，随机抽取其中一个

街头随机采访5个人，回答单身的原因【这种真的是随机吗】

6 总体参数和统计量

总体参数：刻画总体特征的指标称为总体参数，例如：总体均值（μ），总体标准差（σ）,总体比例（π）

统计量：刻画样本特征的指标称为统计量，例如：样本均值（x-bar），样本标准差（s），样本比例（p）

但是往往总体参数都是不可知的，我们经常会通过样本统计量去估算总体参数。

7 抽样误差

许多总体指标是未知的，需要用相应的样本统计量对其进行估计。由随机抽样造成的样本统计量与总体指标之间的差异称为抽样误差（sampling error）

虽然在一次抽样研究中的抽样误差大小是随机的，但是抽样误差在概率意义下有规律可循，这种规律称为抽样分布，后面会详细讲到。

概率分布

随机变量的概率存在一定的规律，这个规律叫做概率分布，但是离散型随机变量和连续型随机变量的规律并不相同，离散型随机变量的概率分布有：二项分布、泊松分布；连续型随机变量的概率分布：正态分布。

1 离散型随机变量的概率分布

二项分布

说到二项分布，不得不提一下他的前辈：伯努利分布

伯努利实验

在现实生活中，许多事件的结果往往只有两个。例如：抛硬币，正面朝上的结果只有两个：国徽或面值；检查某个产品的质量，其结果只有两个：合格或不合格；购买彩票，开奖后，这张彩票的结果只有两个：中奖或没中奖；拨打女朋友电话：接通或没接通。。。以上这些事件都可被称为伯努利试验

伯努利试验是单次随机试验，只有"成功（值为1）"或"失败（值为0）"这两种结果，是由瑞士科学家雅各布·伯努利(1654 - 1705)提出来的。

其概率分布称为伯努利分布(Bernoulli distribution)，也称为两点分布或者0-1分布，是最简单的离散型概率分布。我们记成功概率为p(0≤p≤1)，则失败概率为q=1-p，则概率：

而二项分布是指在只有两个结果的n次独立的伯努利试验中，所期望的结果出现次数的概率

在单次试验中，结果A出现的概率为p，结果B出现的概率为q，p+q=1。那么在n=10，即10次试验中，结果A出现0次、1次、……、10次的概率各是多少呢？这样的概率分布呈现出什么特征呢？这就是二项分布所研究的内容。

案例：还是抛硬币，抛5次，计算2次正面朝上的概率

计算过程

假设某个试验是伯努利试验，其成功概率用p表示，那么失败的概率为q=1-p。进行n次这样的试验，成功了x次，则失败次数为n-x，发生这种情况的概率可用下面公式来计算：

二项分布公式

其中

是二项式的计算方式！表示阶乘

上述案例使用Excel计算方式：

=BINOM.DIST(2,5,0.5,FALSE)

函数介绍

BINOM.DIST(number_s,trials,probability_s,cumulative)

BINOM.DIST 函数语法具有以下参数：

Number_s 必需。试验的成功次数。
Trials 必需。独立试验次数。
Probability_s 必需。每次试验成功的概率。
cumulative 必需。决定函数形式的逻辑值。如果 cumulative 为 TRUE，则 BINOM.DIST 返回累积分布函数，即最多存在 number_s 次成功的概率；如果为 FALSE，则返回概率密度函数，即存在 number_s 次成功的概率。

二项分布的特征：

1.进行n次相同条件下的相互独立的重复试验

2.每次试验，只有2个结果，成功或者失败

3.出现成功的概率P每次试验是相同的，失败的概率q也是，并且p+q=1

如果符合上面的条件，那就是二项分布，如果上述试验只进行一次，就叫做伯努利试验，也是就二项分布是n次伯努利试验的结果。

二项分布的均值和方差分别为np和npq

二项分布形状变化规律，可明显由下图观察出来。图中的横轴代表试验"成功"的次数；纵轴代表次数对应的概率；红线是均值为np、方差为npq的正态分布曲线。

由此可见，二项分布是一个概率分布族，随着试验次数n和成功概率p的不同而不同，且它与正态分布关系密切。

二项分布在工作中并不经常用到，不过在赌场倒是挺有用的，有想去玩一把的同学可以深入研究一下。

泊松分布

用来描述在一指定时间范围内或在指定的面积或体积内某一事件出现的次数的分布，他们对应的随机变量的概率服从的分布叫做泊松分布。

例如：

1 某企业中每月某设备出现故障的次数

2 单位时间内到达某一服务台需要服务的顾客人数

举个例子

小王的婶婶新开了一个包子铺，生意还不错，但是有一天小王去买包子，看见婶婶一筹莫展，问其原因，原来是因为包子铺6点-10点营业，这一周头有两天包子蒸少了，不到8点就卖完了，后来吸取教训蒸多了，又因为卖不完而不新鲜了，早上6点-10点到底蒸多少包子合适呢？

还好小王学过统计学，婶婶把馒头数据简单假设如下：

我们想一想，首先能不能用均值，我们算一下平均数

如果按照平均数，则5天中有2天都供不应求，这个不太合适

这可该怎么办？

我们换个思路，包子在6点-10点之间，每个包子的命运只有两个结果，要么卖出了，要么没卖出，那我们可以把6点-10点这个时间段当成一条有长度的线，假设分成20等份，假设每个时间段上放一个包子，要么卖出去了，要么没卖出去，类似于抛8次硬币，要么出现正面，要么出现反面，我们计算一下，卖出去7个包子的概率，利用二项分布公式

如果我们把时间段分成n等份,则卖出7个包子的概率为

运用极限，把时间段分的越细越好，并计算在这个时间段内卖出 k 个馒头的概率为：

对于这个p该怎么计算呢？

我们知道它服从二项分布，二项分布的期望为np,则

因此

推导过程（了解就行）：

假设每天准备65个包子，μ在这里可以直接使用均值50来计算，最后得出

概率为98.2%，其实大部分时候我们基本能满足每天的需求，因为数据量小，所有可能实际意义不是很明显，这里只是为了教学参考。

Excel使用Poisson.dist函数计算结果：

函数介绍

=POISSON.DIST(65,B8,TRUE)

POISSON.DIST(x,mean,cumulative)

POISSON.DIST 函数语法具有下列参数：

X 必需。事件数。
Mean 必需。期望值。
cumulative 必需。一逻辑值，确定所返回的概率分布的形式。如果 cumulative 为 TRUE，则 POISSON.DIST 返回发生的随机事件数在零（含零）和 x（含 x）之间的累积泊松概率；如果为 FALSE，则 POISSON 返回发生的事件数正好是 x 的泊松概率密度函数。

泊松分布是二项分布的极限

在n重伯努利实验中，当成功的概率很小，实验次数很大时，二项分布可近似等于泊松分布

在实际应用中，当p<=0.25,n>20,np<=25时，用泊松分布近似二项分布的效果良好

2 连续型随机变量的概率分布

正态分布

德国的高斯

法国的拉普拉斯

回到最开始的业务场景

通过统计描述，分析师已经了解了配件A过去的日消耗量波动情况，现希望基于历史数据设定库存控制线，要求该库存量能够保证99%的使用日不会出现库存断货情况。

该怎么办呢？

控制线设置成均数可以吗？

肯定是不可以的，因为均值只是代表一般水平，换句话说，有大概一半的数据在均数以下，有一半在以上，如果把均数设置为库存控制线，最多也就只能满足50%左右的使用日不会出现库存断货情况

如果使用百分位数呢？

计算P99位置的数值，这样理论是可以的，但是百分位数对于样本量比较大的数据集才具有意义，样本量太小，实际意义不大

举个例子：零件日消耗量分布从1-100，我们随机抽取50个样本，计算P99，要求这个值要大于99%的日消耗，假设这个样本数据的最大值是80，比这个数小的是78，最终我们计算出来的是78，显然跟100差的很远，这个数据拿到实际应用中，是不满足要求的，因为样本量少造成的误差太大的缘故。

那该怎么办？

那就用到接下来要讲的内容

从频数分布到概率分布

那我们来分析一下

直方图/频率图的性质

直条的面积实质上就是频率（或者百分比）

面积=直条高度X宽度(组距) = 频率

因此直条的面积相加等于1

当样本量越来越大，频率(面积) 趋向概率

并且组距越来越小时，直方条的顶缩成点并且各个直方条的顶连接成一条曲线，这条曲线就是概率密度分布曲线

概率密度的概念和固体的密度基本类似

哪个地方的概率大说明密度就大

这就是正态分布

官方概念

正态分布的两个重要特征：均数μ和标准差σ

μ是分布曲线的最高峰的位置(集中趋势)

σ标准差是离散程度的度量(离散趋势)

正态分布是具有对称性的

正态分布是应用最广泛的一种分布，在我们生活中正态分布随处可见

人的智商

大部分人的智商是正常的，只有少数像爱伊斯坦老爷子这样的才会智商发飙

人的身高，这个是西方国家的

什么是标准正态分布？

不同的正态分布，其曲线下方的面积分布规律各不相同，使得在应用上很不方便，需要为每种分布单独计算曲线下面积的分布规律

为此统计学家优先计算了均数为0，标准差为1的正态分布N(0,1)曲线下面积分布规律。

其曲线下概率面积分布规律非常常用

95% 99%
双侧 1.96 2.58
单侧 1.64 2.33

95%的情况下最常用

标准正态分布的曲线下面积分布规律

只要将相应的指标转换成服从标准正态分布，就可以根据该面积分布规律计算出累积概率。

例：95%的双侧个体参考值范围

看看这张图，参考值就是应用了正态分布的知识

回到刚才的例子中

解题思路

首先确定数据是否大致服从正态分布

如果服从，直接采用正态分布公式计算参考值范围

如果不服从，那么是否可以采取某种形式进行变换成正态分布

如果还不行，只能采用百分位数，但是如果样本量小的话，数据可能不准确

举个栗子，详细看看如何根据正态分布计算区间范围

某零件的长度服从正态分布，平均长度为10mm，标准差为0.2mm,问：从该批零件中随机抽取一件，其长度不到9.4,mm的概率是多少？

计算过程

使用Excel如何计算

=NORMDIST(9.4,10,0.2,TRUE)

函数介绍

NORMDIST(x,mean,standard_dev,cumulative)

NORMDIST 函数语法具有下列参数：

X 必需。需要计算其分布的数值。
Mean 必需。分布的算术平均值。
standard_dev 必需。分布的标准偏差。
cumulative 必需。决定函数形式的逻辑值。如果 cumulative 为 TRUE，则 NORMDIST 返回累积分布函数；如果为 FALSE，则返回概率密度函数。

正态分布的经验法则

抽样分布

统计推断

就是根据你拥有的信息来对现实世界进行某种判断

我们在生活中的推断

可以根据一个人的衣着、言谈和举止判断其身份

看一个脸色，来判断心情好坏，身体状况

统计中的推断也不例外，只不过它是完全依据数据做出的

那什么是统计推断呢

从数据得到关于现实世界的结论的过程就叫做统计推断(statistical inference)

因为我们在实际工作中，往往只能通过样本去推估总体，所以统计推断非常重要

重要提示：任何一个总体参数都可以进行统计推断

例：配件日消耗量的均数、中位数、标准差等等，都是可以进行统计推断的

但是目前比较成熟，用的最多的就是对于均值的推断

应用场景：

基于配件A的领用历史数据，我们能否估计出其总体日均领用量的大致范围？

解决方案：

最简单的方式：样本均数就等于总体均数，但是这个到底对不对，有点太没有说服力了

给定一个范围是不是更准确一些

抽样误差与标准误

抽样误差：由样本导致的样本均数与相应的总体均数在数值上的差异

但是如何定量表达其大小？

样本均数与真实总体均数之差看上去是可以表示抽样误差大小的，但实际上无法计算

考虑在一个总体中实际上可进行无限多次抽样，实际上这些样本的抽样误差应当也服从某种分布规律

从统计总体的角度来看，其实就是要回答对于一个相同的总体，如果我们从中进行抽样研究的话，则相应的样本统计量(例如均数)的离散程度是怎样的。

例：研究人群为上海成年男性，研究指标为脉搏每分钟跳动次数
假设随机在华东地区按样本量为25抽取样本，并测量其脉搏，每个样本计算样本均数，如果重复10000次抽样，则会得到10000次样本均数

显然，样本均数存在随机变异，但在大量重复观察的情况下，可以证明同样有一定的规律，即：样本均数的概率分布。

中心极限定理

设从均值为μ，方差为（有限）的任意一个总体中抽取样本量为n样本，当n充分大时，样本均值的抽样分布近似服从均值为μ，方差为σ^2/n的正态分布。

也就是说，你抽取n个样本，每个样本的均值近似服从的正态分布。

大数定律和中心极限定理

大数定理是在当时间发生次数趋近无穷之后，强调样本平均数会依概率收敛与原分布的期望，比如投一枚硬币正反两面都可以，正面记为1，反面为0，那么期望为0.5。当次数无穷之后(或者理解为很大)那么那么多时间的平均期望会离0.5非常近。

中心极限定理用一句话来理解，次数发生很多之后(次数要求没有大数定理的次数高)，样本均值近似服从N(μ,σ²/n)的正态分布。

然后再来看，当我们中心极限定理的n次数非常大，就会发现方差无限接近于0，就意味着一直在均值附近了，那么也就是我们的大数定理了

当样本量大于等于30时，样本均数则默认是服从正态分布，对于总体是否是正态都适用。

显然，影响抽样误差大小的因素有两个

总体内各个体间的变异程度
样本含量N的大小

使用标准误，我们就可以知道如果使用样本统计量(如均数)来估计总体参数，可能的变动范围是多大，从而提高结论的实用性。

但是实际上，我们对于总体标准差并不知道，因此只能用样本标准差S来代替，从而均数标准误的估计公式为：

如果使用总体标准差进行计算，则

是服从标准正态分布的

但是如果用样本标准差进行估计，则

是服从t分布的

由标准正态分布推导出的其他分布：卡方分布、t分布、F分布

卡方分布

卡方分布在实际应用中主要是解决方差相关的问题

卡方分布的定义

简单来说，卡方分布就是多个标准正态分布的平方和

补充：自由度

可以自由取值的个数，当我们通过样本去推估总体时，取n个样本，自由度则为n-1,如果单纯想对样本进行计算，则自由度为n。

卡方分布的特点

卡方分布图

t分布

t分布的定义

若随机变量X服从标准正态分布N（0,1），随机变量Y服从自由度为n的卡方分布,且X与Y独立，则

简单来说，t分布就是标准正态分布除以均方的根，主要用于处理小样本问题

注：均方：一组数的平方和的平均值

F分布

功能：均方之比，用来对比两个方差

由统计学家费希尔首先提出的，以其姓氏的第一个字母来命名

F分布的密度函数图

参数估计

推断方法：点估计与区间估计

样本均数直接作为总体均数的点估计，但显然仅有点估计是不够的

区间估计：根据响应标准误的大小，按照一定的可信度给出一个总体参数可能的取值范围。

该区间被称为可信区间

可信区间的含义

可信度仅仅是大量重复抽样时的一个渐进概念。认为“95%的可信区间包括真实参数值的概率为0.95”
这种理解方式是错误的

计算出的可信区间是固定的，而总体参数值也是固定的。因此只有两种可能。95%的可信度只是说如何我们能够大量重复实验的话，则平均下来每100个可信区间中，会有大约95个覆盖真实值。

可信区间的实际应用

例：调查结果显示，某电视节目在观众中的收视率为90%，在95%的置信度下，抽样误差为正负3%

如何实现参数估计

绝大多数统计软件都是将参数估计功能和统计描述功能或者相应的假设检验功能整合在一起实现的

假设检验

1 为什么要做检验

从统计描述结果中发现可能的数据规律
但如果是抽样研究的样本，此时获取的只是样本的信息
研究者关心的并不仅仅是样本，更希望了解相应的总体特征
参数估计：推估样本所在的总体特征
假设检验：对提出的一些总体假设进行分析判断，做出统计决策

2 假设检验步骤之前需要做的工作

运用统计学知识根据研究设计和资料的性质正确选择分析过程
初步的统计描述（集中趋势、离散趋势）和统计分析
集中趋势：均数、中位数
离散趋势：标准差/方差、四分位差
分布特征
异常值及其他

3 假设检验的原理

基于小概率反证法，小概率原理，即认为小概率事件在一次随机抽样中不会发生

最经典的小概率事件:瞎猫碰到死耗子

基本思想：先建立一个关于样本所属总体的假设，考察在假设条件下随机样本的特征信息是否属于小概率事件，若为小概率事件，则怀疑假设成立有悖于该样本所提供特征信息，因此拒绝假设。

事实上，小概率事件在随机抽样中还是可能发生的，只是发生的概率很小。若正好碰上了，则假设检验的结论就是错误的，当然，犯这种错误的概率很小，是我们为了做出决策而愿意付出的代价。

举个栗子

一家大型超市连锁店上个月接到几例消费者投诉，某品牌60克装薯片包装内的土豆片太少
店方猜想引起这些投诉的原因是运输过程总沉积在食品袋底部的土豆片碎屑过多，而不是整包的重量不足，但为了保险起见，店方仍然决定对这批存货的平均重量（克）进行检验

问题：

检验多少包才合适？少了没有说服力，多了成本高

究竟差异要和60克大到什么程度才能认为确实有差异呢

这个时候就需要用到假设检验了

现有的样本均数和已知总体均数不同，其差别可能有两个方面的原因造成

样本来自已知总体，现有差别为抽样误差
样本所来自的总体与已知总体不同，存在本质差异

为了识别这两种可能，应当对其做假设检验

如何做呢？需要按照以下步骤

4 假检验的基本步骤

建立假设

根据统计推断的目的而提出对总体特征的假设

统计学中的假设有两方面的内容：原假设：H0

备择假设：H1

原假设就是来当枪把子的，是被推翻的对象，一般是我们不希望成立的情况

备择假设：当H0被拒绝时就可以接受H1了，两者是互斥的，非此即彼

上述例子中，原假设和备择假设如下：

确定检验水准

实际上就是确定拒绝H0时的最大允许误差的概率

检验水准（size of test），常用a表示，是指检验假设H0本来成立，却根据样本信息拒绝H0的可能性大小，换言之，a是拒绝了实际上成立的H0的概率。

常用的检验水准为a=0.05

其意义是：在所设H0的总体中随机抽得一个样本，其均数比现有样本均数更偏离总体均数的概率不超过5%

类似于考试中习惯用的60%作为及格线

计算统计量和P值

实际上在此之前还有一步叫做进行验证，样本数据即从此得来

统计量只是工具，概率值才是目的，它可以客观衡量样本对假设总体偏离程度。

从H0假设的总体中抽出现有样本（及更极端情况）的概率，即P值

还是回到刚才薯片重量的问题，假设我们抽取50袋薯片，计算出的均值为58克，通过一些资料我们知道薯片的总体标准差为3克

我们知道，当样本量大于等于30时，其样本统计量服从正态分布，这里是检验均值，因此根据中心极限定理，我们可以采用z统计量来计算

计算所得z = -3.65

查z表或者使用=NORMSDIST(3.65)得出0.9999，因为是负值，所以 p = 1-0.9999 = 0.000131

p < 0.05 因此拒绝原假设，不能肯定薯片包装的平均重量是60克

检验统计量的特点

该统计量应当服从某种已知的分布，从而可以计算出P值
各种检验方法所利用的分布及计算原理不同，从而检验统计量也不同
得出推断结论

按照事先确定的检验水准a界定上面得到的P值，并按小概率原理认定对H0的取舍，作出推断结论。

若P<=a

基于H0假设的总体情况出现了小概率事件
则拒绝H0，接受H1，可以认为样本与总体的差别不仅仅是抽样误差造成的，可能存在本质上的差别，属“非偶然的”，因此，可以认为两者的差别有统计学意义
进一步根据样本信息引申，得出实用性的结论

若P>a

基于H0出现了很常见的事件
则样本与总体间的差别尚不能排除纯碎由抽样误差造成，可能的确属“偶然的”，故尚不能拒绝H0
因此，认为两者的差别无统计学意义，但这并不意味着可以接受H0
尚不能认为有罪不等于可确认无罪

两种错误类型

检验效能：H1是真的，实际拒绝H0的概率=1-β，称为Power，又称为检验效能

我们其实往往更希望得到的是拒绝H0的结论，所以实际问题在分析时检验效能不应当太低。

5 假设检验分为单侧检验和双侧检验

双侧检验

不知道样本所在总体和假定总体的相应指标谁高谁低
得到拒绝结论更困难，因此相应的结果也更稳妥

单侧检验

在专业上可知所在总体的相应指标不可能更高/更低于假定总体值
单侧检验更为敏感，但设定单侧检验需要有充分的专业知识来支持

左单侧检验

某批发商欲从厂家购进一批灯泡，根据合同规定灯泡的使用寿命平均不能低于1000小时，已知灯泡燃烧寿命服从正态分布，标准差为200小时。在总体中随机抽取了100个灯泡，得知样本均值为960小时，批发商是否应该购买这批灯泡？

显然，灯泡的使用寿命越长越好，因此我们并不太关心灯泡大于1000小时，而是关注灯泡小于1000是否属于正常现象

原假设H0：μ>=1000

备择假设H1：μ<1000

这就是左单侧检验，也称为下限检验

计算过程：

我们知道φ(-x) = 1-φ(x)

查出p=1-0.9772 = 0.0228<0.05 拒绝原假设

右单侧检验

与之相反，不关心低于某个值，只关心高于某个值的情况，例如次品率，这里就不详细赘述

统计方法应当注意其适用条件

独立性（independence）：各观察值间相互独立，不能互相影响
正态性（normality）：理论上要求样本取自正态总体
方差齐性(homogeneity)：两样本所对应的总体方差相等

你可能感兴趣的:(7-统计学-推断统计分析)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
如何做好人生的选择题？百科全书式天才——赫伯特·西蒙给你答案伽马有话说
赫伯特·西蒙是谁？想必知道的人非常少。但当看到他的履历后，相信没有人再怀疑他是个“天才”。西蒙出生于1916年6月15日，是个美国人，他的名字全称为赫伯特·亚历山大·西蒙，在2001年2月9日与世长辞，在这84年的岁月中，西蒙以27岁时取得的政治学博士学位为开端，先后步入了政治学、管理学、认知心理学、信息科学、人工智能、科学哲学、应用数学、统计学、运筹学、控制论、数理经济学、公共管理等领域，在这些
认识世界陈陈_19b4
9月16日，雨。阅读书目:《真相》。作者:瑞典统计学家和医学教授汉斯·罗斯林，他的儿子奥拉·罗斯林，google公共数据团队的负责人。汉斯·罗斯林还是一位全球知名的教育家，是世界健康组织和联合国儿童基金会的顾问。他与儿子儿媳共同创办了Gapminder基金会，开发了Trendalyzer软件，将国际统计数据转化成交互式的生动有趣的图表，帮助人们以事实为基础来观察世界，被称为“可视化数据之父”。图片
架构师备考的一些思考（三） kiba518 网络
前言这个考题的大部分内容，我感觉都是我们会的，但所有的考题都穿上了马甲，穿上马甲我们就不好认了，而且如果是一个两个人穿马甲，还好推断，如果1000人穿马甲，你识别的概率就会急速下降。有些题的内容则是即无法识别，也无法背，因为它也没有个前因后果，完全是出题人拍脑袋想的，所以，这种题我们是无法通过知识来判断的，因为用知识来判断，你会发现，四个选项全是正确的，这时我们可以采用逐字读题法，就是一个字一个字
python数据分析知识点大全编程零零七 python数据分析 python 开发语言 python数据分析数据分析知识点大全 python数据分析知识点 python教程 python基础
Python数据分析知识点大全可以归纳为以下几个主要方面：一、基础概念与目的数据分析定义：数据分析是指用适当的统计分析方法对收集来的大量数据进行分析，提取有用信息和形成结论，对数据加以详细研究和概括总结的过程。其目的在于从数据中挖掘规律、验证猜想、进行预测。Python在数据分析中的优势：Python因其易学性、快速开发、丰富的扩展库（如NumPy、Pandas等）和成熟的框架，成为数据分析领域的
千万字《计谋之纵横四海》37，中前故意斗地主输掉一百万吗？黑三自信自已推断黑龙江漫天飞雪
黑三和小红在屋子里玩手机，这时，张五和李六走了进来。黑三说道：情况怎么样？张五说道：中前和两个人，斗地主，把一百万，全输光了。在网吧里，我俩见证了这一奇迹的时刻。黑三看着手机，没有抬头。小红说道：什么意思？中前成穷鬼了？李六说道：老大，你不明白，你老盯着中前干嘛呀？到底有什么目的呀？黑三说道：一百万，输光了？他既然是赌鬼，怎么可能有一百万？这不蹊跷吗？小红说道：什么意思？黑三：中前是故意输的。小红
基于VUE2-dataV和echarts实现的可视化大屏，百分比适配PC端风流野趣fly echarts 信息可视化前端 vue.js javascript vscode 大数据
可视化平台中，数据分别通过仪表盘、环状图、柱形图、曲线图、滚动表格等多种形式展示数据变化。可视化平台大致分为左、中、右三部分，左侧由能耗总览、耗能占比、库存预警构成，中间由数据总览、销售计划完成率构成，右侧由销售统计、销售排名（TOP8）、生产统计构成。平台右上角动态显示当前系统日期、星期、时间，格式。在管理端进行添加数据后，数据可视化图表进行相应变化。1.能耗总览仪表盘，统计分析耗电量、耗水量、
如何有效的学习AI大模型？ Python程序员罗宾学习人工智能语言模型自然语言处理架构
学习AI大模型是一个系统性的过程，涉及到多个学科的知识。以下是一些建议，帮助你更有效地学习AI大模型：基础知识储备：数学基础：学习线性代数、概率论、统计学和微积分等，这些是理解机器学习算法的数学基础。编程技能：掌握至少一种编程语言，如Python，因为大多数AI模型都是用Python实现的。理论学习：机器学习基础：了解监督学习、非监督学习、强化学习等基本概念。深度学习：学习神经网络的基本结构，如卷
【Python・统计学】威尔科克森符号秩检验/Wilcoxon signed-rank test（原理及代码） TUTO_TUTO 统计学 python python 学习笔记
前言自学笔记，分享给对统计学原理不太清楚但需要在论文中用到的小伙伴，欢迎大佬们补充或绕道。ps：本文不涉及公式讲解（文科生小白友好体质）～（部分定义等来源于知乎百度等）本文重点：威尔科克森符号秩检验(英文名：Wilcoxonsigned-ranktest)【1.简单原理和步骤】【2.应用条件】【3.数据实例以及Python代码】1.简单原理和步骤威尔科克森符号秩检验是一种非参数检验的方法,需要数据
【Python・统计学】Kruskal-Wallis检验/H检验（原理及代码） TUTO_TUTO python 统计学 python 学习笔记
前言自学笔记，分享给对统计学原理不太清楚但需要在论文中用到的小伙伴，欢迎大佬们补充或绕道。ps：本文不涉及公式讲解（文科生小白友好体质）～（部分定义等来源于知乎百度等）本文重点：Kruskal-Wallis检验(Kruskal-Wallistest),也称H检验【1.定义和简单原理】【2.应用条件】【3.数据实例以及Python代码】【4.多重比较（例：Dunn检验）】1.定义和简单原理Krusk
【Python・统计学】单因素方差分析（简单原理及代码） TUTO_TUTO 统计学 python python 学习笔记
前言自学笔记，分享给对统计学原理不太清楚但需要在论文中用到的小伙伴，欢迎大佬们补充或绕道。ps：本文不涉及公式讲解（文科生小白友好体质）～本文重点：单因素方差分析（以下：方差分析）【1.方差分析简单原理和前提条件】【2.方差分析和t检验的区别】【3.方差分析代码（配对/独立+事后检验+效应量）】1.方差分析简单原理方差分析（ANOVA）又称“变异数分析”或“F检验”，是由罗纳德·费雪爵士发明的，用
【统计学】参数检验和非参数检验的区别和基本统计学 TUTO_TUTO 统计学 python python
前言自学笔记，分享给对统计学原理不太清楚但需要在论文中用到的小伙伴，欢迎大佬们补充或绕道。ps：本文不涉及公式讲解（文科生小白友好体质）～本文重点：参数检验和非参数检验的区别以及对应的常用统计学方法（这是需要根据自己的数据类型搞清楚用哪种统计学方法的关键）【1.参数检验】【2.非参数检验】【3.参数检验和非参数检验的区别】【4.常用统计学方法】1.什么是参数和参数检验参数(parameter)的概
二分系列(二分答案)9/14 2301_78191305 数据结构算法
一、使结果不超过阈值的最小除数给你一个整数数组nums和一个正整数threshold，你需要选择一个正整数作为除数，然后将数组里每个数都除以它，并对除法结果求和。（除法结果会向上取整7/3=3）请你找出能够使上述结果小于等于阈值threshold的除数中最小的那个。思路：使用二分答案来做(有固定模板)1.首先先判断一下要求的除数的范围。如果可以根据逻辑推断出来除数的左右边界，就可以减少复杂度。2.
Swift基础语法 huang1233 Swift swift
print("HelloSwift").不用编写main函数,Swift将全局范围内的首句可执行作为程序入口.一句代码尾部可以省略分号(;),多句代码写在同一行时必须用分号(;)隔开.用var定义变量,let定义常量,编译器能自动推断出变量\常量的类型leta=10letb=20varc=a+b+10c+=30Playground可以快速预览代码效果,是学习语法的好帮手Command+Shift+
Swift初学笔记之Swift基础语法 _迦与迦若 Swift 编程语言 swift ios xcode
一、变量声明与oc相比更简洁，编译时的检错机制更完善1、let声明常量，var声明变量varmyVariable=42myVariable=50letmyConstant=422、如果初始化时直接赋值可以不声明类型，swift会自己识别（即类型推断）。反之需要用冒号:声明变量类型letmyString="HelloWorld"print(myString);//;加不加都可以，不会报错letmSt
力扣2 两数相加 C++ _楠_ 力扣数据结构
题目描述给出两个非空的链表用来表示两个非负的整数。其中，它们各自的位数是按照逆序的方式存储的，并且它们的每个节点只能存储一位数字。如果，我们将这两个数相加起来，则会返回一个新的链表来表示它们的和。您可以假设除了数字0之外，这两个数都不会以0开头。示例：输入：(2->4->3)+(5->6->4)输出：7->0->8原因：342+465=807题目解法/***Definitionforsingly-
java8指Lambda 张晶新 java基础 java lambda
什么是λ表达式λ表达式本质上是一个匿名方法。让我们来看下面这个例子：publicintadd(intx,inty){returnx+y;}转成λ表达式后是这个样子：(intx,inty)->x+y;参数类型也可以省略，Java编译器会根据上下文推断出来：(x,y)->x+y;//返回两数之和或者(x,y)->{returnx+y;}//显式指明返回值可见λ表达式有三部分组成：参数列表，箭头（->）
看《碟中谍6》之前你不得不知道的天花 Mingo布克
8月31日《碟中谍6》再中国上映，鸣哥提前一天买了下午的票，准备看阿汤哥如何全面瓦解。图片发自App在这里就不剧透了，但是要说一个事情，在看电影之前各位不得不知道的事，关于天花。因为电影中，反派在克什米尔地区散步天花，造成了大量妇女和儿童死亡。OK，以下内容和电影再没关系了。2018年高考全国I卷作文题“战机防护”，“统计学家沃德坚持加强对飞机上弹痕少的地方的防护，而不是哪里弹痕多修复哪里，因为弹
golang-阅读雨痕大神的Go语言学习笔记的心得炒股养惠 golang学习之旅 go
golang-阅读雨痕大神的Go语言学习笔记的心得第一章概述1.1go与java中的局部变量初始化问题1.2golang中实现生产者消费者模型，利用管道进行数据通信第二章类型2.1类型推断的使用注意2.2常量与变量的区别2.3常量的值类型省略2.4go的枚举2.5常量和变量到底有什么区别2.6go基本类型2.7go引用类型2.7.1go中new与make的区别第一章概述1.1go与java中的局部
日记2021-3-8 思考z
今天开课第一天，对于今天的目标完成的还不错早上起床赖了一下，下午去图书馆呆了2个多小时，晚自习看了概率论与统计学，单词：talent天赋，才能，thick厚的，obstacleto对……障碍，introduce介绍，传入，thin瘦的，稀薄的，thorough彻底的，完全的，occurredto想到，invent发明，throat喉咙，ofcourse当然，thunder雷，雷声，tide潮汐，o
【机器学习】近似推断的基本概念以及变分贝叶斯的基本概念 Lossya 机器学习人工智能 python 贝叶斯网络变分贝叶斯近似推断
引言近似推断是处理大规模或复杂概率图模型时常用的一种方法，特别是在精确推断变得不可行或不实际的情况下文章目录引言一、近似推断1.1常见的近似推断方法1.1.1采样方法（SamplingMethods）1.1.1.1马尔可夫链蒙特卡洛（MCMC）1.1.1.2重要性采样（ImportanceSampling）1.1.1.3蒙特卡洛模拟（MonteCarloSimulation）1.1.2变分推断（V
PDF和CDF 薛定谔的猫_大雪概率论
在概率论和统计学中，PDF和CDF是两种描述随机变量分布的重要函数：ProbabilityDensityFunction(PDF)：概率密度函数是用来描述连续随机变量可能取值的概率分布的函数。对于一个连续型随机变量X，其PDFf(x)定义为在某个取值x处的概率密度，即X在该值附近出现的概率密度。PDF的积分可以得到概率，即在某个区间内随机变量出现的概率。CumulativeDensityFunct
数据分组还在手忙脚乱？Python groupby一招搞定，效率翻倍！图灵学者 Python库 python windows 开发语言
目录1、初识groupby：基础用法1.1groupby函数简介1.2准备数据与分组2、按键分组2.1使用lambda表达式2.2自定义key函数3、连续元素分组3.1不连续元素处理3.2连续性与排序4、组合其他itertools模块4.1itertools.chain与groupby4.2itertools.repeat与分组5、实战演练：数据分析应用5.1数据清洗5.2统计分析6、性能优化：高
Python自动化办公2.0 即将发布百里图书自动化人工智能 python
第一节课：数据整理与清洗第二节课：数据筛选、过滤与排序第三节课：高级数据处理技巧第四节课：数据可视化与实践案例第五节课：统计分析与报表第六节：常见的Excel报表与下方的课程形成知识体系：Python自动化办公(面向2020,Python3.7,不断更新ing)_在线视频教程-CSDN程序员研修院https://edu.csdn.net/course/detail/28031Python机器学习教
Scala教程之:静态类型 flydean程序那些事
Scala是静态类型的，它拥有一个强大的类型系统，静态地强制以安全、一致的方式使用抽象，我们通过下面几个特征来一一说明：泛类型型变类型上界类型下界内部类抽象类型复合类型自类型隐式参数隐式转换多态方法类型推断通过这些特性，为安全可重用的编程抽象以及类型安全的扩展提供了强大的基础。泛类型和java一样，Scala也有泛型的概念，在scala里面泛型是使用方括号[]来接受类型参数的。通常使用字母A来作为
几何分布的期望和方差公式推导_算法数学基础-统计学最基础之均值、方差、协方差、矩... weixin_39848097 几何分布的期望和方差公式推导均值定理六个公式概率论方差公式
我们天天都可以接触很多随机现象，比如每天的天气不一样气温是我们最直接的感受，我们很难预测明天的精确问题，但是这些随机现象又体现出了一定的规律性。比如上海7月份平均35度左右，冬天的平均温度在5度左右。所以35、5这些数字体现了某种稳定性。所以除了前面几章中讲到的分布律和概率密度函数可以表征随机变量外，还可以用一组数字来表达随机变量的一般特性。这就是我们今天要讲到的随机变量的数字特征。通过对数字特征
数据分析面试【概率论与统计学】总结之-----统计学常见面试题整理天阑的芋头 #数据分析—统计学知识数据分析统计学数据分析面试
阅读之前看这里：博主是正在学习数据分析的一员，博客记录的是在学习过程中一些总结，也希望和大家一起进步，在记录之时，未免存在很多疏漏和不全，如有问题，还请私聊博主指正。博客地址：天阑之蓝的博客，学习过程中不免有困难和迷茫，希望大家都能在这学习的过程中肯定自己，超越自己，最终创造自己。目录1.用简洁的话语阐述随机变量的含义2.划分连续型随机变量和离散型随机变量的依据3.常见的分布函数/概率密度函数，以
每日小计划小糊涂神
活到老学到老到，学习永无止境，我坚持每天学习，我的学习计划如下：1.每天学习五个英语单词，和正在学习英语的儿子共同进步，方便辅导他。2.学习一节统计学或者一节线性代数课程，在此基础上进一步学习数据的处理软件。3.每天微信步数达到1万步，每天饭后过一下二人世界，不到沟通感情，而且还能强身健体！4.学习两节税务师课件，中级会计师已经通过，距离考高级还有几年，空档期考取税务师，充实自己的专业知识。5.坚
【免费培训 · 时间调整】脑电统计分析专题班（直播：2023.7.12）茗创科技
课程背景统计分析通过对数据进行定量和定性分析，使繁杂的数据变得直观且形象。它作为一门实践性很强的课程，对各学科领域的发展起着非常重要的作用，特别是作为一种认识心理现象数量特征的重要工具受到了广大心理学工作者的重视。统计分析有助于建立问题和数据之间的关系，从而更好地了解和发现事物的内在规律。但如果大家在科研数据分析过程中只是记住操作步骤，缺乏对各种统计分析方法的原理、应用条件和检验结果的理解，不能很
最大熵模型（Maximum entropy model） Fang Suk 机器学习最大熵模型最大熵最大熵原理指数族分布
最大熵模型（Maximumentropymodel）本文你将知道：什么是最大熵原理，最大熵模型最大熵模型的推导（约束最优化问题求解）最大熵模型的含义与优缺点1最大熵原理最大熵原理：在满足已知约束条件的模型集合中，选择熵最大的模型。熵最大，对应着随机性最大。最大熵首先要满足已知事实，对于其他未知的情况，不做任何的假设，认为他们是等可能性的，此时随机性最大。2最大熵模型最大熵原理是统计学习的一般原理，
辗转相处求最大公约数沐刃青蛟 C++漏洞
无言面对”江东父老“了，接触编程一年了，今天发现还不会辗转相除法求最大公约数。惭愧惭愧！为此，总结一下以方便日后忘了好查找。 1.输入要比较的两个数a,b 忽略：2.比较大小（因为后面要的是大的数对小的数做%操作） 3.辗转相除（用循环不停的取余，如a%b,直至b=0） 4.最后的a为两数的最大公约数 &
F5负载均衡会话保持技术及原理技术白皮书 bijian1013 F5 负载均衡
一.什么是会话保持？在大多数电子商务的应用系统或者需要进行用户身份认证的在线系统中，一个客户与服务器经常经过好几次的交互过程才能完成一笔交易或者是一个请求的完成。由于这几次交互过程是密切相关的，服务器在进行这些交互过程的某一个交互步骤时，往往需要了解上一次交互过程的处理结果，或者上几步的交互过程结果，服务器进行下
Object.equals方法：重载还是覆盖 Cwind java generics override overload
本文译自StackOverflow上对此问题的讨论。原问题链接在阅读Joshua Bloch的《Effective Java（第二版）》第8条“覆盖equals时请遵守通用约定”时对如下论述有疑问： “不要将equals声明中的Object对象替换为其他的类型。程序员编写出下面这样的equals方法并不鲜见，这会使程序员花上数个小时都搞不清它为什么不能正常工作：” pu
初始线程 15700786134
暑假学习的第一课是讲线程，任务是是界面上的一条线运动起来。既然是在界面上，那必定得先有一个界面，所以第一步就是，自己的类继承JAVA中的JFrame，在新建的类中写一个界面，代码如下： public class ShapeFr
Linux的tcpdump 被触发 tcpdump
用简单的话来定义tcpdump，就是：dump the traffic on a network，根据使用者的定义对网络上的数据包进行截获的包分析工具。 tcpdump可以将网络中传送的数据包的“头”完全截获下来提供分析。它支持针对网络层、协议、主机、网络或端口的过滤，并提供and、or、not等逻辑语句来帮助你去掉无用的信息。实用命令实例默认启动 tcpdump 普通情况下，直
安卓程序listview优化后还是卡顿肆无忌惮_ ListView
最近用eclipse开发一个安卓app，listview使用baseadapter，里面有一个ImageView和两个TextView。使用了Holder内部类进行优化了还是很卡顿。后来发现是图片资源的问题。把一张分辨率高的图片放在了drawable-mdpi文件夹下，当我在每个item中显示，他都要进行缩放，导致很卡顿。解决办法是把这个高分辨率图片放到drawable-xxhdpi下。 &nb
扩展easyUI tab控件，添加加载遮罩效果知了ing jquery
(function () { $.extend($.fn.tabs.methods, { //显示遮罩 loading: function (jq, msg) { return jq.each(function () { var panel = $(this).tabs(&
gradle上传jar到nexus 矮蛋蛋 gradle
原文地址： https://docs.gradle.org/current/userguide/maven_plugin.html configurations { deployerJars } dependencies { deployerJars "org.apache.maven.wagon
千万条数据外网导入数据库的解决方案。 alleni123 sql mysql
从某网上爬了数千万的数据，存在文本中。然后要导入mysql数据库。悲剧的是数据库和我存数据的服务器不在一个内网里面。。 ping了一下， 19ms的延迟。于是下面的代码是没用的。 ps = con.prepareStatement(sql); ps.setString(1, info.getYear())............; ps.exec
JAVA IO InputStreamReader和OutputStreamReader 百合不是茶 JAVA.io操作字符流
这是第三篇关于java.io的文章了，从开始对io的不了解-->熟悉--->模糊，是这几天来对文件操作中最大的感受，本来自己认为的熟悉了的，刚刚在回想起前面学的好像又不是很清晰了，模糊对我现在或许是最好的鼓励我会更加的去学加油！： JAVA的API提供了另外一种数据保存途径，使用字符流来保存的，字符流只能保存字符形式的流字节流和字符的难点：a,怎么将读到的数据
MO、MT解读 bijian1013 GSM
MO= Mobile originate，上行，即用户上发给SP的信息。MT= Mobile Terminate，下行，即SP端下发给用户的信息；上行:mo提交短信到短信中心下行:mt短信中心向特定的用户转发短信，你的短信是这样的，你所提交的短信，投递的地址是短信中心。短信中心收到你的短信后，存储转发，转发的时候就会根据你填写的接收方号码寻找路由，下发。在彩信领域是一样的道理。下行业务：由SP
五个JavaScript基础问题 bijian1013 JavaScript call apply this Hoisting
下面是五个关于前端相关的基础问题，但却很能体现JavaScript的基本功底。问题1：Scope作用范围考虑下面的代码： (function() { var a = b = 5; })(); console.log(b); 什么会被打印在控制台上？回答：上面的代码会打印 5。 &nbs
【Thrift二】Thrift Hello World bit1129 Hello world
本篇，不考虑细节问题和为什么，先照葫芦画瓢写一个Thrift版本的Hello World，了解Thrift RPC服务开发的基本流程 1. 在Intellij中创建一个Maven模块，加入对Thrift的依赖，同时还要加上slf4j依赖，如果不加slf4j依赖，在后面启动Thrift Server时会报错 <dependency>
【Avro一】Avro入门 bit1129 入门
本文的目的主要是总结下基于Avro Schema代码生成，然后进行序列化和反序列化开发的基本流程。需要指出的是，Avro并不要求一定得根据Schema文件生成代码，这对于动态类型语言很有用。 1. 添加Maven依赖 <?xml version="1.0" encoding="UTF-8"?> <proj
安装nginx+ngx_lua支持WAF防护功能 ronin47
需要的软件:LuaJIT-2.0.0.tar.gz nginx-1.4.4.tar.gz &nb
java-5.查找最小的K个元素-使用最大堆 bylijinnan java
import java.util.Arrays; import java.util.Random; public class MinKElement { /** * 5.最小的K个元素 * I would like to use MaxHeap. * using QuickSort is also OK */ public static void
TCP的TIME-WAIT bylijinnan socket
原文连接： http://vincent.bernat.im/en/blog/2014-tcp-time-wait-state-linux.html 以下为对原文的阅读笔记说明：主动关闭的一方称为local end，被动关闭的一方称为remote end 本地IP、本地端口、远端IP、远端端口这一“四元组”称为quadruplet，也称为socket 1、TIME_WA
jquery ajax 序列化表单 coder_xpf Jquery ajax 序列化
checkbox 如果不设定值，默认选中值为on；设定值之后，选中则为设定的值 <input type="checkbox" name="favor" id="favor" checked="checked"/> $("#favor&quo
Apache集群乱码和最高并发控制 cuisuqiang apache tomcat 并发集群乱码
都知道如果使用Http访问，那么在Connector中增加URIEncoding即可，其实使用AJP时也一样，增加useBodyEncodingForURI和URIEncoding即可。最大连接数也是一样的，增加maxThreads属性即可，如下，配置如下： <Connector maxThreads="300" port="8019" prot
websocket dalan_123 websocket
一、低延迟的客户端-服务器和服务器-客户端的连接很多时候所谓的http的请求、响应的模式，都是客户端加载一个网页，直到用户在进行下一次点击的时候，什么都不会发生。并且所有的http的通信都是客户端控制的，这时候就需要用户的互动或定期轮训的，以便从服务器端加载新的数据。通常采用的技术比如推送和comet（使用http长连接、无需安装浏览器安装插件的两种方式：基于ajax的长
菜鸟分析网络执法官 dcj3sjt126com 网络
最近在论坛上看到很多贴子在讨论网络执法官的问题。菜鸟我正好知道这回事情.人道"人之患好为人师" 手里忍不住,就写点东西吧. 我也很忙.又没有MM,又没有MONEY....晕倒有点跑题. OK,闲话少说,切如正题. 要了解网络执法官的原理. 就要先了解局域网的通信的原理. 前面我们看到了.在以太网上传输的都是具有以太网头的数据包.
Android相对布局属性全集 dcj3sjt126com android
RelativeLayout布局android:layout_marginTop="25dip" //顶部距离android:gravity="left" //空间布局位置android:layout_marginLeft="15dip //距离左边距 // 相对于给定ID控件android:layout_above 将该控件的底部置于给定ID的
Tomcat内存设置详解 eksliang jvm tomcat tomcat内存设置
Java内存溢出详解一、常见的Java内存溢出有以下三种： 1. java.lang.OutOfMemoryError: Java heap space ----JVM Heap（堆）溢出JVM在启动的时候会自动设置JVM Heap的值，其初始空间(即-Xms)是物理内存的1/64，最大空间(-Xmx)不可超过物理内存。可以利用JVM提
Java6 JVM参数选项 greatwqs java HotSpot jvm jvm参数 JVM Options
Java 6 JVM参数选项大全（中文版）作者：Ken Wu Email: [email protected] 转载本文档请注明原文链接 http://kenwublog.com/docs/java6-jvm-options-chinese-edition.htm！本文是基于最新的SUN官方文档Java SE 6 Hotspot VM Opt
weblogic创建JMC i5land weblogic jms
进入 weblogic控制太 1.创建持久化存储 --Services--Persistant Stores--new--Create FileStores--name随便起--target默认--Directory写入在本机建立的文件夹的路径--ok 2.创建JMS服务器 --Services--Messaging--JMS Servers--new--name随便起--Pers
基于 DHT 网络的磁力链接和BT种子的搜索引擎架构 justjavac DHT
上周开发了一个磁力链接和 BT 种子的搜索引擎 {Magnet & Torrent}，本文简单介绍一下主要的系统功能和用到的技术。系统包括几个独立的部分：使用 Python 的 Scrapy 框架开发的网络爬虫，用来爬取磁力链接和种子；使用 PHP CI 框架开发的简易网站；搜索引擎目前直接使用的 MySQL，将来可以考虑使
sql添加、删除表中的列 macroli sql
添加没有默认值：alter table Test add BazaarType char(1) 有默认值的添加列：alter table Test add BazaarType char(1) default(0) 删除没有默认值的列：alter table Test drop COLUMN BazaarType 删除有默认值的列：先删除约束（默认值）alter table Test DRO
PHP中二维数组的排序方法 abc123456789cba 排序二维数组 PHP
<?php/*** @package BugFree* @version $Id: FunctionsMain.inc.php,v 1.32 2005/09/24 11:38:37 wwccss Exp $*** Sort an two-dimension array by some level
hive优化之------控制hive任务中的map数和reduce数 superlxw1234 hive hive优化
一、控制hive任务中的map数: 1. 通常情况下，作业会通过input的目录产生一个或者多个map任务。主要的决定因素有： input的文件总个数，input的文件大小，集群设置的文件块大小(目前为128M, 可在hive中通过set dfs.block.size;命令查看到，该参数不能自定义修改)；2.
Spring Boot 1.2.4 发布 wiselyman spring boot
Spring Boot 1.2.4已于6.4日发布，repo.spring.io and Maven Central可以下载(推荐使用maven或者gradle构建下载)。这是一个维护版本，包含了一些修复small number of fixes,建议所有的用户升级。 Spring Boot 1.3的第一个里程碑版本将在几天后发布，包含许多