weixin_33812433

【概率论与数理统计】小结10-1 - 假设检验概述

注：终于写到最激动人心的部分了。假设检验应该是统计学中应用最广泛的数据分析方法，其中像"P值"、"t检验"、"F检验"这些如雷贯耳的名词都来自假设检验这一部分。我自己刚开进入生物信息学领域，用的最多的就是"利用t检验来判断某个基因在实验组和对照组中表达量的差异是否显著"。此外，对"P值"真正含义的探究也开启了自学概率论与数理统计之路。因此无论是应用价值，还是对我学习统计学的影响，这部分的内容都是意义非凡的。

下面是两篇相关的文章，分别写于2011年和2016年，仅供参考：

- 生物学中P值的意义，2011

- 显著性检验——费舍尔与“女士品茶”，2016

1. 假设检验

从样本到总体的推理被称为统计推断。应用统计学家费舍尔认为常用的统计推断有三种基本形式：抽样分布、参数估计和假设检验。

对于假设检验，从字面意思来看，"假设"这个词在这里就是一个其正确与否有待通过样本去判断的陈述。假设是对一个或多个总体的概率分布或参数的假设；在做判断时掌握的信息是从总体中抽取的样本。在数理统计中，通用"检验"一词来代替上文汇总的"判断"。因此假设检验就是根据样本的信息检验对相关总体的某个假设是否正确。

假设检验的类型

根据总体分布是否已知以及检验的内容，可以将假设检验分为以下两类：

参数假设检验：总体分布已知，检验关于未知参数的某个假设（主要包括对总体均值及方差、均值差、方差比等参数的检验）；
非参数假设检验：总体参数未知时的假设检验问题（主要包括分布拟合检验、符号检验、秩和检验等）.

基本理论依据

假设检验的基本理论依据：实际推断原理，即“小概率原理”.

2. 一般步骤（临界值法）

根据样本对原假设进行判断，有两种方法，临界值法和P值法。临界值法是根据显著性水平和统计量的分布确定一个检验统计量的临界值，然后根据检验统计量的值与临界值之间的关系来做决定。在引例中，临界值就是下面$2.1$节中的待定常数C，检验统计量就是样本均值$\bar{X}$.

引例：

体重指数BMI是目前国际上常用的衡量人体胖瘦程度以及是否健康的一个标准，专家指出，健康成年人的BMI取值应该在18.55-24.99之间。某种减肥药广告宣传，连续使用该种减肥药一个星期便可以达到减肥的效果。为了检验其说法是否可靠，随机抽取9位实验者（要求BMI指数超过25、年龄在20-25岁的女生），先让每位女生记录没有服用减肥药之前的体重，然后让每位女生服用该减肥药，服药期间，要求每位女生保持正常的饮食习惯，连续服用该减肥药1周后，再次记录各自的体重。测得服用减肥药前后的体重差值（服药前体重 - 服药一周后体重）（单位：kg）:

$$1.5, 0.6, -0.3, 1.1, -0.8, 0, 2.2, -1.0, 1.4$$

图1：BMI计算公式

问题：根据目前的样本资料能否认为该减肥药广告中的宣称是可靠的？

这里提出的问题就是一个假设检验的问题，包括以下要素：

1). 我们有一个总体，即所考察的BMI指数超过25、年龄在20-25岁的女生服用减肥药一周前后的体重差（这是理想总体，虽然没有在所有符合条件的人群中做实验），且假设该总体服从正态分布$X \sim N(\mu, \sigma^2)$，为了解题方便进一步假设方差$\sigma^2 = 0.36$. 此时总体的分布还有未知参数$\mu$.

2). 从该总体中中抽出的9个样本，即9位参与试验的人.

3). 有一个命题，其正确与否完全取决于未知参数$\mu$的值. $\mu$的取值可以分为三个部分，表示不同的实验效果：$\mu = 0$时表示体重没有变化；$\mu > 0$表示体重下降了；$\mu < 0$表示体重增加了. 在做判断时，只有$\mu > 0$的情况（甚至更严格）才有可能支持"减肥药有效"这个结论.

下面是进行假设检验的一般步骤。

2.1 建立两个完全对立的假设：原假设与备择假设

在作假设检验之前，必须确定原假设（或零假设，$H_0$）和备择假设（或对立假设，$H_1$）。这两个假设通常是完全对立的，例如药物有效与无效，基因表达量有差异与没有差异等。决定谁作原假设，依赖于立场、惯例和方便性。选择零假设的基本原则是：保护零假设，尽量维持现状或取简单假设。例如筛选差异基因，原假设是两组基因没有差异，只有在具有了充足的证据，证明两组基因是有差异的，才能拒绝原假设，说明它们是有差异的。

对于引例中的问题来说，站在消费者的角度，需要严格看待减肥药的效果，因此原假设可以设定为该药物没有作用。那么根据题设，转化成数学语言为：

服用减肥药前后体重差值$X \sim N(\mu, \sigma^2)$，方差$\sigma^2 = 0.36$

检验假设：$H_0: \mu = 0, H_1: \mu > 0$

因为$\bar{X}$是$\mu$的无偏估计，$\bar{X}$的取值大小反映了$\mu$的取值大小，当原假设成立时，$\bar{X}$取值应偏小（这里X表示体重差，体重差越小表示该减肥药的效果越不明显）。因此，

当$\bar{X} \ge C$时，拒绝原假设$H_0$，

当$\bar{X} < C$时，接受原假设$H_0$，

其中C是待定常数——检验统计量的临界值。

2.2 给出检验统计量，并确定拒绝域的形式

在做统计分析时，很多步骤都与各种不同的分布有关，例如代表样本数值特征的统计量；用来做参数估计的枢轴量(包含一个未知量的统计量)；还有这里出现的用于假设检验的检验统计量。

如果统计量$T = T(X_1, ..., X_n)$的取值大小与原假设$H_0$是否成立有密切联系，就可以将其称为对应假设问题的检验统计量，而对应于拒绝原假设$H_0$时，样本值的范围称为拒绝域，记为$W$，其补集$\bar{W}$称为接受域。确定一个检验，等价于指定其接受域或否定域。

引例中的检验统计量为$\bar{X}$，拒绝域为

$$W = \{(X_1, ..., X_n): \bar{X} \ge C\}$$

C如何选择，是问题的关键。

首先要理解C点的含义：C值取定后就是一个固定的值，C点将随机变量的整个取值范围$(0,+\infty)$分成了两个部分，左边为接受域，右边为拒绝域(这里衡量的是体重差，拒绝域在右边，没有考虑体重增加的情况)。
所以当样本均值$\bar{X} < C$时，就落到了接受域(也就是$\bar{X}$与0接近到了一定程度，类似于样本均值落到了0的邻域)，就可以认为$\bar{X}$与0没有差别。又因为$\bar{X}$是总体均值$\mu$的无偏估计，因此可以认为总体的均值$\mu=0$，从而接受原假设$H_0$。当样本均值$\bar{X} > C$时，就落到了拒绝域(样本均值与0的差别非常大)，所以就拒绝了原假设。

2.3 根据显著水平和统计量的分布确定临界值

两类错误

在检验一个假设$H_0$时，有可能犯以下两类错误之一：

1). $H_0$正确，但被否定了，即丢弃了真假设(弃真)，也叫作"第一类错误"或"I型错误"；

2). $H_0$不正确，但被接受了，即接受了假的假设(取伪)，也叫作"第二类错误"或"II型错误"

在引例中，如果犯了第一类错误，就会将本来没有减肥效果的减肥药当做有减肥效果，从而对消费者的利益造成比较大的损害；如果犯了第二类错误，就会将本来有减肥效果的药物当做没有减肥效果，这会让制药公司蒙受损失。再举一个例子：某流行病的发病率为0.1%，由于发病率比较低，可以将"来检测的人没有患病"作为原假设$H_0$. 此时如果犯了第一类错误，就会将健康人诊断为病人从而开具错误的处方，通常也将这种情况称作假阳性；如果犯了第二类错误，就会将病人诊断为健康人从而可能使病人错过最佳治疗时间，且有可能传染给其他人，通常也将这种情况称为假阴性.

下面是一张广为流传的图，用来说明"假阳性"和"假阴性"，其原假设$H_0$是"没有怀孕"：

图2：假阳性&假阴性

我们希望在检验一个假设$H_0$时，犯两类错误的概率都尽量小。但是难免会有失误的时候，而且这两类错误是相互对立的：对于引例来说，假如检验的条件非常严格(例如规定必须每个人的体重都下降10kg)，则犯第一类错误的概率就会比较小，但是大大提高了假阴性的概率。对于引例来说，犯第一类错误的后果显然比犯第二类错误的后果严重，因此检验的标准需要偏严格一些。

在区间估计中，也存在类似的问题：想要增大可靠性即置信系数，就会使区间长度变大而降低精度，反之亦然. 在区间估计中，是用"保一望二"的原则来解决这个问题的，即使置信系数达到指定值，在这个限制之下使区间精度尽可能大. 在假设检验中也是这样办：先保证第一类错误的概率不超过某指定值$\alpha$($\alpha$通常较小，最常用的是0.05和0.01，有时也取0.001, 0.1或0.2等值)，在这个限制下，使第二类错误的概率尽可能小. 以上原则也被称为"奈曼-皮尔逊原则".

继续分析引例中的问题，取显著性水平$\alpha = 0.05$，

当原假设$H_0$成立时 $\Rightarrow \frac{\bar{X}}{0.6 / \sqrt{9}} \sim N(0, 1)$，(统计量的分布)

此时，显著性水平就是犯第一类错误的概率的上限：

$P\{\bar{X} \ge C | \mu=0\} = P\{\frac{\bar{X}}{\sigma/\sqrt{n}} \ge \frac{C}{\sigma/\sqrt{n}} | \mu=0\}$

$= 1 - \Phi(\frac{C}{\sigma/\sqrt{n}}) \le \alpha = 0.05.$, $(0.05 = \Phi(-z_{0.05}))$. $1 - \Phi(x)$越小，$x$越靠近分布的右端，值越大

$\Rightarrow \frac{C}{0.6/\sqrt{9}} \ge z_{0.05} = 1.645. \Rightarrow C \ge 0.329.$

其中，$\Phi(x)$表示区间$(-\infty, x)$上x轴与概率密度函数围成的面积；$z_{\alpha}$表示概率密度函数的上$\alpha$分位点；检验统计量是样本的均值，标准化后服从标准正态分布（总体方差已知）.

2.4 根据样本得出结论

根据样本信息得，$\bar{X} = 0.522 > 0.329$.

当原假设$H_0$成立时，样本落在拒绝域的概率不超过0.05，这是一个小概率事件(小概率事件发生了)。

根据实际推断原理，有充分的理由拒绝原假设，认为厂家的宣传是可靠的.

同理，若$\alpha = 0.01$，可以计算得到$ W = \{ \bar{X} \ge 0.465\}$，此时条件变得更加严格，仍然可以拒绝原假设.

3. P值法

P值法的前两步与临界值法相同，下面是"P值法"的第三步和第四步. 由于在P值法中，只与显著性水平$\alpha$进行比较，也就是只对第一类错误进行了限制，因此也被称为"显著性检验"(Significance Test).

3.3 计算最小显著水平——P值法

P值的定义：当原假设$H_0$成立时，检验统计量取比观察到的结果更为极端的数值的概率。(如果比观察结果更极端的事件发生的概率非常小，那么观察结果本身发生的概率也会非常小！)

$$P_{\_} = P\{\bar{X} \ge \bar{x} = 0.522 | \mu = 0\} = 1 - \Phi(\frac{0.522}{0.6/\sqrt{9}}) = 0.0045 < \alpha = 0.05$$

按照P值的定义，现在观察到的结果为$\bar{x} = 0.522$，观察到比$\bar{x}$更大的结果的概率为0.0045. 这个概率非常小，小到几乎不可能发生.

那么此时的观察结果本身$\bar{x} = 0.522$的概率也非常小，接近0.0045，也就是说在原假设"减肥药无效"成立的情况下，小概率事件发生了，因此要拒绝原假设.

带概率性质的反证法：

该方法有点像"反证法"，但是又有不同之处，因此被称为"带概率性质的反证法". 一般的反证法要求在原假设成立的条件下导出的结论是绝对成立的，如果事实与之矛盾，则完全绝对地否定原假设.

概率反证法的逻辑是：如果小概率事件在一次试验中发生，我们就以很大的把握拒绝原假设.

3.4 比较P_值与显著水平，得出结论

P_值与显著性水平$\alpha$的关系：

1). 若$P_{\_} \le \alpha$，等价于样本落在拒绝域内，因此，拒绝原假设，称检验结果在水平$\alpha$下是统计显著的；

2). 若$P_{\_} > \alpha$，等价于样本没有落在拒绝域内，因此，不拒绝(接受)原假设，称检验结果在水平$\alpha$下统计不显著.

reference

https://marginalrevolution.com/marginalrevolution/2014/05/type-i-and-type-ii-errors-simplified.html

https://allizhealth.com/wp-content/uploads/2016/07/BMI-Formula-1.jpg

http://www.360doc.com/content/17/0904/19/45877835_684588486.shtml

http://staff.ustc.edu.cn/~zwp/teach/Prob-Stat/Lec16_slides.pdf

《概率论与数量统计》，陈希孺，中国科学技术大学出版社，2009年2月第一版

中国大学MOOC：浙江大学&哈尔滨工业大学，概率论与数理统计

转载于:https://www.cnblogs.com/Belter/p/9419616.html

QQ群采集助手，精准引流必备神器 2401_87347160 其他经验分享
功能概述微信群查找与筛选工具是一款专为微信用户设计的辅助工具，它通过关键词搜索功能，帮助用户快速找到相关的微信群，并提供筛选是否需要验证的群组的功能。主要功能关键词搜索：用户可以输入关键词，工具将自动查找包含该关键词的微信群。筛选功能：工具提供筛选机制，用户可以选择是否只显示需要验证或不需要验证的群组。精准引流：通过上述功能，用户可以更精准地找到目标群组，进行有效的引流操作。3.设备需求该工具可以
机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
PHP环境搭建详细教程好看资源平台前端 php
PHP是一个流行的服务器端脚本语言，广泛用于Web开发。为了使PHP能够在本地或服务器上运行，我们需要搭建一个合适的PHP环境。本教程将结合最新资料，介绍在不同操作系统上搭建PHP开发环境的多种方法，包括Windows、macOS和Linux系统的安装步骤，以及本地和Docker环境的配置。1.PHP环境搭建概述PHP环境的搭建主要分为以下几类：集成开发环境：例如XAMPP、WAMP、MAMP，这
pyecharts——绘制柱形图折线图 2224070247 信息可视化 python java 数据可视化
一、pyecharts概述自2013年6月百度EFE(ExcellentFrontEnd）数据可视化团队研发的ECharts1.0发布到GitHub网站以来，ECharts一直备受业界权威的关注并获得广泛好评，成为目前成熟且流行的数据可视化图表工具，被应用到诸多数据可视化的开发领域。Python作为数据分析领域最受欢迎的语言，也加入ECharts的使用行列，并研发出方便Python开发者使用的数据
ARM驱动学习之4小结 JT灬新一嵌入式 C++arm开发学习 linux
ARM驱动学习之4小结#include#include#include#include#include#defineDEVICE_NAME"hello_ctl123"MODULE_LICENSE("DualBSD/GPL");MODULE_AUTHOR("TOPEET");staticlonghello_ioctl(structfile*file,unsignedintcmd,unsignedlo
SpringBlade dict-biz/list 接口 SQL 注入漏洞文章永久免费只为良心 oracle 数据库
SpringBladedict-biz/list接口SQL注入漏洞POC:构造请求包查看返回包你的网址/api/blade-system/dict-biz/list?updatexml(1,concat(0x7e,md5(1),0x7e),1)=1漏洞概述在SpringBlade框架中，如果dict-biz/list接口的后台处理逻辑没有正确地对用户输入进行过滤或参数化查询（PreparedSta
【六】阿伟开始搭建Kafka学习环境能源恒观中间件学习 kafka spring
阿伟开始搭建Kafka学习环境概述上一篇文章阿伟学习了Kafka的核心概念，并且把市面上流行的消息中间件特性进行了梳理和对比，方便大家在学习过程中进行对比学习，最后梳理了一些Kafka使用中经常遇到的Kafka难题以及解决思路，经过上一篇的学习我相信大家对Kafka有了初步的认识，本篇将继续学习Kafka。一、安装和配置学习一项技术首先要搭建一套服务，而Kafka的运行主要需要部署jdk、zook
4.C_数据结构_队列荣世蓥数据结构数据结构
概述什么是队列：队列是限定在两端进行插入操作和删除操作的线性表。具有先入先出(FIFO)的特点相关名词：队尾：写入数据的一段队头：读取数据的一段空队：队列中没有数据，队头指针=队尾指针满队：队列中存满了数据，队尾指针+1=队头指针循环队列1、基本内容循环队列是以数组形式构成的队列数据结构。循环队列的结构体如下：typedefintdata_t;//队列数据类型#defineN64//队列容量typ
基于STM32与Qt的自动平衡机器人：从控制到人机交互的的详细设计流程极客小张 stm32 qt 机器人物联网人机交互毕业设计 c语言
一、项目概述目标和用途本项目旨在开发一款基于STM32控制的自动平衡机器人，结合步进电机和陀螺仪传感器，实现对平衡机器人的精确控制。该机器人可以用于教育、科研、娱乐等多个领域，帮助用户了解自动控制、机器人运动学等相关知识。技术栈关键词STM32单片机步进电机陀螺仪传感器AD采集电路Qt人机界面实时数据监控二、系统架构系统架构设计本项目的系统架构设计包括以下主要组件：控制单元:STM32单片机传感器
基于STM32的汽车仪表显示系统：集成CAN、UART与I2C总线设计流程极客小张 stm32 汽车嵌入式硬件物联网单片机 c语言
一、项目概述项目目标与用途本项目旨在设计和实现一个基于STM32微控制器的汽车仪表显示系统。该系统能够实时显示汽车的速度、转速、油量等关键信息，并通过CAN总线与其他汽车控制单元进行通信。这种仪表显示系统不仅提高了驾驶的安全性和便捷性，还能为汽车提供更智能的用户体验。技术栈关键词微控制器：STM32显示技术：TFTLCD/OLED传感器：速度传感器、温度传感器、油量传感器通信协议：CAN总线、UA
ARMV8体系结构简介：概述简单同学 ARMV8体系结构 ARMV8
1.前言本文主要概括的介绍ARMV8体系结构定义了哪些内容，概括的说：ARM体系结构定义了PE的行为，不会定义具体的实现ARM体系结构也定义了debug体系结构和trace体系结构ARM体系结构采用RISC指令集（1）长度一致的寄存器；（2）load/store架构，数据处理操作只能对寄存器内容进行处理，不会直接对内存的内容进行处理；（3）简单寻址方式，load/store地址来源于寄存器或指令域
WebMagic：强大的Java爬虫框架解析与实战 Aaron_945 Java java 爬虫开发语言
文章目录引言官网链接WebMagic原理概述基础使用1.添加依赖2.编写PageProcessor高级使用1.自定义Pipeline2.分布式抓取优点结论引言在大数据时代，网络爬虫作为数据收集的重要工具，扮演着不可或缺的角色。Java作为一门广泛使用的编程语言，在爬虫开发领域也有其独特的优势。WebMagic是一个开源的Java爬虫框架，它提供了简单灵活的API，支持多线程、分布式抓取，以及丰富的
非对称加密算法原理与应用2——RSA私钥加密文件私语茶馆云部署与开发架构及产品灵感记录 RSA2048 私钥加密
作者：私语茶馆1.相关章节（1）非对称加密算法原理与应用1——秘钥的生成-CSDN博客第一章节讲述的是创建秘钥对，并将公钥和私钥导出为文件格式存储。本章节继续讲如何利用私钥加密内容，包括从密钥库或文件中读取私钥，并用RSA算法加密文件和String。2.私钥加密的概述本文主要基于第一章节的RSA2048bit的非对称加密算法讲述如何利用私钥加密文件。这种加密后的文件，只能由该私钥对应的公钥来解密。
【c++基础概念深度理解——堆和栈的区别，并实现堆溢出和栈溢出】 XWWW668899 C++基本概念 c++c语言开发语言青少年编程
文章目录概要技术名词解释栈溢出和堆溢出小结概要学习C++语言，避免不了要好好理解一下堆（Heap）和栈（Stack），有助于更好地管理内存，以及如何写出一段程序“成功实现”堆溢出和栈溢出。技术名词解释理解东西最快的方式是根据自己目前能理解的词语去关联新的概念，不断的纠正，向正确的深度理解靠近，当无限接近的时候也就理解了想要理解的概念。我们经常说堆栈，把这两个名词放到一起。其实，堆是堆，栈是栈，两种
信息系统安全相关概念(上) YuanDaima2048 课程笔记基础概念安全信息安全笔记
文章总览：YuanDaiMa2048博客文章总览下篇:信息系统安全相关概念(下)信息系统安全相关概念[上]信息系统概述信息系统信息系统架构信息系统发展趋势：信息系统日趋大型化、复杂化信息系统面临的安全威胁信息系统安全架构设计--以云计算为例信息系统安全需求及安全策略自主访问控制策略DAC强制访问控制策略MAC信息系统概述信息系统用于收集、存储和处理数据以及传递信息、知识和数字产品的一组集成组件。几
设计模式之建造者模式(通俗易懂--代码辅助理解【Java版】） ok!ko 设计模式设计模式建造者模式 java
文章目录设计模式概述1、建造者模式2、建造者模式使用场景3、优点4、缺点5、主要角色6、代码示例：1）实现要求2）UML图3)实现步骤：1）创建一个表示食物条目和食物包装的接口2）创建实现Packing接口的实体类3）创建实现Item接口的抽象类，该类提供了默认的功能4）创建扩展了Burger和ColdDrink的实体类5）创建一个Meal类，带有上面定义的Item对象6）创建一个MealBuil
metaRTC8.0，一个全新架构的webRTC SDK库 metaRTC webrtc 音视频
概述metaRTC8.0是metaRTC开源以来架构变化最大的一个版本，是metaIPC3.0等高性能的基础。metaRTC8.0是一个全新架构版本，并非在metaRTC7.0版本上简单升级，在QOS/语音对讲/内存占用/视频文件录制读取等方面新增多个模块，在弱网对抗/语音对讲/内存优化等效果上有显著提升。metaRTC8.0在一年多的开发中进行了近200次迭代，metaRTC8.0社区版计划在2
metaRTC/webRTC QOS 方案与实践 metaRTC metaRTC 解决方案 webrtc qos
概述质量服务(QOS/QualityofService)是指利用各种技术方案提高网络通信质量的技术，网络通信质量需要解决下面两个问题：网络问题：UDP/不稳定网络/弱网下的丢包/延时/乱序/抖动数据量问题：发送数据量超带宽负载和平滑发送拥塞控制是各种技术方案的数据基础，丢包恢复解决丢包问题，抗乱序抖动解决网络乱序抖动问题，流量控制解决平滑发送数据/数据超带宽负载/延时问题。拥塞控制(Congest
metaRTC5.0 API编程指南(一) metaRTC metaRTC c++c语言 webrtc
概述metaRTC5.0版本API进行了重构，本篇文章将介绍webrtc传输调用流程和例子。metaRTC5.0版本提供了C++和纯C两种接口。纯C接口YangPeerConnection头文件:include/yangrtc/YangPeerConnection.htypedefstruct{void*conn;YangAVInfo*avinfo;YangStreamConfigstreamco
Shell脚本中sed使用 jcrhl321 linux
目录一、sed编辑器1、sed概述2、sed的工作流程3、sed命令的常见格式4、sed命令常用操作二、sed常用命令使用1、sed打印2、sed删除3、sed替换4、sed插入与增加4、sed剪切粘贴与复制粘贴一、sed编辑器sed（StreamEDitor）是一个强大而简单的文本解析转换工具，可以读取文本，并根据指定的条件对文本内容进行编辑（删除、替换、添加、移动等），最后输出所有行或者仅输出
JVM源码分析之堆外内存完全解读 HeapDump性能社区
概述广义的堆外内存说到堆外内存，那大家肯定想到堆内内存，这也是我们大家接触最多的，我们在jvm参数里通常设置-Xmx来指定我们的堆的最大值，不过这还不是我们理解的Java堆，-Xmx的值是新生代和老生代的和的最大值，我们在jvm参数里通常还会加一个参数-XX:MaxPermSize来指定持久代的最大值，那么我们认识的Java堆的最大值其实是-Xmx和-XX:MaxPermSize的总和，在分代算法
《算法》四学习——1.1节进阶的Farmer 算法算法笔记
前言买了一本算法4，每天看一点，对每个小结来个学习总结，输出驱动输入。本篇笔记针对第一章基础1.1基础编程模型1.1节总结了相关的语法、语言特性和书中将会用到的库。笔记自己在编码中容易遗漏的点&&优先级比||高在开发中习惯了加括号，所以没注意到这点，教材上也有但是忘记了二分查找中计算mid=left+(right-left)/2这样计算可以有效避免(left+right)/2溢出答疑java无穷大
网关gateway学习总结猪猪365 学习总结学习总结
一微服务概述:微服务网关就是一个系统!通过暴露该微服务的网关系统,方便我们进行相关的鉴权,安全控制,日志的统一处理,易于监控的相关功能!实现微服务网关技术都有哪些呢?1nginx:nginx是一个高性能的http和反向代理web的服务器,同事也提供了IMAP/POP3/SMTP服务.他可以支撑5万并发链接,并且cpu,内存等资源消耗非常的低,运行非常的稳定!2Zuul:Zuul是Netflix公司
KVM+GFS分布式存储系统构建KVM高可用 henan程序媛分布式 GFS 高可用 KVM
一、案列分析1.1案列概述本章案例主要使用之前章节所学的KVM及GlusterFs技术,结合起来从而实现KVM高可用。利用GlusterFs分布式复制卷，对KVM虚拟机文件进行分布存储和冗余。分布式复制卷主要用于需要冗余的情况下把一个文件存放在两个或两个以上的节点,当其中一个节点数据丢失或者损坏之后，KVM仍然能够通过卷组找到另一节点上存储的虚拟机文件，以保证虚拟机正常运行。当节点修复之后，Glu
每日一书|《亲密关系》(Day5) 采臣在等我
采臣在等我-广州【书籍名称】《亲密关系》图片发自App【阅读目标】1.了解“亲密关系”的几个阶段及特点2.认识和理解有效沟通的技巧和原则3.思考自己在亲密关系建立中的角色和心理，以及面临的挑战【阅读感受】这本书是克里斯多福研究亲密关系的智慧结晶，阅读的整体感受是:书中文字亲切，有种娓娓道来的感觉。书中的逻辑感较强，也有详细的小结和应用建议，适合应用和反思。1.亲密关系的4个阶段和特点阶段一:月晕A
Hadoop架构 henan程序媛 hadoop 大数据分布式
一、案列分析1.1案例概述现在已经进入了大数据(BigData)时代，数以万计用户的互联网服务时时刻刻都在产生大量的交互，要处理的数据量实在是太大了，以传统的数据库技术等其他手段根本无法应对数据处理的实时性、有效性的需求。HDFS顺应时代出现，在解决大数据存储和计算方面有很多的优势。1.2案列前置知识点1.什么是大数据大数据是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的大量数据集合，
FlagEmbedding 吉小雨 python库 python
FlagEmbedding教程FlagEmbedding是一个用于生成文本嵌入（textembeddings）的库，适合处理自然语言处理（NLP）中的各种任务。嵌入（embeddings）是将文本表示为连续向量，能够捕捉语义上的相似性，常用于文本分类、聚类、信息检索等场景。官方文档链接：FlagEmbedding官方GitHub一、FlagEmbedding库概述1.1什么是FlagEmbeddi
使用Python和Playwright破解滑动验证码 asfdsgdf python 开发语言
滑动验证码是一种常见的验证码形式，通过拖动滑块将缺失的拼图块对准原图中的空缺位置来验证用户操作。本文将介绍如何使用Python中的OpenCV进行模板匹配，并结合Playwright实现自动化破解滑动验证码的过程。所需技术OpenCV模板匹配：用于识别滑块在背景图中的正确位置。Python：主要编程语言。Playwright：用于浏览器自动化，模拟用户操作。破解过程概述获取验证码图像：下载背景图和
Java【泛型】 SkyrimCitadelValinor Java基础 java
Java泛型的概述不同类的数据如果封装方法相同，不必为每一种类单独定义一个类，只需定义一个泛型类，减少类的声明，提高编程效率。通过准确定义泛型类，可避免对象类型转换时产生的错误。泛型又提供了一种类型安全检测机制，只有数据类型相匹配的变量才能正常的赋值，否则编译器就不通过。Java中的泛型与C++类模板的作用相同，但是编译方式不同，Java泛型类只会生成一部分目标代码，牺牲运行速度，而C++的类模板
由于直接在一个回答中提供完整且多语言的游戏商城代码是不现实的（因为每种语言都有其独特的语法和库），我将为你概述一个游戏商城的核心概念，并提供几种不同编程语言的基本框架或示例代码段。 uthRaman 游戏 python 开发语言
商城系统概述hailiangwang.com游戏商城系统通常包含以下部分：用户系统（登录、注册、用户信息）商品列表（游戏、DLC、虚拟货币等）购物车系统支付系统订单系统2.示例框架（伪代码）首先，我们给出一个伪代码框架，描述商城的核心逻辑。plaintextclassUser:deflogin(username,password):#验证用户登录passdefregister(username,p
关于旗正规则引擎下载页面需要弹窗保存到本地目录的问题何必如此 jsp 超链接文件下载窗口
生成下载页面是需要选择“录入提交页面”，生成之后默认的下载页面<a>标签超链接为：<a href="<%=root_stimage%>stimage/image.jsp?filename=<%=strfile234%>&attachname=<%=java.net.URLEncoder.encode(file234filesourc
【Spark九十八】Standalone Cluster Mode下的资源调度源代码分析 bit1129 cluster
在分析源代码之前，首先对Standalone Cluster Mode的资源调度有一个基本的认识：首先，运行一个Application需要Driver进程和一组Executor进程。在Standalone Cluster Mode下，Driver和Executor都是在Master的监护下给Worker发消息创建(Driver进程和Executor进程都需要分配内存和CPU，这就需要Maste
linux上独立安装部署spark daizj linux 安装 spark 1.4 部署
下面讲一下linux上安装spark，以 Standalone Mode 安装 1）首先安装JDK 下载JDK：jdk-7u79-linux-x64.tar.gz ，版本是1.7以上都行，解压 tar -zxvf jdk-7u79-linux-x64.tar.gz 然后配置 ~/.bashrc&nb
Java 字节码之解析一周凡杨 java 字节码 javap
一： Java 字节代码的组织形式类文件 { OxCAFEBABE ，小版本号，大版本号，常量池大小，常量池数组，访问控制标记，当前类信息，父类信息，实现的接口个数，实现的接口信息数组，域个数，域信息数组，方法个数，方法信息数组，属性个数，属性信息数组 } &nbs
java各种小工具代码 g21121 java
1.数组转换成List import java.util.Arrays; Arrays.asList(Object[] obj); 2.判断一个String型是否有值 import org.springframework.util.StringUtils; if (StringUtils.hasText(str)) 3.判断一个List是否有值 import org.spring
加快FineReport报表设计的几个心得体会老A不折腾 finereport
一、从远程服务器大批量取数进行表样设计时，最好按“列顺序”取一个“空的SQL语句”，这样可提高设计速度。否则每次设计时模板均要从远程读取数据，速度相当慢！！二、找一个富文本编辑软件（如NOTEPAD+）编辑SQL语句，这样会很好地检查语法。有时候带参数较多检查语法复杂时，结合FineReport中生成的日志，再找一个第三方数据库访问软件（如PL/SQL）进行数据检索，可以很快定位语法错误。
mysql linux启动与停止墙头上一根草
如何启动/停止/重启MySQL一、启动方式1、使用 service 启动：service mysqld start2、使用 mysqld 脚本启动：/etc/inint.d/mysqld start3、使用 safe_mysqld 启动：safe_mysqld&二、停止1、使用 service 启动：service mysqld stop2、使用 mysqld 脚本启动：/etc/inin
Spring中事务管理浅谈 aijuans spring 事务管理
Spring中事务管理浅谈 By Tony Jiang@2012-1-20 Spring中对事务的声明式管理拿一个XML举例 [html] view plain copy print ? <?xml version="1.0" encoding="UTF-8"?>&nb
php中隐形字符65279（utf-8的BOM头）问题 alxw4616
php中隐形字符65279（utf-8的BOM头）问题今天遇到一个问题. php输出JSON 前端在解析时发生问题:parsererror. 调试: 1.仔细对比字符串发现字符串拼写正确.怀疑是非打印字符的问题. 2.逐一将字符串还原为unicode编码. 发现在字符串头的位置出现了一个 65279的非打印字符.
调用对象是否需要传递对象(初学者一定要注意这个问题) 百合不是茶对象的传递与调用技巧
类和对象的简单的复习,在做项目的过程中有时候不知道怎样来调用类创建的对象,简单的几个类可以看清楚,一般在项目中创建十几个类往往就不知道怎么来看为了以后能够看清楚,现在来回顾一下类和对象的创建,对象的调用和传递(前面写过一篇) 类和对象的基础概念: JAVA中万事万物都是类类有字段(属性),方法,嵌套类和嵌套接
JDK1.5 AtomicLong实例 bijian1013 java thread java多线程 AtomicLong
JDK1.5 AtomicLong实例类 AtomicLong 可以用原子方式更新的 long 值。有关原子变量属性的描述，请参阅 java.util.concurrent.atomic 包规范。AtomicLong 可用在应用程序中（如以原子方式增加的序列号），并且不能用于替换 Long。但是，此类确实扩展了 Number，允许那些处理基于数字类的工具和实用工具进行统一访问。
自定义的RPC的Java实现 bijian1013 java rpc
网上看到纯java实现的RPC，很不错。 RPC的全名Remote Process Call，即远程过程调用。使用RPC，可以像使用本地的程序一样使用远程服务器上的程序。下面是一个简单的RPC 调用实例，从中可以看到RPC如何
【RPC框架Hessian一】Hessian RPC Hello World bit1129 Hello world
什么是Hessian The Hessian binary web service protocol makes web services usable without requiring a large framework, and without learning yet another alphabet soup of protocols. Because it is a binary p
【Spark九十五】Spark Shell操作Spark SQL bit1129 shell
在Spark Shell上，通过创建HiveContext可以直接进行Hive操作 1. 操作Hive中已存在的表 [hadoop@hadoop bin]$ ./spark-shell Spark assembly has been built with Hive, including Datanucleus jars on classpath Welcom
F5　往header加入客户端的ip ronin47
when HTTP_RESPONSE {if {[HTTP::is_redirect]}{ HTTP::header replace Location [string map {:port/ /} [HTTP::header value Location]]HTTP::header replace Lo
java-61-在数组中，数字减去它右边(注意是右边)的数字得到一个数对之差. 求所有数对之差的最大值。例如在数组{2, 4, 1, 16, 7, 5, bylijinnan java
思路来自： http://zhedahht.blog.163.com/blog/static/2541117420116135376632/ 写了个java版的 public class GreatestLeftRightDiff { /** * Q61.在数组中，数字减去它右边(注意是右边)的数字得到一个数对之差。 * 求所有数对之差的最大值。例如在数组
mongoDB 索引开窍的石头 mongoDB索引
在这一节中我们讲讲在mongo中如何创建索引得到当前查询的索引信息 db.user.find(_id:12).explain(); cursor: basicCoursor 指的是没有索引 &
[硬件和系统]迎峰度夏 comsci 系统
从这几天的气温来看，今年夏天的高温天气可能会维持在一个比较长的时间内所以，从现在开始准备渡过炎热的夏天。。。。每间房屋要有一个落地电风扇，一个空调(空调的功率和房间的面积有密切的关系) 坐的，躺的地方要有凉垫，床上要有凉席电脑的机箱
基于ThinkPHP开发的公司官网 cuiyadll 行业系统
后端基于ThinkPHP，前端基于jQuery和BootstrapCo.MZ 企业系统轻量级企业网站管理系统运行环境:PHP5.3+, MySQL5.0 系统预览系统下载：http://www.tecmz.com 预览地址：http://co.tecmz.com 各种设备自适应响应式的网站设计能够对用户产生友好度，并且对于
Transaction and redelivery in JMS (JMS的事务和失败消息重发机制) darrenzhu jms 事务承认 MQ acknowledge
JMS Message Delivery Reliability and Acknowledgement Patterns http://wso2.com/library/articles/2013/01/jms-message-delivery-reliability-acknowledgement-patterns/ Transaction and redelivery in
Centos添加硬盘完全教程 dcj3sjt126com linux centos hardware
Linux的硬盘识别: sda 表示第1块SCSI硬盘 hda 表示第1块IDE硬盘 scd0 表示第1个USB光驱一般使用“fdisk -l”命
yii2 restful web服务路由 dcj3sjt126com PHP yii2
路由随着资源和控制器类准备，您可以使用URL如 http://localhost/index.php?r=user/create访问资源，类似于你可以用正常的Web应用程序做法。在实践中，你通常要用美观的URL并采取有优势的HTTP动词。例如，请求POST /users意味着访问user/create动作。这可以很容易地通过配置urlManager应用程序组件来完成如下所示
MongoDB查询(4)——游标和分页[八] eksliang mongodb MongoDB游标 MongoDB深分页
转载请出自出处：http://eksliang.iteye.com/blog/2177567 一、游标数据库使用游标返回find的执行结果。客户端对游标的实现通常能够对最终结果进行有效控制，从shell中定义一个游标非常简单，就是将查询结果分配给一个变量（用var声明的变量就是局部变量），便创建了一个游标，如下所示： > var
Activity的四种启动模式和onNewIntent() gundumw100 android
Android中Activity启动模式详解　　在Android中每个界面都是一个Activity，切换界面操作其实是多个不同Activity之间的实例化操作。在Android中Activity的启动模式决定了Activity的启动运行方式。　　Android总Activity的启动模式分为四种： Activity启动模式设置： <acti
攻城狮送女友的CSS3生日蛋糕 ini html Web html5 css css3
在线预览：http://keleyi.com/keleyi/phtml/html5/29.htm 代码如下： <!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <title>攻城狮送女友的CSS3生日蛋糕-柯乐义<
读源码学Servlet（1）GenericServlet 源码分析 jzinfo tomcat Web servlet 网络应用网络协议
Servlet API的核心就是javax.servlet.Servlet接口，所有的Servlet 类（抽象的或者自己写的）都必须实现这个接口。在Servlet接口中定义了5个方法，其中有3个方法是由Servlet 容器在Servlet的生命周期的不同阶段来调用的特定方法。先看javax.servlet.servlet接口源码： package
JAVA进阶：VO(DTO)与PO(DAO)之间的转换 snoopy7713 java VO Hibernate po
PO即 Persistence Object　　VO即 Value Object 　VO和PO的主要区别在于：　　VO是独立的Java Object。　　PO是由Hibernate纳入其实体容器（Entity Map）的对象，它代表了与数据库中某条记录对应的Hibernate实体，PO的变化在事务提交时将反应到实际数据库中。　实际上，这个VO被用作Data Transfer
mongodb group by date 聚合查询日期统计每天数据（信息量） qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
/* 1 */ { "_id" : ObjectId("557ac1e2153c43c320393d9d"), "msgType" : "text", "sendTime" : ISODate("2015-06-12T11:26:26.000Z")
java之18天常用的类(一) Luob. Math Date System Runtime Rundom
System类 import java.util.Properties; /** * System: * out:标准输出,默认是控制台 * in:标准输入,默认是键盘 * * 描述系统的一些信息 * 获取系统的属性信息:Properties getProperties(); * * * */ public class Sy
maven wuai maven
1、安装maven：解压缩、添加M2_HOME、添加环境变量path 2、创建maven_home文件夹，创建项目mvn_ch01,在其下面建立src、pom.xml，在src下面简历main、test、main下面建立java文件夹 3、编写类，在java文件夹下面依照类的包逐层创建文件夹，将此类放入最后一级文件夹 4、进入mvn_ch01 4.1、mvn compile ,执行后会在