随机变量和期望

什么是随机变量?什么是期望?这两个概念在高中阶段就已经学习,但是否真正掌握了这两个概念?现在看来,应该是没有。

教材上对随机变量的定义:

设随机实验为E,其样本空间为\Omega = \left \{ \omega \right \},如果对于每个\omega \in \Omega,都有一个实数X(\omega )和它对应,就得到一个定义在\Omega上的实值单值函数X(\omega ),称X(\omega )为随机变量。

虽然每个字都能看懂,但就是不太理解这句话到底是为了描述什么。这个问题不仅我遇到了,大洋彼岸的美国朋友也遇到了,不过他厉害的地方在于,将随机变量这个抽象的概念用一种简单的方式描述出来,让大家更加容易理解这个概念。我将他这篇博客中比较重点的地方翻译出来,如果想直接看原文可以进入下面的链接。

Random Variables and Expectation with Robots and Stuff!

随机变量

开篇这位仁兄就直呼“天下苦秦久矣”——在生活中大家不会使用概率统计这个数学工具的主要原因是没有真正理解其中的基本概念,比如随机变量和期望。这篇博客的目的就是为了让大家更好的理解这两个概念。

"Many issues in the practice of probability and statistics come from not spending enough time really understanding the basic tools we use when solving problems. Here I want to look at two concepts that are frequently misunderstood, in large part do to their terrible names. We'll start with Random Variables, which are neither random nor variables, then look at Expectation which tells us very little about what we expect from a Random Variable."

首先,作者给出了他自己对随机变量的理解(非数学形式):1. 随机变量是一个函数。2.函数的输入变量是一个事件(event)。3.函数的输出变量是一个数字(number)。

"Random Variable - A function that associates a real number with an event."

这个定义其实并不直觉,与教材上的定义相比,一样不能让我们豁然开朗。

接下来为了解释这个定义,以翻硬币(很老套的例子,不过很能说明问题)为例——掷了10次硬币,“H”和“T”表示硬币的两面,结果为THTHTHTTTT。关键点出现了,如果我们要做数学处理,面对的对象应该是数字而不是字母、汉字等符号,因为数学符号(加减乘除、取余、求亦或等)要处理的数字。掷硬币的结果是“H”和“T”,要转化(更标准的说法应该是量化)为数字。怎么量化?使用随机变量。可以将“T”看作0,将“H”看作1——将“T”和“H”作为输入变量,0和1作为输出变量,函数是随机变量。因此,掷硬币的结果就变为0101010000

进行到这一步,有些朋友可能就会产生迷惑了——随机变量是产生一组随机数字的函数么?作者为了解释这个问题,想象出一个随机数生成机——“Random Number Generating Machine”,该机器的作用是一旦旋转旋钮就会生成随机数。

 

作者继续提出一个问题(其实是带着读者一起思考这个问题),随机数生成机内部构造是什么?一共有两部分构成,第一部分是采样器(Sampler),它的作用是掷硬币,并直接上报结果——“H”或“T”。

 

第二部分是随机变量(Random Variable),它的作用是将采样器上报的结果量化为数字,具体如何量化是根据实际情况来决定的,比如不将“T”看作0而看作100,不将“H”看作1而看作-100。实际场景可能是,如果是“T”,掷硬币的人会赚100块;如果是“H”,掷硬币的人会输100块。

将随机数生成机的内部构造展现出来就如下图所示。其实随机变量的作用非常简单,就是将事件(非数字)根据实际情况量化为数字

随机变量和期望_第1张图片

将随机变量与概率联系起来

根据上面的讨论,我们知道随机变量是一个函数,一般用大写字母表示,其输入变量(事件)用\omega表示,输出变量是数字。用数学语言描述掷硬币的结果如下:

作者又举了一个稍微复杂的例子将随机变量与概率联系起来。指针落在黄色、红色、蓝色区域的概率分别是P\left ( yellow\right )=\frac{1}{2},P\left ( red\right )= \frac{1}{4},P\left ( blue\right )= \frac{1}{4}

随机变量和期望_第2张图片

 

可以任意定义一个随机变量A如下:

CodeCogsEqn (4).gif

例如玩赌博大转盘,落入黄色区域将损失200点,落入红色区域将赚取70,000点,落入蓝色区域赚取12点,则可以定义另外一个随机变量B如下:

AB是对同一个样本空间的两种“量化”,如果使用随机数生成机来做类比,区别点是在第二部分,即采样器是相同的,随机变量不同。

我们可以将P\left ( yellow\right )=\frac{1}{2},P\left ( red\right )= \frac{1}{4},P\left ( blue\right )= \frac{1}{4}变为P\left (A=2\right )=\frac{1}{2},P\left ( A=1\right )= \frac{1}{4},P\left ( A=0\right )= \frac{1}{4} .

问题是,使用P\left ( yellow\right )=\frac{1}{2}很直觉,为何要使用P\left (A=2\right )=\frac{1}{2}?主要原因是使用数字更加简洁准确。例如下面三个例子分别表示落在黄色和红色的概率、随机变量是质数的概率、随机变量是奇数的概率。

随机变量的期望

作者直接切入主题给出随机变量期望的定义:

"The Expectation of a Random Variable is the sum of its values weighted by their probability."

分别计算随机变量A和随机变量B的期望:

随机变量和期望_第3张图片

可以看到一个很奇怪的现象,虽然随机变量AB有着相同的样本空间——指针落在红黄蓝三个区域中,但是却得到了不同的期望结果。

【自己的总结】期望是对过去已经发生的所有事件(样本空间)的总结,用以对未来的事件做出预测。由于已经将事件量化为数字,通过计算得到期望值用来对未来即将发生的事件提前做预判。例如随机变量A的期望是1.25,则下一次实验的结果一定分布在1.25左右。这有什么好处呢?试想一下如果没有期望,下次实验的结果最有可能落在哪里呢?是100,还是1000,还是10000呢?有了期望值,以后实验的结果“大概率”落在1.25周围,方便观测者对结果进行观测。

随机变量和期望_第4张图片

你可能感兴趣的:(2019.10)