【概率论】随机试验、随机变量、离散型/连续型随机变量

1. 随机试验

满足以下3个条件的试验可以称为随机试验:

  • 相同条件下可重复
  • 试验结果明确可知且不只一个
  • 试验前不知道哪个结果会发生

例如:我们平时做的抛硬币、掷骰子试验都是随机试验。以抛硬币试验为例:①该试验可以重复进行多次;②试验结果我们明确知道要么正面朝上,要么反面朝上;③在试验开始前我们也不知道哪种结果会发生。因此这是一个随机试验

2. 随机事件

在一次试验中,可能出现,有可能不出现的结果称为随机事件,常用大写字母A、B、C表示。

例如:在抛硬币试验中,正面朝上是一个随机事件,反面朝上也是一个随机事件,可用A={正面向上},A={反面向上}表示。
【概率论】随机试验、随机变量、离散型/连续型随机变量_第1张图片

3. 随机变量

将随机试验的结果用一个变量来表示,这个变量就被称为随机变量,常用X、Y、Z来表示。随机变量包含了试验的各种结果。

例子1:在抛硬币试验中,硬币朝上的花色结果是随机变量,用X表示,假设正面朝上为1,反面朝上为0,则X=0,1。

例子2:在掷骰子试验中,掷出的点数是随机变量X,则X=1,2,3,4,5,6;
【概率论】随机试验、随机变量、离散型/连续型随机变量_第2张图片

总之,引入【随机变量】是为了将【随机试验的结果】数量化,这样我们才能用统一的数学语言去进行分析和计算。

4. 随机变量的分类

随机变量分为两类:离散型随机变量和连续型随机变量。

  • 离散型随机变量:随机变量X的取值是有限的(或无穷可列的)。
  • 连续型随机变量:随机变量X的取值是无限的,是不能逐个列出的。

4.1 离散型随机变量的概率分布

以下是离散型随机变量的概率分布:

其中, x k x_k xk 表示随机变量X的k种结果, p k p_k pk表示在第k种结果下的概率
在这里插入图片描述
我们也常用这样的方式表示:
在这里插入图片描述
看到这里就很熟悉了吧,

举个例子:有5个球,2个白球,3个红球,从中任取3个,设随机变量X为取到的白球数,求X的概览分布。
【概率论】随机试验、随机变量、离散型/连续型随机变量_第3张图片

【概率论】随机试验、随机变量、离散型/连续型随机变量_第4张图片

4.2 连续型随机变量的概率分布

如果随机变量X的分布函数可以表示为:
在这里插入图片描述
其中, f ( x ) f(x) f(x) 是非负可积函数,则称X为连续型随机变量,称 f ( x ) f(x) f(x)概率密度

再次强调,连续型随机变量的取值是无限多个的,即有无限多个随机变量的结果,且不可以枚举出来。

例如:公交车每30分钟一班,某人的等车时间是一个随机变量X,X的取值范围是[0,30),可以看出,这是一个区间,而不是某几个点,即X可取在0-30分钟这个时间轴上的任意一点,如3分钟、5分钟7毫秒、7√2分钟等,它是连续的而不是离散的,因此我们称X为连续型随机变量。
【概率论】随机试验、随机变量、离散型/连续型随机变量_第5张图片

下面再来看概率密度,由于连续型随机变量计算某个点的概率没有意义,需要计算的是某个区间的概率,因此引入了概率密度。我们可以把概率密度看成是纵坐标,区间看成是横坐标,概率密度对区间的积分就是面积,而这个面积就是事件在这个区间发生的概率,所有面积的和为1。下面这张图的阴影面积就是X在[a,b]区间上的概率。
【概率论】随机试验、随机变量、离散型/连续型随机变量_第6张图片

你可能感兴趣的:(数据分析,概率论,概率论,大数据,面试)