【概率统计】通俗理解边际分布

边际分布:掷骰子的例子

在概率论和统计学中,边际分布是描述两个或更多个随机变量的联合概率分布中的一个或一部分随机变量的概率分布。简单来说,假设有两个随机变量(比如掷两个骰子),边际分布就是其中一个变量的概率分布(比如一个骰子的结果)。

模拟掷骰子过程

可以用numpy库来模拟上述的掷骰子过程,并计算边际分布。如下:

import numpy as np

# 模拟掷骰子过程
np.random.seed(0)  # 设置随机种子,以得到可复现的结果
n_trials = 1000000  # 掷骰子的次数
red_dice = np.random.choice([1, 2, 3, 4, 5, 6], size=n_trials)  # 红色骰子的结果
blue_dice = np.random.choice([1, 2, 3, 4, 5, 6], size=n_trials)  # 蓝色骰子的结果

# 计算红色骰子的边际分布
marginal_distribution = np.zeros(6)
for i in range(1, 7):
    marginal_distribution[i-1] = np.sum(red_dice == i) / n_trials

print(marginal_distribution)

可视化边际分布

进一步,可以使用 matplotlib 库来可视化红色骰子的边际分布

import matplotlib.pyplot as plt

# 创建直方图
plt.bar(range(1, 7), marginal_distribution, color='red')

# 设置图表标题和坐标轴标签
plt.title('Marginal Distribution of Red Dice')
plt.xlabel('Outcome')
plt.ylabel('Probability')
plt.show()

边际分布的含义

边际分布的“边际”一词来源于统计学中的一个惯例。在统计学中,假设有一个二维的联合分布表,我们通常会在这个表的边缘(或者说“边际”)上总结出每一行或者每一列的总和。这个总和就反映了单独一个变量的分布,而不是两个变量的联合分布。因此,这种分布就被称为“边际分布”。

具体到我们掷骰子的例子中,边际分布就是红色骰子每个面的出现概率,它独立于蓝色骰子的结果。

你可能感兴趣的:(概率统计,python,边际分布)