有深入浅数据分析 - 第七章主观概率

题目

分析师存在六个分歧

1: 俄罗斯下一个季是否会补贴石油业
2: 俄罗斯是否会收购欧航航空公司
3: 越南今年是否会减税
4:越南今年是否会鼓励外国投资
5:印尼旅游业今年是否会翻身?
6: 印尼政府是否会投资生态旅游

这些分析师用到了 可能,极可能,大概,不可能。等一些词语
这是一些不专业的词语

主观概率体现专家信念

如果用一个数字形式的概率来表示自己对某事的确认程度,所用的就是主观概率
我们要用 90% 60% 这些明确的数字来决定。

有深入浅数据分析 - 第七章主观概率_第1张图片
有深入浅数据分析 - 第七章主观概率_第2张图片

这里采用散点图来表示:关于每一个说法,分析师觉得出现的概率分布
有深入浅数据分析 - 第七章主观概率_第3张图片

这里我们需要用到 标准偏差(标准差)

标准偏差量度的是典型的分析点与数据集平均值的差距
数据集中的大部分点都会落在平均值的一个标准偏差范围内
主观概率偏离平均值的标准偏差越大,分析师在假设成立的可能性方面的分歧就越大

python 计算标准偏差

import numpy as np
 
# 创建一组随机数据
data = [10, 12, 10, 11, 10]

# 将列表转换成NumPy数组
arr = np.array(data)
 
# 计算标准偏差
standard_deviation = arr.std()
print("标准偏差为:", standard_deviation, np.median(arr))

有深入浅数据分析 - 第七章主观概率_第4张图片

从上图可以看出来,分析师认为俄罗斯下一季度会补贴油田的概率有80%以上

接下来的一条新闻: 俄罗斯宣布售出所有油田,称对商业失去了信心

以上的分析师没有错的
错的是 - 没有理由相信使用主观概率能保证主观概率的正确性

我们需要修订全部的主观概念

贝叶斯规则是修正主观概率的好办法

有深入浅数据分析 - 第七章主观概率_第5张图片

你可能感兴趣的:(数据分析,数据挖掘)