无人车“看世界”的核心概念——概率及两大学派

目录

0. 写在前面

1. “怎么理解都行”——两大学派的跨世纪之争

2. 两种看世界的角度——上帝视角和人类视角

2.1 概率指的是什么?

2.2 随机事件背后的参数会变吗?

3. 最后的话


0. 写在前面

我们都知道,无人车要想做到无人化,必须大幅度提升感知能力。感知能力,通俗地说,就是“看”世界的能力。当然,不一定只是用视觉相机“看”,也可以通过激光雷达“看”,用超声波看,用各式各样的传感器来“看”。

更深入地思考一下,我们会发现,感知分两个阶段。“看”见,只是第一阶段;接着的是相“信”,相信所见,是第二阶段。为什么?因为第一阶段必定会受外界环境影响,混杂其他信息(带有噪声),所以第二阶段要戴上“有色眼镜”。对看见的内容进行过滤,最终形成一个结论。这个结论有时很肯定,有时也会出现不确定。在肯定与不确定之间,还有很多有意思的中间状态。

对于不确定性,无人车的技术链里,用概率来表达。因此,无人车大量地使用了概率工具,特别是贝叶斯法则(也叫做Bayes概率公式)。大名鼎鼎的卡尔曼滤波KF扩展卡尔曼滤波EKF无迹卡尔曼滤波UKF,甚至粒子滤波PF,都基于贝叶斯法则发展出来的。

既然这个概念如此重要,我们有必要多花点时间将它理解透彻。

于是,你翻了一大堆资料,为了搞明白概率到底在讲什么,甚至在搜索网站上输入 “概率讲了啥”。零零碎碎地看了一些资料后,恭喜你,你会彻底把自己搞糊涂。

好吧,别着急上火。让我们追根溯源,先从核心概念开始撸起。

1. “怎么理解都行”——两大学派的跨世纪之争

善用搜索工具的你,一定可以轻松地知道,概率来源于赌博的故事。

(有兴趣的话,可以看看下面的文章)码农要术:概率篇:概率起源故事 - 知乎概率论起源于赌博。 概率雏形1470年,也就是唐伯虎出生的那一年,有一本拉丁文的诗书《De Vetula》出版。上面有首诗记录了3个骰子点数和的排列组合结果。 左图为原始印刷,数字的写法和我们现在有些不同。右边为阿…https://zhuanlan.zhihu.com/p/142681968

如果你对量子力学和相对论感兴趣,下面有一段关于概率的文章,也很有意思。

物理学大师的困惑:概率从何而来?-深度-知识分子 (zhishifenzi.com)http://zhishifenzi.com/depth/view/7049?category=depth

看完很嗨,但是,你仍然不明白概率是什么,或者不知道概率能用来干啥。

想了解概率论的大事记,可以看看这篇文章。概率论与数理统计的前世今生https://www.jianshu.com/p/37158001f8df这里善意地提醒一下,在没有对概率培养足够的兴趣前,不需要提前做知识扩展。因为这些知识对你理解概率这个概念没有任何帮助。而且,我相信,你很可能和我一样,最多看到“贝叶斯”就开始用鼠标快速地划走了。

紧接着,你开始在网上闲逛,网上大部分资料是关于贝叶斯概率公式的。不出意外,仅仅是时间长短问题,你必然会注意到一个信息点——频率学派和贝叶斯学派。

好吧,我相信你会变得更加迷糊。

什么和什么?一个基本概念,被两大学派理解成完全不同的样子,然后彼此攻击,到今天仍在继续。当接触到的概率知识越多,你越会发现,在很多层面上,双方只是话术不同,结论大部分都惊人地相似,或完全相同。

我想,从某种意义上讲,你可以释然了。因为不是你对这个概念迟钝了,而是这个概念很灵活,可以以不同的方式来理解。

更神奇的是,怎么理解都是对的,只要你能自圆其说。

或者,这样说,这个概念只是提供了一种思路和框架,至于你用它来干啥,完全由使用者来决定。举一个帮助思考的例子,就拿你我都耳熟能详的易经八卦来说。同一套框架和工具,可以用来占卜,也能用来算命,还可以看风水,甚至用作文学创作。也许每种解释都没错。只能说,这套工具和方法很“耐撕”,很Nice。

在对比频率学派和贝叶斯学派的理论前,我们先反观一下自己的理解方式。

本质上讲,我们对一个概念很困惑,那肯定是在某些环节存在不确定性的理解。再深一步问问自己,到底哪里捉摸不透。也许,你摇摆的地方,正好是在两个不同的学术领域间跳跃。稍后你会了解到,事实也的确是如此。

扯远了,我们把思路收回来。

2. 两种看世界的角度——上帝视角和人类视角

正是因为在看世界的过程中存在不确定性,为了表达这种不确定性,从而有了“概率”这个概念。容易理解的是,若一件事肯定发生或肯定不发生,就不需要用概率来辅助表达;若一件事的发生带有不确定性,才会用到概率。

对于后者,为了方便描述,常用“随机事件”来表达,这也是频率学派和贝叶斯学派共同研究的对象。而两大学派的不同之处,一句话总结就是,看世界的角度不同。

2.1 概率指的是什么?

下面分别说说,两大学派眼里的概率到底有什么不同。

先说频率学派,他们对随机事件本身建模,讨论一个具体事件在统计学意义上的概率,将概率定义为将统计的次数取无穷极限而逼近的频率值。大意是,上帝已经确定了这件事会发生的概率,而做实验可以无限地逼近这个值。举个例子,投硬币猜正反面出现的概率,频率学派的代表会投掷力所能及的次数(比如1000次),然后统计正反面出现的次数(比如520次正面),从而得出概率值(得出概率值0.52);当实验次数越来越多时,最终概率值可能会稳定在0.5附近。

这里提一句,因为我们永远不可能进行无穷次试验,所以就不可能得到“上帝”定下来的准确概率,所以,还是要强调那句话,这只是一种看世界和解释世界的方式。

再看贝叶斯学派,他们不关注每个具体事件的天然概率,而是换了一种思路,以人类视角来看问题。他们认为,由于观察者信息的变化,导致对随机事件的某个结果的确信程度产生变化(越来越有信心,或变得不确定起来),所以,贝叶斯学派将概率看作观察者知识状态的表征,而不是客观世界的表征。

举个例子。在投硬币前,贝叶斯学派的代表们,根据已有的经验或数据,认为正反面出现的概率是0.5;又经过100次投掷后,得到的60次正面朝上的结果,得到基于观测的概率结果0.6;之后,他们不会执着于0.5进行坚持,也不会无主见地相信0.6,而是以一定的方式将两种信息进行融合。至于怎么融合,就要用到贝叶斯法则(这个概念先放一放,稍后我们另起一篇文章单独说)。

2.2 随机事件背后的参数会变吗?

另一方面,我们从影响事件发生的参数来分析一下。

概率学派认为,随机事件背后的参数是固定的,因此用穷举试验来验证,用优化算法来找最优。侧重于研究似然概率p(θ|x);其中,θ是参数,x是研究的随机事件,那么,对似然概率求最优的参数θ,就是希望找到最能影响随机事件x发生的最靠谱的参数值。

贝叶斯学派认为,影响随机事件的因素是动态变化的,观测者获取的信息越多,对该事件会更确信。因此,他们侧重于研究后验概率p(x|θ)。同样,θ是参数,也可以理解为信息,x是待研究的随机事件。相比于似然概率,后验概率研究的是当信息增加时,我们对随机事件x发生的确定度。

更通俗地理解,频率学派就是鸟瞰群山,全局寻优,要找到最高的山;而贝叶斯学派则关注眼前,走好每一步,爬好眼前的山。前者常用寻优算法,后者惯用推导公式。

正是由于贝叶斯学派的理论更贴合人类的思考方式,而人工智能又是基于人类思维方式和智慧而产生,再加上计算机算力的大幅提升,且资源充足,因此,在当前,贝叶斯法则在无人车领域,特别是状态识别方向,具有举足轻重的位置。

3. 最后的话

我们花了大量的篇幅导入“概率”这个概念,在无人车世界里,它真的很重要。

虽然概率在频率学派和贝叶斯学派的理解不同,但只是观察角度的不同而已。

理解了概率,才能与概率密度区分开,才能更好地理解贝叶斯法则。理解了贝叶斯法则,你才能看懂无人车的状态识别和数据融合原理。

那么,接下来,我们能马上深入了解贝叶斯概率公式吗?

不,时机还不成熟,我们需要熟悉一个核心概念——概率密度函数。下一次,我们将从概率密度函数说起,再过渡到贝叶斯法则。

好了,下次再聊。

你可能感兴趣的:(无人车之美,概率论,人工智能,自动驾驶,汽车,自动化)