放射源定位范例-基于极大似然估计和简单蒙特卡洛方法的单放射源定位研究

放射源定位范例-基于极大似然估计和简单蒙特卡洛方法的单放射源定位研究

基本介绍

本研究的目标是展示极大似然估计和贝叶斯估计这两种统计学方法在放射源定位中的应用。在放射源定位研究中,放射源的位置仅仅是待估计的变量之一,除此之外,待定的变量还可以是放射源的数量、放射源的移动速度、环境材料等等。考虑到本研究的目标是展示统计学方法,如此多的待定变量只能增加所研究问题的复杂程度,同时针对每一个变量的统计过程都是一样的,变量数量的增加仅仅是提升了统计过程的冗余程度,对于入门选手容易迷失在多变量数学方程的构造上,而不是统计学意义和估计流程的理解。为此,本研究将定位问题简化,仅保留最根本的放射源坐标,作为待估计变量,而将其他变量作为固定数值提供。同时,为了能更加简明地体现数学思路,将更具有实际意义的三维空间定位问题转换为二维平面的定位问题,这样处理的好处是将笛卡尔坐标系下的放射源坐标由三个独立分量降低为两个独立分量,进一步简化数学结构。

本研究以放射源位置为估计目标,设定待定位的放射源数量为1,即仅存在一个放射源在环境中,放射源的强度已知,放射源仅存在于二维平面内,并且在观测期间保持在固定位置,不发生移动。

本研究选择统计学中的极大似然估计方法,作为定位的数学模型,以最简单的蒙特卡罗方法作为数学模型的求解方法。

本研究的流程由三个部分组成,首先是统计学模型构造,接着是统计学模型求解,最后是方案的评价。第一部分所谓统计学模型,是一个以观测结果为自变量的概率函数,这个模型通过观测结果与研究目标的物理关系构造得到,在本研究背景下,观测结果就是探测器的响应数量,研究目标就是放射源的位置,物理关系就是光子被探测器观测到的概率。第二部分的实际内容是提出方案、评价方案和筛选方案,以得到最优方案为结果。第三部分是对最优方案进行评价,目标是评价本次研究是否可以接受。

统计学模型构造

探测器响应模型

射线从放射源发出,到被探测器接收并被响应,这个过程可以分为三部分,并统一使用统计学知识进行描述。第一部分是射线在飞行过程中的衰减过程,第二部分是进入探测器的有效探测面,第三部分是被探测器响应。

第一部分与介于放射源和探测器之间的介质有关,使用指数衰减模型进行描述。

设定,探测器总数为,探测器的编号以为标志,坐标使用二元向量描述,第i个探测器的坐标为。

设定,放射源的总数为,放射源的编号以为标志,第i个放射源的坐标为、放射性强度为。由于本研究仅存在一个放射源,因此这个放射源的编号为,坐标为,放射性强度为。这两个参数中,为已知,仅未知,作为待估计变量。

设定,射线在材料中的衰减过程为指数衰减,衰减系数为,总宏观界面(the total macroscopic cross sections of material)为,表示某一指定位置,这样设置是考虑到在放射源与探测器之间,存在各种介质,比如空气、混凝土墙壁、树木、土壤等等,不同介质对射线的衰减效应不同。表示向量的距离,也就是的二范数,或者欧几里得距离。

在本研究背景下,设定材料仅为空气,并且不考虑射线的能量对衰减系数的影响,也就是认为已知,并且在任何位置均相等。

第二部分与探测器有效探测面积有关。默认放射源发射粒子的方向是各向同性,在二维空间中,也就是方向发射。探测器与放射源距离为,探测器的有效探测面积为,设定探测器的有效探测面的法线平行于探测器与放射源的连线,则所有释放出来的光子中,可以进入探测器有效探测面的数量表示如下。

第三部分与探测器的固有探测效率有关。并不是所有进入探测器的光子都能被探测器探测,对于一个能量的光子,探测器能够探测到的光子数量比例是一个固定值,称为固有探测效率,以表示。被第i个探测器测量到的光子数量表示如下。

综合上面三个部分,从S0号放射源释放的光子,能够被第i个探测器测量到的数量表示如下。
I_{Di,S0,Expected} = I_{S0} \cdot exp(- \Sigma \cdot \left\| \boldsymbol{r_{S0}}-\boldsymbol{r_{Di}} \right\|_2^2)\cdot \frac{A_{Di}}{4\pi \left\| \boldsymbol{r_{S0}}-\boldsymbol{r_{Di}} \right\|_2^2} \cdot \epsilon_{Di}

泊松分布和光子的观测概率模型

探测器对单个光子的响应过程遵循二项分布,而在观测过程中,探测器会对数量极大的光子群进行响应,并且在本研究中认为光子之间互相独立,则整个观测过程是遵循泊松分布的。

第Di个探测器对第Si个放射源的响应数量,也就是观测到的光子数量为,而理论上应该观测到的数量为,这种事件的发生概率可以使用泊松分布进行计算。

单放射源多探测器观测的概率模型

按照本研究的设定,环境中只有一个放射源,探测器的数量不止一个,并且分布于环境中的不同位置。假设经过一次观测,则每一台探测器都有一个属于自己的观测数值,也就是对光子的响应次数。设定,放射源编号S0;探测器编号从D0开始,至DN-1;编号为Di的探测器,所观测到的响应次数为,理论上这台探测器的响应次数为。对于这种设定下的观测结果,可以将每一个探测器的观测事件发生概率进行累积,并且以乘法的方式累积,用以表示本次观测的总概率,其计算方法如下。

似然函数的构造

似然函数指以观测数值为条件,放射源的第Plani种分布情况为结果的概率,以表示,可以发现,似然函数就是上一节所描述的概率模型,。

基于极大似然估计的定位方法

假设目前存在PlanN种放射源位置的方案,则每一种方案都对应一个似然函数。极大似然估计的思想是通过比较这些方案的似然函数,找出最大似然函数所对应的方案,就认为该方案为放射源坐标的解。

统计学模型求解-方案的提出、评价和筛选

基本求解方法介绍

根据前文的分析,定位研究只剩下一个问题——方案的获得,而获取方案的方法有很多,为方便理解,将方法分为数值方法和统计学方法,这种划分方法不严谨,后文可以看到,一些具体算法同时采用了数值方法和统计学方法,如模拟退火。

综合上文介绍,统计学模型的求解过程可以归纳为方案的获取和方案的比较。统计学方法首先构造尽可能丰富的备选方案,形成一个可数的方案集合,再通过似然函数的计算和比较选取最合适的方案,也就是导致似然函数最大的方案。而数值方法则从似然函数出发,认定最适合的方案存在于似然函数的极值处,并且是在全局范围内致使似然函数最大的极值处,由此使用寻找极值的方法。

数值方法将似然函数视作一个多自变量的函数,在本研究背景下,自变量为放射源S0的坐标。似然函数的最大值是其极值之一,只需要找到致使似然函数极值最大的自变量,就认为是正确的解。在这里,数值方法可以分成两派,一派是首先找到所有极值,再通过比较确定最大的极值,也称为全局最优解,以模拟退火算法为代表;另一派只寻找一个极值,这个极值一般是最靠近自变量初始值的,以梯度下降法为代表。

统计学方法的基本思路是构造所有可能的方案,在本研究背景下,就是构造所有可能的位置,作为放射源位置的备选方案。在这种设计下,正确的放射源坐标自然属于构造出的方案,并且正确的方案对应的似然函数必然最大,所以只需要计算所有方案的似然函数,找到最大似然函数和其所对应的方案,就可以认为这个方案是正确的解。

蒙特卡罗(MC)方法介绍

理论上,所有可能的位置方案有无限个,如果通过列举位置的方式,是无法达到便利所有可能方案的。在研究中,经常采用随机抽样的方式来获取备选方案,虽然理论上获得所有方案需要无限长的时间,但是在真实求解中,往往认为在有限时间内获得的方案即可以代表全部方案,这种随机采样的方法称为蒙特卡罗方法。

蒙特卡罗方法是一种基本的统计学方法,在其基础上衍生出重要性采样的蒙特卡罗方法、马尔可夫链蒙特卡洛方法、模拟退火等方法。注意,虽然在上文介绍中,将模拟退火方法作为数值方法介绍,但其算法流程中包含了蒙特卡罗的随机采样过程,因此其本身并不能单纯地归类,而是一种综合方法。

考虑本研究的初衷是示范放射源定位流程,为了确保模型构造、模型求解和方案评价三个方面都能得到良好介绍,在各个方面的流程中都使用最简洁的方法。由此,最本质的蒙特卡罗方法是适合使用的,因为最本质的蒙特卡罗方法仅仅从随机采样出发,不添加任何辅助操作,保持了方法的简明。

蒙特卡罗方法产生放射源位置方案

虽然本研究的目标是估计放射源的位置,但可以根据经验提出放射源位置的出现范围。由于是经验性的,这个范围可以很大,但这并不影响蒙特卡罗方法的使用。

使用笛卡尔坐标系描述放射源所在平面,以相互正交的X轴和Y轴组成坐标系,设定放射源的实际位置表示为,经验性的范围可以表示如下。

由于上文的经验性设置,方案的坐标必须满足范围限制。

蒙特卡罗的思路是使用随机数产生备选方案,这里可以选用符合均匀分布的随机数生成器分别为两个分量制作随机数。

均匀分布的随机数生成器是一个常用工具,在很多数学软件和C/C++以及Python数学库中都有提供,尤其是(0,1)均匀分布。这里假设拥有(0,1)均匀分布的随机数生成器,演示如何生成指定区间的均匀分布。

至此,已经介绍了编号Plani的方案的生成方式,对于所有备选方案,通过重复该操作即可获得。由于随机采样的概率特性,方案获取的越多,越能接近真实的解。

方案评价和筛选

本研究的方案指放射源的坐标,而且只有一个放射源,所以编号为Plani的方案是 。

方案的评价原理是依靠统计学模型,在本研究中就是一个泊松分布,也就是前文所述的似然函数,以方案中的放射源坐标为期望,以探测器实际观测得到的响应次数为观测结果,代入泊松分布并计算概率值,得到的概率值就是当前方案的评价。

这里,再列写一遍方案的概率计算方程,实际就是似然函数的定义式,但是这里强调针对编号Plani的方案。

I_{Di,S0,Plani,Expected} = I_{S0} \cdot exp(- \Sigma \cdot \left\| \boldsymbol{r_{S0,Plani}}-\boldsymbol{r_{Di}} \right\|_2^2)\cdot \frac{A_{Di}}{4\pi \left\| \boldsymbol{r_{S0,Plani}}-\boldsymbol{r_{Di}} \right\|_2^2} \cdot \epsilon_{Di}

通过比较所有方案的概率值,选取最大概率值所对应的方案,假设为方案编号为PlanBest,则该方案所对应的放射源坐标就是最优解。

最优方案评价

方案的评价是本研究的最后一步工作,目标是以最优方案代表整个研究过程,以最优方案的评价代表整个研究过程的评价,得出本次研究是否可以接受。

最优方案的概率可以表示如下。

定位实验

观测数据的模拟和获取

定位问题是以观测数据为已知,真实环境中,观测数据是指探测器的响应次数,这是是通过实验获取的。但是我没有探测器,也没有放射源,就算有,我也懒得用。因此,本研究使用模拟软件Geant4对探测器的实验过程进行模拟,并获得观测数据。

设定放射源位于(1m, 2m, 0m)位置,放射性强度为1e9,也就是在模拟中放出的光子数,光子能量0.662MeV,发射方向在3D空间中各向同性。

设定使用HPGe探测器,其灵敏材料为Ge晶体,其几何形状为立方体,几何尺寸为(5cm, 5cm, 8cm)。一共使用20个HPGe探测器,分别放置于20个位置,编号为Di的探测器的坐标。

为了方便了解,附上模拟程序中构造探测器坐标的代码。

double tarlocationx_Detector = -5.*m;
double tarlocationy_Detector = -5.*m;
double tarlocationz_Detector = 0.;    

for(int i=0;i<10;i++)
{   
        tarlocationx_Detector += (1.*m);
        tarlocationy_Detector = -3.*m;
        std::string nameTemp1 = "Detector" + std::to_string(10*0+i);
  
        tarlocationy_Detector = 3.*m;
        std::string nameTemp2 = "Detector" + std::to_string(10*1+i);
}

蒙特卡罗模拟得到的是各个探测器内光子发射事件的能量沉积过程,再对这些能量沉积过程进行统计和筛选,最终得到每一个探测器的响应次数,也就是观测数据。

统计学模型构造实例

探测器响应模型实例

探测器响应模型考虑三个物理过程,光子在材料中的衰减过程、探测器的有效探测面积造成的几何探测效率、探测器的固有探测效率。这三个物理过程对应计算探测器响应次数期望值的三个部分。

首先讨论第一部分,射线在空气中的衰减作用是光子与材料的相互作用的宏观体现。本研究所采用的光子能量为0.662MeV,这个能量的光子与空气中的各种组成元素独立发生反应,更加严谨地说,应该是与空气中的各种同位素独立发生反应。反应截面,也就是反应概率,较高的反应包括三种,光电效应、康普顿散射、电子对效应。其中,电子对效应需要光子能量在1.022MeV,也就是两倍的电子质量能量,以上才可能发生,因此,本研究环境下,光子能量不足以发生电子对效应,只能发生光电效应和康普顿效应。

由于空气的组成成分,主要包括H、O、N,对0.662MeV光子而言,发生光电效应和康普顿散射的截面很低,探测距离也没有长到可以明显衰减光子数量,由此,在粗略估计时,可以认为不发生光电效应和康普顿散射这些反应,也就是无衰减,衰减系数为0。

实际上是我懒得再针对光子在空气中的衰减系数进行模拟了,但如果最优方案对观测数据的符合程度不行,那么还是要回来估计衰减系数。

其次讨论第二部分,几何探测效率。使用探测器在X和Z轴的面代表编号为Di的探测器的有效探测面,则有效探测面积为。由于设定中,所有探测器都一致,因此每一个探测器的有效探测面积都是。

放射源实际坐标为,放射源到编号为Di的探测器的距离,计算方程如下。

使用二范数代表距离,以简化表达。

但是,在极大似然估计中,并不知道真实坐标,而是以每个方案下的假想坐标代替真实坐标,对编号为Plani的方案,其假想坐标为,其距离。

最后讨论第三部分,探测器固有探测效率。虽然固有探测效率与探测器接收到的光子能量有关,但是本研究简化处理,设定固有探测效率为定值,具体设定为10%。

综合上面三个部分,在Plani中,从S0号放射源释放的光子,能够被第i个探测器测量到的数量表示如下。

观测概率模型实例

以泊松分布描述方案对观测数据的符合程度,对编号Plani的方案,其符合程度计算如下。

其中,是探测器响应次数的观测数据,在本研究中,就是通过Geant4蒙特卡罗模拟软件获得的;是探测器响应次数的期望值,根据真实的放射源坐标计算得到。

单放射源似然函数实例

似然函数指以观测数值为条件,放射源的第Plani种分布情况为结果的概率,以表示。

方案筛选实例

在本研究中,方案规定了放射源的坐标,不同方案,坐标不同。但是,各个方案中,探测器的观测数据都是相同的,探测器的坐标也是相同的。由此,不同方案的似然函数中,处于分母的阶乘相同,因为这个阶乘仅仅与观测数据有关,在比较方案的符合程度时,可以省略分母部分,也就是阶乘部分。

由于泊松分布是一个适合贴近幂函数形式的分布函数,这里的似然函数也是以累乘形式构造,整体上可以通过求对数的方法简化函数,因此,构造一个似然函数的自然对数,。

将阶乘部分省略,得到似然函数的核心部分。

这样处理之后,可以避免似然函数的计算超过计算机存储范围。

你可能感兴趣的:(放射源定位范例-基于极大似然估计和简单蒙特卡洛方法的单放射源定位研究)