本文是苏黎世理工学院Wood教授于2018年发表在《ACS Photonics》期刊上。我的初衷是找一篇深度学习与化学图谱结合在一起的文章,但是机器学习这篇对我的启发很大,帮助我如何结合机器学习(或者深度学习)和化学图谱。本来自己是做催化化学出身,好不容易从化学材料跳出来,没想到现在开始在分析化学的道理上越陷越深(笑哭)。
摘要
在理解和优化发光材料和光电材料器件方面,时间分辨光致发光光谱是最标准的技术之一。本文我们展示了一种机器学习代码分析时间分辨光谱数据,并且在没有前提条件的情况下,确定任何发射器的衰减速率分布。为了演示和证实我们的方法,我们分析了计算机生成的时间分辨光谱,展示了该方法在研究新型半导体纳米晶(量子点)荧光的优异性,它迅速地提供了对可能的发光物理机制的洞察,而不需要有根据的猜测和拟合。
正文
在发光动力学中隐藏着有关发射体电子结构的信息(包括缺陷态和光电子作用的出现),电子空穴对与自由电荷或束缚电荷的相互作用,在复杂材料中比如金属界面或在空腔内,由于材料位置导致的光子态密度偏差。在光子计数实验中通常记录光的发光动力学,从而产生了时间分辨光致发光光谱(TPRL)。为了研究TPRL数据,可以使用model-dependent和model-free两种策略。使用model-dependent模型时,将会使用多指数、拉伸指数或者对数正态分布模型来分析拟合TPRL数据。另一方面,使用model-free时为了恢复寿命分布,其中最值得注意的方法是指数采样方法(ESM),最大熵方法(MEM)和寿命分布分析(LDA)。
Figure 1说明了用拟合的TRPL数据推理假设衰减模型时存在的问题。Ag-In-Se纳米晶的TPRL数据用三种不同的模型进行拟合:双指数衰减(Figure 1a),三指数衰减(Figure 1b)以及单指数和拉伸指数混合衰减(Figure 1c)。双指数模型不能够很好的描述300ns以后的发射;但是统计显示(see Supporting Information)三指数和混合模型拟合效果都是一样好的,但是这两种拟合使用来描述两种完全不同的潜在物理模型。三指数模型意思是衰减速率分布是三个狄拉克δ函数的和,一种情景是由三种独特发射路径导致的。混合模型设定一个可以很好的解决发射过程,而另外一个发射通道代表一个宽阔的衰减速率分布。因为在此基础上Ag-In-Se纳米晶的电子结构和光学耦合不能很好地理解,这就不可能提前知道哪个模型是正确地。这个例子充分说明了一种不用推理,数据驱动分析TPRL曲线的必要性。
前人在分析TRPL数据方面的works。。。。。。
本文建立在先前文献和工具基础上,证实了无先验假设的机器学习方法去计算衰减速率分布的可能性。本文的方法使用泊松统计解决离散拉普拉斯转换,应用k-折交叉验证的正则化方法尽可能缩小预测误差。从Figure 1d中可以看出,Ag-In-Se纳米晶的衰减速率分布最好用混合模型描述。该拟合方式可以被研究人员应用,特别是更好的理解I-III-VI纳米晶的荧光原理。
本文提供了软件(LumiML)。本文使用计算机生成的TPRL数据证实了软件的合理性。然后还将其应用在来自于CsPbBr3 钙钛矿纳米晶的energy-resolved, ulrtrast emission。该机器学习方法证实neutral excitons (X), charged excitons (X*), and multiexcitons (XX)的复杂动力学。
前面废话了这么多,干货部分到来:
Determing the Decay Rate Distribution with Machine Learning
衰减率分布表征TRPL的发射体激发态可以用方程(1)描述:
(这个引用文献就可以了,2007年physic review)
根据这个方程的描述,时间分辨发射的分析经常要设定潜在分布ρ(Γ)。但是衰减率分布可以通过计算方程(1)得出ρ(Γ),它等于对测试信号I(t) 作拉普拉斯逆变换。
Γ函数简介:https://www.cnblogs.com/coshaho/p/9653460.html
本文确定ρ(Γ)的方法展示在Figure 2中,没有采用任何先验假设。方程(1)是一个很有名的弗雷德霍姆积分方程。该方程可以被转换为将衰减率分布扩展到一组基函数φi和系数βi的矩阵方程:
我们可以实现3个简单的基集:
δ(Γ)是狄拉克δ函数,θ(Γ)是赫维赛德阶跃函数(又称单位阶跃函数),χi(Γ)表示定义在区域[Γi-1,Γi+1]和居中在Γi(三角基)。衰减速率轴Γ∈[Γmin,Γmax]使用指数抽样离散。这样,我们的方法与标准的拟合过程有根本的不同:在这里,我们定义了一个衰减率(寿命)范围,该范围取决于实际测量的限制,然后使用之前给定范围的选择基础去计算衰减率分布。
通过选择的基础扩张φ(Γ)和衰减速率Γk数组,方程(1)的矩阵等价于:
其中γ是测量TRPL数据点的向量。
β是扩展系数。方程(4)是一个超定方程,因为在标准的TRPL实验中,有上千个数据点γ(矩阵X中的行数),而衰减率数组Γk中元素的合理数量通常小于50。另外,矩阵方程(4)来源于弗雷德霍姆积分方程,因此方程(4)是一个不适合的逆问题。也就是说对于矩阵X的inverse没有独特的解决方法。
为了找到最优向量系数β,我们使用机器学习算法。该库用Python 3 写的,叫做LumiML,并且是建立在已经存在的机器学习库scikit-learn。我们开源了LumiML。结果,优化的系数β通过线性回归找到,其中包括最小化一个目标函数。在这里,我们的目标函数是损失函数L的和,损失函数说明实验的基本统计数据,一个惩罚项P惩罚特定特定系数的值(引用文献24)。惩罚项的出现是由于正则化,被用来去获得一个方程(4)的稳定解法,并且可以防止过拟合。
在这里,我们选择负泊松对数似然函数作为损失函数(引用文献20):
估计值接近实际测量值时,L会变小。这个被称为最大似然评估。我们使用泊松统计(20-21),因为光子计数实验的数据点被认为时来自泊松分布的样本。
为了防止过拟合,我们使用弹性网络正则化(文献34)和一个惩罚项
论文的源码从github上download下来,只是代码的时间能力实在有限,因此本篇论文代码的实践等我学完《opencv+tensorflow入门人工智能图像处理》以及基础深度学习的方法再回来(画饼画饼)