我是搞视觉SLAM的,在很久之前我和一位视觉SLAM大佬交流过,视觉SLAM难以落地原因有很多,其中之一就是环境光照对SLAM系统有较大的影响,而在实际的应用过程中,我们很难去真正控制环境中的光照变化,尤其是在室外。因此如何使得输入SLAM系统的图像具备稳定的光照就是非常值得研究的,而自动曝光就是其中一个非常重要的解决方案。这就是我这几天在家看这几篇论文的出发点。
自动曝光的过程是一个经典的反馈控制过程。
首先,既然是控制我们就需要知道控制的是什么,对于一般的相机来说,和曝光相关的参数配置有光圈、曝光时间、增益等,其中光圈的配置必须通过硬件实现,因此在实际操作过程中一般只控制曝光时间和增益来实现自动曝光。
其次,既然是反馈我们就需要建立一个标准来衡量曝光程度的优劣,而这个衡量标准定义的不同则意味着自动曝光算法的不同,下文就是据此对自动曝光算法进行分类,分别是基于直方图统计的算法、基于图像熵的算法、基于梯度的算法。
基于直方图统计的算法相关文章较多,而且都比较旧想法也比较简单,下面这些文章都是基于直方图统计的算法:
(1)An Advanced Video Camera System with Robust AF, AE, and AWB Control,2001
(2)Real-time Image Fusion and Adaptive Exposure Control for Smart Surveillance Systems,2007
(3) 2.3 Automatic Camera Exposure Control,2007
(4) 2.4 Autonomous Configuration of Parameters in Robotic Digital Cameras,2009
这里只对下面这篇比较新的一篇论文进行分析:
这篇文章主要描述的是一个在农用机器人上应用的实际场景,最终目的是通过自动曝光实现农用机器人更加准确地识别稻田里面的特征。对于自动曝光算法,其在图像直方图的基础上有了进一步的改进,算法框架如下图所示:
除了通过图像直方图计算曝光时间外,还会通过直方图匹配对曝光后的图像进行进一步优化。这篇文章采用的归一化直方图,首先计算: μ n ( g ) = ∑ ε ( g − m ) n p ( g ) with m = ∑ s g ⋅ p ( g ) \mu_{n}(g)=\sum_{\varepsilon}(g-m)^{n} p(g) \text { with } m=\sum_{s} g \cdot p(g) μn(g)=ε∑(g−m)np(g) with m=s∑g⋅p(g)其中 g g g的即直方图的横坐标,其范围是 0 0 0到 255 255 255, p ( g ) p(g) p(g)是横坐标 g g g在直方图中对应的值, m m m是平均值在此基础上可以计算方差 v = μ 2 ( g ) v=\mu_{2}(g) v=μ2(g)、偏度 γ = μ 3 ( g ) μ 2 − 3 / 2 ( g ) \gamma=\mu_{3}(g) \mu_{2}^{-3 / 2}(g) γ=μ3(g)μ2−3/2(g)和峰度 κ = μ 4 ( g ) μ 2 − 2 ( g ) \kappa=\mu_{4}(g) \mu_{2}^{-2}(g) κ=μ4(g)μ2−2(g),这篇文章中用于Decision making的两个参数是平均值 m m m和偏度 γ \gamma γ,如下所示:
while ( m i ≥ m u i and γ i ≥ ∣ γ u i ∣ ) or ( m i ≤ m l i and γ i ≥ γ l i ) \text{ while } \left(m_{i} \geq m_{u i} \text { and } \gamma_{i} \geq\left|\gamma_{u i}\right|\right) \text{or} \left(m_{i} \leq m_{l i} \text { and } \gamma_{i} \geq \gamma_{l i}\right) while (mi≥mui and γi≥∣γui∣)or(mi≤mli and γi≥γli) E T = ( m R r e f + m G r e f m R + m G ) E T c u r r E T=\left(\frac{m_{R r e f}+m_{G r e f}}{m_{R}+m_{G}}\right) E T_{c u r r} ET=(mR+mGmRref+mGref)ETcurr其中 m i m_{i} mi和 γ i \gamma_{i} γi为图像第 i i i个通道的均值和偏度(红绿蓝三个通道,但是由于农用场景的限制,这篇文章只考虑红和绿两个通道), m u i m_{u i} mui和 m l i m_{l i} mli分别是均值的最大最小边界, γ u i \gamma_{u i} γui和 γ l i \gamma_{l i} γli分别是偏度的最大最小边界。 m R r e f m_{R r e f} mRref和 m G r e f m_{G r e f} mGref分别为参考图像的直方图平均值,通过上式就可以计算出优化后的曝光时间,即ET modification中的过程。
如果在Decision making中判定不需要进行曝光时间优化后就可以直接进行Image quality Improvement,其流程是分别计算输入图像和参考图像的直方图的累加概率 P ( g r ) = ∑ i = 0 ε s p ( g i ) and P ( g c ) = ∑ i = 0 R p ( g c ) P\left(g_{r}\right)=\sum_{i=0}^{\varepsilon_{s}} p\left(g_{i}\right) \text { and } P\left(g_{c}\right)=\sum_{i=0}^{R} p\left(g_{c}\right) P(gr)=i=0∑εsp(gi) and P(gc)=i=0∑Rp(gc)通过累加概率进行匹配,然后搜索最接近的 P ( g r ) P\left(g_{r}\right) P(gr)值,然后用 g r g_{r} gr改变 g c g_{c} gc(这里论文中是这么说的,但是具体如何改变并没有举例说明,具体怎么实现的会有点不清楚)。
基于熵的自动曝光算法相关的文章好像并不多,目前就找到这一篇比较有代表性的:
这篇文章主要是介绍了一种基于图像熵的摄像机参数自动调节技术,根据香农定理信息内容可以通过熵进行描述,并且熵可以随着信息内容增加而增大。在RGB色域中计算图像熵,公式如下: Entropy = − ∑ i = 0 L − 1 P R i log P R i − ∑ i = 0 L − 1 P G i log P G i − ∑ i = 0 L − 1 P B i log P B i \begin{aligned} \text {Entropy}=&-\sum_{i=0}^{L-1} P_{R i} \log P_{R i}-\sum_{i=0}^{L-1} P_{G i} \log P_{G i}-\sum_{i=0}^{L-1} P_{B i} \log P_{B i} \end{aligned} Entropy=−i=0∑L−1PRilogPRi−i=0∑L−1PGilogPGi−i=0∑L−1PBilogPBi其中, L = 256 L=256 L=256为RGB颜色通道的离散范围, P R i , P G i , P B i P_{R i}, P_{G i}, P_{B i} PRi,PGi,PBi分别是颜色 R i , G i , B i R i, G i, B i Ri,Gi,Bi在图像中的概率,由上式可知 0 = Min ( Entropy ) ≤ Entropy ≤ Max ( Entropy ) = − 3 ∗ ∑ i = 0 255 ( 1 / 256 ) log ( 1 / 256 ) = 16.6355 0=\operatorname{Min}(\text { Entropy }) \leq \text { Entropy } \leq \operatorname{Max}(\text { Entropy })=-3 * \sum_{i=0}^{255}(1 / 256) \log (1 / 256)=16.6355 0=Min( Entropy )≤ Entropy ≤Max( Entropy )=−3∗i=0∑255(1/256)log(1/256)=16.6355文章中提到控制的参数为曝光时间和增益,那么通过实验可以测得图像熵随曝光时间和增益这两个参数变化的趋势如下图所示:
其中图中蓝色背脊线上的参数都是可以接受的,但是如上图所示的这种三维图是不方便搜索最佳参数的,因此在实际应用中,将曝光时间和增益设置为相同的数值,这样就可以将三维图转化为如下图所示的二维图:
其中图(a)是室内测得的图像熵随参数变化的曲线,图(b)是室外测得的图像熵随参数变化的曲线,如图所示,图像熵随着参数呈单调递增再单调递减的变化趋势。因此搜索就变得简单,可以从一个较低的曝光时间和增益开始,以一定的步长朝峰值搜索,直到下一步的图像熵小于当前步,那么就寻找到了最优的曝光和增益。
这是最近几年比较热门的一种算法,起码对于SLAM来说,实验证明这些算法是有效的,这里分享两篇方法比较类似的文章:
题目直抒胸臆呀,就是通过自动曝光控制提高视觉里程计在高动态环境下的鲁棒性。这篇文章中提出了在视觉里程计中应用自动曝光需要解决的问题是,一方面需要最大化图像信息,另一方面需要补偿由于曝光时间调整带来的时间差。
首先解决第一个问题,如何最大化图像信息,首先论文中定义了光度响应函数 I = f ( X ) = f ( E Δ t ) I=f(X)=f(E \Delta t) I=f(X)=f(EΔt)其中, I I I为图像的光照强度,辐照度 E E E描述了单位时间射入像素的能量, Δ t \Delta t Δt为曝光时间,而这个函数本身 f f f是很难有具体的表达式的,这也就是为什么在自动曝光系统中采用的多是反馈控制算法,如果有了光度响应函数的具体表达式,我们就可以通过这个表达式直接获得合适的曝光时间。在此基础上定义了逆响应函数 g = ln f − 1 g=\ln f^{-1} g=lnf−1这个逆响应函数并不是直接对响应函数求逆,那么光度响应函数的逆响应函数如下: g ~ ( I ) = ln E + ln Δ t \tilde{g}(I)=\ln E+\ln \Delta t g~(I)=lnE+lnΔt我们通过采集不同的曝光时间 Δ t \Delta t Δt的图像,并计算图像的光照强度 I I I,这样就可以看做获得了一组离散数据 g ( k ) , k = 0 , 1 , … , Z max g(k), k=0,1, \ldots, Z_{\max } g(k),k=0,1,…,Zmax,然后利用这组数据采用十阶的多项式函数进行拟合函数 g g g,获得函数 g g g后可以进一步函数的微分形式 g ′ g^{\prime} g′,如下图所示就是这样一条曲线:
有了这个基础后,下面进一步建立曝光程度的评价标准,论文中建立了四种标准,并对标准进行了讨论对比,首先将像素 u \mathbf{u} u的梯度幅值定义为: G ( I , u , Δ t ) = ∥ ∇ I ( u , Δ t ) ∥ 2 G(\mathbf{I}, \mathbf{u}, \Delta t)=\|\nabla \mathbf{I}(\mathbf{u}, \Delta t)\|^{2} G(I,u,Δt)=∥∇I(u,Δt)∥2其中 ∇ I ( ⋅ ) = [ ∂ I ∂ x , ∂ I ∂ y ] \nabla \mathrm{I}(\cdot)=\left[\frac{\partial \mathrm{I}}{\partial x}, \frac{\partial \mathrm{I}}{\partial y}\right] ∇I(⋅)=[∂x∂I,∂y∂I],那么四种标准分别是:
(1)直接求和: M s u m = ∑ u i ∈ I G ( u i ) M_{\mathrm{sum}}=\sum_{\mathbf{u}_{i} \in \mathrm{I}} G\left(\mathbf{u}_{i}\right) Msum=ui∈I∑G(ui)
(2)对数求和: M s h i m = ∑ u i ∈ I m u i M_{\mathrm{shim}}=\sum_{\mathbf{u}_{i} \in \mathrm{I}} m_{\mathbf{u}_{i}} Mshim=ui∈I∑mui其中 m u i = { 1 N log ( λ ( G ~ ( u i ) − σ ) + 1 ) , G ( u i ) ≥ σ 0 , G ( u i ) < σ m_{\mathbf{u}_{i}}=\left\{\begin{array}{ll} {\frac{1}{N} \log \left(\lambda\left(\tilde{G}\left(\mathbf{u}_{i}\right)-\sigma\right)+1\right),} & {G\left(\mathbf{u}_{i}\right) \geq \sigma} \\ {0,} & {G\left(\mathbf{u}_{i}\right)<\sigma} \end{array}\right. mui={N1log(λ(G~(ui)−σ)+1),0,G(ui)≥σG(ui)<σ这种评价标准在下一篇论文中作更加详细的分析。
(3)百分位数 M p e r c ( p ) = percentile ( { G ( u i ) } u i ∈ I , p ) M_{\mathrm{perc}}(p)=\text { percentile }\left(\left\{G\left(\mathbf{u}_{i}\right)\right\}_{\mathbf{u}_{i} \in \mathrm{I}}, p\right) Mperc(p)= percentile ({G(ui)}ui∈I,p)其中, percentile \text { percentile } percentile 函数是求百分位数,例如当参数 p p p 为0.5时,那么 M p e r c ( p ) M_{\mathrm{perc}}(p) Mperc(p)就是所有梯度幅值中的中位数。
(4)软百分位数 M softperc ( p ) = ∑ i ∈ [ 0 , S ] W i h ( p ) ⋅ G i t h M_{\text {softperc }}(p)=\sum_{i \in[0, S]} W_{i \mathrm{h}}(p) \cdot G_{i \mathrm{th}} Msoftperc (p)=i∈[0,S]∑Wih(p)⋅Gith其中 S S S为图像中所有像素的数量, G i t h G_{i \mathrm{th}} Gith为排好序的梯度幅值,而权重 W i h W_{i \mathrm{h}} Wih定义如下: W i h = { 1 N sin ( π 2 [ p ⋅ S ] i ) k , i ≤ ⌊ p ⋅ S ⌋ 1 N sin ( π 2 − π 2 i − ⌊ p ⋅ S ⌋ S − ⌊ p ⋅ S ⌋ ) k , i > ⌊ p ⋅ S ⌋ W_{i \mathrm{h}}=\left\{\begin{array}{ll} {\frac{1}{N} \sin \left(\frac{\pi}{2[p \cdot S]} i\right)^{k},} & {i \leq\lfloor p \cdot S\rfloor} \\ {\frac{1}{N} \sin \left(\frac{\pi}{2}-\frac{\pi}{2} \frac{i-\lfloor p \cdot S\rfloor}{S-\lfloor p \cdot S\rfloor}\right)^{k},} & {i>\lfloor p \cdot S\rfloor} \end{array}\right. Wih=⎩⎪⎨⎪⎧N1sin(2[p⋅S]πi)k,N1sin(2π−2πS−⌊p⋅S⌋i−⌊p⋅S⌋)k,i≤⌊p⋅S⌋i>⌊p⋅S⌋其中符号 ⌊ ⋅ ⌋ \lfloor\cdot\rfloor ⌊⋅⌋为向下取整。
在论文中,通过对比FAST角点在各自标准下最优图像提取数量进行实验对比,发现百分位数标准和软百分位数标准提取数量会更多,然后还通过下面这张图进行图进行直观效果说明,我觉得很有意思:从上到下分别是四个评价标准计算的值随曝光时间的变化曲线,可以看到,前两者是随着曝光时间单调上升,而在最顶点是已经出现了过曝光的情况,后两者则不会,曲线有极大值,而在极大值时图像曝光对于细节的保留确实较优。
最后说明如何根据评价标准和光度响应函数进行自动曝光控制了,那么要做的就是将评价标准 M M M对曝光时间 Δ t \Delta t Δt求导,然后通过梯度下降法求得极大值,那么不管采用上面哪种评价标准,中间都包括求 ∂ G ( ⋅ ) ∂ Δ t \frac{\partial G(\cdot)}{\partial \Delta t} ∂Δt∂G(⋅),那么有 ∂ G ( ⋅ ) ∂ Δ t = 2 ∇ I ( u , Δ t ) ⊤ ∂ ∂ Δ t [ ∇ I ( u , Δ t ) ] \frac{\partial G(\cdot)}{\partial \Delta t}=2 \nabla \mathbf{I}(\mathbf{u}, \Delta t)^{\top} \frac{\partial}{\partial \Delta t}[\nabla \mathbf{I}(\mathbf{u}, \Delta t)] ∂Δt∂G(⋅)=2∇I(u,Δt)⊤∂Δt∂[∇I(u,Δt)]根据二阶导数的对称性,有 ∂ ∂ Δ t [ ∇ I ( u , Δ t ) ] = ∇ [ ∂ ∂ Δ t I ( u , Δ t ) ] \frac{\partial}{\partial \Delta t}[\nabla \mathbf{I}(\mathbf{u}, \Delta t)]=\nabla\left[\frac{\partial}{\partial \Delta t} \mathbf{I}(\mathbf{u}, \Delta t)\right] ∂Δt∂[∇I(u,Δt)]=∇[∂Δt∂I(u,Δt)]求 ∂ I ∂ Δ t \frac{\partial \mathbf{I}}{\partial \Delta t} ∂Δt∂I就需要用到我们前面提到的光度响应函数 ∂ I ∂ Δ t = f ( E ( u ) Δ t ) ∂ Δ t = f ′ ( E ( u ) Δ t ) E ( u ) = f ′ [ f − 1 ( I ) ] E ( u ) = E ( u ) [ f − 1 ] ′ ( I ) = 1 g ′ ( I ) Δ t \frac{\partial \mathbf{I}}{\partial \Delta t} = \frac{f(E(\mathbf{u}) \Delta t)}{\partial \Delta t} =f^{\prime}\left(E(\mathbf{u}) \Delta t\right) E(\mathbf{u})=f^{\prime}\left[f^{-1}(\mathbf{I})\right] E(\mathbf{u})=\frac{E(\mathbf{u})}{\left[f^{-1}\right]^{\prime}(\mathbf{I})} = \frac{1}{g^{\prime}(\mathbf{I}) \Delta t} ∂Δt∂I=∂Δtf(E(u)Δt)=f′(E(u)Δt)E(u)=f′[f−1(I)]E(u)=[f−1]′(I)E(u)=g′(I)Δt1其中,最后一个等式是因为前面定义的逆响应函数 g ( I ) = ln f − 1 ( I ) g(\mathbf{I})=\ln f^{-1}(\mathbf{I}) g(I)=lnf−1(I)那么对 g g g求导有 g ′ ( I ) = [ f − 1 ] ′ ( I ) f − 1 ( I ) = [ f − 1 ] ′ ( I ) E ( u ) Δ t g^{\prime}(\mathbf{I})=\frac{\left[f^{-1}\right]^{\prime}(\mathbf{I})}{f^{-1}(\mathbf{I})} =\frac{\left[f^{-1}\right]^{\prime}(\mathbf{I})}{E(\mathbf{u}) \Delta t} g′(I)=f−1(I)[f−1]′(I)=E(u)Δt[f−1]′(I)将上式变形代入即可。因为 g ′ ( I ) g^{\prime}(\mathbf{I}) g′(I)在一开始就介绍了如何通过采样拟合求得,那么最终 ∂ G ( ⋅ ) ∂ Δ t \frac{\partial G(\cdot)}{\partial \Delta t} ∂Δt∂G(⋅)就可求得,就可以通过梯度下降法求得极大值。以 M softperc ( p ) M_{\text {softperc }}(p) Msoftperc (p)为例,我们可以求得其关于曝光时间 Δ t \Delta t Δt的导数有: ∂ M softperc ∂ Δ t = ∑ i ∈ [ 0 , S ] W i th ∂ G i t h ∂ Δ t \frac{\partial M_{\text {softperc }}}{\partial \Delta t}=\sum_{i \in[0, S]} W_{i \text { th }} \frac{\partial G_{i t h}}{\partial \Delta t} ∂Δt∂Msoftperc =i∈[0,S]∑Wi th ∂Δt∂Gith那么曝光时间的更新方式为: Δ t next = Δ t + γ ∂ M softpere ∂ Δ t \Delta t_{\text {next }}=\Delta t+\gamma \frac{\partial M_{\text {softpere }}}{\partial \Delta t} Δtnext =Δt+γ∂Δt∂Msoftpere 关于自动曝光的部分这篇文章就介绍到这里,文章后面一部分是进行曝光补偿,这个稍后介绍
这篇文章中提出要解决的问题一方面是如何进行基于图像梯度的自动曝光控制,另一方面是如果实现多相机联合曝光。
首先解决第一个问题,这篇文章提出,自然场景图像的梯度分布满足重尾分布,也就是场景中大部分梯度的幅值较小,大幅值梯度分布得少而离散。为了平衡梯度幅值与数量之间的关系,本文提出使用一个对数函数梯度进行映射: m ˉ i = { 1 N log ( λ ( m i − δ ) + 1 ) for m i ≥ δ 0 for m i < δ \bar{m}_{i}=\left\{\begin{array}{ccc} {\frac{1}{N} \log \left(\lambda\left(m_{i}-\delta\right)+1\right)} & {\text { for }} & {m_{i} \geq \delta} \\ {0} & {\text { for }} & {m_{i}<\delta} \end{array}\right. mˉi={N1log(λ(mi−δ)+1)0 for for mi≥δmi<δ其中, N = log ( λ ( 1 − δ ) + 1 ) N=\log (\lambda(1-\delta)+1) N=log(λ(1−δ)+1), m i m_i mi是像素 i i i 处的梯度幅值,可以看到当梯度小于阈值 δ \delta δ 时,梯度幅值映射为零。 λ \lambda λ是一个控制映射趋势的参数。 m ˉ i \bar{m}_{i} mˉi就代表梯度信息中和梯度幅值相关的部分,其输出控制在 0 0 0到 1 1 1。那么图像的曝光评价标准就定义为: M = ∑ m ˉ i M=\sum \bar{m}_{i} M=∑mˉi M M M越大说明曝光效果越好,图像中包含的信息越多。接下来说明如何进行曝光控制,在利用当前曝光时间获得的图像进行 γ \gamma γ矫正,即 I o u t = I i n γ I_{o u t}=I_{i n}^{\gamma} Iout=Iinγ,并求取最优的矫正值 γ ^ \hat{\gamma} γ^: γ ^ = arg max γ M ( I i n γ ) \hat{\gamma}=\arg \max _{\gamma} M\left(I_{i n}^{\gamma}\right) γ^=argγmaxM(Iinγ)具体操作是在 γ = [ 1 1.9 , 1.9 ] \gamma=\left[\frac{1}{1.9}, 1.9\right] γ=[1.91,1.9]的范围里选取一些列的 γ \gamma γ值对当前图像进行 γ \gamma γ矫正,并计算矫正后的曝光程度 M M M,然后利用五阶的多项式函数对这一系列离散值进行拟合,组中求得最优的矫正值 γ ^ \hat{\gamma} γ^,如下图所示:获得最优矫正值 γ ^ \hat{\gamma} γ^后通过更新函数就可以直接对曝光时间进行更新,更新函数分为线性更新函数和非线性更新函数:
线性更新函数: E t + 1 = ( 1 + α K p ( 1 − γ ^ ) ) E t , α = { 1 / 2 for γ ^ ≥ 1 1 for γ ^ < 1 E_{t+1}=\left(1+\alpha K_{p}(1-\hat{\gamma})\right) E_{t}, \alpha=\left\{\begin{array}{ccc} {1 / 2} & {\text { for }} & {\hat{\gamma} \geq 1} \\ {1} & {\text { for }} & {\hat{\gamma}<1} \end{array}\right. Et+1=(1+αKp(1−γ^))Et,α={1/21 for for γ^≥1γ^<1非线性更新函数: E t + 1 = ( 1 + α K p ( R − 1 ) ) E t s.t. R = d ⋅ tan { ( 2 − γ ^ ) ⋅ arctan ( 1 d ) − arctan ( 1 d ) } + 1 \begin{aligned} E_{t+1} &=\left(1+\alpha K_{p}(R-1)\right) E_{t} \\ \text { s.t. } \quad R &=d \cdot \tan \left\{(2-\hat{\gamma}) \cdot \arctan \left(\frac{1}{d}\right)-\arctan \left(\frac{1}{d}\right)\right\}+1 \end{aligned} Et+1 s.t. R=(1+αKp(R−1))Et=d⋅tan{(2−γ^)⋅arctan(d1)−arctan(d1)}+1其中 E t E_{t} Et是 t t t时刻的曝光水平,更新的最终结果是使得最优矫正值 γ ^ \hat{\gamma} γ^趋近与 1 1 1,这样就完成了整个反馈的控制。在此基础上,这篇文章一个很重要的贡献是实现了多相机的联合自动曝光,这里简单介绍下: E t + 1 i ∗ = arg min X α i ⋅ E u ( i , t ) + 1 − α i N ∑ j ∈ G ( i ) E p ( i , j , t ) s.t. E u ( i , t ) = ∥ X − E t + 1 i ∥ 2 E p ( i , j , t ) = ∥ X − r i j ⋅ E t i ∗ ∥ 2 r i j = median ( mean ( p j ) mean ( p i ) + ϵ ) , p ∈ P \begin{aligned} E_{t+1}^{i *}=& \underset{X}{\arg \min } \quad \alpha^{i} \cdot \mathcal{E}_{u}(i, t)+\frac{1-\alpha^{i}}{N} \sum_{j \in G(i)} \mathcal{E}_{p}(i, j, t) \\ \text { s.t. } & \mathcal{E}_{u}(i, t)=\left\|X-E_{t+1}^{i}\right\|^{2} \\ & \mathcal{E}_{p}(i, j, t)=\left\|X-r^{i j} \cdot E_{t}^{i *}\right\|^{2} \\&r^{i j}=\operatorname{median}\left(\frac{\operatorname{mean}\left(p^{j}\right)}{\operatorname{mean}\left(p^{i}\right)+\epsilon}\right), \quad p \in P \end{aligned} Et+1i∗= s.t. Xargminαi⋅Eu(i,t)+N1−αij∈G(i)∑Ep(i,j,t)Eu(i,t)=∥∥X−Et+1i∥∥2Ep(i,j,t)=∥∥X−rij⋅Eti∗∥∥2rij=median(mean(pi)+ϵmean(pj)),p∈P其中,优化函数将所需曝光量视为一元项 E u ( i , t ) \mathcal{E}_{u}(i, t) Eu(i,t),并将重叠区域中的亮度相似度作为成对项 E p ( i , j , t ) \mathcal{E}_{p}(i, j, t) Ep(i,j,t), P P P是两个相机之间的重叠区域,通过以上式为最优化目标进行优化操作就可以获得各个相机在联合自动曝光下最优曝光水平。
目前就看了这十篇左右的论文,看着看着又发现了近几年出的几篇很好的文章,是和SLAM相关的,考虑如何更好地将自动曝光算法和SLAM结合起来以提高系统的性能,很有意思。这篇博客就先写这么多,写得太长了自己都要看吐了,接下来把新的几篇论文看完再重新总结下,有问题欢迎交流~