论文1

==文献地址:==
https://arxiv.org/pdf/1907.01377.pdf

在这里插入图片描述

摘要

  • THz新兴技术,广泛用到不同应用场景。

  • 然而,为这些应用场景,提取可解释的和物理上有意义的参数,需要解决一个反问题:由这些参数确定的模型函数,需要拟合到测量数据。

  • 由于基础的优化问题是非凸的,求解成本很高,作者建议直接从实测数据中学习合适参数的预测

  • 更准确地说,作者开发了一个基于模型的自动编码器AE,
    ==编码器==——编码网络预测合适的参数,
    ==解码器==解码环节被固定到一个物理上有意义的模型函数上,这样我们可以在无监督的方式下训练编码网络

  • 作者用数值方法来说明,结果表明,
    ==优化速度==——网络的速度比经典的优化技术,快140多倍
    ==优化的目标值==——而预测的目标值,仅略高一些

  • ==论文的意义==
    使用这些预测的目标值,作为局部优化技术的起点,可以使我们在不使用基于网络的初始化的情况下,以大约两倍于优化的速度收敛到更好的局部最小值。

1、Introduction

  • ==【基于什么问题?】==
    在这里插入图片描述
  • 新兴传感技术,多个应用领域,有应用价值。
  • 然而,与上述应用相关的物理可解释量,并不总是可以直接测量的
  • 相反,在THz成像系统中,每个像素都隐含着这些物理量的信息。
  • 这使得从每个像素中推导这些物理量的逆问题(也就是说,每个像素怎么得到相关物理量?从相关物理量怎么得到各个像素?),成为一个具有高度现实意义且有难度的问题。
  • ==【公式1:有这样的参数P(X)关系】==
  • 在每个像素位置x上,所需(未知)参数之间的关系,
    在这里插入图片描述
  • ==【公式2:有这样的模型,。==
  • ,是一个设备相关的采样网格
    在这里插入图片描述
  • ==【公式3:要解决的参数优化问题】==
  • 通过反向传播算法,最小化损失函数时,四个参数的取值,是我们需要的。
    在这里插入图片描述

    考虑到像素的个数(n x*n y),即公式(3)所要解决的优化问题,一般是数十万到数百万的数量级,即使是损失函数的简单选择,如2平方损失(MSE),最终的拟合问题也是高度非凸的,全局解会变得相当昂贵
  • ==【论文怎么解决?】==
    在这里插入图片描述

    论文中,作者提出训练一个神经网络(基于模型的AE),来直接解决优化问题(无监督的预训练作为优秀的初始化方案)
    ——获得更低的损失Loss
    ——收敛速度比经典优化快2倍

2、THz成像系统

  • ==1——成像方式==
  • 实现THz成像,有几种方式,飞秒激光扫描系统、合成孔径系统、混合系统……
  • 典型的THz成像方法是基于调频的连续波(FMCW)的概念,
  • 它使用主动调频的THz信号,来感觉来自物体的反射信号。
    反射能量和由于信号路径长度引起的相位偏移使得三维THz成像成为可能
  • ==2——THz三维成像系统==
    在这里插入图片描述

发射机(Tx)和接收机(Rx)都安装在同一平台上。
成像单元由Tx、Rx和光学组件组成,使用步进电机和线性级沿x和y方向移动。
该成像单元在每个横向位置获取物体的深度剖面,以获得完整的图像太赫兹的3d图像

  • ==3——信号变换==

    在这里插入图片描述

  • ——表示FMCW系统横向位置,反射电场振幅的实测解调时域信号

  • ——在FMCW雷达信号处理中,通过傅里叶变换将连续波时域信号转换为频域信号[9,10]。

  • 由于线性扫频在z方向上的每个空间位置,都有唯一的频率,所以转换后的频域信号与空间方位(z方向)域信号直接相关

    在这里插入图片描述

  • 由此得到的三维图像是空间域中的复杂数据,表示THz能量的逐像素复反射率。

    在这里插入图片描述

  • 分别类似于垂直、水平和深度方向的离散化。同样地,我们可以通过把实部和虚部看作两个独立的通道来表示g c,得到一个4D的实数据张量

  • ==4——解释物理模型==

    在这里插入图片描述

  • A——电场振幅,是材料的反射系数,它依赖于材料的复介电常数,有助于对材料进行识别和分类。
    µ——深度位置,最大反射发生的位置,即,最大反射THz能量的表面位置
    σ——脉冲宽度,其中包括材料的色散特性的信息
    φ——反射波的相位,取决于材料的介电性能的实部、虚部之比
    w——频率
    z—— ,是一个设备相关的采样网格

  • 参数,包含实验对象的几何形状以及材料成像的重要信息

3、Related Work

4、基于模型的自编码器

  • ==1——==

  • 输入的THz数据,通过这样形式来表示,

    在这里插入图片描述

  • 考虑四个未知参数,在这样的像素矩阵中,允许在每个像素处改变每个参数

  • 4个参数,即,有4个参数矩阵,那么连接这四个参数矩阵成一个简单的参数张量矩阵P

    在这里插入图片描述

    那么,我们的目的就是,找到这样的P,使得输入数据g
    在这里插入图片描述

  • ==2——有监督==

  • 以THz图像重建为例,用经典的监督机器学习方法,解决已知前向算子的问题,如图所示

    在这里插入图片描述

  • 明确的前向模型,从已知参数P,用来模拟一个巨大的的图像集g。

  • 随后,被用作训练数据,通过取决于权重θ的神经网络,来预测参数P

  • 这种带有模拟训练数据的监督方法,常用于其他图像重建领域,如超分辨率[22,23]或图像去模糊[24,25]。

  • 然而,在模拟数据上训练的网络的准确性,关键依赖于对前向模型和模拟噪声的精确知识。在[26]中,当深度去噪网络训练高斯噪声时,BM3D在处理真实的传感器噪声时表现得更好。

  • ==3——论文所提无监督方法==

    在这里插入图片描述

  • 不是追求上述监督学习方法,我们将用一种神经网络来替换优化方法(3)中的。

  • 这个神经网络,取决于原始输入数据和可学的参数θ。可以用无监督的方式在真实的数据上进行训练。

  • 假设我们有多个THz数据的样本,并选择(3)中的损失函数作为‘2平方损失’,产生无监督训练问题

    在这里插入图片描述

  • 正如在图3中所示,这种训练类似于AE架构——网络的输入是数据,它被映射到参数P。参数P再输入到模型函数时,应该重构输出*,

    在这里插入图片描述

  • 与直接监督学习方法相比,所提出的无监督方法(5)有两个显著的优点:

    在这里插入图片描述

  • 允许我们用无监督的方式在真实数据上进行训练,

  • (5)中的代价函数隐式地处理不同参数的缩放,从而避免了在参数空间中定义有意义的代价函数的问题。如:简单的参数差异,就像
    2两组不同的参数P1和P2,在很大程度上取决于单个参数的缩放程度,甚至可能是毫无意义的,例如φ的相位差这样的循环参数。

5、网络的搭建和训练

5.1 数据预处理

  • 如图4,示例性测得的THz信号的幅值图如下所示,THz能量主要集中在sinc函数的主瓣和第一旁瓣
    在这里插入图片描述
  • 由于物理模型主要在主瓣的附近有效,我们通过裁剪一个小的窗口(通常是9个测量点宽度的窗口),
  • ==裁剪窗口==,是在每像素的12600个测量值的大范围外的窗口。在每个像素处,裁剪窗口集中在信号最大的位置。
  • 如上所述,我们将THz数据表示为4D实张量,其中,为裁剪窗口的大小,在本例中为91。

5.2 编码网络搭建与训练

  • ==1==
  • 编码器网络,选一个空间分离的架构,只在g上使用1×1的卷积,导致signal-by-signal的重建机制,允许高水平的并行性,因此最大限度地在GPU上提升重建速度
  • 具体的架构(如图5所示)——
  • 在连接激活之前,在实部和虚部分别应用第一组卷积滤波器,并在连接的结构上应用三个进一步的卷积滤波器。
  • 我们在每次卷积后使用批处理归一化(BN)[27],并使用漏整流线性单元(LeReLU)[28]作为激活剂。最后,全连接层将尺寸降低到每个像素四个输出参数的期望大小。确保振幅具有物理意义,即在非负的情况下,我们对第一个分量应用一个绝对值函数。有趣的是,当网络被训练时,这个选择与一个简单的直线单元相比是有利的。
  • 结构编码网络G (G;θ),预测参数:在每个像素提取实部和虚部,通过三卷积,卷积、连接和加工1完全连接层。为了获得物理上有意义的(非负的)振幅,我们对第一个分量应用一个绝对值函数
  • ==2==
    待续…………

6、数值实验

7、总结与展望

你可能感兴趣的:(论文1)