diffusion中为什么神经网络要预测噪音

在diffusion中,有一个跟以往不一样的点,就是,他是预测噪音,随后剥离然后生成图像,但是为什么要这样做呢,我认为原因如下
预测噪音每一步都有前一步的基础,两张图片之间差的就是噪音而已,看上去是在预测噪音,实际上是把原图特征剥离出来,既然差距只有噪音,显然,预测噪音比预测原图容易多了

你可能感兴趣的:(神经网络,人工智能,深度学习)