本文为数盟原创译文 转载请注明出处为数盟社区
深度神经网络,不仅通过他们的AI能力给人们留下深刻印象,也包括他们的艺术能力。最新的工作可以实现任何艺术家的风格,并且可以把现有的视频转换成这种风格。你必须看到它并且相信它。
神经网络是擅长分类的。例如,你可以使用一个训练过的神经网络将输入图像变形为一个可参考的绘画风格。其结果是,这个照片看起来好像是艺术家画出来的。
Kandinsky风格的星球大战
实际过程会比这更复杂一点,因为神经网络的学习功能是关于图像的内容,而不是风格信息。合理的假设是风格信息是在存在于特征关系之间的。风格化图像被输入到神经网络中,其像素被调整至最小化以减少损失,其中包括它的特征以及有多少从图像中得来的特征相关性被用作风格案例。注意,这不是对神经网络的直接应用,其意义不是神经网络学习了某位艺术家的风格——它只是提供了常用于表现这种风格的特征。
到目前为止还不错,但使用相同的技术打造一部某位艺术家风格的电影会怎样?如果您尝试了这个显而易见的方法,使用神经网络优化电影每帧的转接,那么你会发现结果并不是那么好,因为事情发生了变化——这之间没有了时间上的一致性。想要打造一部某位艺术家风格的好电影,你必须随着事件的发生变化在保持其时间一致性的基础上转换每一帧画幅。
这是Freiburg大学团队的调查方法。他们使用了一种深度神经网络的方法,来估计从一帧可见波动到下一帧可见波动所提供给你的帧之间是如何移动和变化的内容。这个想法是比较原始和重新设计的图像之间的可见波动,并且包含在优化中所使用的损失的误差。所以,现在的优化试图保持帧之间的变化、原始特征以及风格样式的关系图像都是相同的。
进行这样一个优化的具体细节是十分复杂的,你可以在报纸上看到它们。然而,值得一提的是,它是在一个Nvidia Titan X GPU上实施的,每个1024 x 436帧要花费大约八至十分钟。
现在你知道它是如何工作的了,看一看那个阐释了使用过程中产生的各种阻碍问题的视频。请注意其中开头部分风格跳跃的地方,它是不受优化限制的例子。
https://youtu.be/vQk_Sfl7kSc
这个视频技术性较低,但仍值得一看,你会赞赏它是如何进行良好运作的。
https://youtu.be/Khuj4ASldmU
所以它的确有趣,但是它实用吗?
你可能不希望把现有的影片重新定义成毕加索或“呐喊”的风格,但它开辟了用风格创造新电影的可能性。
原文链接:http://www.i-programmer.info/news/192-photography-a-imaging/9731-a-neural-net-creates-movies-in-the-style-of-any-artist.html