(论文翻译)THE LOTTERY TICKET HYPOTHESIS: FINDING SPARSE, TRAINABLE NEURAL NETWORKS《彩票假说:寻找稀疏、可训练的神经网络》
公式不清楚的地方请对照英文原文进行查看:原论文链接ABSTRACT神经网络修剪技术可以将训练网络的参数计数减少90%以上,降低存储需求并提高推理的计算性能,而不影响准确性。然而,当代的经验是,通过修剪产生的稀疏架构从一开始就难以训练,这将类似地提高训练性能。我们发现,一个标准的修剪技术自然地发现子网络,其初始化使他们能够有效地训练。基于这些结果,我们阐明了彩票假说:密集的、随机初始化的、前馈网络包