【论文精读】Is Synthetic data from generative models ready for image recognition? 生成数据对图像识别的影响

【标题】扩散模型生成数据对图像识别的影响【论文精读】Is Synthetic data from generative models ready for image recognition? 生成数据对图像识别的影响_第1张图片

1. 总体介绍

发展现状: 扩散模型已经可以生成高质量的样本,之前有人研究过生成数据对cv的作用,但是局限于小领域和小规模。
研究目的: 扩散样本对视觉领域的作用,手工标注的样本昂贵、有隐私和安全风险。
探讨方向: 生成样本对cv有用,具体哪方面有用?实验分为三个部分,zero-shot、few-shot和pretrain

2. zero-shot

研究目的:多大程度上影响 & 如何更好的利用数据
【论文精读】Is Synthetic data from generative models ready for image recognition? 生成数据对图像识别的影响_第2张图片
【论文精读】Is Synthetic data from generative models ready for image recognition? 生成数据对图像识别的影响_第3张图片

3. few-shot

【论文精读】Is Synthetic data from generative models ready for image recognition? 生成数据对图像识别的影响_第4张图片

4. 预训练模型

【论文精读】Is Synthetic data from generative models ready for image recognition? 生成数据对图像识别的影响_第5张图片

5. 结论

合成数据可以促进image recognition,合成数据在预训练方面甚至超过imagenet。
局限性: 受限于资源无法计算更大尺寸,和图片大小

你可能感兴趣的:(深度学习,人工智能,深度学习)