基于天池Better Synth多模态大模型数据合成挑战赛的多模态大模型数据合成(2) [Datawhale AI 夏令营]
目录官方Baseline学习小题外话数据合成训练小题外话(_关于服务器中的python文件在导入自定义模块中识别不出mgm文件位置情况_)关于Data-juicer参考资料官方Baseline学习再来回顾一下,该问题背景基于天池BetterSynth多模态大模型数据合成挑战赛,详细可以参考该链接。简而言之,本背景基于图片数据方面,在合成与清洗图文数据中提高多模态大模型的图片理解能力。基于Mini-