【image captioning】自定义image captioning数据集的格式整理(完整版)

自定义image captioning数据集的格式整理(完整版)

作者:安静到无声 个人主页

目录

    • 自定义image captioning数据集的格式整理(完整版)
    • 1. 数据集的整理
      • 1.1 将原始文件合并到uic_new_split(保证验证集和测试集数据是同步的)
        • 1.1.1 将原始测试集,验证集和训练集合并
        • 1.1.2 统计图片个数
        • 1.1.3 复制异常图片
      • 1.2 将合并文件划分新的训练,验证与测试
        • 1.2.1 创建文件夹(训练,测试和验证)
        • 1.2.2 按照比例将图片分配至三个文件夹下
        • 1.2.3 统计各文件夹图片个数
      • 1.3 更改uic.json的训

你可能感兴趣的:(手把手实现Image,captioning,人工智能,深度学习,机器学习)