【Image captioning】自用数据集预处理并提取Resnet特征

自用数据集预处理并提取Resnet特征

作者:安静到无声 个人主页

目录

  • 自用数据集预处理并提取Resnet特征
    • 将uic_coco.json转换为uictalk.json和uictalk_label.h5
    • Resnet特征提取
    • 推荐专栏

注意本文的所使用的数据集是我自己创作的uic自有集。

将uic_coco.json转换为uictalk.json和uictalk_label.h5

目的:对原始的 JSON 数据集进行预处理,将其转换成一个 HDF5 文件和一个 JSON文件,以供数据加载器使用。在此过程中,它将对图像的标注信息进行一些基本预处理(例如,转为小写、添加 UNK 标记等),创建一个特殊的 UNK 标记,并将所有标注信息编码为数组形式。最终生成的 HDF5 文件包含了多个字段,包括所有标注信息的编码数组以及每张图像标注信息的起始和终止指针;JSON 文件则包含了词汇表和一些辅助信息,如图像所属的数据集分割等。

修改程序prep

你可能感兴趣的:(手把手实现Image,captioning,深度学习,人工智能,机器学习)