Image captioning中自定义文本数据整理为类似Flickr8k.token.txt的格式--->助力后期生成JSON格式用于训练

手把手实现Image captioning,将自定义文本数据整理为类似Flickr8k.token.txt的格式,助力后期生成JSON格式用于训练。如果感觉有用,不妨给博主来个一键三连,白天科研,晚上肝文,实属不易~ ~
Image captioning中自定义文本数据整理为类似Flickr8k.token.txt的格式--->助力后期生成JSON格式用于训练_第1张图片](https://imgse.com/i/p9FmMDK)

这里写目录标题

  • 1. 任务需求
  • 2. 程序实现
    • 2.1 读取图片文件名与其含义的对应关系文件
    • 2.2 建立图片文件名与其含义的映射关系
    • 2.3 读取要处理的文本数据
    • 2.4 处理给定的咨询文本
  • 3. 完整代码
  • 4. 代码下载

1. 任务需求

在自己制作image captioning数据的时候,我们最初始的文件如下文所示uic_original.txt

你可能感兴趣的:(手把手实现Image,captioning,数学建模,python,开发语言)