目录
一、背景
二、数据集整理
1. the UC Merced Land Use Dataset(约110M)
2. DOTA:A Large-scale Dataset for Object Detection in Aerial Images(约35G)
3. NWPU VHR-10(约73M)
4. UCAS-AOD: Dataset of Object Detection in Aerial Images(约3G)
5. BigEarthNet: A Large-Scale Benchmark Archive For Remote Sensing Image Understanding(约66G)
6. TGRS-HRRSD-Dataset(约4G)
7. RSOD-Dataset(可下载)
8. INRIA aerial image dataset(约64G)
9. CAESAR-RADI,SAR-Ship-Dataset(可下载)
10. 雄安马蹄湾村航空高光谱遥感影像数据集(可下载)
11. AID Data Set(约2.7G)
12. Dataset-UAV-123 视频数据集(约17G)
13. 变化检测合集
很久没写CSDN了,近期终于可以抽时间来写写CSDN了。自己是做遥感出身,一直在关注计算机视觉在遥感领域的最新成果,目前基于深度学习模型的遥感图像分类,目标识别,图像生成等领域,都需要大量的训练数据,而网上的很多数据集比较老,作者也没有进一步更新,因此这篇文章就整理一下自己遇到的遥感数据集,并会一直持续更新。
数据集介绍:这个数据集有21种土地利用类型,每种100张,尺寸为256*256。可用于数据分类。
下载地址:https://pan.baidu.com/s/1i5zQNdj 或者官方地址:http://weegee.vision.ucmerced.edu/datasets/landuse.html
数据集应用示例:我曾用过该数据集做遥感图像生成,不过效果其实一般,可参考:对抗神经网络学习(十二)——MARTA-GAN实现遥感图像的场景生成(tensorflow实现)
数据集发布年份:2016年之前?(待考证)
数据集介绍:该数据集一共有15种土地利用类型,总样本数约为18万,可用于目标检测,数据分类。DOTA 数据集(全称 A Large-scale Dataset for Object DeTection in Aerial Images)是用于航拍图像中的目标检测的大型图像数据集。 它可用于发现和评估航拍图像中的物体。DOTA-v1.0 包含来自不同传感器和平台的 2806 幅航拍图像。 每个图像的尺寸在约 800×800 到 4000×4000 像素的范围内,并且包含呈现各种尺度、方向和形状的物体。 然后,这些 DOTA 图像由航空图像解释专家使用 15 个常见目标类别进行注释。 完全注释的 DOTA 图像包含 188,282 个实例,每个实例由任意(8 d.o.f.)四边形标记。DOTA 数据集于 2017 年 11 月 28 日由武汉大学发布在 arXiv 上,之后于 2018 年 6 月发布在 IEEE 计算机视觉和模式识别会议(CVPR)上。DOTA-v1.0 数据集中的图像是从 Google Earth 收集的,其中一些是由卫星 JL-1 拍摄的,其他的是由中国资源卫星数据和应用中心的卫星 GF-2 拍摄的。
下载地址:http://captain.whu.edu.cn/DOTAweb/dataset.html或者https://hyper.ai/datasets/4920
数据集应用示例:(待更新)
数据集发布年份:2017年, 数据集约35G
数据集介绍:数据集包含800张图像,其中650张包含10类地物目标,150张为背景样本图像,可用于分类。
下载地址:https://pan.baidu.com/s/1hqwzXeG#list/path=%2F
数据集应用示例:(待更新)
数据集发布年份:2014年,数据集约73M
数据集介绍:中国科学院大学 • 模式识别与智能系统开发实验室的成果,数据集包含两类目标,汽车和飞机,还有一部分是背景样本,总计约2400张影像。
下载地址:原官网已经找不到该数据集的下载地址了,我在网上找到了别人百度云上的下载地址:https://pan.baidu.com/s/1bplTvif 密码:ppef
数据集应用示例:(待更新)
数据集发布年份:2015年,数据集约3G
补充:我到中国科学院大学 • 模式识别与智能系统开发实验室的主页看了一下,实验室公布了很多关于深度学习与遥感方面的论文及成果,这里补充几个链接,可以供大家学习:实验室毕业生的学位论文:https://ucassdl.cn/content/team/alumni.html;实验室论文成果列表:https://ucassdl.cn/content/work/paper.html
数据集介绍:数据集是Sentinel-2数据,约59万个图像块
下载地址:http://bigearth.net/
数据集应用示例:(待更新)
数据集发布年份:2018年,数据集约66G
数据集介绍:是中国科学院西安光学精密机械研究所光学影像分析与学习中心制作用于研究高分辨率遥感图像目标检测的数据集,共13类,~21000张图,共计4万个目标对象
下载地址:https://github.com/CrazyStoneonRoad/TGRS-HRRSD-Dataset/tree/master/OPT2017
数据发布年份:2018年
数据集介绍:武汉大学团队标注,包含飞机、操场、立交桥、 油桶四类目标,~1000张图像
下载地址:https://github.com/RSIA-LIESMARS-WHU/RSOD-Dataset-
数据发布年份:2017年
数据集介绍:Inria Aerial Image Labeling Dataset 数据集是一个城市建筑物检测的遥感图像数据集,标记只有建筑/非建筑两种,且是像素级别,用于语义分割。该数据集于 2017 年由 Inria 发布,相关论文为 Can Semantic Labeling Methods Generalize to Any City? The Inria Aerial Image Labeling Benchmark。数据采集自0.3m分辨率的遥感图像,覆盖面积810km^2。
下载地址:https://project.inria.fr/aerialimagelabeling/或者https://hyper.ai/datasets/5428
数据发布年份:2017 数据集约64G
数据集介绍:中科院遥感所王超研究员团队构建的“多模式SAR图像船舶检测数据集”。该数据集以我国国产高分三号SAR数据和Sentinel-1 SAR数据为主数据源,共采用了102景高分三号和108景Sentinel-1 SAR图像构建高分辨率SAR船舶目标深度学习样本库。标注的船舶切片约4万多个。
下载地址:https://github.com/CAESAR-Radi/SAR-Ship-Dataset?tdsourcetag=s_pcqq_aiomsg
数据发布年份:2019年
数据集介绍:遥感所高光谱团队的数据文件,我目前还没下载查看,具体的图像文件了解的不多。
下载地址:http://www.hrs-cas.com/a/share/shujuchanpin/2019/0501/1049.html
数据集发布年份:2019年5月
数据集介绍:AID 数据集是一个遥感影像数据集,图像像素大小为 600*600,总包含 30 类场景图像,每一类大概 220-420 张,共 10000 张。该数据集于 2017 年由武汉大学和华中科技大学发布。
下载地址:https://hyper.ai/datasets/5446
数据集发布年份:2017年4月,数据集约2.7G
数据集介绍:Dataset-UAV-123 数据集是从低空无人机捕获的视频组成的数据集,于 2016 年由阿卜杜拉国王科技大学的 Matthias Mueller, Neil Smith and Bernard Ghanem 发布。从低空无人机捕获的视频与流行的跟踪数据集(如 OTB50,OTB100,VOT2014,VOT2015,TC128 和 ALOV300 ++)中的视频本质上不同。 因此,一个新的数据集(UAV123)被提出,其中包含来自航空观点的序列,其子集用于长期空中跟踪(UAV20L)。 UAV123 数据集包含总共 123 个视频序列和超过 110K 帧,使其成为 ALOV300 ++之后的第二大对象跟踪数据集。 所有序列都使用直立边框进行完全注释。 数据集可以轻松地与可视跟踪器基准集成。 它包括 UAV 数据集的所有边界框和属性注释。 相关论文为 A Benchmark and Simulator for UAV Tracking。
下载地址:https://hyper.ai/datasets/5154
数据集发布年份:2016年,数据集约17G
主要参考了以下两个博客,以及自己找的一点资料:
(1)遥感图像变化检测数据集
(2)awesome-remote-sensing-change-detection
总结了几个比较好用的数据集:
① SZTAKI AirChange Benchmark set (~42M):该数据集的下载需要账号和密码:sztaki deva。变化内容包含(a)新建城区(b)建筑施工(c)种植大批树木(d)新的耕地(e)重建前的基础工作。 请注意,ground truth不包含变化分类,仅为每个像素标注 变化/不变化 标签。
② Change Detection Dataset (~1.6G):该数据集包含两个区域,Santa Barbara(2013-2014年,大小984 x 740像素,波段有224个)和Bay Area(2013-2015年,大小600 x 500像素,波段224个),两个地区都是位于加州。需要注意的是,这个数据集是mat格式的,需要用matlab读取和处理,如果自己不用matlab的话,可以先考虑用别的数据集。
③ The Aerial Imagery Change Detection (AICD) dataset (~1.7G):数据集包含1000对800x600图像,每对包括一个参考图像和一个测试图像,和对应的ground truth。 这些图像是使用游戏Virtual Battle Station 2的渲染引擎进行渲染,生成的,并不是真实的图像。生成的参数可以参考其官网。
④ ABCD dataset (~1.8G):数据集专门用于构建和评估损坏检测系统,以识别建筑物是否已被海啸冲走。该数据集中的每个数据都是一对海啸前后的航拍图像,并包含位于图像中心的目标建筑物。 分配给每个贴片对的类别标签(即“冲走”或“幸存”)表示海啸发生前贴片中心的建筑物是否被海啸冲走。
⑤ LANDSAT images (密码:b37d,~2.68G):作者将这个数据上传到网盘上了,可以直接用。文献来源:https://www.researchgate.net/publication/325470033_CHANGE_DETECTION_IN_REMOTE_SENSING_IMAGES_USING_CONDITIONAL_ADVERSARIAL_NETWORKS
⑥ LEVIR-CD (~2.7G):数据集包含637组数据,每组图像大小为1024*1024,时间跨度为5-14年,使用的图像分辨率为0.5m,来自于google earth,变化标签为2值的,即1为变化的0为无变化的,总计有31,333个变化的建筑。