【Office-Caltech-10、PACS、office31】迁移学习三个数据集介绍及下载链接

迁移学习的三个数据集

  • Office-Caltech-10数据集
  • PACS数据集[^3]
  • Office-31数据集[^1]
  • 下载链接

Office-Caltech-10数据集

包含有2533个样本,包含(C A W D)四种数据库的数据, C(Caltech), A(Amazon), W(Webcam) 和D(DSLR),其中C有1123个,A有958个,W有295个,D有157个,数据集提供了SURF特征和DeCAF(A Deep Convolutional Activation Featurefor Generic Visual Recognition)特征1

【Office-Caltech-10、PACS、office31】迁移学习三个数据集介绍及下载链接_第1张图片
该数据集有10类物体,是Office-31和Caltech-256数据集中相同的类:”backpack“,”bike“,”calculator“,”headphones“,”keyboard“,”laptop computer“,”monitor“,”mouse“,”mug“,”projector“

PACS数据集2

PACS,数据集是一个域自适应的图像数据集,包含4个域,照片(1670张),艺术画(2048张),动画片(2344张)和素描(3929张)。每个域里面包含7个种类。

PACS数据集划分:

训练集:8977张图片

测试集:1014张图片

验证集:9991张图片

【Office-Caltech-10、PACS、office31】迁移学习三个数据集介绍及下载链接_第2张图片

Office-31数据集3

Office-31 Dataset 即 Office Dataset 是视觉 迁移学习 中的主流基准数据集,该数据集包含了 31 类办公室环境中常见的目标物体,如笔记本电脑、文件柜、键盘等,共 4,652 张图像。

这些图像主要源于 Amazon(在线电商图片)、Webcam(网络摄像头拍摄的低解析度图片)、DSLR(单反相机拍摄的高解析度图片)。

该数据集包括:

Amazon:2,817 张图像,平均每类 90 张,图像背景单一
Webcam:795 张图像,图像表现出明显的噪点,颜色和白平衡伪像
DSLR:498 张图像,每类 5 个对象,每个对象从不同视点平均拍摄 3 次

示例图像:

【Office-Caltech-10、PACS、office31】迁移学习三个数据集介绍及下载链接_第3张图片

下载链接

以上三个数据集下载链接在 https://github.com/jindongwang/transferlearning4 中都可以找到,但是PACS链接挂了,这里放另一个下载地址
https://github.com/MachineLearning2020/Homework3-PACS


  1. 迁移学习(一):相关数据集介绍 ↩︎

  2. PACS 数据集介绍及加载使用 ↩︎

  3. Office-31 (Office Dataset) 办公室环境数据集 ↩︎

  4. https://github.com/jindongwang/transferlearning ↩︎

你可能感兴趣的:(迁移学习,计算机视觉,深度学习)