免费数据集下载

目前系统整理了一些网上开放的免费科研数据集,以下是分类列表以及下载地址,供高校和科研机构免费下载和使用。

金融

  • 美国劳工部统计局官方发布数据
  • 上证A股日线数据,1999.12.09 至 2016.06.08,前复权,1095支股票
  • 深证A股日线数据,1999.12.09 至 2016.06.08,前复权,1766支股票
  • 深证创业板日线数据,1999.12.09 至 2016.06.08,前复权,510支股票
  • MT4平台外汇交易历史数据
  • Forex平台外汇交易历史数据
  • 几组外汇交易逐笔(Ticks)数据
  • 美国股票新闻数据【Kaggle数据
  • 美国医疗保险市场数据【Kaggle数据
  • 美国金融客户投诉数据【Kaggle数据】
  • Lending Club 网贷违约数据【Kaggle数据】
  • 信用卡欺诈数据【Kaggle 数据】
  • 某个金融产品实时交易数据【Kaggle数据】
  • 美国股票数据XBRL【Kaggle数据】
  • 纽约股票交易所数据【Kaggle数据】

交通

  • 2013年纽约出租车行驶数据
  • Udacity自动驾驶数据
  • 纽约 Uber 接客数据 【Kaggle数据
  • 英国车祸数据(2005-2015)【Kaagle数据】
  • 芝加哥汽车超速数据【Kaggle数据】

商业

  • Amazon 食品评论数据【Kaggle数据】
  • Amazon 无锁手机评论数据【Kaggle数据】
  • 美国视频游戏销售和评价数据【Kaggle数据】
  • Kaggle 各项竞赛情况数据【Kaggle数据】

推荐系统

  • Netflix 电影评价数据
  • MovieLens 20m 电影推荐数据集
  • WikiLens
  • Jester
  • HetRec2011
  • Book Crossing
  • Large Movie Review

医疗健康

  • 人识别物体时大脑核磁共振影像数据
  • 人理解单词时大脑核磁共振影像数据
  • 心脏病心房图像及标注数据
  • 细胞病理识别
  • FIRE 视网膜眼底病变图像数据
  • 食物营养成分数据 【Kaggle数据】
  • EGG 大脑电波形状数据【Kaggle数据】

图像数据

综合图像

  • Visual Genome 图像数据
  • Visual7w 图像数据
  • COCO 图像数据
  • SUFR 图像数据
  • ILSVRC 2014 训练数据(ImageNet的一部分)
  • PASCAL Visual Object Classes 2012 图像数据
  • PASCAL Visual Object Classes 2011 图像数据
  • PASCAL Visual Object Classes 2010 图像数据
  • 80 Million Tiny Image 图像数据【数据太大仅有介绍】
  • ImageNet【数据太大仅有介绍】

场景图像

  • Street Scences 图像数据
  • Places2 场景图像数据
  • UCF Google Street View 图像数据
  • SUN 场景图像数据
  • The Celebrity in Places 图像数据

Web标签图像

  • HARRISON 社交标签图像
  • NUS-WIDE 标签图像
  • Visual Synset 标签图像
  • Animals With Attributes 标签图像

人形轮廓图像

  • MPII Human Shape人体轮廓数据
  • Biwi Kinect Head Pose 头部姿势数据
  • 上半身人像数据
  • INRIA Person 数据集

视觉文字识别图像

  • Street View House Number 门牌号图像数据
  • MNIST 手写数字识别图像数据
  • 3D MNIST 数字识别图像数据【Kaggle数据】
  • MediaTeam Document 文档影印和内容数据

特定一类事物图像

  • 著名的猫图像标注数据
  • Caltech-UCSD Birds200 鸟类图像数据
  • Stanford Car 汽车图像数据
  • Cars 汽车图像数据
  • MIT Cars 汽车图像数据
  • Stanford Cars 汽车图像数据
  • Food-101 美食图像数据
  • 17_Category_Flower 图像数据
  • 102_Category_Flower 图像数据
  • UCI Folio Leaf 图像数据
  • Labeled Fishes in the Wild 鱼类图像
  • 美国 Yelp 点评网站酒店照片
  • CMU-Oxford Sculpture 塑像雕像图像
  • Oxford-IIIT Pet 宠物图像数据

材质纹理图像

  • CURET 纹理材质图像数据
  • ETHZ Synthesizability 纹理图像数据
  • KTH-TIPS 纹理材质图像数据
  • Describable Textures 纹理图像数据

物体分类图像

  • COIL-20 图像数据
  • COIL-100 图像数据
  • Caltech-101 图像数据
  • Caltech-256 图像数据
  • CIFAR-10 图像数据
  • CIFAR-100 图像数据
  • STL-10 图像数据
  • LabelMe_12_50k图像数据
  • NORB v1.0 图像数据
  • NEC Toy Animal 图像数据
  • iCubWorld 图像分类数据
  • Multi-class 图像分类数据
  • GRAZ 图像分类数据

人脸图像

  • IMDB-WIKI 500k+ 人脸图像、年龄性别数据
  • Labeled Faces in the Wild 人脸数据
  • Extended Yale Face Database B 人脸数据
  • Bao Face 人脸数据
  • DC-IGN 论文人脸数据
  • 300 Face in Wild 图像数据
  • BioID Face 人脸数据
  • CMU Frontal Face Images
  • FDDB_Face Detection Data Set and Benchmark
  • NIST Mugshot Identification Database
  • Faces in the Wild 人脸数据
  • CelebA 名人人脸图像数据
  • VGG Face 人脸图像数据

姿势动作图像

  • HMDB_a large human motion database
  • Human Actions and Scenes Dataset

指纹识别

  • NIST FIGS 指纹识别数据

其它图像数据

  • Visual Question Answering 图像数据

视频数据

综合视频

  • DAVIS_Densely Annotated Video Segmentation 数据
  • YouTube-8M 视频数据集【数据太大仅有介绍】
  • YouTube 网站视频备份【数据太大仅有介绍】

人类动作视频

  • Microsoft Research Action 人类动作视频数据
  • UCF50 Action Recognition 动作识别数据
  • UCF101 Action Recognition 动作识别数据
  • UT-Interaction 人类动作视频数据
  • UCF iPhone 运动中传感器数据
  • UCF YouTube 人类动作视频数据
  • UCF Sport 人类动作视频数据
  • UCF-ARG 人类动作视频数据
  • HMDB 人类动作视频
  • HOLLYWOOD2 人类行为动作视频数据
  • Recognition of human actions 动作视频数据
  • Motion Capture 动作捕捉视频数据
  • SBU Kinect Interaction 肢体动作视频数据

行人检测视频

  • UCSD Pedestrian 行人视频数据
  • Caltech Pedestrian 行人视频数据
  • ETH 行人视频数据
  • INRIA 行人视频数据
  • TudBrussels 行人视频数据
  • Daimler 行人视频数据

密集人群视频

  • Crowd Counting 高密度人群图像
  • Crowd Segmentation 高密度人群视频数据
  • Tracking in High Density Crowds 高密度人群视频

其它视频

  • Fire Detection 视频数据

音频数据

综合音频

Google Audioset 音频数据【数据太大仅有介绍】

语音识别

  • Sinhala TTS 英语语音识别
  • TIMIT 美式英语语音识别数据
  • LibriSpeech ASR corpus 语音数据
  • Room Impulse Response and Noise 语音数据
  • ALFFA 非洲语音数据

自然语言处理

  • RCV1英语新闻数据
  • 20news 英语新闻数据
  • First Quora Release Question Pairs
  • JRC Names各国语言专有实体名称
  • Multi-Domain Sentiment V2.0
  • LETOR 信息检索数据
  • Yale Youtube Vedio Text
  • 斯坦福问答数据【Kaggle数据】
  • 美国假新闻数据【Kaggle数据】
  • NIPS会议文章信息数据(1987-2016)【Kaggle数据】
  • 2016年美国总统选举辩论数据【Kaggle数据】

社会数据

  • 希拉里邮件门泄露邮件
  • 波士顿 Airbnb 公开数据【Kaggle数据】
  • 世界各国经济发展数据【Kaagle数据】 
  • 世界大学排名芝加哥犯罪数据(2001-2017)【Kaagle数据】
  • 世界范围显著地震数据(1965-2016)【Kaagle数据】
  • 美国婴儿姓名数据【Kaagle数据】
  • 全世界鲨鱼袭击人类数据【Kaagle数据】
  • 1908年以来空难数据【Kaagle数据】
  • 2016年美国总统大选数据【Kaagle数据】
  • 2013年美国社区统计数据【Kaagle数据】
  • 欧洲足球运动员赛事表现数据【Kaagle数据】
  • 美国环境污染数据【Kaagle数据】
  • 美国H1-B签证申请数【Kaggle数据】
  • IMDB五千部电影数据【Kaggle数据】
  • 2015年航班延误和取消数据【Kaggle数据】
  • 凶杀案报告数据【Kaggle数据】
  • 人力资源分析数据【Kaggle数据】
  • 某人基因序列数据【Kaggle数据】
  • 美国费城犯罪数据【Kaggle数据】
  • 安然公司邮件数据【Kaggle数据】
  • 历史棒球数据【Kaggle数据】
  • 美联航 Twitter 用户评论数据【Kaggle数据】
  • 波士顿 Airbnb 公开数据【Kaggle数据】
转自:https://blog.csdn.net/qq_32447301/article/details/79487335

你可能感兴趣的:(大数据)