声明:本文为自己看的资料。如有转载请尊重各位作者的权利,其版权由各位作者本人拥有。
关于数据集下载链接
国内数据:链接:http://pan.baidu.com/s/1i5nyjBn 密码:26bm
好玩的数据集:链接:http://pan.baidu.com/s/1bSDIEi 密码:25zr
微软数据:链接:http://pan.baidu.com/s/1bpmo6uV 密码:286q
微博数据集:链接:http://pan.baidu.com/s/1jHCOwCI 密码:x58f
遥感影像库:链接:http://pan.baidu.com/s/1dF63kDr 密码:7tnh
1990-2016年股票数据:链接:http://pan.baidu.com/s/1i44IQ3N 密码:o9hj
各大企业电话邮箱创立时间:链接:http://pan.baidu.com/s/1i5PXPCp 密码:m4mo
98-09年经济普查:链接:http://pan.baidu.com/s/1o8wbzsu 密码:a093
各国各产业资产数据:链接:http://pan.baidu.com/s/1jI19qmi 密码:on7y
1953-2013统计年鉴:链接:http://pan.baidu.com/s/1mh5sHuC 密码:7ije
2015全国人口普查:链接:http://pan.baidu.com/s/1i5mIj6t 密码:yad1
facebook大数据:链接:http://pan.baidu.com/s/1jHRb3Wq 密码:aezb
taiwind数据:链接:http://pan.baidu.com/s/1kV8YKXh 密码:984g
全球社交媒体:链接:http://pan.baidu.com/s/1qXXAQvU 密码:c8qc
京东2015自营:链接:http://pan.baidu.com/s/1i56uYFz 密码:oj4v
维基百科数据:链接:http://pan.baidu.com/s/1c2gMLUw 密码:4f3b
kaggle竞赛数据:链接:http://pan.baidu.com/s/1pLDAx6N 密码:i10y
生物数据:链接:http://pan.baidu.com/s/1pLLHQwr 密码:zfjs
nasa数据:链接:http://pan.baidu.com/s/1i50pw49 密码:aawf
基因组数据:链接:http://pan.baidu.com/s/1pLTPwtP 密码:vgs8
新闻数据:链接:http://pan.baidu.com/s/1hsHSyzE 密码:pey9
ImageNet数据:链接:http://pan.baidu.com/s/1bpIcTAn 密码:tejk
百肚数据:链接:http://pan.baidu.com/s/1hsr4ayg 密码:k76p
图像数据:链接:http://pan.baidu.com/s/1jHW1kAa 密码:qztt
google数据:链接:http://pan.baidu.com/s/1bpsugGn 密码:8bt4
分类练习数据:链接:http://pan.baidu.com/s/1pLuD3wJ 密码:4pxf
各大联赛世界杯数据:链接:http://pan.baidu.com/s/1jIO9TR4 密码:1v1q
自动驾驶数据:链接:http://pan.baidu.com/s/1miFcv5e 密码:y7uj
Caltech数据集:
http://www.vision.caltech.edu/Image_Datasets/Caltech101/Caltech101.html
http://www.vision.caltech.edu/Image_Datasets/Caltech256/
ILSVRC历年数据集:
http://image-net.org/challenges/LSVRC/2016/download-images-8r28.php
http://image-net.org/challenges/LSVRC/2015/download-images-3j16.php
http://image-net.org/challenges/LSVRC/2014/download-images-5jj5.php
http://www.image-net.org/challenges/LSVRC/2013/download-images-rpa
http://www.image-net.org/challenges/LSVRC/2012/nonpub-downloads
http://www.image-net.org/challenges/LSVRC/2011/registered-downloads
http://www.image-net.org/challenges/LSVRC/2010/download-all-nonpub
PascalVOC数据集:
http://host.robots.ox.ac.uk/pascal/VOC/voc2012/VOCtrainval_11-May-2012.tar
http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtrainval_06-Nov-2007.tar
http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtest_06-Nov-2007.tar
转自http://hi.baidu.com/zgzhaobo/blog/item/5c90e30a876b5d0d95ca6bb8.html
■Annotated Database (Hand, Meat, LV Cardiac, IMM face) (http://www2.imm.dtu.dk/~aam/)
■AR Face Database (http://cobweb.ecn.purdue.edu/~aleix/aleix_face_DB.html)
■BioID Face Database (http://www.bioid.com/downloads/facedb/index.php)
■Caltech Computational Vision Group Archive (Cars, Motorcycles, Airplanes, Faces, Leaves, Background) (http://www.vision.caltech.edu/html-files/archive.html)
■Carnegie Mellon Image Database (motion, stereo, face, car, …) (http://vasc.ri.cmu.edu/idb/)
■CAS-PEAL Face Database (http://www.jdl.ac.cn/peal/index.html)
■CMU Cohn-Kanade AU-Coded Facial Expression Database (http://www.ri.cmu.edu/projects/project_421.html
■CMU Face Detection Databases (http://www.ri.cmu.edu/projects/project_419.html)
■CMU Face Expression Database (http://amp.ece.cmu.edu/projects/FaceAuthentication/download.htm)
■CMU Face Pose, Illumination, and Expression (PIE) Database (http://www.ri.cmu.edu/projects/project_418.html)
■CMU VASC Image Database (motion, road sequences, stereo, CIL’s stereo data with ground truth, JISCT, face, face expressions, car) (http://www.ius.cs.cmu.edu/idb/)
■Content-based Image Retrieval Database (http://www.cs.washington.edu/research/imagedatabase/groundtruth/) 世界各地的地标
■Face Video Database of the Max Planck Institute for Biological Cybernetics (http://vdb.kyb.tuebingen.mpg.de/)
■FERET Database (http://www.frvt.org/)
■FERET Color Database (http://www.itl.nist.gov/iad/humanid/colorferet/home.html http://face.nist.gov/colorferet/ )
■Georgia Tech Face Database (http://www.anefian.com/face_reco.htm)
■German Fingerspelling Database (http://www.anefian.com/face_reco.htm )
■Indian Face Database (http:// www.cs.umass.edu/~vidit/IndianFaceDatabase)
■MIT-CBCL Car Database (http://cbcl.mit.edu/software-datasets/CarData.html)
■MIT-CBCL Face Recognition Database (http://cbcl.mit.edu/software-datasets/heisele/facerecognition-database.html)
■MIT-CBCL Face Databases (http://cbcl.mit.edu/software-datasets/FaceData2.html)
■MIT-CBCL Pedestrian Database (http://cbcl.mit.edu/software-datasets/PedestrianData.html)
■MIT-CBCL Street Scenes Database (http://cbcl.mit.edu/software-datasets/streetscenes/) 世界各地的街景
■NIST/Equinox Visible and Infrared Face Image Database (http://www.equinoxsensors.com/products/HID.html)
■NIST Fingerprint Data at Columbia (Link)
■ORL Database of Faces (http://www.cl.cam.ac.uk/research/dtg/attarchive/facedatabase.html)
■Rutgers Skin Texture Database (http://www.caip.rutgers.edu/rutgers_texture/)
■The Japanese Female Facial Expression (JAFFE) Database (http://www.kasrl.org/jaffe.html
■The Ohio State University SAMPL Image Database (3D, still, motion) (http://sampl.ece.ohio-state.edu/database.htm)
■The University of Oulu Physics-Based Face Database (http://www.ee.oulu.fi/research/imag/color/pbfd.html)
■UMIST Face Database (http://images.ee.umist.ac.uk/danny/database.html)
■USF Range Image Data (with ground truth) (http://marathon.csee.usf.edu/range/DataBase.html)
■Usenix Face Database (hundreds of images, several formats) (Link)
■UCI Machine Learning Repository (http://www1.ics.uci.edu/~mlearn/MLSummary.html)
■USC-SIPI Image Database (collection of digitized images) (http://sipi.usc.edu/services/database/Database.html)
■UCD VALID Database (multimodal for still face, audio, and video) (http://ee.ucd.ie/validdb/)
■UCD Color Face Image (UCFI) Database for Face Detection (http://ee.ucd.ie/~prag/)
■UCL M2VTS Multimodal Face Database (http://www.tele.ucl.ac.be/PROJECTS/M2VTS/m2fdb.html)
■Vision Image Archive at UMass (sequences, stereo, medical, indoor, outlook, road, underwater, aerial, satellite, space and more) (http://sipi.usc.edu/database/)
■Where can I find Lenna and other images? (http://www.faqs.org/faqs/compression-faq/part1/section-30.html)
■Yale Face Database (http://cvc.yale.edu/projects/yalefaces/yalefaces.html)
■Yale Face Database B (http://cvc.yale.edu/projects/yalefaces/yalefaces.html)
目前人脸识别领域常用的人脸数据库主要有:
FERET姿态数据库:FERET人脸库是著名的人脸识别库, 姿态库是其中的子库. FERET姿态库共包含 个人的 张图像, 即每个人有在Yaw方向上的 种不同姿态的图像. FERET的网址为http://www.itl.nist.gov/iad/humanid/feret/.
CAS-PEAL姿态数据库: CAS-PEAL人脸数据库是中科院计算所采集的人脸数据库, 姿态数据库为其其中的子库. CAS-PEAL姿态库包含 个人的图像, 在Yaw方向上有 种姿态角度, 在Pitch方向上有 种姿态角度, 即总共21种不同的头部姿态. CAS-PEAL数据库的网址为http://www.jdl.ac.cn/peal/index.html.
Pointing Data 数据库: Pointing Data数据库包含 个人的图像, 每个人有 个序列的 张不同姿态时的图像. 数据库中的人的皮肤颜色并不相同. 头部的姿态在水平方向上从正面到全侧面的 种姿态, 垂直方向上有 种姿态. 采集人的年龄在20岁到40岁之间. 头部的位置手工切割得到. Pointing Data数据库的网址为http://www-prima.inrialpes.fr/Pointing04.
UMIST姿态数据库: UMIST人脸库包含 个人的从侧面到正面的 张图像. UMIST姿态数据库的网址为http://images.ee.umist.ac.uk/danny/database.html.
CMU PIE数据库: CMU PIE 数据库由70个人的有13种不同姿态的图像组成. CMU PIE 数据库中的图像同时有光照和表情的变化. CMU PIE数据库的信息可以从网页http://www.ri.cmu. edu/projects/project_418.html查到.
Softopia HOIP数据库: Softopia HOIP数据库由2个子库组成, 每个子库均包含300个人的图像, 其中男性和女性的人数均为150人. 第一个子库包含168个离散的姿态, 在水平方向上有24个姿态, 竖直方向上7个姿态, 姿态间隔均为15度. 第二个数据库包含511个离散的姿态, 在水平方向上有73个姿态, 姿态间隔为5度, 竖直方向上7个姿态, 姿态间隔为15度. 这个数据库仅供日本的学术机构使用. Softopia HOIP数据库的网址为 http://www.softopia.or.jp/rd/facedb.html.
CVRR-86数据库和CVRR-386数据库: CVRR-86数据库包含28个人的3894张图像. 姿态在水平方向上从 到 和在竖直方向从 到 均间隔15度采集, 经组合后共有86种离散的姿态. 每个人的图像个数并不固定. CVRR-363数据库包含10个人的图像. 姿态在水平方向上从 到 和在竖直方向从 到 均间隔5度采集, 经组合后共有363种离散的姿态. 这两个数据库目前并没有公开, 其相关信息可以网址http://cvrr.ucsd.edu查到.
FacePix数据库: FacePix数据库包含30个人的图像[116]. 其姿态范围为水平方向上从-90度到90度, 间隔为1度, 共181个姿态. 该数据中的图像已经根据手工标注的眼睛位置进行了切割. 此数据库目前尚未公开.
除了上面提到的一些数据库, 也有姿态视频数据库, 如XM2VTS的姿态序列集合 [117]以及IDIAP数据库 [62]. 在XM2VTS姿态序列数据库中, 295名被采集者被要求分别从中心向左、右、上、下旋转, 然后回到中心. 该姿态序列背景简单, 并且没有记录同步的真实姿态参数. IDIAP数据库中包含16个人的2种自然活动视频集合, 一个是会议室场景, 一个是办公室场景. 虽然该序列同步记录了姿态信息, 但是该数据库数据量相对较小.
作者:猫丸
链接:https://www.zhihu.com/question/27798279/answer/120660978
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
最近把答案中的所有网站收录到我的小站中了,大家有需要的可以收藏这个,方便查询。。
http://hippter.com/data.html
————————————
分享下我自己平时收集的…共100多个O_O
网站分析类:
百度指数 - 以百度海量网民行为数据为基础的数据分享平台
Google趋势 - 了解 Google中热度上升的搜索
360指数 - 基于360搜索的大数据分享平台
Alexa - 网站排名
Google Analytics - Google出品,可以对目标网站进行访问数据统计和分析
百度统计 - 百度推出的一款免费的专业网站流量分析工具
腾讯云分析 - 是腾讯数据云,腾讯大数据战略的核心产品
移动应用分析类:
友盟指数 - 以友盟海量数据为基础的观察移动互联网行业趋势的数据平台
移动观象台 - 20亿独立智能设备为依据,提供应用排行榜
ASOU趋势 - 每日跟踪超过 100万款应用,分析超过6亿条数据
蝉大师 - App数据分析与ASO优化专家,应用与游戏推广平台
百度移动统计 - 基于移动APP统计的分析工具
QuestMobile - 国内知名的移动大数据服务提供商
应用雷达 - 专业的APP排行历史跟踪软件实时榜单排名分析
Appannie - 移动应用和数字内容时代数据分析和市场数据的行业领导者
CQASO - 国内最专业的APP数据分析平台
媒体传播类:
微博指数
优酷指数
微票儿票房分析
BOM票房数据
爱奇艺指数
数说传播
百度风云榜
微博风云榜
爱奇艺风云榜
豆瓣电影排行榜
新媒体排行榜
品牌微信排行榜
清博指数
易赞 - 公众号画像
电商数据类:
阿里价格指数
淘宝魔方
京东智圈
淘宝排行榜
投资数据类:
Crunchbase - 一个免费的科技公司、技术行业知名人物和投资者相关信息的数据库
清科投资界 - 风险投资,私募股权,创业者相关投资,私募,并购,上市的研究
IT桔子 - 关注TMT领域创业与投资的数据库
创投库 - 提供最全的投资公司信息
Angel - 美国创业项目大全
Next - 36kr子站,每天更新新产品介绍
Beta List - 介绍初创公司
金融数据类:
积木盒子 - 全线上网络借贷信息中介平台
网贷中心 - 告网贷行业危机,公正透明地披露网贷平台数据
网贷之家 - P2P网贷平台排名
网贷数据 - 网贷天下 - 行业过去30天详细交易数据,网贷天下统计、发布,每天6点更新
中国P2P网贷指数
零壹数据-专业互联网金融数据中心
大公金融数据
全球股票指数
爱股说-基金经理分析找股平台
私募基金管理人综合查询
中财网数据引擎
游戏数据:
百度网游风云榜
360手机游戏排行榜
360手游指数
CGWR排行榜
App Annie游戏指数
小米应用商店游戏排名
TalkingData游戏指数
游戏玩家排名&赛事数据
国家社会数据:
中国综合社会调查
中国人口普查数据
中国国家数据中心
中国家庭收入项目
中国健康和营养调查
中国统计数据
全国企业信息查询
北京宏观经济数据库
中国金融信息网
其它数据:
蚂蚁金服研究院 - 网消指数&互金指数
二手市场行情
中国网络骗子地图
春运迁徙地图
房价指数
中国城市拥堵指数
百度研究院PC平台
百度城市热力图
数据分析机构:
艾瑞iResearch
艾媒iimedia
易观国际
企鹅智酷_腾讯网
手游那点 - 全事球互联网市场研究
dataeye - 专注于泛娱乐领域的大数据分析和挖掘
Accenture(埃森哲)
Analysys
Asymco
Canalys
CTR
CNNIC
CB Insights
Deloitte(德勤)
Digi-Capita
Forrester(弗雷斯特)
Gartner(高德纳)
GfK(捷孚凯)
IDC(国际数据)
KPCB(凯鹏华盈)
MMD研究所
Nielsen(尼尔森)
NPD(恩帛源)
Ofcom
Piper Jaffray & Co
Strategy Analytics
UBS(瑞银)
pewresearchcenter
不知道题主关注的是哪些领域,其它知友提供了非常棒的回答。考虑到他们的分享以国内数据源为主,我来补充一些国外数据源。
美国管理协会( AMA)旗下杂志《Marketing News》每年会发布一份Gold Top 50(原为Honomichl Top 50)榜单,列举过去一年美国营收排名前50的市场研究公司。上榜的公司就是非常好的数据来源。
2016年发布的Gold Top 50榜单,前10名数据公司及其官网分别为:
Nielsen(What People Watch, Listen To and Buy)
IMS Health(Creating Connected Solutions for Better Healthcare Performance)
Kantar(Research, data and insight consultancy)
IRI(IRI - Delivering Growth for CPG, Retail, and Healthcare)
Ipsos(Global market and opinion research specialists)
Westat(Westat.com |)
Gfk(Market research and user experience research experts)
comScore(Precisely Everywhere)
NPD(NPD Group - Market Research)
JD Power(A Global Market Research Company)
作者:企鹅智酷
链接:https://www.zhihu.com/question/27798279/answer/120633176
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
剩余机构及其网站,请查看下列详细列表:
摘取常见的几家机构,介绍下它们的数据类型:
Nielsen:全球性的市场研究公司,它的调研集中在快消、汽车、电信等领域,数据涉及消费者偏好、购买行为等多项内容,有时还会提供具有代表性的案例研究。
Kantar:同样是一家综合性的市场研究公司,研究覆盖快消、健康、品牌、金融等领域,数据涉及产品的用户喜好、品牌认知度等内容。Kantar对公众比较开放,网站上的数据和分析可以免费查看。
comScore:一家在教育、能源、医疗领域均有研究的市场分析公司,但最擅长的领域还是媒体营销。comScore的数据通常涉及网站流量、流媒体视频消费、用户购买行为等,对美国本土市场的研究很深入。过去几年,comScore以每年一期的节奏发布美国应用市场报告,分析当年应用市场的现状和未来趋势。今年移动市场表现出非常明显的衰落迹象,comScore两年前就发现了。
NPD:综合性市场研究公司。NPD每年访问超过1200万顾客,服务范围覆盖服装、电气、汽车、消费电子、体育等多个领域。它能够提供产品销量预测、用户行为等数据。
除了Gold Top 50,再补充一些常用数据源,以科技、互联网为主:
科技IT数据来源
IDC(IDC: The premier global market intelligence firm.)
Gartner(Technology Research):
两家公司在IT、电信、消费电子、应用软件领域有很深积累,每年都会发布全球市场智能手机、平板电脑、PC出货量,经常关注科技资讯的知友对它们应该很熟悉。
其实除了科技产业,IDC和Gartner还会定期公开能源、健康、制造等的调研数据。进行相关领域研究时,可以将它们的数据作为一项参考。
上市公司数据来源:
美股:
纳斯达克(NASDAQ Stock Market)
纽交所(https://www.nyse.com/index)
SEC(SEC.gov | Home)
港股:
香港联交所(HKEX)
A股:
上交所(上海证券交易所)
深交所(深圳证券交易所)
证监会(http://www.csrc.gov.cn/)
研究上市公司的人员结构、业务构成,财报是常用手段。以一定时间跨度分析一家公司的财报,比单纯看某个季度更有价值。美股财报可以访问纳斯达克、纽交所或SEC的网站获取,港股财报可以访问香港联交所网站获取,A股财报可以访问上交所、深交所或证监会网站获取。
媒体与营销数据来源:
独立民调机构,调查范围覆盖政治、社会趋势、宗教,媒体新闻、科技互联网,调查报告和数据可以免费查看。皮尤具有非常现代化的网页设计,体验好过大多数调研机构网站。
第三方YouTube统计平台,可以提供不同频道的订阅数、排名、视频观看量等数据。VidStatsX数据的时间跨度很大,时效性也很强,可以观察一些爆款视频的数据变化。
移动应用数据来源
App Annie(https://www.appannie.com/dashboard/home/)
App Annie可以提供一款应用在不同应用商店中的日排名,历史排名以及在不同国家的评级数据。用户也可以查看更详细的下载、收入预估等数据,但这些都需要付费订阅。
编辑于 2016-09-05
1.1K47 条评论
分享
收藏感谢收起
mwcc
mwcc
啦啦啦
62 人赞同了该回答
简单浏览几个答案竟然没有人提到Data | The World Bank。
强烈推荐Data | The World Bank,去年做一些case的时候查数据用了很多很多次。
然后这个好像是Google的一个数据,Freebase
其实你想要不付费得到高质量的有时效性的社会经济数据蛮难的,个人经验以前做过的地方会有时候像去尼尔森等等机构买数据还是一笔很大的开销的。
对了还有这个地方我觉得蛮有趣的定期回去看,NIFTY - Weekly Visualization,这是斯坦福做的一个数据可视化的项目,我理解他是做一写text clustering或者topic model去检测每一天或者一段时间的news article的topic变化。
发布于 2015-02-09
62添加评论
分享
收藏感谢
陈诚
陈诚
降服其心
33 人赞同了该回答
浏览了一下,看到还没有人提到Kaggle的datasets:Datasets | Kaggle。
Kaggle是给数据分析和建模的竞赛平台,他们现在也有提供一些开放的数据集来让大家使用,比如:
欧洲足球的数据库,NBA数据
2016年美国大选的数据(也有希拉里邮件)
IMDB电影数据,
一些公司的数据(Uber,Twitter ,Lending Club, Reddit)等。
而且还有很详细的数据描述:
不仅如此,他们还做了一个社区,就是对这些数据集有使用经验的人可以在一起交流,提出问题,用数据回答问题。
点击进去可以看到别人完整的分享和数据使用流程,对于学习来说非常有用。
用这些数据源+自身的练习+和别人思路技法上的切磋交流,可以进步很大。