data.gov
http://data.gov
该网站数据多与政府相关。
Socrata
http://www/socrata.com/resources/
探索政府相关数据的好去处。它提供了几种可视化工具,帮助用户探索数据。
美国人口调查局
http://www.census.gov/data.html
该网站提供人口信息、地区分布和教育情况等美国公民相关数据。
UN3ta
https://data.un.org/
UNdata是基于互联网的数据服务,提供UN统计数据库。
欧盟开发数据平台
http://open-data.europe.eu/en/data/
欧盟开发数据平台,提供欧盟各大机构大量数据。
data.gov.uk
http://data.gov.uk/
英国政府网站,收录英国国家书目:自1950年以来,英国出版的所有图书和其他出版物的元数据。
中情局世界概况
https://www.cia.gov/library/publications/the-world-factbook/
中情局世界概况网站隶属美国中央情报局,提供267个国家的历史、人口、经济、政府、基础设施和军事信息。
healthdata.gov
https://www.healthdata.gov/
该网站提供流行病学、人口统计数据等医学相关的数据。
英国国民医疗服务体系和社会福利信息中心
http://www.hscic.gov.uk/home
该网站收录英国国民医疗服务体系所提供的健康数据。
Facebook Graph
https://developers.facebook.com/docs/graph-api
Facebook官方提供的api,用于查询该网站用户公开的海量信息。
Topsy网站
http://topsy.com/
Topsy网站维护了一个数据库,收录Twitter用户发表的信息(推文),并开放检索功能,其中存储的最早消息可追溯至2006年。他还提供了几种对话分析工具。
谷歌趋势
http://www.google.com/trends/explore
谷歌趋势提供自2004年以来任意词语的搜索量(与全部搜索的占比)
Likebutton网站
http://likebutton.com/
挖掘Facebook公开的数据---来自全球用户或你自己朋友圈---了解当前人们喜欢什么。
亚马逊网络服务开放数据集
http://aws.amazon.com/datasets
亚马逊网络服务提供了一个开放数据集中心仓库,包括多个数据库,其中一个非常有趣的数据集是1000 Genome Project(全球千人基因组计划),该计划尝试建立最全面的人类基因数据库。该仓库还存储了NASA的地球卫星图像。
DBPedia项目
http://wiki.dbpedia.org
维基百科提供了上千万条数据,主题多种多样,既有结构化数据,也有非结构化数据。DBPedia项目雄心勃勃,意在为维基数据编制目录,并创建开放和可自由发布的数据库,便于每个人分析维基数据。
Freebase网站
http://www.freebase.com/
该社区数据库提供四千五百多万条涵盖多个主题的信息。
Gapminder网站
http://www.gapminder.org/data/
该网站数据来自世界卫生组织和世界银行,包括全球经济、医疗和社会统计数据。
谷歌金融
https://www/google.com.finance
收录40年以来的股票数据,实时更新。
美国国家气候数据中心
http://www.ncdc.noaa.gov/data-access/quick-links#loc-clim
美国国家气候数据中心提供了大量环境、气象和气候数据集,是世界最大的气象数据档案。
WeatherBase网站
http://www.weatherbase.com/
该网站提供全球四万多个城市的气候平均值、天气预报和当前天气状况数据。
Wunderground网站
http://www.wunderground.com/
该网站提供由卫星和气象观测站收集的温度、风力和其他气候测量数据。
Pro-Football-Reference网站
http://www/pro-football-reference.com/
该网站提供足球及其他几种体育活动的数据。
《纽约时报》
http://developer.nytimes.com/doc
提供纽约时报自1851年以来的新闻文章,并为其编制了索引,开放数据查询服务。
Google Books Ngrams项目
http://storage.googleapis.com/books/ngrams/books/datasetsv2.html
该项目为谷歌图书项目的一部分,可对几千万本电子书的全文进行查询和分析。
百万歌曲数据集
http://aws.amazon.com/datasets/6468931156960467
百万歌曲数据集为亚马逊网络服务的一部分,收录了超过一百万首歌曲和乐曲的元数据。