开放数据源(python数据分析实战)

1.政治和政府数据

data.gov

http://data.gov

         该网站数据多与政府相关。

Socrata

http://www/socrata.com/resources/

        探索政府相关数据的好去处。它提供了几种可视化工具,帮助用户探索数据。

美国人口调查局

http://www.census.gov/data.html

        该网站提供人口信息、地区分布和教育情况等美国公民相关数据。

UN3ta

https://data.un.org/

      UNdata是基于互联网的数据服务,提供UN统计数据库。

欧盟开发数据平台

http://open-data.europe.eu/en/data/

     欧盟开发数据平台,提供欧盟各大机构大量数据。

data.gov.uk

http://data.gov.uk/

      英国政府网站,收录英国国家书目:自1950年以来,英国出版的所有图书和其他出版物的元数据。

中情局世界概况

https://www.cia.gov/library/publications/the-world-factbook/

    中情局世界概况网站隶属美国中央情报局,提供267个国家的历史、人口、经济、政府、基础设施和军事信息。

 

2.健康数据

healthdata.gov

https://www.healthdata.gov/

    该网站提供流行病学、人口统计数据等医学相关的数据。

英国国民医疗服务体系和社会福利信息中心

http://www.hscic.gov.uk/home

    该网站收录英国国民医疗服务体系所提供的健康数据。

 

3.社会数据

Facebook Graph

https://developers.facebook.com/docs/graph-api

      Facebook官方提供的api,用于查询该网站用户公开的海量信息。

Topsy网站

http://topsy.com/

   Topsy网站维护了一个数据库,收录Twitter用户发表的信息(推文),并开放检索功能,其中存储的最早消息可追溯至2006年。他还提供了几种对话分析工具。

谷歌趋势

http://www.google.com/trends/explore

    谷歌趋势提供自2004年以来任意词语的搜索量(与全部搜索的占比)

Likebutton网站

http://likebutton.com/

    挖掘Facebook公开的数据---来自全球用户或你自己朋友圈---了解当前人们喜欢什么。

 

4.其他开放数据集

亚马逊网络服务开放数据集

http://aws.amazon.com/datasets

     亚马逊网络服务提供了一个开放数据集中心仓库,包括多个数据库,其中一个非常有趣的数据集是1000 Genome Project(全球千人基因组计划),该计划尝试建立最全面的人类基因数据库。该仓库还存储了NASA的地球卫星图像。

DBPedia项目

http://wiki.dbpedia.org

     维基百科提供了上千万条数据,主题多种多样,既有结构化数据,也有非结构化数据。DBPedia项目雄心勃勃,意在为维基数据编制目录,并创建开放和可自由发布的数据库,便于每个人分析维基数据。

Freebase网站

http://www.freebase.com/

    该社区数据库提供四千五百多万条涵盖多个主题的信息。

Gapminder网站

http://www.gapminder.org/data/

   该网站数据来自世界卫生组织和世界银行,包括全球经济、医疗和社会统计数据。

 

5.金融数据

谷歌金融

https://www/google.com.finance

    收录40年以来的股票数据,实时更新。

 

6.气候数据

美国国家气候数据中心

http://www.ncdc.noaa.gov/data-access/quick-links#loc-clim

    美国国家气候数据中心提供了大量环境、气象和气候数据集,是世界最大的气象数据档案。

WeatherBase网站

http://www.weatherbase.com/

    该网站提供全球四万多个城市的气候平均值、天气预报和当前天气状况数据。

Wunderground网站

http://www.wunderground.com/

    该网站提供由卫星和气象观测站收集的温度、风力和其他气候测量数据。

 

7.体育数据

Pro-Football-Reference网站

http://www/pro-football-reference.com/

    该网站提供足球及其他几种体育活动的数据。

 

8.报纸、图书及其他出版物

《纽约时报》

http://developer.nytimes.com/doc

    提供纽约时报自1851年以来的新闻文章,并为其编制了索引,开放数据查询服务。

Google Books Ngrams项目

http://storage.googleapis.com/books/ngrams/books/datasetsv2.html

     该项目为谷歌图书项目的一部分,可对几千万本电子书的全文进行查询和分析。

 

9.音乐数据

百万歌曲数据集

http://aws.amazon.com/datasets/6468931156960467

      百万歌曲数据集为亚马逊网络服务的一部分,收录了超过一百万首歌曲和乐曲的元数据。

你可能感兴趣的:(开放数据源(python数据分析实战))