数据集相关网站(Open datasets and sources)

数据集相关网站(Open datasets and sources)

  • 数据集网站 Open datasets and sources
    • 政府数据网站 Government Data:
    • 金融数据网站 Financial Data Sources:
    • 犯罪数据网站 Crime Data:
    • 健康数据网站 Health Data:
    • 学术和商业数据网站 Academic and Business Data:
    • 其他数据集网站Other:
  • 数据集许可证 Dataset licenses

数据集网站 Open datasets and sources

数据集相关网站(Open datasets and sources)_第1张图片

政府数据网站 Government Data:

  • https://www.data.gov/ — 美国政府公开数据网站
  • https://www.census.gov/data.html
  • https://data.gov.uk/ – 英国政府公开数据网站
  • https://www.opendatanetwork.com/ – 一个美国各种数据的搜索网站
  • https://data.un.org/ – 联合国公开数据,可以查看全球各个国家的人口、教育、医疗、健康、经济等多种数据。
  • https://data.stats.gov.cn/ – 中国国家统计局数据查询网站

金融数据网站 Financial Data Sources:

  • https://data.worldbank.org/ – 世界银行公开数据网站
  • https://www.globalfinancialdata.com/ – 全球金融数据网站
  • https://comtrade.un.org/ – 联合国商品贸易统计数据库
  • https://www.nber.org/ – 美国国家经济研究局
  • https://fred.stlouisfed.org/ – 美联储经济数据,可以查找美国各个地区,各个行业等多种数据。

犯罪数据网站 Crime Data:

  • https://www.fbi.gov/services/cjis/ucr – 美国联邦调查局犯罪信息数据
  • https://www.icpsr.umich.edu/icpsrweb/content/NACJD/index.html – 美国国家刑事司法数据档案馆
  • https://www.drugabuse.gov/related-topics/trends-statistics – 美国国立卫生研究院数据网站
  • https://www.unodc.org/unodc/en/data-and-analysis/ – 联合国毒品和犯罪数据网站

健康数据网站 Health Data:

  • https://www.who.int/gho/database/en/ – 全球卫生健康观察网站,有全球的卫生健康方面的数据
  • https://www.fda.gov/Food/default.htm – 美国食品和药物管理局
  • https://seer.cancer.gov/faststats/selections.php?series=cancer – 癌症相关数据,美国政府网站
  • https://www.opensciencedatacloud.org/ – 开放科学数据云网站,需要注册
  • https://pds.nasa.gov/ – NASA行星数据,大气、行星相关数据。
  • https://earthdata.nasa.gov/ – NASA地球数据,地表面积、海洋、生物圈、人口等地球层面的数据。
  • https://www.sgim.org/communities/research/dataset-compendium/public-datasets-topic-grid – 普通内科协会网站,有医学相关的各种数据

学术和商业数据网站 Academic and Business Data:

  • https://scholar.google.com/ – 谷歌学术,需要梯子
  • https://nces.ed.gov/ – 美国国家教育统计中心,需要梯子
  • https://www.glassdoor.com/research/ – 玻璃门经济研究网站,主要数据内容针对:工作、薪水、福利、公司评论、招聘、薪酬和广泛经济方面的重要趋势。
  • https://www.yelp.com/dataset – 提供企业、大都市、图片等数据资源,网站打开的有些慢,有梯子会快一些

其他数据集网站Other:

  • https://www.kaggle.com/datasets – 大家都知道

  • https://www.reddit.com/r/datasets/ – 需梯子。。

  • https://www.datacastle.cn/dataset_list.html – datacastle网站,有数据竞赛,也可以下载数据集,国内网站

  • https://tianchi.aliyun.com/dataset/ – 阿里云天池数据网站,阿里的数据科学赛事平台。

  • https://connect.huaweicloud.com/courses/learn/aiModel?resourceType=dataset – 华为云大赛,数据集下载,华为的数据赛事平台

数据集许可证 Dataset licenses

  • 选择数据集时,有必要查看许可证。许可证说明您是否可以使用该数据集;或解释您是否必须接受某些准则才能使用该数据集。下面列出了不同的许可证类型。

PUBLIC DOMAIN MARK - PUBLIC DOMAIN

  • 当数据集具有公共领域许可时,使用、访问、修改和共享数据集的所有权利均向所有人开放。从技术上讲,这里没有许可证。

OPEN DATA COMMONS PUBLIC DOMAIN DEDICATION AND LICENSE – PDDL

  • 开放数据共享许可证与公共领域许可证具有相同的功能,但不同之处在于PDDL许可证使用许可机制来授予数据集的权利。

CREATIVE COMMONS ATTRIBUTION 4.0 INTERNATIONAL CC-BY

  • 此许可证允许用户共享和修改数据集,但前提是他们向数据集的创建者提供功劳。

COMMUNITY DATA LICENSE AGREEMENT – CDLA PERMISSIVE-2.0

  • 与大多数开源许可证一样,此许可证允许用户使用、修改、改编和共享数据集,但前提是还包括免责声明和责任。

OPEN DATA COMMONS ATTRIBUTION LICENSE - ODC-BY

  • 此许可证允许用户共享和改编数据集,但前提是他们向数据集的创建者致谢。

CREATIVE COMMONS ATTRIBUTION-SHAREALIKE 4.0 INTERNATIONAL - CC-BY-SA

  • 此许可证允许用户使用、共享和改编数据集,但前提是他们授予数据集信用并显示他们对数据集所做的任何更改或转换。用户可能不想使用此许可证,因为他们必须共享他们在数据集上所做的工作。

COMMUNITY DATA LICENSE AGREEMENT – CDLA-SHARING-1.0

  • 该许可证使用“copyleft”原则:用户可以使用,修改和改编数据集,但前提是他们不对使用数据集创建的新作品添加许可证限制。

OPEN DATA COMMONS OPEN DATABASE LICENSE - ODC-ODBL

  • 此许可证允许用户使用、共享和改编数据集,但前提是他们为数据集提供信用并显示他们对数据集所做的任何更改或转换。用户可能不想使用此许可证,因为他们必须共享他们在数据集上所做的工作。

CREATIVE COMMONS ATTRIBUTION-NONCOMMERCIAL 4.0 INTERNATIONAL - CC BY-NC

  • 此许可证是限制性许可证。用户可以共享和改编数据集,前提是他们将其归功于其创建者并确保数据集不用于任何商业目的。

CREATIVE COMMONS ATTRIBUTION-NO DERIVATIVES 4.0 INTERNATIONAL - CC BY-ND

  • 此许可证也是限制性许可证。如果用户将功劳归功于数据集的创建者,则可以共享数据集。此许可不允许对数据集进行添加、转换或更改。

CREATIVE COMMONS ATTRIBUTION-NONCOMMERCIAL-SHAREALIKE 4.0 INTERNATIONAL - CC BY-NC-SA

  • 此许可证允许用户仅在将数据集的创建者归功于数据集时共享数据集。用户可以共享数据集的添加、转换或更改,但不能将数据集用于商业目的。

CREATIVE COMMONS ATTRIBUTION-NONCOMMERCIAL-NODERIVATIVES 4.0 INTERNATIONAL - CC BY-NC-ND

  • 此许可证允许用户仅在将数据集的创建者归功于数据集时共享数据集。用户不得修改数据集,也不得将其用于商业目的。

你可能感兴趣的:(数据分析&机器学习,人工智能,数据分析)