阿里系唯一对外开放数据分享平台天池数据集2020收官精品合集大放送

**简介:**阿里系唯一对外开放数据分享平台天池数据集2020收官精品合集大放送

作为国内“AI众智“首选平台,阿里云天池除了面向国内开发者组织大数据竞赛、免费开放AI学习内容、提供开发者讨论问答的技术社区等,这几年还开放了数千计公开数据集,通过一站式创建、搜索、使用和打榜,天池数据集平台(https://tianchi.aliyun.com/dataset/ )已成为国内开发者找寻真实业务场景数据的首选阵地。通过长期与合作伙伴的数据资源共创、开放官方比赛数据和邀请开发者一同分享有价值、高质量的开源数据,天池数据集平台能够为开发者们在研发AI项目的过程中提供大量真实可靠的数据依据。

作为阿里系唯一对外开放数据分享平台,天池数据集拥有淘系独家的电商商品数据和用户行为数据、优酷的视频数据、饿了么和速卖通的物流数据等和天池大赛的比赛数据如骨科数据集、天文数据集、问题生成数据集等。天池大赛独有的产学研模式在将比赛成果实际落地以外,还会联合业内专家发布垂直领域的权威数据集。近年来在举办医学领域的商业赛以外,天池数据集平台开源了数十个相关领域的计算机视觉和自然语言处理等不同方向的官方数据集,为开源数据的集成整合做出了重大贡献。在天池,开发者们可以通过简单的标签搜索来直接查找想要的数据集。

天池数据集还充分利用阿里云的计算资源,为开发者们提供数据集打榜的活动。开发者们可以在数据集页面提交模型,系统会自动评测出分,相当于参与到一场长期的数据学习赛中——这样一方面可以直接检测开发者的算法工程能力,另一方面也能通过公示出来的成绩排行棒来增强与开发者们的互动。

为了满足机器学习和人工智能飞速发展的需要,天池数据集会不断优化功能配置和通过数据集活动来鼓励更多的开发者来拥抱开源。在2021年,天池数据集将开放出百余官方发布数据集和数千由开发者自发分享的优质公共数据集,继续在医疗、商业、自然科学、自动驾驶等方向开源出更多权威数据集。除此以外,还将通过互动活动增强数据科学家间的联系沟通,不断发展成为国内第一数据开源社区,为AI发展贡献出自己的力量。

以下,我们为大家准备了天池平台在2020年中盘点出来的50多个热门精选数据集,开发者们可以根据自己的研发需求来下载使用:

电商
淘宝直播商品识别
阿里巴巴用户行为数据集
面向商品的视频描述生成数据集
电商服装产品视频标题数据集
速卖通搜索系统数据集
淘宝用户行为数据
甜品店铺用户评分数据
智能出行平台车辆订单数据

医疗
脊椎疾病病理数据集
医学影像和标题的语篇照应数据集
息肉医学影像数据集
中风后病灶解剖追踪数据集
颅骨医学图像数据集用于监测颅内出血
皮肤病图像数据集用于诊断黑素瘤
COVID-19 mRNA疫苗数据集
OSIC肺部CT扫描影像数据集
自然神经影像数据集
医学影像数据集
生物医学实体标准化数据集
生物医学概念标准化数据集
社交媒体医学实体链接语料数据集
PubMedQA生物医学研究问答数据集
中文BLUE数据集(生物医学文本挖掘语料库)
中文医学知识图谱数据集
医学对话数据集
中文医学问答数据集
平安医学技术疾病问答迁移学习数据集
临床术语标准化数据集
医学实体识别和属性抽取EMR数据集
疫情相似句对诊断数据集
2019-nCoV新型冠状病毒基因测序数据
2020新冠肺炎全国各省数据

IT通讯
阿里巴巴快递送达检测系统Beacon数据集
大型硬盘故障预测数据集

交通
谷歌地标数据集

自然语言处理
语义分割数据集
谷歌MC4数据集(可翻译101种语言)

工业
布匹瑕疵智能识别数据集

农业
遥感检测数据集

科学
太阳耀斑预测数据集
太阳黑子类型智能分类数据集

计算机视觉
视盲OCR图片文案顺序理解数据集

家装
家居成品房3D图像数据集

公共
2012美联邦总统选举数据
共享单车租用数据
教育系统学生分班预测
雇员工作满意度预测数据
员工离职预测数据

娱乐
豆瓣电影评分数据

金融
银行营销活动效果预测
信贷用户逾期预测数据
金融业股票数据
二手车交易数据集

阿里系唯一对外开放数据分享平台天池数据集2020收官精品合集大放送_第1张图片

原文链接:https://developer.aliyun.com/article/780744?

**版权声明:**本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

你可能感兴趣的:(阿里系唯一对外开放数据分享平台天池数据集2020收官精品合集大放送)