教育行业公开数据集免费下载

  • Edx在线课程数据

EdX是Harvard和MIT两所顶尖院校于2012年4月联合推出的在线慕课平台。用户可以在edX上学习这两所名校开设的超优质课程,内容涵盖计算机科学,技术,科学,工程,数学,人文,社会等不同领域。平台集中了尖端教育的资源,是免费给大众开放的非营利平台。

数据获取地址:Online Courses from Harvard and MIT

2)数据集中各字段含义:

共有290个在线课堂数据,字段信息23个,可大致分为4类:

1、课程相关字段:
Institution(online course holders)课程持有机构
Course number(the unique id of each course) 课程编号ID
Launch date上线日期
Course title课程名称
Instructors讲师
Course subject课程主题
Honor code certificates是否提供认证,有(1)没有(0)
Year课程持续时间

2、数量相关字段:
Total course hours总课程时长小时数
Paticipants学生数
Certified 拿到认证人数
Median hours for certification 拿到认证小时数的中位数
Audited (50% course content accessed)完成 50%课程人数

3、百分比相关字段:
%audited 完成 50%课程人数占比
%certified 认证人数占比
%certified of > 50% course content accessed 认证人数在完成 50%课程人数中占比
%play video 播放视频人数占比
% posted in forum 粘贴到论坛占比
%grade higher than zero分数高于0的百分比

4、学员信息相关字段:
Median age用户年龄中位数
%male男性占比
%female女性占比
%bachelor’s degree or higher用户学士学历或以上占比

3)社群会员作业

第1关行业选择:进入商业智能BI首先从数据分析开始

第3关excel分析:EdX在线课堂平台数据分析

第4关sql分析:SQL实践之MITx&HarvardX在线课程分析

 

  • TED数据

1)数据集描述

记录了2550个TED,每条记录有17个属性。

数据下载地址:TED Talks

2)字段含义

comments(评论数量):The number of first level comments made on the talk

description(内容描述):A blurb of what the talk is about

duration(持续时间):The duration of the talk in seconds

event(事件):The TED/TEDx event where the talk took place

film_date(拍摄时间戳):The Unix timestamp of the filming

languages(语言):The number of languages in which the talk is available

main_speaker(主讲人):The first named speaker of the talk

name(名称):The official name of the TED Talk. Includes the title and the speaker.

num_speaker(主讲人个数):The number of speakers in the talk

published_date(发布时间):The Unix timestamp for the publication of the talk onhttp://TED.com

ratings(评级):A stringified dictionary of the various ratings given to the talk (inspiring, fascinating, jaw dropping, etc.)

related_talks(相关的演讲):A list of dictionaries of recommended talks to watch next

speaker_occupation(演讲者职业):The occupation of the main speaker

tags(标签):The themes associated with the talk

title(标题):The title of the talk

url(链接):The URL of the talk

views(观看次数):The number of views on the talk

教育行业公开数据集免费下载_第1张图片

3)社群会员作业:

第1关行业选择:终于要开始分析ted啦!!!

第3关excel分析:用Excel解开Ted神秘面纱

第4关sql分析:使用SQL分析TED数据

第5关可视化报告:TED数据分析报告

 

  • 世界银行的教育统计

世界银行EdStats所有指标查询拥有超过4,000个国际可比指标,数据集是以国家为单位,包含了242个国家,从1970年至2014年期间,描述了教育访问,进展,完成,识字,教师,人口和支出。这些指标涵盖了从学前教育到职业和高等教育的教育周期。

该查询还包含来自国际和区域学习评估(例如PISA,TIMSS,PIRLS)的学习成果数据,来自住户调查的股权数据以及到2050年的预测/达成数据。

数据获取地址:Education Statistics

2)社群会员作业

第1关行业选择:如何开始走上数据分析的不归路?

 

  • 爬虫获取学而思北京小学部2018秋季班面授课程

1)社群会员作业:

第3关excel分析:教育领域数据分析实战项目

慕课网:如何用Excel分析中国慕课

当当网:当当网数据分析报告

使用ptyhon爬虫分析猿辅导课程

你可能感兴趣的:(7_数智教育)