EdX是Harvard和MIT两所顶尖院校于2012年4月联合推出的在线慕课平台。用户可以在edX上学习这两所名校开设的超优质课程,内容涵盖计算机科学,技术,科学,工程,数学,人文,社会等不同领域。平台集中了尖端教育的资源,是免费给大众开放的非营利平台。
数据获取地址:Online Courses from Harvard and MIT
2)数据集中各字段含义:
共有290个在线课堂数据,字段信息23个,可大致分为4类:
1、课程相关字段:
Institution(online course holders)课程持有机构
Course number(the unique id of each course) 课程编号ID
Launch date上线日期
Course title课程名称
Instructors讲师
Course subject课程主题
Honor code certificates是否提供认证,有(1)没有(0)
Year课程持续时间
2、数量相关字段:
Total course hours总课程时长小时数
Paticipants学生数
Certified 拿到认证人数
Median hours for certification 拿到认证小时数的中位数
Audited (50% course content accessed)完成 50%课程人数
3、百分比相关字段:
%audited 完成 50%课程人数占比
%certified 认证人数占比
%certified of > 50% course content accessed 认证人数在完成 50%课程人数中占比
%play video 播放视频人数占比
% posted in forum 粘贴到论坛占比
%grade higher than zero分数高于0的百分比
4、学员信息相关字段:
Median age用户年龄中位数
%male男性占比
%female女性占比
%bachelor’s degree or higher用户学士学历或以上占比
3)社群会员作业
第1关行业选择:进入商业智能BI首先从数据分析开始
第3关excel分析:EdX在线课堂平台数据分析
第4关sql分析:SQL实践之MITx&HarvardX在线课程分析
1)数据集描述
记录了2550个TED,每条记录有17个属性。
数据下载地址:TED Talks
2)字段含义
comments(评论数量):The number of first level comments made on the talk
description(内容描述):A blurb of what the talk is about
duration(持续时间):The duration of the talk in seconds
event(事件):The TED/TEDx event where the talk took place
film_date(拍摄时间戳):The Unix timestamp of the filming
languages(语言):The number of languages in which the talk is available
main_speaker(主讲人):The first named speaker of the talk
name(名称):The official name of the TED Talk. Includes the title and the speaker.
num_speaker(主讲人个数):The number of speakers in the talk
published_date(发布时间):The Unix timestamp for the publication of the talk onhttp://TED.com
ratings(评级):A stringified dictionary of the various ratings given to the talk (inspiring, fascinating, jaw dropping, etc.)
related_talks(相关的演讲):A list of dictionaries of recommended talks to watch next
speaker_occupation(演讲者职业):The occupation of the main speaker
tags(标签):The themes associated with the talk
title(标题):The title of the talk
url(链接):The URL of the talk
views(观看次数):The number of views on the talk
3)社群会员作业:
第1关行业选择:终于要开始分析ted啦!!!
第3关excel分析:用Excel解开Ted神秘面纱
第4关sql分析:使用SQL分析TED数据
第5关可视化报告:TED数据分析报告
世界银行EdStats所有指标查询拥有超过4,000个国际可比指标,数据集是以国家为单位,包含了242个国家,从1970年至2014年期间,描述了教育访问,进展,完成,识字,教师,人口和支出。这些指标涵盖了从学前教育到职业和高等教育的教育周期。
该查询还包含来自国际和区域学习评估(例如PISA,TIMSS,PIRLS)的学习成果数据,来自住户调查的股权数据以及到2050年的预测/达成数据。
数据获取地址:Education Statistics
2)社群会员作业
第1关行业选择:如何开始走上数据分析的不归路?
1)社群会员作业:
第3关excel分析:教育领域数据分析实战项目
慕课网:如何用Excel分析中国慕课
当当网:当当网数据分析报告
使用ptyhon爬虫分析猿辅导课程