2015 年,教育部公布新增“数据科学与大数据技术”专业,首批本科专业 2016 年入学;此后,32 所、250 所、196 所……迄今为止,全国各地已有 700 余所高校开设此专业。
中国石油大学(华东)(以下简称“中石大”)作为教育部直属全国重点大学,也是“双一流”首批建设高校,其理学院于 2019 年获批开设数据科学与大数据技术专业,秋季招收首批本科生。从时间上看,中石大开设得并不算早;但从专业与学生发展来看,中石大后起而勃发,结合校特色学科进行的专业建设与人才培养工作,取得了十分亮眼的成绩。
还有雄厚的师资、强大的科研实力……均构成了中石大过硬的招生简章。
中石大如何交出这份漂亮答卷?
和鲸与中石大从 2019 年开始合作至今,一路陪伴、见证了专业的成长。在迎来首批毕业生这样特殊的节点,我们邀请了中国石油大学(华东)理学院数据科学与统计系主任陈华老师,共同揭开背后的故事……
——和鲸协同打造建设大数据实践教学平台
数据科学本身即具有交叉属性,可认为是数学、统计学、计算机科学三者的结合。中石大的数据科学与大数据技术专业虽在理学院下开设,但专业建设的规范和标准是什么、课程如何设置、学生如何培养……陈华老师告诉我们,这些都是最初规划时困扰了老师们很久的问题。
“各个学校对于新专业的设计差异很大,因为都是在摸着石头过河。18 年我们几乎花了一整年时间到各个已经开设了(数据科学与大数据技术专业)的高校学习和沟通。”
而在经过广泛调研后,理学院最终决定基于 OBE 模式——从学生的出口倒推课程的设计,落实到具体的培养方案上,则形成了融合厚基础、创特色、重实践等的设计理念,这也为和鲸与中石大的友好合作奠定了基础。
学生的出口主要针对就业与深造两个方向。
就业方面的能力对标的是“数据科学家(Data Scientist)”,它对应在企业的职能可能是数据分析师、算法工程师、人工智能工程师、大数据专家等等,与传统的统计学出口相比范围会更广泛。2020年人社部发布的《新职业——大数据工程技术人员就业景气现状分析报告》中指出,大数据行业的就业方向包括研发类、开发类和分析类,因而学生既要能精通计算机与统计学,打下厚实的数学基础,也要学习大数据、人工智能、算法、模型等,了解各类技术的基础原理。深造则更多从学生考研的角度出发,由于数据科学目前尚未设置一级学科,便还是以计算机与统计为两大主流方向。
另外,理学院更进一步结合中石大的校特色——能源与海洋,打造有学科特色的数据科学与大数据技术专业,从行业角度加强对于学生在技术与领域结合方面能力的培养。正如陈华老师所言:“数据要依托于领域,没有领域的支撑数据便无法发挥作用。” 学科交叉的创新课程不在多而在精,从领域出发才能形成有效结合,正是在此基础上,中石大与和鲸共同探索出了课赛结合的创新实践课程(将在后文具体说明),这也是目前和鲸调研下来教学效果最好的学科交叉课程的授课模式。
基于 OBE 理念,结合科学(数学、统计学、数据科学)、技术(计算机技术、大数据技术)及能源与海洋应用三个层次,便构成了中石大独有的课程教学体系。
实践对于数据科学与大数据技术教学的重要性不言而喻,在课堂教学体系的基础上,理学院同时构建起“五位一体”的实践教育体系,包含课内上机、暑期实训、学科竞赛、自主创新项目及企业实践,以培养高层次复合型数据科学应用人才。
然而,课堂实践普遍存在一些特质化的重难点问题:例如师生将面对繁复的环境准备、专业发展不成熟导致课程的数据资源与案例资源有限、算力资源用不起来等等……因此,为了实现更有效、更高效的实践教学,在中石大数据科学与大数据技术专业获批的同年,和鲸协助理学院基于 ModelWhale 数据科学教学-实训平台,建设学练一体的大数据实践教学平台,支持日常的课程教学。
平台同时提供 Jupyter Notebook 交互式编程工具和拖拽式分析建模工具,并内置了数百种 Python、R 语言工具包和深度学习框架,师生网页登录即可进行使用。课上,学生可以跟着老师的节奏复现课件及案例,加深对知识的理解;课后,老师可以发布实践练习让学生在线提交并自动评分。
对于《机器学习》、《神经网络》这类的核心专业课,理学院采取了创新的教学模式——先实践后理论。“和鲸的平台能很好地帮助学生快速上手,学生在实践课上调用过以后就会产生好奇心,比如当他想知道如何改进优化结果时,就会反过来激发他了解内部机理、学习理论课的热情。” 陈华老师说,“和鲸社区也提供了丰富的教学资源,我经常能看到学生提交上来的作品标注数据来源于和鲸社区。”
——和鲸协同打造课赛结合的创新课程
除了课内实践外,学院还设置了特别的课外实践形式:数据科学竞赛。陈华老师表示:“竞赛可以培养学生的创新意识,让学生在解决真实行业问题的过程中锻炼实践能力。”
但与其他竞赛不同的是,数据科学竞赛涉及到数据、代码、环境、算力等多种要素,若缺乏合适的竞赛平台,其筹备与运营将十分繁复。在此背景下,理学院邀请和鲸共同办赛,和鲸从 2015 年就开展了数据科学竞赛业务,甚至可以说是国内数据竞赛的开拓者,丰富的办赛经验与体系化的赛事模块已获得高校的广泛认可。
2021年5月,在中石大“数学文化节”期间,由和鲸联合主办的中国石油大学(华东)疾病预测数据竞赛(校内赛)在和鲸社区正式上线。比赛同样基于 ModelWhale 数据科学教学-实训平台,通过“算法学习+算法竞赛”的形式,提升学生的数据科学基础知识和数据思维能力,在实战应用中重组所学知识,实现学以致用,达到以赛促教、以赛促学的目的。
考虑到参赛的学生不一定完全具备参赛所需的基础知识与技能,故而赛程设置三个阶段:
事实上,“以赛促教”最根本的目的还是在于验证学生对知识掌握的水平与实操能力,过程比结果更重要。因而平台除了提供高效的自动评估外,老师也可以通过主观评审直接查看并运行学生编写的代码,了解学生的算法思路,验证能否真正跑通,并进行打分、留下评语,指导学生改进。
陈华老师告诉我们,通过先学后赛的形式,学生在下半年上《数据科学与大数据技术导论》时明显有了更深刻的理解与更扎实的基础。
与办赛同样重要的是激发学生的参赛积极性。其实早在数据科学专业开设之前,中石大就以举办数学竞赛形成了较为浓厚的竞赛氛围,后来又设置了“第二课堂”激励学生参与各类创新创业、社会实践与志愿服务等活动。
对于数据科学与大数据技术专业的同学,理学院将第一课堂与第二课堂进行了结合,形成创新的“课赛结合”模式——将竞赛融入课堂教学,竞赛的作品与成绩对应列入课程考核的一部分。2022 年的第二届数据竞赛以海洋为主题,赛题考核的范围浅至如何认识海洋大数据,深至海洋数据挖掘与深度学习模型。在和鲸的协助下,赛题设计既面向真实应用场景,又能与课程的知识点与教学进度高度挂钩,可以达到更有效的教学评估。
更为重要的是,参与校内竞赛能帮助学生积累竞赛经验,以在更高级别的竞赛上取得好成绩。但陈华老师表示,理学院会给学生提供一份竞赛指南:“现在市面上竞赛很多,参赛又很耗时,我们希望学生能真正参与那些对他们有帮助的比赛,比如你们和鲸承办的 4C 大赛。还是那句话,要以出口为导向。”正是在这样的引导下,2023 年的首批毕业生均有着出众的竞赛经历与竞赛实力,在多个国家 A 类竞赛中取得的佳绩成为了他们就业时的“加分项”。
另外,理学院举办的竞赛也不仅仅面向本专业学生,全校各个专业都可以参与。从 2021 年第一届的疾病预测,到 2022 年海洋数据,再到 2023 年的贷款预测,多样化的赛题已吸引了上千名学生。
“和鲸的平台很灵活,既能举办小规模的校内比赛,也能承接大规模的国家级赛事。希望咱们之后有机会举办一个覆盖整个青岛高校的挑战赛,扩大竞赛的覆盖面,让更多学生受益。”这是陈华老师的期待,也是和鲸的期待。
四年过去,中国石油大学(华东)理学院数据科学与大数据技术专业从开设到迎来了第一届优秀毕业生,和鲸也获得更多认可与信任,成长为高校搭建教学实训平台的首选。但正如陈华老师所说,专业的发展要跟上时代,技术的发展也在日新月异,未来双方仍将持续携手,共同进步、共同成长。
基于全国高等教育新愿景,和鲸长期助力推动高校教改、课改,依据 OBE 成果导向教育模式,集成功能强大的数据科学协同平台 ModelWhale,拥有丰富实战案例资源的和鲸社区,及和鲸科赛多年的办赛经验与比赛模块,构建出了最完备的产品 + 资源 + 服务体系,并已落地应用于众高校数据科学相关专业(课程)体系建设的工作中——协助中国人民大学信息学院搭建“交叉学科教研一体化新型数据分析平台”、协助四川大学公共管理学院搭建“大数据应用实训系统”、协助暨南大学经济管理实验教学中心搭建“商科大数据教学实训平台”…——获得从双一流到普通高校客户的广泛好评。
和鲸愿用已积累、沉淀的经验及方法论,与高校一起梳理需求、痛点,进行数据驱动相关专业(课程)体系的搭建与完善,为国家应用型人才培养带来实质性的帮助。任何相关需求,都欢迎您扫描下方二维码或搜索进入 ModelWhale 官网 注册体验、与我们展开交流。