↑↑↑关注后"星标"Datawhale
每日干货 & 每月组队学习,不错过
Datawhale学习
开源贡献:Datawhale团队
这是今年三月份的组队学习(每月第2周周六组织),这次学习于3月13日报名,内容如下:
(1) 数据挖掘项目实践
(2) 集成学习(上)
(3) 深度推荐模型
(4) 编程实践(区块链)
Datawhale作为开源组织,更多是希望营造互促的学习氛围和纯粹的学习环境,所有学习内容和学习规划都将开源在Datawhale Github上,方便大家有监督和无监督学习,从而帮助到更多学习者成长。
截止今日,Datawhale已经近开源30多门学习内容,涉及编程、数据挖掘、cv、nlp、强化学习和推荐系统六大模块,这来自每一个开源贡献者的参与。
https://github.com/datawhalechina/team-learning
关于组队学习,顾名思义,就是一群志同道合的小伙伴聚集一起,一起学习,一起讨论,一起组队打boss,一起克服拖延症。其实没有老师,没有教学,有的是一群热爱学习和渴望改变的小伙伴,交流学习,互促共进。
1 /数据挖掘项目(心电图心跳分类)
开源贡献:鱼佬、杜晓东、张晋、王皓月、牧小熊、姚昱君
任务路线:赛题理解及baseline学习、探索性数据分析(EDA)、特征工程等
组队学习周期:14天
定位人群:熟悉数据挖掘的基本方法,对学习时间序列相关问题和医学大数据有需求的学员。难度系数中
每个任务完成大概所需时间:3-5h
任务预览(3天)
Task02:探索性数据分析(EDA)(3天)
EDA的价值主要在于熟悉数据集,了解数据集,对数据集进行验证来确定所获得数据集可以用于接下来的机器学习或者深度学习使用。
当了解了数据集之后我们下一步就是要去了解变量间的相互关系以及变量与预测值之间的存在关系。
...
2 /编程实践(区块链)
开源贡献:陈锴、孙子涵、李岳昆、易远哲
任务路线:区块链简介与以太坊入门介绍、Solidity基础、web3js基础等
组队学习周期:12天
定位人群:具有至少一门编程语言基础,在开展组队学习之前能够熟悉 Linux 基本操作。难度系数较大
每个任务完成大概所需时间:3-5h
任务预览(3天)
Task02:Solidity基础(3天)
学习者学习Solidity在线编辑器Remix的使用以及Solidity的基础操作,该部分需要深入掌握,学习者可以根据参考链接提供的资料进一步学习
打卡内容为Task02最后的Solidity练习题部分,其他内容不作硬性要求
3 /集成学习(上)
开源贡献:李祖贤、薛传雨、赵可、杨毅远、陈琰钰
组队学习说明:本次学习详细地介绍了机器学习领域中最经典的算法并给出了相应的数学推导和代码,对于每个算法都进行了细致的分析以及必要的代码的演示,便于学习者深刻理解机器学习算法的本质。在案例的代码中,我们给出了详细的代码注释,尽量让学习者们不会因为看不懂代码而感到烦恼。
任务路线:掌握基本的回归模型、偏差与方差理论、回归模型的评估及超参数调优等
组队学习周期:15天
定位人群:具备《高等数学》、《线性代数》、《概率论与数理统计》基础,会使用常见的数据分析工具(Numpy,Pandas、matplotlib),既想系统学习sklearn工具库解决机器学习问题,又想系统学习机器学习算法理论的数学推导的学习者。难度系数中
每个任务完成大概所需时间:3-5h
⚠️ 特别提示:本次课程为跨度3个月的长期学习,分为上中下三期,每期15天左右,当期学完有1-2周休息复盘时间,然后默认跟随下个月组队学习活动开始,不需要重复报名。
任务预览(3天)
Task04:掌握回归模型的评估及超参数调优(3天)
数据科学永恒不变的主题也许就是调参吧,正确的调参姿势也是建立在正确评估模型的基础上的。因此我们要从偏差与方差理论中得到启发,从数学理论和代码上掌握回归模型的评估及超参数调优。
4 /深度推荐模型
开源贡献:罗如意、吴忠强、何世福、徐何军、田雨、刘纪川、宁彦吉、赖敏材
组队学习说明:熟悉经典深度学习模型的原理及代码实现(考虑到内容太多,这里选择了部分模型进行组队学习)。
任务路线:DeepCrossing、Wide&Deep、DeepFM等
组队学习周期:13天
定位人群:了解机器学习基础, 了解推荐系统基础(参加过以往的推荐系统组队学习),了解TF2 keras的基本用法。难度系数中
每个任务完成大概所需时间:3-5h
任务预览(3天)
Task03:DeepFM(3天)
完成模型理论学习及代码实现
完成思考题
a. 编程实践(区块链)
开源内容:https://github.com/datawhalechina/team-learning-program/tree/master/Blockchain
b. 集成学习
开源内容:https://github.com/datawhalechina/team-learning-data-mining/tree/master/IntegratedLearning
c. 深度推荐模型
开源内容:https://github.com/datawhalechina/team-learning-rs/tree/master/DeepRecommendationModel
d. 数据挖掘项目(心电图心跳分类)
开源内容:https://github.com/datawhalechina/team-learning-data-mining/tree/master/HeartbeatClassification
1.需交督促金3块:1块学习,1块分享,1块成长;
2.需要有一个可以记录学习笔记的公开帐号;
3.根据任务安排学习,完成后写学习笔记;
4.任务截止前在群内打卡,遇到问题一起交流;
5.未按时打卡的同学视为放弃,流出学习群。
3月13日中午11:30 在Datawhale社群(高校群和在职群)分享报名二维码。由于组织学习非盈利,精力有限,没有报上名的可以根据开源教程自行安排学习。
最后,未在社群的小伙伴,可在公众号后台回复关键词“在校”或“在职”进群(已在的不需要重复加入)。直接获得名额(获赞截图发到后台):
分享获赞满30个或最用心留言10个
⬇️ 详细查看【三月组队学习安排】