Datawhale学习
开源贡献:Datawhale团队
本月组队学习,包含了人工智能(含机器学习、深度学习)、数据科学、编程实践、计算机科学4个模块,共11个学习内容。
Datawhale作为开源组织,更多是希望营造互促的学习氛围和纯粹的学习环境,所有学习内容和学习规划都将开源在Datawhale Github上(地址见下方),方便大家有监督和无监督学习,从而帮助到更多学习者成长。
截止今日,Datawhale已经开源50多门学习内容,涉及编程、数据科学、cv、nlp、强化学习和推荐系统6大模块,这源自每一个开源贡献者的参与。
https://github.com/datawhalechina/team-learning
顾名思义,就是一群志同道合的小伙伴,一起学习讨论,一起克服拖延症,一起组队打boss。没有老师,没有教学,有的是一群热爱学习和渴望改变的人,交流学习,互促共进。或许你可以从这些文章进一步了解:《黄元帅:组队学习的大航海模型》、《闻韶:我的组队学习经历》、《罗如意:从学习者到贡献者》。
1 /吃瓜教程—西瓜书+南瓜书
开源贡献:谢文睿、秦州、陈伟峰
内容说明:周志华老师的“西瓜书”是机器学习经典入门教材,值得反复阅读,配合“南瓜书”从本科数学基础的视角进行讲解,一起打好基础!
任务路线:以《机器学习》西瓜书为主线,配合南瓜书攻克疑难点。
学习周期:18天
定位人群:有本科数学基础(指高数、线代、概率论与数理统计,以下同)的同学
学习名额:180人
⚠️ 配套讲解视频已上传至B站,地址见文末「快速通道」
任务节选
Task02:概览西瓜书、南瓜书第3章(6天)
《机器学习》第3章
涉及的线性回归等数学难点
2 /李宏毅机器学习(含深度学习)
开源贡献:王茂霖、陈安东、刘峥嵘、李玲、郭棉昇、汪超、赵美
内容说明:辅助大家更好学习李宏毅老师机器学习视频,并加入相关补充资料,相信你会对机器学习有更加深刻的理解。
任务路线:李宏毅视频+解读辅助
学习周期:14天
定位人群:深度学习初学者,有微积分,线性代数基础
学习名额:80人
任务预览
Task4:深度学习介绍和反向传播机制(2天)
了解深度学习的基础知识
熟悉反向传播机制
3 /统计学习方法习题实战【公测】
开源贡献:胡锐锋、王维嘉、王瀚翀、王茸茸、毛鹏志、张璇、王天富、范佳慧
内容说明:李航老师的《统计学习方法》是机器学习的经典入门教材,主要学习本书第1篇的监督学习内容,结合课后习题,巩固相关知识。
任务路线:以习题为核心,配合教程;先看书、做题、看习题解答。
学习周期:18天
定位人群:具有本科数学基础(指高数、线代、概率论与数理统计)的同学。
学习名额:80人
任务节选
Task01:第1章-统计学习方法概论(3天)
4 /scikit-learn教程【公测】
开源贡献:江季、李牧轩、武帅、陈宇
内容说明:使用sklearn学习库进行各类算法的实战,帮助读者分析各个算法的特点,并且善用可视化技术润色结果。
任务路线:从线性回归到集成学习、可视化,进行各类算法的编程实践
学习周期:24天
定位人群:具有一定机器学习概念以及Python编程的同学。
学习名额:80人
任务节选
Task03:贝叶斯(3天)
5 /推荐系统-新闻推荐系统实践【公测】
开源贡献:罗如意、肖桐、汪志鸿,吴忠强,赖敏材,王辰玥,毛伟、宋禹成,陈雨龙,管柯琴
内容说明:新闻推荐系统实践是fun-rec开源项目中比较偏工程的实战项目(前端+后端+策略+算法),该项目仅用于学习推荐系统的基本流程和实现过程。
任务路线:实践学习如何构建一个新闻推荐系统
学习周期:18天
定位人群:了解推荐推荐系统,有一定的计算机基础,想了解推荐系统工程实现的同学。
学习名额:80人
⚠️ 特别提示:内容较多,但每次任务中会给大家划重点学习
任务节选
Task03:离线物料系统的构建(4天)
爬虫
构建画像
物料入库
6 / SQL编程语言
开源贡献:王复振、杨煜、闫钟峰、杨梦迪、苏鹏、红星、张晋、汪健麟、李云龙、蒋志强
内容说明:Follow me,从 0 到 1 掌握 SQL,决胜秋招。
任务路线:完成SQL使用环境搭建,了解关系型数据库的基本特点,熟悉SQL增删改查基本操作,进一步掌握视图、子查询、函数、窗口函数等高阶用法,最后试一试秋招秘籍,检验下自己学习的效果。
组队学习周期:15天
定位人群:0基础学员,希望掌握SQL基础查询的同学
学习名额:80人
任务预览
Task04 集合运算(3天)
表的加减法
连结(JOIN)
7 / 数据可视化(Matplotlib)
开源贡献:杨剑砺、杨煜、耿远昊、李运佳、居凤霞、王万、范歆琦
内容说明:系统梳理了python最重要的数据可视化包的方方面面,并配有练习题供学习者核查学习效果。
任务路线:本次课程内容的设计基于原汁原味的官方文档结构,通过画笔、布局、图例和样式来系统学习Python数据可视化。
组队学习周期:14天
定位人群:有基本的python基础,希望通过系统学习matplotlib提升可视化技能的人
学习名额:80人
任务预览
Task02:艺术画笔见乾坤(5天)
作为整个matplotlib宇宙中最重要的一个环节,重点介绍了matplotlib绘图的核心API,以及使用matplotlib绘制基本元素的方法
8 / 动手学数据分析
开源贡献:陈安东、金娟娟、杨佳达、老表、李玲、张文涛、高立业、范淑卷、武者小路、曾心怡
内容说明:以项目为主线,通过边学,边做以及边被引导的方式,既掌握知识点又能掌握数据分析的大致思路和流程。
任务路线:了解数据分析中基本库的操作;熟悉数据分析的操作流程,建立数据分析思维,入门数据建模。
组队学习周期:11天
定位人群:懂一些python,希望入门数据分析的学习者。
学习名额:80人
任务预览
Task01:数据加载及探索性数据分析(2天)
了解数据加载以及数据观察
掌握pandas基础
完成探索性数据分析
9 / Linux实践【公测】
开源贡献:刘羽中、刘洋、王晓亮、陈玉立、六一
内容说明:各种企业的服务器应用99%都是Linux系统,如果你想成为一个合格的软件工程师&算法工程师,Linux是你必备的技能。本次学习旨在帮助学习者掌握Linux基本操作。
任务路线:由登陆环境开始,从0-1实践Linux基础。
组队学习周期:15天
定位人群:不限
学习名额:80人
⚠️ 特别提示:本课程需要使用链接打卡,提供操作截图来完成任务。
任务节选
Task02:任务5-7(5天)
在目录下创建py文件,并进行运行
在目录下创建py目录,并进行import导入
在Linux系统中后台运行应用程序,并打印日志
10 / 算法的应用【公测】
开源贡献:肖然、李铭哲、伊雪
内容说明:本次内容主要是对算法的理解和应用,我们会从优质的课程设计、或者简化的工业界小项目出发。希望每一个参与者能够实现相应的函数接口。
任务路线:我们会给出相关的文档和函数的接口设计,每个学习的同学都需要实现代码,并提交自己的代码到我们的网站,会有相关的可视化显示。
学习周期:14天
定位人群:计算机相关专业,有一定编程能力,学习过数据结构。
学习名额:80人
任务节选
Task03:简易计算器(3天)
11 /深入理解计算机系统(CSAPP)【公测】
开源贡献:李岳昆、易远哲、初晓宇、叶前坤、沈豪
内容说明:本篇为「Datawhale 开源 408 计划」首篇,旨在通过计算机科学领域经典丛书:《深入理解计算机系统》帮助更多的小伙伴理解计算机真实的运行过程与逻辑。Datawhale开源社区将全程支持并提供CSAPP原书习题、lab伴读、课件制作等内容。
任务路线:按照书籍编排进行学习,提供ppt等多种学习材料
学习周期:18天
定位人群:0基础希望理解计算机底层系统的同学
学习名额:80人
任务节选
Task02:信息的表示和处理(3天)
注:课程中,带【公测】标签的是新课,会有大量更新,举办周期不定;其余课程均为完善稳定的精品课系列。
开源地址
⭐ 为难度系数
1. 吃瓜教程——西瓜书+南瓜书⭐⭐
开源地址:https://github.com/datawhalechina/pumpkin-book
B 站视频教程:https://www.bilibili.com/video/BV1Mh411e7VU
2. 李宏毅机器学习(含深度学习) ⭐⭐
开源地址github:https://github.com/datawhalechina/leeml-notes
开源地址 gitee :https://gitee.com/datawhalechina/leeml-notes
3. 统计学习方法习题实战⭐⭐
开源地址:https://github.com/datawhalechina/statistical-learning-method-solutions-manual
4. scikit-learn教程 ⭐⭐
开源地址:https://github.com/datawhalechina/machine-learning-toy-code/tree/main/ml-with-sklearn
5. 推荐系统-新闻推荐系统实践 ⭐⭐⭐
开源地址:https://github.com/datawhalechina/fun-rec
6. SQL编程语言 ⭐
开源地址:https://github.com/datawhalechina/wonderful-sql
7. 数据可视化 ⭐
开源地址github:https://github.com/datawhalechina/fantastic-matplotlib
开源地址 gitee :https://gitee.com/datawhalechina/fantastic-matplotlib
8. 动手学数据分析 ⭐⭐
开源地址github:https://github.com/datawhalechina/hands-on-data-analysis
开源内容gitee:https://gitee.com/datawhalechina/hands-on-data-analysis
B 站视频:https://www.bilibili.com/video/BV1Uv411p77r
9. Linux实践 ⭐
开源地址:https://github.com/datawhalechina/team-learning-program/tree/master/LinuxPractice
10. 算法的应用 ⭐⭐
开源地址:https://github.com/datawhalechina/team-learning-program/tree/master/AlgorithmRunning
11. 深入理解计算机系统 ⭐⭐
开源内容:https://github.com/datawhalechina/team-learning-program/tree/master/ComputerSystems
▶ 时间:12月11日(周六)中午11:30
▶ 方式:在Datawhale高校群/在职群参与报名学习。
关注公众号,后台回复关键词“在校”或“在职”进群;已在则无需重复加入。
由于组织学习非盈利,精力有限,未报名成功可以根据开源教程自行安排学习。
为了我们更好的学习效果,请关注以下规则:
1. 需交督促金3块(1块学习,1块分享,1块成长),按时完成所有任务返还;
2. 需要有Github或博客等公共账号,记录学习笔记;
3. 未按时打卡的同学会被抱出群
提前名额
在朋友圈分享这篇文章获20个赞,发送截图到后台,审核后可获 提前学习 名额。
一键三连,一起学习⬇️