↑↑↑关注后"星标"Datawhale
每日干货 & 每月组队学习,不错过
Datawhale学习
开源贡献:Datawhale团队
今年最后一次组队学习,包含数据分析、编程实践(LeetCode腾讯精选练习50)、异常检测、自然语言处理(知识图谱)四个内容的路线学习,参与学习需要有一些Python基础。
Datawhale作为开源组织,更多是希望营造互促的学习氛围和纯粹的学习环境,所有学习内容和学习规划都将开源在Datawhale Github上,方便大家有监督和无监督学习,从而帮助到更多学习者成长。
截止今日,Datawhale已经近开源30多门学习内容,涉及编程、数据挖掘、cv、nlp、强化学习和推荐系统六大模块,这来自每一个开源贡献者的参与。
https://github.com/datawhalechina/team-learning
关于组队学习,顾名思义,就是一群志同道合的小伙伴聚集一起,一起学习,一起讨论,一起组队打boss,一起克服拖延症。其实没有老师,没有教学,有的是一群热爱学习和渴望改变的小伙伴,交流学习,互促共进。
1 /数据分析(学术前沿趋势分析)
开源贡献:刘羽中、杨毅远、张晋、雷钲仪、周郴莲、宋怡然、姚童
组队学习说明:
本次新人赛是Datawhale与天池联合发起的零基础入门系列赛事第五场 —— 零基础入门数据分析之学术前沿趋势分析。
赛题以数据分析为背景,要求选手使用公开的arXiv论文完成对应的数据分析操作。与之前的数据挖掘赛题不同,本次赛题不仅要求选手对数据进行建模,而且需要选手利用赛题数据完成具体的可视化分析。
为更好的引导大家入门,我们同时为本赛题定制了系列学习方案,其中包括数据科学库使用(Pandas、Numpy和Matplotlib)、数据分析介绍和数据分析工具使用三部分。通过对本方案的完整学习,可以帮助掌握数据分析基本技能。同时我们也将提供专属的视频直播学习通道。
任务路线:论文数据统计 -> 论文作者统计 -> 论文代码统计 -> 论文种类分类 -> 作者信息关联
组队学习周期:15天
学习名额:上限200人
定位人群:熟悉数据挖掘的基本方法,对学习数据分析掌握比赛技巧有需求的学习者。难度系数中
每个任务完成大概所需时间:3-5h
任务预览(3天)
Task04:论文种类分类(3天)
学习主题:论文种类分类(数据建模任务),利用已有数据建模,对新论文进行类别分类;
学习内容:使用论文标题完成类别分类;
学习成果:学会文本分类的基本方法、TFIDF
等;
2 /编程实践(LeetCode 腾讯精选练习50)
开源贡献:姚行志,韩绘锦,徐韬,马燕鹏
组队学习说明:每天刷三道题,利用20天完成Leetcode腾讯精选练习50题,主动讨论并总结。
任务路线:每天三道算法题,期间包含讨论总结环节。
组队学习周期:20天
学习名额:上限100人
定位人群:编程语言学习者,难度系数中
每个任务完成大概所需时间:3-5h
任务预览(1天)
Task03:完成以下三个题目并打卡(1天)
011 盛最多水的容器
014 最长公共前缀
015 三数之和
注释:考虑到一天三道题的强度较高,本次学习安排了讨论总结环节,以便学习者回顾、总结和调整。
3 /数据挖掘(异常检测)
开源贡献:梁家晖,李玲,李芝翔,赵可,陈信达
组队学习说明:理解传统的异常检测方法原理,并具备基本的调用相应python库进行操作的能力。
任务路线:异常检测介绍、基于统计学的方法、线性模型、基于相似度的方法等。
组队学习周期:14天
学习名额:上限100人
定位人群:熟悉数据挖掘的基本方法,对学习异常检测算法有需求的学习者。难度系数中
每个任务完成大概所需时间:3-5h
任务预览(3天)
Task02:基于统计学的方法(3天)
掌握基于高斯分布的异常检测方法
理解非参数异常检测方法
掌握HBOS算法
4 /自然语言处理实践(知识图谱)
开源贡献:吴晓均、杨开漠、康兵兵,周郴莲,王翔,超逸,王嘉鹏,陈安东,段秋阳
组队学习说明:理解知识图谱的基本原理,熟悉Neo4j并具备基本的调用相应python库进行操作的能力。
任务路线:知识图谱介绍、基于医疗知识图谱的问答系统操作介绍、Neo4j图数据库导入数据等。
组队学习周期:8天
学习名额:上限100人
定位人群:熟悉自然语言处理基本方法,对学习知识图谱算法有需求的学员。,难度系数中
每个任务完成大概所需时间:3-5h
任务预览(1天)
引言
运行环境
搭建知识图谱
启动问答测试
代码目录介绍
【数据分析之学术前沿趋势分析】开源地址
https://github.com/datawhalechina/team-learning-data-mining/tree/master/AcademicTrends
【编程实践】 开源地址
https://github.com/datawhalechina/team-learning-program/tree/master/LeetCodeTencent
【异常检测】 开源地址
https://github.com/datawhalechina/team-learning-data-mining/tree/master/AnomalyDetection
【知识图谱】 开源地址
https://github.com/datawhalechina/team-learning-nlp/tree/master/KnowledgeGraph_Basic
【Datawhale论坛】本期详细学习安排
论坛链接:http://datawhale.club/t/topic/1012
需交督促金3块:1块学习,1块分享,1块成长;
需要有一个可以记录学习的公开帐号;
根据任务安排学习,完成后写学习笔记blog;
任务截止前在群内打卡,遇到问题一起交流讨论;
未按时打卡的同学视为自动放弃,流出学习群。
1月9日(周六)中午12:00 在Datawhale社群(高校群和在职群)分享报名二维码,组织学习非盈利,精力有限,没有报上名的可以根据开源教程自行安排学习。
最后,未在社群的小伙伴,可在公众号后台回复关键词“在校”或“在职”进群。(已在的不需要重复加入!)直接获得名额:
分享获赞满30个或最用心留言10个
⬇️ 详细查看【寒假组队学习安排】