寒假组队学习计划!

↑↑↑关注后"星标"Datawhale

每日干货 & 每月组队学习,不错过

 Datawhale学习 

开源贡献:Datawhale团队

今年最后一次组队学习,包含数据分析、编程实践(LeetCode腾讯精选练习50)、异常检测、自然语言处理(知识图谱)四个内容的路线学习,参与学习需要有一些Python基础。

关于开源

Datawhale作为开源组织,更多是希望营造互促的学习氛围和纯粹的学习环境,所有学习内容和学习规划都将开源在Datawhale Github上,方便大家有监督和无监督学习,从而帮助到更多学习者成长。

开源内容

截止今日,Datawhale已经近开源30多门学习内容,涉及编程、数据挖掘、cv、nlp、强化学习和推荐系统六大模块,这来自每一个开源贡献者的参与。

开源地址

https://github.com/datawhalechina/team-learning

组队学习

关于组队学习,顾名思义,就是一群志同道合的小伙伴聚集一起,一起学习,一起讨论,一起组队打boss,一起克服拖延症。其实没有老师,没有教学,有的是一群热爱学习和渴望改变的小伙伴,交流学习,互促共进。

开源学习

1 /数据分析(学术前沿趋势分析)

开源贡献:刘羽中、杨毅远、张晋、雷钲仪、周郴莲、宋怡然、姚童

组队学习说明

    本次新人赛是Datawhale与天池联合发起的零基础入门系列赛事第五场 —— 零基础入门数据分析之学术前沿趋势分析。

    赛题以数据分析为背景,要求选手使用公开的arXiv论文完成对应的数据分析操作。与之前的数据挖掘赛题不同,本次赛题不仅要求选手对数据进行建模,而且需要选手利用赛题数据完成具体的可视化分析。

    为更好的引导大家入门,我们同时为本赛题定制了系列学习方案,其中包括数据科学库使用(Pandas、Numpy和Matplotlib)、数据分析介绍和数据分析工具使用三部分。通过对本方案的完整学习,可以帮助掌握数据分析基本技能。同时我们也将提供专属的视频直播学习通道。

任务路线:论文数据统计 -> 论文作者统计 -> 论文代码统计 -> 论文种类分类 -> 作者信息关联

组队学习周期:15天

学习名额:上限200人

定位人群:熟悉数据挖掘的基本方法,对学习数据分析掌握比赛技巧有需求的学习者。难度系数中

每个任务完成大概所需时间:3-5h

任务预览(3天)

Task04:论文种类分类(3天)

  • 学习主题:论文种类分类(数据建模任务),利用已有数据建模,对新论文进行类别分类;

  • 学习内容:使用论文标题完成类别分类;

  • 学习成果:学会文本分类的基本方法、TFIDF等;

2 /编程实践(LeetCode 腾讯精选练习50)

开源贡献:姚行志,韩绘锦,徐韬,马燕鹏

组队学习说明:每天刷三道题,利用20天完成Leetcode腾讯精选练习50题,主动讨论并总结。

任务路线:每天三道算法题,期间包含讨论总结环节。

组队学习周期:20天

学习名额:上限100人

定位人群:编程语言学习者,难度系数中

每个任务完成大概所需时间:3-5h

任务预览(1天)

Task03:完成以下三个题目并打卡(1天)

  • 011 盛最多水的容器

  • 014 最长公共前缀

  • 015 三数之和

注释:考虑到一天三道题的强度较高,本次学习安排了讨论总结环节,以便学习者回顾、总结和调整。

3 /数据挖掘(异常检测)

开源贡献:梁家晖,李玲,李芝翔,赵可,陈信达

组队学习说明:理解传统的异常检测方法原理,并具备基本的调用相应python库进行操作的能力。

任务路线:异常检测介绍、基于统计学的方法、线性模型、基于相似度的方法等。

组队学习周期:14天

学习名额:上限100人

定位人群:熟悉数据挖掘的基本方法,对学习异常检测算法有需求的学习者。难度系数中

每个任务完成大概所需时间:3-5h

任务预览(3天)

Task02:基于统计学的方法(3天)

  • 掌握基于高斯分布的异常检测方法

  • 理解非参数异常检测方法

  • 掌握HBOS算法

4 /自然语言处理实践(知识图谱)

开源贡献:吴晓均、杨开漠、康兵兵,周郴莲,王翔,超逸,王嘉鹏,陈安东,段秋阳

组队学习说明:理解知识图谱的基本原理,熟悉Neo4j并具备基本的调用相应python库进行操作的能力。

任务路线:知识图谱介绍、基于医疗知识图谱的问答系统操作介绍、Neo4j图数据库导入数据等。

组队学习周期:8天

学习名额:上限100人

定位人群:熟悉自然语言处理基本方法,对学习知识图谱算法有需求的学员。,难度系数中

每个任务完成大概所需时间:3-5h

任务预览(1天)

Task02:基于医疗知识图谱的问答系统操作介绍(1天)

  • 引言

  • 运行环境

  • 搭建知识图谱

  • 启动问答测试

  • 代码目录介绍

参与学习

快速通道

  1. 【数据分析之学术前沿趋势分析】开源地址
    https://github.com/datawhalechina/team-learning-data-mining/tree/master/AcademicTrends

  2. 【编程实践】 开源地址
    https://github.com/datawhalechina/team-learning-program/tree/master/LeetCodeTencent

  3. 【异常检测】 开源地址
    https://github.com/datawhalechina/team-learning-data-mining/tree/master/AnomalyDetection

  4. 【知识图谱】 开源地址
    https://github.com/datawhalechina/team-learning-nlp/tree/master/KnowledgeGraph_Basic

  5. 【Datawhale论坛】本期详细学习安排
    论坛链接:http://datawhale.club/t/topic/1012

学习规则

  1. 需交督促金3块:1块学习,1块分享,1块成长;

  2. 需要有一个可以记录学习的公开帐号;

  3. 根据任务安排学习,完成后写学习笔记blog

  4. 任务截止前在群内打卡,遇到问题一起交流讨论;

  5. 未按时打卡的同学视为自动放弃,流出学习群。

报名方式

1月9日(周六)中午12:00 在Datawhale社群(高校群和在职群)分享报名二维码,组织学习非盈利,精力有限,没有报上名的可以根据开源教程自行安排学习。

最后,未在社群的小伙伴,可在公众号后台回复关键词“在校”或“在职”进群。(已在的不需要重复加入!)直接获得名额:

分享获赞满30个或最用心留言10个



“为开源学习点赞

⬇️ 详细查看【寒假组队学习安排】

你可能感兴趣的:(python,编程语言,人工智能,机器学习,数据挖掘)