全文共2881字,预计学习时长10分钟
图源:unsplash
告别社交,缺少娱乐?疫情期间宅家觉得太无聊?别再浪费时间啦,不试试怎么知道自己潜力无限呢?
莎士比亚在隔离期间完成了《李尔王》;牛顿在隔离期间为运动定律的发现奠定了基础;现在轮到你隔离在家,只想拍拍抖音搞笑视频吗?就算做不到改变戏剧世界或者在物理界掀起几轮变革,也别小瞧自己。你完全可以巩固自己数据科学的技能,疫情结束后一跃踏上职业之路。
随便在谷歌上搜一下,就会发现课多到一辈子都上不完……这里只推荐一些笔者认为有用的课程,根据你目前编程和统计的水平,这里的课程会很适合。
图源:unsplash
本篇指导会分为两大类,帮你更好地了解。就编程而言,三种语言最为关键:Python、R和shell脚本。对于一名数据科学家,这些都是基础。你也需要对Git 和GitHub了解一二。
如果想成为数据科学家,Python和R熟知一个就差不多,这都看你以后想在哪工作;同时还需了解一点数据库的知识,最先进的方法就是SQL。关于统计,任何讲数据科学的课都能满足。
很多课还会介绍一些最重要的编程语言以及技术环境。但笔者还是建议大家报名专门的语言课程,毕竟编程很关键!但这段时间,很多人可能面临着失业或预算不足的危险,所以这里只列出免费的资源。不管怎么说,方法比投入的资金对你的进步更重要。
话不多说,开始学习吧!
根据你目前掌握的技能,有些课也许不用上,也可能所有都有用。为了让大家一目了然找到最合适的,每种语言只给出1到2门课程。
图源:unsplash
如果你是个小白,建议这些课都看看,再继续参与接下来提到的数据科学课程。
1.Python
learnpython.org 上的资料很适合入门,全部为交互式,无需安装任何东西就可以在浏览器上直接敲代码。也许你会发现几个小时之后自己就能熟练掌握。再练习几天,就能编写基础项目。
安装Python和相关程序包是早晚的事,感觉差不多了就试试Python的官方资源。但之前没有编码经验的不要着手弄,不然超级可怕。
资金充足的话可以听一听DataCamp上有关Python的课。每月支付25美元即可享受多门课程,这些课也会讲浏览器中代码。多数情况下,Python和learnpython.org上的免费资源能够完全满足需求。
图源:searchenginejournal
2.R
哈佛大学的edX课程会告诉你学习R语言的所有东西。课程为期8周,分下来每周只花1到2小时,并不会占用很多时间。
若是想花更多精力学得更深一些,霍普金斯大学的coursera课程也可以。为期4周,第一周需要25小时,之后每周10到12小时。该门课程涵盖安装,也会介绍一些背景知识。
3.Shell脚本
Learn Code The Hard Way这本书就是入门的不错选择。它讲得非常系统,不会涉及复杂的用户界面,这本书好就好在这一点,稍后你会看到不同的命令行(不含图像)。
学习这门课程是有些限制的,但绝对值得。完成需要5到10个小时,这取决于你打算学到什么程度。
图源:unsplash
4.GitHub
如果你之前从未使用过GitHub,那笔者建议你读读Anne Bonner的指导,并按照上面的指示做。
阅读需要18分钟,但我建议至少花几个小时琢磨一下,因为在你按照指导进行操作的过程中是需要反复回看的,把一切都准备好总归是好的。假如你了解一些的话,GitHub指南会帮你查漏补缺。
5.SQL
Python能够轻松应对数据集,SQL则适合规模大的数据。w3schools.com上的教程几乎包括所有的基础知识。上面有许多浏览器内代码的例子,所以非常适合初学者,整个课程学下来会花10到15小时。
如果你更喜欢通过视频来学,可以试一试可汗学院上的课程。其中有更多具有难度的浏览器内代码的例子,你需要花上5到10个小时去学。
习得一些编程技巧之后,下面这些课程可以加深你对统计的了解。一两个课程即可,根据你的投入时间和语言决定选择哪些。
图源:searchenginejournal
6.哈佛大学/edX上的统计学与R
· 时长:8到16小时(为期4周,每周2到4小时),进度因人而异
· 语言:R(懂基础编程是前提)
该门课程时间不长,但涵盖了数据科学的基本常识,重点在数据分析和可视化。打算短时间内掌握就可以选择这门课。
7.哈佛大学工程与应用科学学院/coursera上的CS109课程
· 时长:大约100个小时(为期13周,每周8小时),进度因人而异
· 语言:Python
该门实际课程由哈佛大学工程与应用科学学院教授。虽然不像coursera、edX等一样是线上课程,但内容很有价值。
8.霍普金斯大学:数据科学专业课程
· 时长:大约需要200个小时(为期8个月,每周6小时),进度因人而异
· 语言:R(Python是先决条件)
对于有志成为数据科学家的人来说,这门课程一定得看看。其下又分为10门课程,你可按需搭配组合。要是想获得资格证写到简历里,则10门课程都需要学。
图源:unsplash
9.udacity:介绍数据科学
· 时长:大约100个小时(为期2个月,每周10小时),进度因人而异
· 语言:Python
这门课程很详细,从数据获取、分析到可视化都有所涉及。对于此刻困在家中的人们来说,这样的时长和交互形式再合适不过了。如果你比较忙,2周以内就能看完!
10. 密歇根大学/coursera:应用数据科学
· 时长:大约120个小时(为期4个月。每周8小时),进度因人而异
· 语言:Python
这门课更多强调的是动手操作。其下分为5门课程,你可以按需随意组合。特别是对于那些明确自己未来工作领域方向的人,该课程帮助也许很大。有两大部分很有意思,一个是机器学习一个是社交网络分析。
11.德克萨斯州大学/edX:数据分析的基础
· 时长:18到36小时(为期6周,每周3到6小时),进度因人而异
· 语言:R(基本的编程知识是先决条件)
这门课程的标签就是本科统计课程,同时附加模型课程。但考虑到投入的时间很少,这门课程更多介绍的是统计和模型。
6到11的课程也许只是数据科学的一部分,可以帮助你打基础。coursera上也有两个免费课程主要讲统计的基础内容,想学哪种语言就选对应的课程。
密歇根大学/coursera:含专业Python的统计学
· 时长:大约56个小时(为期2个月,每周7小时),进度因人而异
· 语言:Python
这门课程耗时适中,十分适合在居家隔离的时候学习。分为三个板块,包括理解和可视化数据,推理数据分析以及合适的统计模型。
图源:turtlebayedu
杜克大学/coursera:含专业R的统计学
· 时长:大约140个小时(为期7个月,每周5小时),进度因人而异
· 语言:R
这门课程对比上面含Python的会花较长的时间,因为牵扯更多数学基础知识。其分为5个板块,有推理统计、线性回归、建模和贝叶斯统计。如果你想打下坚实的数学基础玩转R语言,这个很适合。
所有人上网都可观看这些课程,它们能帮你打基础,但很难让你在竞争中脱颖而出。如何成为独一无二的数据科学家?要找到自己的优势。
你之前在哪个领域工作?健康、数学、生物、化学、物理或完全不沾边的领域?你的交际圈里谁可以给你指导?谁知道其他人也从事数据科学?让你的交际圈动起来。多听取意见,向其他转型成数据科学家的人咨询,这样就能学到第一手经验。
弯道超车的机会到啦,把握住这段“难得”的空闲时间,准备好迎接崭新的自己。
留言 点赞 关注
我们一起分享AI学习与发展的干货
欢迎关注全平台AI垂类自媒体 “读芯术”
(添加小编微信:dxsxbb,加入读者圈,一起讨论最新鲜的人工智能科技哦~)