全文共1968字,预计学习时长5分钟
图源:unsplash
对于数据科学初学者来说,实干才是硬道理。所以我们只需选择其中一种语言,并重点完成一些项目,接着便可品尝胜利的果实。这就是最快的学习方式。<0}
笔者虽然很想直接推荐Python(笔者主要使用Python,不过也的确掌握一些R语言的工作知识),但还是想为初学者公正地评估一下这两种语言的有效性。这主要是因为选择哪种语言取决于你自己的具体情况。
你为什么想学习?
必须考虑的因素是:你想要学习的原因。例如,如果你是一个训练有素的生物学家,想学习一些编程技能以便更好地理解你的数据集,或者你熟悉其他科学编程语言,比如MATLAB,那么你应该考虑在YouTube上看一些R语言的教程,因为它对你来说比Python更简单、更直观。
或者,如果你是精通C/C++和Java等语言的软件工程师,并且准备转攻数据科学,Python将是适合你的一种语言。与大多数其他流行的编程语言一样,Python是一种面向对象编程(OOP)语言,它可能比R语言更直观。
又或者,也许你最近一直在阅读数据科学这一迷人领域的相关文献,并想涉足其中,在这种情况下,这两种语言都是不错的选择。因此,比起学习的理由这一因素,选择哪种语言将更多地取决于其他因素。
你是否有精通该语言的朋友或同事?
如果你正在学习一门新语言,那么获得社区的支持将会是一个巨大的优势。从社区获得帮助是程序员的一项非常重要的技能。
作为一名初学者,学习如何获得帮助有些棘手,很少有网络资源来教会人们如何从社区获得帮助。具备敏锐的直觉,并且知道当代码出错时应该询问些什么是非常重要的。
如果你认识一个精通Python的人,或者你实验室的另一个研究人员一直在研究R语言,那么你最好学习他们擅长的语言,因为这样你就可以在遇到困难时随时向他们求助。
你是只对统计和数据分析感兴趣,还是想学习其他领域,如机器学习和人工智能?
在应用层面上,Python和R语言的一个显著区别在于前者用途更广泛。Python是一种成熟的编程语言,这意味着你只用Python便可以收集、存储、分析和可视化数据,同时还可以创建机器学习工作管道并将其部署至生产或网站中。
另一方面,R语言则是只用于统计和数据分析,它的图表要比Python的更美观且个性化。R语言使用图形语法(Grammar ofGraphics)的方式可视化其ggPlot2库中的数据,这提供了Python所缺乏的大量直观的个性化设置。
或许这样说有些笼统,但如果你想成为一名数据分析师,R语言应该是你的首选。如果你想成为一名数据科学家,Python则是更好的选择。这便是泛化与专业化的两难选择。
图源:unsplash
作为一个在过去十年间兴起的领域,数据科学的进化日新月异。但不变的是越来越多的数据管道每天都在被自动化。
具备数据工程、数据可视化、机器学习工程、云服务集成和模型部署等多种技能的员工,总是比那些只专注于数据科学工作流程这一个方面的员工更受欢迎。该领域的发展已经在很大程度上实现自动化,只有编程技能出色的员工才能不被机器所取而代之。除非你极其擅长该领域,否则仅仅专注于构建优秀的机器学习模型在未来是行不通的。
目前的业内形势是:有太多初学者水平的求职者,能力虽然“较为”出色,而初工作经验则寥寥无几。对于那些略微高级的工作岗位来说,则没有足够多的经验丰富或技术对口的工作者。为了能够在工作中更上一层楼,你将需要去理解并实践工作流的其它阶段,为何不让自己的成功概率最大化?
如果你依旧举棋不定,笔者建议最好是现在就选择Python并开始学习。在你掌握了与之相关的工作知识之后,还可以学习R语言的基础知识。但如果你实在用不惯Python,那么接下来该做什么就无需笔者多费口舌了。
作为初学者,你的首要任务应该是了解数据科学的核心概念,并首先了解如何将这些概念应用于实际场景。对于那些没有编程或计算机科学背景知识的人来说,配置编程环境可能是件难事。然而,比起Python,配置环境并开始学习R语言的体验可能会更加流畅友好。
有太多人只是沉溺于成为一名数据科学家的空想,而真正脚踏实地采取行动的人却远远不够。所以,是时候开始你的数据科学之旅了。
推荐阅读专题
留言点赞发个朋友圈
我们一起分享AI学习与发展的干货
编译组:孙津、杨月
相关链接:
https://towardsdatascience.com/python-vs-r-for-data-science-cf2699dfff4b
如转载,请后台留言,遵守转载规范
推荐文章阅读
ACL2018论文集50篇解读
EMNLP2017论文集28篇论文解读
2018年AI三大顶会中国学术成果全链接
ACL2017论文集:34篇解读干货全在这里
10篇AAAI2017经典论文回顾
长按识别二维码可添加关注
读芯君爱你