python是统计软件吗_如何选择统计软件学习?R Python SAS Stata...

一年前,我因别人的一句话,R很强大,于是学习了R。也用R做过机器学习,并且参加过“共享杯”比赛,还拿了奖,把支持向量机,决策树,随机森林,神经网络,logistic回归都实现了一遍。但是,我觉得这都只是皮毛,这些高大上的东西容易操作,因为它们在操作上不需要太多统计学知识,便可实现。

一年后,我依然觉得自己是小白。又重新思考了该学习哪个软件,因为我是搞临床流行病的,统计软件是绕不开的话题。最近,使用R做负二项回回,总是莫名奇妙的出错,按理来讲不应该的,因为第一次代码运行没有问题,而且之后改了加了数据就出错了,重启后又可以。还有,同样的代码,再加载一个包之前可以运行,但是加载了哪个包之后便出错,不加载那个包又可以运行。这就很令人烦劳了,主要是我还不知道问谁?

不知道问谁,这便是问题的关键。因为这样会花掉大量的时间,走许多的弯路,进很多坑。于是,我重新考虑了,我该如何选择这些统计软件。我现在,虽然很不舍,但是,要放弃使用R做统计分析了,改用SAS,如果涉及到机器学习,就用python,如果要制图,依然会选择R或者python,如果要做meta分析,就用stata和winbugs,如果做空间分析,就用ArcGIS、geoDa、satsan、GWR4等。估计很多人都说,这些都可以由R来完成。哈哈,我也想这么说,R简直就是全才。如果,您对这种观点深信不疑,那么,您可能会为此努力很长时间,因为这非常具有挑战,可能一辈子都完不成,当然,我佩服愚公移山的精神。

如何选择统计软件呢?

首先,这取决于您的资源可获得程度。您身边的老师,他们是能给您最大帮助的人,您有任何问题,他们都会解答。但是,如果您问师兄、学长等,他们就不一定能给出满意的答案。可能他们也在学习,可能他们也希望您自己多自学。自学许多时候都是事倍功半,效率低下,尤其再碰到问题时,会产生很大的无助感。

其次,我想说,统计软件都是工具,不必执着于某一个软件。但是,您得考虑下时代的主流。个人觉得,现在统计软件:在统计方面SAS还是很有权威的,在meta分析方面stata和winbugs地位也很高,在机器学习方面,python有很大的话语权等。就统计这一块而言,如果你的结果是用SAS做的,没人会说软件选的不合适。

说实话,我这篇文章有点贬低R的嫌疑。作为一个要放弃使用R来做统计分析的人来说,这也很正常。但对于R的高手而言,他们选择R,并且达到很高的层次,这点着实令人敬佩。但对于大部分人而言,很难达到那样的高度,比如我。

我为何放弃R来做统计分析?1.身边的老师是SAS高手,不熟悉R。2.网上找R的资源虽多,但没有我想要的,得不到直接的指导,孤军奋战时间漫长。3.R确实会出些我这个水平无法解决的错误,很玄很玄的那种,尤其在统计模型方面,有些内置的迭代,这种错误我可看不懂,作为应用巨人成果的宝宝,这太难了。

但我只是不用R做统计分析,R的其他功能,如可视化,还是很看好的。

同样,对于阅读到这篇文章的您来说,我希望您结合自己能获得的帮助资源来决定要选择哪门统计语言。假如以后我碰到R高手了,我依然会选择R。

能给您帮助的人就在身边,切莫辜负他们,还请珍惜眼前人。

你可能感兴趣的:(python是统计软件吗)