我是个只会用Excel的数据分析工作者。有一天,我和朋友约好晚上一起吃饭,离下班还有5分钟,老板突然Q我:
老板:你今天加个班
我:好呀好呀
老板:我有几个Excel,需要你把它们合成一张表
我:好呀好呀
老板:给!你自己看着办吧!
我怀着忐忑的心情打开了一个神秘的压缩包:
912个CSV表格,每个表格共370列,约360行不等
这么多!我试了一下Power Query, 电脑不客气地歇菜了,这要是纯手动复制非得睡公司不可。我瘫在工位上:“我今天怕是得和912张表共度良宵。”
朋友听完来龙去脉却哈哈一笑:“小事一桩,今晚这 饭还真得吃定了,看我的!”
我半信半疑看着朋友打开一个黑色的窗口,刷刷刷敲了几行代码,一份合并好的表格就很快完成了!
屏幕上甚至还跳出了时长:
顺利下班!之前我总觉得Excel能做好多事情,自己学习动力也不是特别强,很多时候都得过且过,并且看到代码有点望而生畏,看起来好像很难的亚子,但没想到这么方便。
我坐不住了:鹏哥,你会的这个代码,怎么这么厉害,比Excel还好用啊?
大鹏神秘一笑:Python可强大了,远不止你看到的这些。
刚才处理表格的效率你看到了,更厉害的是如果有类似的工作任务,我们只需要更改一下工作路径,这份代码便可以直接使用,可谓一劳永逸。
除了合并表格这类需求,批量出图是不是也曾经困扰你?想想你用Excel怎么做数据分析的:
从数据的清洗整理到出图的每一步都要鼠标点击,非常繁琐且容易出错,而使用Python只需几行代码即可轻松出图:
当你面对高重复性的工作时,也只需要略微改动,或者引入循环,再也不用点鼠标点到手抽筋了。
我有点心动:好像是比Excel方便多了,会用Python肯定能大大提高工作效率。
就在我在心里为大鹏的表演喊“666”的同时,又滔滔不绝地讲了起来:你别看我前面只提到了使用Python整整表格出出图,人家可是著名的“胶水语言”。
“胶水语言”是什么?我问道。
朋友解释道:Python可以利用MySQLdb库连接数据库,可以利用pandas和matplotlib进行清洗和分析,可以利用pyecharts进行交互可视化,可以利用numpy和sklearn进行建模,甚至可以利用pyinstaller打包工作流交给同事,共同提效……
而且这些库的丰富程度,可以说是超出你的想象,以python可视化必知基本库matplotlib为例,光是他的官方gallery就有26个大类527个样式,数量上就碾压了市面上大部分同功能软件。
Python可视化类工具会有针对图表样式进行调整的代码,也可以交互,几行代码,省时省力,分分钟关机下班。
比较一下Seaborn的图表库和Excel的图表库,感受差距:
这就有点惊讶到我了:这效率和酷炫程度和Excel根本不是一个层级的。这么游刃有余的本事,不可谓不吸引人啊!会用Python肯定能做更多的事情,让老板刮目相看。小编整理一套Python资料和PDF,有需要Python学习资料可以加学习群:631441315 ,反正闲着也是闲着呢,不如学点东西啦~~
我随手找了一点资料:Python官方在今年2月做了一份报告,从官方的角度说明了python的使用状况和受欢迎程度。
该调查由 Python 软件基金会与 JetBrains 一起发起,有来自 150 多个国家的超过两万名开发人员参与。
从官方喜出望外的报告中,我发现python受到大部分人的欢迎,是用户手中的香饽饽:
在python的用途上,大家使用python最常用的场景是数据分析,并且相比2017年,2018年的涨幅也是相比最高的,相关的机器学习场景涨幅也有7%。
python语言的这种火热程度也是不难理解了。看来,使用Python进行数据分析是时代的趋势。