人生苦短、我学python代码_人生苦短,学用python

1. 我为什么开始学着用 python 啦?

扯扯网上疯传的一组图片。网上流传《人工智能实验教材》的图片,为幼儿园的小朋友们量身打造的实验教材,可谓是火了。甚至有网友调侃道:python 将会从幼儿园一直陪你到考大学。活在当下,身为程序一猿,如果你不不知道 python,那就很有可能会成为新时代的“文盲”啦。

看看编程语言趋势方向。在 TIOBE 发布的最新 5 月编程语言佳丽受宠排行榜,python 以高姿态,占据后宫佳丽排行榜第四,受宠爱程度提升远超其它佳丽,后宫佳丽中 python 可谓是5月人生大赢家。

今天无心的尝试,便爱的死心塌地。关注我的朋友们都知道,近期一直忙于一个数据分析的产品需求。其中涉及到清洗大量 CSV 数据,正好近期在关注 python,决定尝试用 python 解决一下。对于一个用 python 连 HelloWorld 都未曾写过的小白而言,用了一下午的时间,完成了环境搭建以及业务数据的清洗工作。不得不说 python 容易上手写程序,而且代码写起来相对简单,对 python 的宠爱感从此而生。

2. 我是怎样学着用 python 解决业务问题的?

CSV 业务数据文件 python 如何读取?首先去网上搜罗了一把,其中熊猫 pandas 明星首先登场,映入眼帘。pandas 是 python 的一个数据分析包,可以进行高效处理数据,进而可以进行数据分析。可以采用 read_csv() 来完成文件的读取。

CSV 数据读取后如何写入 MySQL?庆幸的是熊猫 pandas 模块封装了 to_sql() 函数实现了对数据库的写入。

于是快速构建项目,拿出程序员的绝招:一顿 copy 、粘贴,操作猛如虎。一会儿的功夫,寥寥几行代码,就完成了千万级用户数据的读取并写入到 MySQL,大致统计了一下程序运行耗时: 129.492773 second。

但是去数据库中验证,按照证件号码去重统计,发现重复数据多的让我难以忍受,这数据可真够脏的。于是就去问百度:如何去除重复的数据啊?不得不说熊猫 pandas 功能很暴力、很强大。已经帮我们提供 drop_duplicates 函数支持去除重复数据。

在百度搜索、copy、粘贴猛虎操作下,借用 python 的 pandas 模块,聊聊几行代码完成了一个神奇的数据解析功能。

由此让我这个接触 Java 十几年的程序员,对 python 深感触动。如果你平时做大数据分析或测试的,那么不妨用用 pandas,如果涉及到数据的读取或存储,那么也不妨用用 pandas,势必会非常高效,基本上几行代码就可以搞定你上百行代码的神操作。

3. 写在最后

作为靠技术吃饭的,技术一定要放到第一位,而且任何时候都不能丢掉技术。另外要提升技术广度,要全方位涉猎技术,不是用到了才关注,用不到的技术也要关注,可以不需要特别深入,但是需要了解,因为开卷有益、厚积才能薄发。想想如果前台同事知道用 python 工具化去解决日常工作,效率势必也会大幅度提高。

好了,从今天开始,你也结识了 python 佳丽,再也不会成为新时代的“文盲”啦。后续隔三差五给大家奉上 python 的相关内容,请大家继续关注。

你可能感兴趣的:(人生苦短,我学python代码)