作者:Lemon
来源:Python数据之道
大家好,我是 Lemon。
有不少读者在询问如何入门Python、如何入门Python数据分析,之前跟大家分享了两本零基础入门Python的书籍:《Python编程从入门到实践》 和《笨办法学Python3》。
今天来给大家分享一本Python数据分析入门的书籍,书名是《Python数据分析基础》。
按照书中的介绍:
本书面向的读者主要是那些经常使用电子表格软件进行数据处理,但从未写过一行代码的人。
Lemon 觉得这个范畴还是很清晰的,当然,Lemon 阅读完这本书之后,觉得范围也可以适当的拓宽些,包括经常处理电子表格的、需要定期生成报表的、有一定的数据可视化需求的、以及需要对数据进行统计性描述的,都可以参考下本书的部分内容。
对于这点,Lemon 也是深有感触。前些年,Lemon 还没有开始学 Python ,当时管理许多的项目,用 excel 处理数据感觉有些力不从心,于是开始寻找解决方案,找了一圈,最后用微软的 access 用 sql 语句撸了一个小型的项目管理工具。现在看来,如果当时会 Python,会要方便很多。
书中的代码使用的Python版本是 Python 3.5版,本书作者是在 windows 平台对代码进行测试的, 如果你的电脑上的 Python 版本是 3.5 以及之上的,应该是可以运行的。
由于 Python 是跨平台的,因此,windows、Linux 以及 MacOS 系统应该都没问题。
对用 Python 的安装,书中推荐安装 Anaconda , Lemon 一般也是直接安装 Anaconda,主要是比较省事。
关于 Python 环境的安装,这个还是需要自己去弄,不同的电脑环境,有时候会出现一些小小的问题,这个主要还是需要自己通过搜索来解决。
书中的代码,原书作者已经发布在其 Github 上,大家可以免费去获取,地址如下:
https://github.com/cbrownley/foundations-for-analytics-with-python
书中花了比较大的篇幅来讲解关于数据文件的处理,主要包括 csv文件、excel文件以及 数据库。
对于数据分析入门而言,可能遇到比较多的文件类型还是 excel 和 csv ,所以书中对这两类介绍也是比较多。
书中介绍了用纯 Python、内置模块、第三方库等途径来操作这两类文件,涉及到 内置 csv模块、xlrd、xlwt 等。对于需要读取数据,尤其是需要写入数据,用这些工具还是挺方便的。
如果只是读取数据,然后进行数据清洗等处理,Lemon 一般喜欢用 Pandas 。
此外,对于数据库,书中也介绍了 内置的 sqlite3 模块,以及 以及流行的数据库 MySQL 。
主要涉及四个可视化库,分别是 Matplotlib
、Pandas
、ggplot
和 seaborn
。
除了 ggplot
,其余三个, Lemon 也是经常使用的。
下面分享一个随书的案例:
运行后效果如下:
关于 Matplotlib,前不久 Lemon 整理了一份 100个项目入门 Matplotlib 的内容,有兴趣的同学可以前往查看:
100个案例,Matplotlib从入门到大神
Lemon 觉得还有一个内容估计大家是感兴趣的,那就是使用 Python 来按计划自动运行脚本,由于是在商业环境中,有一些需要定期上报的内容,比如日报、周报、月报、季报、年报等(特别烦!!!)。
前不久,阿里取消周报,都能上热搜,可见这些报表都么重要,又是多么招人厌!
如果你用 Python 来自动运行一些格式高度一致的内容,那自然会省事很多。别人在埋头苦干的时候,估计你就有功夫摸鱼啦。
在本书的封面,给本书的定位是“零基础经验也可学会用最火的Python语言进行数据分析”,如果你对使用Python来进行数据分析有兴趣,本书可以作为初级参考书来使用。
如果你觉得这本书不错,可以去购买一本,仔细阅读下。
今日福利
赠送 6 本书籍,书籍由图灵出版社赞助,书籍列表附后,书籍任选。
参与方式1:
通过在本文留言参与,赠送5本,留言的主题如下:
聊聊你对Python数据分析的理解?或
推荐一本书你读过的,觉得不错的书籍,并用一句话来描述你推荐的原因。
参与方式:在公众号「Python数据之道」的本篇文章底部点击「在看」+「留言」,优质留言才可上墙!留言点赞数量最多的「前5位」读者将获得书籍,截止时间「11月27号20点」,最终获赠者通过留言联系我。
参与方式2:
在下面公号后台回复 “随机” ,通过抽奖的方式,赠送1本。
开奖时间,11月27号20点
PS:禁止恶意刷赞!发现后将进入黑名单,取消上墙资格。
个人微信
可选书籍列表