数据挖掘小组学习记录——20190728-2

这是跟着数据挖掘小组学习的第二周。主要内容是Python数据分析基础。包括:1.Python基础(安装、基本用法、基本数据结构)2.Pandas基础(包括安装环境、Pandas的数据结构)3.实践(包括描述性数据分析、计算中位数等等)。
之前在公众号里抽奖,抽中了一本书《谁说菜鸟不会数据分析(Python篇)》,真正解了燃眉之急。对于只有在若干年前接触过C语言的我,在一周时间之内尽快了解Python,还要付诸实践进行统计分析,这样的要求实在是有点高。幸亏手上有这本书,要不然就远远的被甩在后面了。
2019年7月25日开始学习,当时只在慕课网上面听过几节课,了解了“人生苦短,我用Python”,学到了int、float和str数据类型。看到小组中大家晒着代码,一个个都好高大上的样子。然而在安装了Python之后使用IDE编写代码的过程中,发现自己写代码的环境怎么跟大家的不一样。问了老公原来大家都在用Pycharm,于是怒装Pycharm。然而竟然还存在注册激活的问题,又问了老公之后才发现原来还可以使用community版本——Google员工都用这个,足够自己这个小小白用了。开始看书之后发现书中建议大家使用Anaconda,其中整合了Spyder、Jupyter、R等等,并且做数据的人大多都在用Spyder,因为有专门的显示数据框架的panel,所以果断转向了Spyder。
以下为“实践”板块学习的内容:

——描述性统计分析:直接使用describe()函数就可以出结果:
数据挖掘小组学习记录——20190728-2_第1张图片
describe.jpg

——percentile和quantile之间有什么关系?——可以用下图中的1250与上图中25%数值的1242.5相比,就能明白了。
数据挖掘小组学习记录——20190728-2_第2张图片
quantile.jpg

待完全学完之后再来一份总结。现在的多种数据分析方法才刚刚开始学。

你可能感兴趣的:(数据挖掘小组学习记录——20190728-2)