Python数据分析笔记(1)

第一门课:数据思维导论:如何从数据中挖掘价值?

大数据的时代,如何从海量数据中挖掘到价值信息?从个人主体上,需要自己对未知保持敬畏,好奇,严谨的态度。现实的工作经验也佐证了老师所说,当前的主要工作是2G升4G的用户迁转,用户迁转的因素众多,怎样的因素和策略可以迅速转化用户?作为网络工作者首先想到了肯定就是网络质量问题,然后就是老年用户固执不升网;可是等你拿到数据的时候就会发现自己的想法是有出入的。这就是数据的魅力。

数据背后的景象难以窥见,需要理解数据,掌握基本图表,接触各类软件,培养设计感,多看多想多搜,更多时候想到可能的思路需要借助分析工作去用数据佐证。

第二门课:基础语言入门:从零开始学习Python

Python的设计哲学:优雅,明确,简单。“用一种方法,最好是只有一种方法来做一件事”,人生苦短,早用Python,具有编程效率高,可移植性强,大量程序包和容错率高的优点,缺点是运行效率相对低,它是一种解释型语言,每次运行都会需要将解释型语言转换成机器语言。

    变量其实是一个“暂时的存在”,当我们把程序关掉,变量也就不在了,除非我们把变量的内容存储下来,譬如到处excel,csv等。除此之外,变量的命名不能是数据开头,不能是空格开头,尽量不要用系统函数去命名。如果写了类似于:print=1,此时,print系统的方法函数就变成了一个变量,当你调用print函数时,系统就会报错:“int object is not callable”。解决的方法是  del print 或者重启程序。

    数值类型主要是:整数数值,浮点数值,字符型数值,布尔型数值。对我而言需要记忆和理解的就是布尔型数据,以前学习C语言时没有接触过布尔型数值。整数型数值和浮点型数据可以直接运算,但是两者是不能与浮点型数值相互运算的,需要用函数转化。譬如,x=1,y=’0.8’,x/y是会报错,可以试x/float(y)。

对于序列的话,list是可变序列,而str和tuple是不可变序列。序列的索引是从0开始的。

[1,2,3,4,5,6][2::2]=[3,5]

你可能感兴趣的:(Python数据分析笔记(1))