见链接的pandas学习。
我的学习心得
Python内的数据类型有
布尔型 Boolean (True 、 False)
整型 Integer
浮点型 Float (可用科学计数表示法 ex. 1.0e3 = 1000.0)
字符串 String (字符组成的阵列)
Python是以对象作为设计,所有的数据都是Objcet,具体对象的概念可以参考数据集。
其中要特別注意Object上的method上的使用,
例如string类型的upper函数,可以把文字转成大写,需要使用上的方法为string.upper(),
若是一个一般的內建method或是使用者自行建立的function,需要传入相关的参数
例如len(),則使用上的方法为 len(‘abc’),
所以在学习Python时,需要清楚了解此function是针对某个类型的內建还是一般的内建。
其中要注意的是Python是强类型的(Strongly typed),也就是说在执行 ‘1’ + 2,会出现TypeError,并不会3或是’12’的结果,所以进行不同型別之间的处理可以使用 int(‘1’) + 2 = 3或是 ‘1’ + str(2) = '12’来做处理。
跟大多数语言一样,在给定变数数值时使用 ‘=’ 来赋值,在Python中变量是不用声明的,并还有一个特性,变量在内内存中仅仅像一个标签,对某个内存位置做贴标签的功能,在变量改变内容时,内存的值不会改变,而是变量标签贴到其他内存位置上。因此Python不用声明变量类型,所以可以改变变量的类型,所以可以使用type(变量)作为检测变量现在的类型。
变量的命名只能大小写英文字母、数字和下划线(_),且不能以数字开头,保留关键字如下,不能作为变量名使用。
Python的基本元素:数字,字符串和变量
Python内的数据类型有
布尔型 Boolean (True 、 False)
整型 Integer
浮点型 Float (可用科学计数表示法 ex. 1.0e3 = 1000.0)
字符串 String (字符组成的阵列)
2.1 变量 名称 对象
Python是以对象作为设计,所有的数据都是Objcet,具体对象的概念可以参考数据集。
其中要特別注意Object上的method上的使用,
例如string类型的upper函数,可以把文字转成大写,需要使用上的方法为string.upper(),
若是一个一般的內建method或是使用者自行建立的function,需要传入相关的参数
例如len(),則使用上的方法为 len(‘abc’),
所以在学习Python时,需要清楚了解此function是针对某个类型的內建还是一般的内建。
其中要注意的是Python是强类型的(Strongly typed),也就是说在执行 ‘1’ + 2,会出现TypeError,并不会3或是’12’的结果,所以进行不同型別之间的处理可以使用 int(‘1’) + 2 = 3或是 ‘1’ + str(2) = '12’来做处理。
跟大多数语言一样,在给定变数数值时使用 ‘=’ 来赋值,在Python中变量是不用声明的,并还有一个特性,变量在内内存中仅仅像一个标签,对某个内存位置做贴标签的功能,在变量改变内容时,内存的值不会改变,而是变量标签贴到其他内存位置上。因此Python不用声明变量类型,所以可以改变变量的类型,所以可以使用type(变量)作为检测变量现在的类型。
变量的命名只能大小写英文字母、数字和下划线(_),且不能以数字开头,保留关键字如下,不能作为变量名使用。
基本运算符号如下
符好 解释 用法
其余运算规则与用法详细请看书本介绍(ex. a = a + 1可以写成 a += 1 等等)
数字类型转换可以用int(),里面不允许有非数字出现,浮点数会无条件舍去,其中python允许使用int(98.7) = 98,但int(‘98.7’)则会出现错误,这点要多加小心。
最为重要的一点为Python3之后没有溢位问题,意思是存储整数大小无上限,取决于自身内存的限制。
转换成浮点数可以使用float()。
Python3支持Unicode!!! 表示可以显示中文等等,文件编码方式记得选择Unicode
使用单引号或者双引号皆可以创建字符串,若要在字符串中包含单双引号只要用反斜杠
使用转义字符’ "
连续使用三次即可(单,双引号都可以), 三个单引号’’'还可以用于多行字串的建立,一般常用于多行注释上使用。
在使用print()指令时,会自动将转义字符转换成正确的显示方式(ex. \n转换成换行等等)
并且会在变量之间插入一空白
print(‘a’,‘b’,‘c’) # ‘a’ ‘b’ ‘c’
可以使用str()将其类型转换成字符串类型。
字串连接接可以使用 + 号或是直接把两字串摆在前后即可。( print(‘a’+‘b’) print(‘a’‘b’) 都可以得到 'ab’的结果 )
使用 * 可以快速建立重复字串。
#前面提到字符串为字符的阵列,故可以使用[ ]來提取特定位置之字符
a = 'bcd'
print(a[0]) #'b'
print(a[-1]) #'d'
#index从0开始,-1为最后一个字符
更多的提取方法如下
用法 说明
[ : ] 提取全部
[start : ] 提取 start 至結束
[ : end] 提取开头到 end - 1
[start : end] 提取 start 至 end - 1
[start : end : step] 提取 start 至 end - 1,间隔为step (step为负的时候则从右边开始,start与end需反过来摆放)
两者差异再与,List可以改变其內容,增減长度 or 替换等等皆可以
Tuples一旦赋值之后,就不能再修改。
以性能和内存使用量来说,Tuples皆较佳
List可以使用 [] 或是 list() 來创建空的,或是直接加入值进去,使用逗号区分即可。內容可以重复出现,且具有順序性。
等等基本类型
从教程上面来看主要是python的基础知识。
略过:。。。。。。
后面会单独补充
数据分析:业务理解
数据挖掘:挖掘数据的领域
数据挖掘的岗位很大
大公司数据的应用价值
数据挖掘,挖掘价值
机器学习:分析数据的问题
学习连接