Python基本数据类型一般分为:
非组合数据类型:数字、字符串
组合数据类型:集合 、序列类型(列表、元组)、字典。掌握序列类型,可以应对绝大多数组合数据类型的应用场景。
技巧:
可以使用type(x),去得到变量x的类型。例如:
>>> de = {}; type(de)
“不可更改”类型:指该内存地址所存储的值不能更改。比如,同一个整形变量,赋值前后的内存地址不一样。
“可变”类型:指该内存地址所存储的值可以更改。比如,列表中的元素可以“增删查改”,但是列表的内存地址不变。其中,“可变类型”只有 列表、集合 和 字典。
数字类型是不可更改的对象。对变量改变数字值就是 生成/创建 新的对象。Python支持多种数字类型:整形(标准整形和长整形(Python2.7 及之前的有这种类型))、布尔型、双精度浮点型、十进制浮点型、复数。
1)标准整形:
int,标准整形,在大多数32位机器上标准整形取值范围是-2^31到2^31-1,也就是-2147483648~2147483647,如果在64位机器使用64位编译器,那么这个系统的标准整形将是64位。
2)布尔型
bool,从Python2.3开始Python中添加了布尔类型。布尔类型有两种True和False。对于没有__nozero__方法的对象默认是True。对于值位0的数字、空集(空列表、空元组、空字典等)在Python中的布尔类型中都是False。
3)浮点型
float,每个浮点型占8个字节(64位),完全遵守IEEE754号规范(52M/11E/1S),其中52个位用于表示底,11个位用于表示指数(可表示的范围大约是±10**308.25),剩下的一个位表示符号。这看上去相当完美,然而,实际精度依赖于机器架构和创建Python解释器的编译器。
浮点型值通常都有一个小数点和一个可选的后缀e(大写或小写,表示科学计数法)。在e和指数之间可以正(+)或负(-)表示指数的正负(正数的话可以省略符号)。
4)复数
complex,在复数中虚数不能单独存在,它们总是和一个值为0.0的实数部分一起来构成一个复数。
具体规则如下:
Python实际上有三类字符串。通常意义的字符串(str)和Unicode字符串(unicode)实际上都是抽象类basestring的子类。这个basestring是不能实例化的。
集合最早出现在Python2.3版本中,通过集合模块来创建,并通过ImmutableSet类和Set类进行访问。
集合元素的满足下列3个条件:
集合有两种不同的类型,可变集合(set)和不可变集合(frozenset)。
可变集合,你可以添加和删除元素。对不可变集合则不允许这样做。请注意,可变集合不是可哈希的,因此既不能用作字典的键,也不能做其他集合中的元素。
不可变集合则正好相反,即,它们有哈希值,能被用作字典的键或是作为集合中的一个成员。集合对象是一组无序排列的可哈希的值。
集合支持用Int或not in操作符检查成员,由len()内建函数得到集合的基数(大小),用for循环迭代集合的成员。但是,因为集合本身是无序的,你不可以位集合创建索引或执行切片(slice)操作,也没有键可用来获取集合中元素的值。
表示:
- 集合用大括号{}表示,元素间用逗号分隔。
- 建立集合类型用{}或set()。
- 建立空集合类型,必须使用set()函数。
示例:
A={ "python", 123, ("python",123) }
B=set( "pypy123" ) → { '1', 'p', '2', '3', 'y' }
应用场景:
场景1:包含关系的比较,比如我们有一组数据,判断其它数据或者某一组数据是否在这个数据中。
场景2:数据去重,即利用集合元素的唯一性,去除重复元素。
集合类型及操作的总结:
是python中非常重要的一个数据结构。掌握好序列类型基本就可以处理绝大多数组合数据类型的应用场景。
定义:
序列是具有先后关系的一组元素。
- 序列是一维元素向量,每个元素可以是任何一种数据类型。即元素的类型可以不同。但是元素之间可以相同。
- 序列是一个基类类型,由此派生出:字符串类型""、元组类型()、列表类型[]。
- 元素间由序号引导,通过下标访问序列的特定元素。存在正向递增和反向递减序号的索引关系。正向,第一个元素序号为0;反向,最后一个元素序号为-1。
6个通用操作符:
示例:
>>> ls = ["python",123,".io"]
>>> ls[::-1]
['.io',123,'python']
>>> s = "python123.io"
>>> s[::-1]
'oi.321nohtyp'
5个函数和方法:
示例:
>>> ls = ["python",123,".io"]
>>> len(ls)
3
>>> s = "python123.io"
>>> max(s)
'y'
- 列表用方括号[ ]或list()创建。元素之间使用逗号,分隔。
- 列表(list)像字符串类型一样,但是字符串只能由字符组成,而且是不可变的(不能单独改变它的某个值),而列表被创建后可以随意被修改,且元素类型可以不同,无长度限制。
列表不仅可以包含Python的标准类型,而且可以用用户定义的对象作为自己的元素。列表可以包含不同类型的对象,而且要比C或者Python自己的数组类型(包含在array扩展包中)都要灵活,因为数组类型所有的元素只能是一种类型。列表可以执行pop、sort、reverse等操作。列表也可以添加或者减少元素,还可以跟其他的列表结合或者把一个列表分成几个。可以对单独一个元素或者多个元素执行insert、update或remove操作。
列表类型操作函数和方法:
示例:
- 元组用圆括号()或者tuple()创建,元素间用逗号','分隔。
- 可以使用或不使用小括号
#示例1:
def func():
return 1,2
示例2:
>>> creature = "cat","dog","tiger","human"
>>> creature
('cat','dog','tiger','human')
>>> color = (0x001100, "blue", creature)
>>> color
(4352, 'blue',('cat','dog','tiger','human'))
其在很多操作上都跟列表一样,许多用在列表上的例子在元组上照样能跑。它们的主要不同在于:元组是不可变的,或者说是只读的,所以那些用于更新列表的操作,比如用切片操作来更新一部分元素的操作,就不能用于元组类型。
- 元祖用于元素不改变的应用场景,更多用于固定搭配场景。
或,如果不希望数据被程序所改变,转换成元祖类型。
- 列表更加灵活,它是最常用的序列类型
- 最主要作用:表示一组有序数据,进而操作它们。
字典是Python语言中唯一的映射类型。映射类型对象里哈希值(键,key)和指向的对象(值,value)是一对多的关系。
>>> d = {"中国":"北京", "美国":"华盛顿", "法国":"巴黎"}
>>> d
{"中国":"北京", "美国":"华盛顿", "法国":"巴黎"}
>>> d["中国"]
'北京'
字典类型和序列类型容器类(列表、元组)的区别:
存储和访问数据的方式不同。序列类型只用数字类型的键(从序列的开始起按数值顺序索引)。映射类型可以用其他对象类型做键,一般最常见的是用字符串做键。和序列类型的键不同,映射类型的键直接或间接地和存储的数据值相关联。但因为在映射类型中,我们不再用“序列化排序”的键,所以映射类型中的数据是无序排列的;映射类型不要求用数字值做索引以从一个容器中获取对应的数据项。你可以用键直接“映射”到值,这就是为什么叫映射类型(“mappingtype”)的原因。
字典类型与集合类型的区别:
它们都是用花括号{}表示。但是,1)集合类型每个元素是一个值,而字典类型的元素是键值对。2)生成空的集合类型不能使用空花括号的方式,即{}。而应该使用set函数来完成。因为,它是默认来生成字典类型的;字典类型在计算机编程中非常常用。
一些常用的操作函数和方法:
字典是Python中最强大的数据类型之一。字典最常见的操作有:字典创建、字典赋值、字典中值的访问、字典更新、字典元素删除等操作。