Sir静堂

Python_4_内置结构-元组-字符串-bytes-bytearray-切片

文章目录

1. 元组概念

1.1. 元组的特点
1.2. 元组的定义
1.3. 元组的访问
1.4. 元组的查询

2. 命名元组
3. 字符串

3.1. 字符串的基本操作

3.1.1. 字符串的访问
3.1.2. 字符串的拼接

3.2. 字符串分割
3.3. 字符串大小写
3.4. 字符串排版
3.5. 字符串修改
3.6. 字符串查找
3.7. 字符串判断
3.8. 字符串格式化

3.8.1. C 语言格式化
3.8.2. format 格式化
3.8.3. 对齐
3.8.4. 浮点数与进制

4. bytes、bytearray

4.1. ASCII
4.2. bytes 定义
4.3. bytes 操作
4.4. bytearray 定义
4.5. bytearray 操作
4.6. 字节序
4.7. int 和 bytes

5. 切片

5.1. 切片赋值

1. 元组概念

元组（类型为 tuple）和列表十分相似，但是元组和字符串一样是不可变的。

1.1. 元组的特点

元组可以存储一系列的值，使用 小括号 来定义，是一个 有序 的元素的集合。
元组内的元素是 不可变 的
当元组内嵌套列表这种引用类型时，元组的不可变表示的是嵌套的列表其内存地址不会变，当直接操作元组内嵌套的列表时，是可以进行修改的

1.2. 元组的定义

格式：

tuple()   # 工厂函数，用于创建并返回一个空元组
tuple(iterable)   # 使用可迭代对象的元素，来初始化一个元组

例子：

In : t=(1)    # 会认为 () 只是优先级

In : type(t) 
Out: int

In : t=(1,)

In : type(t)
Out: tuple     # tuple 表示元组类型
 
# 引用其他元组
In : a=(1,2,3)

In : t=('123',a)

In : t
Out:('123',(1, 2, 3))
 
# 通过索引只引用某一个值
In : t=('123', a[1])

In : t
Out:('123', 2)

# tuple 接受一个可迭代对象转换为元组
In : tuple(range(1,7,2))
Out:(1, 3, 5)

1.3. 元组的访问

元组和列表在内存中的格式是相同的，都是线性顺序结构，所以我们可以像列表一样，使用 索引访问 元组的元素，其中元组支持 正索引 和 负索引，同样不支持索引超界，会提示 IndexError。

In : b =(1,2,3)

In : b[1]       
Out: 2

In : b[-1]
Out: 3

当元组内嵌套的是列表这种引用类型时，你可以对列表内的数据进行修改，因为列表是可变的。

In : lst = (1, 2, [1, 2])
In : a = lst * 3

In : a
Out:(1, 2, [1, 2], 1, 2, [1, 2], 1, 2, [1, 2])

In : a[2][0] = 100 # 可以对嵌套的列表进行赋值操作 

In : a
Out:(1, 2, [100, 2], 1, 2, [100, 2], 1, 2, [100, 2])

In : a[3] = 100      # 修改指向的地址是不被允许的     
---------------------------------------------------------------------------
TypeError  Traceback(most recent call last)
<ipython-input-47-2b62bbdeb061> in <module>
----> 1 a[3] = 100

TypeError: 'tuple' object does not support item assignment

1.4. 元组的查询

我们通过使用元组的 index 方法和 count 来获取和统计元组中的元素。

# 返回元组内匹配 value 的第一个元素的 index
T.index(value, [start, [stop]]) --> integer   

# 统计 value 在元组中出现的次数，不存在时，则返回 0
T.count(value) --> integer

注意：t.index 和 t.count 因为要遍历列表所有元素，时间复杂度都是 O(n), 随着列表的元素增加，而效率下降


In : a=('1','2','3')

In : a.count("4")     # 不存在，返回 0
Out: 0

In : a.count("1")
Out: 1
 
# a.index(value) 用来返回 value 在元组中的索引，如果 value 不在元组中，则会报错。
# 如果有多个，默认返回第一个（可以指定从哪个索引开始查找到某个索引结束，指定范围区间）
In : a=('1','2','3')

In : a.index('1')
Out: 0

In : a.index('3')
Out: 2

In : a=('1','2','3')    

In : a.index('4')     # 不存在，就会报错     
---------------------------------------------------------------------------
ValueError Traceback(most recent call last)
<ipython-input-58-dca64b8e9162> in <module>
----> 1 a.index('4')

ValueError: tuple.index(x): x not in tuple

>>> t1
('a', 'b', 'a', 'b', 'a', 'b', 'a', 'b')
>>> t1.index('a',5,7)    # 在指定的区间内查找
6

2. 命名元组

命名元组是元组的子类，所以它也是无法进行修改的，它的特点是可以针元组的对字段进行命名。
Tuple 有一个兄弟，叫 namedtuple。虽然都是 tuple，功能更为强大。对于 namedtuple，你不必再通过索引值进行访问，你可以把它看做一个字典通过名字进行访问，只不过其中的值是不能改变的。

# 格式：
collections.namedtuple(typename, field_names, *, verbose=False, rename=False, module=None)   
# 返回一个新的元组子类，名为 typename 。
# 这个新的子类用于创建类元组的对象，可以通过域名来获取属性值，同样也可以通过索引和迭代获取值。

常用参数含义

typename: 一般和命名元组的名称相同。
field_names: 可以是空白字符或逗号分隔的字段的字符串，可以是字段的列表

namedtuple 存放在 collections 包中，所以需要先进行导入

>>> from collections import namedtuple    
>>> Point = namedtuple('Point', ['x', 'y'])  # 创建一个名为 Point 的命名元组类，其中含有两个字段
>>> p = Point(11, 22)     # 创建一个实例，11 会传递给 x，22 会传递给 y。
>>> p[0] + p[1]    # 可以通过索引访问
33
>>> p.x + p.y      # 也可以通过字段名访问
33
>>> p.x = 33       # 无法修改，将报错 
---------------------------------------------------------------------------
AttributeError    Traceback(most recent call last)
<ipython-input-63-dac7085722b7> in <module>
----> 1 p.x = 33

AttributeError: can't set attribute

Namedtuple 比普通 tuple 具有更好的可读性，可以使代码更易于维护。同时与字典相比，又更加的轻量和高效。但是有一点需要注意，就是 namedtuple 中的属性都是不可变的。任何尝试改变其属性值的操作都是非法的。

In : from collections import namedtuple

In : Animal = namedtuple('animal', 'name age type')   
# 创建一个名为 Animal 的命名元组类，其中含有 name、age、type 三个字段

In : Tom = Animal(name='Tom', age=33, type='cat')   
# 创建一个实例并根据字段的关键字赋值。

In : Tom
Out: animal(name='Tom', age=33, type='cat')

In : print(Tom)
animal(name='Tom', age=33, type='cat')

In : type(Tom)
Out: __main__.animal

In : Tom.type       # 可以通过字段名访问
Out: 'cat'

In : Tom.age = 3    # 和 tuple 一样，无法修改值，将报错 
---------------------------------------------------------------------------
AttributeError     Traceback (most recent call last)
<ipython-input-9-63d4b4478930> in <module>
----> 1 Tom.age = 3

AttributeError: can't set attribute

3. 字符串

字符串是 Python 中比较重要的数据类型，是以单引号 ' 或双引号 " 括起来的任意文本，比如 ‘abc’，“xyz” 等等。请注意，'' 或 "" 本身只是一种表示方式，不是字符串的一部分，因此，字符串 ‘abc’ 只有 a，b，c 这 3 个字符。如果 ’ 本身也是一个字符，那就可以用双引号 "" 括起来，比如 “I’m OK” 包含的字符是 I，'，m，空格，O，K 这 6 个字符。有三种方法定义字符串：单引号，双引号，三引号，需要注意的是字符串是不可变对象，并且从 Python3 起，字符串就是Unicode 类型。
定义方式：

str1='this is string'
str2="this is string"

# 也可以是三个双引号，三个引号可以多行注释但是不能单双混合，
# 三重引号除了能定义字符串以外，还可以表示注释。
str3='''this is string'''   

# 在 print 打印字符串的时候 \n 会被当作换行符进行打印
str4='hello\n world'    

# 前面使用了 r 对字符串进行整体转义，所见即所得
str5=r'hello\n world'   

# 当然使用 \ 也可以对特殊符号进行脱义
str6='hellow\\nworld'   

# R 和 r 相同
str7=R'hello\nworld'

3.1. 字符串的基本操作

Python 的字符串是一个有序序列，所以他可以和列表一样使用下标来访问元素，但是由于它是不可变类型，所以无法对字符串中的某个字符进行修改，下面介绍下字符串的基本操作。

单个字符并没有特殊的类型，Python 中没有字符的概念，严格来讲，说字符是不准确的，字符串是由一个个长度为一的字符串组成的，虽然听起来很别扭，但真的就是这样!

3.1.1. 字符串的访问

字符串和列表相似，都是顺序的线性结构，所以它可以被索引，也可以被遍历。字符串的索引类似数组的下标：

In : a = '1234567'

In : a[0] # 下标从 0 开始，0 表示第一个数
Out: '1'

In : a[3] # 表示第四个数
Out: '4'

In : a[1] = 100   # 字符串无法修改  
---------------------------------------------------------------------------
TypeError  Traceback(most recent call last)
<ipython-input-3-8554a2b011c3> in <module>
----> 1 a[1] = 100

TypeError: 'str' object does not support item assignment

In : for i in a:       # 可以被 for 循环进行迭代
   ...:     print(i) 
   ...:     
1
2
3
4
5
6
7

In : list(a)    # 可以被当作一个可迭代对象传给 list，转换为一个列表
Out: ['1', '2', '3', '4', '5', '6', '7']

3.1.2. 字符串的拼接

当我们需要把多个字符串连接在一起，那么就需要对字符串进行拼接，python 提供了 join 方法，+ 号，以及 * 号，使我们方便的完成需求。

# 使用 join 对可迭代对象进行拼接，返回拼接后的字符串。
str.join(iterable) --> str

join：str 可以为任意字符，包括空。可迭代对象中的元素必须是字符串类型
+：把两个字符串直接进行连接，返回一个新的字符串
*：把字符串重复复制 N 次，返回一个新的字符串

In : str1 
Out: ['h', 'e', 'l', 'l', 'o']

In : ''.join(str1)
Out: 'hello'

In : str2 = ''.join(str1)  

In : str2 
Out: 'hello'

In : '-'.join(str1)      # 使用 - 进行拼接   
Out: 'h-e-l-l-o'

In : str2 * 2     
Out: 'hellohello'

In : str2 + str2  
Out: 'hellohello'

In : lst = [['1','2'], '1', '3']

In : ''.join(lst)  # lst 的第 0 个元素是列表，不是字符串，无法拼接，会报错
---------------------------------------------------------------------------
TypeError  Traceback(most recent call last)
<ipython-input-19-58ac5d2512ec> in <module>
----> 1 ''.join(lst)

TypeError: sequence item 0: expected str instance, list found

3.2. 字符串分割

字符串中有关于字符分割功能的主要有两类，split 系和 partition 系，他们分别适用于不用的场景。但用的比较多的是 split。

split 系：将字符串按照分割符分隔成若干字符串，并返回列表
partition 系：将字符串按照分割符分割成 2 段，返回这 2 段和分隔符组成的三元组

# 从左至右对字符串 str 进行切割，分割符为 sep，默认为尽可能多的空字符，
# maxsplit 表示分割几次，默认为 -1，全部进行分割，返回一个切割后的列表。
str.split(sep=None, maxsplit=-1) --> list of strings   

# 从左至右对字符串 str 进行切割，必须指定一个分割符 sep，返回一个三元组，
# 其中中间的元素为分割符，第一个和最后一个元素为按照分隔符分开后的前后两个元素。
# 当分隔符无法对字符串进行分割时，返回的是（字符串，空，空）组成的三元组。
str.partition(sep) --> (head, sep, tail)   

# 例子：
In : s = "hello world I am Colin"

In : s.split()         # 默认使用空格进行分割      
Out: ['hello', 'world', 'I', 'am', 'Colin']

In : s.split('o')      # 使用字母 o 进行分割
Out: ['hell', ' w', 'rld I am C', 'lin']   

In : s.split('o',1)    # 使用字母 o 进行分割，并且只分割 1 次    
Out: ['hell', ' world I am Colin']

In : s.split(sep='o',maxsplit=1)    # 也可以用关键字进行传参
Out: ['hell', ' world I am Colin']

In : s.partition(' ')  # 使用 ' ' 进行分割，返回三元组
Out:('hello', ' ', 'world I am Colin')

In : s.partition('o')  # 用字母 o 进行分割，返回一个三元组
Out:('hell', 'o', ' world I am Colin')

# --------------------------------------------------------------
In : s = "helloworldIamColin"   # 当分割符不存在时

# 一定会返回一个列表，如果没有被切分，那么会返回只有一个元素的列表
In : s.split()     
Out: ['helloworldIamColin']

# 一定会返回一个三元组，如果没有被切分，那么会从字符串的最右边切开，
# 形成一个三元组，和一个空字符组成的列表
In : s.partition(' ') 
Out:('helloworldIamColin', '', '')

In : s.partition('12')
Out:('helloworldIamColin', '', '')

当然 split 类还包含了其他两个方法：

# 功能与 split 相同，只不过从右往左切分
str.rsplit(sep=None, maxsplit=-1) --> list of strings   

# 按照行来切分，keepends 表示是否保留换行符，True 表示保留，False 表示不保留，默认为 False
str.splitlines([keepends]) --> list of strings    

# 例子：
In : s = 'I am struper Man' 

# 不指定分割次数，一般和 split 是一样的效果
In : s.rsplit('a')     
Out: ['I ', 'm struper M', 'n']

 #  当指分割 1 次时，会从右边开始切分
In : s.rsplit(sep='a',maxsplit=1)           
Out: ['I am struper M', 'n']

In : s = 'hello\nworld\rI\nam\r\nColin'     

In : print(s)
hello
Iorld
am
Colin

In : s.splitlines() # 默认不保留分隔符
Out: ['hello', 'world', 'I', 'am', 'Colin']

In : s.splitlines(True)     # True 表示保留分隔符
Out: ['hello\n', 'world\r', 'I\n', 'am\r\n', 'Colin']

partition 和 split 相似，也有个rpartition函数，也是从右开始截取，需要注意的是，当分隔符无法对字符切分时，返回的是（空，空，字符串）组成的三元组。

3.3. 字符串大小写

upper：将字符串转换为大写字母
lower：将字符串转换为小写字母
swapcase：大小写相互掉换
capitalize：转换成首字母大写的单词格式
title：转换成每个单词首字母大写的标题模式

In : s = 'hElLo wORld i aM Colin'

In : s.upper()    
Out: 'HELLO WORLD I AM Colin'

In : s.lower()    
Out: 'hello world i am Colin'

In : s.swapcase() 
Out: 'HeLlO WorLD I Am Colin'

In : s.capitalize()       
Out: 'Hello world i am colin'

In : s.title()    
Out: 'Hello World I Am Colin'

3.4. 字符串排版

center(width [,fillchar])：居中显示，参数 width 表示整体宽度，fillchar 表示填充字符，默认填充字符为空格
ljust(width [, fillchar])：左对齐，width 表示整体宽度，fillchar 表示填充字符，默认填充字符为空格
rjust(width [, fillchar])：右对齐，width 表示整体宽度，fillchar 表示填充字符，默认填充字符为空格
zfill(width)：居右显示，参数 width 表示整体宽度，左边用 0 进行填充

In : a   
Out: 'abc'

In : a.ljust(20,'-')      
Out: 'abc-----------------'

In : a.rjust(20,'-')      
Out: '-----------------abc'

In : a.center(30,'-')     
Out: '-------------abc--------------' 

In : a.zfill(20)
Out: '00000000000000000abc'

3.5. 字符串修改

前面说字符串是不可变的，为什么这里又说字符串的修改？请继续往下看

# 对字符串 str 进行查找，将指定的 old 字符串转换为 new 字符串，
# count 表示替换的次数，默认表示重复替换所有
str.replace(old, new [, count]) --> str   

# 从字符串 str 两端去除指定的字符集 chars 中的所有字符，
# chars 默认是所有空白字符(\n,\r\n,\r,\t 等等都包含)
str.strip([chars]) --> str

str.lstrip([chars]) --> str    # 从左开始

str.rstrip([chars]) --> str    # 从右开始

注意：replace 的替换是生成一个新的字符串, 而不是就地修改原字符串，这也是字符串修改的原理

In : s = ' \n\t Hello World \n\r' 

# ' 不指定 chars，默认是任意多个空白字符
In : s.strip()     
Out: 'Hello World'

# 如果指定了 chars，那么就挨个使用 char 进行匹配去除
In : s.strip(' \n\tHd')   
Out: 'ello World \n\r'

In : s.strip(' \n\rHd')    
Out: '\t Hello Worl'

In : s.replace('World', 'Colin')
Out: ' \n\t Hello Colin \n\r' 

# 默认从头到尾进行替换
In : s.replace('o', 'O') 
Out: ' \n\t HellO WOrld \n\r'

# 指定替换 1 次      
In : s.replace('o', 'O', 1) 
Out: ' \n\t HellO World \n\r'

3.6. 字符串查找

我们有很多的时候要判断关键字是否存在一个字符串中，那么我们就需要在字符串中 遍历 查找，是否有匹配的字符串。python 提供了 find、rfind、index、count 等函数用于完成需求。

# 在指定的区间[start, end)，从左至右，查找子串 sub 。
#  找到返回索引，没找到返回 -1
str.find(sub [, start [, end]]) --> int 

# 在指定的区间[start, end)，从右至左，查找子串 sub 。
# 找到返回索引，没找到返回 -1
str.rfind(sub [, start [, end]]) --> int  

# 在指定的区间[start, end)，从左至右，查找子串 sub 。
# 找到返回索引，没找到抛出异常 ValueError
str.index(sub [, start [, end]]) --> int  

# 在指定的区间[start, end)，从右至左，查找子串 sub 。
# 找到返回索引，没找到抛出异常 ValueError
str.rindex(sub[, start[, end]]) --> int  

# 在指定的区间[start, end)，从左至右，统计子串 sub 出现的次数，
# 默认为整个字符串。没有找到返回 0
str.count(sub [, start [, end]]) --> int

find 、index 和 count 方法由于是遍历查找，所以时间复杂度都是 O(n), 会随着字符串序列的数据规模的增大，而效率下降。


In : s = 'abc abc abc'    

In : s.find('a')  
Out: 0

# 指定区间，注意这里 -1 表示最后 1 位，但是不包含 -1，类似于 [1,-1)
In : s.find('a',1,-1)   
Out: 4

# end 超出范围，没找到返回 -1
In : s.find('a',-1,-15)   
Out: -1

In : s.rfind('a') 
Out: 8

In : s.rfind('a', 2, -1)    
Out: 8  
  
In : s.rfind('c', 2, -1)    
Out: 6  

# end 超出范围，没找到返回 -1，start，end 表示起始和终止，
# 最好不要使用负数表示区间
In : s.rfind('c', 2, -100)    
Out: -1  

In : s.index('a') 
Out: 0

# 从索引 2 至最右边，从右往左查找  
In : s.rindex('a', 2)     
Out: 4

# 没找到，直接报异常
In : s.index('e') 
---------------------------------------------------------------------------
ValueError Traceback(most recent call last)
<ipython-input-25-90b1c28da6f0> in <module>
----> 1 s.index('e')

ValueError: substring not found

In : s.count('a')
Out: 3

3.7. 字符串判断

Python 的字符串对象提供了两个函数，用于对字符串的起始位和结尾位来进行匹配，它们是 startswith 和 endswith。

# 在指定的区间[start, end)，字符串是否是 prefix 开头，
# 默认为 0，即整个字符串 str, 返回 bool 类型。
str.startswith(prefix [, start [, end]]) --> bool       

# 在指定的区间[start, end)，字符串是否是 suffix 结尾，
# 默认为 0，即整个字符串 str, 返回 bool 类型。
str.endswith(suffix [, start [, end]]) --> bool

例子：

In : s    
Out: 'abc abc abc'

# 从 s 的 [1,-1) 开始判断 'bc' 是否是开头
In : s.startswith('bc',1,-1)    
Out: True

# 从 s 的 [2,-1) 开始匹配 'bc' 是否是结尾
# 这里 -1 不包含，所以返回 False
In : s.endswith('bc',2,-1)     
Out: False     

In : s.endswith('bc',3,7) 
Out: True

In : s.startswith('abc')  
Out: True

In : s.endswith('bc')     
Out: True

除了判断开始和结尾，Python 的字符串还提供了部分函数，用来判断字符串内的元素类型，比如判断字符串是否是纯数字组成？是否是纯字母组成等，这些函数的返回值统一都为bool型，可以作为if 语句的条件表达式。

str.isalpha()      # 是否是字母
str.isalnum()      # 是否是字母和数字组成
str.isdigit()      # 是否全是十进制数字，int
str.isdecimal()    # 判断是否是数字类型，包含 float，但不包含负数
str.islower()      # 判断字符串是否全是小写字母
str.isupper()      # 判断字符串是否全是大写字母
str.isspace()      # 是否是空白字符
str.isnumberic()   # 判断是否是正整数
str.isidentifier() # 是否是一个合规的变量标识符

3.8. 字符串格式化

字符串格式化是我们需要重点掌握的东西，在早期的 Python 中使用的是 C 语言风格的字符串替换，使用起来比较难看，不符合 python 的风格（纯属笔者猜测）。后来 Python 推荐使用内置的 format 函数来对字符串进行格式化。
字符串格式化是一种拼接字符串输出样式的手段，更灵活方便，之前我们使用 join 和 + 来对字符串进行拼接。

join：只能使用分隔符，且要求被拼接的是可迭代对象且元素必须是字符串类型
+：使用起来比较方便，但是非字符串需要先转换为字符串类型才可以进行拼接。

3.8.1. C 语言格式化

在 Python 2.5 版本以前，只能使用 printf-style formatting 风格的 print 输出，这种风格来自于 C 语言的 printf 函数，它有如下格式要求。(建议使用 format)

占位符：使用 % 和格式字符串组成，例如 %s，%d 等。s 调用 str() ，r 会调用 repr()。所有对象都可以被这两个转换
占位符中还可以插入修饰字符，例如 %03d 表示打印 3 个位置，不够的话，前面补 0
format % value 格式字符串和被格式字符串之间使用 % 分割
values 只能是一个对象，或是一个与格式字符串占位符数量相等的元组，或一个字典

In : 'I am %03d' % 20  # 表示 3 为数字，不够的话高位补 0
Out: 'I am 020'

In : 'I like %s' % 'Python'      # 字符串格式化
Out: 'I like Python'

In : 'I am %s' % 20      # 20 会被 str 作用后，传递给字符串 
Out: 'I am 20'

# 3.2f 表示最长 3 为，小数点后精度为 2 位，当数字大时整体长度会被撑开，
# x 表示 16 进制，02X 表示两位显示，高位补 0
In : '%3.2f%%,0x%x,0X%02X' % (89.7654, 10, 15)     
Out: '89.77%,0xa,0X0F'

In : "I am %-5d" % 20     
Out: 'I am 20   '

In : "I am %5d" % 20      
Out: 'I am    20'

3.8.2. format 格式化

Python 中推崇使用 format() 函数来对字符串进行格式化。

# 函数的一般格式，{} 表示占位符，使用 format 中的参数进行传递
'{}{XXX}'.format(*args, **kwargs)  --> str

format 非常灵活，下面是基本使用方法说明：

args 是可变位置参数，是一个元组
kwargs 是可变关键字参数，是一个字典
花括号 表示 占位符
{} 表示按照顺序匹配 位置参数，{n} 表示取位置参数中 索引为 n 的值
{xxx} 表示在关键字参数中搜索名称一致的值，kwargs 必须放在 可变位置参数的后面
{{}} 表示打印花括号

# 按照位置格式化，第一个元素给第一个括号，第二个元素给第二个括号      
In : '{}:{}'.format('10.0.0.13','8888')       
Out: '10.0.0.13:8888'    # 

# 命名格式化，host 表示只获取关键字为 host 的值来填充，
# 其他没有指定关键字的占位符，则按照位置参数进行传递，并格式化显示     
In : '{host}:{}:{}'.format('10.0.0.13','8888',host='Colin')   
Out: 'Colin:10.0.0.13:8888'

# 访问元素的方式进行字符串格式化(不常用)
In : '{0[0]}:{0[1]}'.format(['10.0.0.13','8888'])   
Out: '10.0.0.13:8888'

# 由于 p 对象含有 x 和 y 属性，所以可以在字符串格式化时直接引用
In : from collections import namedtuple     
In : Point = namedtuple('_Point',['x','y']) 
In : p = Point(4,5)       
In : print('{' + '{0.x},{0.y}'.format(p) + '}')   
Out: '{4,5}'

3.8.3. 对齐

字符串还提供了多种的对齐方式，便于我们对输出内容做一个简单的优化。

<：左对齐（默认）
>：右对齐
^: 居中对齐

对齐方式需要在占位符内使用 ：号 进行分割

#   打印字符串，这个字符串占 5 位，默认靠左对齐，其他位使用空格填充
In : '{:5}'.format('c')     
Out: 'c    '

# > 表示右对齐
In : '{:>5}'.format('c')       
Out: '    c'

# 字符串站 5 位，左对齐，其他位使用 0 填充(可以简写为 '{:<05}')
In : '{:0<5}'.format('c')     
Out: 'c0000'

In : '{:0>5}'.format('c')
Out: '0000c'

# > 表示右对齐，其他位用 * 填充
In : '{:*>5}'.format('c')     
Out: '****c'

# 居中对齐，其它位使用 0 进行填充 
In : '{:0^5}'.format('c')     
Out: '00c00'

# 居中对齐，其它位使用 * 进行填充
In : '{:*^5}'.format('c')
Out: '**c**'

当填充符为数字的时候，可以与宽度写在一起，比如 '{:0<5}'.format('3') 可以写成 '{:<05}'.format('3')，而 '{:0^5}'.format('3') 可以写成 '{:^05}'.format('3')

3.8.4. 浮点数与进制

虽然用的不多，还是这里还是举例说明一下进制和浮点数的使用方法（注意宽度可以被撑破）

d: 表示十进制
x: 表示十六进制
o: 表示八进制
b: 表示二进制
F: 表示浮点型
#: 表示添加进制前缀
*[1,2,3]: 表示把列表中的元素解构出来：*[1,2,3] --> 1,2,3

# 输出时转换进制
In : "int: {0:d}; hex: {0:x}; oct: {0:o}; bin: {0:b}".format(42)
Out: 'int: 42; hex: 2a; oct: 52; bin: 101010'

# 加上进制前缀
In : "int: {0:d}; hex: {0:#x}; oct: {0:#o}; bin: {0:#b}".format(42)
Out: 'int: 42; hex: 0x2a; oct: 0o52; bin: 0b101010'

In : octets = [10,0,0,13]      

In : '{:02X}{:02X}{:02X}{:02X}'.format(*octets) 
Out: '0A00000D'

In : '{:02X}-{:02X}-{:02X}-{:02X}'.format(*octets)      
Out: '0A-00-00-0D'  
 
# ----------------------------------------------------------
In : "{}".format(3**0.4)# 默认按照字符串打印 
Out: '1.5518455739153598' 
 
# f 表示填充位为小数，小数是有精度的
In : "{:f}".format(1.5518455739153598)     
Out: '1.551846' 
 
# 表示小数的长度为 2，但是如果小数的位数超过 2，会直接撑开   
In : "{:02f}".format(1.5518455739153598)    
Out: '1.551846' 

# 表示小数的长度为 10，默认是右对齐 
In : "{:10f}".format(1.5518455739153598)    
Out: '  1.551846' 
 
# 左对齐 
In : "{:<10f}".format(1.5518455739153598)   
Out: '1.551846  ' 
 
# .2f 表示小数点后取两位的浮点型 
In : "{:.2f}".format(1.5518455739153598)    
Out: '1.55' 
 
# 总长 3 位，小数点后保留 2 位，若整数位长度超出，则撑开 
In : "{:3.2f}".format(123456.123456)   
Out: '123456.12' 
 
# 使用百分比显示
In : "{:2.2%}".format(1.5518455739153598)   
Out: '155.18%'

4. bytes、bytearray

Python3 引入两个新类型：

bytes：不可变字节序列
bytearray：字节数组，可变

字符串与 bytes

字符串是字符组成的有序序列，字符可以使用编码来理解
bytes 是字节组成的有序的不可变序列
bytearray 是字节组成的有序的可变序列

编码与解码

字符串按照不同的字符集编码 encode 返回字节序列 bytes
- str.encode(encoding=‘utf-8’, errors=‘strict’) --> bytes
字节序列按照不同的字符集解码decode返回字符串
- bytes.decode(encoding=“utf-8”, errors=“strict”) --> str
- bytearray.decode(encoding=“utf-8”, errors=“strict”) --> str

In : '李'.encode()
Out: b'\xe6\x9d\x8e'

In : b'\xe6\x9d\x8e'.decode()
Out: '李'

In : b"\x41\x61".decode()
Out: 'Aa'

# bytearray 和 bytes 不一样的地方在于，bytearray 是可变的。
In : str1 = '人生苦短，Python当歌'

In : b1 = bytearray(str1.encode())

In : b1
Out: bytearray(b'\xe4\xba\xba\xe7\x94\x9f\xe8\x8b\xa6\xe7\x9f\xad\xef\xbc\x8cPython\xe5\xbd\x93\xe6\xad\x8c')

In : type(b1)
Out: bytearray

In : b1.decode()
Out: '人生苦短，Python当歌'

In : b1[:6] = bytearray('生命'.encode())

In : b1
Out: bytearray(b'\xe7\x94\x9f\xe5\x91\xbd\xe8\x8b\xa6\xe7\x9f\xad\xef\xbc\x8cPython\xe5\xbd\x93\xe6\xad\x8c')

In : b1.decode()
Out: '生命苦短，Python当歌'

4.1. ASCII

ASCII（American Standard Code for Information Interchange，美国信息交换标准代码）是基于拉丁字母的一套单字节编码系统，编码范围从 0 到 127

熟记常用字符的 ASCII 码_

Char	Decimal（十进制）	Hex（十六进制）
`\t` 水平制表符	9	09
`\n` 换行符	10	0A
`\v` 垂直制表符	11	0B
`\f` 换页符	12	0C
`\r` 回车符	13	0D
`(space)` 空格	32	20
`0~9`	48~57	30~39
`A-Z`	65~90	41~5A
`a-z`	97~122	61~7A

4.2. bytes 定义

bytes() 空 bytes
bytes(int) 指定字节的 bytes，被 0 填充
bytes(iterable_of_ints) --> bytes （由[0,255] 的 int 组成的可迭代对象）
bytes(string, encoding[, errors]) --> bytes （等价于 string.encode() ）
bytes(bytes_or_buffer) --> immutable copy of bytes_or_buffer （从一个字节序列或者 buffer 复制出一个新的不可变的 bytes 对象）
使用 b 前缀定义
- 只允许基本 ASCII 使用字符形式 b’abc9’
- 使用 16 进制表示 b"\x41\x61"

In : bytes()
Out: b''

In : bytes(5)
Out: b'\x00\x00\x00\x00\x00'

In : bytes(range(3))
Out: b'\x00\x01\x02'

4.3. bytes 操作

和 str 类型类似，都是不可变类型，所以方法很多都一样。只不过 bytes 的方法，输入是 bytes ，输出是 bytes

In : b'abcdef'.replace(b'f',b'k')
Out: b'abcdek'

In : b'abc'.find(b'b')
Out: 1

类方法 bytes.fromhex(string)：string 必须是 2 个字符的 16 进制的形式，‘6162 6a 6b’，空格将被忽略

In : bytes.fromhex('6162 09 6a 6b00')
Out: b'ab\tjk\x00'

hex()：返回16进制表示的字符串

In : 'abc'.encode().hex()
Out: '616263'

索引：b’abcdef’[2] 返回该字节对应的数，int类型

In : b'abcdef'[2]
Out: 99

4.4. bytearray 定义

bytearray() 空 bytearray
bytearray(int) 指定字节的 bytearray，被 0 填充
bytearray(iterable_of_ints) --> bytearray （[0,255]的 int 组成的可迭代对象）
bytearray(string, encoding[, errors]) --> bytearray （近似 string.encode()，不过返回可变对象）
bytearray(bytes_or_buffer) 从一个字节序列或者 buffer 复制出一个新的可变的 bytearray 对象
注意，b 前缀定义的类型是 bytes 类型

In : bytearray()
Out: bytearray(b'')

In : bytearray(6)
Out: bytearray(b'\x00\x00\x00\x00\x00\x00')

In : bytearray(range(3))
Out: bytearray(b'\x00\x01\x02')

4.5. bytearray 操作

和 bytes 类型的方法相同

In : bytearray(b'abcdef').replace(b'f',b'k')
Out: bytearray(b'abcdek')

In : bytearray(b'abc').find(b'b')
Out: 1

类方法 bytearray.fromhex(string)：string 必须是 2 个字符的 16 进制的形式，‘6162 6a 6b’，空格将被忽略

In : bytearray.fromhex('6162 09 6a 6b00')
Out: bytearray(b'ab\tjk\x00')

hex()：返回 16 进制表示的字符串

In : bytearray('abc'.encode()).hex()
Out: '616263'

索引：bytearray(b'abcdef')[2] 返回该字节对应的数，int类型
append(int) 尾部追加一个元素
insert(index, int) 在指定索引位置插入元素
extend(iterable_of_ints) 将一个可迭代的整数集合追加到当前 bytearray
pop(index=-1) 从指定索引上移除元素，默认从尾部移除
remove(value) 找到第一个 value 移除，找不到抛 ValueError 异常
注意：上述方法若需要使用 int 类型，值在 [0, 255]
clear() 清空 bytearray
reverse() 翻转 bytearray，就地修改

In : bytearray(b'abcdef')[2]
Out: 99

In : b = bytearray()

In : b.append(97)

In : b.append(99)

In : b.insert(1,98)

In : b.extend([65,66,67])

In : print(b)
bytearray(b'abcABC')

In : b.remove(66)

In : print(b)
bytearray(b'abcAC')

In : b.pop()
Out: 67

In : print(b)
bytearray(b'abcA')

In : b.reverse()

In : print(b)
bytearray(b'Acba')

In : b.clear()

In : print(b)
bytearray(b'')

4.6. 字节序

大端模式，big-endian；小端模式，little-endian
Intel X86 CPU使用小端模式
网络传输更多使用大端模式
Windows、Linux使用小端模式
Mac OS使用大端模式
Java虚拟机是大端模式

C2 认为是尾巴。尾巴放在低地址端，就是小端模式 LSB:Least Significant Bit，最低有效位；尾巴放在大地址端，就是大端模式 MSB:Most Significant Bit，最高有效位。

4.7. int 和 bytes

int.from_bytes(bytes, byteorder)
- 将一个字节数组表示成整数
int.to_bytes(length, byteorder)
- byteorder 字节序
- 将一个整数表达成一个指定长度的字节数组

In : i = int.from_bytes(b'abc', 'big')

In : print(i, hex(i))
6382179 0x616263

In : print(i.to_bytes(3, 'big'))
b'abc'

In : b1 = bytearray()

In : b1.append(97)

In : b1
Out: bytearray(b'a')

In : b1.extend(range(98, 100))

In : b1
Out: bytearray(b'abc')

5. 切片

列表、元组、字符串、bytes、bytearray 都属于线性结构，线性结构其他的特点还有：

可迭代 (for … in)
len() 可以获取长度
可以通过下标进行访问(有序)
都可以被切片

那什么是切片？我们说通过索引区间访问线性结构一段数据的方法就叫做切片，需要注意的是切片操作会引起内存复制，当对一个过于庞大的线性结构进行切片的时候，请慎重考虑内存使用率的问题。切片的表达方式和基本特点有：

格式：sequence[start:stop:[,step=1]] 返回 [start, stop, step=1) 的前闭后开子序列。
支持负索引。注意方向问题
当 start 为 0 或 stop 为末尾时，可以省略。[:] 表示复制原线性结构数据，等效于 copy() 方法（注意当对象为 list 时，属于 浅 copy）
超过上界(右边界)，则取到末尾；超过下界(左边界)，则取到开头。
start 一定要在 stop 的左边

In : a = 'hello world , My name is Colin'
In : a[2:-1]   
Out: 'llo world , My name is Coli'

In : a[2:]       
Out: 'llo world , My name is Colin'

In : a[-100:]    
Out: 'hello world , My name is Colin'

# stop 位置在 start 左边，所以没办法取出，如果实在想要倒着取，那么需要使用负步长
In : a[10:-100]      
Out: '' 

# 负步长就可以形成开闭区间，注意是从起始位开始按照 step 取的(所以会倒序排列返回) 
In : a[10:-100:-1]   
Out: 'dlrow olleh'

# 列表类型，步长为 2
In : list('My Name is ColinLee')[4:20:2]         
Out: ['a', 'e', 'i', ' ', 'o', 'i', 'L', 'e']

# 元组类型，步长为 2
In : tuple('My Name is ColinLee')[4:20:2]        
Out: ('a', 'e', 'i', ' ', 'o', 'i', 'L', 'e')

注意：

切片并不会对原数据进行修改，会返回新的数据
如果不是用变量接受，那么就会被标记为待回收
由于是新生成的数据，所以 内存地址 和原数据内存地址 一定不相同。

5.1. 切片赋值

既然可以进行切片，那么就会引申出来，是否可以进行切片赋值，什么是切片赋值？它该如何表示？下面以列表例进行说明。

切片操作写在等号的左边
被插入的可迭代对象在等号右边

In : lst = list(range(10))
In : lst 
Out: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

In : lst[1:3]   
Out: [1, 2]

# 只能针对可迭代对象赋值
In : lst[1:3] = 1       
---------------------------------------------------------------------------
TypeError  Traceback(most recent call last)
<ipython-input-82-7fef59136c7e> in <module>
----> 1 lst[1:3] = 1

TypeError: can only assign an iterable


In : lst[1:3] = [100,200]

In : lst 
Out: [0, 100, 200, 3, 4, 5, 6, 7, 8, 9]  

In : a
Out: [0, 4]

In : b = list()

In : b[:] = a

In : b
Out: [0, 4]

In : c = a

In : print(id(a), id(b), id(c))
1935299790344 1935291542600 1935299790344

仔细看上面示例代码会发现几个问题：

lst[1:3] = 1 切片赋值会失败，因为 切片赋值 赋的值必须是 一个可迭代对象
切片赋值改变了原数据
字符串、元组这类不可变的元素，无法使用切片赋值

当我们使用切片时，它会产生新的内存地址来存放生成的新列表，但是如果把切片操作放在赋值操作的左边时，那么就相当于引用了原列表的 [start:stop] 的索引，这种操作是不会生成新的内存空间的，换句话来讲就是直接对原列表进行了 list.insert 操作.

In : lst 
Out: [0, 100, 200, 3, 4, 5, 6, 7, 8, 9]

 # 这种操作相当于在 [1:3) 的位置上进行了 list.remove
In : lst[1:3] = []         

In : lst 
Out: [0, 3, 4, 5, 6, 7, 8, 9]

# 这种操作相当于在 [1:3) 的位置上进行了 list.insert
In : lst[1:3] = [100,200]   

In : lst 
Out: [0, 100, 200, 5, 6, 7, 8, 9]

我们知道 list 在进行 insert 和 remove 时的时间复杂度都是 O(n)，在进行切片赋值时的时间复杂度也是一样，所以建议不要使用这种方法。

你可能感兴趣的:(Python)

理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
python os.environ 江湖偌大 python 深度学习
os.environ['TF_CPP_MIN_LOG_LEVEL']='0'#默认值，输出所有信息os.environ['TF_CPP_MIN_LOG_LEVEL']='1'#屏蔽通知信息（INFO）os.environ['TF_CPP_MIN_LOG_LEVEL']='2'#屏蔽通知信息和警告信息（INFO\WARNING）os.environ['TF_CPP_MIN_LOG_LEVEL']='
Python中os.environ基本介绍及使用方法鹤冲天Pro #Python python 服务器开发语言
文章目录python中os.environos.environ简介os.environ进行环境变量的增删改查python中os.environ的使用详解1.简介2.key字段详解2.1常见key字段3.os.environ.get()用法4.环境变量的增删改查和判断是否存在4.1新增环境变量4.2更新环境变量4.3获取环境变量4.4删除环境变量4.5判断环境变量是否存在python中os.envi
Pyecharts数据可视化大屏：打造沉浸式数据分析体验我的运维人生信息可视化数据分析数据挖掘运维开发技术共享
Pyecharts数据可视化大屏：打造沉浸式数据分析体验在当今这个数据驱动的时代，如何将海量数据以直观、生动的方式展现出来，成为了数据分析师和企业决策者关注的焦点。Pyecharts，作为一款基于Python的开源数据可视化库，凭借其丰富的图表类型、灵活的配置选项以及高度的定制化能力，成为了构建数据可视化大屏的理想选择。本文将深入探讨如何利用Pyecharts打造数据可视化大屏，并通过实际代码案例
Python教程：一文了解使用Python处理XPath 旦莫 Python进阶 python 开发语言
目录1.环境准备1.1安装lxml1.2验证安装2.XPath基础2.1什么是XPath？2.2XPath语法2.3示例XML文档3.使用lxml解析XML3.1解析XML文档3.2查看解析结果4.XPath查询4.1基本路径查询4.2使用属性查询4.3查询多个节点5.XPath的高级用法5.1使用逻辑运算符5.2使用函数6.实战案例6.1从网页抓取数据6.1.1安装Requests库6.1.2代
python os.environ_python os.environ 读取和设置环境变量 weixin_39605414 python os.environ
>>>importos>>>os.environ.keys()['LC_NUMERIC','GOPATH','GOROOT','GOBIN','LESSOPEN','SSH_CLIENT','LOGNAME','USER','HOME','LC_PAPER','PATH','DISPLAY','LANG','TERM','SHELL','J2REDIR','LC_MONETARY','QT_QPA
使用Faiss进行高效相似度搜索 llzwxh888 faiss python
在现代AI应用中，快速和高效的相似度搜索是至关重要的。Faiss（FacebookAISimilaritySearch）是一个专门用于快速相似度搜索和聚类的库，特别适用于高维向量。本文将介绍如何使用Faiss来进行相似度搜索，并结合Python代码演示其基本用法。什么是Faiss？Faiss是一个由FacebookAIResearch团队开发的开源库，主要用于高维向量的相似性搜索和聚类。Faiss
python是什么意思中文-在python中%是什么意思编程大乐趣
Python中%有两种：1、数值运算：%代表取模，返回除法的余数。如：>>>7%212、%操作符（字符串格式化，stringformatting），说明如下：%[(name)][flags][width].[precision]typecode(name)为命名flags可以有+，-，''或0。+表示右对齐。-表示左对齐。''为一个空格，表示在正数的左侧填充一个空格，从而与负数对齐。0表示使用0填
Day1笔记-Python简介&标识符和关键字&输入输出 ~在杰难逃~ Python python 开发语言大数据数据分析数据挖掘
大家好，从今天开始呢，杰哥开展一个新的专栏，当然，数据分析部分也会不定时更新的，这个新的专栏主要是讲解一些Python的基础语法和知识，帮助0基础的小伙伴入门和学习Python，感兴趣的小伙伴可以开始认真学习啦！一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码，再通过语言处理程序执行向计算机发送指令，让计算机完成对应的工作，编程
python八股文面试题分享及解析(1) Shawn________ python
#1.'''a=1b=2不用中间变量交换a和b'''#1.a=1b=2a,b=b,aprint(a)print(b)结果：21#2.ll=[]foriinrange(3):ll.append({'num':i})print(11)结果:#[{'num':0},{'num':1},{'num':2}]#3.kk=[]a={'num':0}foriinrange(3):#0,12#可变类型，不仅仅改变
每日算法&面试题，大厂特训二十八天——第二十天（树）肥学 ⚡算法题⚡面试题每日精进 java 算法数据结构
目录标题导读算法特训二十八天面试题点击直接资料领取导读肥友们为了更好的去帮助新同学适应算法和面试题，最近我们开始进行专项突击一步一步来。上一期我们完成了动态规划二十一天现在我们进行下一项对各类算法进行二十八天的一个小总结。还在等什么快来一起肥学进行二十八天挑战吧！！特别介绍小白练手专栏，适合刚入手的新人欢迎订阅编程小白进阶python有趣练手项目里面包括了像《机器人尬聊》《恶搞程序》这样的有趣文章
Python快速入门 —— 第三节：类与对象孤华暗香 Python快速入门 python 开发语言
第三节：类与对象目标：了解面向对象编程的基础概念，并学会如何定义类和创建对象。内容：类与对象：定义类：class关键字。类的构造函数：__init__()。类的属性和方法。对象的创建与使用。示例：classStudent:def__init__(self,name,age,major):self.name&#
pyecharts——绘制柱形图折线图 2224070247 信息可视化 python java 数据可视化
一、pyecharts概述自2013年6月百度EFE(ExcellentFrontEnd）数据可视化团队研发的ECharts1.0发布到GitHub网站以来，ECharts一直备受业界权威的关注并获得广泛好评，成为目前成熟且流行的数据可视化图表工具，被应用到诸多数据可视化的开发领域。Python作为数据分析领域最受欢迎的语言，也加入ECharts的使用行列，并研发出方便Python开发者使用的数据
Python 实现图片裁剪（附代码） | Python工具剑客阿良_ALiang
前言本文提供将图片按照自定义尺寸进行裁剪的工具方法，一如既往的实用主义。环境依赖ffmpeg环境安装，可以参考我的另一篇文章：windowsffmpeg安装部署_阿良的博客-CSDN博客本文主要使用到的不是ffmpeg，而是ffprobe也在上面这篇文章中的zip包中。ffmpy安装：pipinstallffmpy-ihttps://pypi.douban.com/simple代码不废话了，上代码
【华为OD技术面试真题 - 技术面】- python八股文真题题库（4) 算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选**1.Python中的`with`**用途和功能自动资源管理示例：文件操作上下文管理协议示例代码工作流程解析优点2.\_\_new\_\_和**\_\_init\_\_**区别__new____init__区别总结3.**切片（Slicing）操作**基本切片语法
python os 环境变量 CV矿工 python 开发语言 numpy
环境变量：环境变量是程序和操作系统之间的通信方式。有些字符不宜明文写进代码里，比如数据库密码，个人账户密码，如果写进自己本机的环境变量里，程序用的时候通过os.environ.get（）取出来就行了。os.environ是一个环境变量的字典。环境变量的相关操作importos"""设置/修改环境变量：os.environ[‘环境变量名称’]=‘环境变量值’#其中key和value均为string类
Python爬虫解析工具之xpath使用详解 eqa11 python 爬虫开发语言
文章目录Python爬虫解析工具之xpath使用详解一、引言二、环境准备1、插件安装2、依赖库安装三、xpath语法详解1、路径表达式2、通配符3、谓语4、常用函数四、xpath在Python代码中的使用1、文档树的创建2、使用xpath表达式3、获取元素内容和属性五、总结Python爬虫解析工具之xpath使用详解一、引言在Python爬虫开发中，数据提取是一个至关重要的环节。xpath作为一门
【华为OD技术面试真题 - 技术面】- python八股文真题题库（1）算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.数据预处理流程数据预处理的主要步骤工具和库2.介绍线性回归、逻辑回归模型线性回归（LinearRegression）模型形式：关键点：逻辑回归（LogisticRegression）模型形式：关键点：参数估计与评估：3.python浅拷贝及深拷贝浅拷贝（Shal
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
《Python数据分析实战终极指南》 xjt921122 python 数据分析开发语言
对于分析师来说，大家在学习Python数据分析的路上，多多少少都遇到过很多大坑**，有关于技能和思维的**：Excel已经没办法处理现有的数据量了，应该学Python吗？找了一大堆Python和Pandas的资料来学习，为什么自己动手就懵了？跟着比赛类公开数据分析案例练了很久，为什么当自己面对数据需求还是只会数据处理而没有分析思路？学了对比、细分、聚类分析，也会用PEST、波特五力这类分析法，为啥
Python中深拷贝与浅拷贝的区别 yuxiaoyu.
转自：http://blog.csdn.net/u014745194/article/details/70271868定义：在Python中对象的赋值其实就是对象的引用。当创建一个对象，把它赋值给另一个变量的时候，python并没有拷贝这个对象，只是拷贝了这个对象的引用而已。浅拷贝：拷贝了最外围的对象本身，内部的元素都只是拷贝了一个引用而已。也就是，把对象复制一遍，但是该对象中引用的其他对象我不复
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
Python编译器鹿鹿~ Python编译器 Python python 开发语言后端
嘿嘿嘿我又来了啊有些小盆友可能不知道Python其实是有编译器的，也就是PyCharm。你们可能会问到这个是干嘛的又不可以吃也不可以穿好像没有什么用，其实你还说对了这个还真的不可以吃也不可以穿，但是它用来干嘛的呢。用来编译你所打出的代码进行运行（可能这里说的有点不对但是只是个人认为）现在我们来说说PyCharm是用来干嘛的。PyCharm是一种PythonIDE，带有一整套可以帮助用户在使用Pyt
一文掌握python面向对象魔术方法（二）程序员neil python python 开发语言
接上篇：一文掌握python面向对象魔术方法（一）-CSDN博客目录六、迭代和序列化：1、__iter__(self):定义迭代器，使得类可以被for循环迭代。2、__getitem__(self,key):定义索引操作，如obj[key]。3、__setitem__(self,key,value):定义赋值操作，如obj[key]=value。4、__delitem__(self,key):定义
一文掌握python常用的list（列表）操作程序员neil python python 开发语言
目录一、创建列表1.直接创建列表：2.使用list()构造器3.使用列表推导式4.创建空列表二、访问列表元素1.列表支持通过索引访问元素，索引从0开始：2.还可以使用切片操作访问列表的一部分：三、修改列表元素四、添加元素1.append()：在末尾添加元素2.insert()：在指定位置插入元素五、删除元素1.del：删除指定位置的元素2.remove()：删除指定值的第一个匹配项3.pop()：
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
python中的深拷贝与浅拷贝 anshejd70787 python
深拷贝和浅拷贝浅拷贝的时候，修改原来的对象，浅拷贝的对象不会发生改变。1、对象的赋值对象的赋值实际上是对象之间的引用：当创建一个对象，然后将这个对象赋值给另外一个变量的时候，python并没有拷贝这个对象，而只是拷贝了这个对象的引用。当对对象做赋值或者是参数传递或者作为返回值的时候，总是传递原始对象的引用，而不是一个副本。如下所示：>>>aList=["kel","abc",123]>>>bLis
用Python实现简单的猜数字游戏程序媛了了 python 游戏 java
猜数字游戏代码：importrandomdefpythonit():a=random.randint(1,100)n=int(input("输入你猜想的数字："))whilen!=a:ifn>a:print("很遗憾，猜大了")n=int(input("请再次输入你猜想的数字："))elifna::如果玩家猜的数字n大于随机数字a，则输出"很遗憾，猜大了"，并提示玩家再次输入。elifn
用Python实现读取统计单词个数程序媛了了 python 游戏 java
完整实例代码：fromcollectionsimportCounterdefpythonit():danci={}withopen("pythonit.txt","r",encoding="utf-8")asf:foriinf:words=i.strip().split()forwordinwords:ifwordnotindanci:danci[word]=1else:danci[word]+=
SAX解析xml文件小猪猪08 xml
1.创建SAXParserFactory实例 2.通过SAXParserFactory对象获取SAXParser实例 3.创建一个类SAXParserHander继续DefaultHandler，并且实例化这个类 4.SAXParser实例的parse来获取文件 public static void main(String[] args) { //
为什么mysql里的ibdata1文件不断的增长？ brotherlamp linux linux运维 linux资料 linux视频 linux运维自学
我们在 Percona 支持栏目经常收到关于 MySQL 的 ibdata1 文件的这个问题。当监控服务器发送一个关于 MySQL 服务器存储的报警时，恐慌就开始了 —— 就是说磁盘快要满了。一番调查后你意识到大多数地盘空间被 InnoDB 的共享表空间 ibdata1 使用。而你已经启用了 innodbfileper_table，所以问题是： ibdata1存了什么？当你启用了 i
Quartz-quartz.properties配置 eksliang quartz
其实Quartz JAR文件的org.quartz包下就包含了一个quartz.properties属性配置文件并提供了默认设置。如果需要调整默认配置，可以在类路径下建立一个新的quartz.properties，它将自动被Quartz加载并覆盖默认的设置。下面是这些默认值的解释 #-----集群的配置 org.quartz.scheduler.instanceName =
informatica session的使用 18289753290 workflow session log Informatica
如果希望workflow存储最近20次的log，在session里的Config Object设置，log options做配置，save session log :sessions run ;savesessio log for these runs:20 session下面的source 里面有个tracing
Scrapy抓取网页时出现CRC check failed 0x471e6e9a != 0x7c07b839L的错误酷的飞上天空 scrapy
Scrapy版本0.14.4 出现问题现象： ERROR: Error downloading <GET http://xxxxx CRC check failed 解决方法 1.设置网络请求时的header中的属性'Accept-Encoding': '*;q=0' 明确表示不支持任何形式的压缩格式，避免程序的解压
java Swing小集锦永夜-极光 java swing
1.关闭窗体弹出确认对话框 1.1 this.setDefaultCloseOperation (JFrame.DO_NOTHING_ON_CLOSE); 1.2 this.addWindowListener ( new WindowAdapter () { public void windo
强制删除.svn文件夹随便小屋 java
在windows上，从别处复制的项目中可能带有.svn文件夹，手动删除太麻烦，并且每个文件夹下都有。所以写了个程序进行删除。因为.svn文件夹在windows上是只读的，所以用File中的delete()和deleteOnExist()方法都不能将其删除，所以只能采用windows命令方式进行删除
GET和POST有什么区别？及为什么网上的多数答案都是错的。 aijuans get post
如果有人问你，GET和POST，有什么区别？你会如何回答？我的经历前几天有人问我这个问题。我说GET是用于获取数据的，POST，一般用于将数据发给服务器之用。这个答案好像并不是他想要的。于是他继续追问有没有别的区别？我说这就是个名字而已，如果服务器支持，他完全可以把G
谈谈新浪微博背后的那些算法 aoyouzi 谈谈新浪微博背后的那些算法
本文对微博中常见的问题的对应算法进行了简单的介绍，在实际应用中的算法比介绍的要复杂的多。当然，本文覆盖的主题并不全，比如好友推荐、热点跟踪等就没有涉及到。但古人云“窥一斑而见全豹”，希望本文的介绍能帮助大家更好的理解微博这样的社交网络应用。微博是一个很多人都在用的社交应用。天天刷微博的人每天都会进行着这样几个操作：原创、转发、回复、阅读、关注、@等。其中，前四个是针对短博文，最后的关注和@则针
Connection reset 连接被重置的解决方法百合不是茶 java 字符流连接被重置
流是java的核心部分,,昨天在做android服务器连接服务器的时候出了问题,就将代码放到java中执行,结果还是一样连接被重置被重置的代码如下; 客户端代码; package 通信软件服务器; import java.io.BufferedWriter; import java.io.OutputStream; import java.io.O
web.xml配置详解之filter bijian1013 java web.xml filter
一.定义 <filter> <filter-name>encodingfilter</filter-name> <filter-class>com.my.app.EncodingFilter</filter-class> <init-param> <param-name>encoding<
Heritrix Bill_chen 多线程 xml 算法制造配置管理
作为纯Java语言开发的、功能强大的网络爬虫Heritrix，其功能极其强大，且扩展性良好，深受热爱搜索技术的盆友们的喜爱，但它配置较为复杂，且源码不好理解，最近又使劲看了下，结合自己的学习和理解，跟大家分享Heritrix的点点滴滴。 Heritrix的下载（http://sourceforge.net/projects/archive-crawler/）安装、配置，就不罗嗦了，可以自己找找资
【Zookeeper】FAQ bit1129 zookeeper
1.脱离IDE，运行简单的Java客户端程序 #ZkClient是简单的Zookeeper~$ java -cp "./:zookeeper-3.4.6.jar:./lib/*" ZKClient 1. Zookeeper是的Watcher回调是同步操作，需要添加异步处理的代码 2. 如果Zookeeper集群跨越多个机房，那么Leader/
The user specified as a definer ('aaa'@'localhost') does not exist 白糖_ localhost
今天遇到一个客户BUG，当前的jdbc连接用户是root，然后部分删除操作都会报下面这个错误：The user specified as a definer ('aaa'@'localhost') does not exist 最后找原因发现删除操作做了触发器，而触发器里面有这样一句 /*!50017 DEFINER = ''aaa@'localhost' */ 原来最初
javascript中showModelDialog刷新父页面 bozch JavaScript 刷新父页面 showModalDialog
在页面中使用showModalDialog打开模式子页面窗口的时候，如果想在子页面中操作父页面中的某个节点，可以通过如下的进行： window.showModalDialog('url',self,‘status...’); // 首先中间参数使用self 在子页面使用w
编程之美-买书折扣 bylijinnan 编程之美
import java.util.Arrays; public class BookDiscount { /**编程之美买书折扣书上的贪心算法的分析很有意思，我看了半天看不懂，结果作者说，贪心算法在这个问题上是不适用的。。下面用动态规划实现。哈利波特这本书一共有五卷，每卷都是8欧元，如果读者一次购买不同的两卷可扣除5%的折扣，三卷10%，四卷20%，五卷
关于struts2.3.4项目跨站执行脚本以及远程执行漏洞修复概要 chenbowen00 struts WEB安全
因为近期负责的几个银行系统软件，需要交付客户，因此客户专门请了安全公司对系统进行了安全评测，结果发现了诸如跨站执行脚本，远程执行漏洞以及弱口令等问题。下面记录下本次解决的过程以便后续 1、首先从最简单的开始处理，服务器的弱口令问题，首先根据安全工具提供的测试描述中发现应用服务器中存在一个匿名用户，默认是不需要密码的，经过分析发现服务器使用了FTP协议，而使用ftp协议默认会产生一个匿名用
[电力与暖气]煤炭燃烧与电力加温 comsci
在宇宙中,用贝塔射线观测地球某个部分,看上去,好像一个个马蜂窝,又像珊瑚礁一样,原来是某个国家的采煤区..... 不过,这个采煤区的煤炭看来是要用完了.....那么依赖将起燃烧并取暖的城市,在极度严寒的季节中...该怎么办呢? &nbs
oracle O7_DICTIONARY_ACCESSIBILITY参数 daizj oracle
O7_DICTIONARY_ACCESSIBILITY参数控制对数据字典的访问.设置为true,如果用户被授予了如select any table等any table权限,用户即使不是dba或sysdba用户也可以访问数据字典.在9i及以上版本默认为false,8i及以前版本默认为true.如果设置为true就可能会带来安全上的一些问题.这也就为什么O7_DICTIONARY_ACCESSIBIL
比较全面的MySQL优化参考 dengkane mysql
本文整理了一些MySQL的通用优化方法，做个简单的总结分享，旨在帮助那些没有专职MySQL DBA的企业做好基本的优化工作，至于具体的SQL优化，大部分通过加适当的索引即可达到效果，更复杂的就需要具体分析了，可以参考本站的一些优化案例或者联系我，下方有我的联系方式。这是上篇。 1、硬件层相关优化 1.1、CPU相关在服务器的BIOS设置中，可
C语言homework2，有一个逆序打印数字的小算法 dcj3sjt126com c
#h1# 0、完成课堂例子 1、将一个四位数逆序打印 1234 ==> 4321 实现方法一： # include <stdio.h> int main(void) { int i = 1234; int one = i%10; int two = i / 10 % 10; int three = i / 100 % 10;
apacheBench对网站进行压力测试 dcj3sjt126com apachebench
ab 的全称是 ApacheBench ，是 Apache 附带的一个小工具，专门用于 HTTP Server 的 benchmark testing ，可以同时模拟多个并发请求。前段时间看到公司的开发人员也在用它作一些测试，看起来也不错，很简单，也很容易使用，所以今天花一点时间看了一下。通过下面的一个简单的例子和注释，相信大家可以更容易理解这个工具的使用。
2种办法让HashMap线程安全 flyfoxs java jdk jni
多线程之--2种办法让HashMap线程安全多线程之--synchronized 和reentrantlock的优缺点多线程之--2种JAVA乐观锁的比较( NonfairSync VS. FairSync) HashMap不是线程安全的,往往在写程序时需要通过一些方法来回避.其实JDK原生的提供了2种方法让HashMap支持线程安全.
Spring Security（04）——认证简介 234390216 Spring Security 认证过程
认证简介目录 1.1 认证过程 1.2 Web应用的认证过程 1.2.1 ExceptionTranslationFilter 1.2.2 在request之间共享SecurityContext 1
Java 位运算 Javahuhui java 位运算
// 左移( << ) 低位补0 // 0000 0000 0000 0000 0000 0000 0000 0110 然后左移2位后，低位补0： // 0000 0000 0000 0000 0000 0000 0001 1000 System.out.println(6 << 2);// 运行结果是24 // 右移( >> ) 高位补"
mysql免安装版配置 ldzyz007 mysql
1、my-small.ini是为了小型数据库而设计的。不应该把这个模型用于含有一些常用项目的数据库。 2、my-medium.ini是为中等规模的数据库而设计的。如果你正在企业中使用RHEL,可能会比这个操作系统的最小RAM需求(256MB)明显多得多的物理内存。由此可见，如果有那么多RAM内存可以使用，自然可以在同一台机器上运行其它服务。 3、my-large.ini是为专用于一个SQL数据
MFC和ado数据库使用时遇到的问题你不认识的休道人 sql C++mfc
=================================================================== 第一个 =================================================================== try{ CString sql; sql.Format("select * from p
表单重复提交Double Submits rensanning double
可能发生的场景： *多次点击提交按钮 *刷新页面 *点击浏览器回退按钮 *直接访问收藏夹中的地址 *重复发送HTTP请求（Ajax）（1）点击按钮后disable该按钮一会儿，这样能避免急躁的用户频繁点击按钮。这种方法确实有些粗暴，友好一点的可以把按钮的文字变一下做个提示，比如Bootstrap的做法： http://getbootstrap.co
Java String 十大常见问题 tomcat_oracle java 正则表达式
　1.字符串比较，使用“==”还是equals()? 　　"=="判断两个引用的是不是同一个内存地址(同一个物理对象)。　　equals()判断两个字符串的值是否相等。　　除非你想判断两个string引用是否同一个对象，否则应该总是使用equals()方法。　　如果你了解字符串的驻留(String Interning)则会更好地理解这个问题。　　
SpringMVC 登陆拦截器实现登陆控制 xp9802 springMVC
思路，先登陆后，将登陆信息存储在session中，然后通过拦截器，对系统中的页面和资源进行访问拦截，同时对于登陆本身相关的页面和资源不拦截。实现方法： 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23