sorted排序
python的排序函数sort,sorted在列表排序和字典排序中的应用详解和举例,python 列表list中内置了一个十分有用的排序函数sort,sorted,它可以用于列表的排序,以下是例子。
a = [5,2,1,9,6]
>>> sorted(a) #将a从小到大排序,不影响a本身结构
[1, 2, 5, 6, 9]
>>> sorted(a,reverse = True) #将a从大到小排序,不影响a本身结构
[9, 6, 5, 2, 1]
>>> a.sort() #将a从小到大排序,影响a本身结构
>>> a
[1, 2, 5, 6, 9]
>>> a.sort(reverse = True) #将a从大到小排序,影响a本身结构
>>> a
[9, 6, 5, 2, 1]
注意,a.sort() 已改变其结构,b = a.sort() 是错误的写法!
>>> b = ['aa','BB','bb','zz','CC']
>>> sorted(b)
['BB', 'CC', 'aa', 'bb', 'zz'] #按列表中元素每个字母的ascii码从小到大排序,如果要从大到小,请用sorted(b,reverse=True)下同
>>> c =['CCC', 'bb', 'ffff', 'z']
>>> sorted(c,key=len) #按列表的元素的长度排序
['z', 'bb', 'CCC', 'ffff']
>>> d =['CCC', 'bb', 'ffff', 'z']
>>> sorted(d,key = str.lower ) #将列表中的每个元素变为小写,再按每个元素中的每个字母的ascii码从小到大排序
['bb', 'CCC', 'ffff', 'z']
>>> def lastchar(s):
return s[-1]
>>> e = ['abc','b','AAz','ef']
>>> sorted(e,key = lastchar) #自定义函数排序,lastchar为函数名,这个函数返回列表e中每个元素的最后一个字母
['b', 'abc', 'ef', 'AAz'] #sorted(e,key=lastchar)作用就是 按列表e中每个元素的最后一个字母的ascii码从小到大排序
>>> f = [{'name':'abc','age':20},{'name':'def','age':30},{'name':'ghi','age':25}] #列表中的元素为字典
>>> def age(s):
return s['age']
>>> ff = sorted(f,key = age) #自定义函数按列表f中字典的age从小到大排序
[{'age': 20, 'name': 'abc'}, {'age': 25, 'name': 'ghi'}, {'age': 30, 'name': 'def'}]
>>> f2 = sorted(f,key = lambda x:x['age']) #如果觉得上面定义一个函数代码不美观,可以用lambda的形式来定义函数,效果同上
对于lambda的使用,如对于以上示例中的字典[key,value]可以采用:
sorted(f,key = lambda x:x['age'])
而对于非字典的[key,value] Set结构来说:
db = [[10,20,'t'],[{]12,3,'s'],[8,10,'s']]
db = sorted(db,key = lambda x : x[0], reverse=True)
实现了按照第一个数值进行降序排列功能,同时改变了数据集db。
文件(夹)遍历
批量重命名文件夹注意:
- 遍历所有子文件夹时需要按照(从深到浅)顺序修改
import os
path = 'C:\\Users\\jiache\\Documents\\DataTang\\final_orgnized_zipped_files\\Batch_6'
dirs = []
for dirpath, dirnames, filenames in os.walk(path, topdown=False):
for filepath in dirnames:
oldDir = os.path.join(dirpath, filepath)
oldName = filepath
newName = oldName.replace(' ', '_')
newDir = os.path.join(dirpath, newName)
os.rename(oldDir, newDir)
print('renamed from ' + oldDir + ' ====> ' + newDir)
读取二进制文件
读取二进制文件并且将数值存出:
def convert(path_in, path_out):
i = 0
f = open(path_in, 'rb')
f2 = open(path_out, 'w')
records = iter(partial(f.read, 2), b'') # 每次2字节
for r in records:
j = 0
r_int = int.from_bytes(r, byteorder='little') # 将 byte转化为 int
i += 1
f2.write(str(r_int) + ' ')
if i % 172 == 0:
f2.write('\n')
f.close()
f2.close()
其中涉及python中int.from_bytes的转换,举例说明:
s= b'\xf1\xff'
########################
print(int.from_bytes(s, byteorder='little', signed=True))
>>> -15
print(int.from_bytes(s, byteorder='big', signed=False))
>>> 61951
s_ = b'\xff\xf1'
print(int.from_bytes(s_, byteorder='little', signed=False))
>>> 61951
'\x'表示十六进制数,由于s的高低位标志是'little',即'f1'是低位,'ff'是高位,所以s的顺序应该是'fff1',二进制表示为1111 1111 1111 0001.
同时要考虑符号位,第一位是1,所以s是负数,要进行取反加一才是正确的十进制数(第一位符号位的1不变),可以得到10000000 00001111,写成十进制,就是-15。上面的例子中,如果signed=False,则无符号位;若byteorder='big',则输入s的左边是高位,右边是低位。