python基础-python处理数据

1、数据排序,python有两种选择。原地排序,排序后的数据替换原来的数据,原来的顺序会丢失,对于列表,sort()方法提供原地排序;复制排序,返回原数据的有序副本,原数据的顺序依然保留,sorted()支持复制排序。

2、数据排序示例

#filename列表形式文件名
def deal_file(filename):
    datalist=[]
    try:
        for item_name in filename:
            #rb:读二进制模式
            with open(item_name,'r') as out_file:
                for item in out_file: #取出整个文件数据
                    print(item)
                    #.split(',')生成列表
                    #item.strip().split(',') 方法串联
                    datalist.extend(item.strip().split(',')) #extend列表合并
                #data=out_file.readline() #readline只能读取一行数据
                #print(data)           
    except IOError as err:
        print('file error:'+str(err))
    print(datalist)
    #统一时间格式
    new_data=[]
    for str_time in datalist:
        new_data.append(deal_time(str_time))
    
    print(new_data)
    #对数据列表排序(函数串联)
    print(sorted(new_data))
#处理时间函数(统一格式,将-或:替换成.):3:4->3.4;3-4->3.4
def deal_time(time_string):
    if '-' in time_string:
        splitter='-'
    elif ':' in time_string:
        splitter=':'
    else:
        splitter='.'
    (mins,secs)=time_string.split(splitter)
    #补位数
    if len(mins)<2:
        mins='0'+mins
    if len(secs)<2:
        secs='0'+secs
    return (mins+'.'+secs)

3、排序方法示例代码修改,简化统一时间格式调用(使用列表推导)

#filename列表形式文件名
def deal_file(filename):
    datalist=[]
    try:
        for item_name in filename:
            #rb:读二进制模式
            with open(item_name,'r') as out_file:
                for item in out_file: #取出整个文件数据
                    print(item)
                    #.split(',')生成列表
                    #item.strip().split(',') 方法串联
                    datalist.extend(item.strip().split(',')) #extend列表合并
                #data=out_file.readline() #readline只能读取一行数据
                #print(data)           
    except IOError as err:
        print('file error:'+str(err))
    print(datalist)
    #统一时间格式
    new_data=[deal_time(str_time) for str_time in datalist]
    print(new_data)
    #对数据列表排序(函数串联)
    print(sorted(new_data))
​

[sort()与sorted()方法默认升序排序,若想要进行降序排序,需要传入参数reverse=True]  

4、使用集合删除重复项,集合中的数据项是无序且不允许重复的。

datalist=[10.6,11,6,10.6,10]
distances=set(datalist)
print(distances)
>>>输出结果
{10, 10.6, 11, 6} #直接会去掉重复的10.6

此目录会不定期更新,喜欢我的文章希望和我一起成长的宝宝们,可以搜索并添加公众号TryTestwonderful ,或者扫描下方二维码添加公众号

python基础-python处理数据_第1张图片

你可能感兴趣的:(python)