Python --- 一维数据的格式化和处理

笔记主要由来于 慕课网 Python 语言程序设计

  1. 基本概念
  2. 一维数据表示
  3. 一维数据的存储
  4. 一维数据处理(未进行实际操作!!!!!)

1.基本概念

1.1 维度:一组数据的组织形式
1.2

一维数据
由对等关系的有序或无序数据构成,采用线性方式组织

  • 对应传统python程序中的列表、数组和集合等概念

二维数据
由多个一维数据构成,是一维数据的组合形式

  • 表格是典型的二维数据
  • 表头是二维数据的一部分(也可以作为之外的部分)
    例如:中国大学排行榜

多维数据
由一维或二维数据在新维度上扩展形成
例如:不同年份的中国大学排行榜

高维数据
仅利用最基本的二元关系展示数据间的复杂结构

1.3 数据的操作周期

存储 <-> 表示 <-> 操作

数据存储:数据在磁盘中的存储状态,关心数据的存储格式
数据表示:程序表达的方式,关心的数据类型
数据操作:

2.一维数据表示

  • 如果数据之间有顺序:使用列表类型

    • 列表类型可以表达一维有序数据
    • for 循环可以遍历数据,进而对每个数据进行处理
  • 如果数据之间无序:使用集合类型

    • 集合类型可以表达一维无序类型

    • for 循环可以遍历数据,进而对每个数据进行处理

3. 一维数据的存储

存储方式一:空格分隔

  • 使用一个或多个空格分隔数据进行存储,不换行
  • 缺点:数据中不能存在空格,如果存在空格,无法区分

存储方式二:逗号分隔

  • 使用英文半角符号分隔数据进行存储,不换行
  • 缺点:数据中不能有英文逗号,如果存在空格,无法区分

存储方式三:其他方式

  • 使用其他符号组合分隔,建议使用特殊符号
  • 缺点:需要根据数据特点定义,通用性较差

4. 一维数据处理(未进行实际操作!!!!!)

从空格分隔的文件中读入数据

中国 美国 日本 德国 法国 英国 意大利
        txt = open(fname).read()
        ls = txt.split()
        f.close()

        >>>ls
        ['中国', '美国', '日本', '德国', '法国', '英国', '意大利']


从特殊分隔的文件中读入数据

中国$美国$日本$德国$法国$英国$意大利
        txt = open(fname).read()
        ls = txt.split("$")
        f.close()

        >>>ls
        ['中国', '美国', '日本', '德国', '法国', '英国', '意大利']
采用空格分隔方式将数据写入文件

ls = ['中国', '美国', '日本']
f = open(fname,'w')
f.write(' '.join(ls))
f.close()


采用特殊分隔方式将数据写入文件

ls = ['中国', '美国', '日本']
f = open(fname,'w')
f.write('$'.join(ls))
f.close()

你可能感兴趣的:(Python --- 一维数据的格式化和处理)