Python中yaml数据格式的使用

最近在看代码时发现有人用Yaml —— Yet Another Markup Language :另一种标记语言。编程免不了要写配置文件,怎么写配置也是一门学问。YAML 是专门用来写配置文件的语言,非常简洁和强大,远比 JSON 格式方便。
YAML在python语言中有PyYAML安装包。YAML 语言(发音 /ˈjæməl/ )的设计目标,就是方便人类读写。它实质上是一种通用的数据串行化格式。yaml是一种比xml和json更轻的文件格式,也更简单更强大,它可以通过缩进来表示结构,听着就和Python很配对不对?

PyYaml

PyYaml是Python的一个专门针对yaml文件操作的模块,使用起来非常简单

  • 安装 pip install pyyaml。或者到下载相应版本的包,人工安装。
  • 使用:使用起来非常简单,就像json、pickle一样,load、dump就足够我们使用了。
    • load()
    import yaml
     
    yaml_str = """
    name: 灰蓝
    age: 0
    job: Tester
    """
     
    y = yaml.load(yaml_str)
    print y
    
    结果:{'job': 'Tester', 'age': 0, 'name': u'\u7070\u84dd'}
    • dump()
    import yaml
     
    python_obj = {"name": u"灰蓝",
                  "age": 0,
                  "job": "Tester"
                  }
     
    y = yaml.dump(python_obj, default_flow_style=False)
    print y
    
    输出结果:
    age: 0
    job: Tester
    name: "\u7070\u84DD"
    
    上面只是简单的两个应用,还有 load_all()、dump_all() 等,我们一般用这四个足够了,另外两个下面会讲到,其他方法可以自己看API。

yaml语法

https://www.ibm.com/developerworks/cn/xml/x-cn-yamlintro/
有了上面的基础,接下来我们看看yaml的语法,首先我们准备下测试语法的环境:

  • 创建 test.yaml 文件,我们练习语法就在这里

  • 创建 testyaml.py 文件,用来查看Python执行后的效果,其中内容如下:

# -*- coding: utf-8 -*-
import yaml
 
y = yaml.load(file('test.yaml', 'r'))
print y

1. 基本规则
  • 大小写敏感
  • 使用缩进表示层级关系
  • 缩进时不允许使用Tab,只允许使用空格
  • 缩进的空格数目不重要,只要相同层级的元素左对齐即可
  • # 表示注释,从它开始到行尾都被忽略
2. yaml转字典

yaml中支持映射或字典的表示,如下:
在test.yaml文件中:

#test.yaml
#下面格式读到Python里会是个dict
name: 灰蓝
age: 0
job: Tester

#coding:utf-8
 
import yaml
import os
#open('test.yaml','w')  #如果没有创建test.yaml,先使用open在当前目录下创建文件
 
#方法一
output = yaml.load(file("test.yaml"))
print output
 
#方法二
#filename = os.path.join(os.path.dirname(__file__), 'test.yaml').replace("\\", "/")
#output = yaml.load(open(filename))
#print output

输出:{'job': 'Tester', 'age': 0, 'name': u'\u7070\u84dd'}

3. yaml转列表

yaml中支持列表或数组的表示,注意裂变中的每一个元素前面用符号 - 如下:
在test.yaml文件中:

#test.yaml
#下面格式读到Python里会是个list
 
- 灰蓝
- 0
- Tester

输出:[u'\u7070\u84dd', 0, 'Tester']

4. 复合结构

字典和列表可以复合起来使用,注意这里使用 - 如下:

# test.yaml
#下面格式读到Python里是个list里包含dict
- name: 灰蓝
  age: 0
  job: Tester
- name: James
  age: 30

输出:[{'job': 'Tester', 'age': 0, 'name': u'\u7070\u84dd'}, {'age': 30, 'name': 'James'}]

5. 基本类型

yaml中有以下基本类型:

  • 字符串
  • 整型
  • 浮点型
  • 布尔型
  • null
  • 时间
  • 日期

我们写个例子来看下:

# test.yaml
#这个例子输出一个字典,其中value包括所有基本类型
str: "Hello World!"
int: 110
float: 3.141
boolean: true  # or false
None: null  # 也可以用 ~ 号来表示 null
time: 2016-09-22t11:43:30.20+08:00  # ISO8601,写法百度
date: 2016-09-22  # 同样ISO8601

输出:

{'date': datetime.date(2016, 9, 22), 'None': None, 'boolean': True, 'str': 'Hello World!', 'time': datetime.datetime(2016, 9, 22, 3, 43, 30, 200000), 'int': 110, 'float': 3.141}

如果字符串没有空格或特殊字符,不需要加引号,但如果其中有空格或特殊字符,则需要加引号了

#test.yaml
str: 灰蓝
str1: "Hello World"
str2: "Hello\nWorld"

输出结果:{'str2': 'Hello\nWorld', 'str1': 'Hello World', 'str': u'\u7070\u84dd'}

这里要注意单引号和双引号的区别,单引号中的特殊字符转到Python会被转义,也就是到最后是原样输出了,双引号不会被Python转义,到最后是输出了特殊字符;可能比较拗口,来个例子理解下:

#test.yaml
str1: 'Hello\nWorld'
str2: "Hello\nWorld"

# -*- coding: utf-8 -*-
import yaml
 
y = yaml.load(file('test.yaml', 'r'))
print y['str1']
print y['str2']

输出:

Hello\nWorld
Hello
World

可以看到,单引号中的’\n’最后是输出了,双引号中的’\n’最后是转义成了回车

字符串处理中写成多行、’|’、’>’、’+’、’-‘的意义这里就不讲了。

6. 引用

& 和 * 用于引用

#test.yaml
name: &name 灰蓝
tester: *name

这个相当于一下脚本:

#test.yaml
name: 灰蓝
tester: 灰蓝

输出:{'name': u'\u7070\u84dd', 'tester': u'\u7070\u84dd'}

7. 强制转换

yaml是可以进行强制转换的,用 !! 实现,如下:

#test.yaml
str: !!str 3.14
int: !!int "123"

输出:{'int': 123, 'str': '3.14'}

明显能够看出123被强转成了int类型,而float型的3.14则被强转成了str型。另外PyYaml还支持转换成Python/object类型,这个我们下面再讨论。

8. 分段

在同一个yaml文件中,可以用 — 来分段,这样可以将多个文档写在一个文件中

#test.yaml
---
name: James
age: 20
---
name: Lily
age: 19

这时候我们就得用到我们的 load_all() 方法出场了,load_all() 方法会生成一个迭代器,可以用for输出出来:

# -*- coding: utf-8 -*-
import yaml
 
ys = yaml.load_all(file('test.yaml', 'r'))
for y in ys:
    print y

输出:

{'age': 20, 'name': 'James'}
{'age': 19, 'name': 'Lily'}

对应的也有 dump_all() 方法,一个意思,就是将多个段输出到一个文件中,如:

# -*- coding: utf-8 -*-
import yaml
 
obj1 = {"name": "James", "age": 20}
obj2 = ["Lily", 19]
 
with open('test.yaml', 'w') as f:
    yaml.dump_all([obj1, obj2], f)

打开test.yaml看看

{age: 20, name: James}
--- 
[Lily, 19]

dump() 和 dump_all() 方法可以传入列表,也可以传入一个可序列化生成器,如 range(10), 如下:

# -*- coding: utf-8 -*-
import yaml
 
y = yaml.dump(range(10))
print y

输出:

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

在 dump 和 dump_all() 的时候还可以配一堆参数,不一一讲解了(其实博主也不全了解…)

更高级用法

请参考博文:https://blog.csdn.net/rhx_qiuzhi/article/details/80153920

你可能感兴趣的:(Python)