python3之格式化文件xml,json

1、结构化文件存储

-xml,json

-为了解决不同设备之间信息交换

-参考资料

-

-XML(extensibleMarkupLanguage),可以扩展标记语言

      -标记语言:语言中使用尖括号括起来的文字字符串标记

      -可扩展:用户可以自己定义需要的标记

      -例如:


    自定义标记Teacher
    在两个标记之间任何内容都应该跟Teacher相关

    -是w3c组织制定的一个标准

    -XML描述的是数据本身,即数据的结构和语义

    -HTML侧重于如何显示web页面中的数据

2、XML文档的构成

      -处理指令(可以认为一个文件内只有一个处理指令)

              -以xml关键字开头,在xml文件中只能出现一次并且必须在头部

              -内容是与xml本身处理起相关的一些声明或者指令,一般用于声明XML的版本和采用的编码

                      -version属性是必须的

                      -encoding属性用来支出xml解释器使用的编码

      -根元素(一个文件内只有一个根元素)

              -在整个xml文件中,可以把它看作一个树形结构

              -只有一个根元素,根元素里的都是他的子元素

      -子元素

      -属性

      -内容:表明标签所存储的信息

      -注释:起说明解释的作用;注释不能嵌套在标签里;只有在注释的开始和结尾使用双短横线;三短横线只能出现在开头不能在结尾

python3之格式化文件xml,json_第1张图片

-保留字符的处理

        -XML中使用的符号可能跟实际符号相冲突,典型的就是左右尖括号

        -使用实体引用(EntityReference)来表示保留字符

 score>80  #有错误,xml中不能出现>
 score>:80   #使用实体引用

         -把含有保留字符的部分放在CDATA块内部,CDATA把内部信息视为不需要转义

80
]]
>

-常用的需要转移的保留字和对应实体引用

        -&:&

        -<:&It;

        ->:>

        -' :'

        -" :"

        一共五个,每个实体引用都以&开头并且以分号结尾

-XML标签的命名规则

       -Pascal命名法

       -用单词表示,第一个字母大写

       -大小写严格区分

       -配对的标签必须一直

-命名空间

        -为了防止命名冲突

python3之格式化文件xml,json_第2张图片

        -如果归并上述两个内容信息,会产生冲突

python3之格式化文件xml,json_第3张图片

-为了避免冲突,需要给可能冲突元素添加命名空间

-xmlns: xml name space 的缩写

python3之格式化文件xml,json_第4张图片

3、xml访问

-读取 

    -XML读取分两个主要技术,SAXDOM

    -SAX(Simple API for XML):

          -基于时间驱动的API

          -利用SAX解析文档涉及到解析器和事件处理两部分

          -特点:快;流式读取

-DOM

      -是w3c规定的XML编程接口

      -一个XML文件在缓存中以树形结构保存,读取

python3之格式化文件xml,json_第5张图片

-minidom

       -minidom.parse(filename):加载读取的xml文件,filename也可以是xml的代码

       -doc.documentElement:获取xml文档对象,一个xml文件只有一个对于的文档对象

       -node.getAttribute(attr_name):获取xml节点的属性值

       -node.getElementByTagName(tage_name):得到一个节点对象集合

       -node.childNodes:得到所有孩子节点

       -node.childNodes[index].nodeValue:获取单个节点值

       -node.firstNode:得到第一个节点,等价于node.childNodes[0]

       -node.attributes[tage_name]

-python3之格式化文件xml,json_第6张图片     

-etree

       -以树形结构来表示xml

       -root.getiterator:得到相应的可迭代的node集合

       -root.iter

       -find(node_name):查找指定node_name的节点,返回一个node

       -root.findall(node_name):返回多个node_name的节点

       -node.tag:node对应的tagename

       -node.text:node的文本值

       -node.attrib:是node的属性的字典类型的内容

python3之格式化文件xml,json_第7张图片   

4、xml文件写入

-更改

        -ele.set:修改属性

        -ele.append:添加子元素

        -ele.remove:删除元素

-文件to_edit.xml

python3之格式化文件xml,json_第8张图片

python3之格式化文件xml,json_第9张图片          

-生成创建   

        -SubElement

python3之格式化文件xml,json_第10张图片

        -minidom写入

        -etree创建

python3之格式化文件xml,json_第11张图片

5、JSON

-在线工具

-https://www.sojson.com/

-https://www.w3school.com.cn/json/

-https://www.runoob.com/json/json-tutorial.html

 -JSON(JavaScriptObjectNotation)

-轻量级的数据交换格式,基于ECMAScript

-json格式是一个键值对形式的数据集

        -key:字符串

        -value:字符串、数字、列表、json

        -json使用大括号包裹

        -键值对直接用都好隔开

Student={
    "name":"haha",
    "age":18,
    "mobile":"1242344523"
}

-json和python格式的对应

       -字符串:字符串

       -数字:数字

       -队列:list

       -对象:dict

       -布尔值:布尔值

-python for json

       -json包

       -json和Python对象的转换

               -json.dumps():对数据编码,把python格式表示成json格式

               -json.loads():对数据解码,把json格式转换成python格式

import json

#此时student是一个dict格式内容,不是json
student={
    "name":"lala",
    "age":18,
    "mobile":"17847"
}

print(type(student))

#转换为json格式
stu_json = json.dumps(student)
print(type(stu_json))
print("JSON对象:{0}".format(stu_json))

stu_dict = json.loads(stu_json)
print(type(stu_dict))
print(stu_dict)
运行:


JSON对象:{"name": "lala", "age": 18, "mobile": "17847"}

{'name': 'lala', 'age': 18, 'mobile': '17847'}

-python读取json文件

        -json.dump():把内容写入文件

        -json.load():把json文件内容读入python

python3之格式化文件xml,json_第12张图片

 

你可能感兴趣的:(Python知识)