@TOC
大家好! 我是来自深圳技术大学FSR实验室
的同学,标题FFH
就是FSRlab For Harmony
!并且我也正在参加OpenHarmony成长计划从论文到开源提交研究
,以后我们也会陆续在这个社区记录学习心得和体会。
引言
相信大家不管是在鸿蒙应用开发,web开发或者小程序开发,都会用JSON
或者XML
进行数据的传输,大家对这两个技术的使用并不陌生,但是我们往往只是局限在使用上,所以在阐述为什么XML会被JSON取代之前,我想先把这两个东西的起源和由来都给大家简单的科普一遍。
XML
标记型语言
讲XML之前,我们先来了解一下标记型语言,我就用通俗地语言描述一下,比如我现在要写一篇博客告诉你们为什么XML会被JSON取代,那这篇博客里面会有标题,二级标题,代码段,高亮文本等等,这些最终都会显示在网站上。
那么问题来了,浏览器怎么知道我显示地文字是标题还是高亮文本...
于是就有了Markdown这门标记语言,它就是用各种标记符号说明了哪里是标题,哪里是高亮文本。说白了,标记语言就是为了让冗杂的数据结构化
,使用标记语言后,能让计算机和人能清晰辨别各类数据,如下例子,用#来标记一级标题,``内可以放高亮文本。比如网页能按照标题,段落,图片呈现,都得归功于标记型语言HTML。
# 标题
`高亮文本`
XML起源
最早在1969年,IBM开发了第一种文档描述语言,用来解决不同系统中文档格式不同的问题,把这种标记语言称为通用标记语言(Generalized Markup Language)GML
,后面这门语言也被不断改进
GML(1969)
————>SGML(1986 国际标准化组织采纳)
————>SGML(2018改进并完善)
SGML具有相当高的规范性和可扩展性,但是就是因为规范多,导致开发,学习,维护的成本就很高。
到了1989年欧洲粒子物理实验室的研究员在SGML的基础上
,提出了HTML
,一种超文本的标记语言,简单,通用,语法要求宽松(可以嵌套使用)。
然后随着Web得发展,传输过程中负载的数据量越来越大
,如果没有结构化数据的话,处理传输的数据消耗会非常非常大,而且非常麻烦,而HTML重点是对于数据的显示,不关心所描述的数据结构,缺乏对文档数据含义的确切描述,不能满足对各类信息的存储,传递和搜索的需求,基于以上需求,又一次在SGML的基础之上
,简化出一种规范,1996年,提出了另一种标记型语言命名为XML(可扩展标记语言)
,就这样,XML出现了。
例子
比如A公司要获取到B公司名字叫Hagon的员工个人信息,这时B公司接受到A公司的请求后,就给A公司传输发送了如下XML格式数据:
员工信息
Hagon
66
男
头铁前端工程师
因为结构清晰,A公司拿到数据后很方便地进行了处理。
XML的瓶颈
虽然XML标准本身简单,但与XML相关的标准却种类繁多,W3C制定的相关标准就有二十多个
,采用XML制定的重要的电子商务标准就有十多个。
随着AJax(之前叫XMLHTTP,2005年后才叫Ajax)
技术的流行,XML的弊端也越来越显现:大家都知道XML实现是基于DOM树实现的,而DOM在各种浏览器中的实现细节不尽相同,所以XML的跨浏览器兼容性并不好,所以急需一种新的数据负载格式集成到HTML页面中以满足Ajax的要求。
这就到了我们要讲的JSON。
JSON
JSON的诞生
前面我们说了随着Ajax的流行,而各种浏览器对DOM的实现细节不尽相同,所以会出现兼容性问题,这对前端开发同学来讲真的是灾难。因为一个功能可能需要用代码去兼容各种不同的浏览器,还要调试,工作量巨大。
但是问题总有办法能解决,那就利用所有主流浏览器中的一种通用组件——JavaScript引擎
。这样只要创造一种JavaScript引擎能识别的数据格式就可以啦!
然后就诞生了JavaScript Object Notation (JSON)
,它是一种轻量级的、基于文本的、独立于语言的数据交换格式
,它源于ECMAScript
编程语言标准。
实例
也是上一个员工信息的例子,用JSON就可以表示为:
{
"title":"员工信息",
"id":666,
"name":"Hagon",
"age":"66",
"sex":"男",
"job":"头铁前端工程师"
}
第一点可以看到,可以看到没有像XML一样有太多嵌套的标签,都是以类似键值对
的形式表示,结构简单。
第二点,在编写XML时,第一行需要定义XML的版本,而JSON不存在版本问题
,格式永远不变。
XML与JSON的数据对比
说了那么多纸上的白话,接下来用数据说话。
场景介绍
场景由一系列较小的试验组成,这些试验根据我们的每一项指标来确定JSON和XML在统计上是否不同。采用均值比较消耗时间检验。我们将20000、40000、60000、80000和100000个编码对象发送到服务器,并收集每种情况的指标。表3、4和5显示了从这些试验中获得的指标。
时间消耗
从这张表格上,不难看出XML处理相同数据的时间消耗大约是JSON的30倍
。
CPU及内存利用率
图4和图5分别是JSON和XML的CPU和内存利用率数据显示,从左到右依次是用户CPU利用率的平均百分比
,系统CPU利用率的平均百分比
和内存利用率的平均百分比
。
Figure3显示了JSON每次试验的平均CPU和内存利用率。图4展示了XML每次试验的平均CPU和内存利用率。Figure5通过在同一个图上绘制Figure3和Figure4(方便对比),说明了JSON的资源利用率和XML的资源利用率之间的差异。上图数据表明,XML使用的用户CPU利用率整体上明显低于JSON
。JSON和XML编码的传输在服务器上使用的内存量几乎相同
(图中表面XML内存利用率的浅蓝色折线被重叠遮住了)。
总结
在上面的实验数据可以看到,JSON的性能明显强于XML。
XML与JSON在web不断发展且传输数据量日益增大的背景下, 在要求算力的时代下,JSON毫无疑问会是更加优秀的一方。并且现在也又很多JSON的解析器,比如Gson,FastJson,Jackson等,这些解析器也在不断助力JSON的发展。
参考文献:
Comparison of JSON and XML data interchange formats: A case study
The application/json Media Type for JavaScript Object Notation (JSON) - 百度学术 (baidu.com)