极限压缩 json 文件 大小

在前端与后端做交互的时候,有的时候为了减少网络请求,很多时候都会将修改频次极低生成本地化文件进行直接操作,例如地址选择的数据,现在很多平台都是采用将这样的操作。不过对于一些少量数据的,这是一件非常简单的事情,但是当遇到大量数据的时候,这个就明显GG,今天我就遇到了一个,如果按照前端既定的结构生成json文件,文件是4.2M,当时的我简直满脸黑线,后面找到了方法,将数据降低到0.7M,这大概是我现在的极限了,要是还想小,就只能改结构或者跟前端玩命去了。

下面讲一下“压缩的具体方式”,php为例

一.优化数据的结构

想要文件体积减小,优先考虑的应该是如何将文件所需要存储的数据量降低。需要做的是讨论最小可行的一个结构,将不需要的字段去除,将其中单词,代码进行缩减。

二.不要让json中文转码

在调用PHP的json_encode()函数的时候,会将中文进行编码Unicode,在正常情况下来看,这个可能是除了使生成的json串可读性降低了而已,不过在这种特殊情况下,也不能忽略由于编码,而造成的额外大量的体积开销。不进行编码的话,会让文件缩小很多。

我之前写过一篇使json_encode不转码的文章,不过那个函数相对复杂,兼容了键也是汉字的情况,有兴趣的话可以看看那篇博文,本次讲解,用以下函数就够。

function jsonEncode($da)
{
    return urldecode(json_encode(arrUrlencode($da)));
}
function arrUrlencode($da)
{
    if(is_array($da)){
        foreach($da as $k => $v) {
            if(is_array($v)){
                $da[$k] = arrUrlencode($v);
            }elseif(is_string($v) && !is_numeric($v)) {
                $da[$k] = urlencode($v);
            }
        }
    }
    return $da;
}

三.采用压缩的算法

现在常见的json压缩算法有CJSON与HPack,其原理都是将key和value进行抽离,节省掉部分的重复的key值造成的空间消耗。此次中我用到的是CJSON算法。

HPack的基本是将key值抽离出来,被提取前和提取后的数据示例如下,看起来更像是表格化了,是不是很简单:

# 提取前
[
  {name: "Lam", age: 18, gender: "男", hobit: "看书"},
  {name: "Lee" , age: 20, gender: "女", hobit: "跳舞"},
]
# 压缩后
[
  ["name", "age", "gender", "hobit"],
  ["Lam", 18, "男", "看书"],
  ["Lee", 20, "女", "跳舞"],
]

具体实现算法的加密解密现阶段已经有了,犯懒直接粘贴链接https://github.com/WebReflection/JSONH 「注意,可讲类中的json_encode 替换为 第二节提到的 jsonEncode 会使数据进一步缩小」

你可能感兴趣的:(极限压缩 json 文件 大小)