【问题记录】json.decoder.JSONDecodeError:Extra data: line xxx column xxx(char xxxx)

这个报错一般都出现在解析的json文件格式不对,有特殊字符或者一次性读取的文件过大。(个人认为第一种情况更有可能,因为我的文件数据量就有十多万条,正常打开也没问题)

一开始,我想使用如下命令打开json格式的文件

        with open(data_path) as fp_data:
            raw_problems = json.load(fp_data)

但是会保存json解码过程出现错误,Extra data: line 8 column 1(char 190)。这个时候,还不确定问题到底属于刚才我说的哪一种,所以我就打开我的文件查看第八行第一个字符。我的文件形式如下:

【问题记录】json.decoder.JSONDecodeError:Extra data: line xxx column xxx(char xxxx)_第1张图片

 可以看到,第八行第一个字符是一个"{",这个时候基本可以确定是第一种问题了,无法读取我这种格式的json文件。所以我将文件处理成了下图所示的文件后,这个问题就解决了。

【问题记录】json.decoder.JSONDecodeError:Extra data: line xxx column xxx(char xxxx)_第2张图片

 数据处理的过程根据个人的需要而来,如果有需要我数据处理的过程请私信我。

你可能感兴趣的:(Pytorch,Python,NLP,json)