Python.json.常见两个错误处理(Expecting , delimiter)(Invalid control character at)

ValueError: Invalid control character at: line 1 column 122(char 123)

出现错误的原因是字符串中包含了回车符(\r)或者换行符(\n)
解决方案:

  • 转义
json_data = json_data.replace('\r', '\\r').replace('\n', '\\n')
  • 使用关键字strict
json.loads(json_data, strict=False)


ValueError: Expecting , delimiter: line 13 column 650 (char 4186)

原因:json数据不合法,类似“group_buy_create_description_text”: “1. Select the blue “Buy” button to let other shoppers buy with you.这样的内容出现在json数据中。
解决方案:
将类似的情形通过正则筛选出来通过下面的方式处理。
正则表达式如下:

json_data = json_data.replace('""', '"########"')
js_str = '"[\s\S]+?":\s?"([\s\S]+?)"\}?\}?\]?,'

后续使用中发现无法匹配value为空的情况,故先做一下预处理
这个正则可以匹配到大部分的key,value中的value值,但是也有例外,暂时的处理方法是如果匹配结果中包含”{“, “}”, “[“, “]”这样的字符,说明是匹配失败结果,跳过处理。其他的使用下边的方法替换掉可能出问题的字符。
如果大家有更好的正则匹配方式,欢迎随时批评指正。

def htmlEscape(input) {
        if not input
            return input;
        input = input.replace("&", "&");
        input = input.replace("<", "<");
        input = input.replace(">", ">");
        input = input.replace(" ", " ");
        input = input.replace("'", "'");   //IE暂不支持单引号的实体名称,而支持单引号的实体编号,故单引号转义成实体编号,其它字符转义成实体名称
        input = input.replace("\"", """); //双引号也需要转义,所以加一个斜线对其进行转义
        input = input.replace("\n", "
"
); //不能把\n的过滤放在前面,因为还要对<和>过滤,这样就会导致
失效了 return input; }

你可能感兴趣的:(python,Python,Cook)