python读取json格式

对于处理json格式,如果是要把python数据格式转换成json,使用json.dumps(),如:


data = {
    'name' : 'ACME',
    'shares' : 100,
    'price' : 542.23
}

json_str = json.dumps(data)

吧json格式转换成python数据结构,使用json.loads()

如果你要处理的是文件而不是字符串,你可以使用 json.dump()和json.load() 来编码和解码 JSON 数据。例如:

# Writing JSON data
with open('data.json', 'w') as f:
    json.dump(data, f)

# Reading data back
with open('data.json', 'r') as f:
    data = json.load(f)

如果你试着去检查 JSON 解码后的数据,你通常很难通过简单的打印来确定它的结构, 特别是当数据的嵌套结构层次很深或者包含大量的字段时。 为了解决这个问题,可以考虑使用 pprint 模块的 pprint()函数来代替普通的 print()函数。 它会按照 key 的字母顺序并以一种更加美观的方式输出。 下面是一个演示如何漂亮的打印输出 Twitter 上搜索结果的例子:

[root@disconf ganluo]# python3.6
Python 3.6.2rc1 (default, Sep 18 2017, 14:02:29) 
[GCC 4.4.7 20120313 (Red Hat 4.4.7-18)] on linux
Type "help", "copyright", "credits" or "license" for more information.
>>> from urllib.request import urlopen
>>> import json
>>> u = urlopen('http://api.crossref.org/works/10.1021/jm0203783')
>>> print(u)

>>> resp = json.loads(u.read().decode('utf-8'))
>>> from pprint import pprint
>>> pprint(resp)
{'message': {'DOI': '10.1021/jm0203783',
             'ISSN': ['0022-2623', '1520-4804'],
             'URL': 'http://dx.doi.org/10.1021/jm0203783',
             'alternative-id': ['10.1021/jm0203783'],
             'author': [{'affiliation': [],
                         'family': 'Wang',
                         'given': 'Renxiao'},
                        {'affiliation': [], 'family': 'Lu', 'given': 'Yipin'},
                        {'affiliation': [],
                         'family': 'Wang',
                         'given': 'Shaomeng'}],
             'container-title': ['Journal of Medicinal Chemistry'],
             'content-domain': {'crossmark-restriction': False, 'domain': []},
             'created': {'date-parts': [[2003, 5, 29]],
                         'date-time': '2003-05-29T09:39:38Z',
                         'timestamp': 1054201178000},
             'deposited': {'date-parts': [[2016, 9, 2]],
                           'date-time': '2016-09-02T01:44:31Z',
                           'timestamp': 1472780671000},
             'indexed': {'date-parts': [[2017, 9, 25]],
                         'date-time': '2017-09-25T21:22:11Z',
                         'timestamp': 1506374531270},
             'is-referenced-by-count': 386,
             'issn-type': [{'type': 'print', 'value': '0022-2623'},
                           {'type': 'electronic', 'value': '1520-4804'}],
             'issue': '12',
             'issued': {'date-parts': [[2003, 6]]},
             'link': [{'URL': 'http://pubs.acs.org/doi/pdf/10.1021/jm0203783',
                       'content-type': 'unspecified',
                       'content-version': 'vor',
                       'intended-application': 'similarity-checking'}],
             'member': '316',
             'original-title': [],
             'page': '2287-2303',
             'prefix': '10.1021',
             'published-print': {'date-parts': [[2003, 6]]},
             'publisher': 'American Chemical Society (ACS)',
             'reference-count': 0,
             'references-count': 0,
             'relation': {},
             'score': 1.0,
             'short-container-title': ['J. Med. Chem.'],
             'short-title': [],
             'source': 'Crossref',
             'subject': ['Molecular Medicine', 'Drug Discovery'],
             'subtitle': [],
             'title': ['Comparative Evaluation of 11 Scoring Functions for '
                       'Molecular Docking'],
             'type': 'journal-article',
             'volume': '46'},
 'message-type': 'work',
 'message-version': '1.0.0',
 'status': 'ok'}

一般来讲,JSON 解码会根据提供的数据创建 dicts 或 lists。 如果你想要创建其他类型的对象,可以给 json.loads()传递 object_pairs_hook 或 object_hook 参数。 例如,下面是演示如何解码 JSON 数据并在一个 OrderedDict 中保留其顺序的例子:

>>> ss='{"liujiangbu":"man","age":27,"high":177}'
>>> from collections import OrderedDict
>>> data = json.loads(ss, object_pairs_hook=OrderedDict)
>>> data
OrderedDict([('liujiangbu', 'man'), ('age', 27), ('high', 177)])

你可能感兴趣的:(python读取json格式)