详解python中的JSON编码模块

JSON编码支持的基本数据类型为 None , bool , int , float 和 str , 以及包含这些类型数据的lists,tuples和dictionaries。 对于dictionaries,keys需要是字符串类型(字典中任何非字符串类型的key在编码时会先转换为字符串)。 为了遵循JSON规范,你应该只编码python的lists和dictionaries。 而且,在web应用程序中,顶层对象被编码为一个字典是一个标准做法。

python中的JSON编码模块" alt="详解python中的JSON编码模块" src="//www.dapan.cc/wp-content/uploads/2022/11/1668480863-d07827407e57de7.jpg">

JSON编码的格式对于python语法而已几乎是完全一样的,除了一些小的差异之外。 比如,True会被映射为true,False被映射为false,而None会被映射为null。 下面是一个例子,演示了编码后的字符串效果:

>>>json.dumps(False)
'false'
>>>d={'a':True,
...'b':'Hello',
...'c':None}
>>>json.dumps(d)
'{"b":"Hello","c":null,"a":true}'
>>>

如果你试着去检查JSON解码后的数据,你通常很难通过简单的打印来确定它的结构, 特别是当数据的嵌套结构层次很深或者包含大量的字段时。 为了解决这个问题,可以考虑使用pprint模块的 pprint() 函数来代替普通的 print() 函数。 它会按照key的字母顺序并以一种更加美观的方式输出。 下面是一个演示如何漂亮的打印输出Twitter上搜索结果的例子:

>>>fromurllib.requestimporturlopen
>>>importjson
>>>u=urlopen('http://search.twitter.com/search.json?q=python&rpp=5')
>>>resp=json.loads(u.read().decode('utf-8'))
>>>frompprintimportpprint
>>>pprint(resp)
{'completed_in':0.074,
'max_id':264043230692245504,
'max_id_str':'264043230692245504',
'next_page':'?page=2&max_id=264043230692245504&q=python&rpp=5',
'page':1,
'query':'python',
'refresh_url':'?since_id=264043230692245504&q=python',
'results':[{'created_at':'Thu,01Nov201216:36:26+0000',
'from_user':...
},
{'created_at':'Thu,01Nov201216:36:14+0000',
'from_user':...
},
{'created_at':'Thu,01Nov201216:36:13+0000',
'from_user':...
},
{'created_at':'Thu,01Nov201216:36:07+0000',
'from_user':...
}
{'created_at':'Thu,01Nov201216:36:04+0000',
'from_user':...
}],
'results_per_page':5,
'since_id':0,
'since_id_str':'0'}
>>>

一般来讲,JSON解码会根据提供的数据创建dicts或lists。 如果你想要创建其他类型的对象,可以给 json.loads() 传递object_pairs_hook或object_hook参数。 例如,下面是演示如何解码JSON数据并在一个OrderedDict中保留其顺序的例子:

>>>s='{"name":"ACME","shares":50,"price":490.1}'
>>>fromcollectionsimportOrderedDict
>>>data=json.loads(s,object_pairs_hook=OrderedDict)
>>>data
OrderedDict([('name','ACME'),('shares',50),('price',490.1)])
>>>

下面是如何将一个JSON字典转换为一个python对象例子:

>>>classJSONObject:
...def__init__(self,d):
...self.__dict__=d
...
>>>
>>>data=json.loads(s,object_hook=JSONObject)
>>>data.name
'ACME'
>>>data.shares
50
>>>data.price
490.1
>>>

最后一个例子中,JSON解码后的字典作为一个单个参数传递给 __init__() 。 然后,你就可以随心所欲的使用它了,比如作为一个实例字典来直接使用它。

在编码JSON的时候,还有一些选项很有用。 如果你想获得漂亮的格式化字符串后输出,可以使用 json.dumps() 的indent参数。 它会使得输出和pprint()函数效果类似。比如:

>>>print(json.dumps(data))
{"price":542.23,"name":"ACME","shares":100}
>>>print(json.dumps(data,indent=4))
{
"price":542.23,
"name":"ACME",
"shares":100
}
>>>

对象实例通常并不是JSON可序列化的。例如:

>>>classPoint:
...def__init__(self,x,y):
...self.x=x
...self.y=y
...
>>>p=Point(2,3)
>>>json.dumps(p)
Traceback(mostrecentcalllast):
File"<stdin>",line1,in<module>
File"/usr/local/lib/python3.3/json/__init__.py",line226,indumps
return_default_encoder.encode(obj)
File"/usr/local/lib/python3.3/json/encoder.py",line187,inencode
chunks=self.iterencode(o,_one_shot=True)
File"/usr/local/lib/python3.3/json/encoder.py",line245,initerencode
return_iterencode(o,0)
File"/usr/local/lib/python3.3/json/encoder.py",line169,indefault
raiseTypeError(repr(o)+"isnotJSONserializable")
TypeError:<__main__.Pointobjectat0x1006f2650>isnotJSONserializable
>>>

如果你想序列化对象实例,你可以提供一个函数,它的输入是一个实例,返回一个可序列化的字典。例如:

defserialize_instance(obj):
d={'__classname__':type(obj).__name__}
d.update(vars(obj))
returnd

如果你想反过来获取这个实例,可以这样做:

#Dictionarymappingnamestoknownclasses
classes={
'Point':Point
}

defunserialize_object(d):
clsname=d.pop('__classname__',None)
ifclsname:
cls=classes[clsname]
obj=cls.__new__(cls)#Makeinstancewithoutcalling__init__
forkey,valueind.items():
setattr(obj,key,value)
returnobj
else:
returnd

下面是如何使用这些函数的例子:

>>>p=Point(2,3)
>>>s=json.dumps(p,default=serialize_instance)
>>>s
'{"__classname__":"Point","y":3,"x":2}'
>>>a=json.loads(s,object_hook=unserialize_object)
>>>a
<__main__.Pointobjectat0x1017577d0>
>>>a.x
2
>>>a.y
3
>>>