• Python之json模块


    Python开发实用教程

    JSON (JavaScript Object Notation),由 RFC 7159 (它取代了 RFC 4627) 和 ECMA-404 指定,是一个受 JavaScript 的对象字面值句法启发的轻量级数据交换格式。JSON独立于编程语言的文本格式来存储和表示数据,现在大部分的数据传输基本使用的都是json格式,经常要从json里面拿到自己想要的数据也就是解析json,python提供了工具帮助我们解析json。

    json简介

    json就是一串表达数据的字符串,字符串有一定的语法规则约束:

    • json表达的数据是键值数据,与python中的dict十分相识;
    • 数据项之间使用逗号分割;
    • 使用斜杆来转义\字符
    • 数据项的值支持整数、浮点数、字符串、逻辑值,null等
    • 数据项的值支持数组,数组数据使用中括号括起来
    • 多个数据项可以组合成一个对象,对象数据使用大括号括起来。
    1. {
    2. "name": "Kamishiro Rize",
    3. "age": 22,
    4. "occupation": "firefighter",
    5. "traits": [
    6. "Eagle Eyed",
    7. "Fast Healer",
    8. "High Thirst",
    9. "Hearty Appetite"
    10. ]
    11. }

    JSON 与 Python 的数据结构和对应关系如下:

    JSONPython
    objectdict
    arraylist,tuple
    stringstr,unicode
    number (int)int, long
    number (real)float
    trueTrue
    falseFalse
    nullNone

    解析json

    json.loads(s*cls=Noneobject_hook=Noneparse_float=Noneparse_int=Noneparse_constant=Noneobject_pairs_hook=None**kw)

    将字符串解析为python对象

    参数说明:

    • s:一个包含 JSON 文档的 str, bytes 或 bytearray 对象
    • cls:解析器,默认是JSONDecoder ,也可以使用自定义的JSONDecoder子类作为解析器
    • object_hook 是一个将附带任意已解码的对象字面值 (即 dict) 来调用的可选函。object_hook 的返回值会代替 dict 使用。 此特性可被用于实现自定义解码器 (例如 JSON-RPC 的类型提示)。
    • object_pairs_hook 是一个可选的函数,它会被调用于每一个有序列表对解码出的对象字面量。 object_pairs_hook 的返回值将会取代原本的 dict 。这一特性能够被用于实现自定义解码器。如果 object_hook 也被定义, object_pairs_hook 优先。
    • parse_float ,如果指定,将与每个要解码 JSON 浮点数的字符串一同调用。默认状态下,相当于 float(num_str) 。可以用于对 JSON 浮点数使用其它数据类型和语法分析程序 (比如 decimal.Decimal )。
    • parse_int ,如果指定,将与每个要解码 JSON 整数的字符串一同调用。默认状态下,相当于 int(num_str) 。可以用于对 JSON 整数使用其它数据类型和语法分析程序 (比如 float )。
    • parse_constant ,如果指定,将要与以下字符串中的一个一同调用: '-Infinity' , 'Infinity' , 'NaN' 。如果遇到无效的 JSON 数字则可以使用它引发异常。
    1. import json
    2. jsonstr = '{ \
    3. "name": "Kamishiro Rize",\
    4. "age": 22,\
    5. "occupation": "firefighter",\
    6. "traits": [\
    7. "Eagle Eyed",\
    8. "Fast Healer",\
    9. "High Thirst",\
    10. "Hearty Appetite"\
    11. ]\
    12. }'
    13. # print(jsonstr)
    14. jo = json.loads(jsonstr)
    15. print(type(jo))
    16. print(jo)
    17. ‘’'
    18. dict'>
    19. {'name': 'Kamishiro Rize', 'age': 22, 'occupation': 'firefighter', 'traits': ['Eagle Eyed', 'Fast Healer', 'High Thirst', 'Hearty Appetite']}
    20. ‘''

    上面的例子可以看出,json字符串被解析为一个dict的对象。具体json是如何解析的,是由JSONDecoder来实现的。

    解码器JSONDecoder

    class json.JSONDecoder(*object_hook=Noneparse_float=Noneparse_int=Noneparse_constant=Nonestrict=Trueobject_pairs_hook=None)

    解码器的参数和解析函数的参数大部分相同,相同的部分含义也一致。

    默认情况下,解码执行以下翻译:

    JSON

    Python

    object -- 对象

    dict

    array

    list

    string

    str

    number (int)

    int

    number (real)

    float

    true

    True

    false

    False

    null

    None

    它还将“NaN”、“Infinity”和“-Infinity”理解为它们对应的“float”值,这超出了JSON规范。

    主要的方法有:

    decode(s)

    解析s,如果给定的 JSON 文档无效则将引发 JSONDecodeError。

    raw_decode(s)

    从 s 中解码出 JSON 文档(以 JSON 文档开头的一个 str 对象)并返回一个 Python 表示形式为 2 元组以及指明该文档在 s 中结束位置的序号。
    这可以用于从一个字符串解码JSON文档,该字符串的末尾可能有无关的数据。

    解析json文件

    json.load(fp*cls=Noneobject_hook=Noneparse_float=Noneparse_int=Noneparse_constant=Noneobject_pairs_hook=None**kw)

    对json文件fp进行解析(fp对象要支持read()方法),其他参数与loads完全一致。

    生成json

    json.dumps(obj*skipkeys=Falseensure_ascii=Truecheck_circular=Trueallow_nan=Truecls=Noneindent=Noneseparators=Nonedefault=Nonesort_keys=False**kw)

    将一个python对象生成json的str对象。

    参数说明:

    • obj:待生成json串的python对象;
    • skipkeys:如果 skipkeys 是 true (默认为 False),那么那些不是基本对象(包括 str, int、float、bool、None)的字典的键会被跳过;否则引发一个 TypeError。
    • ensure_ascii:如果 ensure_ascii 是 true (即默认值),输出保证将所有输入的非 ASCII 字符转义。如果 ensure_ascii 是 false,这些字符会原样输出。
    • check_circular:如果 check_circular 为假值 (默认值: True),那么容器类型的循环引用检查会被跳过并且循环引用会引发 RecursionError (或者更糟的情况)。
    • allow_nan:如果 allow_nan 是 false(默认为 True),那么在对严格 JSON 规格范围外的 float 类型值(nan、inf 和 -inf)进行序列化时会引发一个 ValueError。如果 allow_nan 是 true,则使用它们的 JavaScript 等价形式(NaN、Infinity 和 -Infinity)。
    • cls:默认使用编码器JSONEncoder,也可以指定自己定义的JSONEncoder子类作为编码器进行个性化编码。
    • indent:如果 indent 是一个非负整数或者字符串,那么 JSON 数组元素和对象成员会被美化输出为该值指定的缩进等级。 如果缩进等级为零、负数或者 "",则只会添加换行符。 None (默认值) 选择最紧凑的表达。 使用一个正整数会让每一层缩进同样数量的空格。 如果 indent 是一个字符串 (比如 "\t"),那个字符串会被用于缩进每一层。
    • separators:当被指定时,separators 应当是一个 (item_separator, key_separator) 元组。当 indent 为 None 时,默认值取 (', ', ': '),否则取 (',', ': ')。为了得到最紧凑的 JSON 表达式,你应该指定其为 (',', ':') 以消除空白字符。
    • default:当 default 被指定时,其应该是一个函数,每当某个对象无法被序列化时它会被调用。它应该返回该对象的一个可以被 JSON 编码的版本或者引发一个 TypeError。如果没有被指定,则会直接引发 TypeError。
    • sort_keys:如果 sort_keys 是 true(默认为 False),那么字典的输出会以键的顺序排序。
    1. import json
    2. # python object(dictionary) to be dumped
    3. dict1 ={
    4. "emp1":{
    5. "name":"Lisa",
    6. "designation":"programmer",
    7. "age":34,
    8. "salary":54000.01
    9. },
    10. "emp2":{
    11. "name":"Elis",
    12. "designation":"Trainee",
    13. "age":24,
    14. "salary":40000.00
    15. },
    16. }
    17. jdict1 = json.dumps(dict1)
    18. print(jdict1)
    19. jdict1 = json.dumps(dict1, indent = 6)
    20. print(jdict1)
    21. ‘’'
    22. {"emp1": {"name": "Lisa", "designation": "programmer", "age": 34, "salary": 54000.01}, "emp2": {"name": "Elis", "designation": "Trainee", "age": 24, "salary": 40000.0}}
    23. {
    24. "emp1": {
    25. "name": "Lisa",
    26. "designation": "programmer",
    27. "age": 34,
    28. "salary": 54000.01
    29. },
    30. "emp2": {
    31. "name": "Elis",
    32. "designation": "Trainee",
    33. "age": 24,
    34. "salary": 40000.0
    35. }
    36. }
    37. ‘''

    编码器JSONEncoder

    class json.JSONEncoder(*skipkeys=Falseensure_ascii=Truecheck_circular=Trueallow_nan=Truesort_keys=Falseindent=Noneseparators=Nonedefault=None)

    用于Python数据结构的可扩展JSON编码器。

    默认支持以下对象和类型:

    Python

    JSON

    dict

    object -- 对象

    list, tuple

    array

    str

    string

    int, float, int 和 float 派生的枚举

    数字

    True

    true

    False

    false

    None

    null

    除了上面这些类型,JSONEncoder不支持自定义的类型,需要自己写基于上面这个编码器的子类。

    主要方法:

    default(o)

     在子类中实现这种方法使其返回 o 的可序列化对象,或者调用基础实现(引发 TypeError )。 

    encode(o)

    返回 Python o 数据结构的 JSON 字符串表达方式。

    iterencode(o)

    编码给定对象 o ,并且让每个可用的字符串表达方式。

    1. import json
    2. class Base:
    3. def __init__(self, id, desc):
    4. self.id = id
    5. self.desc = desc
    6. def foo(self):
    7. print(f'Base {self.id=}, {self.desc=}')
    8. IDSTART = 1100001
    9. class Teacher(Base):
    10. def __init__(self, name, course):
    11. self.name = name
    12. self.course = course
    13. class Student(Base):
    14. def __init__(self, name, age):
    15. self.name = name
    16. self.age = age
    17. self.score = {'Chinese':90, 'Math':95, 'English':90}
    18. self.tearchers = [Teacher('Chen', 'Chinese'), Teacher('Wang', 'Math'), Teacher('Su', 'English')]
    19. global IDSTART
    20. IDSTART += 1
    21. super().__init__(IDSTART, 'Student ' + name)
    22. def foo(self):
    23. print(f'Student {self.name=}, {self.age=}')
    24. class MyEncoder(json.JSONEncoder):
    25. def default(self, obj):
    26. if type(obj) not in (dict, list, tuple, str, int, float, True, False, None):
    27. return str(vars(obj))
    28. return json.JSONEncoder.default(self, obj)
    29. b = Base(10011, 'Base Object')
    30. b.foo()
    31. jb = json.dumps(b, cls=MyEncoder)
    32. print(jb)
    33. s = Student('John', 12)
    34. s.foo()
    35. js = json.dumps(s, cls=MyEncoder)
    36. print(js)
    37. ’’’
    38. Base self.id=10011, self.desc='Base Object'
    39. "{'id': 10011, 'desc': 'Base Object'}"
    40. Student self.name='John', self.age=12
    41. "{'name': 'John', 'age': 12, 'score': {'Chinese': 90, 'Math': 95, 'English': 90}, 'tearchers': [<__main__.Teacher object at 0x10fede450>, <__main__.Teacher object at 0x10fe05a50>, <__main__.Teacher object at 0x10fede510>], 'id': 1100002, 'desc': 'Student John'}"
    42. ‘’‘

    生成json文件

    json.dump(objfp*skipkeys=Falseensure_ascii=Truecheck_circular=Trueallow_nan=Truecls=Noneindent=Noneseparators=Nonedefault=Nonesort_keys=False**kw)

    将python对象以json格式写入文件fp(支持write()方法)

    json 模块始终产生 str 对象而非 bytes 对象。因此,fp.write() 必须支持 str 输入。

  • 相关阅读:
    PDF处理控件Aspose.PDF功能演示:使用C#查找和替换PDF文件中的文本
    Cy3 PEG N-羟基琥珀酰亚胺,花菁染料CY3标记N-羟基琥珀酰亚胺,CY3-N-Hydroxy succinimide
    自定义类似微信效果Preference
    自学Python 51 多线程开发(一)threading模块
    区别:秒s、毫秒ms、微秒μs、纳秒ns、皮秒ps、飞秒fs每两级之间的换算以及之间的关系
    【IDEA使用maven package时,出现依赖不存在以及无法从仓库获取本地依赖的问题】
    计算机毕业论文选题java毕业设计软件源代码SSH健身房管理系统[包运行成功]
    CodeLab:一款让你体验丝滑般的云化JupyterLab
    Libgdx游戏开发(4)——显示中文文字
    【SpringMVC】详细了解SpringMVC中WEB-INF 目录资源,视图解析器和静态资源放行的使用。
  • 原文地址:https://blog.csdn.net/spiritx/article/details/133455818