Python操作JSON文件的知识点整理
作者:梦想橡皮擦 发布时间:2022-10-23 05:45:01
json 模块
Python 提供了内置的 json 模块来处理 JSON 格式的文件。
该模块主要分为读取和写入 JSON 文件。
读取 JSON
使用 json.load() 或 json.loads() 方法来读取 JSON 文件。
其中 json.load() 方法用于读取文件中的 JSON 数据,json.loads() 方法用于读取字符串中的 JSON 数据。
写入 JSON
使用 json.dump() 或 json.dumps() 方法来写入 JSON 文件。
其中 json.dump() 方法用于写入 JSON 数据到文件中,json.dumps() 方法用于将 JSON 数据转换为字符串。
基于上述内容可以总结一下: json.load() , json.loads() , json.dump() 和 json.dumps() 中的 s 都是字符串 string 的缩写。
读取与写入基本用法如下
提前准备一个 travel.json 文件,存放到 python 文件所在目录。
import json
# 读取json文件
with open('travel.json', 'r', encoding='utf-8') as f:
data = json.load(f)
# 写入json文件
with open('travel.new.json', 'w', encoding='utf-8') as f:
json.dump(data, f)
Tops:在使用 json.load() 和 json.loads() 读取 json 文件时,如果文件中存在格式错误,会抛出 ValueError 异常。
json 模块进阶用法
控制输出格式
在处理 JSON 文件时,还可以使用 json.dump() 方法的可选参数来控制输出的格式,例如:
sort_keys:按照键的字典序排序输出。
indent:缩进输出,可以指定缩进的空格数。
import json
# # 读取json文件
with open('travel.json', 'r', encoding='utf-8') as f:
data = json.load(f)
with open('travel.new.json', 'w', encoding='utf-8') as f:
json.dump(data, f, sort_keys=True, indent=4)
此时可以比对旧文件与新文件之间的差异,可以看到缩进关系产生了变化。
在 JSON 中存储 Python 特殊类型
如果你要在 json 中存储 python 特殊类型,例如 datetime,需要使用 json.JSONEncoder 类和 json.JSONDecoder 类来处理。
import json
from datetime import datetime
# 日期编码
class DateEncoder(json.JSONEncoder):
def default(self, obj):
if isinstance(obj, datetime):
return obj.strftime('%Y-%m-%d %H:%M:%S')
return json.JSONEncoder.default(self, obj)
d = {'date': datetime.now()}
json_str = json.dumps(d, cls=DateEncoder)
print(json_str)
# 日期解码
class DateDecoder(json.JSONDecoder):
def __init__(self):
json.JSONDecoder.__init__(self, object_hook=self.dict_to_object)
def dict_to_object(self, d):
if 'date' in d:
d['date'] = datetime.strptime(d['date'], '%Y-%m-%d %H:%M:%S')
return d
data = json.loads(json_str, cls=DateDecoder)
print(data)
运行代码,可以得到编码和解码的输出。
{"date": "2023-01-27 21:24:46"}
{'date': datetime.datetime(2023, 1, 27, 21, 24, 46)}
对数据进行验证和清洗
JSON Schema 是一种用于验证 JSON 文档的标准,它可以用来确保 JSON 文档符合预期的格式。
jsonschema 模块需要提前安装,示例代码如下。
import json
import jsonschema
schema = {
"type": "object",
"properties": {
"name": {"type": "string"},
"age": {"type": "number"}
},
"required": ["name", "age"]
}
data = '{"name": "梦想橡皮擦", "age": 28}'
try:
jsonschema.validate(json.loads(data), schema)
print("可用的JSON")
except jsonschema.exceptions.ValidationError as e:
print(e)
当你的 json 格式正确时,会输出相应的内容,输出错误信息,测试代码可以将 "required": ["name", "age"] 修改为 "required": ["name", "age" , "sex"]。
第三方模块
在处理 JSON 格式文件时还可以使用第三方库来更方便地操作,例如 pandas。
import pandas as pd
# 读取json文件
data = pd.read_json('travel.json')
# 写入json文件
data.to_json('travel.pandas.json')
还有其他第三方库也可以用来处理 JSON 格式文件,例如:
ijson:迭代读取大型 JSON 文件。
jsonpickle:支持将 Python 对象序列化为 JSON 格式。
jsonlines:简单而高效地读取和写入文本文件中的 JSON 数据。
simplejson:提供了一种比标准库更快的 JSON 解析器和生成器。
json-tricks:支持一些高级功能,例如压缩和迭代。
来源:https://blog.csdn.net/hihell/article/details/128773039


猜你喜欢
- 前两天在帮朋友整理他的主页空间时候,发现的一点关于MySQL可能大家都会忽略的问题:我们知道,在安装完MySQL后,它会自动创建一个root
- 在前面的<如何使用PHP计算上一个月的今天>一文中, 我们提到strtotime函数在使用strtotime(”-1 month
- 1、由于 Python 列表的切片会在内存中创建新对象,因此需要注意的另一个重要函数是itertools.islice。2、通常需要遍历切片
- 前言因为前面的文章中已经涉及到了登录智慧校园的验证码处理问题,所以本文将略过此过程。如登录时遇到验证码的情况,请参考此文。其实第一次使用有验
- demo用了点extjs的东西,主要是为了打印json数组出来。 js code(XmlUtils.js): /**/ function X
- 本文实例讲述了PHP实现的微信公众号扫码模拟登录功能。分享给大家供大家参考,具体如下:PHP微信公众号扫码模拟登录功能功能只是将:https
- 废话不多说了,直接把我写的timeit函数分享给大家,具体内容如下:/** * Compute the delay to execute a
- 简而言之就是,nn.Sequential类似于Keras中的贯序模型,它是Module的子类,在构建数个网络层之后会自动调用forward(
- 目录引言 操作多线程/多进程1、创建线程池2、submit3、map4
- 本文实例讲述了Python全局变量与局部变量区别及用法。分享给大家供大家参考,具体如下:对于很多初学的同学,对全局和局部变量容易混淆,看看下
- 本文侧重于如何使用Python语言实现SIFT算法所有程序已打包:基于OpenCV-Python的SIFT算法的实现一、什么是SIFT算法
- 一、concat()函数1、功能:将多个字符串连接成一个字符串。2、语法:concat(str1, str2,...)返回结果为连接参数产生
- Terminal终端命令行Shell设置解决方案File --> Settings --> Tools --> Termi
- 函数的参数能接收变量,那么一个函数就可以接收另一个函数作为参数,这种函数就称之为高阶函数。注意其中:map和filter返回一个惰性序列,可
- 打开文件import xlrddata = xlrd.open_workbook('路径')获取文件中所有工作表的名称。da
- 关于axios的封装下面代码参考了 vue-element-admin 中的封装方式,request.js 文件如下,封装一个 axios
- 推荐系统MostPopular算法的Python实现MostPopular 算法的 是指对每个用户都选择出当前流行度最高的Top-K个物品进
- 查询缓存1.查询缓存操作原理mysql执行查询语句之前,把查询语句同查询缓存中的语句进行比较,且是按字节比较,仅完全一致才被认为相同。如下,
- 本文实例讲述了Python实现简单截取中文字符串的方法。分享给大家供大家参考。具体如下:web应用难免会截取字符串的需求,Python中截取
- 1、准备数据以下操作将在该表中进行create table student ( id int unsigned primary key au