Python实现json对值进行模糊搜索的示例详解
作者:奥怪的小栈 发布时间:2023-07-22 09:35:24
我经常使用json进行存储配置,于是常常遇到这样的问题:如果想要对某个数组里的值进行模糊搜索,同时输出相关的其他数组相同位置的的值该如何实现呢?
思路
代入实际案例来思考一下我的解法
数据
{
"name": [
"电饭煲版广式腊肠煲饭",
"电饭煲烧鸡",
"电饭煲焖面"],
"ingredients": [
"腊肠、米",
"鸡肉、洋葱、菌菇",
"猪肉、面食"],
"url": [
"https://www.***.com/video/BV1NE411Q7Jj",
"https://www.***.com/video/BV1T54y1U7Cu",
"https://www.***.com/video/BV14b411q7rM"
"https://www.***.com/video/BV1K441157rz"],
"difficulty": [
"简单",
"简单",
"简单"],
"tag": [
"广式",
"好吃",
"健康餐"],
"practice": [
"炒",
"烧",
"蒸"
""],
"tool": [
"电饭煲",
"电饭煲",
"电饭煲"
""]
}
这是一个菜谱json。
假如我现在被隔离在家了,手头上只有零星的食材,我想根据手头上的食材来看看我都能做出什么菜。
那么这该如何实现呢?
解法一
假如已知我手上的食物有牛肉、洋葱。那么我可以这样实现
遍历json,然后分别创建数组变量存储name、ingredients、url、difficulty等json数组内容
遍历ingredients数组,模糊匹配是否与我手头上的食物一致
如果一致,将数据加入新的数组中,同时把相同位置的name、url、difficulty等json数组内容也分别加入新的数组中
同时输出各个数组的内容
显而易见,这种解法太呆了,于是我想还有哪里可以优化呢?
解法二
于是我又想到了另一种写法
只遍历一次json并存储,然后再存储一组需要模糊匹配的内容数组(这个内容数组可以是你想匹配的任何值所在的对应数组,例如想模糊匹配菜名,就只需要存储name数组,想模糊匹配食材,就只需要存储ingredients数组)
模糊匹配是否与我手头上的食物一致并记录下位置
通过位置取其他相关的其他数组相同位置的的值
这个解法的关键在于,因为各个数组的长度相同,所以获取一次位置即可同时知道其他对应数值所在的对应数组中的位置
说的有点绕,直接上代码。
代码实现
首先取菜谱数据
# 取菜谱json
def get_record():
url = "./menu.json"
if not os.path.isfile(url):
return "菜谱获取失败"
fo = open(url, "r", encoding='utf-8')
ele_json = loads(fo.read())
return ele_json
模糊搜索实现
# 模糊搜索
def fuzzyfinder(user_input, collection_key_list):
suggestions = []
pattern = '.*?'.join(user_input) # Converts 'djm' to 'd.*?j.*?m'
regex = compile(pattern) # Compiles a regex.
a = 0
for item in collection_key_list:
match = regex.search(item) # Checks if the current item matches the regex.
if match:
suggestions.append(a)
a = a + 1
return suggestions
user_input 和 collection_key_list 分别表示 关键字 和 欲模糊匹配的数组suggestions数组 存储了模糊匹配上了的数值的位置
最后根据实际情况进行数据取出使用即可。
在本例子里,就是取出菜谱
def get_cook(key):
# 进一步解析资源json
al_dict = get_record()
collection_key = [] # 用来模糊匹配的key
for b in al_dict['ingredients']:
collection_key.append(b)
fuzzyfinder_i_list = fuzzyfinder(key, collection_key) # 模糊搜索资源
fuzzyfinder_i_len = len(fuzzyfinder_i_list)
if fuzzyfinder_i_len > 0:
if collection_key[fuzzyfinder_i_list[0]].replace("、", "") == key.replace("、", ""):
return "".join([al_dict['name'][fuzzyfinder_i_list[0]], "丨", al_dict['ingredients'][fuzzyfinder_i_list[0]],
"\nB站教程BV号:", al_dict['url'][fuzzyfinder_i_list[0]], "\n难度:",
al_dict['difficulty'][fuzzyfinder_i_list[0]], "丨标签:", al_dict['tag'][fuzzyfinder_i_list[0]],
"\n方法:", al_dict['practice'][fuzzyfinder_i_list[0]], "丨工具:",
al_dict['tool'][fuzzyfinder_i_list[0]]])
elif collection_key[fuzzyfinder_i_list[fuzzyfinder_i_len - 1]].replace("、", "") == key.replace("、", ""):
return "".join([al_dict['name'][fuzzyfinder_i_list[fuzzyfinder_i_len - 1]], "丨",
al_dict['ingredients'][fuzzyfinder_i_list[fuzzyfinder_i_len - 1]],
"\nB站教程BV号:", al_dict['url'][fuzzyfinder_i_list[fuzzyfinder_i_len - 1]], "\n难度:",
al_dict['difficulty'][fuzzyfinder_i_list[fuzzyfinder_i_len - 1]], "丨标签:",
al_dict['tag'][fuzzyfinder_i_list[fuzzyfinder_i_len - 1]],
"\n方法:", al_dict['practice'][fuzzyfinder_i_list[fuzzyfinder_i_len - 1]], "丨工具:",
al_dict['tool'][fuzzyfinder_i_list[fuzzyfinder_i_len - 1]]])
else:
re_text = "未找到精准关键词,模糊搜索到以下内容:\n"
for c in fuzzyfinder_i_list:
re_text = "".join(
[re_text, al_dict['name'][c], "丨", al_dict['ingredients'][c], "\nB站教程BV号:",
al_dict['url'][c], "\n难度:", al_dict['difficulty'][c],
"丨标签:", al_dict['tag'][c], "\n方法:", al_dict['practice'][c],
"丨工具:", al_dict['tool'][c], "\n"])
return re_text
else:
content = "".join(["未找到" + key + "相关菜谱"])
return content
这个写法可以同时解决精准匹配和模糊匹配问题,精准匹配结果一般是数组第一个或最后一个,所以只需要判断一下首尾是否与关键字相同即可
结果
来看一下效果
精准匹配
if __name__ == "__main__":
print(get_cook("胡萝卜、牛肉、洋葱"))
>>>胡萝卜炖牛肉丨胡萝卜、牛肉、洋葱
>>>B站教程BV号:https://www.***.com/video/BV1UR4y1V7nV
>>>难度:困难丨标签:法式
>>>方法:炖丨工具:一口大锅
模糊匹配
if __name__ == "__main__":
print(get_cook("牛肉、洋葱"))
>>>未找到精准关键词,模糊搜索到以下内容:
>>>电饭煲罗宋汤丨牛肉、番茄、洋葱、芹菜、胡萝卜、土豆、卷心菜
>>>B站教程BV号:https://www.***.com/video/BV16Q4y1m7nU
>>>难度:简单丨标签:杂烩
>>>方法:丨工具:电饭煲
>>>胡萝卜炖牛肉丨胡萝卜、牛肉、洋葱
>>>B站教程BV号:https://www.***.com/video/BV1UR4y1V7nV
>>>难度:困难丨标签:法式
>>>...
问题解决
来源:https://segmentfault.com/a/1190000041722447


猜你喜欢
- 关于target="_blank"去留的问题在网上已经被反复争议很多次了。有的说要留,有的说要去掉。主张留的一方主要是考
- python 消除序列的重复值,并保持原来顺序1、如果仅仅消除重复元素,可以简单的构造一个集合$ pythonPython 3.5.2 (d
- 代码如下:<% set rs=server.createobject("adodb.recordset&
- function clearCookie(){ var keys=document.cookie.match(/[^ =;]+(?=\=)/
- 准备工具pip3 install PILpip3 install opencv-pythonpip3 install numpy谷歌驱动建议
- 一、创建数据库标准1.表的必备三个字段:id、gmt_create、gmt_modified2.gmt_create是创建时间,gmt_mo
- redis模块的使用1.安装模块pip3 install redis2.导入模块import redis3.连接方式严格连接模式:r=red
- 引言周六来公司写点东西,刚好有个icon颜色不对,ui又不在公司,那么就只能自己动手丰衣足食了。呜呜呜,好想住公司,都不用上下班了。svg填
- 目录系列教程一、用户管理1、用户账号2、增加删除账号3、破解管理账号密码二、授权管理1、授权2、查询授权3、收回授权总结系列教程MySQL系
- 在接触公司一个系统时,公司使用的是SQL Server 2008数据库,里面涉及到了多个数据库之间的查询,而且数据库是分布式的,数据库分布在
- 在Web标准中的页面布局是使用Div配合CSS来实现的。这其中最常用到的就是使整个页面水平居中的效果,这是在页面布局中基本,也是最应该首先掌
- 密码算法程序设计实践选的SHA-1。在写的过程中遇到一丢丢关于python移位的问题,记录一下。SHA-1其中第一步需要填充消息。简单阐述一
- 1在js中只有两种作用域a:全局作用域b:函数作用域在ES6之前,js是没有块级作用域。首先来解释一下什么是没有块级作用域?所以此时 是可以
- 公司里很多部门,每个部门可以发多条信息,但每条信息只对应一个部门部门类:class Dep(models.Model): nam
- 1.安装pm2 : npm install pm2 -gd这时在命令行下执行pm2命令可能找不到,需要执行如下命令1.创建软链接:ln -s
- 最近这段时间研究Node感觉不错,自己做了一个增删改查,虽然有些简陋,但是思想是想通的,其实所有项目都是增删改查,有助于初学者快速掌握Nod
- 在一个规范化的研发流程中,一般遵循如下流程:开发阶段:研发功能或者修复bug,在本地自测。代码审核阶段:提交代码,并请求团队内人员做code
- 1.前言最近在用 Python 写一个小工具,这个工具主要就是用来管理各种资源的信息,比如阿里云的 ECS 等信息,因为我工作的电脑使用的是
- 先来看看绘制的动态水球图:没有安装PyEcharts的,先安装PyEcharts:# 安装pyecharts模块,直接安装就是最新的版本pi
- Mcrypt扩展库可以实现加密解密功能,就是既能将明文加密,也可以密文还原。1.PHP加密扩展库Mcrypt安装在标准的PHP安装过程中并没