解决python中set与dict的无序问题
作者:big蟒蛇 发布时间:2021-02-24 14:50:31
每个熟悉python的人都知道,python提供给了我们各种各样原生的数据结构,如list、tuple、set、dict等等。这些形形色色的数据结构为我们程序猿提供了业务支持。但是要用好这些对象,可就要理解这些结构的特点。
比如简单的区分:可变与不可变、有序与无序。
那么本文就想和大家分享一下,这个无序中的细节。
在开始之前,本蟒蛇严重申明,集合和字典是无序的!!集合和字典是无序的!!集合和字典是无序的!!不要看完本蛇说完,然后得到了什么奇奇怪怪的结论!本文基于python3.6进行讲解,什么你还是2.7?兄弟醒醒,都2018年了o(∩_∩)o 哈哈
字典和集合是无序的,只要你懂一点点python的皮毛,你都熟知这句话。大家在初识python时就学习过,什么是可迭代对象(分清楚这个多半是想知道到底啥能被for循环遍历),什么是可变可迭代对象,什么是不可变可迭代对象,什么是无序什么是有序。但大家有想过证明无序嘛?自然会想,本蟒蛇也不例外。那么如何证明无序性呢?简单暴力的解决办法,随便写个两行代码,定义一个set然后print看结果呗!
我的测试代码如下:
s = {'a','b','c'}
print(s)
真的是简单暴力又直接,看到这两行代码不经感叹,人生苦短,我用python(本蟒蛇大学学的java)。好了,当我疯狂运行这个程序的时候输出结果自然也不唯一。
无序嘛!就是这个意思~
但是事情没有那么简单,我无意又用int类型试了一试,如下:
s = {1,2,3}
print(s)
猜猜发生了什么?这种情况下,无论我怎么疯狂输出,疯狂运行这段代码,我得到的结果却是唯一的,那就是print了{1,2,3}
通过反复尝试我发现,只要是int类型,那么set好像就变成有序了,无论声明这个set时数字如何摆放,输出结果总是以一种固定的顺序!同样我将dict字典的key值设为int类型,这时候字典也变成了固定的排序方式。
这是为什么呢?
讲到这里,本蛇需要继续声明set和dict是无序的!别怀疑你的专业知识。那么为什么出现这种现象呢,答案只需要从底层源码中就能找到。
简单来说,就是字典和集合的无序性在python是如何实现的?
字典和集合无序的实现方式是hash表。没错,他们是通过hash值来将对象放入hash表中,从而达到无序的操作(众所周知对象的hash值是不断变化的)。
代码如下:
s = {'A','B','C'}
print(hash('A'))
print(hash('B'))
print(hash('C'))
print(s)
通过打印出hash值,结果也就一目了然啦~
就像上图显示一样,每次的hash值都不同,那么字符ABC在hash表中的位置也不同,然而set就是依据hash表来进行排列的,这就实现了集合的无序。
那么同样的操作我们放在int类型上呢?
s = {1,2,3}
print(hash(1))
print(hash(2))
print(hash(3))
print(s)
到这一步,可能有些猿们就知道结果了,没错结果如下:
无论我多努力的输出,123的hash值却那么任性就是123。是的,python中int型的hash值就是它本身,那么set或dict中的排序方式又是通过hash表实现的,所以自然顺序就不会变。
所以,问题解决啦~就是因为hash的原因,导致了这一怪异现象。提到了hash表不得不佩服python的精妙,dict是原生数据结构中常用来储存大量复杂数据的工具,类似数据库。
这种情况下,查询效率真的是很关键的存在。利用了hash表,空间换时间的方式大大提高了查询效率,妙呀~
所以!不知道大家在做列表随机的时候会不会这样操作,反正本蟒蛇是干过(年少不懂事~),就是类似下面的代码:
L = ['a','b','c']
L = list(set(L))
print(L)
有没有??完美!精简!做随机我甚至都没导入random模块!在没有重复对象的情况下转为集合在转回来不就随机了嘛~那么通过上面的分析,当出现int类型时这个随机就失去了意义啦~避免这样使用哟。而且在真正的生产过程中,你用到列表随机说明就有重复值呀~如果没有。。为什么不直接就用set呢。。。Σ( ° △ °|||)︴可别忘了set还带去重呢!
所以!记住set是无序的!也千万别钻int值是有序的这个空子!因为简单的说,我运行时是CPython作为解释器的,别的结果可能不一样哟~而且python是一门胶水语言,百搭的中央空调,和什么都能配~所以不能保证你的代码绝对只用cPython作为解释器。
所以set与dict是无序的~但是无序的世界里也有小惊喜等着我们发现~
补充:Python中关于dict和set的比较
语法 | dict | set |
---|---|---|
定义 | 通过键-值储存的字典 | 只储存list值的集合 |
性质 | 键和值一一对应 | 储存的值不能重复 |
用法 | 存入:字典名[‘键'] = 值 删除:字典名.pop(‘键') 替换:字典名[‘键'] = 新值 | 存入集合名.add(内容) 删除:集合名.remove(值) 交并补运算: |
共同点:
set的原理和dict一样,所以,同样不可以放入可变对象,因为无法判断两个可变对象是否相等,也就无法保证set内部“不会有重复元素”。
以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。如有错误或未考虑完全的地方,望不吝赐教。
来源:https://blog.csdn.net/qq_16617397/article/details/83627602


猜你喜欢
- 我试了网上提供的一些方法都不行,最后还是自己用SQL解决了些问题。 1 在查询分析器里面选中出问题的数据库,然后输入: Exec sp_co
- tensorflow中的conv2有padding=‘SAME'这个参数。吴恩达讲课中说到当padding=(f-1)/2(f为卷积
- 接口(python 中的协议)的多种不同的实现方式即为多态。多态的作用,就是为了类在继承和派生的时候,保证使用“家谱”中任一类的实例的某一属
- 一、什么是shutilshutil可以简单地理解为sh + util ,shell工具的意思。shutil模块是对os模块的补充,主要针对文
- 前面使用TensorFlow实现一个完整的Softmax Regression,并在MNIST数据及上取得了约92%的正确率。前文传送门:
- 我正在开发某种RESTful API.发生一些错误时,我会抛出一个App :: abort($code,$message)错误.问题是:我希
- 以country.xml为例,内容如下:<?xml version="1.0"?><data>
- 一、安装环境PHPMailer 需要 PHP 的 sockets 扩展支持另外登录 QQ 邮箱 SMTP 服务器则必须通过 SSL 加密的,
- 一、激活函数定义激活函数 (Activation functions) 对于人工神经网络模型去学习、理解非常复杂和非线性的函数来说具有十分重
- 之前写了一个ajax上传工具。但是只是客户端的工具是我写的,服务器端的那个程序,我是修改了一个网上流传的无组件上传类。因为当时我还不懂什么a
- 摘要:如果你学过 C 语言,那么当你初见 Python 时可能会觉得 Python 的赋值方式略有诡异:好像差不多,但又好像哪里有点不太对劲
- 前言随着Python 3.8的发布,赋值表达式运算符(也称为海象运算符)也发布了。运算符使值的赋值可以传递到表达式中。这通常会使语句数减少一
- NVIDIA驱动安装与更新首先查看电脑的显卡版本,步骤为:此电脑右击–>管理–>设备管理
- //只能在firefox下运行 var test = { name: "puterjam", __noSuchMetho
- 公司技术背景:数据库访问类(xxx.DataBase.Dll)调用存储过程实现数据库的访问。技术方案一:压缩时间下程序员写出的第一个版本,仅
- 这个函数是前几年刚流行小偷程序的时候,偶写来用于小偷程序中截取代码的;可能有些朋友在我以前的代码中看见过了,但没有写用法,现在把调用方法及使
- JavaScript 语法约定1、大小写的区分1). JavaScript的关键字,永远都是小写的;2). 内置对象,如Math和Date是
- 最近为了熟悉一下 js 用有道翻译练了一下手,写一篇博客记录一下,也希望能对大家有所启迪,不过这些网站更新太快,可能大家尝试的时候会有所不同
- 直接使用model2=model1会出现当更新model2时,model1的权重也会更新,这和自己的初始目的不同。经评论指出可以使用:mod
- compose函数compose函数可以将需要嵌套执行的函数平铺,嵌套执行就是一个函数的返回值将作为另一个函数的参数。我们考虑一个简单的需求