Python代码实现列表分组计数
作者:Felix 发布时间:2022-11-03 07:58:38
本篇阅读的代码片段来自于30-seconds-of-python。
1. count_by
def count_by(arr, fn=lambda x: x):
key = {}
for el in map(fn, arr):
key[el] = 1 if el not in key else key[el] + 1
return key
# EXAMPLES
from math import floor
count_by([6.1, 4.2, 6.3], floor) # {6: 2, 4: 1}
count_by(['one', 'two', 'three'], len) # {3: 2, 5: 1}
count_by
根据给定的函数对列表中的元素进行分组,并返回每组中元素的数量。该使用map()
使用给定函数映射给定列表的值。在映射上迭代,并在每次出现时增加元素数。
该函数使用not in
判断目前字典中是否含有指定的key
,如果不含有,就将该key
加入字典,并将对应的value
设置为1;如果含有,就将value
加1。
2. 使用字典推导式
字典推导式有{ key_expr: value_expr for value in collection if condition }
这样的形式。group_by
函数中字典推导式的value_expr
是一个列表,该列表使用了列表推导式来生成。即
{ key_expr: [x for x in collection2 if condition2] for value in collection1 if condition1 }
同时,我们可以看到根据group_by
代码中的字典推导式,可能计算出key相同的项,根据Pyrhon
中字典的类型的规则,key相同的,只保留最新的key-value
对。实际上当key相同时,value值也一样。[el for el in lst if fn(el) == key]
推导式的for语句中只有key一个变量。
>>> d = {'one': 1, 'two': 2, 'three': 3, 'two': 2}
>>> d
{'one': 1, 'two': 2, 'three': 3}
>>> d = {'one': 1, 'two': 2, 'three': 3, 'two': 22}
>>> d
{'one': 1, 'two': 22, 'three': 3}
>>>
这里也可以使用同样的方式,在分组之后直接获取列表长度。不过这种写法遍历了两次列表,会使程序效率变低。
def count_by(lst, fn):
return {key : len([el for el in lst if fn(el) == key]) for key in map(fn, lst)}
3. 使用collections.defaultdict简化代码
class collections.defaultdict([default_factory[, ...]])
collections.defaultdict
包含一个default_factory
属性,可以用来快速构造指定样式的字典。
当使用int
作为default_factory
,可以使defaultdict
用于计数。因此可以直接使用它来简化代码。相比字典推导式的方法,只需要对列表进行一次循环即可。
from collections import defaultdict
def count_by(lst, fn):
d = defaultdict(int)
for el in lst:
d[fn(el)] += 1
return d
当使用 list
作为 default_factory
时,很轻松地将(键-值对组成的)序列转换为(键-列表组成的)字典。
def group_by(lst, fn):
d = defaultdict(list)
for el in lst:
d[fn(el)].append(el)
return d
# EXAMPLES
from math import floor
group_by([6.1, 4.2, 6.3], floor) # {4: [4.2], 6: [6.1, 6.3]}
group_by(['one', 'two', 'three'], len) # {3: ['one', 'two'], 5: ['three']}
来源:https://segmentfault.com/a/1190000040668316


猜你喜欢
- 一、进程之间的数据共享展望未来,基于消息传递的并发编程是大势所趋即便是使用线程,推荐做法也是将程序设计为大量独立的线程集合,通过消息队列交换
- 前言对于前端来说,需要后端提供一个人脸识别接口,前端传入图片,接口识别并返回结果,如此看来,其实前端只需实现图片传入即可,但是其实不然,在传
- 在客户端,Get方式在通过URL提交数据,数据在URL中可以看到;POST方式,数据放置在HTML HEADER内提交。GET方式提交的数据
- 本文实例为大家分享了python画条形图的具体代码,供大家参考,具体内容如下在做毕设的过程中有些数据用表格来展现,会很难看出数据之间的差别,
- 线程池map()方法传递多参数list之前通过threading.thread()进行了助力接口的多线程并发,但是这个针对并发数量较少的时候
- 学习目标在本章中,将学习用于跟踪视频中对象的Meanshift和Camshift算法MeanshiftMeanshift背后的原理很简单,假
- 1. pathlib库介绍相比常用的 os.path 而言,pathlib 对于目录路径的操作更简洁也更贴近 Pythonic(Python
- 数组的组合主要有:1.水平组合:np.hstack(arr1,arr2) 或 concatenate(arr1,arr2,axis=1)2.
- 公共的抽象基类import numpy as npfrom abc import ABCMeta, abstractmethodclass
- mulLine = """Hello!!! Wellcome to Python's world! T
- 问题你想将一个多层嵌套的序列展开成一个单层列表解决方案可以写一个包含 yield from 语句的递归生成器来轻松解决这个问题。比如:fro
- 一年一度的双十一就快到了,各种砍价、盖楼、挖现金的口令将在未来一个月内充斥朋友圈、微信群中。玩过多次双十一活动的小编表示一顿操作猛如虎,一看
- 1.安装时选择的自动安装,忘了用户名和密码导致现在试了几个Oracle默认用户名密码後(表格中附带默认用户名及密码),都提示无效的用户名、密
- 关于js中的offsetWidth、clientWidth、scrollWidth等一系列属性及其方法一直都傻傻分不清,这里就来总结一下这些
- 前言:Redhat下安装Python2.7rhel6.4自带的是2.6, 发现有的机器是python2.4。 到python网站下载源代码,
- Models内容from django.db import modelsfrom django import forms# Create y
- Pydub是一个基于ffmpeg的Python音频处理模块,封装了许多ffmpeg底层接口,因此用它来做音乐歌曲文件格式转换会非常方便,如果
- 最近因为数学建模3天速成Python,然后做了一道网络的题,要画网络图。在网上找了一些,发现都是一些很基础的丑陋红点图,并且关于网络的一些算
- 最近工作需要把单片机读取的传感器电压数据实时在PC上通过曲线显示出来,刚好在看python, 就试着用了python 与uart端口通讯,并
- 数据库中数据展示:使用python代码实现:# Requires pymongo 3.6.0+from pymongo import Mon