python绘制简单直方图的方法
作者:一只会飞的猪? 发布时间:2023-06-23 19:54:50
直方图,又称质量分布图,是一种统计报告图,由一系列高度不等的纵条或线段表示数据分布情况。用横轴表示数据类型,纵轴表示分布情况。直方图是数值数据分布的精确图形表示。绘制连续性的数据,展示一组或多组数据的分布状况。
直方图的绘制和条形图有些相似,需要把plt.bar()修改成plt.hist(),更改图形的拟合方式,即可绘制直方图。例如你获取到了250部电影的数量,他们的时长都在80-140分钟,如何呈现电影的时长分布情况呢?
老规矩,上代码:
'''
组数=极差/组距
'''
from matplotlib import pyplot as plt
from matplotlib import font_manager
import random
a = [random.randint(80,140) for i in range(250)]
print(a)
print(max(a)-min(a))
# 计算组数
d = 3 # 组距
num_bins = (max(a)-min(a))//d
# 设置图形大小
plt.figure(figsize=(20, 8), dpi=80)
plt.hist(a, num_bins)
# 设置x轴刻度
plt.xticks(range(min(a), max(a)+d, d))
# 设置网格
plt.grid(alpha=0.4)
plt.show()
运行结果如下图:
程序分析:通过随机数random.randint()生成250个80-140的随机整数,代表250部电影的时长。然后要把时间段分成组,设置组距d为3,那么(max-min)//d即为分成的组数,然后通过plt.hist()对组数和数据进行拟合。设置x刻度时,因为range含头不含尾,所以最后截止的位置要加一个组距d,才能显示完全。可以看出,这个数字直方图可以显示每个电影时长在每个时段占得数目。那么问题又来了,如果想要知道在每个时段占总时段的比例呢,也就是频率分布直方图?
so easy! 只需要在plt.hist()里面设置参数density=True实现数量的频率化,其余不变。
代码如下:
'''
组数=极差/组距
'''
from matplotlib import pyplot as plt
from matplotlib import font_manager
import random
a = [random.randint(80,140) for i in range(250)]
print(a)
print(max(a)-min(a))
# 计算组数
d = 3 # 组数
num_bins = (max(a)-min(a))//d
# 设置图形大小
plt.figure(figsize=(20,8),dpi=80)
plt.hist(a,num_bins,density=True) # 使用density实现频率化
# 设置x轴刻度
plt.xticks(range(min(a),max(a)+d,d))
# 设置网格
plt.grid(alpha=0.4)
plt.show()
运行结果:
显而易见,每个时段的数目变成了总体的占比,也就是频率,很好的达到了想要的效果。
那如果要自己设置数据自己设置x轴的距离,对x轴的刻度不均匀划分呢?
上代码:
# coding=utf-8
from matplotlib import pyplot as plt
from matplotlib import font_manager
interval = [0,5,10,15,20,25,30,35,40,45,60,90,150]
width = [5,5,5,5,5,5,5,5,5,15,30,60]
quantity = [836,2737,3723,3926,3596,1438,3273,642,824,613,215,47]
plt.figure(figsize=(20,8),dpi=80)
plt.bar(range(len(quantity)),quantity,width=1)
# 设置x轴刻度
_x = [i-0.5 for i in range(13)]
plt.xticks(_x, interval)
plt.grid(alpha=0.8)
plt.show()
运行结果如下图:
可以看出来,很简单,只需要把x轴对应的数据设置好,把对应x轴的刻度设置好,进行数据匹配即可。一定要注意,分配的组数和数据个数匹配问题。
总结:这篇文章总的讲述了一下绘制频数直方图和频率直方图的绘制方法,通过图像进行比较,发现各个直方图的优缺点,以便在工程中进行运用。
来源:https://blog.csdn.net/qq_52131774/article/details/121469063


猜你喜欢
- 影响的范围: IE的所有版本在表单的radio/checkbox控件中,一旦他们的DOM结构被更改过就会出现这个bug。bug描述当象下例中
- 1、使用 runefunc BenchmarkSubstr1(b *testing.B) {s := "bench基准测试,121
- 很多朋友问过我absolute与relative怎么区分,怎么用?我们都知道absolute是绝对定位,relative是相对定位,但是这个
- PHP mysqli_stat() 函数创建 SSL 连接:<?php// 假定数据库用户名:root,密码:123456,数据库:c
- 本文代码来之《数据分析与挖掘实战》,在此基础上补充完善了一下~代码是基于SVM的分类器Python实现,原文章节题目和code关系不大,或者
- 这篇文章主要介绍了Python pygame绘制文字制作滚动文字过程解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考
- 菜鸟版代码如下: 理解这段代码就基本上掌握了 function f_s() { var obj = document.getElementB
- 具体代码如下所示:import tkinter as tkimport tkinter.messageboximport copyimpor
- 1. 不使用全局变量,适当封装2. 兼容性还行~~3. 代码短,可读性凑合~~呵呵~~~~~a. 拖动效果,16行JS<!DOCTYP
- jupyter notebook 图片显示模糊的解决办法加入这几行代码即可:矢量图设置import matplotlib.pyplot as
- 前言看到这篇文章我就默认你已经在你的电脑上使用 pipenv搭建好了虚拟环境并且设置好了开发环境(pycharm)。如果没有,请参照这篇文章
- 把程序重新写了一遍,日期下拉选择器,可自定义日期范围。使用了一个技巧获取指定月份的天数。演示页面:DateSelector.htm 程序代码
- 下面是ThoughtBot 的Git使用规范流程。我从中学到了很多,推荐你也这样使用Git。第一步:新建分支首先,每次开发新功能,都应该新建
- 比如我们有一张school表,里面有一个字段county_name,现在我们要查询county_name字段中包含a-w字母和数字以外字符的
- 一、问题故事起源于一个查询错漏率的报表:有两个查询结果,分别是报告已经添加的项目和报告应该添加的项目,求报告无遗漏率何为无遗漏?即,应该添加
- 前言:最近某个时间开始,特别留意了一下Web标准中柱状图,也就是英文中的bar graph的实现。虽然实现方法各异,效果不尽相同,但是总体来
- 前言使用面向对象编程思想完成学员管理系统的开发,具体如下:系统要求:使用面向对象的方法系统功能:添加学员、删除学员、修改学员信息、查询学员信
- 1.’%.2f’%f该方法会进行四舍五入代码如下所示:f = 2.3456789print('
- golang监听消息队列rabbitmq任务脚本,当rabbimq消息队列断开连接后自动重试,重新唤起协程执行任务需求背景:goalng常驻
- nilGo中,每个指针都有2个基本信息,指针的类型和指针的值(type,value);当执行==时,需要比较类型与值(只有类型与值都相等时,