Python中不同图表的数据可视化的实现
作者:海拥 发布时间:2021-02-08 00:58:54
标签:Python,图表,数据,可视化
数据可视化是以图形格式呈现数据。它通过以简单易懂的格式汇总和呈现大量数据,帮助人们理解数据的重要性,并有助于清晰有效地传达信息。
考虑这个给定的数据集,我们将为其绘制不同的图表:
用于分析和呈现数据的不同类型的图表
1.直方图
直方图表示特定现象发生的频率,这些现象位于特定的数值范围内,并以连续和固定的间隔排列。
在下面的代码中绘制直方图Age, Income, Sales
。因此,输出中的这些图显示了每个属性的每个唯一值的频率。
# 导入 pandas 和 matplotlib
import pandas as pd
import matplotlib.pyplot as plt
# 创建上面给出的表的二维数组
data = [['E001', 'M', 34, 123, 'Normal', 350],
['E002', 'F', 40, 114, 'Overweight', 450],
['E003', 'F', 37, 135, 'Obesity', 169],
['E004', 'M', 30, 139, 'Underweight', 189],
['E005', 'F', 44, 117, 'Underweight', 183],
['E006', 'M', 36, 121, 'Normal', 80],
['E007', 'M', 32, 133, 'Obesity', 166],
['E008', 'F', 26, 140, 'Normal', 120],
['E009', 'M', 32, 133, 'Normal', 75],
['E010', 'M', 36, 133, 'Underweight', 40] ]
# 使用上述数据数组创建的数据框
df = pd.DataFrame(data, columns = ['EMPID', 'Gender',
'Age', 'Sales',
'BMI', 'Income'] )
# 为数值数据创建直方图
df.hist()
# show plot
plt.show()
输出:
2. 柱形图
柱形图用于显示不同属性之间的比较,或者它可以显示项目随时间的比较。
# 此处使用之前代码的数据框
# 绘制数值条形图,将显示所有 3 个年龄、收入、销售额之间的比较
df.plot.bar()
# 在 2 个属性之间绘制
plt.bar(df['Age'], df['Sales'])
plt.xlabel("Age")
plt.ylabel("Sales")
plt.show()
输出:
3. 箱线图
箱线图是基于 minimum, first quartile, median, third quartile, and maximum
. 术语“箱线图”来自这样一个事实,即图形看起来像一个矩形,线条从顶部和底部延伸。由于延伸线,这种类型的图有时被称为盒须图。
# 对于数据框的每个数字属性
df.plot.box()
# 单个属性箱线图
plt.boxplot(df['Income'])
plt.show()
输出:
4、饼图
饼图显示一个静态数字以及类别如何代表整体的一部分。饼图以百分比表示数字,所有段的总和需要等于 100%。
plt.pie(df['Age'], labels = {"A", "B", "C",
"D", "E", "F",
"G", "H", "I", "J"},
autopct ='% 1.1f %%', shadow = True)
plt.show()
plt.pie(df['Income'], labels = {"A", "B", "C",
"D", "E", "F",
"G", "H", "I", "J"},
autopct ='% 1.1f %%', shadow = True)
plt.show()
plt.pie(df['Sales'], labels = {"A", "B", "C",
"D", "E", "F",
"G", "H", "I", "J"},
autopct ='% 1.1f %%', shadow = True)
plt.show()
输出:
5、散点图
散点图显示了两个不同变量之间的关系,它可以揭示分布趋势。当有许多不同的数据点,并且您想突出数据集中的相似性时,应该使用它。这在查找异常值和了解数据分布时很有用。
# 收入和年龄之间的散点图
plt.scatter(df['income'], df['age'])
plt.show()
# 收入和销售额之间的散点图
plt.scatter(df['income'], df['sales'])
plt.show()
# 销售额和年龄之间的散点图
plt.scatter(df['sales'], df['age'])
plt.show()
输出 :
来源:https://juejin.cn/post/7129345806313717768


猜你喜欢
- 输出用print加上字符串,就可以向屏幕上输出指定的文字。比如输出'hello, world',用代码实现如下:>&g
- 对方用<script language="javascript"> var location="&
- Python字典中的键是唯一的,但不同的键可以对应同样的值,比如说uid,可以是1001。id同样可以是1001。这样的话通过值来获取指定的
- 做项目的时候,一位同事导数据的时候,不小心把一个表中的数据全都搞重了,也就是说,这个表里所有的记录都有一条重复的。这个表的数据是千万级的,而
- 前言虽然本文讲的是Python,但其实它也适用于所有的编程语言。因为这里面蕴含着编程之魂。所以本文标题没有显著的使用Python关键词。当然
- 如下所示:在def __init__(self):函数里添加self.setFixedSize(self.width(), self.hei
- 本文实例分析了python对json的相关操作。分享给大家供大家参考,具体如下:什么是json:JSON(JavaScript Object
- 目录需求说明Do it需求说明如图,我想要实现当点击字母L,页面定位到L开头的城市名Do it1.找到字母表的页面在html标签绑定一个cl
- 前言一首歌热门了,参与评论的人也很多,这时无论好坏评论都来了,没有人控评得话,指不定乱七八糟但是自己有喜欢看评论,不想影响好心情,想看看精彩
- 具体内容如下所示:参考案例:import turtled=0for i in range(4): turtle.fd(200)
- 这几天要折腾mysql服务器,所以在网上搜罗了一些维护策略,然后自己总结实验,下面是我的总结经验和别人的一些建议。日志类型:MySQL有几个
- 本文实例讲述了PHP解析xml格式数据工具类。分享给大家供大家参考,具体如下:class ome_xml { /**
- 本次分享将讲述如何在Python中对多个list的对应元素求和,前提是每个list的长度一样。比如:a=[1,2,3], b=[2,3,4]
- 在我们关于SQL服务器安全系列的这文章里,我们的目标是向你提供安全安装SQL服务器所需要的工具和信心,这样的话,你有价值的数据就会受到保护,
- 本篇博客介绍如何使用Python调用百度地图WEB服务API获取地点对应坐标值,现有一系列结构化地址数据(如:北京市海淀区上地十街十号),目
- python3 读取串口数据 demo最近在写一个demo,zigbee串口连接树莓派,树莓派使用串口通信接受zigbee穿过来得值。其中我
- 都知道最近ChatGPT聊天机器人爆火,我也想方设法注册了账号,据说后面要收费了。ChatGPT是一种基于大语言模型的生成式AI,换句话说它
- 前段时间练习过的一个小项目,今天再看看,记录一下~项目结构说明:datefile文件夹:保存车辆信息表的xlsx文件file文件夹:保存图片
- 看一个网站其实就好比品评一个美女。一看长相,我们很多时候关注的是视觉,比如老板经常会说,你做几个页面让我看看!二看身材,也有很多关注标准和s
- python启用多线程后,调用exit出现无法退出的情况,原因是exit会抛出Systemexit的异常,如果在exit外围调用了try,就