Seaborn数据分析NBA球员信息数据集
作者:ZacheryZHANG 发布时间:2021-06-27 03:36:04
标签:Seaborn,数据分析,数据处理
本案例使用 Jupyter Notebook进行案例演示,数据集为NBA球员信息数据集。本项目将进行完整的数据分析演示。
1. 数据介绍
数据集共有342个球员样本,38个特征,即342行×38列。
数据集主要信息如下表所示:
球员姓名 | 位置 | 身高 | 体重 | 年龄 | 球龄 | 上场次数 | 场均时间 | 进攻能力 | 防守能力 | 是否入选过全明星 | 球员薪金 |
---|
本数据集主要可以用来做数据处理以及数据挖掘,进行数据可视化。
本小结,我们将对NBA球员数据集进行初步统计学分析,并且绘制出相关性热力图。
2. 案例演示
2.1 获取数据
导入相关库,并使用如下代码进行本地数据集获取。
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
# 获取数据集
NBA = pd.read_csv("nba_2017_nba_players_with_salary.csv")
NBA.head()
运行结果:
2.2 查看数据基本信息
先进行简单的统计学分析,查看标准差、中位数、方差等等信息。
# 看一下数据有多少
NBA.shape
# 查看基本统计信息
NBA.describe()
部分运行结果:
2.3 数据分析
2.3.1 效率值相关性分析
在众多数据中,有一项名为RPM,表示球员的效率值。该数据反映球员在场时对球队比赛获胜的贡献大小,最能反映球员的综合实力。我们可以看一下它与其他数据的相关性。
首先,我们取出几个有用的特征分析相关性,并绘制热力图。
# 2. 数据分析
## 2.1 效率值相关性分析
NBA_1 = NBA.loc[:, ['RPM','AGE','SALARY_MILLIONS','ORB','DRB','TRB','AST','AST','STL','BLK','TOV','PF','POINTS','GP','MPG','ORPM','DRPM']]
NBA_1.head()
然后,使用如下代码计算出相关性表。
# 计算相关性
# 获取两列之间的相关性
corr = NBA_1.corr()
corr
部分运行结果如下图所示:
最后,使用刚才的相关性表,绘制出相关性关系热力图
# 调用热力图绘制相关性关系
plt.figure(figsize=(20,20),dpi=120)
sns.heatmap(corr, square=True, linewidths=0.1, annot=True)
# 保存图像
plt.savefig("./test.png")
# 颜色越深:相关性越弱
# 颜色越浅:相关性越强
运行结果如下图所示:
来源:https://juejin.cn/post/7148044291972005919
0
投稿
猜你喜欢
- 一、插补查找算法插补查找算法又称为插值查找,它是折半查找算法的改进版。插补查找是按照数据的分布,利用公式预测键值所在的位置,快速缩小键值所在
- 图片人脸检测#coding=utf-8import cv2import dlibpath = "img/meinv.png&quo
- 首先要注册一个账号密码,通过账号密码登录,并且滑块验证,自动输入搜索关键词,进行跳转翻页爬取数据,并保存到Excel文件中。代码运行时,滑块
- 本文实例讲述了python时间日期操作方法。分享给大家供大家参考,具体如下:#coding=utf-8import timeimport d
- 本文介绍使用ADODB.Stream组件来下载服务器文件,例如:download.asp?file=相对路径的文件。就可以把这个文件下载下来
- 1、subprocess这个模块来产生子进程,并且可以连接到子进程的标准输入、输出、错误中,还可以获得子进程的返回值。2、subproces
- python读取Excel表格文件,例如获取这个文件的数据python读取Excel表格文件,需要如下步骤:1、安装Excel读取数据的库-
- 很多朋友都有过制作网页的经历,如今,众多网页的设计都用到了表格。这样不仅有利于网页的维护,同时,提高了网页的观赏性。在众多网页制作风格中,细
- TihuanWords.txt文档格式注意:同一行的词用单个空格隔开,每行第一个词为同行词的替换词。年休假 年假 年休究竟 到底回家场景 我
- 今天在看框架的时候无意间看到了document.compatMode,经过一番资料查找,终于搞懂了。文档模式在开发中貌似很少用到,最常见的是
- 最近,W3C的一项公告称,在W3C与XHTML2的合同于今年年底到期后将不会续签。这意味着W3C停止了对XHTML2的开发,转而大力支持HT
- 摘要:现代网站和web应用程序趋向于依赖客户端的大量的javascript来提供丰富的交互。特别是通过不刷新页面的异步请求来返回数据或从服务
- 今天网页调试的时候在线订单出现错误:Server 对象 错误 'ASP 0178
- python 打开浏览器,可以做简单的刷网页的小程序。仅供学习,别用非法用途。python的webbrowser模块支持对浏览器进行一些操作
- 前言每种编程语言为了表现出色,并且实现卓越的性能,都需要有大量编译器级与解释器级的优化。由于字符串是任何编程语言中不可或缺的一个部分,因此,
- -------------- 函数检索 --------------trim函数: trim() lTrim() rTrim()校验字符串是
- <script>var d = '2013-07-21';var nd = d.replace(new RegE
- 前言作为一个pythoner ,包的安装时必须懂的,这个语言跟matlab很类似,开源、共享,只要你有好的方法,都可以作为一个库,供大家下载
- <%@LANGUAGE="VBSCRIPT" CODEPAGE="936"%>
- 一、在CentOS上安装Python31.下载Python3.10源代码文件下载地址:https://www.python.org/down