Python pandas之求和运算和非空值个数统计
作者:不思量自难忘 发布时间:2023-11-19 03:04:59
准备工作
本文用到的表格内容如下:
先来看一下原始情形:
import pandas as pd
df = pd.read_excel(r'C:\Users\admin\Desktop\测试.xlsx')
print(df)
result:
分类 货品 实体店销售量 线上销售量 成本 售价
0 水果 苹果 34 234 12 45
1 家电 电视机 56 784 34 156
2 家电 冰箱 78 345 24 785
3 书籍 python从入门到放弃 25 34 13 89
4 水果 葡萄 789 56 7 398
1.非空值计数
非空值计数就是计算某一个去榆中非空数值的个数
1.1对全表进行操作
1.1.1求取每列的非空值个数
df = pd.read_excel(r'C:\Users\admin\Desktop\测试.xlsx')
print(df.count())
result:
分类 5
货品 5
实体店销售量 5
线上销售量 5
成本 5
售价 5
dtype: int64
1.1.2 求取每行的非空值个数
df = pd.read_excel(r'C:\Users\admin\Desktop\测试.xlsx')
print(df.count(axis=1))
result:
0 6
1 6
2 6
3 6
4 6
dtype: int64
1.2 对单独的一行或者一列进行操作
1.2.1 求取单独某一列的非空值个数
df = pd.read_excel(r'C:\Users\admin\Desktop\测试.xlsx')
print(df['分类'].count())
result:
5
1.2.2 求取单独某一行的非空值个数
df = pd.read_excel(r'C:\Users\admin\Desktop\测试.xlsx')
print(df.iloc[0].count())
result:
6
1.3 对多行或者多列进行操作
1.3.1 求取多列的非空值个数
df = pd.read_excel(r'C:\Users\admin\Desktop\测试.xlsx')
print(df[["分类", "货品"]].count())
result:
分类 5
货品 5
dtype: int64
1.3.2 求取多行的非空值个数
df = pd.read_excel(r'C:\Users\admin\Desktop\测试.xlsx')
print(df.iloc[[0, 1]].count())
result:
分类 2
货品 2
实体店销售量 2
线上销售量 2
成本 2
售价 2
dtype: int64
2 sum求和
2.1对全表进行操作
2.1.1对每一列进行求和
df = pd.read_excel(r'C:\Users\admin\Desktop\测试.xlsx')
print(df.sum())
result:
分类 水果家电家电书籍水果
货品 苹果电视机冰箱python从入门到放弃葡萄
实体店销售量 982
线上销售量 1453
成本 90
售价 1473
dtype: object
可以看到,字符串类型的求和直接是字符串拼接,数字类型就正常的数学运算
2.1.2 对每一行进行求和
df = pd.read_excel(r'C:\Users\admin\Desktop\测试.xlsx')
print(df.sum(axis=1))
result:
0 325
1 1030
2 1232
3 161
4 1250
dtype: int64
先看运行结果,我们可以看到,每一行求和的时候直接忽略文本字符类型,只对数字类型进行求和。就比如第一行的数据
分类 货品 实体店销售量 线上销售量 成本 售价
0 水果 苹果 34 234 12 45
上面的325=34+234+12+45,,其他的行也是如此
2.2 对单独的一行或者一列进行操作
2.2.1 对某一列进行求和
df = pd.read_excel(r'C:\Users\admin\Desktop\测试.xlsx')
print(df['实体店销售量'].sum())
result:
982
2.2.2 对某一行进行求和
df = pd.read_excel(r'C:\Users\admin\Desktop\测试.xlsx')
print(df.iloc[[0]].sum())
result:
分类 水果
货品 苹果
实体店销售量 34
线上销售量 234
成本 12
售价 45
dtype: object
当然,单独一行去求和似乎没卵用
2.3 对多行或者多列进行操作
2.3.1 对多列进行求和
df = pd.read_excel(r'C:\Users\admin\Desktop\测试.xlsx')
print(df[['实体店销售量', "线上销售量"]].sum())
result:
实体店销售量 982
线上销售量 1453
dtype: int64
2.3.2 对多行进行求和
df = pd.read_excel(r'C:\Users\admin\Desktop\测试.xlsx')
print(df.iloc[[0, 1]].sum())
result:
分类 水果家电
货品 苹果电视机
实体店销售量 90
线上销售量 1018
成本 46
售价 201
dtype: object
来源:https://juejin.cn/post/6991271671123017736


猜你喜欢
- 数据迁移需要从mysql导入clickhouse, 总结方案如下,包括clickhouse自身支持的三种方式,第三方工具两种。create
- function is_utf8($string) { &n
- 浅谈NumPy中的维度AxisNumPy中的维度是一个很重要的概念,很多函数的参数都需要给定维度Axis,如何直观的理解维度呢?我们首先以二
- 正常的页面跳转的api大家应该都清楚,但是涉及到多页面来回跳转以及返回到导航页的时候就需要一些技巧来进行处理,之前找了挺多文章也没有很详细的
- 1) 创建配置文件和帐户 (创建一个配置文件和配置数据库邮件向导,用以访问配置数据库邮件管理节点中的数据库邮件节点及其上下文菜单中使用的帐户
- django中form表单设置action后,点提交按钮是跳转到action页面的,比如设置action为login,网址为192.168.
- 正则中有分组这个功能,在golang中也可以使用命名分组。一次匹配的情况场景还原如下:有一行文本,格式为:姓名 年龄 邮箱地址请将其转换为一
- Python2默认是不支持中文的,一般我们在程序的开头加上#-*-coding:utf-8-*-来解决这个问题,但是在我用open()方法打
- 一、介绍我们在项目的开发过程中应该会遇到这样的问题:我们的项目读取某个配置文件,然后才能按照配置的信息正常运行服务,当我们需要对修改服务的某
- 这是 COMSHARP CMS 团队翻译的2009年海外Web设计风潮的第二部分,着重讲解了反 Box 式布局,单页布局,多栏布局,巨型插图
- phpinfo() 功能描述:输出 PHP 环境信息以及相关的模块、WEB 环境等信息。 危险等级:中 passthru() 功能描述:允许
- 本文实例讲述了python迭代器常见用法。分享给大家供大家参考,具体如下:迭代器迭代是访问集合元素的一种方式。迭代器是一个可以记住遍历的位置
- 本文实例为大家分享了python放大图片和画方格的具体代码,供大家参考,具体内容如下1、Python 放大图片和画方格算法#!C:/Pyth
- 前言近来chatGPT挺火的,也试玩了一下,确实挺有意思。这里记录一下在Python中如何去使用chatGPT。本篇文章的实现100%基于
- import shutil高级的文件,文件夹,压缩包的处理模块,也主要用于文件的拷贝shutil.copyfileobj(fsrc,fdst
- 0. 学习目标栈和队列是在程序设计中常见的数据类型,从数据结构的角度来讲,栈和队列也是线性表,是操作受限的线性表,它们的基本操作是线性表操作
- MySQL 非空约束(NOT NULL)指字段的值不能为空。对于使用了非空约束的字段,如果用户在添加数据时没有指定值,数据库系统就会报错。可
- 1. 用Dreamweaver 4.0制作闪动的Flash按钮选择菜单Insert→Interactive Images→Flash But
- 一、概述一个gRPC服务的大体结构图为:图一表明,grpc的服务是跨语言的,但需要遵循相同的协议(proto)。相比于REST服务,gPRC
- 相比于range,list等简易单词,enumerate仅凭外形都不太让人愿意用。事实上,enumerate还是很好用的。enumerate