对pandas的算术运算和数据对齐实例详解
作者:修炼之路 发布时间:2023-05-29 07:24:51
标签:pandas,算术,运算
pandas可以对不同索引的对象进行算术运算,如果存在不同的索引对,结果的索引就是该索引对的并集。
一、算术运算
a、series的加法运算
s1 = Series([1,2,3],index=["a","b","c"])
s2 = Series([4,5,6],index=["a","c","e"])
print(s1+s2)
'''
a 5.0
b NaN
c 8.0
e NaN
'''
sereis相加会自动进行数据对齐操作,在不重叠的索引处会使用NA(NaN)值进行填充,series进行算术运算的时候,不需要保证series的大小一致。
b、DataFrame的加法运算
d1 = np.arange(1,10).reshape(3,3)
dataFrame1 = DataFrame(d1,index=["a","b","c"],columns=["one","two","three"])
d2 = np.arange(1,10).reshape(3,3)
dataFrame2 = DataFrame(d2,index=["a","b","e"],columns=["one","two","four"])
print(dataFrame1+dataFrame2)
'''
four one three two
a NaN 2.0 NaN 4.0
b NaN 8.0 NaN 10.0
c NaN NaN NaN NaN
e NaN NaN NaN NaN
'''
dataFrame相加时,对齐操作需要行和列的索引都重叠的时候才回相加,否则会使用NA值进行填充。
二、指定填充值
s1 = Series([1,2,3],index=["a","b","c"])
s2 = Series([4,5,6],index=["a","c","e"])
print( s1.add(s2,fill_value=0))
'''
a 5.0
b 2.0
c 8.0
e 6.0
'''
需要注意的时候,使用add方法对两个series进行相加的时候,设置fill_value的值是对于不存在索引的series用指定值进行填充后再进行相加。除了加法add,还有sub减法,div除法,mul乘法,使用方式与add相同。DataFrame与series一样。
s1 = Series([1,2,3],index=["a","b","c"])
s2 = Series([4,5,6],index=["a","c","e"])
print(s2.reindex(["a","b","c","d"],fill_value=0))
'''
a 4
b 0
c 5
d 0
'''
s3 = s1 + s2
print(s3.reindex(["a","b","c","e"],fill_value=0))
'''
a 5.0
b NaN
c 8.0
e NaN
'''
使用reindex进行填充的时候,需要注意的是,不能对已经是值为NaN的进行重新赋值,只能对使用reindex之前不存在的所以使用指定的填充值,DataFrame也是一样的。
三、DataFrame与Series的混合运算
a、DataFrame的行进行广播
a = np.arange(9).reshape(3,3)
d = DataFrame(a,index=["a","b","c"],columns=["one","two","three"])
#取d的第一行为Series
s = d.ix[0]
print(d+s)
'''
one two three
a 0 2 4
b 3 5 7
c 6 8 10
'''
b、DataFrame的列进行广播
a = np.arange(9).reshape(3,3)
d = DataFrame(a,index=["a","b","c"],columns=["one","two","three"])
#取d的第一列为Series
s = d["one"]
print(d.add(s,axis=0))
'''
one two three
a 0 1 2
b 6 7 8
c 12 13 14
'''
对列进行广播的时候,必须要使用add方法,而且还要将axis设置为0,不然就会得到下面的结果
print(d.add(s))
'''
a b c one three two
a NaN NaN NaN NaN NaN NaN
b NaN NaN NaN NaN NaN NaN
c NaN NaN NaN NaN NaN NaN
'''
来源:https://blog.csdn.net/sinat_29957455/article/details/78989104


猜你喜欢
- 前言一直是想知道一条SQL语句是怎么被执行的,它执行的顺序是怎样的,然后查看总结各方资料,就有了下面这一篇文章了。这篇笔记主要记录mysql
- python 利用pywifi模块实现连接网络破解wifi密码实时监控网络,具体内容如下:import pywififrom pywifi
- 一、我的需求对于这样的一个 csv 表,需要将其(1)将营业部名称和日期和股票代码进行拼接(2)对于除了买入金额不同的的数据需要将它们的买入
- 前言大家好,我是辣条今天给大家带来几个实用的python脚本工具,原因不难猜这段时间我亲爱的女朋友呢给我整出点小花样,差点让我电脑GG了。我
- 密码已经是我们生活工作中必不可少的工具,但一个不安全的密码有又有可能会给我们造成不必要的损失。作为网站设计者,如果我们在网页中能对用户输入的
- 二值图像的凸壳指的是包围输入二值图像白色区域的最小的凸多边形的像素集合。skimage中的函数from skimage.morphology
- 前言Django中的中间件是一个轻量级、底层的插件系统,可以介入Django的请求和响应处理过程,修改Django的输入或输出。中间件的设计
- 本文实例为大家分享了python爬取微信公众号文章的具体代码,供大家参考,具体内容如下# -*- coding: utf-8 -*-impo
- 本篇不是教给大家如何去学习python,有需要详细深入学习的朋友可以参阅:Python基础语言学习笔记总结(精华)本文通过一周快速学习pyt
- 前面讲述了"专题一.函数的基础知识",而这篇文章讲述的Python的条件语句和循环语句的基础知识.主要内容包括:1.条件
- 目标:爬取自己账号中购买的课程视频。一、实现登录账号这里采用的是手动输入验证码的方式,有能力的盆友也可以通过图像识别的方式自动填写验证码。登
- 任务:用python时间简单的统计任务-统计男性和女性分别有多少人。用到的物料:xlrd 它的作用-读取excel表数据代码:import
- 改变图像中物体对象(像素)之间的空间关系。平移# 定义平移矩阵,需要是numpy的float32类型# x轴平移50,y轴平移80, 2*3
- 本文实例讲述了Symfony2实现从数据库获取数据的方法。分享给大家供大家参考,具体如下:假设有一张表:test, 字段:name,colo
- 首先,需要简单的了解一下爬虫,尽可能简单快速的上手,其次,需要了解的是百度的API的接口,搞定这个之后,最后,按照官方给出的demo,然后写
- 前言学完语法和正在学习语法的时候,我们可以在空闲的时候,写几个简单的小项目,今天我们就用最基础的语法看两个实战语法练习猜数字游戏项目游戏说明
- 导言:到目前为止,我们的教程围绕的是text数据。然而,很多应用程序既需要处理text数据,也需要处理二进制数据。比如招聘网站可能需要用户上
- 一、条件变量与互斥锁条件变量是基于互斥锁的,它必须基于互斥锁才能发挥作用;条件变量并不是用来保护临界区和共享资源的,它是用来协调想要访问共享
- 一、缺失数据剔除1. python 方式获取所有的缺失值,返回一个 true 和 false 的表df.isnull()统计缺失值,按照每一
- pip install *** :Cannot connect to proxy在使用pip install 安装任何新的包都会出现下面错误