对Python 2.7 pandas 中的read_excel详解
作者:G_66_hero 发布时间:2023-09-10 04:14:49
标签:pandas,read,excel,Python,2.7
导入pandas模块:
import pandas as pd
使用import读入pandas模块,并且为了方便使用其缩写pd指代。
读入待处理的excel文件:
df = pd.read_excel('log.xls')
通过使用read_excel函数读入excel文件,后面需要替换成excel文件所在的路径。读入之后变为pandas的DataFrame对象。DataFrame是一个面向列(column-oriented)的二维表结构,且含有列表和行标,对excel文件的操作就转换为对DataFrame操作。另外,如果一个excel含有多个表,如果你只想读入其中一个可以:
df = pd.read_excel('log.xls', sheetname=1)
增加了一个参数sheetname,表示的是第几个表,从0开始计数。我上面设置的是1,也就是第二个表。
读入之后,可以先查看表头信息和每一列的数据类型:
df.dtypes
输出如下:
Member object
Unnamed: 1 float64
Unnamed: 2 float64
Unnamed: 3 float64
Unnamed: 4 float64
Unnamed: 5 float64
家内外活动类型 object
Unnamed: 7 object
activity object
dtype: object
提取每个member连续出现的最后一行数据:
new_df = df.drop_duplicates(subset='Member', keep='last')
以上语句的意思是根据Member字段去除掉多余的行,并且保留相同行的最后一行数据。这些就得到了每一个member最后一行的数据了,返回了经过筛选后的DataFrame。
接下来需要将处理后的结果,保存为excel文件:
out = pd.ExcelWriter('output.xls')
new_df.to_excel(out)
out.save()
output.xls是你要保存的文件名,可以任取;然后将DataFrame的内容保存到该文件,最后保存该文件到系统的磁盘上。
接下来,你就可以在当前目录看到一个新的文件,可以直接使用excel打开查看。
Pandas还提供了很多的API,可以根据具体的任务,查找API文档,找到合适的函数来完成任务。
附:一个完整的示例
#coding=utf-8
import pandas as pd
# 读入excel文件中的第2个表
df = pd.read_excel('log.xls', sheetname=1)
# 查看表的数据类型
print df.dtypes
# 查看Member列的数据
print df['Member']
'''
# 新建一列,每一行的值是Member列和activity列相同行值的和
for i in df.index:
df['activity_2'][i] = df['Member'][i] + df['activity'][i]
'''
# 根据Member字段去除掉多余的行,并且保留相同行的最后一行数据
new_df = df.drop_duplicates(subset='Member', keep='last')
# 导出结果
out = pd.ExcelWriter('output.xls')
new_df.to_excel(out)
out.save()
来源:https://blog.csdn.net/G_66_hero/article/details/71730651


猜你喜欢
- 本文实例讲述了Python操作Oracle数据库的简单方法和封装类。分享给大家供大家参考,具体如下:最近工作有接触到Oracle,发现很多地
- 一、前言使用过Python的同学们一定被她的各种编码问题缠绕过,因为平常维护的新老项目跨越 2、3两个版本,编码问题有时更是让我苦不堪言,遂
- 用新云还不是很熟,一点点学习中。今天遇到一个文章列表前有小圆点的问题,把去除方法记一下。文章列表前有小圆点有这么几种情况:1、li的默认样式
- MaxPooling1D和GlobalMaxPooling1D区别import tensorflow as tffrom tensorflo
- 前言最近有个项目需求就是在客户端的右上角要实时展示提醒消息,下面来看下简单的实现步骤一、Notification这是基于悬浮出现在页面角落,
- 1 图1第一个图是蚊香,感兴趣的小伙伴可以自己尝试在python中用turtle库绘制一下。具体代码如下:#画蚊香import turtle
- 在通过requests.post()进行POST请求时,传入报文的参数有两个,一个是data,一个是json。data与json既可以是st
- 摘要:发现给div绑定keyup.enter事件是没有效果的。那该如何实现呢?下面直接上代码吧1、在template中代码2、在create
- openpyxl模块离线安装背景:公司的防火墙限制,无法使用pip在线安装,开墙的审批流程较为繁琐,故采取离线安装的方式。步骤如下:1、官网
- 1. 无索引、索引失效导致慢查询如果在一张几千万数据的表中以一个没有索引的列作为查询条件,大部分情况下查询会非常耗时,这种查询毫无疑问是一个
- #coding=gbkfrom xml.dom import minidom,Nodeimport urllib2,re,osdef rea
- 在一些特殊的业务场景中,我们需要一次性提取一张图片中的色卡信息,并且需要使用十六进制的颜色表示方法进行展示。今天得空做了一个小工具,用来自定
- SQL Server数据库用视图来处理复杂的数据查询关系是本文我们主要要介绍的内容,该内容是这样想到的:在辅助教务系统那块的时候,我做的一个
- 0.摘要本文介绍了生成连续和随机字母表的方法,用于快速生成大量字母数据。主要使用chr()函数,将数字通过ASCII表转换为相应字母。1.c
- LOAD DATA INFILE '文件地址' INTO TABLE 表名 FIELDS TERMINATED BY
- 使用MySQLdb连接数据库执行sql语句时,有以下几种传递参数的方法。1.不传递参数conn = MySQLdb.connect(user
- 1、执行cmd指令,在cmd输出的内容会直接在控制台输出,返回结果为0表示执行成功。2、在调用完shell脚本后,返回一个16位的二进制数,
- 前言网络摄像头的视频流解析直接使用通过http的Mjpeg是具有边界帧信息的multipart / x-mixed-replace,而jpe
- 为了更好的理解邮件发送功能的实现,要先了解邮件发送系统的大致流程。首先 电子邮件之间的相互发送接受就像 邮局邮件发送
- 本文实例讲述了PHP使用JpGraph绘制折线图操作。分享给大家供大家参考,具体如下:下载jpgraph类库,使用的是src目录下的类文件。