python 使用openpyxl读取excel数据
作者:miki的测试笔记 发布时间:2021-02-10 07:32:10
目录
openpyxl介绍
openpyxl安装
openpyxl基本概念
openpyxl对excel进行操作
新建excel
打开已存在的文件
读取单个单元格
读取多个单元格
其他相关操作
openpyxl封装
openpyxl介绍
openpyxl是一个开源项目,它是一个用于读取/写入Excel 2010文档(如xlsx 、xlsm 、xltx 、xltm文件 )的Python库,如果要处理更早格式的Excel文档(xls),需要用到其它库(如:xlrd、xlwt等),这是openpyxl比较其他模块的不足之处。openpyxl是一款比较综合的工具,不仅能够同时读取和修改Excel文档,而且可以对Excel文件内单元格进行详细设置,包括单元格样式等内容,甚至还支持图表插入、打印设置等内容。
python中与excel操作相关的模块:
📔 xlrd库:从excel中读取数据,支持xls、xlsx格式
📔 xlwt库:对excel进行修改操作,但不支持对xlsx格式的修改
📔 xlutils库:在xlwt和xlrd中,对一个已存在文件进行修改
📘 openpyxl库:主要针对xlsx格式的excel进行读取和编辑
openpyxl安装
pip install openpyxl
openpyxl基本概念
WorkBook:工作簿对象
Sheet:表单对象
Cell:表格对象
也就是我们使用excel时可以看到的三个对象,我们操作excel的步骤是打开工作簿,选中表单,对单元格进行操作,而openpyxl的工作原理也是如此。
openpyxl对excel进行操作
新建excel
import openpyxl
# 创建一个工作簿
workbook = openpyxl.Workbook()
# 创建一个表单
sheet = workbook.create_sheet('表单1')
# 写入一个数据
sheet.cell(row=1, column=1, value="python")
# 保存
workbook.save('test.xlsx')
🎈 注意点:如果保存的文件名已存在,将会覆盖原来的文件
打开已存在的文件
打开已存在的文件:load_workbook()
获取表单:workbook['表单名']
读取指定表格:cell(row, column).value
import openpyxl
# 打开工作簿
workbook = openpyxl.load_workbook('test.xlsx')
# 获取表单
sheet = workbook['表单1']
# 读取指定的单元格数据
cell = sheet.cell(row=1, column=1).value
print(cell)
运行结果:
C:\software\python\python.exe D:/learn/python24/python_base/test.py
python
Process finished with exit code 0
读取单个单元格
# 方式一:读取A6单元格的值
cell1 = sheet['A6'].value
# 方式二:读取第3行,第4列单元格的值
cell2 = sheet.cell(row=3, column=4).value
读取多个单元格
# 方式一:读取A6单元格的值
cell1 = sheet['A6'].value
# 方式二:读取第3行,第4列单元格的值
cell2 = sheet.cell(row=3, column=4).value
读取多个单元格时,都是以元组的形式返回
其他相关操作
关键代码 | 相关描述 |
---|---|
cell(row, column, value) | 写入数据,三个参数分别是行,列,值 |
cell(row, column).value | 获取指定单元格的值,两个参数分别是行,列 |
workbook.remove('表单名') | 删除表单 |
del workbook['表单名'] | 删除表单 |
workbook.save('文件名') | 保存工作簿 |
sheet.max_row | 获取表单数据的总行数 |
sheet.max_column | 获取表单数据的总列数 |
sheet.rows | 获取按行所有的数据 |
sheet.columns | 获取按列所有的数据 |
🎈 注意点:
openpyxl中列和行的起始标识都是1,不是从0开始
从excel中读取出来的数据只有两种类型,即数值类型和字符串类型
不要随便在表格中敲空格,会影响判断最大行数和最大列数
运行操作excel的代码时,要先关闭在操作系统中打开的相关excel表,否则可能会无法读取/写入数据
写入数据时要执行保存
import openpyxl
# 打开工作簿
wb = openpyxl.load_workbook('test.xlsx')
# 获取表单
sh = wb['表单1']
# 读取指定的单元格数据
res1 = sh.cell(row=1, column=1).value
print(res1)
# 获取最大行数
print(sh.max_row)
# 获取最大列数
print(sh.max_column)
# 按列读取所有数据,每一列的单元格放入一个元组中
print(sh.columns) # 直接打印,打印结果是一个可迭代对象,我们可以转换成列表来查看
# 按行读取所有数据,每一行的单元格放入一个元组中
rows = sh.rows
# print(list(rows)) # 转换成列表之后打印结果为具体的单元格,如下
# [(<Cell '表单1'.A1>, <Cell '表单1'.B1>, <Cell '表单1'.C1>, <Cell '表单1'.D1>, <Cell '表单1'.E1>, <Cell '表单1'.F1>, <Cell '表单1'.G1>),
# (<Cell '表单1'.A2>, <Cell '表单1'.B2>, <Cell '表单1'.C2>, <Cell '表单1'.D2>, <Cell '表单1'.E2>, <Cell '表单1'.F2>, <Cell '表单1'.G2>),
# (<Cell '表单1'.A3>, <Cell '表单1'.B3>, <Cell '表单1'.C3>, <Cell '表单1'.D3>, <Cell '表单1'.E3>, <Cell '表单1'.F3>, <Cell '表单1'.G3>)]
# 我们可以通过for循环以及value来查看单元格的值
for row in list(rows): # 遍历每行数据
case = [] # 用于存放一行数据
for c in row: # 把每行的每个单元格的值取出来,存放到case里
case.append(c.value)
print(case)
运行结果:
C:\software\python\python.exe D:/learn/python24/python_base/test.py
case_id
3
7
<generator object Worksheet._cells_by_col at 0x0000012FEF90D8B8>
['case_id', 'interface', 'title', 'method', 'url', 'data', 'expected']
[1, 'login', '登录成功', 'post', '/member/login', '{"mobile_phone":"15692004245","pwd":"miki12345"}', "{'code': 0, 'msg': 'OK'}"]
[2, 'login', '登录失败-手机号为空', 'post', '/member/login', '{"mobile_phone":"","pwd":"miki12345"}', "{'code': 2, 'msg': '手机号码为空'}"]
excel表中的原数据如下图:
openpyxl封装
在测试过程中,我们会经常需要访问excel读取测试数据,如果毎访问一次我们就调用一次openpyxl,进行打开excel,选取表单,读取数据等操作,将会增加我们的工作量和代码量。凡是需要重复使用的,我们都可以对它进行二次封装,写成我们自己的版本,还可以在封装过程中加入我们想要的内容,使用的时候直接调用即可。
在封装openpyxl时,读取excel时我写了两种实现方法,第一种是读取数据后,把每条测试数据的键值保存到一个字典中,再把字典存到一个列表,这种方式比较容易理解,但是调用的时候需要多敲几个括号或者引号;第二种是把每条测试数据的键值存到一个实例对象的属性中,再把每个实例存到一个列表。实际上他们的作用是一样,只是第二种方式调用时更简单。
# read_excel.py
import openpyxl
class CasesData:
"""用于保存测试用例数据"""
pass
class ReadExcel:
def __init__(self, file_name, sheet_name):
self.file_name = file_name
self.sheet_name = sheet_name
def open(self):
self.wb = openpyxl.load_workbook(self.file_name)
self.sh = self.wb[self.sheet_name]
def close(self):
self.wb.close()
def read_data(self):
"""按行读取数据,最后返回一个存储字典的列表"""
self.open()
rows = list(self.sh.rows)
titles = []
for t in rows[0]:
title = t.value
titles.append(title)
cases = []
for row in rows[1:]:
case = []
for r in row:
case.append(r.value)
cases.append(dict(zip(titles, case))) # 通过zip聚合打包用例的标题和数据
self.close()
return cases
def read_data_obj(self):
"""按行读取数据,最后返回的是一个存储实例对象的列表"""
self.open()
rows = list(self.sh.rows)
titles = []
for t in rows[0]:
title = t.value
titles.append(title)
cases = []
for row in rows[1:]:
case_obj = CasesData() # 创建一个对象用来保存该行用例数据
case = []
for r in row:
case.append(r.value)
case_info = dict(zip(titles, case))
for k, v in case_info.items():
setattr(case_obj, k, v)
cases.append(case_obj)
self.close()
return cases
def write_data(self, row, column, msg):
self.open()
self.sh.cell(row=row, column=column, value=msg)
self.wb.save(self.file_name)
self.close()
if __name__ == '__main__':
# 直接运行本文件时执行,下面是一个应用实例
# 需要读取excel时直接调用ReadExcel类
test = ReadExcel('cases.xlsx', 'login')
res = test.read_data_obj()# 最后返回的是一个存储实例对象的列表
print(res[0].case_id)# 打印第1个用例的case_id
print(res[3].title)# 打印第4个用例的title
test2 = ReadExcel('cases.xlsx', 'login')
res2 = test2.read_data()# 最后返回一个存储字典的列表
print(res2[0]['case_id'])# 打印第1个用例的case_id
print(res2[3]['title'])# 打印第4个用例的title
上面封装的openpyxl中,应用实例的excel表结构如下:
来源:https://www.cnblogs.com/miki-peng/p/12904383.html#4676720


猜你喜欢
- js运行效果,含公历农历,生肖及节日的javascript日历代码:<html><head><meta htt
- 本文实例讲述了Python3实现获取图片文字里中文的方法。分享给大家供大家参考,具体如下:一、运行环境(1) win10(2) pychar
- 在中文分词中,jiebe库是最为常见的,主要的原因还是它独特的支持分词模式如:精确模式、全模式、搜索引擎模式。也对应着三种方式,包括jieb
- 为了得到更好的网络,学习率通常是要调整的,即刚开始用较大的学习率来加快网络的训练,之后为了提高精确度,需要将学习率调低一点。如图所示,步长(
- 今天微软正式发布上SQL Server 2016 SP1,根据以往的SP1定律,可以在生产环境上使用了。打了SP1的标准版将具有企业版几乎所
- 通常python安装包都会被默认装在/usr/local/pythonx/lib/site-packages(linux),但是我们有时想自
- 本文实例为大家分享了pygame实现弹力球及其变速效果的具体代码,供大家参考,具体内容如下期望:1.球体接触到框体后反弹2.设置速度按键,按
- <?php $search = array ("'<script[^>]*?>.*?</sc
- django 处理上传图片生成缩略图首先要注意form标签上必须有enctype="multipart/form-data&quo
- 尽管某些书籍上总是说避免使用全局变量,但是在实际的需求不断变化中,往往定义一个全局变量是最可靠的方法,但是又必须要避免变量名覆盖。Pytho
- ACCESS数据库中Field对象的caption属性(也就是标题)是用来设置数据字段的标题,在正常的数据库设计中为了保持维护的便利性,许多
- 由于服务器无法上网,不得不采用离线方式安装。IDE=pycharm-community-2019.2.3,python=3.5.4。1 安装
- 我们在用Python进行机器学习建模项目的时候,每个人都会有自己的一套项目文件管理的习惯,我自己也有一套方法,是自己曾经踩过的坑总结出来的,
- 这篇文章主要介绍了python读取ini配置文件过程示范,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的
- 一、共享变量共享变量:当多个线程访问同一个变量的时候。会产生共享变量的问题。例子:import threadingsum = 0loopSu
- 根本原因:python定义函数时,一般都会有指定返回值,如果没有显式指定返回值,那么python就会默认返回值为None我们输入的代码如下:
- Python函数的定义定义函数,也就是创建一个函数,可以理解为创建一个具有某些用途的工具。定义函数需要用 def 关键字实现,具体的语法格式
- go module 是Go1.11版本之后官方推出的版本管理工具,并且从 Go1.13 版本开始, go module
- 项目地址:https://github.com/chen0495/pythonCrawlerForJSU环境python 3.5即以上req
- 本例程使用urlib实现的,基于python2.7版本,采用beautifulsoup进行网页分析,没有第三方库的应该安装上之后才能运行,我