Python Excel vlookup函数实现过程解析
作者:wztshine 发布时间:2022-05-24 06:12:07
标签:Python,Excel,vlookup,函数
用法:注意是用英文的逗号",",且之间没有空格。
文件名,[工作表名称,不写则默认当前激活的表],[从第几行开始,不写则默认第二行,因为很多表第一行是title],列名(第一列是要查找的元素,列名可以不连续,比如“ade”)
脚本会自动把要查找的第一列进行大小写变换,去除空格等操作,下面的例子中,第一列的名字有的是大写,有的小写,前后还有空格,脚本会默认它们相同
现有Sheet1,内容如下
Sheet2内容如下
想把 Sheet1 的 B,C 列的信息复制到 Sheet2 的 B,C列上,执行脚本:
Source fileName,[sheetName],[row],columns:
vlookup.xlsx,Sheet1,1,abc
Target fileName,[sheetName],[row],columns:
vlookup.xlsx,Sheet2,1,abc
{'name': ['Lao Wang', 'Zhang San'], 'age': [23, 25], 'id': [23429234, None], 'phone': ['18292942422', '1000101010'], 'addr': ['BeiJIng', None]}
{'addr': [None, None], 'phone': [None, None], 'id': [None, None], 'age': [None, None], 'name': [None, None]}
Processing...
Done.
然后Sheet2的内容就变成了:
import openpyxl
def read_Excel(path,sheetName,row,*col):
# 默认从第二行开始,因为很多表都有表头
if row == '':
row = 2
else:
row = int(row)
workbook = openpyxl.load_workbook(path)
# 默认打开当前激活的工作表
if sheetName == "":
sheet0 = workbook.active # 获取当前激活的工作表
else:
sheet0 = workbook[sheetName] # 如果制定了工作表,就打开指定的工作表
highest = sheet0.max_row
case_list = {}
# title 所在列,对比的那一列,假设A列
title = col[0]
for i in range(row,highest+1): # 遍历行
value_list = []
if sheet0[title+str(i)].value == None: # 如果A5是空的,pass
pass
else:
v1 = sheet0[title+str(i)].value.lower().strip() # 忽略大小写和前后空格
# 除去 title的其他列
for j in range(1,len(col)):
v2 = sheet0[col[j]+str(i)].value
value_list.append(v2)
case_list[v1] = value_list
print(case_list)
return case_list
def write_Excel(dict,path,sheetName,row,*col):
# 将处理好的数据再次写入excel
if row == "":
row = 2
else:
row = int(row)
workbook = openpyxl.load_workbook(path)
if sheetName == "":
sheet0 = workbook.active # 获取当前激活的工作表
else:
sheet0 = workbook[sheetName]
highest = sheet0.max_row
# case title 所在列
title = col[0]
for i in range(row,highest+1):
if sheet0[title + str(i)].value != None:
v1 = sheet0[title + str(i)].value.lower().strip() # 忽略大小写和前后空格
for key in dict:
if key == v1:
for j in range(1,len(col)):
v2 = sheet0[col[j]+str(i)]
v2.value = dict[key][j-1]
workbook.save(path)
def process(r1,r2):
# 对比处理两次读取的内容,然后更新r2的内容
print('Processing...')
for key in r1:
if key in r2:
length = len(r1[key])
if length > 0:
for i in range(0, len(r1[key])):
# 如果想要不想覆盖原有的数值,可以取消注释,然后删除下面那行
# if r2[key][i] == None:
# r2[key][i] = r1[key][i]
r2[key][i] = r1[key][i]
else:
pass
return r2
def manual():
info1 = input('Read from fileName,[sheetName],[row],columns:\n')
file1,sheetName1,row1,list1 = info1.split(',')
info2 = input('Write into fileName,[sheetName],[row],columns:\n')
file2,sheetName2,row2,list2 = info2.split(',')
r1 = read_Excel(file1,sheetName1,row1,*list1)
r2 = read_Excel(file2,sheetName2,row2,*list2)
r3 = process(r1,r2)
write_Excel(r3,file2,sheetName2,row2,*list2)
print('Done.')
if __name__ == "__main__":
manual()
来源:https://www.cnblogs.com/wztshine/p/13168235.html
0
投稿
猜你喜欢
- 本文实例讲述了Django框架登录加上验证码校验实现验证功能。分享给大家供大家参考,具体如下:验证码生成函数pip install Pill
- url标记为变量通过把 URL 的一部分标记为 <variable_name> 就可以在 URL 中添加变量。标记的 部分会作为
- 正常使用了go 1.8一段时间没有发现异常,为了发布便捷,以及后期引入plug-in,开始将大项目分解。涉及到通过vendor引入私有库保存
- 我就废话不多说了,还是直接看代码吧def c(a,b): c=a**2+b**2 return ("the right trian
- 背景 background css 说明 background-image:url(&q
- 最近有需求是,需要把对方提供的ftp地址上的图片获取到本地服务器,原先计划想着是用shell 操作,因为shell 本身也支持ftp的命令
- 1、路径https://www.lfd.uci.edu/~gohlke/pythonlibs/PS:网上说有时候报404,解决办法是换浏览器
- 如何用Sleep函数编译一个定时组件?见下: Private Declare Sub Sleep L
- 本文主要介绍了pandas统计重复值次数的方法实现,分享给大家,具体如下:from pandas import DataFramedf =
- python中字典和列表的使用,在数据处理中应该是最常用的,这两个熟练后基本可以应付大部分场景了。不过网上的基础教程只告诉你列表、字典是什么
- 本文实例为大家分享了python实现图像边缘检测的具体代码,供大家参考,具体内容如下任务描述背景边缘检测是数字图像处理领域的一个常用技术,被
- 可变参数可变参数应该最简单,在C/C++和Java等语言中都有,就是用*号来表示,例如def testArg(*arg)你可以传入任意多个元
- 一、在Yii中实现乐观锁乐观锁(optimistic locking)表现出大胆、务实的态度。使用乐观锁的前提是, 实际应用当中,发生冲突的
- 类属性和对象属性我们把定义在类中的属性称为类属性,该类的所有对象共享类属性,类属性具有继承性,可以为类动态地添加类属性。对象在创建完成后还可
- Ansible Inventory 介绍Ansible Inventory 是包含静态 Inventory 和动态 Invent
- 忽略循环引用在 .NET 5 中,如果存在循环依赖, 那么序列化的时候会抛出异常, 而在 .NET 6 中, 你可以选择忽略它。Catego
- 在练习列表的操作的时候我发现赋值之后的列表会随着被赋值的列表改变而改变,就像是C语言中用指向同一实际变量的指针进行操作一样。这是因为Pyth
- Python初学,定义urlConfig 接收参数,正常传递参数时,出现,多给了一个参数的错误问题,定义class的函数之后,在调用的时候出
- 在mysql数据库中,mysql key_buffer_size是对MyISAM表性能影响最大的一个参数(注意该参数对其他类型的表设置无效)
- 一、Matplotlib 绘图在数据分析中,数据可视化也非常重要,通过直观的展示过程、结果数据,可以帮助我们清晰的理解数据,进而更好的进行分