Python实现将Word表格嵌入到Excel中
作者:酸菜鱼编程 发布时间:2022-02-10 06:21:49
标签:Python,Word,Excel
今日需求
其实就是把Word中的表格转到Excel中,顺便做一个调整。这个需求在实际工作中,很多人还是经常碰到的!
如果单单是两个表格,那只要简单的复制黏贴即可,但如果上百了呢?那就得考虑自动化了。好在今天碰到的需求中的原文件格式是比较有规律的,那直接来尝试一下。
# 首先要pip install python-docx
# 如果原文件是doc格式,那就先转成docx
from docx import Document
import pandas as pd
path = "./word表格转excel.docx"
docx = Document(path)
table_s = docx.tables # 返回一个Table对象的列表
len(table_s) --> 2 # 返回值是2,因为原文件中只有两个表格
list_ = [] # 初始化一个空列表,用来装后面的dict_
for table in table_s: # 循环所有的表格列表
dict_ = {}
dict_['名称'] = table.cell(0, 1).text # 表格的索引是从(0行,0列)开始
dict_['身份'] = table.cell(0, 3).text
dict_['简介'] = table.cell(1, 1).text
for i in range(3, len(table.rows)): # 后续的内容格式不固定,所以循环获取
dict_[table.cell(i, 0).text] = table.cell(i, 1).text
list_.append(dict_)
当完成上述操作后,list_就会是一个字典列表。
接下来,将列表转为DataFrame进行操作即可。
df = pd.DataFrame(list_)
# 先将前三列作为索引,然后逆透视其他列,其实这就是个一维表转二维表的过程
df = df.set_index(['名称', '身份', '简介']).stack(level=0).to_frame()
# 重新设置一下行列索引的名字
df.index.names = ['名称', '身份', '简介', '物质']
df.columns = ['现状']
此时的df就跟需求结果相差不大了。
最后将DataFrame导出,稍作美化即可完成需求。
# 导出的时候一定要设置index=True不然只会保留一列Series
df.to_excel("data3.xlsx", index=True, merge_cells=True)
完整代码
# 首先要pip install python-docx
# 如果原文件是doc格式,那就先转成docx
from docx import Document
import pandas as pd
path = "./word表格转excel.docx"
docx = Document(path)
table_s = docx.tables # 返回一个Table对象的列表
list_ = [] # 初始化一个空列表,用来装后面的dict_
for table in table_s: # 循环所有的表格列表
dict_ = {}
dict_['名称'] = table.cell(0, 1).text # 表格的索引是从(0行,0列)开始的
dict_['身份'] = table.cell(0, 3).text
dict_['简介'] = table.cell(1, 1).text
for i in range(3, len(table.rows)): # 循环获得后面的内容
dict_[table.cell(i, 0).text] = table.cell(i, 1).text
list_.append(dict_)
df = pd.DataFrame(list_)
# 先将前三列作为索引,然后逆透视其他列,就是个一维表转二维表的过程
df = df.set_index(['名称', '身份', '简介']).stack(level=0).to_frame()
# 重新设置一下行列索引的名字
df.index.names = ['名称', '身份', '简介', '物质']
df.columns = ['现状']
# 导出的时候一定要设置index=True不然只会保留一列Series
df.to_excel("data3.xlsx", index=True, merge_cells=True)
来源:https://blog.csdn.net/pythonxuexi123/article/details/115027653
0
投稿
猜你喜欢
- 利用Python中的socket模块中的来实现UDP协议,这里写一个简单的服务器和客户端。为了说明网络编程中UDP的应用,这里就不写图形化了
- 很多时候,用户可能会因为承受不了某一产品中的细节设计而放弃使用该产品,这无疑是让设计人员感很沮丧的事情,因为除去这个细节的问题外,这个产品可
- 在IE6中背景属性加 a 与 a:hover 两者的伪类结合,在正常逻辑下为何不起作用?测试这问题存在IE6及以下浏览器,这问题我经常遇到在
- 最新版OpenCV2.4.7中,cv::resize函数有五种插值算法:最近邻、双线性、双三次、基于像素区域关系、兰索斯插值。下面用for循
- 前言本文主要使用 cpu 版本的 tensorflow 2.4 版本完成文本的 word embedding 训练,并且以此为基础完成影评文
- 一.打包Flask项目1.1自己写个Flask2.2 下载pyinstallerpip install pyinstaller可选参数示例说
- 内容摘要:一堆数据摆面前,数据背后有什么样的事情在发生,这些数据里面暗藏着什么样的用户需求,什么样的商业机会?看懂这些,将为未来产品设计的方
- 本文实例讲述了Django框架首页和登录页分离操作。分享给大家供大家参考,具体如下:1.登录模板login.html<!DOCTYPE
- 目录生成迷宫走出迷宫可视化总结相信大家都玩过迷宫的游戏,对于简单的迷宫,我们可以一眼就看出通路,但是对于复杂的迷宫,可能要仔细寻找好久,甚至
- 阅读上一章:chapter 5 表单Chapter 6 <strong>,<em>与其他短语元素在引言和前面的章节中
- 遵循Web标准的思想,网页要表现出一种亲和力。那么,针对残障用户来说,其“阅读”器可不能读取图像上传递的信息的。所以我们会采用一种Using
- 本文实例讲述了python中map、any、all函数用法。分享给大家供大家参考。具体分析如下:最近想学python,就一直比较关注pyth
- VS2013的简单WInForm控件,通过WebRequest,WebResponse来访问,接收:private void btn_int
- 今天,在在使用 pycharm 的使用,进行创建 python的时候,发现使用默认的创建的选项使用的python 3环境 。而我系统默认的p
- 今天在编写PHPDoc的导出文档的时候发现一个很郁闷的错误,虽然这个warning不是什么重要错误,但是看着总是很不爽的。于是就去网上找了很
- 键盘事件废话不多说直接上包from selenium.webdriver.common.keys import Keys1、删除键 BACK
- 一次性选中并修改多个相同的变量在编码的时候,有时候要批量替换一个变量的名字,但是又不想使用批量替换,因为在不同的作用域中是可以使用相同的变量
- 本文实例讲述了python实现从尾到头打印单链表操作。分享给大家供大家参考,具体如下:# coding=utf-8class SingleN
- code原文档 1.txt :HelloNanjing100实现代码:file_ = "1.txt"r_file = o
- 一. create优化在serializer序列化中,我们通过创建序列化器对象的方式地简化了视图函数的代码,前端传入的数据通过反序列化操作进