python办公之python编辑word
作者:??斜月???? 发布时间:2022-03-31 08:48:40
标签:python,办公,编辑,word
1 前言
在工作中时常会有繁重的文案工作,接触了python 之后,就会觉得这个比较简单了,python 操作word 和 excel 是比较常用的操作,相对比较简单,在本文中,我们就以 python 操作 word 为例来介绍一些简单的操作。
2 前提准备
2.1 python-docx 的安装
需要操作的前提是下载 docx 相关的操作类库 python-docx
,操作的环境和 IDE 环境如下所示
#使用的python 版本 python3.7.6 IDE pycharm2019
# 安装命令
pip install python-docx
# 查看安装版本
pip list | grep python-docx
2.2 docx 文档的结构说明
事先声明一下,python 操作的word版本必须是 docx
的版本,doc
的文档暂不支持。另外 docx 文档也是一种 xml 的数据组织格式, 首先了解一下其格式情况,
在word文档中,其主要结构如下所述:
1 每个document包含多个paragraph,每个paragraph有多个run,每个run包含有(text文本,font字体,color颜色,字号)
2 每个document包含多个tables,table中有多个rows,每个row包含多个cells,每个cell中包含多个paragraph。对于写word表格不论是 head 还是paragraph 基本操作都是先添加对象,然后再添加run就好了
3 word表格的结构包含head标题、normal 正文、Caption表
3 具体使用
3.1 创建标题
# 创建一个document
document = Document()
# 创建一个标题 默认是一级标题
head = document.add_heading(level=4)
run = head.add_run("这是一个四级标题 this is a title")
# font.name 只能设置西文字体
run.font.name = 'Times New Roman'
# 中文字体需要使用这种方式设置
run._element.rPr.rFonts.set(qn('w:eastAsia'), u'宋体')
# 设置大小为11磅
run.font.size = Pt(16)
# 段落字体颜色
run.font.color.rgb = RGBColor(128, 0, 128)
# 是否加粗
run.bold = False
# 是否斜体
run.italic = False
3.2 创建段落
# 创建一个段落
ph = document.add_paragraph()
# 添加段落 段落间距段落前13磅 段落后13磅 行间距固定值18磅
ph.paragraph_format.space_before = Pt(13)
ph.paragraph_format.space_after = Pt(13)
ph.paragraph_format.line_spacing = Pt(18)
# 设置2.5倍行间距
ph.paragraph_format.line_spacing = 2.5
# 段落缩进 段落左缩进0.5英寸 left_indent right_indent
# p.paragraph_format.left_indent = Inches(0.5)
# 首行缩进 首行缩进0.9cm
ph.paragraph_format.first_line_indent = Cm(0.9)
# 段落左对齐
ph.alignment = WD_PARAGRAPH_ALIGNMENT.LEFT
run1 = ph.add_run("历史上第一个儿子当皇帝,老爹还活着的,当属刘太公,也就是刘邦的父亲。刘邦建立汉朝,称帝,"
"每天还去拜见刘太公,后来有大臣进言讲,虽然刘太公贵为皇帝父亲,但也为人臣,不应该由皇帝前去拜见。")
run1.font.size = Pt(12)
run1.font.color.rgb = RGBColor(128, 128, 128)
run1.font.name = 'Times New Roman'
run1._element.rPr.rFonts.set(qn('w:eastAsia'), u'宋体')
3.3 创建表格
# 创建一个表格 3行四列 也可以不设置
table = document.add_table(rows=1, cols=3)
# 自动调整表格
table.autofit = True
# 设置表格样式
table.style = 'Table Grid'
# 表头
hdr_cells = table.rows[0].cells
hdr_cells[0].text = 'Qty'
hdr_cells[1].text = 'Id'
hdr_cells[2].text = 'Desc'
# 准备数据
records = (
(3, '101', 'Spam'),
(7, '422', 'Eggs'),
(4, '631', 'Spam, spam, eggs, and spam')
)
# 添加内容
for qty, id, desc in records:
row_cells = table.add_row().cells
row_cells[0].text = str(qty)
row_cells[1].text = id
row_cells[2].text = desc
3.4 文档保存
# 保存文档 指定保存位置
document.save(r"demo_word.docx")
3.5 获取文档操作
#获取文档中所有段落的样式根据样式进行修改文档
docu = Document(r'D:/xxx.docx')
for p in docu.paragraphs:
style_name = p.style.name
print(style_name)
#获取文档中所有的表格
for tb in docu.tables:
# tb.rows 文档中所有的行 tb.rows[0].cells 某一行的所有单元格
# 循环单元格进行编辑样式操作
3.6 其它操作
# word表格单元格背景颜色
def set_cell_background_color(cell, color):
# print(colorStr)
shading_elm_1 = parse_xml(r'<w:shd {} w:fill="{color_value}"/>'.format(nsdecls('w'), color_value=color))
cell._tc.get_or_add_tcPr().append(shading_elm_1)
cells1[i].paragraphs[0].style = "表格体"
# 修改背景颜色为白色
set_cell_background_color(rows.cells[0], "#FFFFFF")
# 查看文档内所有的样式
for sts in document.styles:
print(sts)
# 查看word文档结构
print(document._element.xml)
4 总结
最终产生的效果如下图所示:
在本章中,介绍了怎么使用python-docx创建wor文档,并举例说明了创建段落,表格,标题,图片等要点。
来源:https://juejin.cn/post/7035867058642354207
0
投稿
猜你喜欢
- 1.字典的概念字典和列表类似,也是可变序列,不过和列表不同,它是无序的可变序列,保存的内容是以键值对(key:value)形式存放的 字典的
- Python中为了方便程序直接生成exe文件,它存在一个pyinstaller库,使用这个库可以直接将.py程序生成exe文件。这个命令不是
- 问题:python2.7 查询或者插入中文数据在mysql中的时候出现中文乱码---可能情况:1.mysql数据库各项没有设置编码,默认为&
- reduce() 函数在 python 2 是内置函数, 从python 3 开始移到了 functools 模块。官方文档是这样介绍的re
- 格式化字符串是什么?Python字符串的格式化处理主要是用来将变量(对象)的值填充到字符串中,在字符串中解析Python表达式,对字符串进行
- 修改镜像源的原因是pip和conda默认国外镜像源,所以每次安装模块pip install ×××或者 conda install ×××的
- Pyperclip模块详解一. Pyperclip模块安装Pyperclip模块兼容python2和python3,能跨平台使用。安装指令如
- python ThreadPoolExecutor线程池的工作线程中出现异常时,主线程不会捕获异常。解决方法1:直接在需要执行的任务方法中添
- 使用SQL SERVER的[导入]功能,便可将access数据转换,但要注意原来的'自增字段'需要修改,将相应字段标识修改为
- SQL Server 2005的新功能为动态管理对象,它们是在指定时间返回某个数据库实例的特殊状态信息的数据库视图或函数。这些对象允许数据库
- 有的时候我们希望生成一段时间返回,比如从 2022-01-01 00:00:00 后面的 10 天,这么 10 个 datetime 对象,
- python 实现删除文件或文件夹  
- 看了一个月的文档和资料以后,终于让我参与到项目中来了,哈哈,痛快!虽然只是让我解决一个小问题,不过有活干就是好。在写代码的过程中遇到了一个小
- 前言如果你以前没有接触过面向对象的编程语言,那你可能需要先了解一些面向对象语言的一些基本特征,在头脑里头形成一个基本的面向对象的概念,这样有
- 目录Memcache缓存第一步:安装Memcached第二步:启动Memcached第三步:pip安装python-memcached第四步
- 列表(List) 的三种遍历(序号和值)方法if __name__ == '__main__':
- ASP+javascript实现可显示和隐藏的树型菜单实例:<script language=&qu
- 在PyTorch中,torch.Tensor类是存储和变换数据的重要工具,相比于Numpy,Tensor提供GPU计算和自动求梯度等更多功能
- 前言本博客默认读者对神经网络与Tensorflow有一定了解,对其中的一些术语不再做具体解释。并且本博客主要以图片数据为例进行介绍,如有错误
- 本文实例讲述了Python记录详细调用堆栈日志的方法。分享给大家供大家参考。具体实现方法如下:import sysimport osdef