Python3 读取Word文件方式
作者:医然 发布时间:2021-03-21 22:36:37
标签:Python3,读取,Word
我的环境,Windows10,Python3.6.3
查询了很多有关资料,发现都是Python2版本操作Word文件的,所以就写了这篇短小的文章。
一、安装 docx
pip install docx
完了之后,导入:import docx
发现报错:ModuleNotFoundError: No module named ‘exceptions'
说没有 exceptions 这个模块,由于Python3已经取消了这个模块,而 PendingDeprecationWarning 是内置
可以直接使用的,所以我们直接进入文件(这个要看你报错显示的路径):
D:\ProgramFiles\Anaconda3\lib\site-packages\docx.py
把 from exceptions import PendingDeprecationWarning 注释掉即可
示例代码:
import docx
def get_docx(file_name):
d = docx.opendocx(file_name)
doc = docx.getdocumenttext(d)
return doc
doc = get_docx('tt.docx')
print(doc) # 输出行数:1075
for d in doc[:5]:
print(d) # 打印前5行
'''输出:
一、补益之剂
1.四君子汤
四君子汤中和义,参术茯苓甘草比
益以夏陈名六君,祛痰补气阳虚饵
除却半夏名异功,或加香砂胃寒使
'''
来源:https://blog.csdn.net/a649344475/article/details/81162381
0
投稿
猜你喜欢
- 1.简要概述为什么要开通MySQL这个学习板块呢?因为这是一名数据分析师必要的一项技能。分析数据什么最重要?当然是数据,既然如此!在数据呈现
- 有时候为了自动化测试网页,我们往往希望能够使用一些脚本语言控制浏览器. 通过脚本模拟一些浏览器动作,然后测试得到的结果.这里, 我们讲解一下
- python发邮件需要掌握两个模块的用法,smtplib和email,这俩模块是python自带的,只需import即可使用。smtplib
- 通常大家想知道数据库是否增长了,增长了多少。大家可能想到用数据库的各个历史时期的大小来比较就可以了。 但怎么能得到这些历史的大小数据呢?好像
- 解决方法一: mysql安装时候的编码, 看下my.ini,有无 [mysql] default-character-set=utf8 [c
- 什么是协程在 Python 中,协程(Coroutine)是一种轻量级的并发编程方式,可以通过协作式多任务来实现高效的并发执行。协程是一种特
- 在Python中,生成器和函数很像,都是在运行的过程中才会去确定各种变量的值,所以在很多情况下,会导致各种各样的问题。def generat
- 如下所示:new_array = np.zeros((5,4))for i in range(3): new_array[i] = np.a
- 附加数据库就可以完成. 附加数据库: &nb
- 1、CSV(1)写csv文件import csvdef writecsv(path,data): with open(path,
- 在SQL Server中可以使用系统内部存储过程xp_fileexist判断文件是否存在,如果存在再使用xp_cmdshell删除文件。xp
- pyecharts中的Funnel函数可以绘制漏斗图,自动根据数据大小生成由大到小自上而下排列的一个漏斗样的图形。1、导入Funnel模块。
- mint19.2 本来pip 和 pip2 对应 python2.7 pip3对应pytho
- python实现12306余票查询我们说先在浏览器中打开开发者工具(F12),尝试一次余票的查询,通过开发者工具查看发出请求的包余票查询界面
- 程序没有改动过运行一直正常,突然有一天同事告知出现错误了。经过检查发现传递的数据中出现了#等特殊字符,浏览器只取到#号前面的数据,后面的被截
- 第一步:字母转数字英文字母转对应数字相对简单,可以在命令行输入一行需要转换的英文字母,然后对每一个字母在整个字母表中匹配,并返回相应的位数,
- 好久没有学python了,反正各种理由吧(懒惰总会有千千万万的理由),最近网上学习了一下selenium,实现了一个简单的自动登录网页,具体
- MySQL Index索引是一种数据结构,可以是B-tree、R-tree、或者hash结构。其中,B-tree适用于查找某范围内的数据,可
- timeit.repeattimeit.repeat默认会执行3轮,每轮执行1000000次。返回每轮的总执行时间列表字典获取性能大家都知道
- 直接进入主题立方体每列颜色不同:# Import librariesimport matplotlib.pyplot as pltfrom