位置：首页>> 网络编程>> Python编程>> Python处理Excel文件实例代码

Python处理Excel文件实例代码

作者：Berne　　发布时间：2022-02-15 23:13:01　

标签：Python,Excel

因为工作需求，需要审核一部分query内容是否有效，query储存在Excel中，文本内容为页面的Title，而页面的URL以HyperLink的格式关联到每个Cell。

于是本能的想到用Python读取Excel文件之后进行文本分析，之后对每个链接进行一次HttpRequest，通过分析HttpResponse的内容来判断当前链接是否有效。

于是上网搜了下，发现比较主流的是用xlrd的插件，但是实际使用过程中发现，无论如何，最终获取的hyperlink_map值一直都是None，也没空去分析到底是为什么。最后经过搜索发现一个叫xlwings的Python库，可以有效使用。

xlwings：Python For Excel

具体的代码如下：

# -*- coding=utf-8 -*-
import xlwings as xw
import urllib
import sys

type = sys.getfilesystemencoding()

def get_html(url):
page = urllib.urlopen(url)
html = page.read()
return unzip(html)

## Debug的时候发现无论怎样做Decode，最后的结果都是乱码
## 后来发现是因为对应的网页做了压缩处理，所以需要对获取的网页内容手动解压缩
def unzip(data):
import gzip
import StringIO
data = StringIO.StringIO(data)
gz = gzip.GzipFile(fileobj=data)
data = gz.read()
gz.close()
return data

wb = xw.Book(r"C:\Users\hasee\Desktop\Test.xlsx")
main_data = wb.sheets["Sheet2"]
## 通过获取Last Cell来确定当前Sheet的有效行数与列数
rownum = main_data.range('A1').current_region.last_cell.row
colnum = main_data.range('A1').current_region.last_cell.column

## 定位column对应的列
col_dict = {"2":"B","3":"C","4":"D","5":"E","6":"F"}

for row in range(1, rownum + 1):
for col in range(2, colnum + 1):
query = main_data.range(row, 1).value
cell = main_data.range(row, col)
link = cell.hyperlink
html = get_html(link)
if "error-container" in html:
print "％s,％s,％s,％s" ％ (query, col_dict.get(str(col))+str(row), cell.value, cell.hyperlink)
## 对无效的链接所属的Cell染色，直接写入文件
cell.color = (253,218,4)

来源：http://www.cnblogs.com/chrischeng/p/7050027.html?utm_source=tuicool&utm_medium=referral

0

投稿

猜你喜欢

Python检查图片是否损坏及图片类型是否正确过程详解
检查图片是否损坏日常工作中，时常会需要用到图片，有时候图片在下载、解压过程中会损坏，而如果一张一张点击来检查就太不Cool了，因此我想大家都
HTTP状态码
HTTP状态码摘要说明成功2××
python调用cmd命令行制作刷博器
import webbrowser as webimport timeimport oscount=0while count<10:&
JavaScript十二月新标准ECMA262v5快速浏览
今天终于抽出时间瞟了一眼JavaScript的新标准ECMA262v5，让我欣喜的是，不像是因为过于激进而被废除的v4，这个新标准对Java
服务器端控件是如何操作的？
<HTML> <BODY> <
总结showModalDialog和showModelessDialog用法
这也是老早前整理的了，也贴出来吧：1． showModalDialog和showModelessDialog的异同
python matplotlib.pyplot.plot()参数用法
如下所示：matplotlib.pyplot.plot(*args, **kwargs)绘制线条或标记的轴。参数是一个可变长度参数，允许多个
详解MySQL 数据库优化方法
用analyze进行处理，定期进行处理ANALYZE [LOCAL | NO_WRITE_TO_BINLOG] TABLE tb1_name
Asp无组件生成缩略图
网上有不少生成缩略图的ASP组件。若你的虚拟空间不支持注册新组件，可能会感觉自己的网站失色不少。心晴不才，结合网上资源写了个无组件生成缩略图
Python使用pickle进行序列化和反序列化的示例代码
一、说明早上看到Python使用pickle进行序列化和反序列化，然后发现面临的一个获取不到返回值的框架，似乎可以通过在框架中先序列化，然后
脚本安全的本质_PHP+MYSQL第1/3页
一前言问题的存在从代码级别上，也就是应用层次上考虑代码安全的话（也就是不考虑底层的语言本身等问题的漏洞），脚本安全问题就是函数和变量的
ASP四级连动下拉列表程序段
<％sql = "select * from SMT_addt
Python自动化之批量处理工作簿和工作表
一、批量新建并保存工作簿import xlwings as xw # 导入库# 启动Excel程序，但不新建工作
ASP连接Access数据库的几种方法
1. 相对与比较老的环境，建议使用第二个 set dbconnection=Server.CREATEOBJECT("ADODB.
用isapi rewrite 实现asp的HTML静态化
asp网站程序在国内运用很广,但是类似于im286.asp?id=20050307213811这样的url有点不利于搜索引擎的收录,也就是说
Python实现注册登录系统
表单在网页中主要负责数据采集功能。一个表单有三个基本组成部分：表单标签：这里面包含了处理表单数据所用CGI程序的URL以及数
python中将\\\\uxxxx转换为Unicode字符串的方法
今天碰到一个很有意思的问题，需要将普通的 Unicode字符串转换为 Unicode编码的字符串，如下：将 \\u9500\\u552e 转
numpy系列之数组合并(横向和纵向)
目录1.横向合并1.1 concatenate方法1.2 hstack方法1.3 column_stack方法2.纵向合并2.1 conca
Javascript fso操作文件
Javascript是网页制作中离不开的脚本语言，依靠它，一个网页的内容才生动活泼、富有朝气。但也许你还没有发现并应用它的一些更高级的功能吧
DHTML+XML+ASP+CSS的树形目录
树形目录显示程序问题描述：在我们项目中常常会出现自关联的数据表，如果我们从整体看去，整个表就呈现为一个树形数据结构（对于复杂的情况，它可能变

Python中字符串List按照长度排序

对Django 转发和重定向的实例详解

Python SQLAlchemy库的使用方法

python实现批量视频分帧、保存视频帧

Python 比较文本相似性的方法(difflib,Levenshtein)

Python实现删除列表中满足一定条件的元素示例

Python基础入门之seed()方法的使用

如何用Python进行时间序列分解和预测

使用Python的Dataframe取两列时间值相差一年的所有行方法

python 集合并集、交集 Series list set 转换的实例

Win7任务管理器提示拒绝访问进程的解决方法

Win11运行cmd提示“请求的操作需要提升”的解决方法

win10怎么关闭uac控制

word打字时后面的字会消失是什么原因?如何解决?

Win10飞行模式变成灰色无法关闭怎么办？

WPS怎么设计信封图标? wps画信封的教程

单元格的空格怎么去掉？去除单元格的空格

Excel表格错误值怎么设置不打印?

在Python中使用SimpleParse模块进行解析的教程

win10心灵终结闪退怎么办-win10心灵终结闪退解决方法

手机版 网络编程 asp之家 www.aspxhome.com