利用python对Excel中的特定数据提取并写入新表的方法
作者:heavenmark 发布时间:2023-09-17 16:03:10
标签:python,Excel,提取
最近刚开始学python,正好实习工作中遇到对excel中的数据进行处理的问题,就想到利用python来解决,也恰好练手。
实际的问题是要从excel表中提取日期、邮件地址和时间,然后统计在一定时间段内某个人在某个项目上用了多少时间,最后做成一张数据透视表(这是问题的大致意思)。
首先要做的就是数据提取了,excel中本身有一个text to column的功能,但是对列中规律性不好的数据处理效果很差,不能分割出想要的数据,所以我果断选择用python来完成。
要用的库一个是对excel读写处理的,一个事正则表达式的库。
因为xlwt和xlrd只能对03版以前的excel处理,所以我选择了openpyxl。
以下代码就是自己敲的,写了对日期和邮件地址的提取,最后出来效果不错,仅供大家参考,欢迎交流与改进。
import openpyxl
import re
def Exceldivide(file_dir):
wb=openpyxl.load_workbook(file_dir) #打开原有的excel表
sheet=wb.get_sheet_by_name('Sheet1')
tuple(sheet['A1':'C3'])
wb.create_sheet('Sheet2') #新建一个表
sheet2=wb.get_sheet_by_name('Sheet2')
tuple(sheet2['A1':'C3'])
L1=re.compile(r'\d\d/\d\d/\d\d\d\d') #日期格式
L2=re.compile(r'[a-zA-Z0-9_]+@[a-zA-Z0-9-]+.com') #邮件格式
l1=[]
l2=[]
for rows in sheet['A1':'C3']: #提取日期和邮件数据
for cell in rows:
A=L1.search(cell.value)
a=A.group()
B=L2.search(cell.value)
b=B.group()
for rows in sheet2['A1':'A9']: #把日期数据写入新表
for cell in rows:
cell.value=a
print(cell.coordinate,cell.value)
for rows in sheet2['B1':'B9']: #把邮件数据写入新表
for cell in rows:
cell.value=b
print(cell.coordinate,cell.value)
return wb
g=Exceldivide('C:\\Users\\Desktop\\111_copy.xlsx')
g.save('C:\\Users\\Desktop\\111_copy.xlsx') #保存
来源:https://blog.csdn.net/heavenmark/article/details/73518853
0
投稿
猜你喜欢
- 学习目的 接触验证控件 昨天介绍了SQL SERVER插入数据,但是我们省略了验证输入这一步。以前的做法是用语句逐个判断输入的正确性,如是否
- python格式化字符串有%和{}两种 字符串格式控制符.字符串输入数据格式类型(%格式操作符号)%%百分号标记#就是输出一个%%c字符及其
- 方法一一般情况下,SQL数据库的收缩并不能很大程度上减小数据库大小,其主要作用是收缩日志大小,应当定期进行此操作以免数据库日志过大1、设置数
- 在开始之前,先问问大家:什么是百度Aip模块?百度AI平台提供了很多的API接口供开发者快速的调用运用在项目中本文写的是使用百度AI的**在
- 计算机视觉方面朋友都需要跟图像打交道,在pytorch中图像与我们平时在matlab中见到的图像数据格式有所不同。matlab中我们通常使用
- 方法1:使用Python中自带的print输出带有颜色或者背景的字符串书写语法print(\033[显示方式;前景色;背景色m输出内容\03
- 本文实例为大家分享了python实现抖音点赞功能的具体代码,供大家参考,具体内容如下#coding=utf-8from time impor
- 本文实例为大家分享了js实现圆形菜单选择器的具体代码,供大家参考,具体内容如下代码:<head> <style
- 情况1: father.php如下定义: <?php $jack = 1000; ?> children.php 如下定义: &
- 随手google咗一下,基本上都用select实现非阻塞监听,但问题是,监听的是用select之后是不能像getchar()那样
- 准备在以后制作的网站中尝试一些变化,比如:先提交内容,后提示注册/登陆。感觉这样可以绑架更多用户……不想注册再发言?那就先让你上钩发言,然后
- 如何做一个全面的探测器? 我们也可以做一个功能类似的探测器,见下:<Script lan
- 这篇文章主要介绍了Python函数参数类型及排序原理总结,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的
- max() 方法返回其参数最大值:最接近正无穷大的值。语法以下是max()方法的语法:max( x, y, z, .... )参
- 图像的阈值处理一般使得图像的像素值更单一、图像更简单。阈值可以分为全局性质的阈值,也可以分为局部性质的阈值,可以是单阈值的也可以是多阈值的。
- 最最简单的操作import numpy as npimport matplotlib.pyplot as pltfig = plt.figu
- 非常不错,大家可以自己应用下。<% '//数据处理部分 dim Content,Num,I,st
- JS获取多选框checkbox被选中的个数。var checkbox = document.getElementsByName("
- 因为python打包的时候需要用到ico图片格式,网上看好的图片又没有ico,于是自己寻找了一下python转换图片格式的方法,彻底解决这个
- Django结合ajax进行页面实时更新踩过的坑简单记录一下在使用Django、echarts和ajax实现数据动态更新时遇到的一些坑: 1