位置：首页>> 网络编程>> Python编程>> python提取具有某种特定字符串的行数据方法

python提取具有某种特定字符串的行数据方法

作者：请叫我渣渣的帕楚利亚　　发布时间：2022-09-20 08:12:55　

标签：python,字符串,行数据

今天又帮女朋友处理了一下，她的实验数据，因为python是一年前经常用，最近找工作，用的是c，c++，python的有些东西忘记了，然后就一直催我，说我弄的慢，弄的慢，你自己弄啊，烦不烦啊，逼逼叨叨的，最后还不是我给弄好的？呵呵

好的，数据是这样的，我截个图

我用红括号括起来的，就是我所要提取的数据

其中lossstotal.txt是我要提取的原始数据，考虑两种方法去提取，前期以为所要提取行的数据是有一定规律的，后来发现，并不是，所以，我考虑用正则来提取，经过思考以后，完成了数据的提取，如下午所示，数据变的非常好看

代码如下：

#coding:utf-8
#__author__ ='dell'

import re

f1=file('losstotal.txt','r')
data1=f1.readlines()
# print data1
f1.close()
results = []
f2 = open('loss2.txt', 'w')

# # 按照特定行提取，发现后面的行并无规律
# i = 0
# for line in data1:
# i+=1
# # print line
# if((i-1)％3==0):
# f2.write(line)
# print line

# 利用正则表达式

for line in data1:
data2=line.split()
# print data2
for i in data2:
n = re.findall(r"Iteration", i)
# m=re.findall(r"loss", i)
if n:
# print line
f2.writelines(line)
f2.close()

f3=file('loss2.txt','r')
data3=f3.readlines()
# print data1
f3.close()
f4 = open('loss3.txt', 'w')

for line in data3:
data4=line.split()
# print data2
for i in data4:
n = re.findall(r"loss", i)
# m=re.findall(r"loss", i)
if n:
print line
f4.writelines(line)
f4.close()

# 去掉逗号
f5=open('loss3.txt','r')
data5=f5.read()
f5=data5.replace(',',' ')
f6=file('lossfinal.txt','w')
f6.write(f5)
f6.close()

# # 去掉等号=
f7=open('lossfinal.txt','r')
data7=f7.read()
f7=data7.replace('=',' ')
f8=file('lossfinal.txt','w')
f8.write(f7)
f8.close()
# data3=lin.split()
# for j in data3:
# m=re.findall(r"loss",i)
# if m:
# print lin

# # m=re.findall(r"sgd_solver.cpp",i)
# n=re.findall(r"Iteration",i)

我在同样的目录下，还建立了

这几个txt文件，要不然，代码跑不通的哟。

解释：我连续用了两个正则，各自把含有特定字符串的行进行提取，两个写一起，发现还是不太会，所以分开写了，但是结果还是完成的不错！

来源：https://blog.csdn.net/u011436427/article/details/82628597

投稿

python提取具有某种特定字符串的行数据方法

猜你喜欢