Python中的字符串查找操作方法总结
作者:mink的小屋 发布时间:2021-06-13 12:21:46
标签:Python,字符串,查找
基本的字符串位置查找方法
Python 查找字符串使用 变量.find("要查找的内容"[,开始位置,结束位置]),开始位置和结束位置,表示要查找的范围,为空则表示查找所有。查找到后会返回位置,位置从0开始算,如果每找到则返回-1。
str = 'a,hello'
print str.find('hello') # 在字符串str里查找字符串hello
>> 2 # 输出结果
朴素匹配算法
朴素匹配算法是对目标字符串和模板字符串的一一匹配。如果匹配得上,下标向右移一位, 否则清空并重新开始匹配。
target = 'abb aba'
pattern = 'aba'
def match(target, pattern):
i = j = 0
n, m = len(target), len(pattern)
while i < n and j < m:
# 如果字符相等则目标和模板的下标都向右移
if target[i] == pattern[j]:
i, j = i+1, j+1
else:
# 如果字符不相等则目标下标切换到不相等的下标
# 模板下标移动到初始下标
i = i - j + 1
j = 0
if j == m:
return i - j
return -1
把上面的加上print后打印一遍
#修改的地方
else:
i = i -j + 1
j = 0
print(target[i], pattern[j], i, j)
# 打印结果
b a 1 0
b a 2 0
a 3 0
a a 4 0
循环会一直到相等的匹配值, 这个方法效率低下,主要是在不匹配时会重新把模板字符循环一次。最多可能会出现 m * (n-m +1)次。m是模板字符的长度,n-m + 1是排除不等字符的次数。
KMP 算法
kmp是通过已知匹配的字符进行移位的算法,比如上面的abb 中跟abc比较的话 ab是已知的。
def match(target, pattern):
i = j = 0
n, m = len(target), len(pattern)
while i < n and j < m:
# 如果字符相等则目标和模板的下标都向右移
if if j == -1 and target[i] == pattern[j]:
i, j = i+1, j+1
else:
# 这里通过next 函数来判断位移个数
i = i - j + pattern_next(pattern[:j])
j = 0
if j == m:
return i - j
return -1
def pattern_next(s):
prefix = [s[:i+1] for i in range(len(s)-1)]
suffix = [s[i+1:] for i in range(len(s)-1)]
l = list(set(prefix) & set(suffix))
return len(l)


猜你喜欢
- 前序、中序和后序表达式是什么?对于像B∗C 这样的算术表达式,可以根据其形式来正确地运算。在B∗
- 1.首先需要安装pandas, 安装的时候可能由依赖的包需要安装,根据运行时候的提示,缺少哪个库,就pip 安装哪个库。2.示例代码impo
- 一、问题分析runtimeError: package fails to pass a sanity check解决方法如下:解决一:使用p
- 本文实例讲述了Python实现文件内容批量追加的方法。分享给大家供大家参考,具体如下:#coding:utf-8import os#----
- 需求我的需求是批量裁剪某一文件夹下的所有图片,并指定裁剪宽高。思路1、 先使用PIL.Image.size获取输入图片的宽高。2、宽高除以2
- 在sql语句中,如果查找某个文本字段值为空的可以用select * from 表 where 字段=''但是如果
- 今天给一个客户巡检的情况下发从库没有业务的情况mysqld的cpu的一个core占用100%.查主库慢查询也没有关于写的SQL.可以说是典的
- 1.经典类与新式类在了解Python的类与类型前,需要对Python的经典类(classic classes)与新式类(new-style
- 前面讲解了使用纯numpy实现数值微分和误差反向传播法的手写数字识别,这两种网络都是使用全连接层的结构。全连接层存在什么问题呢?那就是数据的
- 本文实例讲述了Python Django模板之模板过滤器与自定义模板过滤器。分享给大家供大家参考,具体如下:模板过滤器过滤器用于对模板变量进
- 为什么会有多个分支一般项目在开发阶段,都会创建多个分支,用于不同开发阶段的版本发布如:master、dev等,之所以会有这种多分支情况,就是
- 高阶函数除了可以接受函数作为参数外,还可以把函数作为结果值返回。看代码:# -*- coding: utf-8 -*-# @File &nb
- 阅读上一篇:css基础教程属性篇 本篇主要介绍css对边框(border)的属性控制和链接(link)的伪类选择器.边框(border):
- 前言CSDN博客好久没有换过头像了,想换个新头像,在相册里面翻来翻去,然后就找到以前养的小宠物的一些照片,有一张特别有意思惊恐到站起来的金丝
- 编这个程序是想过节过年,一些重要的纪念日,给亲戚好友发祝福之类的,但要凌晨0点才显得比较有诚意,可我又比较贪睡,常常忘了,所以就有了编个微信
- 本文实例讲述了python自动翻译实现方法。分享给大家供大家参考,具体如下:以前学过python的基础,一般也没用过。后来有一个参数表需要中
- 如下所示:#! usr/bin/python#coding=utf-8 import numpy as npimport matplotli
- 前言利用Django开发网站,可以设计出非常优美的url规则,如果url的匹配规则(包含正则表达式)组织得比较好,view的结构就会比较清晰
- numpy.where() 有两种用法:1. np.where(condition, x, y)满足条件(condition),输出x,不满
- 一、Python 操作 Excel 的常用库小伙伴你好,在开始操作 Excel 之前,你需要安装 Python 和一些相关库。可以使用 pi