Python中拆分具有多个分隔符的字符串方法实例
作者:迹忆客 发布时间:2022-07-01 00:38:20
要使用多个定界符拆分字符串:
使用 re.split()
方法,例如 re.split(r',|-', my_str)
。
re.split()
方法将拆分所有出现的分隔符之一的字符串。
import re
# 👇️ 用 2 个分隔符拆分字符串
my_str = 'fql,jiyik-dot,com'
my_list = re.split(r',|-', my_str) # 👈️ 以逗号或连字符分隔
print(my_list) # 👉️ ['fql', 'jiyik', 'dot', 'com']
re.split
方法接受一个模式和一个字符串,并在每次出现该模式时拆分字符串。
管道 | 字符是一个或。 匹配 A 或 B。
该示例使用 2 个分隔符(逗号和连字符)拆分字符串。
# 👇️ 用 3 个分隔符拆分字符串
my_str = 'fql,jiyik-dot:com'
my_list = re.split(r',|-|:', my_str) # 👈️ comma, hyphen or colon
print(my_list) # 👉️ ['fql', 'jiyik', 'dot', 'com']
下面是一个使用 3 个分隔符(逗号、连字符和冒号)拆分字符串的示例。
我们可以使用尽可能多的 |
正则表达式中必要的字符。
使用方括号 [] 根据多个定界符拆分字符串
或者,我们可以使用方括号 []
来指示一组字符。
import re
my_str = 'fql,jiyik-dot,com'
my_list = re.split(r'[,-]', my_str)
print(my_list) # 👉️ ['fql', 'jiyik', 'dot', 'com']
确保在方括号之间添加所有分隔符。
import re
# 👇️ 用 3 个分隔符拆分字符串
my_str = 'fql,jiyik-dot:com'
my_list = re.split(r'[,-:]', my_str) # 以逗号、连字符、冒号分割
print(my_list) # 👉️ ['fql', 'jiyik', 'dot', 'com']
如果字符串以其中一个定界符开头或结尾,我们可能会在输出列表中得到空字符串值。
处理前导或尾随定界符
我们可以使用列表理解从列表中删除任何空字符串。
import re
# 👇️ 用 3 个分隔符拆分字符串
my_str = ',fql,jiyik-dot:com:'
my_list = [
item for item in re.split(r'[,-:]', my_str)
if item
]
print(my_list) # 👉️ ['fql', 'jiyik', 'dot', 'com']
列表推导负责从列表中删除空字符串。
列表推导用于对每个元素执行某些操作或选择满足条件的元素子集。
另一种方法是使用 str.replace()
方法。
使用 str.replace() 拆分具有多个定界符的字符串
要使用多个定界符拆分字符串:
使用
str.replace()
方法将第一个分隔符替换为第二个分隔符。使用
str.split()
方法按第二个分隔符拆分字符串。
my_str = 'fql_jiyik!dot_com'
my_list = my_str.replace('_', '!').split('!')
print(my_list) # 👉️ ['fql', 'jiyik', 'dot', 'com']
这种方法仅在您想要拆分的分隔符很少时才方便,例如 2.
首先,我们用第二个分隔符替换每个出现的第一个分隔符,然后我们拆分第二个分隔符。
str.replace
方法返回字符串的副本,其中所有出现的子字符串都被提供的替换项替换。
该方法采用以下参数:
old 字符串中我们要替换的子串
new 替换每次出现的 old
count 仅替换第一个 count 出现(可选)
请注意 ,该方法不会更改原始字符串。 字符串在 Python 中是不可变的。
这是另一个例子。
my_str = 'fql jiyik, dot # com. abc'
my_list = my_str.replace(
',', '').replace(
'#', '').replace('.', '').split()
print(my_list) # 👉️ ['fql', 'jiyik', 'dot', 'com', 'abc']
我们使用 str.replace()
方法在拆分空白字符的字符串之前删除标点符号。
我们使用空字符串进行替换,因为我们要删除指定的字符。
我们可以根据需要将尽可能多的调用链接到 str.replace()
方法。
最后一步是使用 str.split()
方法将字符串拆分为单词列表。
str.split()
方法使用定界符将字符串拆分为子字符串列表。
该方法采用以下 2 个参数:
separator 在每次出现分隔符时将字符串拆分为子字符串
maxsplit 最多完成 maxsplit 拆分(可选)
当没有分隔符传递给 str.split()
方法时,它会将输入字符串拆分为一个或多个空白字符。
my_str = 'fql jiyik com'
print(my_str.split()) # 👉️ ['fql', 'jiyik', 'com']
如果在字符串中找不到分隔符,则返回仅包含 1 个元素的列表。
使用可重用函数根据多个定界符拆分字符串
如果我们需要经常根据多个分隔符拆分字符串,请定义一个可重用的函数。
import re
def split_multiple(string, delimiters):
pattern = '|'.join(map(re.escape, delimiters))
return re.split(pattern, string)
my_str = 'fql,jiyik-dot:com'
print(split_multiple(my_str, [',', '-', ':']))
split_multiple
函数接受一个字符串和一个分隔符列表,并根据分隔符拆分字符串。
str.join()
方法用于将分隔符与管道 |
连接起来。 分隔器。
# 👇️ ,|-|:
print('|'.join([',', '-', ':']))
这将创建一个正则表达式模式,我们可以使用该模式根据指定的分隔符拆分字符串。
如果我们需要将一个字符串拆分为多个分隔符的单词列表,我们还可以使用 re.findall()
方法。
使用 re.findall() 将字符串拆分为单词列表
使用 re.findall()
方法将字符串拆分为具有多个分隔符的单词列表。
re.findall()
方法将在每次出现单词时拆分字符串,并返回包含单词的列表。
import re
# ✅ 将字符串拆分为具有多个分隔符的单词列表
my_str = 'fql jiyik, dot # com. abc'
my_list = re.findall(r'[\w]+', my_str)
print(my_list) # 👉️ ['fql', 'jiyik', 'dot', 'com', 'abc']
re.findall
方法将一个模式和一个字符串作为参数,并返回一个字符串列表,其中包含字符串中该模式的所有非重叠匹配项。
我们传递给 re.findall()
方法的第一个参数是一个正则表达式。
import re
my_str = 'fql jiyik, dot # com. abc'
my_list = re.findall(r'[\w]+', my_str)
print(my_list) # 👉️ ['fql', 'jiyik', 'dot', 'com', 'abc']
方括号 []
用于表示一组字符。
\w
字符与 Unicode 单词字符匹配,并且包括可以作为任何语言的单词一部分的大多数字符。
加号 + 使正则表达式匹配前面字符(Unicode 字符)的 1 次或多次重复。
re.findall()
方法返回一个包含字符串中单词的列表。
如果大家想了解关于正则表达式的知识,可以参考 正则表达式教程。
该页面包含所有特殊字符的列表以及许多有用的示例。
来源:https://blog.csdn.net/fengqianlang/article/details/129353330


猜你喜欢
- 本文实例讲述了js控制输入框获得和失去焦点时状态显示的方法。分享给大家供大家参考。具体实现方法如下:<!DOCTYPE html PU
- 平时写的一些 Python 的代码,需要在其他模块里面复用。最粗狂的方法就是直接 copy 过去。但这种方式太麻烦,copy 一堆代码,导致
- 前言说到 vue 中的 watch 方法,大家可能首先想到,它是用来监听数据的变化,一旦数据发生变化可以执行一些其他的操作。但是 watch
- 1、Mongoose模块(1)是一个对象模型工具,是对Node.js环境下操作MongoDB数据库进行了封装,可以将MongoDB数据库中的
- 我就废话不多说了,直接上代码吧!其实也不难,使用tertools.chain将参数链接起来即可import itertools...self
- 本文实例讲述了Python实现读取文件最后n行的方法。分享给大家供大家参考,具体如下:# -*- coding:utf8-*-import
- 前言最近在研究 pyecharts 的用法,它是 python 的一个可视化工具,然后就想着结合微信来一起玩不多说,直接看效果:
- Group By分组后选取每组最新的一条数据问题group by语句只会展示一条数据,而且很多时候并不会展示我们想要的数据,如何解决呢首先我
- 序章yield item这行代码会产出一个值,提供给next()的调用方;此外还会做出让步,暂停执行生成器,让调用方继续工作,知道需要使用另
- WebDriver有2个方法执行Java Script脚本。(1)同步执行:execute_script(2)异步执行:execute_as
- 前言如何通过python实现邮件解析?邮件的格式十分复杂,主要是mime协议,本文主要是从实现出发,具体原理可以自行研究。一、安装通过mai
- tomorrow是我最近在用的一个爬虫利器,该模块属于第三方的一个模块,使用起来非常的方便,只需要用其中的threads方法作为装饰器去修饰
- HTML文件 一、 设置编码UTF-8对于中文网页需要使用<meta charset="utf-8">声明编
- 这篇文章主要介绍了Python3的socket使用方法详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要
- 分享一个新增备案不关站的代码,这里只是转帖,没有亲自实验,如有问题请及时反馈。其实就是利用API接口的IP查询地址来限制首页不被所在省的IP
- python中@的用法@是一个装饰器,针对函数,起调用传参的作用。 有修饰和被修饰的区别,‘@function'作为一个装饰器,用来
- 1.问题复现:有时候我们去点击.py文件 文件里明明有打印信息,却一闪而过,没有任何显示比如以下内容#!/usr/local/bin/pyt
- 免责声明:本教程所有资源均来源于网络;仅用于学习交流,请勿用于任何商业行为;如需要,请使用正版授权;侵权联删。idea不同版本激活方法,ID
- Python中字符串前面我们经常看到加r(R)或u/(U)的前缀,而这两个符号是什么意思呢?1.r(R)r意为raw,表示不包含转义字符的原
- python 3.3 下载固定链接文件并保存。import urllib.requestprint ("downloading w