Python 字符串操作详情
作者:一碗周 发布时间:2023-02-04 19:03:59
1、字符串的定义
所谓字符串,就是由0个或者多个字符组成的有限序列。
在Python
程序中,如果我们把单个或多个字符用单引号''或者双引号""包裹起来,就可以表示一个字符串,也可以用三个单引号或者双引号进行折行。字符串的字符可以是特殊符号、英文字母、中文字符、日文的平假名或片假名、希腊字母、Emoji字符等等。
如下代码展示了Python
中的字符串:
text1 = "这是用双引号包裹的字符串"
text2 = '这是用单引号包裹的字符串'
text3 = """
这一个是那个三个引号包裹的字符串
可以保留原来的格式
"""
print(text1)
print(text2)
print(text3)
代码运行结果如下:
这是用双引号包裹的字符串
这是用单引号包裹的字符串这一个是那个三个引号包裹的字符串
可以保留原来的格式
2、转义字符串和原始字符串
Python
中使用反斜杠“”
来表示转义,也就是说后面的内容就不会是原始的内容了,例如\n
则表示换行,而不再表示和字符n
了;所以如果字符串本身包含了 '、"、
这些特殊的字符,必须要通过``进行转义处理。
示例代码如下所示:
text1 = "\'Hello world\'" # 输出被单引号包裹的Hello world
text2 = '\\Hello world\\' # 输出被两个反斜线包裹的Hello world
print(text1)
print(text2)
下面展示了python
中的一些转义字符:
原始字符串是Python
中一类比较特殊的字符串,以大写字母R或者小写字母r
开始。在原始字符串中,字符“\”
不再表示转义字符的含义。
示例代码如下所示:
text1 = "古之立大事者,\n不惟有超世之才,\n亦必有坚忍不拔之志"
text2 = r"古之立大事者,\n不惟有超世之才,\n亦必有坚忍不拔之志"
print(text1)
print(text2)
运行代码如下所示:
古之立大事者,
不惟有超世之才,
亦必有坚忍不拔之志
古之立大事者,\n不惟有超世之才,\n亦必有坚忍不拔之志
3、字符串的运算
Python
为字符串类型提供了非常多的运算符
3.1 拼接运算符
使用+运算符来实现字符串的拼接,使用*运算符来重复一个字符串的内容
text1 = "Hello,world"
text2 = "!"
print(text1 + text2) # Hello,world!
print(text2 * 10) # !!!!!!!!!!
用*实现字符串的重复是很重要,比如要打印一个分隔线如果写成---------------会很麻烦的,但是如果用- * 20就很简单了
3.2 成员运算
Python
中可以用in和not in
判断一个字符串中是否存在另外一个字符或字符串,in
和not in
运算通常称为成员运算,会产生布尔值True
或False
text1 = "Hello,world"
text2 = "一碗周"
print("llo" in text1) # True
print("周" not in text2) # False
print("粥" not in text2) # True
4、获取字符串长度
通过内置函数len()
来获取字符的长度
text1 = "Hello,world"
text2 = "一碗周"
print(len(text1)) # 11
print(len(text2)) # 3
5、索引和切片
如果在字符串中引用某个字符,可以对字符从进行索引运算(注:Python的索引值是从0开始的),运算符是[n],其中n是一个整数,假设字符串的长度为N,那么n可以是从0到N-1的整数,其中0是字符串中第一个字符的索引,而N-1是字符串中最后一个字符的索引,通常称之为正向索引;在Python
中,字符串的索引也可以是从-1到-N的整数,其中-1是最后一个字符的索引,而-N则是第一个字符的索引,通常称之为负向索引。
值得注意的是,因为字符串是不可变类型,所以不能通过索引运算修改字符串中的字符。
text1 = "Hello,world"
text2 = "一碗周"
N1 = len(text1)
N2 = len(text2)
# 获取第一个字符
print(text1[0], text1[-N1]) # H H
print(text2[0], text2[-N2]) # 一 一
# 获取最后一个字符
print(text1[N1 - 1], text1[-1]) # d d
print(text2[N2 - 1], text2[-1]) # 周 周
# 获取索引为2和-2的字符
print(text1[2], text1[-2]) # l l
print(text2[2], text2[-2]) # 周 碗
注意:如果索引越界(即索引值不在索引范围内)会引起错误,例如
print(text2[222])
错误信息如下:
IndexError: string index out of range # (字符串索引超出范围)
如果要取出多个字符,要对字符串进行切片,运算符是[i:j:k]
,其中i是开始索引,索引对应的字符可以不能取到N-1或者-1;j是结束索引,索引对应的字符不能取到0或者-N;k是步长,默认值为1,表示从前向后获取相邻字符的连续切片(可以省略),如果k的值为正数,即为正向索引;如果k的值为负数,即为负向索引。
s = '123456789abcdef,一碗周'
# i=3, j=6, k=1的正向切片操作
print(s[3:6]) # 456
# i=-17, j=-14, k=1的正向切片操作
print(s[-17:-14]) # 456
# i=16, j=默认, k=1的正向切片操作
print(s[16:]) # 一碗周
# i=-4, j=默认, k=1的正向切片操作
print(s[-3:]) # 一碗周
# i=8, j=默认, k=2的正向切片操作
print(s[8::2]) # 9bdf一周
# i=-12, j=默认, k=2的正向切片操作
print(s[-12::2]) # 8ace,碗
# i=默认, j=默认, k=2的正向切片操作
print(s[::2]) # 13579bdf一周
# i=默认, j=默认, k=1的正向切片
print(s[:]) # 123456789abcdef,一碗周
# i=1, j=-1, k=2的正向切片操作
print(s[1:-1:2]) # 2468ace,碗
print("-"*20)
# i=7, j=1, k=-1的负向切片操作
print(s[7:1:-1]) # 876543
# i=-13, j=-19, k=-1的负向切片操作
print(s[-13:-19:-1]) # 876543
# i=8, j=默认, k=-1的负向切片操作
print(s[8::-1]) # 987654321
# i=默认, j=1, k=-1的负向切片操作
print(s[:15:-1]) # 周碗一
# i=默认, j=默认, k=-1的负向切片
print(s[::-1]) # 周碗一,fedcba987654321
# i=默认, j=默认, k=-2的负向切片
print(s[::-2]) # 周一fdb97531
i的默认值为最开始的那个数,j的默认值为结束的那个数(包括本身)
值得注意的是,返回的字符串是包括i不包括j的。
6、字符串的方法
在Python
中使用字符串的类型自带的方法对字符串进行处理和操作,对于一个字符串类型的变量,使用变量名.方法名()的方式来调用它的方法。所谓方法其实就是跟某个类型的变量绑定的函数。
6.1 转换大小写
s1 = 'hello, world!'
# 使用capitalize方法获得字符串首字母大写后的字符串
print(s1.capitalize()) # Hello, world!
# 使用title方法获得字符串每个单词首字母大写后的字符串
print(s1.title()) # Hello, World!
# 使用upper方法获得字符串大写后的字符串
print(s1.upper()) # HELLO, WORLD!
s2 = 'GOODBYE'
# 使用lower方法获得字符串小写后的字符串
print(s2.lower()) # goodbye
6.2 查找操作
如果想在一个字符串中从前向后查找有没有另外一个字符串,可以使用字符串的find
或index
方法。
s = 'hello, world!'
# find方法从字符串中查找另一个字符串所在的位置
# 找到了返回字符串中另一个字符串首字符的索引
print(s.find('or')) # 8
# 找不到返回-1
print(s.find('shit')) # -1
# index方法与find方法类似
# 找到了返回字符串中另一个字符串首字符的索引
print(s.index('or')) # 8
# 找不到引发异常
print(s.index('shit')) # ValueError: substring not found
在使用find
和index
方法时还可以通过方法的参数来指定查找的范围,就是不必从索引0的位置开始。``find和index方法还有逆向查找(从后向前查找)的版本,分别是rfind
和rindex
`
s = 'hello good world!'
# 从前向后查找字符o出现的位置(相当于第一次出现)
print(s.find('o')) # 4
# 从索引为5的位置开始查找字符o出现的位置
print(s.find('o', 5)) # 7
# 从后向前查找字符o出现的位置(相当于最后一次出现)
print(s.rfind('o')) # 12
6.3性质判断
可以通过字符串的startswith
、endswith
来判断字符串是否以某个字符串开头和结尾;还可以用is开头的方法判断字符串的特征,这些方法都返回布尔值。
s1 = 'hello, world!'
# startwith方法检查字符串是否以指定的字符串开头返回布尔值
print(s1.startswith('He')) # False
print(s1.startswith('hel')) # True
# endswith方法检查字符串是否以指定的字符串结尾返回布尔值
print(s1.endswith('!')) # True
s2 = 'abc123456'
# isdigit方法检查字符串是否由数字构成返回布尔值
print(s2.isdigit()) # False
# isalpha方法检查字符串是否以字母构成返回布尔值
print(s2.isalpha()) # False
# isalnum方法检查字符串是否以数字和字母构成返回布尔值
print(s2.isalnum()) # True
6.4格式化字符串
在Python中,字符串类型可以通过center
、ljust
、rjust
方法做居中、左对齐和右对齐的处理。
s = 'hello, world'
# center方法以宽度20将字符串居中并在两侧填充*
print(s.center(20, '*')) # ****hello, world****
# rjust方法以宽度20将字符串右对齐并在左侧填充空格
print(s.rjust(20)) # hello, world
# ljust方法以宽度20将字符串左对齐并在右侧填充~
print(s.ljust(20, '~')) # hello, world~~~~~~~~
Python2.6
开始,新增了一种格式化字符串的函数 str.format()
,它增强了字符串格式化的功能。
基本语法是通过 {}
和 :
来代替以前的 %
。
a = 111
b = 222
print('{0} + {1} = {2}'.format(a, b, a + b)) # 111 + 222 = 333
c = "hello"
d = "world"
# 不设置指定位置,按默认顺序
print("{} {}".format(c, d)) # hello world
print("{0} {1}".format(c, d)) # hello world
print("{1} {0}".format(d, c)) # hello world
print("{1} {0} {1}".format(c, d)) # world hello world
从Python 3.6
开始,格式化字符串还有更为简洁的书写方式,就是在字符串前加上f来格式化字符串,在这种以f打头的字符串中,{变量名}是一个占位符,会被变量对应的值将其替换掉。
a = 111
b = 222
print(f"{a} + {b} = {a + b}") # 111 + 222 = 333
c = "hello"
d = "world"
print(f"{c} {d}") # hello world
对数字格式化的多种操作
分别是居中、左对齐、右对齐,后面带宽度,:号后面带填充的字符,只能是一个字符,不指定则默认是用空格填充。
+
表示在正数前显示+
,负数前显示 -
; (空格)表示在正数前加空格 b、d、o、x 分别是二进制、十进制、八进制、十六进制。
7、修剪操作
strip()
方法用于移除原字符串修剪掉左右指定的字符(默认为空格或换行符)或字符序列。这个方法非常有实用价值,通常用来将用户输入中因为不小心键入的头尾空格去掉,strip
方法还有lstrip
(即left strip)和rstrip
(即right strip)两个版本。
s = ' 一碗周 \t\n'
# strip方法获得字符串修剪左右两侧空格之后的字符串
print(s.strip()) # 一碗周
s1 = "!!!一碗周!!!"
print(s1.lstrip("!")) # 一碗周!!!
print(s1.rstrip("!")) # !!!一碗周
来源:https://juejin.cn/post/7022981375586205709


猜你喜欢
- 本节内容:本节内容是根据上学期所上的模式识别课程的作业整理而来,第一道题目是Kmeans聚类算法,数据集是Iris(鸢尾花的数据集),分类数
- 在开始聊我在阿里四个月的网页推广设计之前,我想先来说说我对平面设计和网页设计的认识。它们之间的交集。它们都是集艺术创作、电脑技术和数字技术于
- django的表单系统,分2种基于django.forms.Form的所有表单类的父类基于django.forms.ModelForm,可以
- EasyUI 简介easyui是一种基于jQuery的用户界面插件集合。easyui为创建现代化,互动,JavaScript应用程序,提供必
- 一,问题因为我想在我的服务器上部署两个vue项目,但是vue打包后默认的项目名是dist,这样子就跟我上一个vue项目冲突了。因此查了一下资
- MySQL各版本,对于add Index的处理方式是不同的,主要有三种:(1)Copy Table方式这是InnoDB最早支持的创建索引的方
- What do the ->, => and :: symbols mean?The -> is the "in
- 基本模块 python爬虫,web spider。爬取网站获取网页数据,并进行分析提取。基本模块使用的是 urllib,urlli
- asp.net的dropdownlist控件为我们的web应用提供了许多用处,但有一点我总感觉不爽的就是在使用dropdownlist的事件
- 小编今天写下关于后台管理员权限的分配自己的思路想法<?php /**reader * 小编的思想比较简单实现的功能
- 一、案例分析我们先思考一下,实现扫码工具需要写什么操作。在扫码过程中我们需要打开摄像头,如何由手机或者电脑识别二维码。所以我们要实现两个关键
- 文章介绍OpenCV 库中包含很多运算函数,这里着重介绍按位运算的基本原理并举例说明。本篇文章中主要涉及到的函数有:按位与:bitwise_
- 我就废话不多说了,大家还是直接看代码吧~代码如下type KDRespBody struct { Errcode int `j
- 一、爬虫的流程开始学习爬虫,我们必须了解爬虫的流程框架。在我看来爬虫的流程大概就是三步,即不论我们爬取的是什么数据,总是可以把爬虫的流程归纳
- 本文实例讲述了wxPython中listbox用法。分享给大家供大家参考。具体如下:# load a listbox with names,
- 早上一开Google Reader,发现已经全部被Silverlight 3的消息占领了,基本上都来自于Silverlight
- 本文为 djangorestframework-simplejwt 使用记录。(官方文档) 1. 安装 pip inst
- few-shot learning的采样Few-shot learning 基于任务对模型进行训练,在N-way-K-shot中,一个任务中
- 直接奔入主题看下面pywebio程序,实现了Python的简陋在线编辑器from pywebio.input import *from py
- <?php /*============================文件说明===========================