golang 获取字符串长度的案例
作者:王者之路001 发布时间:2024-04-27 15:40:47
1.不同字符与获取字符串长度
获取字符串长度,是字符串操作的重要方法。理论来说,获取字符串长度,只要从头到尾查找一遍就可以了。但遗憾的是,不同字符具有不同的编码格式。拉丁字母一个字符只要一个字节就行,而中文则可能需要两道三个字节;UNICODE把所有字符设置为2个字节,UTF-8格式则把所有字符设置为1--3个字节。
因此,字符串长度的获得,不等于按字节数查找,而要根据不同字符编码查找。
2.golang中获取字符串长度的方法
对于中文开发者来说,经常需要对字符串进行长度判断。golang有自己的默认判断长度函数len();但遗憾的是,len()函数判断字符串长度的时候,是判断字符的字节数而不是字符长度。因此,在中文字符下,应该采用如下方法:
1)使用 bytes.Count() 统计
2)使用 strings.Count() 统计
3)将字符串转换为 []rune 后调用 len 函数进行统计
4)使用 utf8.RuneCountInString() 统计
3.样例展示
s := "欢迎学习Go的len()函数"
r := []rune(strTest)
fmt.Println(len(r))
fmt.Println(len(s))
fmt.Println(bytes.Count([]byte(s), nil) - 1)
fmt.Println(strings.Count(s, "") - 1)
fmt.Println(utf8.RuneCountInString(s))
补充:Go语言获取中英文混和字符串的长度以及子字符串的方法
1. 纯英文字符串
使用len()函数。
testString1 := "China!"
length1 := len(testString1)
fmt.Printf("testString1 字符串的长度是:%d", length1)
长度是6。
2. 中英文混合字符串
2.1 先使用len()函数。
testString2 := "我爱你中国,我爱你China!"
length2 := len(testString2)
fmt.Printf("字符串的长度是:%d", length2)
fmt.Printf("testString2字符串的长度是:%d\n", length2)
fmt.Printf("testString2中的最后一个字符是:%s\n", testString2[length2-1])
fmt.Printf("testString2中的最后一个字符是:%c\n", testString2[length2-1])
fmt.Printf("testString2中的下标6-末尾的子字符串是:%s\n",testString2[:15])
fmt.Printf("testString2中的下标6-末尾的子字符串是:%s\n",testString2[:16])
这种方法的到的是字节数。Go语言中,中文字符按utf-8编码,占3字节,故长度是31。故此方法不适用统计中英文混合或者中文字符串长度。
2.2 使用utf8.RuneCountInString()方法。
testString2 := "我爱你中国,我爱你China!"
length3 := utf8.RuneCountInString(testString2)
fmt.Printf("使用utf8中的方法统计的字符串长度是:%d\n", length3)
此方法可统计字符数,输出结果是15。
2.3 转成[]rune类型,再对此类型进行操作
testString2 := "我爱你中国,我爱你China!"
temp := []rune(testString2)
length4 := len(temp)
fmt.Printf("使用rune统计的字符串的长度是:%d\n", length4)
//获取字符串中最后一个字符
lastChar := string(temp[length4-1])
//获取下标从0到3(不包括3)的子串
subString1 := temp[0:3]
subString2 := temp[6:9]
fmt.Printf("testString2中的最后一个字符是:%s\n", lastChar)
fmt.Printf("testString2中的下标0-2的子字符串是:%s\n",string(subString1))
fmt.Printf("testString2中的下标6-8的子字符串是:%s\n",string(subString2))
此方法也可输出字符个数15。但是此方法能获取指定下标范围的子字符串,也能获取指定下标位置的字符。比第二种方法方便。
3.示例代码
package main
import (
"fmt"
"unicode/utf8"
)
func main() {
//纯英文
testString1 := "China!"
length1 := len(testString1)
fmt.Printf("testString1字符串的长度是:%d\n", length1)
lastCharA := testString1[length1-1]
//此处用%s格式输出最后一个字符会出错,只能用%c
fmt.Printf("testString1字符串中最后一个字符是:%s\n", lastCharA)
fmt.Printf("testString1字符串中最后一个字符是:%c\n", lastCharA)
fmt.Printf("testString1中的下标0-2的子字符串是:%s\n",testString1[0:3])
fmt.Printf("testString1中的下标3-末尾的子字符串是:%s\n",testString1[3:])
fmt.Println()
//中英文加一起15个字符
testString2 := "我爱你中国,我爱你China!"
//此处长度是输出字节数,Go语言中文字符是UTF-8编码,长度3字节,故此处应该是15+1+9+6=31
length2 := len(testString2)
fmt.Printf("testString2字符串的长度是:%d\n", length2)
fmt.Printf("testString2中的最后一个字符是:%s\n", testString2[length2-1])
fmt.Printf("testString2中的最后一个字符是:%c\n", testString2[length2-1])
fmt.Printf("testString2中的下标6-末尾的子字符串是:%s\n",testString2[:15])
fmt.Printf("testString2中的下标6-末尾的子字符串是:%s\n",testString2[:16])
fmt.Println()
//此处就是统计字符数
length3 := utf8.RuneCountInString(testString2)
fmt.Printf("使用utf8中的方法统计的字符串长度是:%d\n", length3)
fmt.Println()
//转成rune类型,再统计字符数
temp := []rune(testString2)
//获取中英文混合字符串长度
length4 := len(temp)
fmt.Printf("使用rune统计的字符串的长度是:%d\n", length4)
//获取字符串中最后一个字符
lastCharB := string(temp[length4-1])
//获取下标从0到3(不包括3)的子串
subString1 := temp[0:3]
subString2 := temp[6:]
fmt.Printf("testString2中的最后一个字符是:%s\n", lastCharB)
fmt.Printf("testString2中的下标0-2的子字符串是:%s\n",string(subString1))
fmt.Printf("testString2中的下标6-末尾的子字符串是:%s\n",string(subString2))
}
4. 示例结果
总结
如果是对中英文进行操作,建议用第三种方式。先转成rune[]型,再进行操作。
以上为个人经验,希望能给大家一个参考,也希望大家多多支持asp之家。如有错误或未考虑完全的地方,望不吝赐教。
来源:https://blog.csdn.net/wangzhezhilu001/article/details/94436579


猜你喜欢
- 在程序中,经常需要将⼀组(通常是同为某个类型的)数据元素作为整体 管理和使⽤,需要创建这种元素组,⽤变量记录它们,传进传出函数等。 ⼀组数据
- 痛点在传统的工作中,发送会议纪要是一个比较繁琐的任务,需要手动输入邮件内容、收件人、抄送人等信息,每次发送都需要重复操作,不仅费时费力,而且
- 前言本博客默认读者对神经网络与Tensorflow有一定了解,对其中的一些术语不再做具体解释。并且本博客主要以图片数据为例进行介绍,如有错误
- 设计页面时,经常会从一个页面打开一个子窗口以供浏览者查看。通常,这种子窗口中的内容一经浏览者看过,对于浏览者而言就不再需要,而他们常常会忘记
- 至于对好广告的评判,不同的人有不同的标准,一些人认为那些打动人、有新意、有共鸣的广告是好广告,另一些人的观点则是:观众喜欢与否,不是广告好与
- 背景公司一个golang的项目,使用到了公司的私有仓库,去执行go mod tidy(下载依赖)的时候,到download公司私有库的时候就
- 如下所示:def signal_xHz(A, fi, time_s, sample):return A * np.sin(np.linspa
- 输入框Input 应当符合逻辑地划分为小组,这样大脑就可以很好的处理大堆区域间的关系。 ——《HTML权威指南》Web 应用程序总是利用表单
- 一、算法构造1.简单介绍一下knn算法KNN算法,也叫K最近邻算法。功能是分类。算法逻辑非常简单,说直白点就是:先找到跟你最近的k个邻居(假
- 在前文说过,如果想要更好的做接口测试,我们要利用自己的代码基础与代码优势,所以该章节不会再介绍商业化的、通用的接口测试工具,重点介绍如何通过
- 在一个网页中,不仅仅只有一个html骨架,还需要css样式文件,js执行文件以及一些图片等。因此在DTL中加载静态文件是一个必须要解决的问题
- 本文实例为大家分享了JavaScript实现简单省市联动的具体代码,供大家参考,具体内容如下步骤* 创建一个页面,有两个下拉选择框 
- 安装laravel框架命令行cd进入指定目录下,执行composer create-project --prefer-dist larave
- 1.前言面向对象编程的三大特性:封装、继承、多态。可见继承是面向对象程序设计中一个重要的概念。Go 作为面向对象的编程语言,自然也支持继承。
- 1 用mysql客户端登入 2 选择数据库 mysql>use test 3 查询当前数据库有哪些存储过程 mysql>show
- 错误出现:导入数据时出现“SqlDateTime 溢出。必须介于 1/1/1753 12:00:00 AM 和 12/31/9999 11:
- PyCaret 是一个开源、低代码的 Python 机器学习库,可自动执行机器学习工作流。它是一种端到端的机器学习和模型管理工具,可以以指数
- .whl文件解释whl文件时以wheel格式保存的python安装包,Wheel是Python发行版的标准内置包格式。WHL文件包含Pyth
- 修改字符串本身是不可能的,因为字符串是不可变类型,只能是通过某些方法来产生它的副本。再把副本赋值给原字符串,达到类似替换的作用。这里介绍几种
- Pyqt5安装并配置到pycharm方法:教你如何用pycharm安装pyqt5及其相关配置一、简介QLabel是界面中的标签类,继承自QF