Mysql查询去空格的多种方法汇总
作者:Conquer_El 发布时间:2024-01-25 02:27:18
一、背景
最近系统线上数据库数据出现一个问题,发现某些字段存在一些异常的首尾空格,不管是使用trim对比还是like查询都查询不到具体的数据;在网上找了一些方法,最后发现一个去“不间断空格”的方法解决了问题,在这里做一下记录和汇总。
二、方法
1、trim()、ltrim()、rtrim()函数
语法:trim(字段) || trim([{BOTH | LEADING | TRAILING} [指定字符] FROM] 字段)
(1)trim()去除字段首尾空白字符,也可以去除指定字符
列子:去除商品零件号左右空格,以及指定字符,打印去除字符后的长度
select
p.parts_num as "零件号(包含首尾各3个空格)",
length(p.parts_num) as "原始长度",
trim(p.parts_num),
length(trim(p.parts_num)) as "去除左右空格后长度",
trim(leading ' 7' from p.parts_num),
length(trim(leading ' 7' from p.parts_num)) as "去除左边字符后长度",
trim(trailing '7 ' from p.parts_num),
length(trim(trailing '7 ' from p.parts_num)) as "去除右边字符后长度"
from
product p
where
p.product_id = "1941573845271945216";
结果:
(2)ltrim()去除左空格
select
p.parts_num as "零件号(包含首尾各3个空格)",
length(p.parts_num) as "原始长度",
ltrim(p.parts_num),
length(ltrim(p.parts_num)) as "去除左空格后长度"
from
product p
where
p.product_id = "1941573845271945216";
结果:
(3)rtrim()去除右空格
select
p.parts_num as "零件号(包含首尾各3个空格)",
length(p.parts_num) as "原始长度",
rtrim(p.parts_num),
length(rtrim(p.parts_num)) as "去除右空格后长度"
from
product p
where
p.product_id = "1941573845271945216";
结果:
2、replace()函数
语法:replace(object,search,replace)
(1)替换字段中指定字符为新字符
select
p.parts_num as "零件号(包含首尾各3个空格)",
length(p.parts_num) as "原始长度",
replace(p.parts_num, ' ', ''),
length(replace(p.parts_num, ' ', '')) as "替换空格后长度",
replace(p.parts_num, '7', '8') as "把7替换成8"
from
product p
where
p.product_id = "1941573845271945216";
结果:
(2)指定去除一下特殊字符
水平制表符:CHAR(9)、换行符:CHAR(10)、回车符:CHAR(13)
REPLACE(REPLACE(REPLACE(p.parts_num, CHAR(9), ''), CHAR(10), ''), CHAR(13), '')
3、convert()函数配合trim()函数(解决了我的问题)
(1)使用convert()先转换一些特殊编码的空格(unicode码位u+00a0的utf-8编码,也称为不间断空格)转换成常规空格(ASCII 中编码为0x20)
-- convert转换,trim去除
select TRIM(convert(0xC2A0 using utf8mb4) FROM p.parts_num);
-- 替换掉字符中的不间断空格
select TRIM(REPLACE(p.parts_num, convert(0xC2A0 using utf8mb4), ' '));
这些特殊空格一般常见于各文本编辑器(word、Excel等,刚好出现问题的业务存在Excel导入数据的场景),想要详细了解看下面推荐的文章。
补充:你不知道的空格
Level1: 半角空格
历史最悠久的空格,在1967年,ASCII 规范中被定义。
空格在 ASCII 中编码为0x20, 占位符为一个半角字符。在日常英文书写和代码编写中使用。
Level2: 全角空格
中文输入中的空格(标准说法为中日韩表意字符(CJK)中使用的宽空格)。和其他汉字一样,作为GBK的一个字符,其对应的unicode码为\u3000.宽
度是2个半角空格的大小。
例如:
先生孙先生
Level3: 不间断空格 ( non-breaking space )
unicode 为 \u00A0, 在代码中可能会出现的编码错误(utf8 编码0xC2 0xA0) 就是它了。
在Word中,会遇到一个有多个单词组成的词组被分割在两行文字中,这样很容易让人看不明白。这时候,不间断空格就可以上场了。
输入不间断空格,会将不间断空格连着的单词在一行展示。
举个例子:
上面英文使用了不间断空格,下面没有使用。所以上面的英文自动在一行展示,而下面没有。
在word中输入不间断空格的方式为: (Ctrl + Shift + Space)
除了在word等文本编辑软件中使用,其实不间断空格在html 中大量使用。 是html 中最为常见的空格。由于html页面中,如果有多个连着的半角空格,则空格只会展示一个。而使用 空格,则会显示占位半个自宽。
Level4: 零宽度空格 (ZERO WIDTH SPACE)
零宽度空格有两种
零宽度空格 unicode 编码为 \u200B.
不可见非打印字符。有了半角空格,也有了全角空格,其实还有零宽度空格。因为宽度为零,因此该字符是一个不可见字符。
这个编码虽然是不可见的,但是也是非常有用的。它可以替换html中的标签(软换行, html5 新增)。
零宽度非中断空格(ZWNBSP) unicode 编码为 \u2060 (之前使用\ufeff表示,unicode 3.2 开始 \ufeff 标记unicode文档的字节序。)
该空格结合了 non-breaking space 和 零宽度空格的特点。既会自动换行,宽度又是0。
零宽度空格(软换行)举例:
一行连续的英文编码:
<p style="font-size:100px;">phpIsTheBestProgramingLanguageInTheWorld</p>
而如果在每个可以换行的地方加上 <wbr />, 则可以在标记的最近的地方换行。
<p style="font-size:100px;">php<wbr />Is<wbr />The<wbr />Best<wbr />Programing<wbr />Language<wbr />In<wbr />The<wbr />World</p>
Level5: 其他空格字符空格
虽然已经有半角空格、全角空格,但是上面的空格如果字体变化了,不会随着字体的变化而变化。
因此,又有了可以随着字体的变化而变化的空格,简单罗列如下:
在html 的宽度度量中,有一种单位叫em,是按照字体大小定义的,下面的em也是字体的宽度。
打印字符的空格有很多种,罗列几个:
名称 | unicode 编码 | html 标记 | 特征和用途 |
---|---|---|---|
短空格 | \u2002 |   | html 中占位半个字 |
长空格 | \u2003 |   | html 中占位一个字 |
1/3em空格 | \u2004 |   | 占用1/3个空格 |
1/4em空格 | \u2005 |   | 占用1/4个空格 |
1/6em空格 | \u2006 |   | 占用1/6个空格 |
数样间距 (figure space) | \u2007 |   | 在等宽字体中,宽度是一个字符的宽度。 |
行首前导空格 (punctuation space) | \u2008 |   | 宽度约为 0x20 的宽度。 |
瘦弱空格 (thin space) | \u2009 |   | 宽度是 全角打印空格的 1/5 或者 1/6 (宽度不定,法文设置为1/8), 主要用在打印两个空的引号之间。 |
hair space | \u200a |   | (浏览器目前不支持), 最窄的空格,推荐标准为 (1/10, 1/16) |
narrow no-break space | \u202f | &nnbsp; | 和0a 类似,不同语种中不太一样。 |
medium mathematical space | \u205f | &mediumspace; | 在格式化数学公式时使用。是 4/18 的 em宽度,例如:"a + b"中,a 和+ 之间应该用 这个空格 |
总结
来源:https://blog.csdn.net/Conquer__EL/article/details/126656136


猜你喜欢
- pymysql模块的使用查询一条数据fetchone()from pymysql import *conn = connect(  
- 在django1.9之前,数据库同步只需要一条命令:python manage.py syncdb在djang1.9以后,数据库同步执行指令
- 本文实例讲述了Python读写及备份oracle数据库操作。分享给大家供大家参考,具体如下:最近项目中需要用到Python调用oracle实
- 开发工具**Python版本:**3.6.4相关模块:pyecharts模块;以及一些Python自带的模块。环境搭建安装Python并添加
- urllib3是一款Python 3的HTTP客户端。Python标准库提供了urllib。在Python 2中,另外提供了urllib2;
- 前言在 Go 语言中,有一种特殊的用法可能让许多人感到困惑,那就是空结构体 struct{}。在本文中,我将对
- 学习 Python 使程序员能够专注于解决问题,而不是专注于语法,其丰富的库赋予它完成伟大任务所需的力量。1. IDLE使得在 Python
- pyecharts介绍pyecharts是python与echarts链接,一个用于生成Echarts图标的第三方库,pyecharts分为
- Q&AQ: .js和.min.js文件分别是什么?A: .js是JavaScript 源码文件, .min.js是压缩版的js文件。
- 一、效果图如下二、使用步骤1.创建并配置一个django项目1.1新建一个项目ch3django-admin startproject ch
- 你搜索这个,你会发现好多都是np.zeros(5,2),嗯都是复制的一个国外的帖子,然而没有翻译人家的话。然后你愤怒的关闭页面。这简直就是文
- 呵,以前也没考虑过这方面的东西,现在写的代码越来越多,越来越复杂,如果再不把不用的变量及时释放掉,到时肯定会出问题。今天无意中在无忧Q群里看
- 一:编译器 编译器是一种特殊的程序,它可以把以特定编程语言写成的程序变为机器可以运行的机器码。我们把一个程序写好,这时我们利用的环境是文本编
- 今天学习了如何使用pygame来制作小游戏,下面是五子棋的代码,我的理解都写在注释里了import pygame# 导入pygame模块pr
- 小书学习的主要方向是TensorFlow和Pytorch,今天就来安装一下Pytorch。第一步:去官网看看Pytorch官网:(https
- 在数据库中有时我们可能需要对一些数据进行处理,例如四舍五入、直接舍去后面的几位等,其实很简单,都是有现成的函数,我们只需要套用就行了:sel
- Python爬虫可以爬取的东西有很多,Python爬虫怎么学?简单的分析下:如果你仔细观察,就不难发现,懂爬虫、学习爬虫的人越来越多,一方面
- 这段时间遇到一个需求是如果库里面有没有图片的数据,则访问我们的网站生成图片数据并更新库,要求每隔一段时间就要检测。该需求主要为两个部分:一是
- 首先还是应该科普下函数参数传递机制,传值和传引用是什么意思?函数参数传递机制问题在本质上是调用函数(过程)和被调用函数(过程)在调用发生时进
- 本教程主要介绍css的基础知识,将逐个讲解css的各个属性,过程可能比较枯燥,但会尽力多举例说明.作者的网站:http://jorux.co