位置：首页>> 网络编程>> Python编程>> python正则过滤字母、中文、数字及特殊字符方法详解

python正则过滤字母、中文、数字及特殊字符方法详解

作者：jlulxg　　发布时间：2022-02-20 10:14:47　

标签：python,正则,中文

去除数字，特殊字符，只保留汉字

import re

s = '1123*#$ 中abc国'
str = re.sub('[a-zA-Z0-9'!"#$％&\'()*+,-./:;<=>?@，。?★、…【】《》？“”‘'！[\\]^_`{|}~\s]+', "", s)
# 去除不可见字符
str = re.sub('[\001\002\003\004\005\006\007\x08\x09\x0a\x0b\x0c\x0d\x0e\x0f\x10\x11\x12\x13\x14\x15\x16\x17\x18\x19\x1a]+', '', x)
print(str)
# 结果为：中国

去除特殊字符，只保留汉子，字母、数字

import re
string = "123我123456abcdefgABCVDFF？/ ，。,.:;:''';'''[]{}()（）《》"
print(string)
123我123456abcdefgABCVDFF？/ ，。,.:;:''';'''[]{}()（）《》
sub_str = re.sub(u"([^\u4e00-\u9fa5\u0030-\u0039\u0041-\u005a\u0061-\u007a])","",string)
print(sub_str)
123我123456abcdefgABCVDFF

正则表达式说明

函数	说明
sub(pattern,repl,string)	把字符串中的所有匹配表达式pattern中的地方替换成repl
[^**]	表示不匹配此字符集中的任何一个字符
\u4e00-\u9fa5	汉字的unicode范围
\u0030-\u0039	数字的unicode范围
\u0041-\u005a	大写字母unicode范围
\u0061-\u007a	小写字母unicode范围
\uAC00-\uD7AF	韩文的unicode范围
\u3040-\u31FF	日文的unicode范围

来源：https://blog.csdn.net/jlulxg/article/details/84650683

0

投稿

猜你喜欢

python字符串操作详析
字符串是不可变类型，可以重新赋值，但不可以索引改变其中一个值，只能拼接字符串建立新变量索引和切片索引：越界会报错切片：越界会自动修改不包含右
python高效过滤出文件夹下指定文件名结尾的文件实例
如下所示：import osdef anyTrue(predicate, sequence):return True in map(pred
js 判断一组日期是否是连续的简单实例
这是群里一朋友问的问题，当时我说判断下 day 是否相邻即可，后来细想，发现完全不对。问题需求给定5个相同格式的日期，怎么判断是否是连续5天
OpenCV图像颜色反转算法详解
前言图像颜色的反转,比较简单的思路就是使用255减去当前值,从而得到反转后的图像.原始图片: 1.灰度图像的颜色反转import cv2im
微信小程序学习笔记之本地数据缓存功能详解
本文实例讲述了微信小程序学习笔记之本地数据缓存功能。分享给大家供大家参考，具体如下：前面介绍了微信小程序获取位置信息操作。这里再来介绍一下微
python thrift 实现单端口多服务的过程
Thrift 是一种接口描述语言和二进制通信协议。以前也没接触过，最近有个项目需要建立自动化测试，这个项目之间的微服务都是通过 Thrift
你们要的Python绘画3D太阳系详细代码
用Python画一个平面的太阳系得到一些朋友的欣赏，然后有同学提出了绘制三维太阳系的要求。从Python画图的角度来说，三维太阳系其实并不难
利用python设计图像加密技术(Arnold算法)
下面展示了图像的加密和解密过程（左边是输入图像，中间是加密后的结果，右边是解密后的图像）：1、加密算法要求（1）加密算法必须是可逆的，拥有配
Python常用模块之requests模块用法分析
本文实例讲述了Python常用模块之requests模块用法。分享给大家供大家参考，具体如下：一. GET请求1.访问一个页面import
如何在ADSI中查询用户属性？
如何在ADSI中查询用户属性？看看下面这个返回用户可用属性的代码实例，基本上返回了大部分可用的用户属性：<％Dim x&nb
深入浅出SQL嵌套SELECT语句
嵌套SELECT语句也叫子查询，形如：SELECT name FROM bbc WHERE region = (SELECT region
由日文出错的Bug，重新认识 Replace 函数
上次我重新修改了UBB的转换后，又很多朋友反映日文显示的时候出错了。我在本地测试了一下，结果出现了 Invalid procedure ca
Asp WinHttp.WinHttpRequest.5.1 对象使用详解
使用 WinHttpRequest 伪造 HTTP 头信息，伪造 Referer 等信息。由于微软封锁了 XmlHttp 对象，所以无法伪造
JavaScript实现计算圆周率到小数点后100位的方法示例
本文实例讲述了JavaScript实现计算圆周率到小数点后100位的方法。分享给大家供大家参考，具体如下：浮点数的有效数位是16位，我自己做
JavaScript实现网页动态生成表格
JavaScript(JS)网页–动态生成表格，供大家参考，具体内容如下在网页中，动态生成列表的内容，将数组中的object加入到列表中（没
如何写JS数组sort的比较函数
我们知道，数组的sort方法可以对数组元素进行排序，默认是按ASCII字母表顺序排序。如果要根据其他的顺序排序就需要为sort方法提供一个比
Python实现桌面翻译工具【新手必学】
Python 用了好长一段时间了，起初是基于对爬虫的兴趣而接触到的。随着不断的深入，慢慢的转了其它语言，毕竟工作机会真的太少了。很多技能长时
网马解密大讲堂——网马解密中级篇(Freshow工具使用方法)
阅读上一篇：网马解密大讲堂——网马解密初级篇今天主要讲解的内容是Freshow工具的使用方法，工欲善其事,必先利其器，首先要学会如何使用解密
JavaScript体验异步更好的解决办法
一、异步解决方案的进化史JavaScript的异步操作一直是个麻烦事，所以不断有人提出它的各种解决方案。可以追溯到最早的回调函数(ajax老
详解Python流程控制语句
流程控制流程:代码执行的过程控制:对代码执行过程的把控三大结构顺序结构:代码默认从上到下,依次执行分支结构:单项分支,双向分支,多项分支,巢

Ranorex通过Python将报告发送到邮箱的方法

纯numpy卷积神经网络实现手写数字识别的实践

Python通过format函数格式化显示值

pip install如何指定包的安装路径

解决安装pycharm后不能执行python脚本的问题

python出现RuntimeError错误问题及解决

python实现将元祖转换成数组的方法

python数据可视化Pyecharts库sankey修改桑葚图颜色

python命令行解析之parse_known_args(）函数和parse_args()使用区别介绍

python实现猜拳游戏项目

跑跑卡丁车手游冰峰裂谷宝藏在什么地方-冰峰裂谷宝箱位置坐标分享

使用iPhone SE2玩游戏时如何能不被打扰？

Windows更新失败错误代码0x800f0911怎么办？

在Python 中同一个类两个函数间变量的调用方法

word怎么安装字体

Excel2007中表格常用设置的操作方法

恶果之地三头蛇BOSS怎么打比较好？

pytorch中tensor张量数据类型的转化方式

文字脑洞诡异医院2找到12处诡异的地方怎么过

在excel图表中显示数值

手机版 网络编程 asp之家 www.aspxhome.com