Python分割单词和转换命名法的实现
作者:梦未 发布时间:2023-11-24 00:06:16
分割单词
将一个标识符分割成若干单词存进列表,便于后续命名法的转换
先引入正则表达式包
import re
至于如何分割单词看个人喜好,如以常见分隔符 “ ”、“_”、“-”、“/”、“\” 去分割
re.split('[ _\-/\\\\]+', name)
还可以范围再广一点,拿除了数字和字母以外的所有字符去分割
re.split('[^0-9a-zA-Z]', name)
那对于字母内部怎么分割呢?
综合考虑驼峰命名法、连续大写的缩写单词等,笔者根据经验一般会采用这种策略,连续比较三个字符,满足以下条件之一就分割:“小|大无”、“有|大小”、“小|大有”
是尾字符,是大写,倒数第二个字符是小写,在尾字符前分割,比如 'getA' 分割成 ['get','A']
是非首位的中间字符,是大写,前后至少有一个是小写,在该字符前分割,比如 'getJSONString' 分割成 ['get','JSON','String']
对于字母和数字结合的标识符,就比较难处理了
因为有的数字可以作为单词开头(比如 '3D'),有的又可以作为结尾(比如 'HTML5'),还有的字母数字交错(比如 'm3u8'),暂未想到通用的分割的好办法,根据个人需求实现就行了
综合以上几者的分割函数如下
def to_words(name):
words = [] # 用于存储单词的列表
word = '' # 用于存储正在构建的单词
if(len(name) <= 1):
words.append(name)
return words
# 按照常见分隔符进行分割
# name_parts = re.split('[ _\-/\\\\]+', name)
# 按照非数字字母字符进行分割
name_parts = re.split('[^0-9a-zA-Z]', name)
for part in name_parts:
part_len = len(part) # 字符串的长度
word = ''
# 如果子串为空,继续循环
if not part:
continue
for index, char in enumerate(part):
# “小|大无”
if(index == part_len - 1):
if(char.isupper() and part[index-1].islower()):
if(word): words.append(word)
words.append(char)
word = ''
continue
# “有|大小”或“小|大有”
elif(index != 0 and char.isupper()):
if((part[index-1].islower() and part[index+1].isalpha()) or (part[index-1].isalpha() and part[index+1].islower())):
if(word): words.append(word)
word = ''
word += char
if(len(word) > 0): words.append(word)
# 去除空单词
return [word for word in words if word != '']
测试用例如下
print(to_words('IDCard')) # ['ID', 'Card']
print(to_words('getJSONObject')) # ['get', 'JSON', 'Object']
print(to_words('aaa@bbb.com')) # ['aaa', 'bbb', 'com']
print(to_words('D://documents/data.txt')) # ['D', 'documents', 'data', 'txt']
分割成全小写单词
def to_lower_words(name):
words = to_words(name)
return [word.lower() for word in words]
分割成全大写单词
def to_upper_words(name):
words = to_words(name)
return [word.upper() for word in words]
分割成首大写、其余小写单词
def to_capital_words(name):
words = to_words(name)
return [word.capitalize() for word in words]
转中划线命名法
中划线命名法,也叫烤肉串命名法(kebab case),如 'kebab-case'
字母全小写
连字符连接
def to_kebab_case(name):
words = to_lower_words(name)
to_kebab_case = '-'.join(words)
return to_kebab_case
转小蛇式命名法
小蛇式命名法,其实就是小写下划线命名法,也叫蛇式命名法(snake case),如 'snake_case'
字母全小写
下划线连接
def to_snake_case(name):
words = to_lower_words(name)
snake_case_name = '_'.join(words)
return snake_case_name
转大蛇式命名法
大蛇式命名法,其实就是大写下划线命名法,也叫宏命名法(macro case),如 'MACRO_CASE'
字母全大写
下划线连接
def to_macro_case(name):
words = to_upper_words(name)
snake_case_name = '_'.join(words)
return snake_case_name
转小驼峰命名法
小驼峰命名法,也叫驼峰命名法(camel case) ,如 'camelCase'
首单词首字母小写,后每个单词首字母大写
不使用连接符
def to_camel_case(name):
words = to_words(name)
camel_case_words = []
for word in words:
if len(word) <= 1:
camel_case_words.append(word.upper())
else:
camel_case_words.append(word[0].upper() + word[1:])
camel_case = ''.join(camel_case_words)
if len(camel_case) <= 1:
camel_case = camel_case.lower()
else:
camel_case = ''.join(camel_case[0].lower() + camel_case[1:])
return camel_case
转大驼峰命名法
大驼峰命名法,也叫帕斯卡命名法(pascal case) ,如 'PascalCase'
每个单词首字母大写
不使用连接符
def to_pascal_case(name):
words = to_words(name)
pascal_case_words = []
for word in words:
if len(word) <= 1:
pascal_case_words.append(word.upper())
else:
pascal_case_words.append(word[0].upper() + word[1:])
pascal_case = ''.join(pascal_case_words)
return pascal_case
来源:https://blog.csdn.net/weixin_42077074/article/details/129543001
猜你喜欢
- 一、property() 函数讲解了解 @property 装饰器之前,我们首先要了解内置函数的 property()。class prop
- What's more important to your web site: pictures or text? If you h
- 一段非常简单代码普通调用方式def console1(a, b): print("进入函数")
- Microsoft建立了一种既灵活又强大的安全管理机制,它能够对用户访问SQL Server服务器系统和数据库的安全进行全面地管理。按照本文
- 最近用layer ui上传文件遇到了一个问题,我想在上传文件之前把data-id传入后台,layer文档找了一下也没有找到类似的说明,经过一
- 下一代的 web 已经开始上路了,就在这个星期,MySpace 集成了 Google Gears,雅虎发布了新的 BrowserPlus,G
- 前一段时间导师叫我写一个批处理的小程序,就是循环修改辐射传输模型软件MODTRAN的输入参数,然后运行MODTRAN软件进行计算,输出需要的
- detectres.asp<HTML><head><TITLE>asp教程之全能屏幕分辨率侦测</
- 1、jsp前端<%-- Created by IntelliJ IDEA. User: Lenovo Date: 2020/6/19
- 会员注册以后,有些会员可能会遇到忘记登录密码的问题,因而网站具备“找回密码/忘记密码”功能不仅是必须的,而且是服务贴心的具体表现之一。在此,
- 准备篇:1、配置防火墙,开启80端口、3306端口vi /etc/sysconfig/iptables-A INPUT -m state -
- 目录一.权限简介二.权限表结构设计:第一版三.权限表结构设计:第二版四.客户管理之动态“一级”菜单五.客户管理之动态“二级”菜单六.客户管理
- 当然首先得去下载ASPupload 程序,安装后使用!官方网站下载:http://www.aspupload.com/使用ASP实现文件上载
- MySQL插件式存储引擎是MySQL数据库服务器中的组件,负责为数据库执行实际的数据I/O操作,并能允许和强制执行面向特殊应用需求的特定特性
- 曾经为看别人写的杂乱代码而头痛吗?曾经为看BWindow代码而烦恼吗?曾经为减小JS体积和JS的可读性之间的矛盾而左右徘徊吗?最好的办法是有
- 1.查看mysql上都有哪些库mysql> show databases \G***************************
- 目前防采集的方法有很多种,先介绍一下常见防采集策略方法和它的弊端及采集对策: 一、判断一个IP在一定时间内对本站页面的访问次数,如果明显超过
- 本文实例讲述了Python使用Selenium模块模拟浏览器抓取斗鱼直播间信息。分享给大家供大家参考,具体如下:import timefro
- 一个简单的PHP循环一维数组的实例,先是把字符串按照一定的规则进行转换成为数组,然后再进行遍历输出,实际是一个很简单的方法,因为最近做的一个
- EF Core 是一个ORM(对象关系映射),它使 .NET 开发人员可以使用 .NET对象操作数据库,避免了像ADO.NET访问数据库的代