MySQL中如何正确存储IP地址
作者:_陈哈哈 发布时间:2024-01-29 13:34:34
数据库中IP地址数据该怎么存?或许你已经不止一次遇到过这类问题,怎么存?varchar(255)不就完事儿了?坦白说,在我经历的几个项目中,几乎都遇到过存储IP地址(V4、V6)的数据字段,都用的变长字符串varchar(15)来存储,嗯,感觉还挺香的…
其实很早以前我就在《高性能MySQL第三版》中看过IP地址属于特殊类型数据,应转为整数存储。
《高性能MySQL第三版》
4.1.7 特殊类型数据
-某些类型的数据并不直接与内置类型一致。低于秒级精度的时间戳就是一个例子;
-本意的前面部分也演示过存储此类数据的一些选项。
-另一个例子是一个IPv4地址。人们经常使用VARCHAR(15)列来存储IP地址。
-然而,它们实际上是 32位无符号整数,不是字符串。用小数点将地址分成四段的表示方法只是为了让人们阅读容易。
-所以应该用无符号整数存储IP地址。MySQL提供INET ATON()和 INET NTOA()函数在这两种表示方法之间转换。
但项目中并未涉及到对IP地址的高频查询业务需求;所以嘛,你知道的,我们程序员的三不准则:跟自己没关系的代码不要看,自己模块用不到的技术不要学,遗留代码只要能跑的就不要动!
直到老大看我们项目数据表时问道:“你们存IP地址都是用字符串吗?这可不兴啊!应该用整数来存啊。”
“老大,我明白你的优化思路,你看咱们这表,就几十条数据(狗头)…”
直到上周有位同学问我IP地址在数据库中该怎么存,他在面试中被问到了,我突然意识到了这玩意儿是时候记录一下了。
一、IP地址应该怎么存
在MySQL中,当存储IPv4地址时,应该使用32位的无符号整数(UNSIGNED INT)来存储IP地址,而不是使用字符串,用UNSIGNED INT类型存储IP 地址是一个4字节长的整数。
如果是字符串存储IP 地址,在正常格式下,最小长度为 7 个字符 (0.0.0.0),最大长度为 15 个 (255.255.255.255),因此,我们通常会使用varchar(15)来存储。同时为了让数据库准确跟踪列中有多少数据,数据库会添加额外的1字节来存储字符串的长度。这使得以字符串表示的 IP 的实际数据存储成本需要16字节。
这意味着如果将每个 IP 地址存储为字符串的话,每行需要多耗费大约 10 个字节的额外资源。
如果你说磁盘够使不是事儿,那我得告诉你,这个不仅会使数据文件消耗更多的磁盘,如果该字段加了索引,也会同比例扩大索引文件的大小,缓存数据需要使用更多内存来缓存数据或索引,从而可能将其他更有价值的内容推出缓存区。执行SQL对该字段进行CRUD时,也会消耗更多的CPU资源。
在早先使用Oracle10g时,是没有相关函数来进行IP整数和字符串的,但在MySQL中有内置的函数,来对IP和数值进行相互转换。
INET_ATON()
将IP转换成整数。
算法:第一位乘256三次方+第二位乘256二次方+第三位乘256一次方 + 第四位乘256零次方
INET_NTOA()
将数字反向转换成IP
SELECT INET_ATON('127.0.0.1');
+------------------------+
| INET_ATON('127.0.0.1') |
+------------------------+
| ? ? ? ? ? ? 2130706433 |?
+------------------------+
1 row in set (0.00 sec)
SELECT INET_NTOA('2130706433');
+-------------------------+
| INET_NTOA('2130706433') |
+-------------------------+
| 127.0.0.1 ? ? ? ? ? ? ? |?
+-------------------------+
1 row in set (0.02 sec)
如果是 IPv6地址的话,可以使用函数 INET6_ATON() 和 INET6_NTOA() 来转化:
mysql> SELECT HEX(INET6_ATON('1030::C9B4:FF12:48AA:1A2B'));?
+----------------------------------------------+
| HEX(INET6_ATON('1030::C9B4:FF12:48AA:1A2B')) |
+----------------------------------------------+
| 1030000000000000C9B4FF1248AA1A2B ? ? ? ? ? ? |
+----------------------------------------------+
1 row in set
mysql> SELECT INET6_NTOA(UNHEX('1030000000000000C9B4FF1248AA1A2B'));?
+-------------------------------------------------------+
| INET6_NTOA(UNHEX('1030000000000000C9B4FF1248AA1A2B')) |
+-------------------------------------------------------+
| 1030::c9b4:ff12:48aa:1a2b ? ? ? ? ? ? ? ? ? ? ? ? ? ? |
+-------------------------------------------------------+
1 row in set
然后将数据库定义为 varbinary类型,分配 128bits空间(因为 ipv6采用的是128bits,16个字节);或者定义为 char 类型,分配 32bits 空间。
二、整数存储 IP 地址的查询性能实验
测试数据,用存储过程生成了 100 万个随机 IP 地址;
1、测试范围查询:
IP转成Int,查询:耗时0.60s
select ip_int from T where ip_int > INET_ATON('192.0.0.0') and ip_int <=INET_ATON('192.255.255.255');
1726 row in set, 1 warning (0.60 sec)
IP为字符串,查询:耗时0.63s
select ip_varchar from T where ip_varchar like '192.%';
1726 row in set, 1 warning (0.63 sec)
2、IP精确查询:
select ip_int from T where ip_int = INET_ATON('192.168.0.0');
1 row in set, 1 warning (0.00 sec)
select ip_varchar from T where ip_varchar='192.168.0.0';
1 row in set, 1 warning (0.00 sec)
都是0s出结果。可认为常量索引查询,性能上无明显差异。
3、整理一下结果发现:
范围查询和精确查询:
数据量少的情况下的差距不明显,如果数据量扩大到约1千万行或1亿行,1亿行时预计范围查询差距能拉开到0.5s。
存储空间节省:
按1亿行算,理论上 varchar 最大15字节存储,数值4个字节,大约节省10字节 *1亿 约1G空间。
加上索文件引所占的空间,一个索引也是能节省1G。约能节省2G空间。
来源:https://chensj.blog.csdn.net/article/details/121073057
猜你喜欢
- 方法一:进入MYSQL安装目录 打开MYSQL配置文件 my.ini 或 my.cnf查找 max_connections=100 修改为
- ★二维数组的使用方式:先声明或者定义,再赋值1)语法:var 数组名[大小][大小]类型2)比如:var arr[2][3]int[][]两
- <%If(Request.QueryString("Page")="") ThenPage=1
- UTC时间转换,最终得到的都是UTC时间。简单来说就是:时间戳(timestamp) 转换-> UTC显示时间(datetime),使
- 想要使用多个CPU核心来进行测试,可以使用 -n 参数( 或者 --numprocesses)(使用8个核心来跑测试用例)pytest -n
- 遇到一个难题,在无物理键盘情况下,通过页面软键盘在页面文本框输入汉字,不知道51js的各位大牛有没有遇到过这种需求,如果遇到过是如何解决的,
- 慢SQL与索引的关系慢SQL优化原则数据库也是应用,MySQL 作为一种磁盘数据库,属于典型的 IO 密集型应用,并且随机 IO 比顺序 I
- 不过首先你会发现,你在不同的地区或者不同的网络(电信、联通、移动)的情况下,转换后的IP地址很可能是 不一样的,这首先涉及到负载均衡的第一步
- 原始数据在这里1.观察数据首先,用Pandas打开数据,并进行观察。import numpy import pandas as pdimpo
- leaflet为R语言提供了API很好用,这次尝试用Python使用leaflet,需要folium安装foliumpip install
- js给span标签赋值的方法?一般有两种方法:第一种方法:输出html<body onload="s()">
- 小编今天写下关于后台管理员权限的分配自己的思路想法<?php /**reader * 小编的思想比较简单实现的功能
- 最近整理了一下网上关于MySql 链接url 参数的设置,有不正确的地方希望大家多多指教: mysql JDBC URL格式如下: jdbc
- python提供了两个非常重要的功能来处理python程序在运行中出现的异常和错误。你可以使用该功能来调试python程序。异常处理: 本站
- PowerDesigner简介 工具的用途 :这里我只介绍他在SqlServer数据库的应用,其它的我也不懂。工具的好处 : 个人
- Python字典的key都可以是什么答一个对象能不能作为字典的key,就取决于其有没有__hash__方法。所以所有python自带类型中,
- python包含子目录中的模块方法比较简单,关键是能够在sys.path里面找到通向模块文件的路径。下面将具体介绍几种常用情况:(1)主程序
- 交互式命令行是一种方便用户进行交互的工具,能够使用户与计算机进行快速的交互操作,提高工作效率。Python pyreadline模块可以帮助
- 如何让animate在显示图片的过程保持窗口的标题不变animate -title "My Image Sequence"
- 切片——str[start:end]str1 = ' python str '#切片