Golang如何编写内存高效及CPU调优的Go结构体
作者:??AlanHou? 发布时间:2024-04-23 09:45:55
前言
结构体是包含多个字段的集合类型,用于将数据组合为记录。这样可以将与同一实体相关联的数据利落地封装到一个轻量的类型定义中,然后通过对该结构体类型定义方法来实现不同的行为。
本文会尝试从内存利用和CPU周期的角度讲解如何高效编写struct
。
我们来看下面这一结构体,这是我们一个奇怪用例所定义的terraform
资源类型:
type TerraformResource struct {
Cloud string // 16字节
Name string // 16字节
HaveDSL bool // 1字节
PluginVersion string // 16字节
IsVersionControlled bool // 1字节
TerraformVersion string // 16字节
ModuleVersionMajor int32 // 4字节
}
使用如下代码来了解TerraformResource
结构体需要分配多少内存:
package main
import (
"fmt"
"unsafe"
)
type TerraformResource struct {
Cloud string // 16字节
Name string // 16字节
HaveDSL bool // 1字节
PluginVersion string // 16字节
IsVersionControlled bool // 1字节
TerraformVersion string // 16字节
ModuleVersionMajor int32 // 4字节
}
func main() {
var d TerraformResource
d.Cloud = "aws"
d.Name = "ec2"
d.HaveDSL = true
d.PluginVersion = "3.64"
d.TerraformVersion = "1.1"
d.ModuleVersionMajor = 1
d.IsVersionControlled = true
fmt.Println("==============================================================")
fmt.Printf("结构体使用的总内存:d %T => [%d]\n", d, unsafe.Sizeof(d))
fmt.Println("==============================================================")
fmt.Printf("结构体中的Cloud字段:d.Cloud %T => [%d]\n", d.Cloud, unsafe.Sizeof(d.Cloud))
fmt.Printf("结构体中的Name字段:d.Name %T => [%d]\n", d.Name, unsafe.Sizeof(d.Name))
fmt.Printf("结构体中的HaveDSL字段:d.HaveDSL %T => [%d]\n", d.HaveDSL, unsafe.Sizeof(d.HaveDSL))
fmt.Printf("结构体中的PluginVersion字段:d.PluginVersion %T => [%d]\n", d.PluginVersion, unsafe.Sizeof(d.PluginVersion))
fmt.Printf("结构体中的ModuleVersionMajor字段:d.IsVersionControlled %T => [%d]\n", d.IsVersionControlled, unsafe.Sizeof(d.IsVersionControlled))
fmt.Printf("结构体中的TerraformVersion字段:d.TerraformVersion %T => [%d]\n", d.TerraformVersion, unsafe.Sizeof(d.TerraformVersion))
fmt.Printf("结构体中的ModuleVersionMajor字段:d.ModuleVersionMajor %T => [%d]\n", d.ModuleVersionMajor, unsafe.Sizeof(d.ModuleVersionMajor))
}
输出结果
$ go run golang-struct-memory-allocation.go
==============================================================
结构体使用的总内存:d main.TerraformResource => [88]
==============================================================
结构体中的Cloud字段:d.Cloud string => [16]
结构体中的Name字段:d.Name string => [16]
结构体中的HaveDSL字段:d.HaveDSL bool => [1]
结构体中的PluginVersion字段:d.PluginVersion string => [16]
结构体中的ModuleVersionMajor字段:d.IsVersionControlled bool => [1]
结构体中的TerraformVersion字段:d.TerraformVersion string => [16]
结构体中的ModuleVersionMajor字段:d.ModuleVersionMajor int32 => [4]
因此结构体TerraformResource
所需分配的总内存是88字节。TerraformResource
类型内存分配
如下图所示:
为什么是88字节呢?16 +16 + 1 + 16 + 1+ 16 + 4 = 70 bytes,多出来的18字节是从哪来的?
涉及到结构体的内存分配时,总是会分配连续、字节对齐的内存志,字段按所定义的顺序进行内存分配和存储。这里的字节对齐表示连续的内存块按平台的字大小进行偏移排列。
可以很清楚地看到TerraformResource.HaveDSL
、TerraformResource.isVersionControlled
和TerraformResource.ModuleVersionMajor
分别仅占用1字节、1字节和4字节。剩余的空间使用空白字节进行填充。
所以重新计算一下:
数据占用字节 = 16字节 + 16字节 + 1字节 + 16字节 + 1字节 + 16字节 + 4字节 = 70字节
空白字节 = 7字节 + 7字节 + 4字节 = 18字节
总字节数 = 数据占用字节 + 空白字节 = 70字节 + 18字节 = 88字节
那如何修复这个问题呢?通过恰当地的数据结构对齐,我们可以这样来定义结构体:
type TerraformResource struct {
Cloud string // 16字节
Name string // 16字节
PluginVersion string // 16字节
TerraformVersion string // 16字节
ModuleVersionMajor int32 // 4字节
HaveDSL bool // 1字节
IsVersionControlled bool // 1字节
}
使用优化后的结构体来运行同一段代码:
输出结果
$ go run golang-struct-memory-allocation.go
==============================================================
结构体使用的总内存:d main.TerraformResource => [72]
==============================================================
结构体中的Cloud字段:d.Cloud string => [16]
结构体中的Name字段:d.Name string => [16]
结构体中的HaveDSL字段:d.HaveDSL bool => [1]
结构体中的PluginVersion字段:d.PluginVersion string => [16]
结构体中的ModuleVersionMajor字段:d.IsVersionControlled bool => [1]
结构体中的TerraformVersion字段:d.TerraformVersion string => [16]
结构体中的ModuleVersionMajor字段:d.ModuleVersionMajor int32 => [4]
现在TerraformResource
类型总的内存占用是72字节。
我们来看下在内存中是如何排列的:
仅仅是通过对结构体元素进行了一轮数据结构对齐我们就将所占用的内存由88字节降到了72字节,真是太棒了!!!
我们再来算一下
数据占用字节 = 16字节 + 16字节 + 16字节 + 16字节 +4字节 + 1 byte + 1字节 = 70字节
空白字节 = 2字节
总字节数 = 数据占用字节 + 空白字节 = 70字节 + 2字节 = 72字节
通过恰当的数据结构对齐不仅优化了内存占用,还优化了CPU读取周期,怎么做到的呢?
CPU以字为单位从内存中进行读取,一个字在32位系统中占用4字节、64位系统中占用8字节。我们声明的第一个结构体类型TerraformResource
CPU需要读取11个字才能读完:
但对优化后的结构体只需要读取9个字:
通过恰当地对结构体进行数据结构排序我们可以让内存分配和CPU 读取都变得高效。
来源:https://juejin.cn/post/7124539157837250596
猜你喜欢
- 应该只是一个简单的层的定位及鼠标事件吧<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.
- 正则表达式并不是Python的一部分。正则表达式是用于处理字符串的强大工具,拥有自己独特的语法以及一个独立的处理引擎,效率上可能不如str自
- 一、前言1.1 关于描述性统计分析概括地来说,描述性统计分析就是在收集到的数据的基础上,运用制表和分类,图形以及计算概括性数据来描述数据特征
- 背景:这个库的安装不是像其他的一样的直接使用 pip install XXX的形式,而是使用原始的Git方式1、apex这是NVIDIA开发
- 今天看了一下数据结构的书,发现其实数据结构没有几种,线性表,数组,字符串,队列和栈,等等,其实是一回事,然后就是树结构,图结构。数据结构的理
- 正则表达式正则表达用来匹配字符串正则表达式匹配过程依次拿出表达式和文本中的字符串进行比价如果每个字符都能匹配,则匹配成功;一旦有匹配不成功的
- 先给大家展示效果图,感觉不错,请参考实现代码。具体代码如下所示:#!/usr/bin/env python# -*- coding:utf-
- python简单游戏-反弹球,供大家参考,具体内容如下tkinter实现,直接贴上代码from tkinter import*import
- 本文实例讲述了PHP设计模式:装饰器模式Decorator。分享给大家供大家参考,具体如下:1. 概述  
- 我们提到切片的时候,一般想到的大多数是分割列表。其实它还可以对列表进行拼接,想必这点是很多人不知道的,这就是切片的占位符用法。留在原列表中,
- 本文介绍了6个asp常用的判断函数的语法和使用方法,有IsArray 函数,IsDate 函数 ,IsEmpty 函数,IsNull 函数,
- 表单内有两个提交按钮,要实现当点击不同的提交按钮时,分别进行两个不同的处理过程,在这里有实现表单多按钮提交action的处理方法分享给大家。
- 仿windows选项卡或叫做tabpan以及tabpage,现在还有最新的进展譬如仿淘宝网导航菜单效果皆属于此类:运行代码框<scri
- 上篇博客转载了关于感知器的用法,遂这篇做个大概总结,并实现一个简单的感知器,也为了加深自己的理解。感知器是最简单的神经网络,只有一层。感知器
- 本文实例为大家分享了Python实现打乒乓小游戏的具体代码,供大家参考,具体内容如下源码奉上:import sysimport cfgimp
- 我们的目标是秒杀淘宝或京东等的订单,这里面有几个关键点,首先需要登录淘宝或京东,其次你需要准备好订单,最后要在指定时间快速提交订单。这里就要
- 背景:Python是一种解释性的语言,执行速度相比C、C++等语言十分缓慢;因此我们需要在其它地方上下功夫来提高代码的执行速度。首先需要对代
- 硬件平台:SUN Ultra Enterprise 3000 操作系统:Solaris 2.5(中文简体) 磁盘:4.2GB 内存:256M
- 二维数组二维数组本质上是以数组作为数组元素的数组,即“数组的数组”,类型说明符 数组名[常量表达式][常量表达式]。二维数组又称为矩阵,行列
- 前言人类都是视觉动物,不管是男生还是女生看到漂亮的小姐姐、小哥哥就想截图保存下来。可是截图会对画质会产生损耗,截取的画面不规整,像素不高等问