go time.After优化后性能提升34%内存减少67%
作者:steden 发布时间:2024-05-05 09:33:34
大家好,今天给大家带来一篇如何优化time.After
函数。
最近我在做调度中心2.0的重构。本次重构使用的GO语言开发。
在项目中,基本都离不开需要休眠等待一定时间后再执行下一步逻辑的操作,再搭配select,用起来是真的舒服。
func waitWorking() {
select {
case <-time.After(5 * time.Second): // 每隔5秒,主动向客户端询问任务状态
_ = receiver.CheckWorkingEventBus.Publish(receiver)
case <-receiver.updated:
}
}
在这个示例中,5秒后会执行Publish
函数,或者<-receiver.updated
有数据时退出,这是我们比较常用的方式。
但有一点要注意的是:time.After如果没有被执行到,会导致无法第一时间GC回收内存。
从内存分析中,会看到内存在持续增长,到了一定时间后,才会下降。这个增长幅度随着你的项目请求量而决定。
这是因为当<-receiver.updated
被触发执行时,导致time.After(5 * time.Second)
在5秒后才会有数据进来,在这5秒内,time.After创建的NewTimer(d)是无法回收的。
func After(d Duration) <-chan Time {
return NewTimer(d).C
}
明白了这一点之后,我们可以简单的做一个改进
改进1:
func waitWorking() {
timer := time.NewTimer(5 * time.Second)
select {
case <-timer.C: // 每隔5秒,主动向客户端询问任务状态
_ = receiver.CheckWorkingEventBus.Publish(receiver)
case <-receiver.updated:
timer.Stop()
}
}
当<-receiver.updated
被触发执行时,我们主动调用Stop
方法,来告知GC,此timer对象不再使用。
这样就不至于等到5秒后,GC才知道这个对象不再使用。
这就完了吗?显示没有,如果waitWorking函数会在并发中被调用:
type TaskGroupMonitor struct {
updated chan struct{} // 数据有更新,让流程重置
name string // 任务名称
}
func (receiver *TaskGroupMonitor) waitWorking() {
timer := time.NewTimer(5 * time.Second)
select {
case <-timer.C: // 每隔5秒,主动向客户端询问任务状态
_ = receiver.CheckWorkingEventBus.Publish(receiver)
case <-receiver.updated:
timer.Stop()
}
}
func init() {
// 模拟数据库读到了100条任务
for i := 0; i < 100; i++ {
taskGroup:= TaskGroupMonitor{}
go taskGroup.waitWorking()
}
}
这里假如从数据库中读到了100条任务数据,每条数据都在独立的协程中运行。
这就会导致在这100条任务在运行的过程中,创建了100个time.Timer对象,事实上除了waitWorking
,还会有waitStart
,waitScheduler
,taskFinish
等函数也使用了time.Timer对象。
可以想到,项目在运行过程中time.Timer在不停的创建,直到GC后才被回收。这将导致我们的内存一直占用着。
并且time.After
或time.NewTicker
并不是高精度的时间控制。有时候会慢那么0-3ms,协程数量越多越繁忙,则越不精准。
这对于调度中心而言是无法接收的,我的目标是支持几千个任务同时监控调度。意味着协程数量会非常高。
而在GO的time.Timer中是使用64个timersBucket
,并使用四叉堆
来管理各个timer,虽然在1.17版本有所改进。
但时间上仍然没有那么准确,对于调度这种场景来说,对ms级别的延迟也是没办法接受的。
time.Timer原理不在本篇的范围内,现在有很多大神有这方面的剖析,感兴趣可以去搜搜。
分析问题
通过简单的分析,我们已经知道使用time.Timer会有如下缺点:
每个协程需要创建time.Timer(导致内存占用上升)
time.Timer会有延迟(对于ms敏感的场景不适用)
即如此,我们是否可以通过统一的时间管理器
来管理所有的时间触发器呢?
答案是显而易见的,那就是时间轮。
时间轮
时间轮是一种实现延迟功能的算法, 它在Linux内核中使用广泛, 是Linux内核定时器的实现方法和基础之一. 时间轮是一种高效来利用线程资源来进行批量化调度的一种调度模型, 把大量的调度任务全部绑定到同一个调度器上, 利用这个调度器来进行所有任务的管理, 触发以及运行.
简单来说,时间轮就是一个模拟时钟的原理。 实现方式有:单层、双层、多层三种方式。
而在双层、多层时间轮中,又有两种算法:一种是不管几层,时间周期是一样的。另一种是低层一圈 = 上层一格(像秒针、分针一样)
在时钟里,秒针走完一圈,分针走一格。分针走完一圈,时针走一格。以此类推。
当秒针走到第X格,会到第X格的队列中找到是否有待执行任务列表,如果有则取出并通知到C变量。
而我在实现这个时间轮就是完全模拟时钟的这种算法来实现的。我与其它开源的时间轮不一样的地方是,我是高精度算法的。
时间轮的原理大概就讲这么多,毕竟不是一个什么新鲜的算法,网上有很多讲的比我更透彻的大神,在这里我主要讲使用时间轮的前后对比。
我们来看看如何使用:
// 在项目中,定义一个全局变量tw,并规定第0层,走一格=100ms,一圈有120格
import "github.com/farseer-go/fs/timingWheel"
var tw = timingWheel.New(100*time.Millisecond, 120)
tw.Start()
接着在项目中我们改成时间轮来控制时间:
func (receiver *TaskGroupMonitor) waitWorking() {
select {
case <-tw.AddPrecision(60 * time.Second).C:
_ = receiver.CheckWorkingEventBus.Publish(receiver)
case <-receiver.updated:
}
}
至此,我们使用了全局tw变量来控制时间的延迟管理。
我们来看下,优化前的情况:
100个并发下调度:平均延迟:10ms
、CPU:31.4%
、内存:115m
优化后:
100个并发下调度:平均延迟:1ms
、CPU:21.7%
、内存:34.5m
为此,整体性能提升:34%
,内存减少:67%
相关材料:
farseer-go开源地址:github.com/farseer-go/…
时间轮开源地址:github.com/farseer-go/…
调度中心开源地址:github.com/FSchedule/F…
来源:https://juejin.cn/post/7203274235426324536
猜你喜欢
- 一.图像金字塔原理上一篇文章讲解的图像采样处理可以降低图像的大小,本文将补充图像金字塔知识,了解专门用于图像向上采样和向下采样的pyrUp(
- 很久没写过东西了,今天看了chinahuman 的《用asp自动解析网页中的图片地址,并将其保存到本地服务器》,于是优化了这个程序,并且将所
- 英语原文地址:点此浏览新年开始了,来点猛料,放上15个漂亮的网页排版的demo,来欣赏一下。去年我也专门找了15个同类网站,比较受用户欢迎,
- 论坛有人问起如何获取读取CSS属性值,就写了下面这段兼容各浏览器的获取HTML元素的css属性值函数:function getSt
- 首先我是从淘宝进去,爬取了按销量排序的所有(100页)女装的列表信息按综合、销量分别爬取淘宝女装列表信息,然后导出前100商品的 link,
- 本文实例为大家分享了bootstrap响应式工具的具体代码,供大家参考,具体内容如下<!DOCTYPE html><htm
- 不论是做WEB设计还是做交互模型,最快确立创意与设计效果的最好办法就是用笔在纸上绘制出来。不过从事IT行业的人很少一部分是来自美术学院。当然
- 中间件中间件是放在客户端和服务端的中间。 当你的客户端对某个接口发起一个请求,但是在到达接口2之前,这里是有一层中间件的处理。一般
- 八九年前,我在公司做设计,当时就已经做到技术总监,Photoshop是自学的,当时觉得全世界比我Photoshop强的人也不在多数。七年前,
- 在设计网页时,没有比页面的外观更重要的了。所以,如果发现设计人员十分关注字体及字体大小,我并不感到惊奇。使用CSS来编辑字体有各种各样的方法
- 这篇文章主要介绍了Python中的四种交换数值的方法解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的
- (asp.net的应用). 在网上一搜有很多此类文章,但我需要将公司的复杂的,较大的web应用也以此方式操作,比较的头大。一般的文章建议将b
- 目录生成器nextsendthrowclose使用场景大集合的生成简化代码结构协程与并发总结生成器如果在一个方法内,包含了 yield 关键
- 具体方法:1使用panda read_excel 方法加载excel2使用concat将DataFrame列表进行拼接3然后使用pd.Exc
- 脉冲星假信号频率的相对路径论证。首先看一下演示结果:实例代码:import numpy as npimport matplotlib.pyp
- 条形图(bar chart),也称为柱状图,是一种以长方形的长度为变量的统计图表,长方形的长度与它所对应的变量数值呈一定比例。1. 竖放条形
- 在服务器部署时,往往都是在后台运行。当程序发生特定的错误时,我希望能够在日志中查询。因此这里熟悉以下 logging 模块的用法。loggi
- VSCode 的 Remote Deployment 插件对 WSL2 直接提供了支持,能够很方便的连接本机的 WSL2 ,但是并没有提供一
- MySQL报错:错误代码: 1293 Incorrect table definition; there can be only one T
- 导读一篇用PyTorch Lighting提供模型服务的完全指南。纵观机器学习领域,一个主要趋势是专注于将软件工程原理应用于机器学习的项目。