深入解析golang bufio
作者:charlieroro 发布时间:2024-04-28 09:13:24
bufio 包介绍
bufio包实现了有缓冲的I/O。它包装一个io.Reader或io.Writer接口对象,创建另一个也实现了该接口,且同时还提供了缓冲和一些文本I/O的帮助函数的对象。
golang bufio
当频繁地对少量数据读写时会占用IO,造成性能问题。golang的bufio
库使用缓存来一次性进行大块数据的读写,以此降低IO系统调用,提升性能。
在Transport中可以设置一个名为WriteBufferSize
的参数,该参数指定了底层(Transport.dialConn
)写buffer的大小。
tr := &http.Transport{
WriteBufferSize: 64 * 1024,
}
pconn.br = bufio.NewReaderSize(pconn, t.readBufferSize())
pconn.bw = bufio.NewWriterSize(persistConnWriter{pconn}, t.writeBufferSize())
使用bufio进行写
可以使用bufio.NewWriter
初始化一个大小为4096字节的Writer
(见下),或使用bufio.NewWriterSize
初始化一个指定大小的Writer
。
Writer
中的主要参数为缓存区buf
,缓存区中的数据偏移量n
以及写入接口wr
:
type Writer struct {
err error
buf []byte
n int
wr io.Writer
}
bufio.Writer
方法可以一次性写入缓存中的数据,通常有如下三种情况:
缓存中满数据
缓存中仍有空间
待写入的数据大于缓存的大小
缓存中满数据
当缓存中满数据时,会执行写操作。
缓存中仍有空间
如果缓存中仍有数据,则不会执行写入动作,除非调用Flush()
方法。
待写入的数据大于缓存的大小
由于此时缓存无法缓存足够的数据,此时会跳过缓存直接执行写操作
type Writer int
func (*Writer) Write(p []byte) (n int, err error) {
fmt.Printf("Writing: %s\n", p)
return len(p), nil
}
func main() {
w := new(Writer)
bw1 := bufio.NewWriterSize(w, 4)
// Case 1: Writing to buffer until full
bw1.Write([]byte{'1'})
bw1.Write([]byte{'2'})
bw1.Write([]byte{'3'})
bw1.Write([]byte{'4'}) // write - buffer is full
// Case 2: Buffer has space
bw1.Write([]byte{'5'}) //此时buffer中无法容纳更多的数据,执行写操作,写入 []byte{'1','2','3','4'}
err = bw1.Flush() // forcefully write remaining
if err != nil {
panic(err)
}
// Case 3: (too) large write for buffer
// Will skip buffer and write directly
bw1.Write([]byte("12345")) //buffer不足,直接执行写操作
//结果:
Writing: 1234
Writing: 5
Writing: 12345
缓存重用
申请缓存对性能是有损耗的,可以使用Reset
方法重置缓存,其内部只是将Writer
的数据偏移量n
置0。
wr := new(Writer)
bw := bufio.NewWriterSize(wr,2)
bw.Reset(wr)
获取缓存的可用空间数
Available()
方法可以返回缓存的可用空间数,即len(Writer.buf)-Writer.n
使用bufio进行读
与用于写数据的Writer
类似,读数据也有一个Reader
,可以使用NewReader
初始化一个大小为4096字节的Reader
,或使用NewReaderSize
初始化一个指定大小的Reader
(要求最小为16字节)。Reader
也有一个记录偏移量的变量r
type Reader struct {
buf []byte
rd io.Reader // reader provided by the client
r, w int // buf read and write positions
err error
lastByte int // last byte read for UnreadByte; -1 means invalid
lastRuneSize int // size of last rune read for UnreadRune; -1 means invalid
}
Peek
该方法会返回buf中的前n个字节的内容,但与Read操作不同的是,它不会消费缓存中的数据,即不会增加数据偏移量,因此通常也会用于判断是否读取结束(EOF)。通常有如下几种情况:
如果peak的值小于缓存大小,则返回相应的内容
如果peak的值大于缓存大小,则返回bufio.ErrBufferFull错误
如果peak的值包含EOF且小于缓存大小,则返回EOF
Read
将数据读取到p
,涉及将数据从缓存拷贝到p
。
func (b *Reader) Read(p []byte) (n int, err error)
ReadSlice
该方法会读从缓存读取数据,直到遇到第一个delim
。如果缓存中没有delim
,则返回EOF,如果查询的长度超过了缓存大小,则返回 io.ErrBufferFull
错误。
func (b *Reader) ReadSlice(delim byte) (line []byte, err error)
例如delim
为','
,则下面会返回的内容为1234,
。
r := strings.NewReader("1234,567")
rb := bufio.NewReaderSize(r, 20)
fmt.Println(rb.ReadSlice(','))
// 结果:[49 50 51 52 44] <nil>
注意:
ReadSlice
返回的是原始缓存中的内容,如果针对缓存作并发操作,则返回的内容有可能被其他操作覆盖。因此在官方注释里面有写,建议使用ReadBytes
或ReadString
。但ReadBytes
和ReadString
涉及内存申请和拷贝,因此会影响性能。在追求高性能的场景下,建议外部使用sync.pool
来提供缓存。// Because the data returned from ReadSlice will be overwritten
// by the next I/O operation, most clients should use
// ReadBytes or ReadString instead.
ReadLine
ReadLine() (line []byte, isPrefix bool, err error)
ReadLine
底层用到了ReadSlice
,但在返回时会移除\n
或\r\n
。需要注意的是,如果切片中没有找到换行符,则不会返回EOF或io.ErrBufferFull
错误,相反,它会将isPrefix
置为true
ReadBytes
与ReadSlice
类似,但它会返回一个新的切片,因此便于并发使用。如果找不到delim
,ReadBytes
会返回io.EOF
func (b *Reader) ReadBytes(delim byte) ([]byte, error)
Scanner
scanner可以不断将数据读取到缓存(默认64*1024字节)。
rb := strings.NewReader("12345678901234567890")
scanner := bufio.NewScanner(rb)
for scanner.Scan() {
fmt.Printf("Token (Scanner): %q\n", scanner.Text())
}
// 结果:Token (Scanner): "12345678901234567890"
参考
how-to-read-and-write-with-golang-bufio
来源:https://www.cnblogs.com/charlieroro/p/16172519.html
猜你喜欢
- 安装好所需要的插件和包:python、django、pip等版本如下:采用Django REST框架3.01、在python文件夹下D:\p
- 近期有一个业务需求,多台机器需要同时从Mysql一个表里查询数据并做后续业务逻辑,为了防止多台机器同时拿到一样的数据,每台机器需要在获取时锁
- Python基本输入和输出1.input输入函数input函数:获取用户输入,保存成一个字符串。>>> name = in
- 这篇文章主要介绍了Python中使用gflags实例及原理解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,
- 如何提高SQL Server数据库的性能,该从哪里入手呢?笔者认为,该遵循从外到内的顺序,来改善数据库的运行性能。如下图: 第一层
- 英文文档:setattr(object, name, value)This is the counterpart of getattr().
- 本文整理了一些MySQL的通用优化方法,做个简单的总结分享,旨在帮助那些没有专职MySQL DBA的企业做好基本的优化工作,至于具体的SQL
- 本文实例讲述了python获得一个月有多少天的方法。分享给大家供大家参考。具体分析如下:在python的datetime模块中没有一个月有多
- 前言Go 数组的长度不可改变,在特定场景中这样的集合就不太适用,Go中提供了一种灵活,功能强悍的内置类型切片("动态数组"
- 安装淘宝镜像:要安装Angular4。于是我对着一股浓郁口音的视频开启了Angular4安装之旅。那口音说了,ang哥乐4不是那么好装的,由
- 1、此api已经关闭https://api.map.baidu.com/highacciploc/v1?qcip=220.181
- 0x01 OpenCV安装 通过命令pip install opencv-python 安装pip install opencv-
- 在学习Python的过程中,一直没有找到比较趁手的第三方编辑器,用的最多的还是Python自带的编辑器。由于本人用惯了宇宙第一IDE(Vis
- 在python中可以使用json将数据格式化为JSON格式:1.将字典转换成JSON数据格式:s=['张三','年龄
- 1、说明这篇文章是帮一个群友解答的问题。他有一个需求,就是对于日期的录入都是中文形式的,需要转换为数字形式的。由于python库中没有函数直
- 楔子有几天没有更新 Python 文章了,本次我们来聊一下 Python 的集合是怎么实现的?之前我们介绍过字典的实现原理,它底层是基于哈希
- 一、批量新建并保存工作簿import xlwings as xw # 导入库# 启动Excel程序,但不新建工作
- 前言实际工作中,偶尔遇到如下情况,例如使用Pandas计算如下相关系数,并把结果写入Excel文件中。correlations = df.c
- 很多人都使用很多的编程工具,尤其对于Web开发人员。这个小教程将告诉各位如何使DreamweaverMX编程环境适合中国的Web开发人员。一
- 前言很多中后台业务的系统中,表格是最高频的组件之一,其中一般包括搜索条件、表格展示、表格操作列、分页等。那么我们二次封装的这个表格组件就需要