python 并发编程 非阻塞IO模型原理解析
作者:minger_lcm 发布时间:2022-03-11 06:55:54
非阻塞IO(non-blocking IO)
Linux下,可以通过设置socket使其变为non-blocking。当对一个non-blocking socket执行读操作时,流程是这个样子:
从图中可以看出,当用户进程发出read操作时,如果kernel中的数据还没有准备好,那么它并不会block用户进程,而是立刻返回一个error。从用户进程角度讲 ,它发起一个read操作后,并不需要等待,而是马上就得到了一个结果。用户进程判断结果是一个error时,它就知道数据还没有准备好,于是用户就可以在本次到下次再发起read询问的时间间隔内做其他事情,或者直接再次发送read操作。一旦kernel中的数据准备好了,并且又再次收到了用户进程的system call,那么它马上就将数据拷贝到了用户内存(这一阶段仍然是阻塞的,这段是本地拷贝,copy data ),然后返回。
也就是说非阻塞的recvform系统调用调用之后,进程并没有被阻塞,内核马上返回给进程,如果数据还没准备好,
此时会返回一个error。进程在返回之后,可以干点别的事情,然后再发起recvform系统调用。重复上面的过程,
循环往复的进行recvform系统调用。这个过程通常被称之为轮询。轮询检查内核数据,直到数据准备好,再拷贝数据到进程,
进行数据处理。需要注意,拷贝数据整个过程,进程仍然是属于阻塞的状态。
所以,在非阻塞式IO中,用户进程其实是需要不断的主动询问kernel操作系统内存 数据准备好了没有。
非阻塞IO示例
设置socket接口为 非阻塞IO接口
默认是True 为阻塞
server.setblocking(False)
处理一下这个异常
BlockingIOError: [WinError 10035] 无法立即完成一个非阻止性套接字操作。
from socket import *
server = socket(AF_INET,SOCK_STREAM)
server.bind(('127.0.0.1',8000))
server.listen(5)
# 设置socket接口为 非阻塞IO接口
# 默认是True 为阻塞
server.setblocking(False)
print("starting...")
while True:
try:
conn,addr = server.accept()
print(addr)
except BlockingIOError:
print("干其他的工作")
server.close()
执行结果,如上面的图,一直返回error消息
starting...
干其他的工作
干其他的工作
干其他的工作
干其他的工作
服务端 可以与 多个客户端建立连接,实现服务端可以不停的建立连接
from socket import *
server = socket(AF_INET,SOCK_STREAM)
server.bind(('127.0.0.1',8000))
server.listen(5)
# 设置socket接口为 非阻塞IO接口
# 默认是True 为阻塞
server.setblocking(False)
r_list = []
print("starting...")
while True:
try:
conn,addr = server.accept()
r_list.append(conn)
print(r_list)
except BlockingIOError:
pass
server.close()
起三个客户端与服务端建立连接
r_list 存着所有建立的连接
有连接来,就建立连接,没有连接来,就抛出异常
实现IO非阻塞 并发 多个连接
from socket import *
server = socket(AF_INET,SOCK_STREAM)
server.bind(('127.0.0.1',8000))
server.listen(5)
# 设置socket接口为 非阻塞IO接口
# 默认是True 为阻塞
server.setblocking(False)
r_list = []
print("starting...")
while True:
try:
conn,addr = server.accept()
r_list.append(conn)
print(r_list)
except BlockingIOError:
# 定义删除连接列表
del_rlist = []
for conn in r_list:
try:
data = conn.recv(1024)
# 收空数据时候
if not data:
del_rlist.append(conn)
continue
conn.send(data.upper())
# 没有连接,抛出异常,就结束这次循环,继续
except BlockingIOError:
continue
# 套接字出现异常,客户端单方面连接断开
except Exception:
conn.close()
del_rlist.append(conn)
break
# 结束上面循环之后,循环del_list 连接元素 删除连接
for conn in del_rlist:
del_rlist.remove(conn)
server.close()
BUG:send也是IO阻塞接口
当send在数据量过大时候,也会阻塞。
send操作是,把应用程序把数据发送到操作系统缓存区里,而操作系统缓存区空间也是有限的。缓存区也会满了,后面还有数据需要发送,那只能等缓存区清掉数据,有空间了,才能发送数据。所以在这里缓存区满了,就阻塞。
修改后服务端的代码 可以自己检测IO,遇到IO切换单个线程的其他任务,去运行,实现单线程并发
from socket import *
server = socket(AF_INET,SOCK_STREAM)
server.bind(('127.0.0.1',8000))
server.listen(5)
# 设置socket接口为 非阻塞IO接口
# 默认是True 为阻塞
server.setblocking(False)
r_list = []
w_list = []
print("starting...")
while True:
try:
conn,addr = server.accept()
r_list.append(conn)
print(r_list)
except BlockingIOError:
# 收消息
# 定义删除连接列表
del_rlist = []
for conn in r_list:
try:
data = conn.recv(1024)
# 收空数据时候
if not data:
del_rlist.append(conn)
continue
'''加入元祖 元祖有两个元素
1.存放套接字连接
2.准备要发送的的数据
'''
w_list.append((conn, data.upper()))
# 没有连接,抛出异常,就结束这次循环,继续
except BlockingIOError:
continue
# 套接字出现异常,客户端单方面连接断开
except Exception:
conn.close()
del_rlist.append(conn)
break
# 发消息
# 用于 发成功数据后,删除套接字连接的列表
del_wlist = []
for item in w_list:
try:
conn = item[0]
data = item[1]
conn.send(data)
# 发成功后,从列表删除连接
del_wlist.append(item)
# send 有可能出现异常 没发完情况
except BlockingIOError:
pass
# 结束上面循环之后,循环del_wlist 连接元素 删除连接
for item in del_wlist:
del_wlist.remove(item)
# 结束上面循环之后,循环del_rlist 连接元素 删除连接
for conn in del_rlist:
del_rlist.remove(conn)
server.close()
这就是非阻塞IO
但是非阻塞IO模型绝不被推荐。
我们不能否则其优点:能够在等待任务完成的时间里干其他活了(包括提交其他任务,也就是 “后台” 可以有多个任务在“”同时“”执行)。
干其他活时候,有可能来新的连接,新的连接来了,不能及时响应与该新的连接,建立连接。所以会导致问题:数据不会及时响应
但是也难掩其缺点:
1. 循环调用recv()将大幅度推高CPU占用率;这也是我们在代码中留一句time.sleep(2)的原因,否则在低配主机下极容易出现卡机情况
2. 任务完成的响应延迟增大了,因为每过一段时间才去轮询一次read操作,而任务可能在两次轮询之间的任意时间完成。
这会导致整体数据吞吐量的降低。
3.死循环While True会导致CPU的无用的耗用、占用
此外,在这个方案中recv()更多的是起到检测“操作是否完成”的作用,实际操作系统提供了更为高效的检测“操作是否完成“作用的接口,例如select()多路复用模式,可以一次检测多个连接是否活跃
来源:https://www.cnblogs.com/mingerlcm/p/11257381.html


猜你喜欢
- 很多年以前,面对上古时代遗留的 HTML 发出的腐臭,我捂住鼻子唉声叹气。刚练熟 web 标准的我,恨不得寝其尸食其肉,把一切推翻重来。但经
- 数据库优化是一项很复杂的工作,因为这最终需要对系统优化的很好理解才行。尽管对系统或应用系统的了解不多的情况下优化效果还不错,但是如果想优化的
- 本文实例讲述了Python读取properties配置文件操作。分享给大家供大家参考,具体如下:工作需要将Java项目的逻辑改为python
- worker pool简介worker pool其实就是线程池thread pool。对于go来说,直接使用的是goroutine而非线程,
- 通过手动输入数据,将数据分成几部分存入数组中import osimport sysdef test(): bric
- 无论使用int还是varchar,对于Status的多选查询都是不易应对的。举例,常规思维下对CustomerStatus的Enum设置如下
- tensorflow版本1.4获取变量维度是一个使用频繁的操作,在tensorflow中获取变量维度主要用到的操作有以下三种:Tensor.
- 代码演示暴力破解MSSQL的帐号和密码,包括管理员帐号sa的密码。网上有SQL Server Sa密码破解的存储过程,方法就是暴力破解MSS
- MVC和MTV框架MVCWeb服务器开发领域里著名的MVC模式,所谓MVC就是把Web应用分为模型(M),控制器(C)和视图(V)三层,他们
- 一、软件下载官方下载地址:https://download.jetbrains.8686c.com/webstorm/WebStorm-20
- 本文实例讲述了Python udp网络程序实现发送、接收数据功能。分享给大家供大家参考,具体如下:1. udp网络程序-发送数据创建一个基于
- 需求说明当用户申请售后,商家未在n小时内处理,系统自动进行退款。商家拒绝后,用户可申请客服介入,客服x天内超时未处理,系统自动退款。用户收到
- sysbench是一款非常优秀的基准测试工具,它能够精准的模拟MySQL数据库存储引擎InnoDB的磁盘的I/O模式。因此,基于sysben
- 该章节我们学习虚拟环境的相关知识,虚拟环境对于刚刚使用Python的初学者来说使用的概率可能会比较低。但是我们依然要对它有一定的了解。认识虚
- 本文实例为大家分享了OpenLayers3实现图层控件的具体代码,供大家参考,具体内容如下1. 前言在实际应用中,我们将加载到地图容器中的图
- 前言判断文件是否存在在实际应用中用的非常多,下面我们来归纳一下检查文件、文件夹是否存在的各种操作一.检查文件夹/文件是否存在1. os.pa
- 用ASP.NET与SQL SERVER可是缘份最好了,稍大的程序一般第一先考虑的是SQL SERVER,只是一些很考虑经济的才使用ACCES
- 在开发数据库应用中,经常会遇到处理时间的问题,如查询指定时间的记录等。下面就这些常见的问题,结合自己的一些经验,和大家探讨一下这类问题。首先
- 先给大家展示下效果图:向下滑动网页的时候能够自动加载图片并显示。盛放图片的盒子模型如下:<div class="box&qu
- 文件名字处理文件名字得看业务要求。不需要保留原始名字,则随机生成名字,拼接上白名单校验过的后缀即可。反之要谨慎处理://允许上传的后缀白名单