• socket编程:多路复用I/O服务端客户端之select


    其实在之前的TCP之中,我们编程实现了多进程,多线程机制下的TCP服务器,但是对于这种的TCP服务器而言,存在太大的资源局限性。所以我们可以是用I/0模型中的多路复用I/O模型来进行编程。

    他的具体思想就是:当前进程可以处理多个相应时间,记录多个描述符,然后控制轮询时间态,当有响应产生的时候我们就去保存当前响应文件描述符,对他进行连接处理/数据传输就OK了。在一个进程进行多个响应时间的答复情况下,可以大大的节约我们系统所消耗的资源。

    对这个进行操作的函数就是select():

    他的函数原型如下:

    首先我们不看select函数本身,我们先去看一下select下面的几个FD函数:

    FD = fd,其实很简单,就是我们的文件描述符操作函数。

    关于fd_set*类型的变量:其实就是一个对某种类型时间行为的文件描述符集合,称为描述词组。

    FD_CLR(inr fd,fd_set* set);用来清除描述词组set中相关fd 的位

    FD_ISSET(int fd,fd_set *set);用来测试描述词组set中相关fd 的位是否为真

    FD_SET(int fd,fd_set*set);用来设置描述词组set中相关fd的位

    FD_ZERO(fd_set *set);用来清除描述词组set的全部位。

    然后我们来看一下select函数:

    参数nfds是需要监视的最大的文件描述符值+1;

    rdset,wrset,exset分别对应于需要检测的可读文件描述符的集合,可写文件描述符的集合及异

    常文件描述符的集合。

    struct timeval结构用于描述一段时间长度,如果在这个时间内,需要监视的描述符没有事件

    发生则函数返回,返回值为0。

    参数timeout为结构timeval,用来设置select()的等待时间,其结构定义如下:

    如果参数timeout设为:

    NULL:则表示select()没有timeout,select将一直被阻塞,直到某个文件描述符上发生了

    事件。

    0:仅检测描述符集合的状态,然后立即返回,并不等待外部事件的发生。

    特定的时间值:如果在指定的时间段里没有事件发生,select将超时返回。

    函数返回值:

    执行成功则返回文件描述词状态已改变的个数

    如果返回0代表在描述词状态改变前已超过timeout时间,没有返回;

    当有错误发生时则返回-1,错误原因存于errno,此时参数readfds,writefds,exceptfds和

    timeout的值变成不可预测。错误值可能为:

    EBADF 文件描述词为无效的或该文件已关闭。

    EINTR 此调用被信号所中断。

    EINVAL 参数n 为负值。

    ENOMEM 核心内存不足。

    理解select模型的关键在于理解fd_set,为说明方便,取fd_set长度为1字节,fd_set中的每一bit

    可以对应一个文件描述符fd。则1字节长的fd_set最大可以对应8个fd。

    (1)执行fd_set set; FD_ZERO(&set);则set用位表示是0000,0000。

    (2)若fd=5,执行FD_SET(fd,&set);后set变为0001,0000(第5位置为1)

    (3)若再加入fd=2,fd=1,则set变为0001,0011

    (4)执行select(6,&set,0,0,0)阻塞等待

    (5)若fd=1,fd=2上都发生可读事件,则select返回,此时set变为0000,0011。注意:没有事件

    发生的fd=5被清空。

     基于上面的讨论,可以轻松得出select模型的特点:

      (1)可监控的文件描述符个数取决与sizeof(fd_set)的值。我这边服务 器上sizeof(fd_set)=

    512,每bit表示一个文件描述符,则我服务器上支持的最大文件描述符是512*8=4096。据说

    可调,另有说虽然可调,但调整上限受于编译内核时的变量值。本人对调整fd_set的大小不

    太感兴趣,参考http://www.cppblog.com /CppExplore/archive/2008/03/21/45061.html中的模

    型2(1)可以有效突破select可监控的文件描述符上 限。

      (2)将fd加入select监控集的同时,还要再使用一个数据结构array保存放到select监控集

    中的fd,一是用于再select 返回后,array作为源数据和fd_set进行FD_ISSET判断。二是select

    返回后会把以前加入的但并无事件发生的fd清空,则每次开始 select前都要重新从array取得fd

    逐一加入(FD_ZERO最先),扫描array的同时取得fd最大值maxfd,用于select的第一个参数。

      (3)可见select模型必须在select前循环array(加fd,取maxfd),select返回后循环array

    (FD_ISSET判断是否有时间发生)。

    对于利用select函数所编写的服务器端而言:

    TCP服务端所产生的所有sock套接字描述符(文件描述符),其实都可以归纳到可读文件描述符集合中。

    当我们检测到listen()的sock套接字就建立连接accept(),如果确认到是普通,也就是我们accept()所产生的文件描述符时,就确定这个是一条对于客户端/服务端的连接链路。然后我们就利用相关的函数操作进行信息传输,

    timeout代表当次所进行的询问等待时间,需要注意的是就是每一次循环都必须重新设置timeout。

    每一次循环开始都要对描述词组进行初始化,要不然当timeout耗尽而没有产生响应的话,会改变描述词组的值,从而产生错误。

    select缺点:

    (1)每次调用select,都需要把fd集合从用户态拷贝到内核态,这个开销在fd很多时会很大

    (2)同时每次调用select都需要在内核遍历传递进来的所有fd,这个开销在fd很多时也很大

    (3)select支持的文件描述符数量太小了,默认是1024。
    ---------------------
    作者:q1239678315
    来源:CSDN
    原文:https://blog.csdn.net/q1239678315/article/details/52672616
    版权声明:本文为博主原创文章,转载请附上博文链接!

  • 相关阅读:
    面向消息的持久通信与面向流的通信
    通信协议
    分布式系统简介
    Hadoop on Yarn 各组件详细原理
    Parquet文件结构笔记
    Redis部分数据结构方法小结
    Storm Ack框架笔记
    MapReduce格式与类型
    Hadoop 2.6 MapReduce运行原理详解
    Hadoop SequenceFile数据结构介绍及读写
  • 原文地址:https://www.cnblogs.com/jack-hzm/p/10837567.html
Copyright © 2020-2023  润新知