• Swoole从入门到入土(5)——TCP服务器[异步任务]


    无论对于B/S还是C/S,程序再怎么变,唯一不变的是用户不想等太久的躁动心情。所以服务端对于客户的请求,能有多快就多快。如果服务端需要执行很耗时的操作,就需要异步任务处理机制,保证当前的响应速度不受影响。

    现在以下面的一个例子为引子:

    <?php
    $server = new SwooleServer('0.0.0.0', 9501);
    $server->set([
        'max_wait_time'=>60,
        'reload_async'=>true,
        'worker_num'=>1,
        'task_worker_num'=>1,
        'task_max_request'=>100
    ]);
    
    //监听连接进入事件
    $server->on('Connect', function ($server, $fd) {
        
    });
    
    
    //监听数据接收事件
    $server->on('Receive', function ($server, $fd, $from_id, $data) {
        $server->task("receive to task:$data");    //将任务丢入异步任务列队
    });
    
    $server->on("task",function ($serv, $fd, $from_id, $data){
        //在这里处理任务
        $serv->finish("$data ok");    //处理完成后,将结果传给finish
    });
    
    $server->on("finish",function ($serv, $task_id, $data){
        //处理任务完成后的事情
        echo "finish $data
    ";
    });
    
    //监听连接关闭事件
    $server->on('Close', function ($server, $fd) {
    
    });
    
    //启动服务器
    $server->start();

    上面这个例子,在之前的代码上增加了两个属性(task_worker_num和task_max_request)和两个事件(onTask和onFinish)。代码中同时设置了这四项,便可以启动swoole的异步任务处理。是不是很简单?

    那么现在分别了解关于异步任务的新属性和事件:

    新配置:

    1) task_worker_num:配置 Task 进程的数量。【默认值:未配置则不启动 task

    配置此参数后将会启用 task 功能。所以 Server 必须要注册 onTask、onFinish 2 个事件回调函数。如果没有注册,服务器程序将无法启动。

    注意:

    Task 进程是同步阻塞的;

    最大值不得超过 swoole_cpu_num() * 1000;

    如果单个 task 的处理需要 100ms,那一个进程 1 秒就可以处理 1/0.1=10 个 task;则task 投递的速度,如每秒产生 2000 个 task,2000/10=200,就需要设置 task_worker_num => 200,启用 200 个 Task 进程;

    Task 进程内不能使用 SwooleServer->task 方法。

    2) task_max_request:设置 task 进程的最大任务数。【默认值:0】

    设置 task 进程的最大任务数。一个 task 进程在处理完超过此数值的任务后将自动退出。这个参数是为了防止 PHP 进程内存溢出。如果不希望进程自动退出可以设置为 0。

    3) task_tmpdir:设置 task 的数据临时目录。【默认值:Linux /tmp 目录】

    在 Server 中,如果投递的数据超过 8180 字节,将启用临时文件来保存数据。这里的 task_tmpdir 就是用来设置临时文件保存的位置。

    注意:

    底层默认会使用 /tmp 目录存储 task 数据,如果你的 Linux 内核版本过低,/tmp 目录不是内存文件系统,可以设置为 /dev/shm/;

    task_tmpdir 目录不存在,底层会尝试自动创建

    4)task_use_object:使用面向对象风格的 Task 回调格式。【默认值:false】

    设置为 true 时,onTask 回调将变成对象模式。

    //面向对象风格代码示例$server = new SwooleServer('127.0.0.1', 9501);
    $server->set([
        'worker_num'      => 1,
        'task_worker_num' => 3,
        'task_use_object' => true,
    ]);
    $server->on('receive', function (SwooleServer $server, $fd, $tid, $data) {
        $server->task(['fd' => $fd,]);
    });
    $server->on('Task', function (SwooleServer $server, SwooleServerTask $task) {
        //此处$task是SwooleServerTask对象
        $server->send($task->data['fd'], json_encode($server->stats()));
    });
    $server->start();

    5) task_ipc_mode(进阶):设置 Task 进程与 Worker 进程之间通信的方式。【默认值:1】

    这是一个进阶属性,正常情况下是不用设置,使用默认值即可。要了解这个属性,请先看文末的高级话题 :什么是IPC? 

     知道了什么是IPC后,这个属性可取以下三个值:

    其中:

    模式1:支持定向投递,可在 task 和 taskwait 方法中使用 dst_worker_id,指定目标 Task进程。dst_worker_id 设置为 -1 时,底层会判断每个 Task 进程的状态,向当前状态为空闲的进程投递任务。

    模式2、3:消息队列模式使用操作系统提供的内存队列存储数据,未指定 mssage_queue_key 消息队列 Key,将使用私有队列,在 Server 程序终止后会删除消息队列。指定消息队列 Key 后 Server 程序终止后,消息队列中的数据不会删除,因此进程重启后仍然能取到数据。这两者的不同之处在于,模式2 支持定向投递,$serv->task($data, $task_worker_id) 可以指定投递到哪个 task 进程。模式3 是完全争抢模式, task 进程会争抢队列,将无法使用定向投递,task/taskwait 将无法指定目标进程 ID,即使指定了 $task_worker_id,在模式3 下也是无效的。另外:模式3 会影响 sendMessage 方法,使 sendMessage 发送的消息会随机被某一个 task 进程获取。

    新函数

    函数task:投递一个异步任务到 task_worker 池中。此函数是非阻塞的,执行完毕会立即返回。Worker 进程可以继续处理新的请求。

    SwooleServer->task(mixed $data, int $dstWorkerId = -1): int

    $data:要投递的任务数据,必须是可序列化的 PHP 变量。

    $dstWorkerId:可以指定要给投递给哪个 Task 进程,传入 ID 即可,范围参考 $worker_id;默认值:-1。

    函数finish: 用于在 Task 进程中通知 Worker 进程,投递的任务已完成。此函数可以传递结果数据给 Worker 进程(即,触发worker进程的onFinish事件)。

    SwooleServer->finish(mixed $data)

    $data:任务处理的结果内容

    注意:·

    finish 方法可以连续多次调用,Worker 进程会多次触发 onFinish 事件;

    在 onTask 回调函数中调用过 finish 方法后,return 数据依然会触发 onFinish 事件;

    Server->finish 是可选的。如果 Worker 进程不关心任务执行的结果,不需要调用此函数;

    在 onTask 回调函数中 return 字符串,等同于调用 finish;

    新事件

    1) 事件onTask:在 task 进程内被调用。worker 进程可以使用 task 函数向 task_worker 进程投递新的任务。当前的 Task 进程在调用 onTask 回调函数时会将进程状态切换为忙碌,这时将不再接收新的 Task,当 onTask 函数返回时会将进程状态切换为空闲然后继续接收新的 Task。

    function onTask(SwooleServer $server, int $task_id, int $src_worker_id, mixed $data);

    $server:SwooleServer 对象

    $task_id:执行任务的 task 进程 id【$task_id 和 $src_worker_id 组合起来才是全局唯一的,不同的 worker 进程投递的任务 ID 可能会有相同

    $src_worker_id:投递任务的 worker 进程 id

    $data:任务的数据内容

    注意:

    如果开启了 task_enable_coroutine 则回调函数原型是:

    $server->on('Task', function (SwooleServer $server, SwooleServerTask $task) {
        $task->worker_id;              //来自哪个`Worker`进程
        $task->id;                     //任务的编号
        $task->flags;                  //任务的类型,taskwait, task, taskCo, taskWaitMulti 可能使用不同的 flags
        $task->data;                   //任务的数据
        co::sleep(0.2);                //协程 API
        $task->finish([123, 'hello']); //完成任务,结束并返回数据
    });

    在 onTask 函数中 return 字符串(return 的变量可以是任意非 null 的 PHP 变量),表示将此内容返回给 worker 进程。也可以通过 SwooleServer->finish() 来触发 onFinish 函数,而无需再 return。此时worker 进程中会触发 onFinish 函数,表示投递的 task 已完成。

    onTask 函数执行时遇到致命错误退出,或者被外部进程强制 kill,当前的任务会被丢弃,但不会影响其他正在排队的 Task。

    2)事件onFinish:在 worker 进程被调用,当 worker 进程投递的任务在 task 进程中完成时被触发。

    function onFinish(SwooleServer $server, int $task_id, mixed $data)

    $server:SwooleServer 对象;

    $task_id:执行任务的 task 进程 id;

    $data:任务处理的结果内容。

    注意:

    - task 进程的 onTask 事件中没有调用 finish 方法或者 return 结果,worker 进程不会触发 onFinish。

    -执行 onFinish 逻辑的 worker 进程与下发 task 任务的 worker 进程是同一个进程。

    关于异步任务的注意点:

    -使用消息队列通信,如果 Task进程 处理能力低于投递速度,可能会引起 Worker 进程阻塞。

    -使用消息队列通信后 task 进程无法支持协程 (开启 task_enable_coroutine)。

    ----------- 高级话题分隔线--------------

    什么是IPC

    同一台主机上两个进程间通信 (简称 IPC) 的方式有很多种,在 Swoole 下我们使用了 2 种方式 Unix Socket 和 sysvmsg,下面分别介绍:

    第一种:Unix Socket

    全名 UNIX Domain Socket, 简称 UDS, 使用套接字的 API (socket,bind,listen,connect,read,write,close 等),和 TCP/IP 不同的是不需要指定 ip 和 port,而是通过一个文件名来表示 (例如 FPM 和 Nginx 之间的 /tmp/php-fcgi.sock),UDS 是 Linux 内核实现的全内存通信,无任何 IO 消耗。在 1 进程 write,1 进程 read,每次读写 1024 字节数据的测试中,100 万次通信仅需 1.02 秒,而且功能非常的强大,Swoole 下默认用的就是这种 IPC 方式

    Swoole 下面使用 UDS 通讯有两种类型:SOCK_STREAM 和 SOCK_DGRAM,可以简单的理解为 TCP 和 UDP 的区别,当使用 SOCK_STREAM 类型的时候同样需要考虑 TCP 粘包问题。

    当使用 SOCK_DGRAM 类型的时候不需要考虑粘包问题,每个 send() 的数据都是有边界的,发送多大的数据接收的时候就收到多大的数据,没有传输过程中的丢包、乱序问题,send 写入和 recv 读取的顺序是完全一致的。send 返回成功后一定是可以 recv 到。
    在 IPC 传输的数据比较小时非常适合用 SOCK_DGRAM 这种方式,由于 IP 包每个最大有 64k 的限制,所以用 SOCK_DGRAM 进行 IPC 时候单次发送数据不能大于 64k,同时要注意收包速度太慢操作系统缓冲区满了会丢弃包,因为 UDP 是允许丢包的,可以适当调大缓冲区。

    第二种:sysvmsg

    即 Linux 提供的消息队列,这种 IPC 方式通过一个文件名来作为 key 进行通讯,这种方式非常的不灵活,实际项目使用的并不多,不做过多介绍。此种 IPC 方式只有两个场景下有用:

    1)防止丢数据,如果整个服务都挂掉,再次启动队列中的消息也在,可以继续消费,但同样有脏数据的问题。

    2)可以外部投递数据,比如 Swoole 下的 Worker进程通过消息队列给 Task进程投递任务,第三方的进程也可以投递任务到队列里面让 Task 消费,甚至可以在命令行手动添加消息到队列。

    ---------------------------  我是可爱的分割线  ----------------------------

    最后博主借地宣传一下,漳州编程小组招新了,这是一个面向漳州青少年信息学/软件设计的学习小组,有意向的同学点击链接,联系我吧。

  • 相关阅读:
    LeetCode——Length of Last Word
    Leetcode--Remove Duplicates from Sorted Array
    Cocos2d-x 精灵碰撞检測(方法二)
    hibernate中持久化对象的生命周期(三态:自由态,持久态,游离态 之间的转换)
    Jquery Ajax时 error处理 之 parsererror
    DropdownList绑定的两种方法
    mac 系统开发android,真机调试解决方式(无数的坑之后吐血总结)
    淘宝PK京东:哥刷的不是广告,刷的是存在
    历时一年,我的著作《第一行代码——Android》已出版!
    编程算法
  • 原文地址:https://www.cnblogs.com/ddcoder/p/13631308.html
Copyright © 2020-2023  润新知