• Android native进程间通信实例-socket本地通信篇之——服务端进程异常退出解决办法


     导读:

      好难受啊,为什么服务端说挂就挂,明明只是客户端关闭而已,服务端怎么能挂呢?

    想想,如果手机上使用一个聊天程序的时候,手机端关闭了聊天程序,那么远端服务器程序总不能说挂就挂吧!所以一定要查明真相。

    1. 跟踪代码查找到进程退出的源头

      之前服务端源码:https://www.cnblogs.com/songsongman/p/11187844.html

    查阅代码发现,代码主体在while(1)里面,所以最可疑的地方在于accpet,pthread_create, pthread_join和创建的线程client_thread了

    明摆着就是client_thread中出了问题,因为accpet,pthread_create, pthread_join中都有根据函数返回值做是否出错的判断,还是认怂好好看看线程做了什么:

    void *client_thread(void *arg)
    {
        int clifd = *(int *)arg;char *s = "hello mysocketclient
    ";
    
        while(1)
        {
            usleep(1000000);
            write(clifd,s,strlen(s));//send(clifd,s,strlen(s),0);
        }
    
        return (void *)0;
    }

    哇!居然使用write的时候没有添加返回值的判断,在ubuntu终端中输入man 2 write,可以看到write出错时候会返回-1;

    2.简单完善代码容错机制

    添加容错代码后以后看看效果如何,代码如下:

        while(1)
        {
            usleep(1000000);
            ret = write(clifd,s,strlen(s));//send(clifd,s,strlen(s),0);
            if(ret == -1)
            {
                printf("client thread write failed !
    ");
           close(clifd); pthread_exit(NULL); } }

    执行结果如下:

    过程分析,

    1. 先执行服务端程序,然后运行客户端程序,客户端程序强制退出(通过快捷键ctrl+c),服务端client_thread中write返回-1,线程正常退出。

    2. 这时候服务端程序还阻塞在accpet等待下一次的客户端连接请求,运行新的客户端程序,然后强制退出客户端,发现服务端进程居然直接退出了!

    咋办啊!感觉代码没有任何问题了,为啥还会出错,虽然很明确一定是write的时候没能写进客户端导致的进程奔溃,但是却无从下手。

    (注意:为了解决这个问题,笔者绞尽脑汁修改,比如添加

    shutdown(clifd, SHUT_RDWR);

    又或者添加getsockopt来实时获取连接状态

    )效果都不佳,无法解决问题。

    3. 添加捕获异常来再次加强容错机制

    绞尽脑汁似乎没有什么效果,抓耳挠腮看看吧,好好翻翻书,看看能不能找到灵感。

    从网上找到一本和UNIX系统编程有关的书籍《UNIX环境高级编程_第二版中文》,因为android是基于linux开发的操作系统,linux又是从UNIX那边衍射出来的,

    所以linux系统编程这块参考这本书特别靠谱。

    看到一个和信号有关的章节,确定了要用signal来检测异常,可检测的信号可真多啊!

                        图3.1  参考UNIX环境高级编程第二版中文第10章表1

                 

     然后不小心看到这点

    好吧,灵感来了,开始写代码,直接添加头文件

    #include <signal.h>

    然后再main函数中添加signal(SIGPIPE, SIG_IGN);

    运行服务端,再运行客户端,不管客户端怎么退出重启,服务端都不受影响了。

    任务完成!

  • 相关阅读:
    LeetCode Arithmetic Slices
    LeetCode Number of Longest Increasing Subsequence
    LeetCode Longest Increasing Subsequence
    shrio注解的方式进行权限控制
    30分钟学会如何使用Shiro(转自:http://www.cnblogs.com/learnhow/p/5694876.html)
    eclipse逆向生成实体类
    redis2.3.7安装时出现undefined reference to `clock_gettime'
    使用Nginx+Lua(OpenResty)开发高性能Web应用
    shrio初体验(2)Realm
    shrio初体验(1)
  • 原文地址:https://www.cnblogs.com/songsongman/p/11189205.html
Copyright © 2020-2023  润新知