• Linux服务器程序规范化


    Linux日志体系

    在这里插入图片描述
    rsyslogd守护进程既能接收用户进程输出的日志,又能接收内核日志。用户进程是通过调用syslog函数生成系统日志的。该函数将日志输出到一个UNIX本地域socket类型(AF_UNIX)的文件/dev/log中,rsyslogd 则监听该文件以获取用户进程的输出。内核日志在老的系统上是通过另外一个守护进程rklogd来管理的,rsyslogd 利用额外的模块实现了相同的功能。内核日志由printk等函数打印至内核的环状缓存(ring buffer) 中。环状缓存的内容直接映射到/proc/kmsg文件中。rsyslogd 则通过读取该文件获得内核日志。

    rsyslogd守护进程在接收到用户进程或内核输人的日志后,会把它们输出至某些特定的日志文件。默认情况下,调试信息会保存至/varlog/debug文件,普通信息保存至/var/log/messages文件,内核消息则保存至/var/log/kerm.log文件。不过,日志信息具体如何分发,可以在rsyslogd的配置文件中设置。rsyslogd 的主配置文件是/etc/syslog.conf,其中主要可以设置的项包括:内核日志输人路径,是否接收UDP日志及其监听端口(默认是514,见/etc/services文件),是否接收TCP日志及其监听端口,日志文件的权限,包含哪些子配置文件(比如/etc/rsyslog.d/* .conf)。rsyslogd 的子配置文件则指定各类日志的目标存储文件。

    应用程序使用syslog函数与rsyslogd守护进程通信。syslog 函数的定义如下:

    #ifdef __va_arg_pack
    __fortify_function void
    syslog (int __pri, const char *__fmt, ...)
    {
      __syslog_chk (__pri, __USE_FORTIFY_LEVEL - 1, __fmt, __va_arg_pack ());
    }
    #elif !defined __cplusplus
    # define syslog(pri, ...) \
      __syslog_chk (pri, __USE_FORTIFY_LEVEL - 1, __VA_ARGS__)
    #endif
    

    该函数采用可变参数(第二个参数message和第三个参数)来结构化输出。priority 参数是所谓的设施值与日志级别的按位或。设施值的默认值是LOG USER,我们下面的讨论也只限于这一种设施值。日志级别有如下几个:

    #define	LOG_EMERG	0	/* system is unusable */
    #define	LOG_ALERT	1	/* action must be taken immediately */
    #define	LOG_CRIT	2	/* critical conditions */
    #define	LOG_ERR		3	/* error conditions */
    #define	LOG_WARNING	4	/* warning conditions */
    #define	LOG_NOTICE	5	/* normal but significant condition */
    #define	LOG_INFO	6	/* informational */
    #define	LOG_DEBUG	7	/* debug-level messages */
    

    下面这个函数可以改变syslog的默认输出方式,进一步结构化日志内容:

    /* Open connection to system logger.
    
       This function is a possible cancellation point and therefore not
       marked with __THROW.  */
    extern void openlog (const char *__ident, int __option, int __facility);
    

    ident参数指定的字符串将被添加到日志消息的日期和时间之后,它通常被设置为程序的名字。logopt 参数对后续syslog调用的行为进行配置,它可取下列值的按位或:

    /*
     * Option flags for openlog.
     *
     * LOG_ODELAY no longer does anything.
     * LOG_NDELAY is the inverse of what it used to be.
     */
    #define	LOG_PID		0x01	/* log the pid with each message */
    #define	LOG_CONS	0x02	/* log on the console if errors in sending */
    #define	LOG_ODELAY	0x04	/* delay open until first syslog() (default) */
    #define	LOG_NDELAY	0x08	/* don't delay open */
    #define	LOG_NOWAIT	0x10	/* don't wait for console forks: DEPRECATED */
    #define	LOG_PERROR	0x20	/* log to stderr as well */
    

    facility参数可用来修改syslog函数中的默认设施值。

    此外,日志的过滤也很重要。程序在开发阶段可能需要输出很多调试信息,而发布之后我们又需要将这些调试信息关闭。解决这个问题的方法并不是在程序发布之后删除调试代码(因为日后可能还需要用到),而是简单地设置日志掩码,使日志级别大于日志掩码的日志信息被系统忽略。下面这个函数用于设置syslog 的日志掩码:

    /* Set the log mask level.  */
    extern int setlogmask (int __mask) __THROW;
    

    maskpri参数指定日志掩码值。该函数始终会成功,它返回调用进程先前的日志掩码值。
    最后,不要忘了使用如下函数关闭日志功能:

    /* Close descriptor used to write to system logger.
    
       This function is a possible cancellation point and therefore not
       marked with __THROW.  */
    extern void closelog (void);
    

    用户信息

    用户信息对于服务器程序的安全性来说是很重要的,比如大部分服务器就必须以root身份启动,但不能以root身份运行。下面这一组函数可以获取和设置当前进程的真实用户ID(UID)、有效用户ID (EUID)、真实组ID (GID)和有效组ID ( EGID): .

    #include <sys/types.h>
    #include <unistd.h>
    uid_ t getuid();/* 获取真实用户 ID */ 
    uid_ t geteuid() ;/*获取有效用户ID */
    gid_ t getgid() ;/*获取真实组ID */
    gid_ t getegid() ;/*获取有效组ID */
    int setuid( uid_t uid ) ;/*设置真实用户ID */
    int seteuid( uid_t uid ) ;/*设置有效用户ID */
    int setgid( gid_t gid );/*设置真实组ID */
    int setegid( gid_t gid );/*设置有效组ID */
    

    需要指出的是,个进程拥有两个用户ID:UID和EUID。EUID存在的目的是方便资源访问:它使得运行程序的用户拥有该程序的有效用户的权限。比如su程序,任何用户都可以使用它来修改自己的账户信息,但修改账户时su程序不得不访问/etc/passwd文件,而访问该文件是需要root权限的。那么以普通用户身份启动的su程序如何能访问/etc/passwd文件呢?窍门就在EUID。用Is命令可以查看到,su 程序的所有者是root,并且它被设置了set-user-id标志。这个标志表示,任何普通用户运行su程序时,其有效用户就是该程序的所有者root.那么,根据有效用户的含义,任何运行su程序的普通用户都能够访问/epassd文件。有效用户为root的进程称为特权进程(privileged processes)。EGID 的含义与EUID类似:给运行目标程序的组用户提供有效组的权限。进程的UID和EUID的区别,进程的UID是启动程序的用户的ID,而EUID则是root账户(文件所有者)的ID。

    进程间关系

    进程组

    Linux下每个进程都隶属于一个进程组,因此它们除了PID信息外,还有进程组ID(PGID)。我们可以用如下函数来获取指定进程的PGID:

    extern __pid_t getpgid (__pid_t __pid) __THROW;
    

    该函数成功时返回进程pid所属进程组的PGID,失败则返回-1并设置每个进程组都有一个首领进程,其PGID和PID相同。进程组将一直存在, 直到其中所有进程都退出,或者加入到其他进程组。

    下面的函数用于设置PGID:

    /* Set the process group ID of the process matching PID to PGID.
       If PID is zero, the current process's process group ID is set.
       If PGID is zero, the process ID of the process is used.  */
    extern int setpgid (__pid_t __pid, __pid_t __pgid) __THROW;
    

    该函数将PID为pid的进程的PGID设置为pgid。如果pid和pgid相同,则由pid指定的进程将被设置为进程组首领;如果pid为0,则表示设置当前进程的PGID为pgid;如果pgid为0,则使用pid作为目标PGID。setpgid函数成功时返回0,失败则返回-1并设置errno。

    一个进程只能设置自己或者其子进程的PGID。并且,当子进程调用exec系列函数后,我们也不能再在父进程中对它设置PGID。

    会话

    一些有关联的进程组将形成-一个会话(session)。 下面的函数用于创建-一个会话:

    /* Create a new session with the calling process as its leader.
       The process group IDs of the session and the calling process
       are set to the process ID of the calling process, which is returned.  */
    extern __pid_t setsid (void) __THROW;
    

    该函数不能由进程组的首领进程调用,否则将产生-一个错误。对于非组首领的进程,调用该函数不仅创建新会话,而且有如下额外效果:

    • 调用进程成为会话的首领,此时该进程是新会话的唯一- 成员。
    • 新建-一个进程组,其PGID就是调用进程的PID,调用进程成为该组的首领。
    • 调用进程将甩开终端( 如果有的话)。

    该函数成功时返回新的进程组的PGID,失败则返回-1并设置error。

    Linux进程并未提供所谓会话ID(SID)的概念,但Linux系统认为它等于会话首领所在的进程组的PGID,并提供了如下丽数来读取SID:

    /* Return the session ID of the given process.  */
    extern __pid_t getsid (__pid_t __pid) __THROW;
    

    用ps命令查看进程间关系

       PID    PPID    PGID     SID COMMAND
      53998   51650   53998   53998 bash
      54717   53998   54717   53998 ps
      54718   53998   54717   53998 less
    

    我们是在bash shell下执行ps和less命令的,所以ps和less命令的父进程是bash命令,这可以从PPID (父进程PID)一列看出。这3条命令创建了1个会话(SID 是53998)和2个进程组(PGID分别是53998和53998)。bash命令的PID、PGID和SID都相同,很明显它既是会话的首领,也是组53998的首领。ps 命令则是组54717的首领,因为其PID也是54717。图描述了此三者的关系。
    在这里插入图片描述

    系统资源限制

    Linux上运行的程序都会受到资源限制的影响,比如物理设备限制(CPU数量、内存数量等)、系统策略限制(CPU时间等),以及具体实现的限制(比如文件名的最大长度)。Linux系统资源限制可以通过如下一-对函数来读取和设置:

    #include<sys/resource.h>
    
    typedef int __rlimit_resource_t;
    
    /* Put the soft and hard limits for RESOURCE in *RLIMITS.
       Returns 0 if successful, -1 if not (and sets errno).  */
    extern int getrlimit (__rlimit_resource_t __resource, struct rlimit *__rlimits) __THROW;
    

    __rlimits参数是rlimit结构体类型的指针,rlimit 结构体的定义如下:

    struct rlimit
     {
       /* The current (soft) limit.  */
       rlim_t rlim_cur;
       /* The hard limit.  */
       rlim_t rlim_max;
     };
    

    rlim_t是一个整数类型,它描述资源级别。rlim_cur 成员指定资源的软限制,rlim_max成员指定资源的硬限制。软限制是-一个建议性的、最好不要超越的限制,如果超越的话,系统可能向进程发送信号以终止其运行。例如,当进程CPU时间超过其软限制时,系统将向进程发送SIGXCPU信号:当文件尺寸超过其软限制时,系统将向进程发送SIGXFSZ信号。硬限制一般是软限制的上限。普通程序可以减小硬限制,而只有以root身份运行的程序才能增加硬限制。此外,我们可以使用ulimit命令修改当前shell环境下的资源限制(软限制或/和硬限制),这种修改将对该shell启动的所有后续程序有效。我们也可以通过修改配置文件来改变系统软限制和硬限制,而且这种修改是永久的。

    resource参数指定资源限制类型。表7-1列举了部分比较重要的资源限制类型。
    在这里插入图片描述
    setrlimit和getrlimit成功时返回0,失败则返回-1并设置errno。

    改变工作目录和根目录

    获取进程当前工作目录和改变进程工作目录的丽数分别是:

    /* Get the pathname of the current working directory,
       and put it in SIZE bytes of BUF.  Returns NULL if the
       directory couldn't be determined or SIZE was too small.
       If successful, returns BUF.  In GNU, if BUF is NULL,
       an array is allocated with `malloc'; the array is SIZE
       bytes long, unless SIZE == 0, in which case it is as
       big as necessary.  */
    extern char *getcwd (char *__buf, size_t __size) __THROW __wur;
    
    /* Change the process's working directory to PATH.  */
    extern int chdir (const char *__path) __THROW __nonnull ((1)) __wur;
    

    buf参数指向的内存用于存储进程当前工作目录的绝对路径名,其大小由size 参数指定。如果当前工作目录的绝对路径的长度(再加上一个空结束字符“\0”) 超过了size,则getewd将返回NULL,并设置erno为ERANGE.如果buf为NULL并且size非0,则getcwd可能在内部使用malloc动态分配内存,并将进程的当前工作目录存储在其中。如果是这种情况,则我们必须自己来释放getcwd在内部创建的这块内存。getcwd 函数成功时返回- -个指向目标存储区(buf指向的缓存区或是getcwd在内部动态创建的缓存区)的指针,失败则返回NULL并设置errno。

    chdir函数的path参数指定要切换到的目标目录。它成功时返回0,失败时返回-1并设
    置errno。

    改变进程根目录的函数是chroot,其定义如下:

    /* Make PATH be the root directory (the starting point for absolute paths).
       This call is restricted to the super-user.  */
    extern int chroot (const char *__path) __THROW __nonnull ((1)) __wur;
    

    path参数指定要切换到的目标根目录。它成功时返回0,失败时返回-1并设置ermo。chroot并不改变进程的当前工作目录,所以调用chroot之后,我们仍然需要使用chdir(“/”)来将工作目录切换至新的根目录。改变进程的根目录之后,程序可能无法访问类似/dev的文件(和目录),因为这些文件(和目录)并非处于新的根目录之下。不过好在调用chroot之后,进程原先打开的文件描述符依然生效,所以我们可以利用这些早先打开的文件描述符来访问调用chroot之后不能直接访问的文件(和目录),尤其是一些日志文件。此外,只有特权进程才能改变根目录。

    服务程序后台化

    /* Put the program in the background, and dissociate from the controlling
       terminal.  If NOCHDIR is zero, do `chdir ("/")'.  If NOCLOSE is zero,
       redirects stdin, stdout, and stderr to /dev/null.  */
    extern int daemon (int __nochdir, int __noclose) __THROW __wur;
    

    其中,nochdir参数用于指定是否改变工作目录,如果给它传递0,则工作目录将被设置为“1”(根目录),否则继续使用当前工作目录。noclose 参数为0时,标准输人、标准输出和标准错误输出都被重定向到/dev/null文件,否则依然使用原来的设备。该函数成功时返回0,失败则返回-1并设置errno。

  • 相关阅读:
    《图解算法》读书笔记(十)K最近邻算法
    《图解算法》读书笔记(九) 动态规划
    《图解算法》读书笔记(八) 贪婪算法
    Go 常用包之fmt、flag包(四)
    GO环境及初始化项目(二)
    nginx fpm 常见错误对比分析
    Ueditor富文本添加、编辑视频,视频不显示解决方案
    phpunit 测试
    mysql 主从并行复制(MTS)
    Explain执行计划详解
  • 原文地址:https://www.cnblogs.com/chengmf/p/15715300.html
Copyright © 2020-2023  润新知