• Linux系统调用


    什么是系统调用?

    Linux内核中设置了一组用于实现各种系统功能的子程序,称为系统调用。用户可以通过系统调用命令在自己的应用程序中调用它们。从某种角度来看,系统调用和普通的函数调用非常相似。区别仅仅在于,系统调用由操作系统核心提供,运行于核心态;而普通的函数调用由函数库或用户自己提供,运行于用户态。

    随Linux核心还提供了一些C语言函数库,这些库对系统调用进行了一些包装和扩展,因为这些库函数与系统调用的关系非常紧密,所以习惯上把这些函数也称为系统调用。

    为什么要用系统调用?

    实际上,很多已经被我们习以为常的C语言标准函数,在Linux平台上的实现都是靠系统调用完成的,所以如果想对系统底层的原理作深入的了解,掌握各种系统调用是初步的要求。进一步,若想成为一名Linux下编程高手,也就是我们常说的Hacker,其标志之一也是能对各种系统调用有透彻的了解。

    即使除去上面的原因,在平常的编程中你也会发现,在很多情况下,系统调用是实现你的想法的简洁有效的途径,所以有可能的话应该尽量多掌握一些系统调用,这会对你的程序设计过程带来意想不到的帮助。

    系统调用是怎么工作的?

    一般的,进程是不能访问内核的。它不能访问内核所占内存空间也不能调用内核函数。CPU硬件决定了这些(这就是为什么它被称作"保护模式")。系统调用是这些规则的一个例外。其原理是进程先用适当的值填充寄存器,然后调用一个特殊的指令,这个指令会跳到一个事先定义的内核中的一个位置(当然,这个位置是用户进程可读但是不可写的)。在Intel CPU中,这个由中断0x80实现。硬件知道一旦你跳到这个位置,你就不是在限制模式下运行的用户,而是作为操作系统的内核--所以你就可以为所欲为。

    进程可以跳转到的内核位置叫做sysem_call。这个过程检查系统调用号,这个号码告诉内核进程请求哪种服务。然后,它查看系统调用表(sys_call_table)找到所调用的内核函数入口地址。接着,就调用函数,等返回后,做一些系统检查,最后返回到进程(或到其他进程,如果这个进程时间用尽)。

    具体过程如下图所示:

    如何使用系统调用?

    先来看一个例子:

     

    这是因为在time.h中实际上已经用库函数的形式实现了time这个系统调用,替我们省掉了调用_syscall1宏展开得到函数原型这一步。

    大多数系统调用都在各种C语言函数库中有所实现,所以在一般情况下,我们都可以像调用普通的库函数那样调用系统调用,只在极个别的情况下,我们才有机会用到_syscall*()这几个宏。

    调用性能问题

    系统调用需要从用户空间陷入内核空间,处理完后,又需要返回用户空间。其中除了系统调用服务例程的实际耗时外,陷入/返回过程和系统调用处理程序(查系统调用表、存储恢复用户现场)也需要花销一些时间,这些时间加起来就是一个系统调用的响应速度。系统调用不比别的用户程序,它对性能要求很苛刻,因为它需要陷入内核执行,所以和其他内核程序一样要求代码简洁、执行迅速。幸好Linux具有令人难以置信的上下文切换速度,使得其进出内核都被优化得简洁高效;同时所有Linux系统调用处理程序和每个系统调用本身也都非常简洁。

    绝大多数情况下,Linux系统调用性能是可以接受的,但是对于一些对性能要求非常高的应用来说,它们虽然希望利用系统调用的服务,但却希望加快相应速度,避免陷入/返回和系统调用处理程序带来的花销,因此采用由内核直接调用系统调用服务例程,最好的例子就HTTPD——它为了避免上述开销,从内核调用socket等系统调用服务例程。

    Linux系统调用列表

    · 进程控制

    fork 创建一个新进程

    clone 按指定条件创建子进程

    execve 运行可执行文件

    exit 中止进程

    _exit 立即中止当前进程

    getdtablesize 进程所能打开的最大文件数

    getpgid 获取指定进程组标识号

    setpgid 设置指定进程组标志号

    getpgrp 获取当前进程组标识号

    setpgrp 设置当前进程组标志号

    getpid 获取进程标识号

    getppid 获取父进程标识号

    getpriority 获取调度优先级

    setpriority 设置调度优先级

    modify_ldt 读写进程的本地描述表

    nanosleep 使进程睡眠指定的时间

    nice 改变分时进程的优先级

    pause 挂起进程,等待信号

    personality 设置进程运行域

    prctl 对进程进行特定操作

    ptrace 进程跟踪

    sched_get_priority_max 取得静态优先级的上限

    sched_get_priority_min 取得静态优先级的下限

    sched_getparam 取得进程的调度参数

    sched_getscheduler 取得指定进程的调度策略

    sched_rr_get_interval 取得按RR算法调度的实时进程的时间片长度

    sched_setparam 设置进程的调度参数

    sched_setscheduler 设置指定进程的调度策略和参数

    sched_yield 进程主动让出处理器,并将自己等候调度队列队尾

    vfork 创建一个子进程,以供执行新程序,常与execve等同时使用

    wait 等待子进程终止

    wait3 参见wait

    waitpid 等待指定子进程终止

    wait4 参见waitpid

    capget 获取进程权限

    capset 设置进程权限

    getsid 获取会晤标识号

    setsid 设置会晤标识号

    · 文件系统控制

    1.文件读写操作

    fcntl 文件控制

    open 打开文件

    creat 创建新文件

    close 关闭文件描述字

    read 读文件

    write 写文件

    readv 从文件读入数据到缓冲数组中

    writev 将缓冲数组里的数据写入文件

    pread 对文件随机读

    pwrite 对文件随机写

    lseek 移动文件指针

    _llseek 在64位地址空间里移动文件指针

    dup 复制已打开的文件描述字

    dup2 按指定条件复制文件描述字

    flock 文件加/解锁

    poll I/O多路转换

    truncate 截断文件

    ftruncate 参见truncate

    umask 设置文件权限掩码

    fsync 把文件在内存中的部分写回磁盘

    2.文件系统操作

    access 确定文件的可存取性

    chdir 改变当前工作目录

    fchdir 参见chdir

    chmod 改变文件方式

    fchmod 参见chmod

    chown 改变文件的属主或用户组

    fchown 参见chown

    lchown 参见chown

    chroot 改变根目录

    stat 取文件状态信息

    lstat 参见stat

    fstat 参见stat

    statfs 取文件系统信息

    fstatfs 参见statfs

    readdir 读取目录项

    getdents 读取目录项

    mkdir 创建目录

    mknod 创建索引节点

    rmdir 删除目录

    rename 文件改名

    link 创建链接

    symlink 创建符号链接

    unlink 删除链接

    readlink 读符号链接的值

    mount 安装文件系统

    umount 卸下文件系统

    ustat 取文件系统信息

    utime 改变文件的访问修改时间

    utimes 参见utime

    quotactl 控制磁盘配额

    · 系统控制

    ioctl I/O总控制函数

    _sysctl 读/写系统参数

    acct 启用或禁止进程记账

    getrlimit 获取系统资源上限

    setrlimit 设置系统资源上限

    getrusage 获取系统资源使用情况

    uselib 选择要使用的二进制函数库

    ioperm 设置端口I/O权限

    iopl 改变进程I/O权限级别

    outb 低级端口操作

    reboot 重新启动

    swapon 打开交换文件和设备

    swapoff 关闭交换文件和设备

    bdflush 控制bdflush守护进程

    sysfs 取核心支持的文件系统类型

    sysinfo 取得系统信息

    adjtimex 调整系统时钟

    alarm 设置进程的闹钟

    getitimer 获取计时器值

    setitimer 设置计时器值

    gettimeofday 取时间和时区

    settimeofday 设置时间和时区

    stime 设置系统日期和时间

    time 取得系统时间

    times 取进程运行时间

    uname 获取当前UNIX系统的名称、版本和主机等信息

    vhangup 挂起当前终端

    nfsservctl 对NFS守护进程进行控制

    vm86 进入模拟8086模式

    create_module 创建可装载的模块项

    delete_module 删除可装载的模块项

    init_module 初始化模块

    query_module 查询模块信息

    *get_kernel_syms 取得核心符号,已被query_module代替

    · 内存管理

    brk 改变数据段空间的分配

    sbrk 参见brk

    mlock 内存页面加锁

    munlock 内存页面解锁

    mlockall 调用进程所有内存页面加锁

    munlockall 调用进程所有内存页面解锁

    mmap 映射虚拟内存页

    munmap 去除内存页映射

    mremap 重新映射虚拟内存地址

    msync 将映射内存中的数据写回磁盘

    mprotect 设置内存映像保护

    getpagesize 获取页面大小

    sync 将内存缓冲区数据写回硬盘

    cacheflush 将指定缓冲区中的内容写回磁盘

    · 网络管理

    getdomainname 取域名

    setdomainname 设置域名

    gethostid 获取主机标识号

    sethostid 设置主机标识号

    gethostname 获取本主机名称

    sethostname 设置主机名称

    · socket控制

    socketcall socket系统调用

    socket 建立socket

    bind 绑定socket到端口

    connect 连接远程主机

    accept 响应socket连接请求

    send 通过socket发送信息

    sendto 发送UDP信息

    sendmsg 参见send

    recv 通过socket接收信息

    recvfrom 接收UDP信息

    recvmsg 参见recv

    listen 监听socket端口

    select 对多路同步I/O进行轮询

    shutdown 关闭socket上的连接

    getsockname 取得本地socket名字

    getpeername 获取通信对方的socket名字

    getsockopt 取端口设置

    setsockopt 设置端口参数

    sendfile 在文件或端口间传输数据

    socketpair 创建一对已联接的无名socket

    · 用户管理

    getuid 获取用户标识号

    setuid 设置用户标志号

    getgid 获取组标识号

    setgid 设置组标志号

    getegid 获取有效组标识号

    setegid 设置有效组标识号

    geteuid 获取有效用户标识号

    seteuid 设置有效用户标识号

    setregid 分别设置真实和有效的的组标识号

    setreuid 分别设置真实和有效的用户标识号

    getresgid 分别获取真实的,有效的和保存过的组标识号

    setresgid 分别设置真实的,有效的和保存过的组标识号

    getresuid 分别获取真实的,有效的和保存过的用户标识号

    setresuid 分别设置真实的,有效的和保存过的用户标识号

    setfsgid 设置文件系统检查时使用的组标识号

    setfsuid 设置文件系统检查时使用的用户标识号

    getgroups 获取后补组标志清单

    setgroups 设置后补组标志清单

    · 进程间通信

    ipc 进程间通信总控制调用

    信号

    sigaction 设置对指定信号的处理方法

    sigprocmask 根据参数对信号集中的信号执行阻塞/解除阻塞等操作

    sigpending 为指定的被阻塞信号设置队列

    sigsuspend 挂起进程等待特定信号

    signal 参见signal

    kill 向进程或进程组发信号

    *sigblock 向被阻塞信号掩码中添加信号,已被sigprocmask代替

    *siggetmask 取得现有阻塞信号掩码,已被sigprocmask代替

    *sigsetmask 用给定信号掩码替换现有阻塞信号掩码,已被sigprocmask代替

    *sigmask 将给定的信号转化为掩码,已被sigprocmask代替

    *sigpause 作用同sigsuspend,已被sigsuspend代替

    sigvec 为兼容BSD而设的信号处理函数,作用类似sigaction

    ssetmask ANSI C的信号处理函数,作用类似sigaction

    消息

    msgctl 消息控制操作

    msgget 获取消息队列

    msgsnd 发消息

    msgrcv 取消息

    管道

    pipe 创建管道

    信号量

    semctl 信号量控制

    semget 获取一组信号量

    semop 信号量操作

    共享内存

    shmctl 控制共享内存

    shmget 获取共享内存

    shmat 连接共享内存

    shmdt 拆卸共享内存

  • 相关阅读:
    bat 批处理编写
    dos 命令
    反射
    反爬机制和破解方法汇总
    pandas
    谷歌历史浏览器下载
    python-----pip安装源选择(亲测有效)
    deepin 20.1 系统未安装pip
    python自带库-----os.path
    python 自带库---os库
  • 原文地址:https://www.cnblogs.com/cyyljw/p/9037109.html
Copyright © 2020-2023  润新知