• Linux 网络编程基础(一) 客户端/服务器的简单实现


     

    一、 Socket的基本知识

    1. socket历史与功能

    在80年代早期,加利福尼亚大学伯克利分校的一个研究组,将TCP/IP软件一直到UNIX操作系统上。作为实现该项目的一部分,他们设计了一种接口,应用程序可以通过这个接口方便的进行通信。这样做的结果是出现了插件接口(Barkeley Socket)。

    image

    图1. Socket层次

    Socket实质上提供了进程通信的端点,进程通信之前,双方必须首先各自创建一个端点,否则是没有办法建立联系并相互通信的。

    每一个Socket都一个半相关描述:

    {协议, 本地地址, 本地端口}

    完整的Socket的描述:

    {协议, 本地地址, 本地端口, 远程地址, 远程端口}

    2. Socket工作流程
    l 服务器端

    首先,服务器应用程序用系统调用socket()来创建一个socket,它是系统分配给该服务器进程的类似文件描述符的资源,不能与其他进程共享。

    接下来,需要给socket绑定,本地socket绑定的是Linux文件系统中的文件名,一般放在/tmp或者/usr/tmp目录中。对于网络socket,要和客户连接的特定网络相关的服务标示符(端口号或者访问点)。可以使用系统调用bind()来绑定socket,然后服务器进程就用listen()创建一个队列将客户的连接存入队列,再使用accept()接收客户的连接。

    服务器调用accept()时会创建一个和原有的socket不同的新socket。这个新socket只用于与这个特定的客户进行通信,而原socket保留下来继续处理来自其他客户的连接。

    l 客户端

    客户端是首先调用socket()创建一个未绑定的socket,然后将服务器的socket作为一个地址调用connect()与服务器建立连接。

    image

    图2 面向连接(TCP)的Socket工作流程

    image

    图3 UDP的socket工作流程

    3. 套接字属性
    l 套接字的域(domain)

    AF_INET

    互联网络

    AF_UNIX

    UNIX文件系统

    AF_ISO

    基于ISO标准协议的网络

    AF_XNS

    Xerox网络系统

    l 套接字的类型(type)

    套接字有三种类型:流式套接字(SOCK_STREAM),数据报套接字(SOCK_DGRAM)及原始套接字。

    流式套接字(SOCK_STREAM)

    流式的套接字可以提供可靠的、面向连接的通讯流。如果你通过流式套接字发送顺序的数据:“1”、“2”,那么数据到达的顺序也是“1”、“2”。流式套接字在AF_INET域中使用TCP协议来保证数据传输的正确性及顺序性。TCP是TCP/IP协议的前半部分,IP只处理网络路由。

    数据报套接字(SOCK_DGRAM)

    数据报协议定义了一种无连接的服务,数据通过相互独立的报文进行传输,是无序的,并且不保证可靠,无差错。它使用UDP/IP协议。UDP将数据打包,贴上IP地址,然后发送。这个过程不需要建立连接。

    原始套接字

    原始套接字主要用于一些协议的开发,可以进行比较底层的操作。它功能强大,但是没有流式套接字和数据报套接字使用方便,一般的程序也不涉及到原始套接字。

    4. 套接字地址

    AF_INET与AF_UNIX域的套接字地址结构不相同,分别为struct sockaddr_in, struct sockaddr_un。

    l AF_INET地址结构
    #include <netinet/in.h>
    
    struct sockaddr_in
    
    {
    
    short int sin_family; /* AF_INET */
    
    unsigned short int sin_port; /* Port Numbers*/
    
    struct in_addr sin_addr; /* Internet Address */
    
    }
    

    IP地址结构in_add定义为:

    struct in_addr
    
    {
    
    unsigned long int s_addr; /* IP地址是四个字节的一个32位值 */
    
    }
    
    l AF_UNIX地址结构
    #include <sys/un.h>
    
    struct sockaddr_un
    
    {
    
    sa_family_t sun_family; /* AF_UNIX */
    
    char sun_path[]; /* pathname */
    
    }
    

    在当前的Linux系统中,由X/Open规范定义的类型sa_family_t在头文件sys/un.h中声明,它是短整数类型。另外sun_path指定的路径名长度也是有限制的(Linux规定的是108个字符)。

    二、 转换函数

    1. 主机字节序和网络字节序

    因为每一个机器内部对变量的字节存储顺序不同(有的系统是高位在前,低位在后,有的系统是的低位在前,高位在后),而网络传输的字节序需要统一。所以,对于主机字节序和网络字节序不同的机器,就一定要对数据进行转换(例如IP地址的表示和端口号的表示)。如果主机字节序和网络字节序相同,也要调用转换函数,真正转换 还是不转换由系统函数自己决定。

    转换函数:

    #include <netinet/in.h>
    
    unsigned long int htonl(unsigned long int hostlong); /* host to network long */
    
    unsigned short int htons(unsinged short int hostshort); /* host to network short */
    
    unsigned long int ntohl(unsigned long int netlong); /* network to host long */
    
    unsigned short int ntohs(unsigned short int netshort); /* network to host short */
    

    这些函数将16位和32位整数在主机字节序和标准的网络字节序之间进行转换。“h”代表主机“host”,“n”代表网络“network”,“l”代表“long”,“s”代表“short”。

    三、 socket系统调用

    1. 创建套接字socket()

    socket()系统调用创建一个套接字并返回一个描述符,该描述符可以用来访问该套接字。

    #include <sys/types.h>
    
    #include <sys/socket.h>
    
    int socket(int domain, int type, int protocol);
    

    创建的套接字是一条通信线路的一个端点,domain参数指定协议族,type参数指定这个套接字的通信类型,protocol参数指定使用的协议。

    最常用的套接字域是AF_UNIX和AF_INET,前者用于通过UNIX和Linux文件系统实现的本地套接字,后者用于UNIX网络套接字。AF_INET套接字可以用于通过包括互联网在内的TCP/IP网络进行通信的程序。

    参数type指定这个socket的通信类型,protocol参数指定使用的协议。通信所需的协议一般是由socket类型来决定,通常不需要进行选择。只有当需要选择的时候,才会用到protocol参数。将protocol参数设置为0表示使用默认协议。

    socket返回一个描述符,类似于文件描述符。这个描述符可以用于read(),write()等系统调用来连接另一个socket。

    实例:创建socket,AF_INET,SOCK_STREAM。

    server_sockfd = socket(AF_INET, SOCK_STREAM, 0);
    2. 绑定socket

    在调用socket()获得描述符之后,需要对该套接字进行绑定。AF_UNIX套接字会关联到一个文件系统的路径名,而AF_INET套接字会关联到一个IP端口号。

    #include <sys/socket.h>
    
    int bind(int socket, const struct sockaddr *address, size_t address_len);
    

    bind将参数address中的地址分配给与文件描述符socket关联的未命名套接字。address_len传递地址结构体的长度。 地址的长度取决于地址的类型。bind系统调用需要将struct sockaddr_in或struct sockaddr_un指针转换成struct sockaddr *类型。

    bind在调用成功时返回0, 失败是返回-1并设置errno。

    EBADF

    文件描述符无效

    ENOTSOCK

    文件描述符对应的不是一个socket

    EINVAL

    文件描述符对应的是一个已经绑定的socket

    EADDRNOTAVAIL

    地址不可用

    EADDRINUSE

    地址已经绑定了一个socket

    表2 errno值

    AF_UNIX还有一些错误代码

    EACCESS

    权限不足,不能创建文件系统中的路径名

    ENOTDIR, ENAMETOOLONG

    文件名不符合要求

    表3 AF_UNIX部分errno值

    实例:

    bind(server_sockfd, (struct sockaddr *)&server_address, server_len);
    3. 创建套接字队列

    为了能够在套接字上接受进入的链接,服务器要建立一个队列来保存未处理的请求。

    #include <sys/socket.h>
    
    int listen(int socket, int backlog);
    

    参数backlog设置队列中可以容纳的未处理连接的最大个数。超过这个数字后,剩下的连接会被拒绝。backlog常用值为5……

    listen函数会在成功时返回0,失败时返回-1,错误代码包括EBADF,EINVAL和ENOTSOCK。

    实例:

    listen(server_sockfd, 5);
    4. 接受连接

    一旦服务器程序创建并绑定了socket之后,他就可以通过用accept()来等待客户建立对该socket的连接。

    #inculde <sys/socket.h>
    
    int accept(int socket, struct sockaddr *address, size_t *address_len);
    

    accept只有当有客户程序尝试连接到由socket参数指定的socket上时才返回。accept将创建一个新socket来与该客户进行通信,将该socket描述符作为返回值。之后的读写动作都关联到该socket描述符上。

    参数socket所关联的套接字必须首先已经被bind绑定,而且有listen为其分配连接队列。参数address表示客户的地址,如果不关心客户的地址值可设为空指针。

    如果socket没有未处理的连接accept将阻塞直到队列中有未处理的连接。可以通过设置O_NONBLOCK来改变。实例:

    int flags = fcntl(socket, F_GETFL, 0);
    
    fcntl(socket, F_SETFL, O_NONBLOCK | flags);
    

    发生错误时,accept会返回-1。

    5. 请求连接

    客户程序通过与服务器监听套接字之间绑定的方法连接到服务器。

    #include <sys/socket.h>
    
    int connect(int socket, const struct sockaddr *address, size_t address_len);
    

    参数socket指定的套接字将连接到参数address指定的服务器的socket上。

    成功时,connect返回0,失败返回-1。

    如果连接不能立刻建立,connect将阻塞到超时时间,超过超时时间连接将被放弃,连接失败。

    6. 关闭socket

    可以通过close()来终止服务器与客户端的socket连接。

    #include <unistd.h>
    
    int close(int socket);
    
    7. 发送数据send()

    send()同样可以发送数据,与write()不同的是,send()只能用于socket数据的发送。

    #include <sys/socket.h>
    
    int send(int socket, const void *buff, int len, int flags)
    

    参数中,buff指向要发送的数据,len为要发送数据的长度, flags一般为0。

    成功时send返回发送的字节数,失败返回-1。

    8. 接收数据recv()

    与send()相同,recv()也只能用于socket的数据发送。

    #include <sys/socket.h>
    
    int recv(int socket, void *buf, int len, unsigned int flags)
    

    buf指向存放接收数据的缓冲区,len为数据长度,flags一般为0。

    成功时recv()返回接收的字节数,失败时返回-1。

    9. 发送数据sendto()

    sendto需要带上发送目的地的地址信息,可以用于UDP通讯的实现,TCP中也可以使用sendto()。

    #include <sys/socket.h>
    
    int sendto(int socket, const void *buff, int len, unsigned int flags, const struct sockaddr *addr_to, int addr_len)
    

    buff指向要发送的数据,len为要发送的数据的长度,flags一般为0,addr_to携带发送目的IP的信息,addr_len是地址信息的长度。

    成功时,sendto返回发送的字节数,失败返回-1。

    10.接收数据recvfrom()

    recvfrom()与sendto配套使用,实现数据的收发。

    #include <sys/socket.h>
    
    int recvfrom(int socket, const void *buff, int len, unsigned int flags, const struct sockaddr *addr_from, int addr_len)
    

    buff指向接收数据的缓冲区,len为数据长度,flags一般为0, addr_from存放数据来源的IP地址,addr_len为地址信息的长度。

    recvfrom成功时返回接收的字节数,失败返回-1。

    四、 阻塞

    connect(),recv()都是阻塞性函数,当需求的资源没有准备好的时候,调用函数的进程将进入休眠状态,这样就无法处理I/O多路复用的情况了。

    解决这个问题的方法与普通的文件操作相同:使用fcntl()或者select()函数。相比较fcntl(),select()函数还可以设置等待时间,功能更为强大。

    ----<end>----

  • 相关阅读:
    webservice4
    webservice2
    webservice3
    webservice
    java 堆栈分析4
    java 堆栈分析3
    java 堆栈分析2
    java 堆栈分析
    数据库的Timeout
    node.js小结 2
  • 原文地址:https://www.cnblogs.com/jasonwang/p/socket_1.html
Copyright © 2020-2023  润新知