• UDP TCP 消息边界


    先明确一个问题,如果定义了一个数据结构,大小是,比方说 32 个字节,然后 UDP 客户端连续向服务端发了两个包。现在假设这两个包都已经到达了服务器,那么服务端调用 recvfrom 来接收数据,并且缓冲区开得远大于 64,例如,开了 1024 个字节,那么,服务端的 recvfrom 函数是会一次收到两个数据包呢,还是只能收到一个。

    答案是只能收到一个。

    来看代码:

    struct.h

    复制代码
    #ifndef STRUCT_H
    #define STRUCT_H
     
    typedef struct _UDP_MSG {
        int add1;
        int add2;
        int sum;
        char str1[16];
        char str2[16];
        char cat[32];
    } UDP_MSG;
     
    #endif /* STRUCT_H */
    复制代码
     

    服务器的代码:

    复制代码
    #include <sys/types.h>
    #include <sys/socket.h>
    #include <string.h>
    #include <unistd.h>
    #include <netinet/in.h>
    #include <stdio.h>
    #include <stdlib.h>
     
    #include "struct.h"
     
    #define MAX_LINE 1024
    #define SERV_PORT 8080
     
    int udp_serv();
     
    int main() {
        return udp_serv();
    }
     
    int udp_serv() {
        int sockfd = socket(AF_INET, SOCK_DGRAM, 0);
        if (sockfd == -1) {
            perror("socket");
            return -1;
        }
         
        struct sockaddr_in serv_addr;
        memset(&serv_addr, 0, sizeof(serv_addr));
        serv_addr.sin_family = AF_INET;
        serv_addr.sin_addr.s_addr = htonl(INADDR_ANY);
        serv_addr.sin_port = htons(SERV_PORT);
     
        if (bind(sockfd, (struct sockaddr*)&serv_addr, sizeof(serv_addr)) == -1) {
            perror("bind");
            return -1;
        }
     
        while (1) {
            printf("sleeping
    ");
            sleep(10);
            printf("akwaked
    ");
            char buf[BUFSIZ];
            struct sockaddr_in cli_addr;
            memset(&cli_addr, 0, sizeof(cli_addr));
            socklen_t cli_addr_len = sizeof(cli_addr);
            int recvn = recvfrom(sockfd, buf, sizeof(buf), 0, (struct sockaddr*)&cli_addr, &cli_addr_len);
            printf("recv %d bytes
    ", recvn);
            UDP_MSG msg;
            memset(&msg, 0, sizeof(msg));
            printf("UDP_MSG size is %d
    ", sizeof(msg));
            memcpy(&msg, buf, sizeof(msg));
            msg.sum = msg.add1 + msg.add2;
            strcpy(msg.cat, msg.str1);
            strcat(msg.cat, msg.str2);
            printf("msg.add1 is: %d
    ", msg.add1);
            printf("msg.add2 is: %d
    ", msg.add2);
            printf("msg.sum is: %d
    ", msg.sum);
            printf("msg.str1 is: %s
    ", msg.str1);
            printf("msg.str2 is: %s
    ", msg.str2);
            printf("msg.cat is: %s
    ", msg.cat);
            sendto(sockfd, &msg, sizeof(msg), 0, (struct sockaddr*)&cli_addr, cli_addr_len);
        }
     
        return 0;
    }
    复制代码
     

    客户端的:

    复制代码
    #include <sys/types.h>
    #include <sys/socket.h>
    #include <string.h>
    #include <netinet/in.h>
    #include <stdio.h>
    #include <stdlib.h>
    #include <arpa/inet.h>
    #include <unistd.h>
     
    #include "struct.h"
     
    #define MAX_LINE 1024
    #define SERV_PORT 8080
     
    int udp_cli(const char* serv_ip);
     
    int main(int argc, char* argv[]) {
        if (argc < 2) {
            printf("Usage: %s serv_ip
    ", argv[0]);
            return 1;
        }
        return udp_cli(argv[1]);
    }
     
    int udp_cli(const char* serv_ip) {
        int sockfd = socket(AF_INET, SOCK_DGRAM, 0);
        if (sockfd == -1) {
            perror("socket");
            return -1;
        }
        struct sockaddr_in serv_addr;
        memset(&serv_addr, 0, sizeof(serv_addr));
        serv_addr.sin_family = AF_INET;
        serv_addr.sin_port = htons(SERV_PORT);
        if (inet_pton(AF_INET, serv_ip, &serv_addr.sin_addr) <= 0) {
            perror("inet_pton");
            return -1;
        }
        while (1) {
            UDP_MSG msg;
            memset(&msg, 0, sizeof(msg));
            msg.add1 = 1;
            msg.add2 = 2;
            scanf("%s%s", msg.str1, msg.str2);
            if (sendto(sockfd, &msg, sizeof(msg), 0,
                (struct sockaddr*)&serv_addr, sizeof(serv_addr)) == -1) {
                perror("write");
                return -1;
            } else {
                printf("send success
    ");
            }
            if (sendto(sockfd, &msg, sizeof(msg), 0,
                (struct sockaddr*)&serv_addr, sizeof(serv_addr)) == -1) {
                perror("write2");
                return -1;
            } else {
                printf("send2 success
    ");
            }
            socklen_t serv_addr_len = sizeof(serv_addr);
            if (recvfrom(sockfd, &msg, sizeof(msg), 0,
                (struct sockaddr*)&serv_addr, &serv_addr_len) == -1) {
                perror("read");
                return -1;
            }
            printf("msg.add1 is: %d
    ", msg.add1);
            printf("msg.add2 is: %d
    ", msg.add2);
            printf("msg.sum is: %d
    ", msg.sum);
            printf("msg.str1 is: %s
    ", msg.str1);
            printf("msg.str2 is: %s
    ", msg.str2);
            printf("msg.cat is: %s
    ", msg.cat);
            break;
        }
        return 0;
    }
    复制代码
     

    运行起来后,服务端的输出如下:

    复制代码
    sleeping
    akwaked
    recv 76 bytes
    UDP_MSG size is 76
    msg.add1 is: 1
    msg.add2 is: 2
    msg.sum is: 3
    msg.str1 is: 123
    msg.str2 is: 456
    msg.cat is: 123456
    sleeping
    akwaked
    recv 76 bytes
    UDP_MSG size is 76
    msg.add1 is: 1
    msg.add2 is: 2
    msg.sum is: 3
    msg.str1 is: 123
    msg.str2 is: 456
    msg.cat is: 123456
    sleeping
    复制代码
     

    客户端如下:

    复制代码
    123
    456
    send success
    send2 success
    msg.add1 is: 1
    msg.add2 is: 2
    msg.sum is: 3
    msg.str1 is: 123
    msg.str2 is: 456
    msg.cat is: 123456
    复制代码
     

    这里涉及到一个边界的问题。 TCP 是流式的数据传输,消息没有边界,需要应用层自己去定义消息边界,而 UDP 是数据报传输,所以协议保证了一次只能接收一个数据报。

    详细的解释看到这里,http://hi.baidu.com/chongerfeia/item/c38f91e075d742226dabb8a4

    2010-08-11 14:56 有关TCP和UDP 粘包 消息保护边界在socket网络程序中,TCP和UDP分别是面向连接和非面向连接的。因此TCP的socket编程,收发两端(客户端和服务器端)都要有一一成对的socket,因此,发送端为了将多个发往接收端的包,更有效的发到对方,使用了优化方法(Nagle算法),将多次间隔较小且数据量小的数据,合并成一个大的数据块,然后进行封包。这样,接收端,就难于分辨出来了,必须提供科学的拆包机制。
    对于UDP,不会使用块的合并优化算法,这样,实际上目前认为,是由于UDP支持的是一对多的模式,所以接收端的skbuff(套接字缓冲区)采用了链式结构来记录每一个到达的UDP包,在每个UDP包中就有了消息头(消息来源地址,端口等信息),这样,对于接收端来说,就容易进行区分处理了

    保护消息边界和流
    那么什么是保护消息边界和流呢?

    保护消息边界,就是指传输协议把数据当作一条独立的消息在网上
    传输,接收端只能接收独立的消息.也就是说存在保护消息边界,接收
    端一次只能接收发送端发出的一个数据包.
    而面向流则是指无保护消息保护边界的,如果发送端连续发送数据,
    接收端有可能在一次接收动作中,会接收两个或者更多的数据包.

    我们举个例子来说,例如,我们连续发送三个数据包,大小分别是2k,
    4k , 8k,这三个数据包,都已经到达了接收端的网络堆栈中,如果使
    用UDP协议,不管我们使用多大的接收缓冲区去接收数据,我们必须有
    三次接收动作,才能够把所有的数据包接收完.而使用TCP协议,我们
    只要把接收的缓冲区大小设置在14k以上,我们就能够一次把所有的
    数据包接收下来.只需要有一次接收动作.

    这就是因为UDP协议的保护消息边界使得每一个消息都是独立的.而
    流传输,却把数据当作一串数据流,他不认为数据是一个一个的消息.

    所以有很多人在使用tcp协议通讯的时候,并不清楚tcp是基于流的
    传输,当连续发送数据的时候,他们时常会认识tcp会丢包.其实不然,
    因为当他们使用的缓冲区足够大时,他们有可能会一次接收到两个甚
    至更多的数据包,而很多人往往会忽视这一点,只解析检查了第一个
    数据包,而已经接收的其他数据包却被忽略了.所以大家如果要作这
    类的网络编程的时候,必须要注意这一点.

    结论:
    根据以上所说,可以这样理解,TCP为了保证可靠传输,尽量减少额外
    开销(每次发包都要验证),因此采用了流式传输,面向流的传输,
    相对于面向消息的传输,可以减少发送包的数量。从而减少了额外开
    销。但是,对于数据传输频繁的程序来讲,使用TCP可能会容易粘包。
    当然,对接收端的程序来讲,如果机器负荷很重,也会在接收缓冲里
    粘包。这样,就需要接收端额外拆包,增加了工作量。因此,这个特
    别适合的是数据要求可靠传输,但是不需要太频繁传输的场合(
    两次操作间隔100ms,具体是由TCP等待发送间隔决定的,取决于内核
    中的socket的写法)

    而UDP,由于面向的是消息传输,它把所有接收到的消息都挂接到缓冲
    区的接受队列中,因此,它对于数据的提取分离就更加方便,但是,
    它没有粘包机制,因此,当发送数据量较小的时候,就会发生数据包
    有效载荷较小的情况,也会增加多次发送的系统发送开销(系统调用,
    写硬件等)和接收开销。因此,应该最好设置一个比较合适的数据包
    的包长,来进行UDP数据的发送。(UDP最大载荷为1472,因此最好能
    每次传输接近这个数的数据量,这特别适合于视频,音频等大块数据
    的发送,同时,通过减少握手来保证流媒体的实时性)

  • 相关阅读:
    阿里云安全
    阿里云存储
    阿里云网络和CDN
    一文搞懂用户登录验证流程(附图)
    mybatis注解之@Mapper和@MapperScan的使用
    百度一面:谈谈 @Transactional 的原理和坑
    IDEA断点调试技巧,多张动图包教包会
    一文弄懂责任链设计模式
    美团一面:@Transactional 原理和常见的坑?
    RocketMQ消息丢失场景及解决办法
  • 原文地址:https://www.cnblogs.com/weekbo/p/9754182.html
Copyright © 2020-2023  润新知