• RTP学习笔记


    一、定义

    实时传输协议(Real- time Transport Protocol,RTP)是在Internet上处理多媒体数据流的一种网络协议,利用它能够在一对一(unicast,单播)或者一对多 (multicast,多播)的网络环境中实现传流媒体数据的实时传输。

    RTP通常使用UDP来进行多媒体数据的传输,但如果需要的话可以使用TCP或者ATM等其它协议。

    二、协议格式

        0               1               2               3              4
        0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1
       +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
       |V=2|P|X|  CC   |M|     PT      |       sequence number         |
       +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
       |                           timestamp                           |
       +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
       |                synchronization source (SSRC)                  |   
    +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
    | contributing source (CSRC) |
    +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+

    三、字段解析

     1 V:RTP协议的版本号,占2位,当前协议版本号为2。
     2 
     3 P:填充标志,占1位,如果P=1,则在该报文的尾部填充一个或多个额外的八位组,它们不是有效载荷的一部分。
     4 
     5 X:扩展标志,占1位,如果X=1,则在RTP报头后跟有一个扩展报头。
     6 
     7 CC:CSRC计数器,占4位,指示CSRC 标识符的个数。
     8 
     9 M: 标记,占1位,不同的有效载荷有不同的含义,对于视频,标记一帧的结束;对于音频,标记会话的开始。
    10 
    11 PT: 有效载荷类型,占7位,用于说明RTP报文中有效载荷的类型,如GSM音频、H264视频等,在流媒体中大部分是用来区分音频流和视频流的,这样便于客户端进行解析。
    12 
    13 sequence number(序列号):占16位,用于标识发送者所发送的RTP报文的序列号,每发送一个报文,序列号增1。这个字段当下层的承载协议用UDP的时候,网络状况不好的时候可以用来检查丢包。同时出现网络抖动的情况可以用来对数据进行重新排序。
    14 
    15 timestamp(时间戳):占32位,时戳反映了该RTP报文的第一个八位组的采样时刻。接收者使用时戳来计算延迟和延迟抖动,并进行同步控制。
    16 
    17 SSRC(同步信源):占32位,用于标识同步信源。
    RTP包流的源,用RTP报头中32位数值的SSRC标识符进行标识,使其不依赖于网络地址。一个同步源的所有包构成了相同计时和序列号空间的一部分,这样接收方就可以把一个同步源的包放在一起,来进行重放。
    举些同步源的例子,像来自同一信号源的包流的发送方,如麦克风、摄影机、RTP混频器就是同步源。一个同步源可能随着时间变化而改变其数据格式,如音频编码。
    SSRC标识符是一个随机选取的值,它在特定的RTP会话中是全局唯一
    如果参与者在一个RTP会话中生成了多个流,例如来自多个摄影机,则每个摄影机都必须标识成单独的同步源。
    该标识符是随机选择的,参加同一视频会议的两个同步信源不能有相同的SSRC。
    19 CSRC(作用信源):占32位,可以包含0~15个作用信源信息。
    若一个RTP包流的源,对由RTP混频器生成的组合流起了作用,则它就是一个作用源。对特定包的生成起作用的源,其SSRC标识符组成的列表,被混频器插入到包的RTP报头中。这个列表叫做CSRC表。
    相关应用的例子如:在音频会议中,混频器向所有的说话人(talker)指出,谁的话语(speech)将被组合到即将发出的包中,即便所有的包都包含在同一个(混频器的)SSRC标识符中,也可让听者(接收者)可以清楚谁是当前说话人。 
    每个CSRC标识了包含在该RTP报文有效载荷中的所有作用信源。

    四、实例参考

    16进制码流实例

    1 80 00 1e e2 12 e9 c2 4d 0b a9 e9 05 ff ff ff ...

    连续的ffff开始往后是Payload负载,不做分析。

    1. 80 二进制 1000 0000

    可以得出 V=2,P=0,X=0,CC=0

    2. 00 二进制 0000 0000

    可以得出 M=1,PT=0(PCMU)

    3. 1e e2 二进制 00011110 11100010

    可以得出 sequence number=7906

    4. 12 e9 c2 4d 二进制 00010010 11101001 11000010 01001101

    可以得出 timestamp=317309517

    5. 0b a9 e9 05 

    可以得出SSRC=0x0ba9e905

  • 相关阅读:
    自定义打包工具对应的解析代码
    自定义的打包工具源码
    一种C语言实现面向对象特性的继承,多态
    buffers和cached的区别
    初识rt-thread杂记
    一种多叉树的实现,提供树形结构打印,树转表输出等功能
    关于rtsp的时间戳问题
    一种基于状态机(表)的小组件
    一种基于消息发布-订阅的观察者模式实现
    命令解析类代码重构
  • 原文地址:https://www.cnblogs.com/yoyotl/p/5650101.html
Copyright © 2020-2023  润新知