这些小活动你都参加了吗?快来围观一下吧!>>
电子产品世界 » 论坛首页 » 嵌入式开发 » STM32 » RTSP学习之H264的RTP封装

共2条 1/1 1 跳转至

RTSP学习之H264的RTP封装

高工
2018-07-13 07:45:21     打赏

一. H264基础概念

1.1、NAL、Slice与frame简介及相互关联

NAL指网络提取层,里面放一些与网络相关的信息。

Slice是片的意思,264中把图像分成一帧(frame)或两场(field),而帧又可以分成一个或几个片(Slilce);片由宏块(MB)组成。宏块是编码处理的基本单元。

一个frame是可以分割成多个Slice来编码的,而一个Slice在编码之后被打包进一个NAL单元。每个slice中的数据,在帧内预测只用到自己slice的数据, 与其他slice 数据没有依赖关系。NAL 是用来将编码的数据进行打包的,每一个slice 数据可以放在NAL 包中。不过NAL单元除了容纳Slice编码的码流外,还可以容纳其他数据,比如序列参数集SPS。 

I frame 是自己独立编码,不依赖于其他frame 数据。

P frame 依赖 I frame 数据。 

B frame 依赖 I frame, P frame 或其他 B frame 数据。   

1.2、NAL nal_unit_type

NALnal_unit_type中有1(非IDR图像的编码条带)、2(编码条带数据分割块A)、3(编码条带数据分割块B)、4(编码条带数据分割块C)、5(IDR图像的编码条带)五种类型 

Slice有三种编码模式:I_slice、P_slice、B_slice 

NALnal_unit_type 里的五种类型,代表接下来数据是表示啥信息的和具体如何分块。I_slice、P_slice、B_slice 表示I类型的片、P类型的片,B类型的片。其中I_slice为帧内预测模式编码;P_slice为单向预测编码或帧内模式;B_slice 中为双向预测或帧内模式。 

1.3、frame的3种类型:I frame、P frame、 B frame之间的映射关系:

I frame、P frame、 B frame关系同 I_slice、P_slice、B_slice,slice和frame区别在1.1已说明。 

1.4、NAL nal_unit_type参数集

NALnal_unit_type中的帧分为:序列参数集(SPS)、图像参数集(PPS)、增强信息(SEI)不属于帧的概念,表示后面的数据信息为序列参数集(SPS)、图像参数集(PPS)、增强信息(SEI)。  

二、H.264 视频RTP 负载格式

2.1、 网络抽象层单元类型 (NALU)

NALU 头由一个字节组成, 它的格式如下:

说明

F: 1 bit。forbidden_zero_bit。在 H.264 规范中规定了这一位必须为 0,设置为1指示语法违例。

NRI: 2 bit。nal_ref_idc,取 00 ~ 11,指示这个 NALU 的重要性,指示NAL单元的不用于帧间图像预测的重构参考图像。这样的NAL单元可以被丢弃而不用冒参考图像完整性的风险。大于0的值指示NAL单元的解码要求维护参考图像的完整性。不过一般情况下不太关心这个属性。

Type: 5 bit。  nal_unit_type。这个 NALU 单元的类型,简述如下:

  0     没有定义

  1-23  NAL单元  单个 NAL 单元包.

  24    STAP-A   单一时间的组合包

  25    STAP-B   单一时间的组合包

  26    MTAP16   多个时间的组合包

  27    MTAP24   多个时间的组合包

  28    FU-A     分片的单元

  29    FU-B     分片的单元

  30-31 没有定义

2.2、 RTP封装格式

  下面是 RFC 3550 中规定的 RTP 头的结构:



RTP头信息设置说明:

Markerbit (M): 1 bit  RTP负载为NAL单元的最后一个包时,设置该位。解码器可以使用该位作为最后一个包的指示,但是不可以依赖本属性。

注:运送多个NAL单元的聚合包只有一个M位相关联。

Payload type (PT): 7 bits NAL单元荷载类型,表示当前荷载为上文中NAL nal_unit_type所包含的哪一种参数集类型。

Sequencenumber (SN): 16 bits根据RFC 3550设置使用,对于单个NALU与非交错打包方式,序号用于对定NALU解码顺序。

Timestamp:32 bits  RTP时戳设置为内容的采样时戳。必须使用90 kHz时钟频率。

如果NAL单元没有他自己的时间属性(即,parameter set and SEI NAL units)RTP时戳设置成访问单元主编码图像的RTP时戳。

接收者应该忽略包含在访问单元(只有一个显示时戳)的任何图像时间SEI消息,相反,接收者应该使用RTP时戳同步显示过程。

 

H.264 Payload 格式定义了三种不同的基本的负载(Payload)结构,接收端可能通过 RTP Payload 的第一个字节来识别它们,这一个字节类似 NALU 头的格式,而这个头结构的 NAL 单元类型字段则指出了代表的是哪一种结构,这个字节的结构如下:

 可以看出它和 H.264 的 NALU 头结构是一样的。

字段 Type: 这个 RTP payload 中 NAL 单元的类型,这个字段和 H.264 中类型字段的区别是,当 type的值为 24 ~ 31 表示这是一个特别格式的 NAL 单元,而 H.264 中,只取 1~23 是有效的值。

  24    STAP-A   单一时间的组合包

  25    STAP-B   单一时间的组合包

  26    MTAP16   多个时间的组合包

  27    MTAP24   多个时间的组合包

  28    FU-A     分片的单元

  29    FU-B     分片的单元

  30-31 没有定义

  可能的结构类型分别有:

  (1). 单一 NAL 单元模式

      即一个 RTP 包仅由一个完整的 NALU 组成。这种情况下 RTP NAL 头类型字段和原始的 H.264的NALU 头类型字段是一样的。

  (2). 组合封包模式

     即可能是由多个 NAL 单元组成一个 RTP 包。分别有4种组合方式:STAP-A、STAP-B、MTAP16、MTAP24,那么这里的类型值分别是 24、25、26以及27。

  (3). 分片封包模式

     用于把一个 NALU 单元封装成多个 RTP 包。存在两种类型 FU-A 和 FU-B,类型值分别是 28 和 29。 

2.3、单一 NAL 单元模式

  对于 NALU 的长度小于 MTU 大小的包,一般采用单一 NAL 单元模式:


  对于一个原始的 H.264 NALU 单元常由 [Start Code] [NALU Header] [NALU Payload] 三部分组成,其中 Start Code 用于标示这是一个NALU 单元的开始,必须是 "00 00 00 01" 或 "00 00 01",NALU 头仅一个字节,其后都是 NALU 单元内容。打包时去除"00 00 01" 或 "00 00 00 01" 的开始码,把其他数据封包的 RTP 包即可。

  如有一个 H.264 的 NALU 是这样的:

  [00 00 00 01 67 42 A0 1E 23 56 0E 2F ... ]

  这是一个序列参数集 NAL 单元. [00 00 00 01] 是四个字节的开始码,67 是 NALU 头,42 开始的数据是 NALU 内容。

  封装成 RTP 包将如下:

  [ RTP Header ] [ 67 42 A0 1E 23 560E 2F ]

  即只要去掉 4 个字节的开始码就可以了。 

2.4、 组合封包模式

  其次,当 NALU 的长度特别小时,可以把几个NALU 单元封在一个 RTP 包中:


2.5、 Fragmentation Units (FUs).

  而当 NALU 的长度超过 MTU 时,就必须对 NALU 单元进行分片封包。也称为 Fragmentation Units(FUs),常用的如下表所示的FU-A分片模式


FU-A由1字节的分片指示单元,1字节的分片单元头,和分片单元荷载组成。

分片指示单元格式如下表:


类型域Type值为28(FU-A)或29(FU-B)。 NRI域的值必须根据分片NAL单元的NRI域的值设置。

FU的头格式如下表:

S: 1 bit。当设置成1,开始位指示分片NAL单元的开始。当跟随的FU荷载不是分片NAL单元荷载的开始,开始位设为0。

E: 1 bit。 当设置成1,结束位指示分片NAL单元的结束,即荷载的最后字节也是分片NAL单元的最后一个字节。当跟随的FU荷载不是分片NAL单元的最后分片,结束位设置为0。

R: 1 bit。保留位必须设置为0,接收者必须忽略该位。

Type: 5 bits。NAL单元荷载类型,表示当前荷载为上文中NAL nal_unit_type所包含的哪一种参数集类型。 

三. H264常用的SDP参数说明

  下面描述了如何在 SDP 中表示一个 H.264 流:

  . "m=" 行中的媒体名必须是 "video"

  . "a=rtpmap" 行中的编码名称必须是 "H264".

  . "a=rtpmap" 行中的时钟频率必须是 90000.

  . 其他参数都包括在 "a=fmtp" 行中.

  如:

  m=video 49170 RTP/AVP 98

  a=rtpmap:98 H264/90000

  a=fmtp:98 profile-level-id=42A01E;sprop-parameter-sets=Z0IACpZTBYmI,aMljiA==

  下面介绍一些常用的参数.

3.1、 packetization-mode:

  表示支持的封包模式. 

  当 packetization-mode 的值为 0 时或不存在时, 必须使用单一 NALU 单元模式.

  当 packetization-mode 的值为 1 时必须使用非交错(non-interleaved)封包模式.

  当 packetization-mode 的值为 2 时必须使用交错(interleaved)封包模式.

  这个参数不可以取其他的值.

 3.2、 sprop-parameter-sets:

 这个参数可以用于传输 H.264 的序列参数集和图像参数 NAL 单元。这个参数的值采用Base64 进行编码。不同的参数集间用","号隔开。

3.3、 profile-level-id:

  这个参数用于指示 H.264 流的 profile 类型和级别,由 Base16(十六进制) 表示的 3 个字节,第一个字节表示 H.264 的 Profile 类型,第三个字节表示 H.264 的 Profile 级别。 

3.4、 max-mbps:

  这个参数的值是一个整型, 指出了每一秒最大的宏块处理速度. 




管理员
2018-07-13 08:09:50     打赏
2楼

谢谢楼主分享


共2条 1/1 1 跳转至

回复

匿名不能发帖!请先 [ 登陆 注册 ]