AAC头部格式

摘要:
2是AAC-LC,5是SBR,29是PS。title=MPEG-4_如果音频是HE-AAC,则有两种显式和隐式声明模式。您可以参考flv格式的官方说明文件http://download.macromedia.com/f4v/video_file_format_spec_v10_1.pdf3AAC的LATMoverRTP封装格式在RFC3016中定义。每个RTP包的有效载荷在前面是PayloadLengthInfo。每个0xFF表示帧长度+255,剩余长度不是0xFF;然后是PayloadMux,AAC的原始流4。AAC的另一种RTP打包格式是mpeg4通用格式,在RFC3640中定义。接下来的两个字节,高13位是AAC帧的长度,低3位是0。
一共有2种AAC头格式,一种是StreamMuxConfig,另一种是AudioSpecificConfig

1、AudioSpecificConfig
读写header的代码参考
    ffmpeg libavcodecaacenc.c put_audio_specific_config()
    ffmpeg libavcodecmpeg4audio.c avpriv_mpeg4audio_get_config()
    fdk-aac libMpegTPEncsrc penc_asc.cpp transportEnc_writeASC()
    libaacplus aacplusenc.c aacplusEncGetDecoderSpecificInfo()
 
ISO文档 14496-3
    1.6.2.1 "Syntax - AudioSpecificConfig"
http://www.nhzjj.com/asp/admin/editor/newsfile/2010318163752818.pdf
 
该Header的主要成员
  audioObjectType: 基本的object type用5个比特表示。2是AAC-LC,5是SBR,29是PS。
  samplingFrequencyIndex: 4个比特,用来表示采样率表中的索引号
  channelConfiguration: 4个比特,声道数
  if (audioObjectType == 5 || audioObjectType == 29)
    extensionSamplingFrequencyIndex: 4个比特,表明实际的音频采样率
    audioObjectType:  5个比特,表明基本层编码的AOT
  GASpecificConfig
    frameLengthFlag: 1个比特,0表示帧长为1024,1表示帧长为960
    DependsOnCoreCoder: 1个比特
    extensionFlag: 1个比特
 
剩余的扩展字段 
  syncExtensionType:  11个比特,0x2b7表示HE-AAC的扩展
  if (syncExtensionType == 0x2b7) {
    extensionAudioObjectType: 5个比特
    if ( extensionAudioObjectType == 5 ) {
      sbrPresentFlag: 1个比特
      if (sbrPresentFlag == 1) {
        extensionSamplingFrequencyIndex: 4个比特
      }
    }
  }
 
object type、sample rate详细表格可以参考
http://wiki.multimedia.cx/index.php?title=MPEG-4_Audio
 
如果是HE-AAC,有两种explicit和implicit一共三种声明模式。在explicit模式一(hierarchical signaling),AOT是5,然后在channels之后会有扩展的采样率和AOT字段(这里的AOT用于表明基本层编码,一般是2 AAC-LC),fdk_aac采用的这种方式;在explicit模式二(backward compatible signaling),AOT仍然是2(AAC-LC),但在GASpecificConfig后会有同步字0x2b7和sbrPresentFlag,libaacplus采用的是这种方式;在implicit模式,AOT仍然是2(AAC-LC),AudioSpecificConfig没有任何扩展,仍只是2个字节,需要靠解码器在AAC码流中找到SBR的数据
参考论文《A closer look into MPEG-4 High Efficiency AAC》
http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.129.4563&rep=rep1&type=pdf
http://developer.apple.com/library/ios/#technotes/tn2236/_index.html
 
 
2、StreamMuxConfig
写header的代码参考
    ffmpeg libavformatlatmenc.c latm_write_frame_heade()
    ffmpeg libavcodecaacdec.c read_stream_mux_config()
    fdk-aac libMpegTPEncsrc penc_latm.cpp CreateStreamMuxConfig()
 
ISO文档 14496-3
    1.7.3 Multiplex Layer
 
 
其他相关的
1、TS流可以使用ADTS和LATM两种封装格式。在ffmpeg的mpegtsenc中,用了一个amux的AVFormatContext,先把非ADTS的raw aac流写成ADTS或者LATM格式,然后再写入TS流
2、FLV/RTMP有两种AAC AUDIO DATA,0是AudioSpecificConfig,1是raw的AAC流。可以参考flv格式的官方说明文档
http://download.macromedia.com/f4v/video_file_format_spec_v10_1.pdf
3、AAC的LATM over RTP打包格式定义在RFC 3016。SDP中几个参数含义:object,就是AAC的AOT;cpresent=0,表示StreamMuxConfig不出现在码流中;config,就是StreamMuxConfig用base16进行编码。每个RTP包的载荷,最前面是PayloadLengthInfo,每出现一个0xFF表示帧长度+255,直至非0xFF就是剩余的长度;然后就是PayloadMux即AAC的裸流

4、AAC的另外一种RTP打包格式是mpeg4-generic,定义在RFC 3640。SDP中几个参数含义:config,就是AudioSpecificConfig的十六进制表示;sizeLength=13; indexLength=3,这是每个rtp包头都是固定的。每个RTP包的载荷,最前面2个字节一般是0x00 10,这是 AU-headers-length,表示AU header的长度是16个比特也就是2个字节。后面2个字节,高13位是AAC帧的长度,低3位为0。

免责声明:文章转载自《AAC头部格式》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇AES加解密代码vue-cli按需引入antd样式文件报错问题下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

AAC帧格式及编码介绍

参考资料: AAC以adts格式封装的分析:http://wenku.baidu.com/view/45c755fd910ef12d2af9e74c.html aac编码介绍:http://wenku.baidu.com/view/0de48034f111f18583d05a65.html AAC音频压缩编码标准的ADTS与LATM的格式分析:http:/...

iphone利用AudioQueue播放音频文件(mp3,aac,caf,wav等)

最近在做iphone上的流媒体播放,需要用到播放音频流,参考了好多博客、网站,最终算是把这个比较难弄的问题解决了。这篇文章是播放音频文件的,我会专门用一篇文章来介绍如何用AudioQueue来播放raw pcm data,相信这是大多数ios开发同胞需要的吧。在此分享出来,希望能帮助到真正需要的人,毕竟一个人的力量是有限的,还是要共同学习、共同进步。1.p...

音频编码器

16 音频编码器 介绍当前可用的音频编码器 aac AAC(Advanced Audio Coding )编码器 当前原生(内置)编码器还处于实验阶段,而且只能支持AAC-LC(低复杂度AAC)。要使用这个编码器,必须选择 ‘experimental’或者'lower' 因为当前还处于实验期,所以很多意外可能发生。如果需要一个更稳定的AAC编码器,参考li...

AAC的各种规格

Hi,又来写点儿小记录心得吧,这次是在准备AAC音频解码的规格中发现和总结出的一些问题,大概的情况在这里简要做一小记,为我们最后确立规格提供参考,当然我对AAC规格的了解还很稚嫩,有些表述不太确切的地方,还请大家指正: 一、规格(profile)问题: wiki上说到,AAC共有9种规格,以适应不同的场合的需要: l         MPEG-2 AAC...

AAC的ADTS头文件信息介绍

遵循:BY-SA 署名-相同方式共享 4.0协议   作者:谭东 时间:2016年10月28日 环境:Windows 7   ADTS是Audio Data Transport Stream的简称。   是AAC音频文件常见的传输格式。 有的时候当你编码AAC裸流的时候,会遇到写出来的AAC文件并不能在PC和手机上播放,很大的可能就是AAC文件的每一帧里...

计算音频帧的播放时间(音频码流 音频帧)

音频码流(冗余数据占的比例):先简单讲一下对于ADTS header的结构的理解: 1)ADTS header位于每一个aac帧的开头,长度一般是7字节(也可以是9字节的,没见过)。 2)每个aac帧的长度固定为1024个sample(可以是1024*n,没见过n>1的情况)。 3)ADTS header中大部分信息无用,有用的只有采样率(4bit)...