• 学习笔记-音频编解码


         

         研究音频编码之前,先了解一下音频的几种常用的格式以及他们的优缺点:

    1、PCM格式

    PCM 是通过话筒录音后直接得到的未经压缩的二进制数据流,该文件没有附加的文件头和文件结束标识。

    数据大小 = 采样频率*采样位数*声道数*时间/8(byte);

    采样频率(声音在”模-数“转换的过程中单位时间内采样的次数)一般是22k或者44k,

    采样位数是8位/16位,每个采样数据记录的是振幅,采样精度取决于存储空间的大小;

    8bit 只能记录256个数,也就是只能将振幅划分为256个等级;

    16bit能够记录65536个数,这已经是CD标准了;

    声道数一般分为单声道和双声道;单声道声音文件是采样数据为8位的短整型(short int 00H-FFH);双声道立体声音文件,每次采样数据为16位的整数,高八位(左声道)和低八位(右声道)两个声道;

    人对声音的识别频率是20HZ-20000HZ,如果每秒采样20000次,还原的声音能够满足人耳的需求,所以22050的采样是常用的,44100是CD音质,超过48000,对人耳也就没任何意义了,这和电影的每秒24帧的图片意思一样。

    2、WAV格式

    wav是封装格式,里面可以存放多种编码格式的数据,但是一般都是存放PCM格式的,由wav文件头部分和数据体部分组成;0-43字节存放的是采样率,通道数,以及数据体的标识符等头信息,44字节以后就是数据部分;很显然,如果头部的文件信息损坏了,那么播放就会出现问题。

    标准格式化的WAV文件采样频率是44100HZ,采样比特为16位,因此标准的WAV文件和CD音频格式一样,都是44.1KHZ的采样频率,16位量化数字,在声音文件质量和CD音频相差无几。

         WAV是录音时用的标准的windows文件格式,文件的扩展名为 “.wav”,WAVE文件作为最经典的Windows多媒体音频格式,应用非常广泛。声道有单声道和立体声之分,采样频率一般有11kHz、22kHz 和44kHz三种。WAVE文件所占容量=(采样频率×采样位数×声道)×时间/8(1字节=8bit)。  WAV文件与MIDI或MP3这类多媒体声音文件比较起来,所占的硬盘空间要大得多,但WAV文件的回放效果是最好的,WAV文件直接反映了一个声音在每个时刻的大小值,1分钟44khz采样率的WAV文件就会占用10M硬盘空间!

    3、MP3格式

        MP3是利用一种音频压缩技术也是一种音频格式,由于这种压缩方式的全称叫MPEG1 Layer-3。

    MP3文件是由TAG_V2(ID3V2)结构体、一组Frame,和TAG_V1(ID3V1)结构体组成。头部的TAG结构体不一定存在,需要进行判断;尾部的TAG结构体长度为128个字节,也需要进行判断;中间一组Frame长度可以定长也可以边长,每一帧Frame都是由帧头和数据实体组成,帧头记录了MP3的位率、采样率、和版本信息等,各帧之间相互独立,也就是说,如果前面的帧损坏了,后面的还是可以播放的;

          MPEG Audio Layer3,所以人们把它简称为MP3。因为人耳只能听到一定频段内的声音,而其他更高或更低频率的声音对人耳是没有用处的,所以MP3技术就把这部分 声音去掉了,从而使得文件体积大为缩小,但在人耳听起来却并没有什么失真。  MP3可以将声音用1∶10甚至1∶12的压缩率进行压缩,举个例子一般来说一张光碟容量为650M,作为CD它能容纳的不过是60到90分钟的音乐(15 首左右的歌曲), 一首5分钟的歌曲要占用50M左右的空间,而一首5分钟的MP3歌曲体积只有4~5M,一张光碟能放上一百多收首MP3歌曲。MP3的体积小,音质却非常接近CD,是一种很不错的音乐文件格式。

    4、AMR格式

          AMR文件包含一个文件头,后面就是一帧一帧的AMR帧。AMR文件的文件头是固定值,表明该文件是AMR文件。每个帧分为帧头和数据部分,帧头里面弄存放的是编码方式和辅助信息,采样率因为编码方式的不同而不同,因此不会像MP3那样每个帧里面还要写上采样率。

          AMR铃声格式也是彩信通用文件格式之一,既可以用来制作音乐文件,还常常被采用AMR文件来制作一些音效类的作品,像搞笑的人声啊、动物的声音啊等等,在彰显个性上,AMR有不可替代的优势。由于AMR文件的容量很小,每秒钟的AMR音频大小可控制在1K左右,因此即便是长达1分钟的音频文件,所以AMR还被广泛应用为手机的录音文件格式。

    5、AAC格式

    AAC格式,没有头文件,全部由帧序列组成,帧由帧头和数据实体组成,帧头里面存放的是采样率,声道数,以及帧长度等等,有点类似MP3格式。

    AAC适用于比特率在8Kbps单声道的电话音质到160Kbps多声道的超高质量音频 范围内的编码,并且允许对多媒体进行编码、解码。AAC增加了诸如对立体声的完美再现、比特流效果音扫描、多媒体控制、降噪优异等MP3没有的特性,使得 在音频压缩后仍能完美地再现CD音质。

    6、WMA格式

          WMA的全称是Windows Media Audio,它是微软公司推出的与MP3格式齐名的一种新的音频格式。由于WMA在压缩比和音质方面都超过了MP3,更是远胜于RA(Real Audio),即使在较低的采样频率下也能产生较好的音质,再加上WMA有微软的Windows Media Player做其强大的后盾,所以一经 推出就赢得一片喝彩。  和MP3相比,WMA只能算是“平民中的精英”,虽然64kbps的WMA在波形还原以后的确要好于128kbps的MP3,原 因就是低流量的MP3在编码时候丢弃了太多的高频信息,但是在128kbps以上时WMA的音质和文件大小相比MP3而言就没什么优势了。由于它是微软所 研发的技术,目前只在采用Windows mobile操作系统的Smartphone手机上使用,范围比较有限。

    7、caf格式

    caf格式是苹果的一种封装的音频格式,与WAV差不多,里面存放的是LPCM、MP3等编码数据;

    8、铃声格式MIDI和MMF

          MIDI几乎是目前市场上被支持度最高的铃音文件格式,它的文件小,表现力好,几乎已经成为目前和弦手机的铃声标准配置。和弦铃声的文件格式便是MIDI,不同的机型支持的和弦数会有所不同,所以下载的时候一定要主要去选择合适自己的机型文件。MMF:  MMF是由雅马哈开发出来的多媒体数据形式的SMAF格式的文件,是一种特定的铃声格式。和MIDI铃音一样,MMF也是分各种和弦数的。因为采取的铃声芯片的关系,MMF和弦铃声音色饱满,表现力比同样和弦数的MIDI铃音更好,MMF铃声音量大,而且MMF格式铃声可以逼真的表现人声、鸟鸣等模拟音效,这是MIDI所不能的;另外,MMF音乐文件较小,大约是同曲MIDI的2/3,用GPRS下载时更省钱。

          但是,因为MMF并不是目前中国移动规定的通用彩信文件格式,所以用户在一般的彩信网站上往往下载不到这一格式的铃声,只在少数专门的网站才有提供下载。目前市场上日韩系的手机对这一格式的铃声支持比较好,一些采用韩系手机机芯制造的国产品牌手机也继承了这个特点。

    9、ADPCM格式

          ADPCM(ADP):ADPCM又可称为ADP,这种格式常用在MP3机和手机的录音方面,它其实也是一种编码格式,优势是文件体积更小。然而,如果你对人声铃声的音质要求较高,那么ADP的表现肯定会让你失望,由于只是一种以录音为主要职能的音频格式,ADP处理一些简单的人声还可以,可面对层次复杂的音乐或歌曲,其音质只能用惨不忍睹来形容。目前市面上有很多飞利浦手机均支持ADP铃声,如535和9@9c等。在制作ADP铃声时,为了获得相对最佳的音质,应该用WAV音频文件来作为转换所需的源文件。

    10、iMY格式

          IMY是2000年由爱立信提出的一种音频文件格式,并于2001年6月得到3GPP认可成为标准,IMY具有占有空间小、容易编辑等特点,是被专门设计用于EMS中的铃声文件格式。IMY是中国移动规定的通用彩信文件格式之一,但是支持这一文件格式播放和铃声的手机并不多,支持EMS的爱立信以及现在的索尼爱立信手机型号多支持i-Melody铃声格式。

  • 相关阅读:
    字典和列表 相互嵌套
    HashSet
    SQLServer在分页获取数据的同时获取到总记录数
    C# list 多条件排序
    DictionaryBase
    .Net页面数据校验类(WebForm)
    链接
    解决:Server's certificate is not trusted
    win10下gradle6.2版本下载安装配置
    解决:mysql5.7乱码中文
  • 原文地址:https://www.cnblogs.com/luningning0901/p/4883114.html
Copyright © 2020-2023  润新知