(三)格式分析
WAVE文件是由若干个Chunk组成的。按照在文件中的出现位置包括:RIFF WAVE Chunk, Format Chunk, Fact Chunk(可选), Data Chunk。
------------- RIFF WAVE Chunk--------------
| ID = 'RIFF' |
| RiffType = 'WAVE' |
--------------- Format Chunk ----------------
| ID = 'fmt ' |
---------- Fact Chunk(optional) ------------
| ID = 'fact' |
-------------- Data Chunk -----------------
| ID = 'data' |
每个Chunk有各自的ID,位于Chunk最开始位置,作为标示,而且均为4个字节;紧跟在ID后面的是Chunk大小(去除ID和Size所占的字节数后剩下的其他字节数目),4个字节表示,低字节表示数值低位,高字节表示数值高位。
1.RIFF WAVE Chunk
==================================
| ID | 4 Bytes | 'RIFF' |
----------------------------------
| Size | 4 Bytes | |
----------------------------------
| Type | 4 Bytes | 'WAVE' |
----------------------------------
struct RIFF_HEADER
{
char szRiffID[4]; // 'R','I','F','F'
DWORD dwRiffSize; // file size - 8(id length + size length)
char szRiffFormat[4]; // 'W','A','V','E'
}
2.Format Chunk
====================================================================
| ID | 4 Bytes | 'fmt ' |
--------------------------------------------------------------------------
| Size | 4 Bytes | 数值为16或18,18则最后又附加信息 |
--------------------------------------------------------------------------
| FormatTag | 2 Bytes | 编码方式,一般为0x0001(线性PCM编码) |
--------------------------------------------------------------------------
| Channels | 2 Bytes | 声道数目,1--单声道;2--双声道 |
--------------------------------------------------------------------------
| SamplesPerSec | 4 Bytes | 采样频率 |
--------------------------------------------------------------------------
| AvgBytesPerSec | 4 Bytes | 每秒所需字节数 |
--------------------------------------------------------------------------
| BlockAlign | 2 Bytes | 数据块对齐单位(每个采样需要的字节数) |
--------------------------------------------------------------------------
| BitsPerSample | 2 Bytes | 每个采样需要的bit数 |
--------------------------------------------------------------------------
| | 2 Bytes | 附加信息(可选,通过Size来判断有无) |
--------------------------------------------------------------------------
一般情况下Size为16,此时最后附加信息没有;如果为18 则最后多了2个字节的附加信息。
struct WAVE_FORMAT
{
WORD wFormatTag;
WORD wChannels;
DWORD dwSamplesPerSec;
DWORD dwAvgBytesPerSec;
WORD wBlockAlign;
WORD wBitsPerSample;
};
struct FMT_BLOCK
{
char szFmtID[4]; // 'f','m','t',' '
DWORD dwFmtSize;
WAVE_FORMAT wavFormat;
};
3.Fact Chunk
Fact Chunk是可选字段,一般当wav文件由某些软件转化而成,则包含该Chunk。
==================================
| ID | 4 Bytes | 'fact' |
----------------------------------
| Size | 4 Bytes | 4 |
----------------------------------
| Data | 4 Bytes | |
----------------------------------
struct FACT_BLOCK
{
char szFactID[4]; // 'f','a','c','t'
DWORD dwFactSize;
};
4.Data Chunk
Data Chunk是真正保存wav数据的地方,
==================================
| ID | 4 Bytes | 'data' |
----------------------------------
| Size | 4 Bytes | |
----------------------------------
| data | | |
----------------------------------
在多声道WAVE文件中,样本是交替出现的,如16bit的单声道WAVE文件和双声道WAVE文件的数据采样格式如下:
16位单声道:
采样一 |
采样二 |
…… |
||
低字节 |
高字节 |
低字节 |
高字节 |
…… |
16位双声道:
采样一 |
…… |
|||
左声道 |
右声道 |
…… |
||
低字节 |
高字节 |
低字节 |
高字节 |
……
|
struct DATA_BLOCK
{
char szDataID[4]; // 'd','a','t','a'
DWORD dwDataSize;
};