音频输出格式

音频输出格式

PCM文件：模拟音频信号经模数转换(A/D变换)直接形成的二进制序列，该文件没有附加的文件头和文件结束标志。Windows的Convert工具可以把PCM音频格式的文件转换成Microsoft的WAV格式文件。

将音频数据化，其实就是将声音数据化。最常见的方式是透过脉冲编码调制PCM(Pulse Code Modulation)。运作原理如下：首先我们考虑声音经过麦克风，转换成一串电压变化的信号，如图一所示。这张图横坐标为秒，纵坐标为电压大小。要将这样的信号转为PCM格式的方法，是使用三个参数来表示声音，它们是：声道数，采样位数和采样频率。

采样频率：即每秒钟取得声音样本的次数。采样率越高，声音的质量也高，但同时占用的资源也越多。在16位声卡中有22KHz、44KHz等结果等级，其中，22KHz相当于普通FM广播的音频，44KHz已相当于CD音质了，目前的常用采样频率都不超过48KHz。

采样位数：即采样值或取样值（就是将采样样本幅度量化），他是用来衡量声音波动变化的一个参数，也可以说是声卡的分辨率。值越大，分辨率越高，所发声音的能力越强。

声道数：单声道：一个喇叭，立体声：两个喇叭，左声道，右声道

PCM文件所占容量的公式：

存储量=(采样频率*采样位数*声道)*时间/8(单位：字节数)
例如：数字激光唱盘(CD-DA，红皮书标准)的标准采样频率为44.1KHz,采样位数为16位，立体声(2声道)，可以几乎无失真地播放频率高达22KHz的声音，这也是人类所能听到的最高频率声音。激光唱片一分钟音乐需要的存储量为：

存储量=(44.1KHz*16*2)*1*60/8=10,584,000(字节)=10.584MBytes

这个数字就是pcm声音文件在硬盘中所占磁盘空间的存储量。

//////////////////////////////////////////////////////////////////////////////////////////////////////////////////////

118分贝信噪比立体声音频模数转换器：

该PCM4202是一种高性能，立体声模拟数字(A/D)转换为专业设计和广播音频应用。该采用PCM4202位每通道Δ-Σ调制器，装有新型密度调制抖动，以提到动力性能计划。

该PCM4202支持24位的线性PCM输出数据，采样率高达216KHz。该PCM4202还可以被配置为输出或128*64*32或过采样，每个通道1位直接数据流DSD数据。为PCM和DSD输出格式支持使得一个数字音频几率和处理各种应用PCM4202适合。

了解PCM码流：

PCM：Pulse Code Modulation 脉冲编码调制一般速度为64kbps

是指对语音信号直接采集量化的一种编码办法，采样速率为8KHz，每样点为8bit表示

CD用16bit 44.1KHz采样的PCM;

数字电话用的也是PCM

PCM是非线性编码，根据G.711建议，编码结束后需要做偶数位翻转，也就是说：

如果编码后结果是 0110 1001 ，则在发送的时候需要经过偶数位翻转：

得到： 0011 1100

pcm码的压缩分辨率有：a率、u率，在中国使用a率

PCM码有很多种，网络上主要有4种：MANCHESTER码，差分Manchester码，AMI码，HDB3码，2B1Q码，分别用于以太网，ISDN，DDN,电话

ITU网站上可以下载这类协议

PCM就是WAV文件，未经过压缩的音频文件，当然无损的

直接播放PCM格式的音频文件：

安装AC3Filter或者FFDShow

MCASP

McASP是TI的DSP一种接口，称为复通道音频接入接口。这是一种通用的音频接入接口。采用的是时分复用的数据流形式。TI公司不同的产品有不同的接口个数。

McASP使用I2S协议，也支持DIT协议。McASP包括发射与接收两部分，它们可以使用不同时钟，不同传输模式，工作完全独立。发射和接收能够工作在同步状态。McASP使用灵活，能够和音频模数转换ADC，数模转换DAC编码器，数字音频接口接收器DIR等无缝直连。例如DIR接收，一个DIR接收器集成电路需要使用I2S输出格式。

一、I2S总线概述

音响数据的采集、处理和传输是多媒体技术的重要组成部分。众多的数字音频系统已经进入消费市场，例如数字音频录音带、数字声音处理器。对于设备和生产厂家来说，标准化的信息传输结构可以提高系统的适应性。I2S(Inter—IC Sound)总线是飞利浦公司为数字音频设备之间的音频数据传输而制定的一种总线标准，该总线专责于音频设备之间的数据传输，广泛应用于各种多媒体系统。

二、I2S总线规范

I2S总线拥有三条数据信号线：

1、SCK: (continuous serial clock) 串行时钟

对应数字音频的每一位数据，SCK都有1个脉冲。SCK的频率=2×采样频率×采样位数。

2、WS: (word select) 字段（声道）选择

用于切换左右声道的数据。WS的频率＝采样频率。

命令选择线表明了正在被传输的声道。
WS为“1”表示正在传输的是左声道的数据。
WS为“0”表示正在传输的是右声道的数据。
WS可以在串行时钟的上升沿或者下降沿发生改变，并且WS信号不需要一定是对称的。在从属装置端，WS在时钟信号的上升沿发生改变。WS总是在最高位传输前的一个时钟周期发生改变，这样可以使从属装置得到与被传输的串行数据同步的时间，并且使接收端存储当前的命令以及为下次的命令清除空间。

用二进制补码表示的音频数据。 I2S格式的信号无论有多少位有效数据，数据的最高位总是被最先传输(在WS变化(也就是一帧开始)后的第2个SCK脉冲处)，因此最高位拥有固定的位置，而最低位的位置则是依赖于数据的有效位数。也就使得接收端与发送端的有效位数可以不同。如果接收端能处理的有效位数少于发送端，可以放弃数据帧中多余的低位数据；如果接收端能处理的有效位数多于发送端，可以自行补足剩余的位(常补足为零)。这种同步机制使得数字音频设备的互连更加方便，而且不会造成数据错位。为了保证数字音频信号的正确传输，发送端和接收端应该采用相同的数据格式和长度。当然，对I2S格式来说数据长度可以不同。

对于系统而言，产生SCK和WS的信号端就是主设备。
相关阅读:
C++ 知识点（摘抄书籍内容）
filebeat 知识点
 PostgreSQL 报错及解决
 https://github.com/bilibili/flv.js 项目本地调试步骤
 etcd 报错及解决
 《程序员的自我修养 : 链接、装载与库》
005TkeServiceConfig探活影响k8s服务启动记录
 019查看docker内进程实际占用内存
 009网页状态码302和307的区别
 007k8s诡异详细记录
原文地址：https://www.cnblogs.com/itxiaocaiyidie/p/2325590.html

音频输出格式

一、I2S总线概述

二、I2S总线规范

1、SCK: (continuous serial clock) 串行时钟

2、WS: (word select) 字段（声道）选择