• SDL开发笔记(二):音频基础介绍、使用SDL播放音频


    上一篇:《SDL开发笔记(一):SDL介绍、编译使用以及工程模板
    下一篇:敬请期待

     

    前言

      对于Qt应用来说,为了更大的跨平台通用性,使用SDL播放音频,同时也能做更多的扩充操作。

     

    声波

      声音是通过空气传播的一种连续的波,简称声波。声音的强弱体现在声波压力的大小上,音调的音调体现在声音的频率上。
      声音信号由两个基本参数是频率和复读。信号的频率指的是信号每秒变化的次数,用Hz表示。
    频率范围为20Hz20Khz的信号成为音频信号。该范围内的音频声音幅度在0120dB之间,可被人感知到。
    声音转换为数字信号,则成为音频信号。

     

    音频信号

      音频信号(acoustic signals)是带有语音、音乐和音效的有规律的声波的频率、幅度变化信息载体。根据声波的特征,可把音频信息分类为规则音频和不规则声音。其中规则音频又可以分为语音、音乐和音效。规则音频是一种连续变化的模拟信号,可用一条连续的曲线来表示,称为声波。
      声音的三个要素是音调、音强和音色。声波或正弦波有三个重要参数:频率 ω0、幅度An和相位ψn ,这也就决定了音频信号的特征。
      对音频信号进行采样,模拟信号数字化后,就是数字音频信号了。

     

    数字音频信号

      数字音频计算机数据的存储是以0、1的形式存取的,那么数字音频就是首先将音频文件转化,接着再将这些电平信号转化成二进制数据保存,播放的时候就把这些数据转换为模拟的电平信号再送到喇叭播出,数字声音和一般磁带、广播、电视中的声音就存储播放方式而言有着本质区别。相比而言,它具有存储方便、存储成本低廉、存储和传输的过程中没有声音的失真、编辑和处理非常方便等特点。
      数字音频信号,就是我们最终处理的音频数据。
      音频数字信号信号具备几个特征:

    量化级

      简单地说就是描述声音波形的数据是多少位的二进制数据,通常用bit做单位,如16bit、24bit。16bit量化级记录声音的数据是用16位的二进制数,因此,量化级也是数字声音质量的重要指标。我们形容数字声音的质量,通常就描述为24bit(量化级)、48KHz采样,比如标准CD音乐的质量就是16bit、44.1KHz采样。

    声道

      可以简单的理解为通过一个振膜采样到的音频数据就是一个声道,两个振膜就是两个声道,以此类推。振膜一般有大、中、小三种尺寸,尺寸越大,对声波越敏感,成本也越高。一个麦克风里面有的有一个振膜,有的有两个振膜。一个振膜的麦克风进行的是Mono单声道录音,两个振膜的麦克风进行的是Stereo双声道立体声录音。五声道环绕立体声录音就是麦克风1录取东北方向的声音,麦克风2录取西北方向的声音,麦克风3录取西南方向的声音,麦克风4录取东南方向的声音,麦克风5录取正前方的声音。另外还有四声道环绕立体声录音和七声道环绕立体声录音。

    采样率

      简单地说就是通过波形采样的方法记录1秒钟长度的声音,需要多少个数据。44KHz采样率的声音就是要花费44000个数据来描述1秒钟的声音波形。原则上采样率越高,声音的质量越好。

    比特率

    一种数字音乐压缩效率的参考性指标,表示记录音频数据每秒钟所需要的平均比特值(比特是电脑中最小的数据单位,指一个0或者1的数),通常我们使用Kbps(通俗地讲就是每秒钟1024比特)作为单位。CD中的数字音乐比特率为1411.2Kbps(也就是记录1秒钟的CD音乐,需要1411.2×1024比特的数据),近乎于CD音质的MP3数字音乐需要的比特率大约是112Kbps~128Kbps。

    压缩率

      通常指音乐文件压缩前和压缩后大小的比值,用来简单描述数字声音的压缩效率。

     

    SDL音频播放流程解析

      基本流程如下:

    步骤一:初始化子系统

      初始化音频系统,其他多余的系统不用初始化。

    步骤二:根据音频信息打开音频设备

      填充好SDL_AudioSpec音频信息,打开音频设备,此时会返回最接近的音频设备,若没有接近的则第二个参数返回0,此时我们直接第二个参数如0,无需返回。

    步骤三:开始播放

      使用SDL_PauseAudio(0)进行播放。

    步骤四:循环补充数据

      根据缓冲区数据长度和文件剩余的数据长度进行补充,若缓冲区数据没了,就补充一次,使用SDL_Delay进行1ms的延迟,用当前缓存区剩余未播放的长度大于0结合前面的延迟进行等待。

    步骤四(附加):回调函数

      开始播放后,会有音频其他子线程来调用回调函数,进行音频数据的补充,经过测试每次补充4096个字节。

    步骤五:关闭音频设别

    步骤六:退出SDL系统

     

    SDL播放音频相关变量

    struct SDL_AudioSpec

      SDL_AudioSpec是包含音频输出格式的结构体,同时它也包含当音频设备需要更多数据时调用的回调函数,此结构体是关键。

    typedef struct SDL_AudioSpec
    {
        int freq;                   // DSP频率—每秒采样数
        SDL_AudioFormat format;     // 音频数据格式
        Uint8 channels;             // 通道数1-单声道,2-立体声
        Uint8 silence;              // 音频缓冲静音值(计算)
        Uint16 samples;             // 基本是512、1024设置不合适可能会导致卡顿’
        Uint16 padding;             // 对于某些编译环境是必需的
        Uint32 size;                // 音频缓冲区大小(字节)(计算)
        SDL_AudioCallback callback; // 为音频设备提供数据回调(空值使用SDL 自身预先定义的SDL_QueueAudio ()回调函数)
        void *userdata;             // 传递给回调的Userdata(对于空回调忽略)
    } SDL_AudioSpec;
    

      举例:播放pcm音频“匆匆那年-44100-16位-双通道.pcm”

    // 音频结构体设置
    SDL_AudioSpec sdlAudioSpec;
    sdlAudioSpec.freq = 44100;
    sdlAudioSpec.format = AUDIO_S16SYS;
    sdlAudioSpec.channels = 1;
    sdlAudioSpec.silence = 0;
    sdlAudioSpec.samples = 1024;
    sdlAudioSpec.callback = callBack_fillAudioData;
    sdlAudioSpec.userdata = 0;
    
     

    SDL播放音频相关原型

    SDL_Init()

    int SDLCALL SDL_Init(Uint32 flags);
    

      使用此函数初始化SDL库,必须在使用大多数其他SDL函数之前调用它,初始化的时候尽量做到“够用就好”,而不要用SDL_INIT_EVERYTHING。会出现一些不可预知的问题。

    • 参数一:输入初始化的设备
      在这里插入图片描述

    SDL_OpenAudio()

    int SDL_OpenAudio(SDL_AudioSpec * desired,
                      SDL_AudioSpec * obtained);
    

      此函数使用所需参数打开音频设备,然后如果成功,则返回0,将实际硬件参数放入已获得指向的结构。如果获得的为空,则音频传递给回调函数的数据将被保证在请求的格式,并将自动转换为硬件音频格式(如有必要)。如果失败,此函数返回-1,则无法打开音频设备,或无法设置音频线程。

    • 参数一:输入需要打开的音频设备参数;
    • 参数二:返回打开成功的音频设备参数;

    SDL_PauseAudio()

    extern DECLSPEC void SDLCALL SDL_PauseAudio(int pause_on);
    

      暂停音频功能。函数暂停和取消暂停音频回调处理。
      打开音频后,应使用参数0调用它们开始播放声音的设备。这样就可以在打开音频设备后安全地初始化回调函数的数据。
      暂停期间,静音将写入音频设备。

    SDL_MixAudio:混音播放函数

    void SDL_MixAudio(Uint8 * dst,
                     const Uint8 * src,
                     Uint32 len,
                     int volume);
    

      这需要播放音频格式和混音的两个音频缓冲区它们执行加法、音量调节和溢出剪辑。音量的范围从0到128,应设置为SDL_MIX_MAXVOLUME全音频音量。注意这不会改变硬件的音量。
    这是为了方便起见,可以混合音频数据。

    • 参数一:目标数据,这个是回调函数里面的stream指针指向的,直接使用回调的stream指针即可。
    • 参数二:音频数据,这个是将需要播放的音频数据混到stream里面去,那么这里就是我们需要填充的播放的数据。
    • 参数三:音频数据的长度,这个是我们填充过去的长度。
    • 参数四:音量,0~128范围,SAL_MIX_MAXVOLUME为128,设置的是软音量,不是硬件的音响。

    SDL_Delay()

    void SDL_Delay(Uint32 ms);
    

      在返回之前等待指定的毫秒数。

    SDL_Quit()

    void SDLCALL SDL_Quit(void);
    

      此函数用于清除所有初始化的子系统。在所有退出条件后调用它。

     

    Demo源码

    void SDLManager::testPlayPCM()
    {
        int ret = 0;
        // 音频结构体
        SDL_AudioSpec sdlAudioSpec;
    //    sdlAudioSpec.freq = 44100;
        sdlAudioSpec.freq = 22050;
    //    sdlAudioSpec.format = AUDIO_U8; // x
    //    sdlAudioSpec.format = AUDIO_S8; // x
    //    sdlAudioSpec.format = AUDIO_U16LSB; // x
    //    sdlAudioSpec.format = AUDIO_S16LSB; // √
    //    sdlAudioSpec.format = AUDIO_U16MSB; // x
    //    sdlAudioSpec.format = AUDIO_U16LSB; // x
    //    sdlAudioSpec.format = AUDIO_S16MSB; // x
    //    sdlAudioSpec.format = AUDIO_U16; // x
        sdlAudioSpec.format = AUDIO_S16; // √
    //    sdlAudioSpec.format = AUDIO_S16SYS; // x
    //    sdlAudioSpec.format = AUDIO_S32SYS; // x
    //    sdlAudioSpec.format = AUDIO_F32SYS; // x
    //    sdlAudioSpec.format = AUDIO_F32MSB; // x
        sdlAudioSpec.channels = 1;
        sdlAudioSpec.silence = 0;
        sdlAudioSpec.samples = 1024;    // 导致错误512~1024之间
        sdlAudioSpec.callback = callBack_fillAudioData;
        sdlAudioSpec.userdata = 0;
    
        QString fileName;
    
    #if 0
        fileName = "testPCM/王妃-22050-16位-单通道.pcm";
        sdlAudioSpec.freq = 22050;
        sdlAudioSpec.channels = 1;
        sdlAudioSpec.format = AUDIO_S16;
    #endif
    #if 1
        fileName = "testPCM/匆匆那年-44100-16位-双通道.pcm";
        sdlAudioSpec.freq = 44100;
        sdlAudioSpec.channels = 2;
        sdlAudioSpec.format = AUDIO_S16;
    #endif
    #if 0
        fileName = "testPCM/北京北京8k16bits单声道.pcm";
        sdlAudioSpec.freq = 8000;
        sdlAudioSpec.channels = 1;
        sdlAudioSpec.format = AUDIO_S16;
    #endif
    #if 0
        fileName = "testPCM/冰雨片段48k16bit单声道.pcm";
        sdlAudioSpec.freq = 48000;
        sdlAudioSpec.channels = 1;
        sdlAudioSpec.format = AUDIO_S16;
    #endif
    #if 0
        fileName = "testPCM/浪花一朵朵片段48k16bit单声道.pcm";
        sdlAudioSpec.freq = 48000;
        sdlAudioSpec.channels = 1;
        sdlAudioSpec.format = AUDIO_S16;
    #endif
    
        QFile file(fileName);
        if(!file.open(QIODevice::ReadOnly))
        {
            LOG << "Failed" << file.exists();
            return;
        }
    
    
        // 步骤一:初始化音频子系统
        ret = SDL_Init(SDL_INIT_AUDIO);
        if(ret)
        {
            LOG << "Failed";
            return;
        }
    
        // 步骤二:打开音频设备
        ret = SDL_OpenAudio(&sdlAudioSpec, 0);
        if(ret)
        {
            LOG << "Failed";
            return;
        }
    
        // 步骤三:开始播放
        SDL_PauseAudio(0);
    
    #if 1
        // 步骤四:一次性读取所有的数据
        QByteArray data = file.readAll();
        int pos = 0;
        _audioPos = (uint8_t *)data.data();
        _audioLen = data.size();
        pos += data.size();
        while(_audioLen > 0)
        {
            SDL_Delay(1);
        }
    #else
        // 步骤四:一次性读取4096
        int readSize = 4096;
        while(true)
        {
            _audioPos = (uint8_t *)file.read(readSize).data();
            _audioLen = readSize;
            while(_audioLen > 0)
            {
                SDL_Delay(1);
            }
        }
    #endif
        // 步骤:播放完毕
        SDL_CloseAudio();
    
        // 步骤:释放SDL
        SDL_Quit();
    
    
        if(file.isOpen())
        {
            file.close();
            return;
        }
    }
    
    void SDLManager::callBack_fillAudioData(void *userdata, uint8_t *stream, int len)
    {
        SDL_memset(stream, 0, len);
        if(_audioLen == 0)
        {
            return;
        }
        len = (len > _audioLen ? _audioLen : len);
    
        SDL_MixAudio(stream, _audioPos, len, SDL_MIX_MAXVOLUME);
    
        _audioPos += len;
        _audioLen -= len;
    
        // 每次加载4096
        LOG << len;
    }
    
     

    工程模板:对应版本号v1.1.0

      对应版本号v1.1.0:播放裸PCM数据。

     

    上一篇:《SDL开发笔记(一):SDL介绍、编译使用以及工程模板
    下一篇:敬请期待

     
  • 相关阅读:
    自定义Visual Studio调试器中的对象显示方式
    Visual Studio中的主题定制变得更加容易
    宣布Visual Studio Code Installer for Java
    在Visual Studio 2019中开启预览功能
    .NET Core 3.0预览版7中的ASP.NET Core和Blazor更新
    C#连接SQL Anywhere 12 数据库
    数据库导出脚本
    python http请求及多线程应用
    记录 Ext 日历月份选择控件bug解决过程结果
    js浮点数运算封装, 起因财务部分精确计算
  • 原文地址:https://www.cnblogs.com/qq21497936/p/13672262.html
Copyright © 2020-2023  润新知