• 奈奎斯特定理和傅里叶变换


    人总是认为事物在以最简单的方式运行:对于音频,人总是认为它的频率尽量低
    如果一个录音机采样率为8000Hz,那么这台录音机至多捕捉到4000Hz的声音;一个声音最高频率为100Hz,那么录音机采样率至少为200Hz才能完美地录下这个声音。
    人耳的听觉范围20Hz~20000Hz,所以可以认为人耳的采样率为40000Hz,人耳的声音频率范围和机械频率范围不同。
    通俗解释:一盏灯一亮一灭,它的频率为50Hz;人眼看灯,眼睛睁一下马上闭上。人眼要想看到灯的每一次亮灭,就必须在1s钟内睁眼100次,因为灯1s钟内有100个亮灭状态。

    如果违背了奈奎斯特定理会怎样?
    频率低的录音机看待世界总是认为全世界都是低频的,即便是更高的频率它也会误认为是低频
    我跳绳,180个每分钟,3Hz,如果用1.3Hz的频率给我照相,最多记录78个我的状态,顶多认为我跳了39下,也就是0.65Hz。也就是说,这个照相机能看见的极限频率就是0.65Hz
    而实际上,照相机并不认为我跳了39下。而是3%1.3=0.4Hz,也就是24下
    夏天,电扇转得很快,人眼看上去电扇像在倒着转
    人眼接受电磁运动的频率跟人眼接受机械运动的频率不同。

    离散傅里叶是特殊的连续傅里叶
    对于N个音频点,离散傅里叶总是认为它的采样率为N,播放时间为1s
    连续傅里叶采样率可以随意变动,离散傅里叶采样率固定。对于N个音频点,当连续傅里叶采样率小于N时,逆变换后音频会失真;当连续傅里叶采样率等于N时,傅里叶变换刚好完美地描述音频信号;当连续傅里叶采样率大于N时,当然也能完美描述音频信号,但是却画蛇添足,毫无必要超过N。
    连续傅里叶形式更灵活,离散傅里叶可以应用周期性、分治提高效率
    N个音频点需要用N个正弦波来描述

    时域波形有正有负,对应声带的偏移位置
    音频处理:TimeStretch,PitchShift,TempoChange
    TempoChange:改变播放时间、改变音调
    TimeStretch:改变播放时间、不改变音调
    PitchShift:改变音调、不改变播放时间

  • 相关阅读:
    三维重建:SLAM算法的考题总结
    ubuntu16.04安装KDE
    pip更新
    DNN结构演进History—CNN-GoogLeNet :Going Deeper with Convolutions
    OpenCV直方图均衡化
    图像连通域检测的2路算法Code
    OpenCV中的模板匹配/Filter2d
    OpenCV边缘检测的详细参数调节
    ICCV2015上的GazeTracker论文总结
    图像的连通域检测的堆栈算法
  • 原文地址:https://www.cnblogs.com/weiyinfu/p/9733435.html
Copyright © 2020-2023  润新知