• 音乐和人声自动判别小结


          人声的平均识别率在89.31%,音乐的平均识别率在95.95%。相声和故事的结果较差,原因在于测试集中包含的相声现场录制环境较差,环境吵闹,频谱混乱;而讲故事有比较明显的音乐背景伴奏。

    表1   音乐和人声自动分类结果

    正确数目

    数目

    准确率

    电视节目

    59

    66

    0.893939

    故事

    69

    88

    0.784091

    评书

    181

    186

    0.973118

    相声

    73

    96

    0.760417

    有声电台

    41

    44

    0.930233

    1800有声

    96

    101

    0.950495

    合计

    518

    580

    0.893103

    1800音乐

    1614

    1690

    0.95503

    华语舞曲

    54

    54

    1

    R&B

    44

    44

    1

    西方民谣

    80

    80

    1

    华语摇滚

    50

    52

    0.961538

    rap

    104

    108

    0.962963

    合计

    1946

    2028

    0.959566

    合理阈值

    0.5

    表2  两层筛选自动分类结果

    正确数目

    数目

    准确率

    电视节目

    62

    66

    0.939394

    故事

    72

    88

    0.818182

    评书

    182

    186

    0.978495

    相声

    77

    96

    0.802083

    有声电台

    41

    43

    0.953488

    1800有声

    96

    101

    0.950495

    合计

    530

    580

    0.913793

    1800音乐

    1592

    1688

    0.943128

    华语舞曲

    54

    54

    1

    R&B

    43

    44

    0.977273

    西方民谣

    80

    80

    1

    华语摇滚

    49

    52

    0.942308

    rap

    104

    108

    0.962963

    合计

    1922

    2026

    0.948667

    合理阈值

    0.5

  • 相关阅读:
    hoj 13832 Fence
    hoj 13830 DNA Sequencing 字典树
    HOJ Funfair
    HOJ 13828 Funfair
    图论相关
    01字典树
    异或
    日常补题2017-10-31
    康拓展开
    日常训练17-10-27(16杭州ccpc)
  • 原文地址:https://www.cnblogs.com/welen/p/4305674.html
Copyright © 2020-2023  润新知