• [转]开源语音数据集


    本文为CSDN博主「chenghaoy」的原创文章, 原文链接:https://blog.csdn.net/chenghaoy/article/details/82842151

    英文数据集:
    1.LibriSpeech ASR corpus:该数据集是包含大约1000小时的英语语音的大型语料库。这些数据来自LibriVox项目的有声读物。它已被分割并正确对齐,如果你正在寻找一个起点,请查看已准备好的声学模型,这些模型在kaldi-asr.org和语言模型上进行了训练,适合评估。
    https://www.openslr.org/12

    Mini LibriSpeech ASR corpus:用于回归测试的一个子集 http://www.openslr.org/31/

    2.TED-LIUM:http://www.openslr.org/7/
    TED-LIUMv2:http://www.openslr.org/19/
    TED-LIUM Release 3:https://www.openslr.org/51/

    3.VoxForge:该数据集是带口音的语音清洁数据集,对测试模型在不同重音或语调下的鲁棒性非常有用。
    http://www.voxforge.org/
    https://voice.mozilla.org/zh-CN/data

    4.TIMIT数据集 百度云链接:https://pan.baidu.com/s/1YJNIFdBiSPqebTq_GyOdog 密码:sqw7

    5.Free ST American English Corpus:http://www.openslr.org/45/

    中文数据集
    1、THCHS-30
    THCHS-30是在安静的办公室环境下,通过单个碳粒麦克风录取的,总时长超过30个小时。大部分参与录音的人员是会说流利普通话的大学生。采样频率16kHz,采样大小16bits。
    THCHS-30的文本选取自大容量的新闻,目的是为了扩充863语音库。我们选取1000句来录音。
    链接:http://www.openslr.org/18/

    2、Aishell
    Aishell is an open-source Chinese Mandarin speech corpus published by Beijing Shell Shell Technology Co.,Ltd.
    400 people from different accent areas in China are invited to participate in the recording, which is conducted in a quiet indoor environment using high fidelity microphone and downsampled to 16kHz. The manual transcription accuracy is above 95%, through professional speech annotation and strict quality inspection. The data is free for academic use. We hope to provide moderate amount of data for new researchers in the field of speech recognition.
    希尔贝壳中文普通话开源语音数据库AISHELL-ASR0009-OS1录音时长178小时,是希尔贝壳中文普通话语音数据库AISHELL-ASR0009的一部分。AISHELL-ASR0009录音文本涉及智能家居、无人驾驶、工业生产等11个领域。录制过程在安静室内环境中, 同时使用3种不同设备: 高保真麦克风(44.1kHz,16-bit);Android系统手机(16kHz,16-bit);iOS系统手机(16kHz,16-bit)。高保真麦克风录制的音频降采样为16kHz,用于制作AISHELL-ASR0009-OS1。400名来自中国不同口音区域的发言人参与录制。经过专业语音校对人员转写标注,并通过严格质量检验,此数据库文本正确率在95%以上。分为训练集、开发集、测试集。
    链接:http://www.openslr.org/33/

    3、Aishell2
    希尔贝壳中文普通话语音数据库AISHELL-2的语音时长为1000小时,其中718小时来自AISHELL-ASR0009-[ZH-CN],282小时来自AISHELL-ASR0010-[ZH-CN]。录音文本涉及唤醒词、语音控制词、智能家居、无人驾驶、工业生产等12个领域。录制过程在安静室内环境中, 同时使用3种不同设备: 高保真麦克风(44.1kHz,16bit);Android系统手机(16kHz,16bit);iOS系统手机(16kHz,16bit)。AISHELL-2采用iOS系统手机录制的语音数据。1991名来自中国不同口音区域的发言人参与录制。经过专业语音校对人员转写标注,并通过严格质量检验,此数据库文本正确率在96%以上

    4、Free ST Chinese Mandarin Corpus
    This corpus were recorded in silence in-door environment using cellphone. It has 855 speakers. Each speaker has 120 utterances
    链接:http://www.openslr.org/38/

    5、Primewords Chinese Corpus Set 1
    Chinese Mandarin corpus released by Shanghai Primewords Co. Ltd. (www.primewords.cn), containing 100 hours of speech data.
    The corpus is recorded by smart mobile phones from 296 native Chinese speakers. The transcription accuracy is larger than 98%, at the confidence level of 95%. It is free for academic use.
    链接:http://www.openslr.org/47/

  • 相关阅读:
    第九周上机作业
    购物商城
    安卓第四周作业
    第十五周作业
    第十三周作业-集合
    第十三周上机练习
    第十二周作业
    上机练习 5.21
    java第十一周作业
    java第十一周上机练习
  • 原文地址:https://www.cnblogs.com/Tester_Dolores/p/14981267.html
Copyright © 2020-2023  润新知