• 用树莓派实现会说话的汤姆猫


    会说话的汤姆猫很多人都玩过,对着它说话,它就会用猫的音调重复你说的话。这篇文章就是介绍如何使用树莓派来实现这个功能。

    测试设备:

    树莓派3B+

    ReSpeaker 2-Mics Pi HAT(USB的麦克风应该也可以)

    耳机/音箱(需要带插头的)

    1、ReSpeaker硬件安装

    ReSpeaker是直接扣在树莓派上的,将树莓派的针脚全部插入到ReSpeaker中。

    2、ReSpeaker驱动安装

    通过SSH连接到树莓派后,首先更新包源,然后安装git,下一步会使用git下载代码:

    sudo apt-get update
    sudo apt-get upgrade
    sudo apt-get install git

    从github获取麦克风驱动源代码:

    git clone https://github.com/respeaker/seeed-voicecard.git

    进入源代码目录,安装驱动:

    cd seeed-voicecard
    sudo ./install.sh
    reboot

    安装成功后需要重启,然后分别执行aplay -l和arecord -l列出所有的声音播放设备和声音录制设备:

    pi@raspberrypi:~ $ aplay -l
    **** List of PLAYBACK Hardware Devices ****
    card 0: ALSA [bcm2835 ALSA], device 0: bcm2835 ALSA [bcm2835 ALSA]
      Subdevices: 7/7
      Subdevice #0: subdevice #0
      Subdevice #1: subdevice #1
      Subdevice #2: subdevice #2
      Subdevice #3: subdevice #3
      Subdevice #4: subdevice #4
      Subdevice #5: subdevice #5
      Subdevice #6: subdevice #6
    card 0: ALSA [bcm2835 ALSA], device 1: bcm2835 ALSA [bcm2835 IEC958/HDMI]
      Subdevices: 1/1
      Subdevice #0: subdevice #0
    card 1: seeed2micvoicec [seeed-2mic-voicecard], device 0: bcm2835-i2s-wm8960-hifi wm8960-hifi-0 []
      Subdevices: 1/1
      Subdevice #0: subdevice #0
    pi@raspberrypi:~ $ arecord -l
    **** List of CAPTURE Hardware Devices ****
    card 1: seeed2micvoicec [seeed-2mic-voicecard], device 0: bcm2835-i2s-wm8960-hifi wm8960-hifi-0 []
      Subdevices: 1/1
      Subdevice #0: subdevice #0

    如果都看到了card 1: seeed2micvoicec,则说明安装成功。

    3、ReSpeaker驱动安装问题

    如果安装成功请跳过这一步。

    我这里第一次安装没有成功,报了一个错误:

    Error! echo
    Your kernel headers for kernel 4.14.50-v7+ cannot be found at
    /lib/modules/4.14.50-v7+/build or /lib/modules/4.14.50-v7+/source.

    大概意思是说找不到linux内核的头文件,这个去目录下找确实没有,可能是由于官方镜像升级内核时遗漏了些东西,最终按照这篇文章解决了:https://github.com/respeaker/seeed-voicecard/issues/83

    大概步骤是:

    (1)升级系统内核(如果没安装rpi-update,则需要先安装):

    sudo rpi-update

    安装成功后重启。

    (2)更新linux headers(如果没安装rpi-source,则需要先安装):

    sudo rpi-source --skip-gcc

    (3)删除老版本的linux headers:

    删除/lib/modules/文件夹下的老版本,比如我这里安装的最新版本是: 4.14.54-v7+,把非4.14.54开头的文件夹删掉就行了。

    (4)重新安装驱动:

    sudo ./install.sh

    安装成功后重启,再执行aplay -l和aarecord -l确认是否安装成功。

    4、测试ReSpeaker

    执行录音和播放命令:

    arecord -f cd -Dhw:1 | aplay -Dhw:1

    将扬声器的插头插入ReSpeaker的播放器接口。

    现在说话,耳机中应该能够听到重复的声音。

    ReSpeaker上还支持APA102 LED,可以根据接收到的声音有闪灯的效果。

    这里用到了pip,这是python的一个包安装工具,需要先安装:

    wget https://bootstrap.pypa.io/get-pip.py
    python get-pip.py
    pip -V  #查看pip版本

    然后安装运行:

    sudo pip install spidev
    git clone https://github.com/respeaker/mic_hat.git
    cd mic_hat
    python pixels.py

    现在说话的时候等应该会闪。

    5、安装PyAudio

    虽然aplay和arecord可以实现播放和录音的功能,但是如果要实时检测声音的话需要用PyAudio(可能也有别的库,这里选一个常用的)。

    因为我这里用了python3,所以需要python3版本的PyAudio:

    sudo apt-get install portaudio19-dev python-all-dev python3-all-dev
    pip3 install pyaudio

    6、安装SoundTouch

    这个程序可以对音频进行一些处理,我们这里用来做变声。

    在Windows上可以直接下载:https://www.surina.net/soundtouch/download.html

    在树莓派上需要源代码编译安装这个程序:

    sudo wget https://gitlab.com/soundtouch/soundtouch/-/archive/soundtouch-2.0.0/soundtouch-soundtouch-2.0.0.tar.gz
    sudo tar -xvf  soundtouch-soundtouch-2.0.0.tar.gz
    cd soundtouch-soundtouch-2.0.0
    sudo apt-get install automake autoconf libtool build-essential
    ./bootstrap
    ./configure
    make
    make install

    安装之后会在/usr/local/lib中生成类库文件,但是这个目录下的文件不能自动发现,建议将这个目录增加到/etc/ld.so.conf中:

    include ld.so.conf.d/*.conf
    /usr/local/lib  #增加的行

    然后运行 ldconfig 加载配置。

    7、运行汤姆猫程序

    这是一个用python3写的程序,先安装几个依赖库:

    sudo pip3 install numpy

    然后在/home/pi下创建一个目录tomcat:

    cd /home/pi
    mkdir tomcat
    cd tomcat

    然后创建 tomcat.py,这个是会说话的汤姆猫的主程序。其中大概的流程是:

    持续监控麦克风声音,如果达到某个阈值就开始录制声音,如果声音低于某个阈值就结束录音,然后保存声音,然后变声,然后播放;播放完毕后,继续监控麦克风声音。

    现在上传这个文件到tomcat目录中就可以运行了。

    chmod +x ./tomcat.py
    ./tomcat.py

    现在说句话试试,你应该能够听到汤姆猫美妙的回声了(记得连上耳机或音箱哦)。

  • 相关阅读:
    发布Hessian服务作为服务内部基础服务
    关于项目中的DAL数据接入层架构设计
    分享Spring Scheduled定时器的用法
    如何在两个月的时间内发表一篇EI/SCI论文-我的时间管理心得
    分享一个SqliteHelper类
    C++调用存储过程
    “扒项目”的历程(二):系统分析
    “扒项目”的历程一(业务分析)
    学习WebSocket一(WebSocket初识)
    局域网多人对战飞行棋的实现
  • 原文地址:https://www.cnblogs.com/bossma/p/raspberrypi-implement-a-talking-tom-cat.html
Copyright © 2020-2023  润新知