• 人工智能


    转:https://www.cnblogs.com/li-li/p/10273412.html#autoid-0-0-0

    一、人工智能

      此篇是人工智能应用的重点,只用现成的技术不做底层算法,也是让初级程序员快速进入人工智能行业的捷径,目前市面上主流的AI技术提供公司有很多,比如百度、阿里、腾讯、主做语音的科大讯飞,做只能问答的图灵机器人等等,这些公司投入了很大一部分财力物力人力将底层封装,提供应用接口给我们,尤其是百度,完全免费的接口,既然百度这么仗义,咱们就不要浪费掉怎么好的资源,从百度AI入手,开启人工智能之旅!

      开启人工智能技术的大门 : http://ai.baidu.com/

      看看我们大百度的AI大法,这些技术全部都是封装好的接口,看着就爽,接下来咱们就一步一步的操作一下,首先进入控制台,注册一个百度的账号(百度账号通用),开通一下我们百度AI开放平台的授权。然后找到已开通服务中的百度语音,如下图:

      走到这里,想必已经知道咱们要从语音入手了,语音识别和语音合成,打开百度语音,进入语音应用管理界面,创建一个新的应用,如下图:

      创建应用时可按照如下填写:

      创建完成后,回到应用列表我们可以看到已创建的应用了,如下图:

      这里面有三个值 AppID , API Key , Secret Key需要记住从这里看,之后的学习中我们会用到。

      到此,百度语音的应用已经创建完成了,接下来,我们Python 代码作为实例进行应用及学习。

      使用pip安装百度人工智能的python SDK:

    1
    pip3 install baidu-aip

      安装后就可以使用如下方式导入:

    1
    from aip import AipSpeech

    一、语音合成

      百度语音合成技术文档: https://ai.baidu.com/docs#/TTS-Online-Python-SDK/top

      代码示例:

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    from aip import AipSpeech
     
    """ 你的 APPID AK SK """
    # 这里的三个参数,对应在百度语音创建的应用中的三个参数
    APP_ID = '15421088'
    API_KEY = 'YLhm87fm7q51a3LqBwG7g4xB'
    SECRET_KEY = 'ojzQ40mGhyrzrH9zTkVkEdBbae0F7HyW'
     
    # 这是与百度进行一次加密校验,认证你是合法用户,合法应用
    client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)
    # AipSpeech 是百度语音的客户端,认证成功之后,客户端将被开启,这里的client 就是已经开启的百度语音的客户端了
     
    # 用百度语音客户端的synthesis方法,并提供相关参数,成功得到音频文件流,否则返回错误信息
    result = client.synthesis(
        '你叫什么名字?'# text: 合成的文本,utf-8编码,注意长度须小于1024字节
        'zh',             # lang: 语言,zh代表中文,en代表英文
        1,             # ctp: 客户端信息,这里就写1,写别的不好使,原因后边解释
        {
            'vol':5,   # 合成音频我呢见的准音量
            'spd':3,   # 语速,取值0-9,默认为5,中语速
            'pit':7,   # 语调音调,取值0-9,默认为5,中语调
            'per':4    # 发音人选择,0为女声,1为男声,3为情感合成-度逍遥,4为情感合成度丫丫,默认为普通女
        }
    )
     
    # 若上面三个参数APP_ID,API_KEY,SECRET_KEY填写正确,result就是音频文件的流
    # 如果返回失败的话,result就是一个字典
    print(result)
     
    if not isinstance(result, dict):
        with open('audio.mp3', 'wb') as f:
            f.write(result)

    二、语音识别

      百度语音识别技术文档:http://ai.baidu.com/docs#/ASR-Online-Python-SDK/top

    1、语音识别工具

      我们一般不对mp3格式的音频文件进行识别,文档中明确指出支持的格式有:pcm(不压缩)、wav(不压缩,pcm编码)、amr(压缩格式),因此,要想让百度的SDK识别我们的音频文件,就要想办法转变成百度SDK可以识别的格式(我们一般用PCM格式)。下面为你介绍一个可以实现自动化转换格式并且屡试不爽的工具 : FFmpeg。

      下载地址:https://pan.baidu.com/s/1jonSAa_TG2XuaJEy3iTmHg(提取码:w6hk)。

      1)将FFmpeg工具压缩包下载后,解压缩,找到bin目录(例如我的目录是D:Program Filesffmpegin),将bin目录加入到环境变量,如下图:

      2)测试是否配置成功,下图表示成功:  

        接下来你就可以使用该工具将wav、wma、mp3等音频文件转换为pcm无压缩音频文件了。

      3)演示:现在我电脑D:DragonFireAudio目录下有个音频文件audio.wav,进行pcm格式的转换得到 audio.pcm,操作如下:

        命令:ffmpeg -y  -i audio.wav  -acodec pcm_s16le -f s16le -ac 1 -ar 16000 audio.pcm

        然后打开目录D:DragonFireAudio 就可以看见生成的.pcm文件了。

    2、语音识别示例

    三、图灵机器人

      官网:http://www.tuling123.com

    1、创建机器人

      1)注册登录账号后,点击创建机器人,填写信息;

      2)配置机器人各项参数,按照文档说明使用;

      3)API V2.0接入文档地址:https://www.kancloud.cn/turing/www-tuling123-com/718227

    2、机器人示例代码

    四、web录音玩具

      注意:以下示例请使用火狐浏览器演示!

      manage.py文件:

      index.html文件:

      

  • 相关阅读:
    shader之渐变长方体实现(threejs)
    shader之threejs应用
    shader之cesium应用
    pip install -- Failed building wheel for XXX
    pycharm -- 界面乱码
    Android Studio -- 优化速度
    django -- ImageField 上传图片修改头像
    AI -- 回溯法解决四皇后问题
    Android Studio -- 真机测试
    傻瓜函数式编程
  • 原文地址:https://www.cnblogs.com/kenD/p/10470609.html
Copyright © 2020-2023  润新知