• 用人工智能工具解决工作中遇到的录音整理、速录行业的问题


      音视频内容整理行业是一个出现挺长时间的行业,主要工作是听声音录成文档,或者是将内嵌的字幕“抄”出来,形成易读的文档,还有的是根据图片的文字打字,有的是将录音整理成字幕格式,每行多少个字。
     
      这种行业需要有比较广泛的知识,因为要面对各行各业的录音内容。第二个特点是工作需要特别多的时间,因为文字工作本身是需要时间和耐心的。第三个特点是要面对各种各样的场景,例如有个客户发的仅是一个链接,录音下不下来,有的声音质量很糟糕,有的内容很专业,有的要求交稿的时间很紧,有的是方言,有的是外语,等等。
     
      从事录音整理、扒词行业挺长一段时间了,在工作中也遇到了各种各样的问题,使用了各种工具,最近总结出来分享一下。

    用到的工具
      媒体播放器,可以使用VLC播放器,这款播放器开源,没有广告,安装简单,编解码能力强,前进、后退等等操作方便。
      字幕编辑工具,可以用subtitle edit,这款软件也是开源的,编辑字幕功能强大。
      加字幕工具,可以用aegisub,premiere、edius等后期软件,能做丰富的字幕效果。

    行业中的痛点
    #1 媒体文件存放在网盘
      这种情况可以用http://pandownload.com/这款工具,下载速度快。

    #媒体文件放在优酷,qq等视频网站上
    这种情况推荐使用稞麦综合视频下载这款软件,小巧方便。

    #媒体文件无法下载的
    这种就用终极杀器—用手机或电脑上的录音软件录音或者录屏,这种虽然耗时间,但也是不得已而为之。

    #有些媒体文件体积很大
    这种情况如果是视频的,如MP4,vob原装盘等等格式,体积很大,可以提取出MP3格式的语音,或者是音频的wav,pcm等未压缩的格式,也可以转化成MP3格式,方便传输,操作。这种情况推荐我们研发的一款好用的工具,获取方式在本文最后。

    #有时候需要截取媒体文件的一部分
    比如有的媒体文件某些部分敏感,不需要整理的,这时候要截取某些需要整理的部分,这种情况也可以用后面的工具。

    #媒体文件声音太小的
    这种可以用后边软件提供的软件。

    #媒体文件有比较大的噪声的
    这种情况请用提供的软件,可以有效降噪。

    #文本需要整理成字幕格式的
    可以用我们的软件进行符号断句,按照标点符号分行,超过字数的有字数检测。

    #最主要的提高效率的方式:运用人工智能的方式自动转录语音成文字,以及从视频中自动提取出内嵌字幕
      这是HTWCore软件最大的亮点,它使用当前最先进的人工智能在语音识别,文字识别、语义理解方面的技术,具有当前大厂相关领先技术的能力,能将语音按要求转录成区分角色,带时间码,特定格式,易阅读的文档,可将视频中的内嵌字幕自动“抄”成文档。
      利用HTWCore能极大的提高效率,音质条件好的录音只需要改少量的软件生成的文档的专业词汇,通常的专业速录速记人员整理录音的时间比在1:2.5-3,而使用我们的软件能控制在1:2以内,也就是整理一小时的录音只需要小于2小时的时间,而且能自动时间码隔开,角色区分,杜绝打字错误,有效减轻人力工作量。
     
      做了几千小时的录音,视频,深知这行业的不易,用人工智能的技术解决行业的痛点,HTWCore简单易用,有需要的可以加QQ群:414750884。
     

      HTWCore下载:

      链接:https://pan.baidu.com/s/1k4zjpMBbUf-Okczd6xUogQ 提取码:qs52 

      或者加QQ群:414750884


    作者:Qubook
    出处:http://www.cnblogs.com/hard/
    版权声明:本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文链接。
    联系方式: 个人QQ  1005354833;

  • 相关阅读:
    函数式编程
    JSONP
    用javascript实现base64编码器
    图片Ping
    CORS
    深入理解ajax系列第五篇——进度事件
    文件File
    深入理解ajax系列第四篇——FormData
    Blob
    深入理解ajax系列第三篇——响应解码
  • 原文地址:https://www.cnblogs.com/Hard/p/audio-transcript-videoocr-htwcore.html
Copyright © 2020-2023  润新知