• “眼界大开 声临其境”网易首届音视频技术大会圆满落幕


    众所周知,视觉是万物感知的主要信息来源,听觉让沉默的信息更进一步而变得“有声有色”。在移动互联网时代下,“声色俱佳”的在线学习、工作、娱乐方式广受欢迎,互动直播、视频会议、远程招聘等新场景纷纷涌现。而其背后是音视频技术的鼎力支撑,潜移默化中融入了各行各业的在线场景。

    基于此背景,“眼界大开 声临其境”网易首届音视频技术大会应运而生。紧密围绕着“色”与“声”,本次大会分别设置“眼界大开:视频技术创新视界”和“声临其境:音频技术沉浸体验”两大专题分会,全程为期两天,为所有到场嘉宾和线上观众奉献了一场酣畅淋漓的科技盛宴。

    网易音视频技术大会

    展技术,促交流

    首先,本届大会的总出品人、网易智企技术 VP 陈功博士讲述了本届大会举办的契机和目的。陈功说道,近几年音视频技术发展迅猛,商业化落地加速,而网易在此领域持续进行着技术创新和突破,并在今年初成立了网易 TM599 音视频技术分委会,并期待通过分委会集中展示网易集团在音视频各个细分领域的技术能力积累,同时促进行业内的交流与合作。

    网易智企技术 VP 陈功

    眼界大开

    视频技术创新视界

    在“眼界大开:视频技术创新视界”专题分会上,专题出品人、网易音视频实验室高级技术专家韩庆瑞介绍了专题的主要内容,结合网易云音乐、网易易盾、网易云信、网易互娱在视频技术的实战经验,本场分会将围绕视频处理、视频深度鉴伪、内容安全、视频增强及计算机视觉技术、AI 舞蹈合成等话题展开深度分享。

     

    网易音视频实验室高级技术专家 韩庆瑞

    网易云音乐资深视频算法工程师眭世晨从当下火热的短视频领域切入,以技术视角深度剖析了云音乐中多种视频作品创作工具的功能和设计思路,并认为技术最终只是辅助创作者表达价值的工具,而非直接取代创作者的想法。

    网易云音乐资深视频算法工程师 眭世晨

    网易易盾资深图像算法工程师胡宜峰介绍了 AI 在各个场景应用的“双刃剑”效应,并以最为突出的人脸伪造隐患为例,从算法和应用的维度分享了网易易盾在视频深度伪造检测方面的解决策略和显著成果。

    网易易盾资深图像算法工程师 胡宜峰

    网易云信资深视频算法工程师周琛晖梳理了影响视频清晰度、色彩、质量等一系列问题的原因,并针对各项问题逐一分享了基于 AI 视频处理算法的解决方法,网易云信画质增强在实时音视频交互、低延时直播、点播等场景大有可为。

    网易云信资深视频算法工程师 周琛晖

    网易互娱资深 AI 研究工程师谭志鹏着重介绍了在游戏和影视行业中常见的舞蹈动画,并阐释了舞蹈动画生成背后不易的过程,以及如何通过 AI 音乐舞蹈合成算法技术,快速且高效的制作生成高质量的舞蹈动画。

    网易互娱资深 AI 研究工程师 谭志鹏

    声临其境

    音频技术沉浸体验

    “声临其境:音频技术沉浸体验”专题分会同样充满了技术干货。专题出品人、网易云音乐音视频实验室负责人刘华平介绍,新冠肺炎疫情极大推动了线上应用场景发展,实时音视频通话是众多应用中非常“刚需”的技术点,音质也是音视频通话系统中最为核心的参数之一。

    网易云音乐音视频实验室负责人 刘华平

    网易云信音频算法专家郝一亚首先回顾了 RTC 实时通信的背景和主要应用场景,并介绍了网易云信 AI 降噪技术的架构和效果,以及回声消除算法。在音频标准化评价体系建设方面,网易云信也付出了很多努力,如:设立音频实验室、建立降噪算法评价体系等,并期待以此不断推动国内 RTC 音频领域的发展。最后分享了网易云信诸如 3D 音效、AEC 等其他音频能力和音频实验室的学术研究成果。

     

    网易云信音频算法专家 郝一亚

    网易云音乐音视频算法负责人赵翔宇表示,沉浸式音频对用户获得真实的、身临其境的体验非常重要。围绕此主题,赵翔宇列举了影响声场沉浸感的主要因素,以及应对的技术方案。最后展示了技术方案的音频效果,让所有现场和线上的观众也一起“沉浸”了一把。

    网易云音乐音视频算法负责人 赵翔宇

    来自网易杭州研究院的语音算法专家刘东、杨震、李响聚焦于 AI 技术在语音相关领域的研发与应用多年,并分别从各自深耕的音频理解系统、语音识别中的声学模型、语音识别线上推理系统三大维度展开讲述了研发过程中面对的技术挑战、解决思路和实际案例。

     

    网易杭州研究院语音算法专家  刘东、杨震、李响

    网易游戏雷火音频设计专家付明铭则以 AI 音乐的开发和应用为主题进行了分享。付明铭提出,AI 音乐是一个算法和艺术的交叉领域,本质是通过各种算法对音乐数据进行分析与学习,形成审美相对确定的风格模型,并基于用户输入在选定的风格模型中进行内容生成。

     

    网易游戏雷火音频设计专家 付明铭

    大会已落幕

    技术分享从不止步

    2021 “眼界大开 声临其境”网易首届音视频技术大会已圆满落幕。大会上,来自音视频各个细分领域专家们的精彩演讲,为行业实践与应用提供了切实可行的技术方案,也为行业发展提供了新的思考和见解,指引着未来技术方向和发展趋势。

    大会已经落幕,技术共享从不止步。讲师们的真知灼见吸引了超过5.4万人次观看,并广受观众认可。为方便观众重温回顾,促进技术交流共享,演讲视频将陆续发布于实践者沙龙、云商会、MCtalk、Bilibili 等平台,相关内容文章也将陆续发布于“网易智企技术+”微信公众号,敬请各位关注。

    扫描下方二维码,关注微信公众号,获取更多资讯~~

    网易智企技术+公众号

    网易智企公众号

    网易云信公众号

  • 相关阅读:
    Java操作PDF之iText超入门
    Bootstrap 总结
    使用iframe框架后的页面跳转时目标页面变为iframe的子页面的问题
    Alluxio/Tachyon如何发挥lineage的作用?
    (转载)Zab vs. Paxos
    mysql批量数据导入探究
    读技术性文本的技巧
    Spark设计思想浅析
    MapReduce调优总结与拓展
    MapReduce 计算模式
  • 原文地址:https://www.cnblogs.com/wangyiyunxin/p/15217521.html
Copyright © 2020-2023  润新知