• 首页 > 新兴 > 热点>正文
  • AI让远程交流“更清晰”:GAN消除视频通话中的抖动

  • 2020-10-22 14:32:22
  •   NVIDIA Maxine是一款云AI视频流平台,将使用GAN来提高带宽性能

    图片4.jpg

      Ming-Yu Liu 和Arun Mallya 正在进行视频通话,其中一个人的画面开始出现卡顿,直至画面定格。

      这是一种常见且令人反感的情况。但与大多数人不同的是,Liu和Mallya可以做出一些改变。

      他们是NVIDIA的AI研究人员,专攻计算机视觉。在与Ting-Chun Wang共事中,他们意识到可以使用神经网络来替代被称为视频编解码器的软件,这种软件通常用于视频在网络传输过程中的压缩和解压缩。

      迄今为止,他们的工作成果将用户在视频通话时所需的网络带宽压缩至原来的十分之一,还有望将带宽消耗降低数个数量级。

      Mallya表示:“我们希望通过AI提供更好的视频沟通体验,即使在带宽极低的情况下,也可以从语音升级到视频通话。”

      GAN让连接质量更佳

      即使用户的面部有遮挡(比如戴着帽子、眼镜、耳机或口罩),这项技术同样适用。为了增加趣味性,他们在演示中使用了一些装饰物,这样用户可以在线上更改其发型或衣服或者创建头像。

      更重要的是,如上图所示,借助神经网络定位,无需再盯着显示器上方摄像头才能与对方对视,这增强了面对面对话的感觉。

      Wang表示:“借助计算机视觉技术,我们可以从多个角度来定位头部。我们认为这将帮助人们更自然地进行对话。”

      迎接最前沿的AI技术,让虚拟生活更真实。

      AI赋能视频通话的原理

      AI辅助视频通话的工作机制十分简单。

      与目前使用压缩的视频流的系统类似,参考图像发送后,仅用户眼睛、鼻子和嘴巴周围几个关键点的位置数据被发送,而非发送大量压缩过像素的图像。

      接收端的生成式对抗网络通过初始图像和面部关键点,在本地GPU上重构后续图像。因此,通过网络传输的数据要比之前少得多。

      Liu在GAN领域的工作成果GauGAN曾引发关注。GauGAN是一种可以将涂鸦转化为写实艺术作品的AI工具,目前已经创建了超过一百万张图像。该工具可在AI Playground中获取。

      Liu表示:“疫情期间频繁的视频会议启发了我们,因此我们开始探索突破带宽瓶颈的方式,让供应商可以同时为更多人提供服务。”

      GPU突破带宽瓶颈

      这一方法顺应当前行业趋势,将网络瓶颈转化为计算任务,从而借助本地或云端资源更轻松地解决此类问题。

      NVIDIA媒体集团高级产品总监Andrew Page表示:“如今,许多公司希望将带宽问题转化为计算问题,这是因为带宽一般很难增加,而增强算力则相对容易。”

    图片5.jpg

      NVIDIA Maxine搭配了一套视频会议和流媒体服务工具

      AI 工具优化视频服务

      GAN视频压缩是NVIDIA Maxine即将推出的几个功能之一,这是一个云AI视频流平台,用于增强视频会议和电话质量。它将音频、视频和对话式AI功能整合在一个工具包中,并支持多种设备。

      在上周的GTC大会上,NVIDIA宣布推出了Maxine平台。基于该平台,服务提供商能够在提供超高分辨率的视频的同时,实现实时翻译、噪声消除和情景感知的闭路字幕。用户可以享受到人脸校正、虚拟助手和化身逼真的动画角色等功能。

      Page表示:“视频会议正在经历一场复兴。疫情期间,它的缺点给所有人带来了不愉快的使用体验,但回归视觉动物的属性,视频终将成为人们今后生活中的一部分。”

      通过利用基于Tensor Core核心的NVIDIA GPU,Maxine可运行如NVIDIA Jarvis的软件。NVIDIA Jarvis是用于对话式AI的SDK,提供了一套语音和文本功能。 它们共同提供了当今有用的AI功能,并成为未来视频产品和服务的基石。

    图片6.jpg


    免责声明:科技狗对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。 本网站转载图片、文字之类版权申明,本网站无法鉴别所上传图片或文字的知识版权,如果侵犯,请及时通知我们,本网站将在第一时间及时删除:yzl_300@126.com

    延伸阅读:

  • 空气也如此艺术:CLIVET中央空调联袂《时尚家居
  • 从科技精英到人文自然 COLMO这一次让人“例
  • 小天鹅策动波轮洗衣机新革命 OTT技术获行业
  • 高质量发展势头正猛 量子之歌二季度营收7.864
  • 科华数据:以自主核心技术构筑算力平台底座
  • BOE(京东方)柔性OLED获评2020 IFA创新显示技
  • 云际视界:科技提速 积极助推营商环境优化
  • CES 2020前瞻:三星电子将展出可以“变身”的冰
  • 卡儿酷重磅推出重卡启停锂电、重卡救星,革新重卡配
  • A家爆款笔记本齐聚ChinaJoy,元气偶像助阵嗨翻全场
  • 全球“芯”荒?松下洗衣机一点都不慌
  • 客必得 | 发布预订服务管理系统4.0版 再定义餐饮
  • 集呈科技官方网站上线内测 开启社群电商5.0新风向
  • 虹星科技:快速非接触式测温+高精度身份识别助力抗
  • “夺冠”镜头下的小尺寸黑白电视,如今终于变成大屏
  • 十大远程控制软件排名,哪个是你最常用?
  • 主编推荐 ...
  • 东来也孙道军:不是每一只国潮鹅,都可以叫“鹅小天”...

  • TCL携智慧科技产品重磅亮相,UDE成“最佳Show场”...

  • 美的洗衣机与联合利华达成战略合作 共领未来家庭洗护新生...

  • 今日焦点
    滚动新闻 ...
    新闻排行 ...
    关于我们 |   科技狗简介 |   法律声明 |   广告刊例 |   联系我们
    © 2014-2020 科技狗版权所有   E-mail:yzl_300@126.com
    科技狗 |  techdog.cn  |   粤ICP备2020076861号