• 首页 > 快讯>正文
  • 谷歌称语音合成系统Tacotron 2已达人类说话效果

  • 作者: NT 来源: 3DMgame 2017-12-28 12:03:23
  •   众所周知,谷歌近年来在人工智能领域进行了大量实验。今天,谷歌在这个领域中又前进了一步。谷歌方面宣称,旗下AI驱动语音合成系统Tacotron 2的最新版本已经基本达到人类说话的效果。谷歌还上传了一些Tacotron 2的语音小样,来让大家体验一下这个最新科技。

      Tacotron 2是谷歌的第二代语音文字转换技术,结合了两大深度神经网络,实现了近乎完美的输出效果。第一层神经网络负责将文字转化为频谱图(pdf),用视效来渲染声音频率。转换为频谱图之后,将其提交给WaveNet,也就是由Alphabet的AI研究实验室DeepMind开发的系统。WaveNet读取频谱图表,并生成与之相近的声音元素。

      语音文字转换技术当然不是什么新科技了。但谷歌方面宣称其文字转换语音技术高于市面上大部分类似的技术,并与人类发音几无二致。

      Tacotron 2的发音将与上下文进行结合,有别于现在市面上一个词一个词蹦的朗读方式。另外该系统还会对标点符号作出反应,并会对句子中的大写单词进行强调。

      玩家想要体验这段对比音频的话,可以点此链接。其中有两段语音小样,而且谷歌并未标明哪一段是由Tacotron 2朗读,哪一段是人类朗读的。但如果你深扒一下文件来源,就能发现哪段音频出自Tacotron 2。

      在听完语音小样并通过源代码模式找到哪段出自Tacotron 2之手之后,我们可以发现谷歌确实交出了一份让人惊叹的答卷。这个声音确实与人类发音非常接近,虽然并不是完全一致,但也已经非常接近。相比市面上那些机器味十足的技术来说已经好了很多。而且我们还能听出文本中的标点以及相应的节奏变换。


    免责声明:科技狗对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。 本网站转载图片、文字之类版权申明,本网站无法鉴别所上传图片或文字的知识版权,如果侵犯,请及时通知我们,本网站将在第一时间及时删除:yzl_300@126.com

    延伸阅读:

  • 武汉:五一未至旅游先火 麦德龙自有品牌悄然热
  • 网御星云荣膺行业信息化数字政务创新成果奖
  • 中企通信数据科学与创新团队 荣获“第三届阿
  • 科技与自然共生长 COLMO携例外开启高端衣物
  • 助力构建全民终身学习型社会 量子之歌领跑成
  • 双“展”齐上!中广亮相山西供热展、河北教装
  • 沈阳年轻人消费更理性 麦德龙自有产品受认可
  • 第五届中国金融年度品牌案例大赛圆满落幕, 联
  • 智林机器人亮相第32届广州国际大健康产业博览会
  • 行车记录仪存储卡如何选 耐久防护容量速度都重要
  • 吸尘拖地两用 扫拖一体机会是扫地机器人发展方向
  • 500GB和1TB不同容量的NVMe固态硬盘:性能相差为什么
  • ChatGPT4.0 来了,远传科技如何助推场景化落地
  • Yeelight易来推出子品牌“凌动”,全面渗透用户智能
  • 讲真周年庆典活动在京举办 商羽荣获年度优秀讲师
  • 光启,来自未来 改变世界------光启技术研究报告
  • 主编推荐 ...
  • 东来也孙道军:不是每一只国潮鹅,都可以叫“鹅小天”...

  • TCL携智慧科技产品重磅亮相,UDE成“最佳Show场”...

  • 美的洗衣机与联合利华达成战略合作 共领未来家庭洗护新生...

  • 今日焦点
    滚动新闻 ...
    新闻排行 ...
    关于我们 |   科技狗简介 |   法律声明 |   广告刊例 |   联系我们
    © 2014-2020 科技狗版权所有   E-mail:yzl_300@126.com
    科技狗 |  techdog.cn  |   粤ICP备2020076861号