• 首页 > 快讯>正文
  • 亲爱的,你已经连阅读理解都做不过AI了

  • 来源: 脑极体 2018-01-15 09:34:59
  •   提起阅读理解这四个字,你会想到什么?

      被四六级雅思托福支配的恐惧?语文试卷上连原作者都搞不懂的选择题?

      不管哪种答案,肯定都逃不出一个规律:进行阅读理解这项有益身心运动的主体,必然是跟你我一样的人类。

      毕竟嘛,这东西堪称考试中最费脑筋,也最考验综合能力的一个环节。所以你的英语老师一定说过这样一句话:得阅读理解者得天下。

      然而,可是,但是,如果告诉你今天得这个天下的已经不再是人类,而是AI了,你会怎么想?可事实就是这样,1月11日,斯坦福大学著名的机器阅读理解赛事SQuAD刷新了全球排名,令人惊奇的是阿里巴巴凭借82.440的精准率打破了世界纪录。最重要的是,这个成绩超越了人类82.304的平均得分,正式宣布AI在精准阅读能力上超越了人类。

      当然了,AI是不会去跟你比托福刷分的。但AI通过机器阅读理解,撬动理解力这扇大门开启,意义也远远不是测试和排名所能概括的。国外网友和AI从业者,面对这个中国公司完成的壮举纷纷脱帽致敬,将其列为2018伊始AI的重要突破,卡内基梅隆发现计算机科学学院机器人研究所的研究教授Jeff Schneider等等业界大牛也对阿里团队表示了致敬。

      所以说,机器做阅读理解这件事的背后,脑洞有点大哦…

      什么是机器阅读理解?

      机器阅读理解,虽然看起来只是让AI上阵来一场考试。但是却是自然语言处理技术中,继语音判断、语义理解之后最大的挑战:让智能体理解全文语境。所以这个领域的“跑分”,一直是AI界的大事件。

      而斯坦福大学发起的SQuAD挑战赛,则是业内公认的机器阅读理解最高水平赛事,甚至可以说是标准水平测试。其参赛者来自全球学术界和产业界的研究团队,比如我们耳熟能详的微软亚洲研究院、IBM、Facebook、谷歌以及卡内基·梅隆大学、斯坦福大学等等。

      SQuAD挑战赛的基本规则,是通过众包的方式构建一个包含10万个问题左右的大规模数据集,并给出来源于维基百科长度大约在几百个单词左右的文章。参赛者提交的AI模型在阅读完数据集中的一篇短文之后,回答若干个基于文章内容的问题,答案与标准答案进行比对,最终得出成绩。

      这项测试的得分,包括确匹配(Exact Match)和模糊匹配(F1-score)两项结果,这次阿里巴巴提交的模型,在精准匹配领域超越了人类的得分能力。模糊匹配还差2.5分,但是也已经比较接近。

      由于阅读理解这项“智能”调整,需要运用到大量逻辑、细节和结构分析能力,并且直接作用于现实中的文本资料,所以实际价值巨大。

      比如说,我们首先要面对的问题就是,假如人工智能已经比人类平均水平更擅长在对文本中精准信息进行理解和回答,会带给我们什么呢?

      当AI的“阅读理解”得分超越人类,意味着什么

      如何理解阿里的AI阅读理解能力,超越人类得分的价值呢?

      举个例子或许可以很简单的理解这个问题:英语考试上,当机器可以翻译单词的时候,我们一点都不惊奇;但机器可以听写整句话的时候,我们会感叹技术进步了;当机器自己做阅读理解的时候,我们大概会想:还要我考这个试干什么?

      这里面的差别,在于处理阅读理解相关问题时,AI不只是要运算和记录,而是要主动去分析和理解,所以阅读理解问题一直被人问是NLP的标志性临界点。但这个点被AI破解,直接意味着很多必须人类才能完成的工作已经正式能够被AI接管。

      因为阅读理解问题处理和关注词汇、语句、篇章结构、思维逻辑、辅助语句和关键句等等元素构成的复杂组织网络。

      当超越人类均值这个时刻真正到来,或许意味着在语言交互领域,机器智能将可以从感知应用向着理解应用进发。从学术到产业应用的角度讲,背后都有无数种可能蔓延开来。

      最直接的产业影响,是大多数今天还必须由人工完成的规则、对话、服务信息类的相关理解工作,都可以被人工智能所取代。比如说客服、信息管理和推荐类的工作,都可以考虑用不眠不休、高运算速度的机器来取代。

     2    1 2 下一页 尾页

    免责声明:科技狗对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。 本网站转载图片、文字之类版权申明,本网站无法鉴别所上传图片或文字的知识版权,如果侵犯,请及时通知我们,本网站将在第一时间及时删除:yzl_300@126.com

    延伸阅读:

  • 武汉:五一未至旅游先火 麦德龙自有品牌悄然热
  • 网御星云荣膺行业信息化数字政务创新成果奖
  • 中企通信数据科学与创新团队 荣获“第三届阿
  • 科技与自然共生长 COLMO携例外开启高端衣物
  • 助力构建全民终身学习型社会 量子之歌领跑成
  • 双“展”齐上!中广亮相山西供热展、河北教装
  • 沈阳年轻人消费更理性 麦德龙自有产品受认可
  • 第五届中国金融年度品牌案例大赛圆满落幕, 联
  • 智林机器人亮相第32届广州国际大健康产业博览会
  • 行车记录仪存储卡如何选 耐久防护容量速度都重要
  • 吸尘拖地两用 扫拖一体机会是扫地机器人发展方向
  • 500GB和1TB不同容量的NVMe固态硬盘:性能相差为什么
  • ChatGPT4.0 来了,远传科技如何助推场景化落地
  • Yeelight易来推出子品牌“凌动”,全面渗透用户智能
  • 讲真周年庆典活动在京举办 商羽荣获年度优秀讲师
  • 光启,来自未来 改变世界------光启技术研究报告
  • 主编推荐 ...
  • 东来也孙道军:不是每一只国潮鹅,都可以叫“鹅小天”...

  • TCL携智慧科技产品重磅亮相,UDE成“最佳Show场”...

  • 美的洗衣机与联合利华达成战略合作 共领未来家庭洗护新生...

  • 今日焦点
    滚动新闻 ...
    新闻排行 ...
    关于我们 |   科技狗简介 |   法律声明 |   广告刊例 |   联系我们
    © 2014-2020 科技狗版权所有   E-mail:yzl_300@126.com
    科技狗 |  techdog.cn  |   粤ICP备2020076861号