财 经 IT | 股 票 房 产 |   中国经济时报电子版
商 业 地 方 | 文 化 汽 车 APP |   中国经济时报数字报

IT新闻

首页 > IT频道 > IT新闻

IBM语音识别软件已接近人类水平

中国经济新闻网 2017-03-13 14:46:54

  [观察者网编译报道]你知道在对话过程中,一个人听错或漏听字词的概率是多少吗?在我们听到的20个词中,普通人一般会听错或漏听1到2个词。这意味着,在5分钟的对话中,你可能会错过80个词。但是,对大多数人来说,这并不会构成沟通障碍。可是,如果和一台电脑对话呢?

  3月7日,IBM宣布说,该公司的语音识别软件的错误率已经降到了5.5%。美国《软件开发时代》3月8日报道说,人类的语音识别错误率大约为5.1%,这意味着,IBM的语音识别软件已经与人类的语音识别能力非常接近。

IBM总裁弗吉尼亚·罗曼提IBM总裁弗吉尼亚·罗曼提

  据美国《商业内幕》3月9日报道,IBM此前曾创造错误率仅为6.9%的语音识别记录,但在2016年,微软宣布其语音识别软件的错误率仅为6.3%。但5.5%并不是IBM的最终目标,IBM也将人类的语音识别错误率5.1%设定为自己的目标。

  “现在还不是庆祝的时候。”《软件开发时代》引用IBM科学家乔治·桑恩的话说,“我们将继续致力于创造一种能够跟得上人类耳朵、声音和大脑的交互相的软件。现在的成果让我们充满动力,未来的工作也会在目前工作的基础上进行,最重要的是,我们想要达到最高的标准。”

IBM早期研究语音识别的科学家IBM早期研究语音识别的科学家

 

  《商业内幕》说,这一突破对智能手机中的人工智能软件,比如Siri和谷歌助手等来说是一个积极信号。

  尽管取得了可喜进步,但这一技术距离识别人类自然对话仍有不小距离。“识别人类的对话依然是一个巨大的挑战,因为人类的对话,特别是自然而然的对话,是非常复杂的。”美国哥伦比亚大学计算机科学系教授朱莉娅·希尔施贝格说。

哥伦比亚大学计算机科学系教授朱莉娅·希尔施贝格哥伦比亚大学计算机科学系教授朱莉娅·希尔施贝格

  尽管因为音调和习惯用语等问题,这一软件识别人类的自然对话尚有一定距离,但对机械朗读的识别程度已经很多。

  此外,IBM介绍说,5.5%低错误率是通过长短期记忆、WaveNet语言模型和三个强声学模型实现的。而这一结果则是使用SWITCHBOARD和CallHome语料库测试得出,具有相当的权威性和业内认同。

来源:观察者网 编辑:蒋帅      
微信公众号

相关阅读

中国经济新闻网版权与免责声明:
    1、凡本网注明“中国经济新闻网”的所有作品,版权均属于中国经济新闻网,未经本网授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的,应在授权范围内使用,并注明“来源:中国经济新闻网”。违反上述声明者,中国经济新闻网将追究其相关法律责任。
    2、凡本网注明“来源:XXX(非中国经济新闻网)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。本网转载其他媒体之稿件,意在为公众提供免费服务。如稿件版权单位或个人不想在本网发布,可与本网联系,本网视情况可立即将其撤除。
    3、如因作品内容、版权和其它问题需要同本网联系的,请在30日内进行。电话:(010)81785256
报纸订阅  关于我们  CET邮箱 
微信公众号
微信公众号
中国经济新闻网 版权所有 未经书面允许不得转载、复制或建立镜像
联系电话:(010)81785256 投稿邮箱:cesnew@163.com wlzx@cet.com.cn
中国经济时报社 地址:北京市昌平区平西府王府街 邮政编码:102209 电话:(010)81785188(总机) (010)81785188-5100(编辑部) (010)81785186(广告部) (010)81785178(发行部) 传真:(010)81785121 电邮:info@cet.com.cn 站点地图 Copyright 2011 www.cet.com.cn. All Rights Reserved
举报
不良信息举报中心
京ICP备07019363号-1       京公网安备110114001037号