据外媒VentureBeat报道,谷歌高级研究员杰夫·迪恩(Jeff Dean)日前在人工智能前沿峰会(AI Frontiers)上表示,自2012年以来,谷歌已经把语音识别的词错率(WER)降低了30%以上。词错率指的是谷歌将一个词语从语音转录成为文字时的错误率。

谷歌把语音识别词错率降30%(图片来自baidu)
迪恩称,词错率的下降得益于神经网络的使用,后者是谷歌和其他公司在深度学习中使用的一种系统。研究人员使用大量数据对神经网络进行训练,例如语音片段,然后让他们对新数据作出推断。谷歌在2012年首次将神经网络用于语音识别中,当时正值“果冻豆”Android系统发布。谷歌并不是经常讨论公司在语音识别技术上取得的进展,该技术影响着越来越多的谷歌产品,从Google Home智能音箱到Gboard输入法。
在2015年,谷歌CEO桑德加·皮查伊(Sundar Pichai)曾表示,谷歌的语音识别词错率为8%。另外,苹果Siri资深总监亚历克斯·阿赛洛(Alex Acero)在去年8月称,Siri在所有语言中的错误率降低了两倍,许多情况下超过两倍。
微软则在去年9月份表示,研究人员已经将词错率降至6.3%。国内百度也表示,当前百度的Deep Speech 2错误率仅为3.7%。


2025食品级润滑油哪个牌子好?从安全认证到性能表现全面解析
AI赋能安全生产 热烈祝贺省重点研究课题在安生股份成功召开
美国倍捷再度亮相韩国首尔国际航太防务展(Seoul ADEX)
赋能MCU AI,安谋科技发布“星辰”STAR-MC3



慧聪电子网微信公众号
慧聪电子网微信视频号
精彩评论