为什么人类会在很长一段时间内继续击败机器人在语音识别方面?

发布日期:2025-11-14 09:01:15 阅读:9

在很长一段时间内,人类将击败机器在语音识别方面。想象一下,Siri总是能够准确理解你,谷歌翻译完美无缺,它们两个共同创建出类似《神秘博士》中翻译电路的东西。想象一下,能够随时自由交流,无需在巴黎餐厅用法语低声说话。这是一个吸引人的前景,但仍然遥不可及。推动这个现实的瓶颈之一是语言变化,特别是口头语言。技术无法完全应对。另一方面,人类在处理语言变异方面表现得惊人出色。我们非常擅长处理语言变异,事实上,当事情偶尔出错时,我们确实会非常注意。 我在新西兰访问时,有一段时间以为人们在叫我“宝贝”,这是类似于纽卡斯尔的亲昵称呼。事实上,他们只是在说我的名字,Pat。我的“恍然大悟”发生在一家咖啡店(“宝贝的平白!”让我停顿了一下)。这个故事说明了英语不同口音存在略微不同的元音——这是一个众所周知的事实。但让我们试着理解当我听错了新西兰人把Pat发音为“宝贝”时发生了什么。我们将元音与一定范围的声音相关联,比如a或e。这些范围不是绝对的,它们的边界会因不同的口音而变化。当听众无法调整这一点时,就像我在这种情况下所做的,声音与意义的映射就会出现扭曲。可以费力地教导语音识别系统不同的口音,但口音的变化只是冰山一角。元音的发音也可能会受到我们的年龄、性别、社会阶层、种族、性取向、醉酒程度、说话速度、与谁交谈、是否处于嘈杂环境等诸多因素的影响...这个列表就不断延伸。...;这也说明了语言变异的另一个重要特征:它在不断变化。因此,语言研究人员不断需要审查对变体的理解,这又需要不断获取新数据并更新分析。语言学领域的这种做法正在被新技术、仪器数据分析的进步以及录音设备(2018年,英国成年人口中82%拥有一个录音设备,也就是智能手机)的无处不在所改变。现代语言学项目可以从各种技术进步中获益。比如,英语方言应用程序通过智能手机远程收集录音,以建立一个庞大且持续更新的现代英语口音语料库。这一语料库也是关于北部英国发音中crux的调查结果的来源,例如。通过从这个和许多其他项目中积累信息,让我们能够更全面地跟踪变异,并建立更精确的模型来预测个别音素的实现。这种新精细的语言理解是否也能改进语音识别技术?也许可以,但为了改进,技术需要更多了解你的信息。

为什么人类会在很长一段时间内继续击败机器人在语音识别方面?

这篇文章来自 The Conversation,根据创意共享许可证重新发布。原文请查阅原始文章。