为什么人类会在很长一段时间内继续击败机器人在语音识别方面？-西泽读留学

在很长一段时间内，人类将击败机器在语音识别方面。想象一下，Siri总是能够准确理解你，谷歌翻译完美无缺，它们两个共同创建出类似《神秘博士》中翻译电路的东西。想象一下，能够随时自由交流，无需在巴黎餐厅用法语低声说话。这是一个吸引人的前景，但仍然遥不可及。推动这个现实的瓶颈之一是语言变化，特别是口头语言。技术无法完全应对。另一方面，人类在处理语言变异方面表现得惊人出色。我们非常擅长处理语言变异，事实上，当事情偶尔出错时，我们确实会非常注意。我在新西兰访问时，有一段时间以为人们在叫我“宝贝”，这是类似于纽卡斯尔的亲昵称呼。事实上，他们只是在说我的名字，Pat。我的“恍然大悟”发生在一家咖啡店（“宝贝的平白！”让我停顿了一下）。这个故事说明了英语不同口音存在略微不同的元音——这是一个众所周知的事实。但让我们试着理解当我听错了新西兰人把Pat发音为“宝贝”时发生了什么。我们将元音与一定范围的声音相关联，比如a或e。这些范围不是绝对的，它们的边界会因不同的口音而变化。当听众无法调整这一点时，就像我在这种情况下所做的，声音与意义的映射就会出现扭曲。可以费力地教导语音识别系统不同的口音，但口音的变化只是冰山一角。元音的发音也可能会受到我们的年龄、性别、社会阶层、种族、性取向、醉酒程度、说话速度、与谁交谈、是否处于嘈杂环境等诸多因素的影响...这个列表就不断延伸。...；这也说明了语言变异的另一个重要特征：它在不断变化。因此，语言研究人员不断需要审查对变体的理解，这又需要不断获取新数据并更新分析。语言学领域的这种做法正在被新技术、仪器数据分析的进步以及录音设备（2018年，英国成年人口中82%拥有一个录音设备，也就是智能手机）的无处不在所改变。现代语言学项目可以从各种技术进步中获益。比如，英语方言应用程序通过智能手机远程收集录音，以建立一个庞大且持续更新的现代英语口音语料库。这一语料库也是关于北部英国发音中crux的调查结果的来源，例如。通过从这个和许多其他项目中积累信息，让我们能够更全面地跟踪变异，并建立更精确的模型来预测个别音素的实现。这种新精细的语言理解是否也能改进语音识别技术？也许可以，但为了改进，技术需要更多了解你的信息。

这篇文章来自 The Conversation，根据创意共享许可证重新发布。原文请查阅原始文章。

为什么人类会在很长一段时间内继续击败机器人在语音识别方面？

相关快讯