对于聋哑人来说,火车旅行可以是一种赌博——人工智能驱动的澳大利亚化身可以提供帮助

2025-10-28 00:38来源:本站

  

  train travel

  对聋人来说,坐火车旅行可能是一场赌博。一般来说,每天都不会出什么差错:他们赶火车去目的地,继续做生意。

  但当一些不寻常的事情发生时,情况很快就会变得可怕,因为大多数更新都是通过音频公告来传递的。一个聋哑的旅客可能会因为火车被移到了另一个站台而错过火车,或者因为火车今天没有停在那里而眼睁睁地看着他们的车站呼啸而过。在紧急情况下,他们也可能在其他人都撤离后仍留在火车车厢里,必须由车站工作人员救出。

  这些例子中的每一个都是来自悉尼聋人的真实生活经历。但我和我的同事正在与悉尼火车公司和澳大利亚聋人社区的成员合作,开发一种先进的、人工智能(AI)驱动的手语化身,它可以自动将音频广播翻译成澳大利亚语。

  我们在角色上的工作也朝着下一步发展:开发能够“理解”澳大利亚语的AI系统。

  今年早些时候,我和我的同事在悉尼对三名聋人火车乘客进行了一项试点研究。除了他们分享的关于火车旅行中可能出现的问题的故事外,我们还了解到他们使用久经考验的策略来使旅程顺利进行。

  他们的策略对普通通勤者来说可能很熟悉。例如,他们会用应用程序计划行程,提前到达,并寻找指示牌,让他们知道是否有什么变化。

  但他们也表示,他们觉得自己需要站在信息屏幕附近观看最新消息,并在情况发生变化时向车站工作人员或其他乘客询问信息。他们还报告说,他们在火车上非常警惕,注意确保他们没有坐过站。

  但这些策略并不总能确保聋人旅行者获得重要信息,包括紧急情况。例如,虽然通常会提供帮助,但电台工作人员有时太忙而无法提供帮助。

  最令人沮丧的是,其他乘客不愿意或不能提供信息,让我们的聋人旅行者只能“随波逐流”。这通常意味着在错误的地方结束。

  语音转文本软件似乎是解决其中一些问题的简单方法。但对于许多聋人来说,英语不是他们的母语,而澳大利亚语处理起来要容易得多,也快得多。

  我们的聋人旅行者告诉我们,在一个完美的世界里,他们需要现场翻译。然而,使用在站台或火车屏幕上显示的签名虚拟形象进行自动、人工智能翻译,可以识别音频公告中的关键词,生成具有正确澳大利亚语法的句子,并将我们的词汇库中的相应符号拼接在一起,这有很多原因。

  首先,它允许使用已知词汇的公告进行实时翻译,这与火车和车站上下文中相关,其中许多公告涵盖类似的主题。

  其次,角色及其手势可以根据特定情况进行定制,例如使用屏幕位置信息来确保角色在指出出口或其他平台时指向正确的方向。

  第三,多个签名者可以为虚拟角色的词汇提供符号,然后这些符号可以顺利地拼接在一起,形成一个句子。

  更重要的是,虚拟形象意味着公司自动生成的公告中不需要真人作为“面孔”。这一点尤其重要,因为澳大利亚聋人社区规模小,关系密切,如果翻译出了问题,没有人会受到任何声誉损害。

  从技术角度来看,头像还允许我们确保签名的最低质量阈值。我们使用动作捕捉来确保词汇库中的每个手势都是准确的,动作是清晰的。

  它还能帮助我们避免“恐怖谷”——一种让人感到不安的现象,这种现象与人类相似,但却有细微的错误。我们不想看到任何你最近看到的由人工智能生成的多指怪物。

  这项工作是我们创建一个可以理解澳大利亚语的人工智能系统的更广泛目标的一步。这种人工智能可以用来帮助聋人和听力正常的车站工作人员交谈,或者创建“聊天机器人亭”或基于应用程序的助手,让聋人在澳大利亚按需获得有关火车旅行或其他日常任务的信息。

  世界各地的手语和聋人文化有细微差别和复杂性,听力研究人员和人工智能开发人员可能没有意识到这一点。这些细微差别和复杂性必须嵌入到新技术中,研究人员和开发人员必须采取语言优先的方法来收集和设计人工智能数据,而不仅仅是针对聋人。

  只有这样,人工智能才能满足聋人的真正需求:确保他们在日常生活的各个方面的安全和独立。

  公司提供

  nversation

  本文转载自The Co在知识共享许可下的对话。阅读原文。The Conversation

  引用:对于聋哑人来说,火车旅行可以是一个由赌博人工智能驱动的澳大利亚化身可以帮助(2024,10月17日

  作品受版权保护。除为私人学习或研究目的而进行的任何公平交易外,未经书面许可,不得转载任何部分。的有限公司

  内容仅供参考之用。

打卡网声明:未经许可,不得转载。