— 2025/07/11
目前,许多视障人士在独立出行时常常感到犹豫,因为他们不清楚陌生环境中的具体情况。尽管已有一些工具如微软的Soundscape应用,能够提供现场环境的描述,但这些工具主要是在用户现场使用时进行的,而非提前准备。因此,视障人士在出行前所获得的地标和导航信息,往往无法满足他们对环境背景的需求。
SceneScout的诞生正是为了填补这一空白。该人工智能代理能够让视障人士在实际出行前就对目的地环境有充分的了解,大大提升了他们独立出行的信心和安全性。
SceneScout是一款由多模态大型语言模型驱动的人工智能代理,具有两种主要功能模式。其中,"路线预览"模式能够提供关于沿途可见元素的详细描述,比如提醒用户在转弯处注意路旁的树木等触觉元素,为用户提供具体的导航参考点。
而"虚拟探索"模式则允许用户在街景图像中自由移动,获取更直观的环境信息。这一创新功能使用户能够像在现实中一样"行走"在虚拟街景中,提前熟悉路线和环境特征,为实际出行做好充分准备。
在用户研究中,参与者表示SceneScout极大提升了他们对环境的认知,因为这款人工智能能够获取他们无法通过现有工具获取的信息。该研究表明,SceneScout的描述准确率高达72%,对于稳定的视觉元素,准确率更是高达95%。
然而,参与者也提出了一些改进建议,比如提供个性化的描述,或者将描述的视角调整至更符合行人的位置。这些反馈为SceneScout的进一步优化提供了宝贵的方向指引。
此外,参与者希望SceneScout能够实时提供街景描述,以便与他们的行走位置同步,甚至可以通过骨传导耳机在用户移动时提供视觉信息。利用设备中的陀螺仪和指南针,SceneScout还可以指向环境中的细节,进一步提升使用体验。
专业分析认为,这些功能的实现将使SceneScout从静态的环境描述工具进化为动态的实时导航助手,为视障人士提供更加全面和便捷的出行支持。
虽然这篇论文并不代表苹果一定会推出相关产品或服务,但它为我们提供了一个了解苹果在这项技术应用方面的视角。未来,结合人工智能和实时数据,苹果或许能够为视障人士创造出更多便利的工具。
业内专家指出,SceneScout的研发体现了科技企业对无障碍技术的重视,也展示了人工智能技术在解决特殊群体需求方面的巨大潜力。随着技术的不断完善和应用场景的扩展,类似的创新解决方案有望为更多视障人士带来便利,推动社会无障碍环境的建设。