Be My Eyes利用GPT-4处理视觉障碍

丹麦初创公司Be My Eyes利用GPT-4技术开发了一款虚拟志愿者应用程序,旨在帮助250多万视力障碍者解决日常生活中的各种问题。该应用程序可以识别图像、生成文字描述并提供有关事物的上下文信息,例如冰箱里的食品成分或购物网站的搜索结果。Be My Eyes将这一创新称为视觉无障碍性的“游戏改变者”,并表示其具有巨大的商业潜力。

Be My Eyes利用GPT-4改变了视觉无障碍

自2012年以来,Be My Eyes一直致力于为超过2.5亿盲人和视力低下人士创造技术。这家丹麦初创企业通过将视力低下的人与志愿者联系起来,帮助他们完成数百个日常生活任务,例如识别产品或在机场导航。

凭借GPT-4的新视觉输入功能,Be My Eyes开始在其应用程序中开发GPT-4动力虚拟志愿者,它可以产生与人类志愿者相同的上下文和理解水平。

“在我们拥有这项技术的短时间内,我们已经看到了无与伦比的表现,超越了所有现有的图像转文本物体识别工具,”Be My Eyes的CEO迈克尔·巴克利说。“这对全球无障碍性的影响是深远的。在不久的将来,盲人和视力低下的人群将利用这些工具不仅满足其各种视觉解释需求,而且在生活中获得更大的独立性。”

现在,GPT-4技术不仅可以识别和命名冰箱中的物品,还可以推断和分析这些配料能做哪些菜,并提供一个好的食谱。使用情况几乎没有限制。

行业洗牌

“这是一场改变游戏规则的变革,”巴克利说。“最终,无论用户想要什么或需要什么,他们都可以重新提示工具以获得更多可用、有益和有帮助的信息。”

Be My Eyes的CTO杰斯珀·赫维林·亨利克森解释说,GPT-4与其他语言和机器学习模型的不同之处在于它既具有对话的能力,又提供了更高的分析能力。他说:“基本的图像识别应用程序只告诉你面前有什么。它们不能进行讨论,以理解面条的配料是否正确或者地上的物体不仅仅是一个球,而是一个绊倒的隐患,并传达这些信息。”

现在,Be My Eyes已经有了一个案例,用户能够穿越铁路系统,并获得详细的位置和如何安全地到达目的地的指令,这对于视觉障碍者来说是一个几乎不可能的任务。

然而,理解屏幕上的内容对于视觉障碍者来说可能是两倍的努力。嵌入在大多数现代操作系统中的屏幕阅读器会按行、按段读取网页或桌面应用程序的内容,朗读每个单词。然而,网络上的图像是交流的核心,这可能更糟糕。

但是,亨利克森说,现在他们能够向GPT-4展示网页,并且经过深度学习算法的训练,GPT-4能够建立关系,理解网页上“重要”的部分,选择要读取或总结的部分。这不仅可以简化阅读新闻之类的任务,而且赋予需要视觉帮助的人们访问网络上一些最混乱的页面:购物和电子商务网站。GPT-4能够总结搜索结果,就像有视力的人自然扫描一样,而不是读取每个微小的细节,并帮助需要视力支持的人在实时中做出正确的购买决策。

“这对人类来说是一个极好的发展,”巴克利说,“但它也代表了一个巨大的商业机会。”

此文章由OpenAI开源维基百科原创发布,如若转载请注明出处:https://openai.wiki/news-be-my-eyes-gpt-4.html

(0)
上一篇 2023-03-15 01:41
下一篇 2023-03-16 01:46

相关推荐

  • 爱情的未来:和AI谈恋爱

    随着科技的不断进步,人工智能技术也在不断发展。其中最新的应用之一就是和AI谈恋爱。这种恋爱方式利用智能机器人和人工智能技术,让人们可以与AI建立情感联系。本文将探讨和AI谈恋爱的背景、形式以及发展前景。

    AI快讯 2023-02-15
    001.0K
  • 豆包自研深度思考模型内测技术解析

    字节跳动旗下AI助手豆包近期启动深度思考模型灰度测试,官方确认该功能采用自主研发技术架构。测试显示模型具备上下文记忆解析能力,通过特定语句可激活思维链展示,目前网页端已实现功能触发,移动端适配仍在推进中。本文解析测试细节与技术特性。

    AI快讯 2025-02-25
    001.8K
  • 苹果5000亿美元技术投资战略解析

    苹果宣布未来四年投入5000亿美元强化本土AI与芯片制造能力,计划新建24座先进工厂及德州AI服务器生产基地,创造2万个高技能岗位。该战略获特朗普公开致谢,标志着美国科技巨头争夺技术主权的关键转折。

    AI快讯 2025-02-25
    00737
  • 【AI测评惊天黑幕】Grok-3陷64次试错争议

    OpenAI实名举报Grok-3基准测试作弊!64次试错VS单次作答,马斯克团队被指误导性对比。深度解析AI测评潜规则,揭秘大模型竞技场不为人知的”数据化妆术”。

    AI快讯 2025-02-22
    00620
  • 百度本周召开「文心一言」发布会

    百度在本周召开了「文心一言」发布会,会上公布了该产品的最新进展。 「文心一言」是百度旗下的一款智能写作辅助工具,旨在为用户提供高效、智能、人性化的写作体验。本次发布会聚焦于该产品的新功能和应用场景,引起了广泛关注和讨论。

    AI快讯 2023-03-14
    001.5K

发表回复

登录后才能评论
微信