Be My Eyes利用GPT-4处理视觉障碍

丹麦初创公司Be My Eyes利用GPT-4技术开发了一款虚拟志愿者应用程序,旨在帮助250多万视力障碍者解决日常生活中的各种问题。该应用程序可以识别图像、生成文字描述并提供有关事物的上下文信息,例如冰箱里的食品成分或购物网站的搜索结果。Be My Eyes将这一创新称为视觉无障碍性的“游戏改变者”,并表示其具有巨大的商业潜力。

Be My Eyes利用GPT-4改变了视觉无障碍

自2012年以来,Be My Eyes一直致力于为超过2.5亿盲人和视力低下人士创造技术。这家丹麦初创企业通过将视力低下的人与志愿者联系起来,帮助他们完成数百个日常生活任务,例如识别产品或在机场导航。

凭借GPT-4的新视觉输入功能,Be My Eyes开始在其应用程序中开发GPT-4动力虚拟志愿者,它可以产生与人类志愿者相同的上下文和理解水平。

“在我们拥有这项技术的短时间内,我们已经看到了无与伦比的表现,超越了所有现有的图像转文本物体识别工具,”Be My Eyes的CEO迈克尔·巴克利说。“这对全球无障碍性的影响是深远的。在不久的将来,盲人和视力低下的人群将利用这些工具不仅满足其各种视觉解释需求,而且在生活中获得更大的独立性。”

现在,GPT-4技术不仅可以识别和命名冰箱中的物品,还可以推断和分析这些配料能做哪些菜,并提供一个好的食谱。使用情况几乎没有限制。

行业洗牌

“这是一场改变游戏规则的变革,”巴克利说。“最终,无论用户想要什么或需要什么,他们都可以重新提示工具以获得更多可用、有益和有帮助的信息。”

Be My Eyes的CTO杰斯珀·赫维林·亨利克森解释说,GPT-4与其他语言和机器学习模型的不同之处在于它既具有对话的能力,又提供了更高的分析能力。他说:“基本的图像识别应用程序只告诉你面前有什么。它们不能进行讨论,以理解面条的配料是否正确或者地上的物体不仅仅是一个球,而是一个绊倒的隐患,并传达这些信息。”

现在,Be My Eyes已经有了一个案例,用户能够穿越铁路系统,并获得详细的位置和如何安全地到达目的地的指令,这对于视觉障碍者来说是一个几乎不可能的任务。

然而,理解屏幕上的内容对于视觉障碍者来说可能是两倍的努力。嵌入在大多数现代操作系统中的屏幕阅读器会按行、按段读取网页或桌面应用程序的内容,朗读每个单词。然而,网络上的图像是交流的核心,这可能更糟糕。

但是,亨利克森说,现在他们能够向GPT-4展示网页,并且经过深度学习算法的训练,GPT-4能够建立关系,理解网页上“重要”的部分,选择要读取或总结的部分。这不仅可以简化阅读新闻之类的任务,而且赋予需要视觉帮助的人们访问网络上一些最混乱的页面:购物和电子商务网站。GPT-4能够总结搜索结果,就像有视力的人自然扫描一样,而不是读取每个微小的细节,并帮助需要视力支持的人在实时中做出正确的购买决策。

“这对人类来说是一个极好的发展,”巴克利说,“但它也代表了一个巨大的商业机会。”

此文章由OpenAI开源维基百科原创发布,如若转载请注明出处:https://openai.wiki/news-be-my-eyes-gpt-4.html

(0)
上一篇 2023-03-15 01:41
下一篇 2023-03-16 01:46

相关推荐

  • 爱情的未来:和AI谈恋爱

    随着科技的不断进步,人工智能技术也在不断发展。其中最新的应用之一就是和AI谈恋爱。这种恋爱方式利用智能机器人和人工智能技术,让人们可以与AI建立情感联系。本文将探讨和AI谈恋爱的背景、形式以及发展前景。

    AI快讯 2023-02-15
    00650
  • 关于GPT-4全部资讯汇总

    近日关于 ChatGPT 技术的体验以及对 GPT-4 技术发展的资讯总结 ChatGPT 已成为他工作中不可或缺的一部分,可以提高生产效率 20 倍以上。 GPT 技术会深刻改变人类的学习、教育和工作方式,但同时也指出,这项技术不会降低知识的门槛,如果一个人并不熟悉某个领域,指望 ChatGPT 就无济于事。

    AI快讯 2023-03-16
    002.0K
  • GPT-4模型将于3月17日公布

    GPT-4是OpenAI开发的第四代大型语言模型,将是一个多模态模型,将提供完全不同的可能性,例如文字转图像、音乐甚至视频。GPT的全称是Generative Pre-trained Transformer,是一种使用人工神经网络的深度学习技术,能够使机器像人一样聊天交流并进行创作。

    AI快讯 2023-03-13
    001.8K
  • AI自动生成3D模型和场景

    Physna公司三名工程师组成的团队,在两周的时间内用8000个模型数据集创建生成的一个AI原型。 而这恰恰是Physna的优势,Physna有世界上最大的带标签的3D数据库。接下…

    AI快讯 2022-12-10
    00560
  • DeepSeek开源第四弹:梁文锋与AI训练革新

    DeepSeek发布开源第四弹,两项突破性技术亮相,梁文锋亲自参与开发。DualPipe实现前向与反向计算并行,EPLB优化专家负载分配,为大模型训练提速降耗注入新动能。

    AI快讯 2025-02-27
    00250

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

微信