GPT-4模型将于3月17日公布

GPT-4是OpenAI开发的第四代大型语言模型,将是一个多模态模型,将提供完全不同的可能性,例如文字转图像、音乐甚至视频。GPT的全称是Generative Pre-trained Transformer,是一种使用人工神经网络的深度学习技术,能够使机器像人一样聊天交流并进行创作。

GPT-4:OpenAI的多模态语言模型

GPT-4模型预计将于2023年3月17日公布,参数达到了3.5万亿,创造了新的人工智能语言生成纪录。

GPT-4是OpenAI开发的第四代大型语言模型,将是一个多模态模型,将提供完全不同的可能性,例如文字转图像、音乐甚至视频。GPT的全称是Generative Pre-trained Transformer,是一种使用人工神经网络的深度学习技术,能够使机器像人一样聊天交流并进行创作。

GPT-4是建立在GPT-3之上的,GPT-3于2020年5月发布,迅速成为使用最广泛的自然语言处理模型之一。GPT-4比GPT-3更大更强,能够更准确、更流畅地处理和生成文本。

在GPT-4之前是GPT-3.5,由该模型开发的聊天机器人ChatGPT一经面世,便引爆了AI界的军备竞赛。

多模态或成GPT-4最大亮点

多模态AI不仅可以将文本转化成相应的图像、音乐甚至是视频。微软AI技术专家Holger Kenn和Clemens Sieber对多模态AI的相关功能进行了介绍。根据Kenn的说法,多模态AI不仅能够将文本转化成相应的图像、音乐甚至是视频,还可以将电话呼叫的语音直接记录成文本,从而节省时间和成本。根据估算,该功能能为微软位于荷兰的一家大客户节省500个工作小时/天。这项技术已经发展到基本上“适用于所有语言”,也就是说“可以用德语提问,然后用意大利语得到答案”。

GPT的演变历史

在GPT系列模型推出之前,传统的NLP模型都是针对特定任务(如分类、翻译等)进行训练的,并且往往使用监督学习,这导致了两个问题:缺乏大量的标注数据,模型也无法概括和泛化任务。

GPT-1是OpenAI在2018年推出的,模型参数数量为1.17亿,通过未标注的数据训练出一种生成式语言模型,再根据特定的下游任务进行微调,将无监督学习作为有监督模型的预训练目标。

时隔一年后,2019年具有15亿参数的GPT-2出现。与GPT-1相比,GPT-2在结构上并没有太多创新与设计,使用了更大的数据集和更多的模型参数进行训练,以此强化并提高模型性能。

2020年,GPT-3的参数量翻了100倍,达到了1750亿,其预训练数据量也高达45TB。事实证明,海量参数确实让GPT-3具备了更强大的性能,它在下游任务表现得非常好。即便是复杂的NLP任务,GPT-3也表现出惊人的能力,可以模仿人类写作,编写SQL查询语句、React或JavaScript代码等。

2022年初,OpenAI推出了全新的InstructGPT模型,只有13亿参数,但效果比GPT-3更好。InstructGPT能根据用户的反馈数据进行训练。

ChatGPT是由GPT-3.5系列中的模型微调而成的聊天机器人。自从去年11月发布以来,ChatGPT迅速走红全球。根据Similarweb的测算,其访问量已经从1月的6.16亿达到了目前的超过10亿。

ChatGPT API是OpenAI在3月1日发布的,它是GPT-3.5-turbo模型的API,每1000个tokens仅售0.002美元,相当于每输出100万个单词,价格才2.7美元(约合18元人民币),比现有的GPT-3.5模型便宜10倍。

关于GPT-4,OpenAI的首席执行官Sam Altman近期接受媒体采访时直接否认了一些传言,比如GPT-4可能会使AGI有和人类一样的意识。Altman强调,GPT-4是一次进化,而不是一项革命性的技术。ChatGPT的下一个版本不会是AGI,也不会有100万亿个参数。但是,OpenAI的首席技术官Mira Murati认为,GPT-4可能会为人们拓宽发展机会。

总之,GPT系列模型是目前自然语言处理领域最强大的预训练语言模型之一,已经在NLP任务中取得了显著的成就。随着技术的不断进步,我们可以期待GPT-4带来更多的创新和突破,为AI技术的未来发展提供更多可能性。

此文章由OpenAI开源维基百科原创发布,如若转载请注明出处:https://openai.wiki/news-gpt4model-317.html

(0)
上一篇 2023-03-11 21:09
下一篇 2023-03-14 13:19

相关推荐

  • OpenAI 推出 ChatGPT 支持联网插件集功能

    OpenAI发布了ChatGPT插件集,这些插件可以将ChatGPT连接到第三方应用程序中,从而为ChatGPT带来更广泛的应用场景和功能。这些插件能够让ChatGPT连接到最新的互联网检索实时信息。

    AI快讯 2023-03-24
    002.7K
  • 月之暗面发布MoBA注意力机制技术解析:长文本处理效率革新

    月之暗面最新论文提出MoBA注意力机制,通过动态块稀疏注意力与混合专家技术结合,显著提升长文本处理效率。实验显示,该架构在保持性能的同时,计算速度提升6.5倍,支持百万级上下文处理。本文深度解析其技术原理、实验表现及行业影响,为AI模型优化提供新思路。

    AI快讯 2025-02-23
    00821
  • ChatGPT-4 将于下周发布

    随着科技的不断进步,人工智能已经成为我们日常生活中不可或缺的一部分。近年来,自然语言处理技术已经取得了突破性进展,从GPT-1到GPT-3,每一代的模型都为AI领域的发展带来了新的里程碑。而GPT-4的出现更是为我们带来了更多的惊喜,它引领了AI多模态模型的革命。

    AI快讯 2023-03-10
    001.2K
  • 微软耗数亿美元建超级计算机

    近日,微软宣布投入数亿美元建造一台超级计算机,旨在为 OpenAI 的 ChatGPT 提供支持,开展人工智能(AI)研究。这台计算机采用最先进的硬件和软件技术,其处理速度是现有计算机的数十倍,将极大地促进 OpenAI 在聊天机器人领域的研究进展。本篇文章将分别从以下三个方面阐述这一重大的 AI 合作项目。

    AI快讯 2023-03-14
    00978
  • OpenAI推出积分制订阅:ChatGPT商业模式重大调整

    OpenAI颠覆性调整:ChatGPT订阅转向积分制,用户需为GPT-4.5与Sora“买单” 2024年5月5日,OpenAI CEO Sam Altman在社交平台X宣布,Ch…

    AI快讯 2025-03-05
    001.4K

发表回复

登录后才能评论
微信