更高效、更有创造力、更不容易出现困扰生成式 AI 的“幻觉”:OpenAI 刚刚推出了 GPT-4,这是为 ChatGPT 提供支持的模型的新版本。 ChatGPT+ 订阅者(每月 20 美元的付费服务)已经可以使用 GPT-4,并且开发者可以通过等待名单来访问,以便通过 API 从中受益。
宣布推出大型多模式模型 GPT-4,在功能和一致性方面取得了有史以来最好的结果:https://t.co/TwLFssyALF pic.twitter.com/lYWwPjZbSg
— OpenAI (@OpenAI)2023 年 3 月 14 日
与 GPT-3.5 的第一个巨大区别:GPT-4 是所谓的“多模态”模型。了解人工智能不仅可以接受文本作为输入(如 ChatGPT),还可以接受与文本相结合的图像。换句话说,它可以分析您在“提示”旁边提交的图像。并得到答案,如下面的屏幕截图所示。 “如果我们割断绳子会发生什么? » 我们可以阅读。 AI 对此回应:“气球会飞走»。
GPT-4 可以在一次查询中吞下 25,000 个单词
这开辟了许多(令人眼花缭乱的)新的可能性。因此,GPT-4 可以分析图形、图表、屏幕截图等。但是请注意,GPT-4 不是 DALL-E:它仅提供文本输出,并且无法生成新图像。
第二个明显的区别:GPT-4 能够处理比以前大得多的请求。 GPT-3 无法处理或多或少 1,024 个单词的输入,GPT-4 将此限制设置为 25,000 个单词。这已经很多了,至少足以消化几个完整的网页以获得答案。
OpenAI 认识到了这一点通过博客文章:«在随意交谈中,GPT-3.5 和 GPT-4 之间的区别可能很微妙。当任务的复杂性达到足够的阈值时,差异就会出现 – GPT-4 比 GPT-3.5 更可靠、更有创意,并且能够处理更细致的指令。 »
因此,该模型将更有能力解决复杂的问题。 OpenAI 通过在不同学科中进行数十项针对人类设计的考试来测试其新人工智能,在这些考试中,它的表现比它的老大哥好得多,如下图所示。它还在大多数机器学习模型基准测试中放弃了 GPT-3.5。
OpenAI 联合创始人兼老板 Sam Altman 回忆道,如果这个模型应该是“更有创意,更少偏见»,它还远未达到完美无缺。他的“幻觉”倾向——换句话说,发明虚假事物——会大大减少,但并没有完全消除。
无论如何,OpenAI 工程师都通过该模型推动了其行为的个性化,用户可以修改该行为,同时保持在公司设定的道德限制内:“我们现在支持 API 中的“系统”消息,允许开发人员(以及很快的 ChatGPT 用户)进行重要的行为定制。如果你想要一个始终以莎士比亚风格或 json 格式回应你的 AI,现在你就可以拥有它。”萨姆·奥尔特曼在推特上写道。
OpenAI 利用这一公告与使用该模型构建新功能的公司建立了一系列新的合作伙伴关系。例如,Duolingo 或 Stripe 在各自的应用程序中利用了 GPT-4。微软将于周四组织一次关于将生成人工智能集成到其办公软件中的会议,预计还将宣布与 GPT-4 相关的新功能。这家软件巨头是 OpenAI 的主要合作伙伴,该模型的训练也得益于雷蒙德公司设计的超级计算机。
来源 : 开放人工智能