Strawberry AI来了OpenAI推出o1高级推理模型

• 2024-09-26 14:06:58

摘要经过数月的期待，OpenAI终于推出了一系列名为o1的高级推理能力强的新模型，之前被称为StrawberryAI。新模型包括 OpenAI o1、OpenAI o1-p...

经过数月的期待，OpenAI终于推出了一系列名为“o1”的高级推理能力强的新模型，之前被称为StrawberryAI。新模型包括 OpenAI o1、OpenAI o1-preview 和 OpenAI o1-mini。预览版和迷你版模型从今天开始向付费 ChatGPT Plus 用户开放。稍后，OpenAI o1-mini 也将向免费 ChatGPT 用户开放。

OpenAI 表示，o1 模型需要花一些时间思考才能做出反应，但它们可以“推理复杂的任务”并解决数学、科学和编码方面的难题。此外，OpenAI 表示，新的推理模型在具有挑战性的科学课题上的表现与博士生不相上下。

举个例子，OpenAI o1 模型在国际数学奥林匹克 (IMO) 等严格答案中得分为 83%，而GPT-4o只能解决 13% 的问题。在 Codeforces 竞赛中，新的 o1 模型达到了第 89 个百分位，而 GPT-4o 则处于第 11 个百分位。

在 MMLU 基准测试中，OpenAI o1 得分为 92.3，在 MATH 基准测试中得分为 94.8。OpenAI 表示，在需要大量推理的任务中，o1 的表现与人类专家的表现非常接近，这非常重要。

o1 模型通过强化学习，使用思维链技术进行训练。它将步骤分解为更简单的步骤，并通过不同的策略处理每个步骤，直到得出正确的结论。顺便说一句，目前 o1 模型仅支持文本输入。您无法使用该模型浏览网页或分析文件和图像。

标签：

Strawberry AI来了OpenAI推出o1高级推理模型

猜你喜欢

最新文章