您的位置:首页 >每日快讯 >正文

Strawberry AI来了OpenAI推出o1高级推理模型

摘要 经过数月的期待,OpenAI终于推出了一系列名为o1的高级推理能力强的新模型,之前被称为StrawberryAI。新模型包括 OpenAI o1、OpenAI o1-p...

经过数月的期待,OpenAI终于推出了一系列名为“o1”的高级推理能力强的新模型,之前被称为StrawberryAI。新模型包括 OpenAI o1、OpenAI o1-preview 和 OpenAI o1-mini。预览版和迷你版模型从今天开始向付费 ChatGPT Plus 用户开放。稍后,OpenAI o1-mini 也将向免费 ChatGPT 用户开放。

OpenAI 表示,o1 模型需要花一些时间思考才能做出反应,但它们可以“推理复杂的任务”并解决数学、科学和编码方面的难题。此外,OpenAI 表示,新的推理模型在具有挑战性的科学课题上的表现与博士生不相上下。

举个例子,OpenAI o1 模型在国际数学奥林匹克 (IMO) 等严格答案 中得分为 83%,而GPT-4o只能解决 13% 的问题。在 Codeforces 竞赛中,新的 o1 模型达到了第 89 个百分位,而 GPT-4o 则处于第 11 个百分位。

在 MMLU 基准测试中,OpenAI o1 得分为 92.3,在 MATH 基准测试中得分为 94.8。OpenAI 表示,在需要大量推理的任务中,o1 的表现与人类专家的表现非常接近,这非常重要。

o1 模型通过强化学习,使用思维链技术进行训练。它将步骤分解为更简单的步骤,并通过不同的策略处理每个步骤,直到得出正确的结论。顺便说一句,目前 o1 模型仅支持文本输入。您无法使用该模型浏览网页或分析文件和图像。

版权声明:本文由用户上传,如有侵权请联系删除!