考试已经没有意义了?性能强劲又便宜的大模型已经全面超越人类专家水平了。Openai-o1 模型来了

时间 :2024-09-13 作者 : 来源: 浏览 : 分类 :AI新闻中心
openai-o1的应用场景可以帮助医疗研究人员标注细胞测序数据,帮助物理学家生成量子光学所需的复杂数学公式,并帮助各领域的开发人员构建和执行多步工作流程

OpenAI-o1首次将大模型行业从原先卷参数带到了卷推理时间,o1具备了自我进化能力,是通用人工智能AGI的起点。

微信图片_20240913092321.png

o1作为早期模型,很多功能不支持,

o1模型不支持以下内容,并报错

system 字段:400 报错

tools 字段:400 报错

图片输入:400 报错

json_object 输出:500 报错

structured 输出:400 报错

logprobs 输出:403 报错

stream 输出:400 报错

o1系列:20 RPM,150,000,000 TPM,很低,随时429报错

其他:temperature, top_p and n 被固定为1;

presence_penalty 和 frequency_penalty 被固定为 0.


微信图片_20240913092311.png

o1 系列及 o1-preview 模型

OpenAi 测试中,推理模型在物理、化学和生物等挑战性基准任务中表现得与博士生相当。

在数学和编程方面表现出色。在国际数学奥林匹克(IMO)选拔考试中,GPT-4o 只正确解决了 13% 的问题,而推理模型得分为 83%。编程能力在比赛中达到了Codeforces 竞赛的 89 百分位。

OpenAI 表示,作为早期模型,目前还不具备使 chatgpt 实用的许多功能,比如浏览信息、上传文件和图片。对于许多常见情况,GPT-4o 在短期内会更为强大。

但对于复杂的推理任务,这代表了 AI 能力的重大进展。OpenAI 将计数器重置为1,并将这一系列命名为OpenAI o1。

微信图片_20240913091956.png

openai-o1的应用场景:可以帮助医疗研究人员标注细胞测序数据,帮助物理学家生成量子光学所需的复杂数学公式,并帮助各领域的开发人员构建和执行多步工作流程。

开发者可以开始使用 API 原型开发,限速为每分钟20次请求。经过额外测试后,OpenAI 将努力提高这些限制。api-t5等级,才有o1的api调用权限!