品牌方舟获悉,OpenAI宣布发布新一代AI推理模型o3和o4-mini,强化图像分析与多工具协同能力。
据了解,o3和o4-mini旨在推动生成式人工智能在多模态理解和复杂任务处理方面的能力,两款模型现已集成至ChatGPT,可供Pro、Plus和Team计划订阅者使用。
官方介绍称,o3是迄今为止OpenAI推出的最强推理模型,在数学、编程、科学、推理及视觉理解等关键测试中,全面超越了先前版本。与之相辅的o4-mini则更注重速度、成本与性能的平衡,适用于开发者在应用集成中对资源效率的不同需求。
这两款模型均支持ChatGPT中的高级工具功能,包括网页浏览、Python代码执行、图像处理及图像生成。其中o4-mini还提供了一个“high”版本o4-mini-high,专注于提升回答的准确性与可靠性,适合对输出质量要求更高的使用场景。
o3和o4-mini是OpenAI首批支持“图像思考”能力的模型。用户可上传图像、草图或PDF图表,模型将以“思维链”方式分析视觉内容,从而实现基于图像的深层次推理。OpenAI表示,这些模型可理解模糊或低质量图像,并能在分析过程中执行如缩放、旋转等操作,扩大视觉处理的适用场景。
o3的发布过程并非一帆风顺。OpenAI首席执行官Sam Altman曾在今年2月透露,公司一度计划搁置该模型,转而开发一个融合o3技术的更复杂替代方案。但面对谷歌、Meta、Anthropic等竞争者的持续追赶,OpenAI最终决定提早发布o3,以保持技术领先优势。
OpenAI同时透露,计划在未来几周推出更高规格版本o3-pro。该版本将使用更多计算资源,专供ChatGPT Pro用户使用,进一步释放o3模型的潜力。Altman表示,o3和o4-mini可能是GPT-5问世前最后一批独立AI推理模型。未来的GPT-5将整合传统语言模型与推理模型,朝着统一智能系统的方向迈进。