OpenAI發(fā)布o(jì)3與o4-mini，支持圖思及工具調(diào)用

來源：發(fā)布時(shí)間：2025-04-17

OpenAI發(fā)布o(jì)3與o4-mini，支持圖思及工具調(diào)用

北京時(shí)間 4 月 17 日凌晨，OpenAI 正式發(fā)布了兩款全新 AI 模型 ——o3 和 o4-mini。這兩款模型屬于 “o 系列” 推理模型，能夠通過圖像進(jìn)行推理，并可自主調(diào)用多種工具，被認(rèn)為是人工智能能力的一次重大飛躍。

o3 和 o4-mini 經(jīng)過訓(xùn)練，可在響應(yīng)前進(jìn)行更長時(shí)間的思考，是 OpenAI 迄今發(fā)布的智能、強(qiáng)大的模型。它們能夠自主組合并使用 ChatGPT 內(nèi)的多種工具，包括網(wǎng)頁搜索、用 Python 分析文件和數(shù)據(jù)、進(jìn)行視覺輸入推理以及生成圖像等。而且，模型能判斷何時(shí)及如何使用工具，以正確輸出格式，在一分鐘內(nèi)給出詳細(xì)回答，解決復(fù)雜問題，使 ChatGPT 具備 “自主執(zhí)行任務(wù)” 的能力。

性能方面，o3 是 OpenAI 強(qiáng)大的推理模型，在編程、數(shù)學(xué)、科學(xué)、視覺理解等領(lǐng)域取得突破，在 Codeforces、SWE-bench 和 MMMU 等多項(xiàng)基準(zhǔn)測試中創(chuàng)下新紀(jì)錄，適合復(fù)雜查詢，在視覺任務(wù)中表現(xiàn)突出。外部專業(yè)人員評估顯示，在現(xiàn)實(shí)高難度任務(wù)中，o3 的重大錯誤率比 o1 降低 20%，在多個領(lǐng)域表現(xiàn)出色，早期測試者稱其為 “思考伙伴”。

o4-mini 則是更小巧、高效的推理模型，專為快速、低成本應(yīng)用場景優(yōu)化，在數(shù)學(xué)、編程和視覺任務(wù)上性價(jià)比驚人，是 AIME 2024 和 AIME2025 基準(zhǔn)測試中表現(xiàn)的模型之一，在非 STEM 任務(wù)上超越 o3-mini，計(jì)算效率出色，適用于高頻、高吞吐量場景。

在技術(shù)創(chuàng)新上，OpenAI 通過強(qiáng)化學(xué)習(xí)訓(xùn)練這兩款模型使用工具，并讓它們學(xué)會判斷使用時(shí)機(jī)。同時(shí)，模型可實(shí)現(xiàn)將圖像直接整合進(jìn)推理思維鏈，能 “用圖像進(jìn)行思考”，實(shí)現(xiàn)視覺與文本推理的深度融合，在視覺感知任務(wù)中準(zhǔn)確率前列。

OpenAI o3 和 o4-mini 在 ChatGPT 中擁有對所有工具的完整訪問權(quán)限，開發(fā)者還能通過 API 接入自定義工具。面對復(fù)雜問題，模型可執(zhí)行一連串工具調(diào)用，靈活應(yīng)變，完成復(fù)雜任務(wù)。

價(jià)格方面，o3 和 o4-mini 在很多情況下比前代更高效、節(jié)省成本。在安全性上，OpenAI 重構(gòu)安全訓(xùn)練數(shù)據(jù)集，新增拒絕示例，使模型在內(nèi)部安全拒絕基準(zhǔn)測試中表現(xiàn)優(yōu)異，還開發(fā)了風(fēng)險(xiǎn)緩解機(jī)制，識別和標(biāo)記危險(xiǎn)提示。經(jīng)嚴(yán)格測試，o3 與 o4-mini 在生物與化學(xué)風(fēng)險(xiǎn)、網(wǎng)絡(luò)安全、AI 自我改進(jìn)能力等領(lǐng)域均處于 “低風(fēng)險(xiǎn)” 級別。

此外，OpenAI 發(fā)布了全新實(shí)驗(yàn)項(xiàng)目 Codex CLI，這是一款輕量級編程智能體，專為發(fā)揮 o3 和 o4-mini 等模型的推理能力設(shè)計(jì)，即將支持更多 API 模型。用戶可從命令行體驗(yàn)多模態(tài)推理，解決實(shí)際編程任務(wù)。OpenAI 還啟動了 100 萬美元資助計(jì)劃，支持使用 Codex CLI 和 OpenAI 模型的項(xiàng)目。

從 4 月 17 日開始，ChatGPT Plus、Pro 和 Team 用戶可在模型選擇器中看到 o3、o4-mini 和 o4-mini-high，取代之前的 o1、o3-mini 和 o3-mini-high。ChatGPT Enterprise 和 Edu 用戶將在一周后獲得訪問權(quán)限。其用戶可點(diǎn)擊 “Think” 按鈕嘗試 o4-mini 的推理能力。OpenAI 還計(jì)劃在未來幾周推出支持全部工具功能的 OpenAI o3-pro，o3 和 o4-mini 也將通過 Chat Completions API 和 Responses API 向開發(fā)者開放。

標(biāo)簽：數(shù)智化時(shí)代引導(dǎo)變革數(shù)字化轉(zhuǎn)型

上一篇 ?又急了！特朗普打算禁止 DeepSeek 購買美國技術(shù)

下一篇 ?浪潮云發(fā)布分布式智能云戰(zhàn)略加速布局千節(jié)點(diǎn)網(wǎng)絡(luò)迎戰(zhàn)AI新賽道

相關(guān)新聞