歡迎來到淘金地

OpenAI發(fā)布o(jì)3與o4-mini,支持圖思及工具調(diào)用

來源: 發(fā)布時(shí)間:2025-04-17

OpenAI發(fā)布o(jì)3與o4-mini,支持圖思及工具調(diào)用

北京時(shí)間 4 月 17 日凌晨,OpenAI 正式發(fā)布了兩款全新 AI 模型 ——o3 和 o4-mini。這兩款模型屬于 “o 系列” 推理模型,能夠通過圖像進(jìn)行推理,并可自主調(diào)用多種工具,被認(rèn)為是人工智能能力的一次重大飛躍。

o3 和 o4-mini 經(jīng)過訓(xùn)練,可在響應(yīng)前進(jìn)行更長時(shí)間的思考,是 OpenAI 迄今發(fā)布的智能、強(qiáng)大的模型。它們能夠自主組合并使用 ChatGPT 內(nèi)的多種工具,包括網(wǎng)頁搜索、用 Python 分析文件和數(shù)據(jù)、進(jìn)行視覺輸入推理以及生成圖像等。而且,模型能判斷何時(shí)及如何使用工具,以正確輸出格式,在一分鐘內(nèi)給出詳細(xì)回答,解決復(fù)雜問題,使 ChatGPT 具備 “自主執(zhí)行任務(wù)” 的能力。

性能方面,o3 是 OpenAI 強(qiáng)大的推理模型,在編程、數(shù)學(xué)、科學(xué)、視覺理解等領(lǐng)域取得突破,在 Codeforces、SWE-bench 和 MMMU 等多項(xiàng)基準(zhǔn)測試中創(chuàng)下新紀(jì)錄,適合復(fù)雜查詢,在視覺任務(wù)中表現(xiàn)突出。外部專業(yè)人員評估顯示,在現(xiàn)實(shí)高難度任務(wù)中,o3 的重大錯誤率比 o1 降低 20%,在多個領(lǐng)域表現(xiàn)出色,早期測試者稱其為 “思考伙伴”。

o4-mini 則是更小巧、高效的推理模型,專為快速、低成本應(yīng)用場景優(yōu)化,在數(shù)學(xué)、編程和視覺任務(wù)上性價(jià)比驚人,是 AIME 2024 和 AIME2025 基準(zhǔn)測試中表現(xiàn)的模型之一,在非 STEM 任務(wù)上超越 o3-mini,計(jì)算效率出色,適用于高頻、高吞吐量場景。

在技術(shù)創(chuàng)新上,OpenAI 通過強(qiáng)化學(xué)習(xí)訓(xùn)練這兩款模型使用工具,并讓它們學(xué)會判斷使用時(shí)機(jī)。同時(shí),模型可實(shí)現(xiàn)將圖像直接整合進(jìn)推理思維鏈,能 “用圖像進(jìn)行思考”,實(shí)現(xiàn)視覺與文本推理的深度融合,在視覺感知任務(wù)中準(zhǔn)確率前列。

OpenAI o3 和 o4-mini 在 ChatGPT 中擁有對所有工具的完整訪問權(quán)限,開發(fā)者還能通過 API 接入自定義工具。面對復(fù)雜問題,模型可執(zhí)行一連串工具調(diào)用,靈活應(yīng)變,完成復(fù)雜任務(wù)。

價(jià)格方面,o3 和 o4-mini 在很多情況下比前代更高效、節(jié)省成本。在安全性上,OpenAI 重構(gòu)安全訓(xùn)練數(shù)據(jù)集,新增拒絕示例,使模型在內(nèi)部安全拒絕基準(zhǔn)測試中表現(xiàn)優(yōu)異,還開發(fā)了風(fēng)險(xiǎn)緩解機(jī)制,識別和標(biāo)記危險(xiǎn)提示。經(jīng)嚴(yán)格測試,o3 與 o4-mini 在生物與化學(xué)風(fēng)險(xiǎn)、網(wǎng)絡(luò)安全、AI 自我改進(jìn)能力等領(lǐng)域均處于 “低風(fēng)險(xiǎn)” 級別。

此外,OpenAI 發(fā)布了全新實(shí)驗(yàn)項(xiàng)目 Codex CLI,這是一款輕量級編程智能體,專為發(fā)揮 o3 和 o4-mini 等模型的推理能力設(shè)計(jì),即將支持更多 API 模型。用戶可從命令行體驗(yàn)多模態(tài)推理,解決實(shí)際編程任務(wù)。OpenAI 還啟動了 100 萬美元資助計(jì)劃,支持使用 Codex CLI 和 OpenAI 模型的項(xiàng)目。

從 4 月 17 日開始,ChatGPT Plus、Pro 和 Team 用戶可在模型選擇器中看到 o3、o4-mini 和 o4-mini-high,取代之前的 o1、o3-mini 和 o3-mini-high。ChatGPT Enterprise 和 Edu 用戶將在一周后獲得訪問權(quán)限。其用戶可點(diǎn)擊 “Think” 按鈕嘗試 o4-mini 的推理能力。OpenAI 還計(jì)劃在未來幾周推出支持全部工具功能的 OpenAI o3-pro,o3 和 o4-mini 也將通過 Chat Completions API 和 Responses API 向開發(fā)者開放。

公司信息

聯(lián) 系 人:

手機(jī)號:

電話:

郵箱:

網(wǎng)址:

地址:

新疆派威智研科技有限公司
SaaS智能營銷云平臺
本日新聞 本周新聞 本月新聞
返回頂部