8月6日消息,OpenAI宣布推出兩款開源模型GPT-oss-120b和GPT-oss-20b,這是自2020年發布GPT-2以來,OpenAI首次推出開源語言模型。這兩款模型均可在Hugging Face在線開發者平臺上免費下載,OpenAI稱其在多個用于比較開源模型的基準測試中表現“處于前沿水平”。
兩款開源模型亮相,性能與兼容性兼具?
據每日經濟新聞援引OpenAI介紹,兩款gpt-oss模型采用了其最先進的預訓練和后訓練技術,特別注重推理、效率和跨部署環境的實用性。它們都是使用專家混合(MoE)架構的Transformer,以減少處理輸入所需的活躍參數數量。
gpt-oss-120b每個token激活5.1億參數,總參數量為1170億;gpt-oss-20b激活3.6B參數,總參數量為210億。模型使用交替的密集和局部帶狀稀疏注意力模式,支持高達128k的上下文長度。OpenAI稱gpt-oss-20b是一款中型開放模型,gpt-oss-120b則是可在“大多數臺式機和筆記本電腦”上運行的大型開放模型。
OpenAI表示,較小的模型至少需要16GB顯存或統一內存才能發揮最佳性能,并且“非常適合高端消費級GPU和搭載蘋果芯片的Mac電腦”。較大的全尺寸模型則需要至少60GB顯存或統一內存。
從性能上看,gpt-oss-120b在核心推理基準測試中表現接近OpenAI o4-mini,在競賽編碼(Codeforces)、通用問題求解(MMLU和HLE)以及工具調用(TauBench)等方面超越了o3-mini,甚至在健康相關查詢(HealthBench)和競賽數學(AIME 2024和2025)的表現上優于o4-mini。而gpt-oss-20b雖規模較小,但在相同評估中達到或超過了o3-mini的性能,尤其在競賽數學和健康領域表現突出。
開源戰略轉變,應對市場競爭壓力
此次OpenAI重新推出開源模型,源于其在開源技術方面態度的轉變。今年1月,DeepSeek引發了開源AI熱潮,奧爾特曼隨后承認OpenAI在開源技術上“站在了歷史的錯誤一邊”。此次發布開源模型,正是OpenAI對市場趨勢的回應,旨在重新融入開源生態,增強自身在AI領域的競爭力。
市場競爭的加劇無疑是OpenAI此舉的重要驅動力。近年來,眾多科技公司和研究機構在開源AI領域積極布局,推出了一系列具有競爭力的模型。谷歌DeepMind于8月4日宣布推出第三代通用世界模型Genie 3,能夠生成多樣化的交互式環境,在模擬環境領域展現出強大的技術實力。面對競爭對手的不斷發力,OpenAI通過開源模型,有望吸引更多開發者和企業參與其生態系統,鞏固自身的市場地位。
此外,OpenAI與英偉達、AMD、Cerebras和Groq等芯片制造商展開合作,確保模型在各種芯片上能夠良好運行。英偉達CEO黃仁勛表示,OpenAI在英偉達AI平臺上推動了開源軟件的創新。這一系列合作將進一步提升OpenAI模型的性能和適用性,為用戶提供更優質的體驗。
模型安全性引關注,市場期待GPT-5?
盡管OpenAI的開源模型在性能上表現出色,但相較o3和o4-mini模型,兩款開放模型更容易出現“幻覺”現象。OpenAI解釋稱,由于較小的模型所擁有的世界知識相對較少,因此更容易產生幻覺。在OpenAI內部用于衡量模型對人物知識準確性的PersonQA基準測試中,gpt-oss-120b和gpt-oss-20b分別對49%和53%的問題產生幻覺,顯著高于o4-mini模型的36%。
針對開放權重模型可能面臨的安全風險,OpenAI給予了特別關注。在預訓練期間,公司過濾了與化學、生物、放射性和核(CBRN)相關的有害數據,并對模型進行了專門的生物學和網絡安全數據微調,以評估潛在風險。經過內部和外部測試,這些惡意微調的模型無法達到其準備框架中的“高能力”閾值。
隨著OpenAI此次開源模型的發布,市場對其下一個重磅產品的期待愈發高漲。鑒于公司近期不斷釋放的新消息,市場普遍預期OpenAI的下一個重大更新將是推出GPT-5。
浙商證券7月27日發布的報告指出,GPT-5的模型思路圍繞“簡化、統一、多模態”展開,它將整合GPT系列基礎模型、o系列推理模型以及GPT-4o全模態模型的三方能力。奧特曼早在2025年2月就曾透露,GPT-5將簡化產品線,實現更強更統一的功能;6月的播客中,他再次強調了GPT-5的融合能力。
中信證券8月1日發布的研究報告預計,相較于GPT-4單次激活2770億的規模,新一代模型GPT-5單次推理的算力消耗不會大幅增加,API價格或較GPT-4o僅小幅增長甚至維持不變,推理性價比有望提升一倍以上,這將顯著改善AI應用的盈利能力。