OpenAI 計劃發布具推理能力的「開放權重」模型

OpenAI將重返開放技術AI領域，計劃在未來幾個月內推出一款強大的開放權重語言模型，並具有推理能力，首席執行官Sam Altman於週一表示。

「我們計劃發布自GPT-2以來的首個開放權重語言模型，」Altman在X上的一篇帖子中寫道。「我們已經考慮這個問題很長時間了，但其他優先事項優先於此。現在我們覺得這是非常重要的事情。」

這一公告正值OpenAI面臨來自競爭對手的壓力，其中包括Meta及其Llama開源模型家族；Google的Gemma，擁有多模態功能；以及中國AI實驗室DeepSeek，該實驗室最近推出了一款開源推理模型，據報導其表現超越了OpenAI的o1。

開源模型是指其開發者將所有內容公開，使用者可以訪問代碼、訓練數據集和架構等信息。這使得使用者能夠修改並重新分發該模型。開放權重模型則較為封閉：用戶可以對其進行微調，但無法從頭開始構建，因為他們無法訪問關鍵元素，如訓練數據集或架構。

為了收集開發者實際需求的意見，OpenAI在其網站上發布了反饋表單，並宣布計劃在幾週內於舊金山舉辦開發者活動，隨後將在歐洲和亞太地區舉行會議。

「我們很高興與開發者、研究人員及更廣泛的社群合作，收集意見並使這款模型變得更有用，」該公司在公告中表示。

OpenAI的API團隊成員Steven Heidel也分享了這個模型將能夠在本地運行的消息：「我們今年將發布一款可以在你自己的硬件上運行的模型。」

他並未具體說明該模型將擁有多少個參數、標記上下文窗口、數據集、訓練中使用的技術或發布許可證，這些可能會對反向工程或微調等行為在特定國家產生限制。

今天的公告標誌著OpenAI在近期戰略上的重大轉變，該公司近期一直將其最先進的模型鎖定在API後面。

這一舉措也與Altman最近在Reddit問答中所表達的看法相一致，他在該問答中首次透露公司正在考慮發布完整的開源模型。

「是的，我們正在討論（發布一些模型權重並發佈一些研究），」Altman寫道。「我個人認為我們在這裡站在歷史的錯誤一方，需要思考一個不同的開源策略；並非每個OpenAI的人都認同這個看法，這也不是我們當前的最高優先事項。」

根據Altman的帖子，這款即將發布的模型將具有與OpenAI的o3-mini相當的推理能力，這將使其成為迄今為止最強大的開放推理模型，超越DeepSeek的R1。

編輯：Sebastian Sinclair 和 Josh Quittner

以太坊適合「驚人」穩定幣增長，摩根大通表示