AI愛好者,你們的祈禱已經被聽見
OpenAI將重返開放技術AI領域,計劃在未來幾個月內推出一款強大的開放權重語言模型,並具有推理能力,首席執行官Sam Altman於週一表示。
「我們計劃發布自GPT-2以來的首個開放權重語言模型,」Altman在X上的一篇帖子中寫道。「我們已經考慮這個問題很長時間了,但其他優先事項優先於此。現在我們覺得這是非常重要的事情。」
這一公告正值OpenAI面臨來自競爭對手的壓力,其中包括Meta及其Llama開源模型家族;Google的Gemma,擁有多模態功能;以及中國AI實驗室DeepSeek,該實驗室最近推出了一款開源推理模型,據報導其表現超越了OpenAI的o1。
開源模型是指其開發者將所有內容公開,使用者可以訪問代碼、訓練數據集和架構等信息。這使得使用者能夠修改並重新分發該模型。開放權重模型則較為封閉:用戶可以對其進行微調,但無法從頭開始構建,因為他們無法訪問關鍵元素,如訓練數據集或架構。
為了收集開發者實際需求的意見,OpenAI在其網站上發布了反饋表單,並宣布計劃在幾週內於舊金山舉辦開發者活動,隨後將在歐洲和亞太地區舉行會議。
「我們很高興與開發者、研究人員及更廣泛的社群合作,收集意見並使這款模型變得更有用,」該公司在公告中表示。
OpenAI的API團隊成員Steven Heidel也分享了這個模型將能夠在本地運行的消息:「我們今年將發布一款可以在你自己的硬件上運行的模型。」
他並未具體說明該模型將擁有多少個參數、標記上下文窗口、數據集、訓練中使用的技術或發布許可證,這些可能會對反向工程或微調等行為在特定國家產生限制。
今天的公告標誌著OpenAI在近期戰略上的重大轉變,該公司近期一直將其最先進的模型鎖定在API後面。
這一舉措也與Altman最近在Reddit問答中所表達的看法相一致,他在該問答中首次透露公司正在考慮發布完整的開源模型。
「是的,我們正在討論(發布一些模型權重並發佈一些研究),」Altman寫道。「我個人認為我們在這裡站在歷史的錯誤一方,需要思考一個不同的開源策略;並非每個OpenAI的人都認同這個看法,這也不是我們當前的最高優先事項。」
根據Altman的帖子,這款即將發布的模型將具有與OpenAI的o3-mini相當的推理能力,這將使其成為迄今為止最強大的開放推理模型,超越DeepSeek的R1。
編輯:Sebastian Sinclair 和 Josh Quittner