Grok-3,由Elon Musk的xAI開發,於週一揭幕,該公司對其能力提出了大膽的宣稱,同時展示了一個龐大的計算基礎設施,顯示出更大的野心。
此次公告重點強調了原始計算能力、基準性能和即將推出的功能,儘管許多實際演示感覺像是其他人工智慧公司已經達成的重播。
展會初期的明星並不是人工智慧本身,而是「Colossus」,一個擁有200,000個GPU的巨型叢集,為Grok-3的訓練提供動力。
該系統分兩個階段組建:在100,000個GPU上進行122天的同步訓練,隨後進行92天的擴展,以達到完整的200,000個GPU。根據xAI開發者的說法,建立這一基礎設施比開發人工智慧模型本身更具挑戰性。
該公司已經計劃建立一個更強大的叢集,Musk表示他們的目標是當前容量的五倍,實際上打造出將成為地球上最強大的GPU叢集。
在性能方面,Grok-3在標準人工智慧基準測試中顯示出令人印象深刻的結果。基礎模型(不包含思維鏈和推理的常規模型)在數學(AIME)、科學(GPOA)和編碼(LCB)測試中穩定地名列前茅。
在盲測中,它似乎也顯示出非常有前景的結果。
xAI確認,代號為「Chocolate」的神秘模型實際上是Grok-3的一個早期測試版本,已上傳至LLM Arena。
在這些測試中,它在所有LLM中達到了最佳ELO,意味著用戶更喜歡它的回答,而不是其他所有人工智慧模型生成的答案,並且在評估時並不知道他們正在評估哪個模型。
這可能是測量質量的最準確方式,因為它沒有給模型任何機會通過在那些數據集上訓練他們的人工智慧來作弊。這一基準完全基於數千名匿名用戶的偏好和盲選擇。
Grok-3的一個專用「推理測試版」變體,使用內部思維鏈處理並在測試時進行額外計算,使數學分數更高——在AIME 2025基準測試中達到93%,而其他最佳執行模型的分數均低於87%。
有趣的是,一個名為Grok-3 Mini Reasoning Beta的小型版本有時會因較長的訓練時間而超越其更大的兄弟。
換句話說,完整尺寸的Grok-3在獲得可比的訓練時間後仍有改善的空間,這在其更大的參數數量下顯得尤為有希望。
但當xAI移至現場演示Grok-3的能力時,展示感覺更像是一場追趕遊戲,而非創新。團隊展示了模型解決物理問題和從零開始編寫遊戲代碼的能力——這些令人印象深刻的壯舉是ChatGPT、Claude和谷歌的Gemini早已掌握的。
新工具,舊把戲
他們還推出了DeepSearch,一個研究代理,像OpenAI和谷歌的類似工具一樣,掃描網絡並生成有關特定主題的廣泛報告。
X Premium Plus訂閱者將立即獲得Grok-3的訪問權限,但最強大的版本和更新版本通常將在專用的獨立應用程序或Grok.com上運行。
與OpenAI的「高級語音模式」類似的語音互動將在未來幾周內到來,Musk強調這不是簡單的文字轉語音,而是一個真正的人工智慧語音模型,能夠實現自然且富有表情的語音。
開發者將在未來幾周內獲得API訪問權限,並帶有音頻轉錄功能,使Grok-3成為第三方人工智慧應用程序的強大工具。
在展示了一個由Grok生成的俄羅斯方塊遊戲示例後,xAI還透露了打造一個AI遊戲工作室的計劃,讓開發者能夠建立由Grok-3驅動的遊戲。
目前,該模型正在慢慢推出。在撰寫本文時,Decrypt尚未獲得該模型的訪問權限,但一些愛好者已經嘗試過,並對結果感到滿意。
計算機科學家Lex Friedman,AI領域中最響亮的聲音之一,讚揚了Grok-3的能力。
其他人將其與市場領先的競爭對手進行比較。
「Grok 3 + 思考感覺大約在OpenAI最強模型(o1-pro,$200/月)的藝術狀態範圍內,比DeepSeek-R1和Gemini 2.0 Flash Thinking稍好一些,」前OpenAI聯合創始人Andrej Karpathy在X上的一篇詳盡帖子中寫道。「目前,恭喜xAI團隊,他們顯然擁有巨大的速度和動能。」
X用戶Penny2x分享了一個由Grok-3從零開始構建的遊戲——一個類似於馬里奧兄弟的2D平台遊戲。
他們對Grok理解指令和改進多次迭代的能力感到驚訝。
「我一直在要求調整,它一直在一個文件中生成我可以放在桌面上運行的遊戲。」他在X上寫道。「這真是太不可思議了。我們生活在未來。每個人現在都是開發者。」
該遊戲可在Thank Doge上進行測試。
該公司還確認了一旦Grok-3完全成熟並正常運行後,將開源Grok-2的計劃,這預計將在未來幾個月內進行。
xAI在Grok-2之後曾開源其模型,繼續釋放舊版本以促進創新——儘管Grok-2在頂級模型中落後。
目前,Grok-3似乎擅長於與最佳人工智慧模型已經能做到的匹配。
真正的考驗將在xAI推出其承諾的語音功能、遊戲工具和API訪問權限的幾周後到來。現在,球在OpenAI的場上,該公司即將推出GPT-4.5。
編輯:Sebastian Sinclair
Related Posts
Add A Comment