OpenAI的備受期待的GPT-5推出——被譽為人工智慧的突破性進展——卻遭遇了名為現實的熟悉障礙。
該公司將這一模型宣稱為其最先進的版本,但早期使用者表示,這一推出的過程並不順利。性能遲緩、輸出不穩定以及缺失功能的報告,引發了對GPT-5及OpenAI能否兌現其承諾的日益懷疑。
週五,OpenAI首席執行官薩姆·奧特曼在X上對公司所有的承諾和錯誤表示歉意。
“向所有人推出需要花費更多時間,”他寫道。“這是一個大規模的巨大變革。”
奧特曼承認推出過程不平坦,承認比OpenAI預期的還要糟糕。
“我們將繼續努力讓一切穩定,也會持續聆聽反饋,”他說。“正如我們提到的,我們預期在同時推出這麼多東西時會有一些波折。但這次的波折超出了我們的預期!”
性能問題:不再健談,變得笨重
許多免費和Plus用戶表示,GPT-5感覺懶惰、速度較慢、回答較短,且比以往更具機械感。
反應變慢、回答較短以及更為機械的語氣使其被與早期的機器人進行比較,而非“專家級”的人工智慧。有人甚至認為這是一個退步,尤其是與靈活且具上下文的GPT-4o相比。
“不可思議的是ChatGPT Plus在推出GPT-5後從必需品變成了垃圾,”Nillion Network首席技術官約翰·伍茲在X上寫道。
Hyperbolic Labs聯合創始人兼首席技術官金宇辰稱這一模型令人失望——仍然容易出現幻覺,過度使用破折號,並且難以遵循指示。
“我懷念4o、4.5和o3。這個大路由器一直在讓我失望,”他寫道。“結果發現我喜歡長模型列表……拜託,讓我的朋友們離開這場葬禮。”
雖然OpenAI宣傳GPT-5為推理的強大工具,但用戶表示,它經常需要繁瑣的提示設計才能達到預期的表現。
“ChatGPT在GPT-5的路由上存在一些非常嚴重的錯誤,”Raindrop AI首席技術官本·海拉克寫道。“除非你說‘想得更深’,幾乎每個請求都會被路由到一個更小的模型,這個模型極其愚蠢且迴圈不斷。”
一些開發者指出,GPT-5在基本編程技能上出現了回退,據報導在變量範圍和初始化等基本編程概念上出現了困難——這對於一個被宣傳為智能代理和自主編程未來的模型來說是一個令人擔憂的信號。
更糟的是,GPT-5引入了“思考模式”,這些模式像內部齒輪一樣運作,但用戶無法看到或控制它們。結果?混亂。它一會兒像個哲學家,下一刻卻無法告訴“藍莓”中有多少個B。
推出的挫折:我的舊機器人在哪裡?
如果你感覺被推入GPT-5,你並不孤單。許多用戶抱怨像GPT-4和4o這樣的舊模型選項被突然移除或難以訪問,讓他們困在了一個他們並不需要的模型上。
此次推出還暴露了不同定價層級之間的明顯差異。免費層級和Plus用戶受到使用限制和削弱的“迷你”版本的限制,而Pro和Team訂閱者則可以使用完整的GPT-5 Pro。這並不新鮮,但在廣泛不滿的背景下,尤其令人厭煩。
即使是Pro用戶也報告在高峰時段出現延遲、停機和限速,這表明OpenAI可能在容量上遇到了困難。
公關失誤與道德紅旗
任何高風險的技術推出都伴隨著公關失敗的風險,而GPT-5也不例外。
OpenAI因使用一些觀察者稱為誤導性的性能圖表而受到批評。該公司在其現場演示中也犯了一個基本的數學錯誤,這一失誤在工程師和投資者中引起了質疑。
道德問題也持續困擾著這次推出,GPT-5的巨大上下文窗口和AI代理能力重新點燃了對濫用的恐懼,範圍從詐騙和虛假信息到設計用以欺騙的合成媒體。長期存在的問題,如算法偏見、隱私侵犯和工作流失,也以更大的緊迫性回到了討論中,強化了對監管的呼籲。
好消息(是的,確實有一些)
並非一切都壞。OpenAI聲稱GPT-5在幾個方面顯示了進展:幻覺減少、阿諛奉承減少,以及在更廣泛的主題上更一致的推理。其更大的上下文窗口意味著它現在可以在更長的對話中跟踪和整合信息,這對於高級用戶來說非常有用。
安全系統的升級也提供了對敏感提示更細緻的反應,儘管一些人仍然認為GPT-5在平淡的風險規避上有所偏差。
對於擁有正確提示和耐心的開發者來說,GPT-5可以生成令人印象深刻的代碼並處理複雜的推理任務。但對於許多人來說,它仍未達到“改變遊戲”的標籤。
結論:在艱難世界中的軟啟動
GPT-5的首發提供了一個有關AI發展的警示故事:技術能力並不足夠。期望值高漲,出錯的空間不斷縮小。用戶希望速度、準確性、個性和控制——並且希望這一切始終如一。
OpenAI現在面臨著管理這些期望的雙重挑戰,同時繼續對一個儘管有缺陷,但仍處於AI前沿的產品進行迭代。該公司的推出策略可能需要與模型本身一樣多的微調。
因為如果這是AI的未來……它可能需要修補。