去年,我將預測三月瘋狂比賽的這項不可能任務交給了ChatGPT。
結果?很遺憾,我的賽程預測和其他人一樣全軍覆沒,但至少我相信我的選擇比運氣更有實質依據。
365天過去了,這次我組建了AI版的夢幻隊伍:Google的Gemini Researcher、OpenAI的GPT-4.5研究代理、xAI的Grok-3(具備推理和研究能力)、百度剛推出的ERNIE X1——據說它能打敗DeepSeek R1和所有OpenAI的推理模型。我為每一個模型設計了賽程,並在下面分享給大家。
然後,我重啟了我的舊版GPT機器人——現在它內建了強化版的GPT 4.o——並更新了過去賽季的數據。
這就是它,萬一你想自己試試看:讓它優先考慮某個特定方法或統計數據,逐場比賽分析,或者調整它思考信息的方式,以適應你的需求和風格。
也許這些AI會比去年做得更好,但可能不會:選出完美賽程的機率仍然是1比92 quintillion。即使自人類誕生以來你已經填過了多少個賽程,你仍然有99.9999999883%的機率選錯。
但這些AI並不在乎機率。它們已經分析了數以TB計的數據,查閱了每一個KenPom評分,並刮取了網絡上的所有統計數據,為我們提供它們最有可能的預測。
這些模型會成為我們期待的籃球先知嗎?你來判斷吧。所有模型的回應都可以在我們的GitHub倉庫中查閱,但這裡是每個模型預測的概述。
ChatGPT的SEC偏愛
如果ChatGPT是個大學籃球迷,它可能會在它的矽膺上紋上東南聯盟(SEC)的標誌。
它的四強預測包含三支SEC隊伍:阿拉巴馬(東部)、田納西(中西部)和奧本(南部),以及聖約翰(西部)。
ChatGPT全力支持一場全SEC的總冠軍賽,預測奧本將在決賽中擊敗阿拉巴馬。它的一些冒險預測包括:八號種子甘迺迪(Gonzaga)在第二輪擊敗一號種子休斯頓。
在第一輪的冷門選擇上,ChatGPT採取了保守策略,選擇了幾個驚訝的比賽結果,如新墨西哥擊敗馬奎特、科羅拉多州立(12號種子)擊敗5號種子、加州大學聖地亞哥作為“賽程破壞者”。
該模型尤其看好奧本的冠軍潛力,並指出他們的均衡優勢是決定因素:“奧本排名第一不是沒有原因,他們在高得分的比賽中擁有防守優勢。在總決賽中,當球員腿部疲勞時,防守和半場執行變得至關重要——奧本在這方面占優勢。”
它的總冠軍預測是——奧本86,阿拉巴馬80——這將是一場精彩的全SEC決賽,展示ChatGPT所謂的“均衡優勢”,指出奧本在攻守兩端都排名前10至15——“這是一個證明的冠軍公式。”
四強:
阿拉巴馬對田納西(全SEC對決)和奧本對聖約翰
全國冠軍:
奧本擊敗阿拉巴馬(註:ChatGPT提到,杜克曾在某些早期預測模型中被認為擁有最高的初步機會,但研究代理特別選擇奧本為冠軍。)
(你可以通過點擊這個鏈接閱讀ChatGPT的完整報告。)
Gemini的藍魔預言
Google的Gemini預測了四強:杜克(東部)、佛羅里達(西部)、休斯頓(中西部)、密西根州立(南部),並預測杜克將擊敗佛羅里達奪得冠軍。
與ChatGPT不同,Gemini在第一輪預測中充滿驚喜,預測多場13號種子會擊敗4號種子:耶魯擊敗德州A&M、阿克倫擊敗亞利桑那、海高點擊敗普渡大學。它還預測德雷克(11號)擊敗伊利諾伊(6號)以及VCU(11號)擊敗BYU(6號)。
Gemini的分析特別強調杜克的均衡(在攻防效率中均排名前5)和佛羅里達的#1進攻效率評分。也許最值得注意的是,Gemini提到杜克的庫珀·弗拉格和休斯頓的J’Wan羅伯茨等關鍵球員的傷病問題——這是其他模型未曾提到的細節。
Gemini的逐區分析展現了對統計數據的謹慎關注。對於它的冠軍預測,它專注於杜克在攻防兩端的出色表現:“這個分析基於KenPom評分、NET排名、最近表現、傷病報告和來自各方的專家預測。”對於像我這樣的業餘玩家來說,這是相當具有說服力的。
四強候選:
杜克(1號種子,東部)、佛羅里達(1號種子,西部)、休斯頓(1號種子,中西部)、密西根州立(2號種子,南部)
冠軍預測:
杜克擊敗佛羅里達
(你可以通過點擊這個鏈接閱讀Gemini的研究。)
Grok-3的均衡方法
伊隆·馬斯克的Grok-3站在中立立場,選擇了四強:奧本(南部)、杜克(東部)、佛羅里達(西部)、休斯頓(中西部),最終預測杜克將擊敗佛羅里達奪得冠軍。
Grok-3的冷門選擇包括耶魯擊敗德州A&M以及北卡大學/聖地亞哥州立的附加賽勝者擊敗馬奎特。它還列出其他潛在冷門,如自由大學擊敗俄勒岡、阿克倫擊敗亞利桑那、科羅拉多州立擊敗孟菲斯、麥基尼斯擊敗克萊姆森,以及海高點擊敗普渡大學。
與Gemini類似,Grok-3強調KenPom指標和其他數據來源的重要性,特別指出奧本強勁的進攻(KenPom第二)和穩固的防守(排名第12),以及SEC在比賽中令人印象深刻的14支隊伍。
對於杜克在東部的比賽,Grok-3特別規劃了:“精英八強:杜克擊敗阿拉巴馬;甜16:杜克擊敗亞利桑那,阿拉巴馬擊敗威斯康辛;第二輪:杜克擊敗密西西比州立,亞利桑那擊敗俄勒岡,威斯康辛擊敗貝勒,阿拉巴馬擊敗UCLA。”
Grok-3的預測之所以有趣,在於它在保守的賽程建設和戰略性冷門選擇之間的平衡,專注於具有統計優勢和有利比賽對決的隊伍,而非純粹的驚喜價值。
四強:
杜克擊敗奧本,佛羅里達擊敗休斯頓。
冠軍:
杜克擊敗佛羅里達,預測的全國冠軍。
(你可以通過點擊這個鏈接閱讀Grok的研究。)
ERNIE X1的膽大冒險
百度的ERNIE X1模型預測了四強:杜克(東部)、佛羅里達(西部)、阿拉巴馬(南部)和堪薩斯(中西部),並預測杜克將擊敗阿拉巴馬奪冠。
但ERNIE的真正亮點是它的膽大冷門選擇。怎麼樣?諾福克州立挑戰愛荷華州立?還是新墨西哥會取勝?如果這些事發生了,ERNIE可能需要開始選擇彩票號碼,因為專家認為它們是明顯的弱隊。
在分析中,ERNIE X1強調了教練經驗作為成功的關鍵因素,並指出:“教練經驗的重要性(杜克的Jon Scheyer、佛羅里達的Todd Golden)”是比賽成功的關鍵。該模型還提供了關於隊伍組成的獨特觀點,指出擁有“精英後衛(佛羅里達、杜克)或強大內線球員(阿拉巴馬、普渡)”的隊伍通常在比賽中佔有優勢。
ERNIE X1的甜16和精英八強預測遵循了從第一輪冷門選擇的邏輯進展,杜克擊敗普渡和肯塔基擊敗田納西,隨後杜克進入四強。南區則預測阿拉巴馬擊敗貝勒,甘迺迪超越密西根州立,最終阿拉巴馬進入四強。
四強:
杜克對佛羅里達,阿拉巴馬對堪薩斯
全國冠軍:
杜克擊敗阿拉巴馬:杜克的深度和投籃能力讓阿拉巴馬的防守無法抵擋。
(你可以通過點擊這個鏈接閱讀ERNIE的報告。)
賽程機器人獲得第二次機會
去年失敗的三月瘋狂賽程機器人再次登場,唯一的目標是:復仇。公平地說,我們都需要承認這個機器人失敗的原因很簡單:BYU——所有人的熱門隊伍——被杜克斯基大學(Duquesne)徹底擊敗,而這支球隊自1969年以來未曾勝過三月瘋狂。
今年,機器人的四強選擇是:杜克(東部)、休斯頓(中西部)、佛羅里達(西部)和奧本(南部),並預測杜克將擊敗奧本奪得冠軍。
機器人的冷門選擇集中在12-5和11-6的比賽:德雷克(12號)擊敗貝勒(5號)、里士滿(12號)擊敗堪薩斯州立(5號)、佛蒙特(13號)擊敗亞利桑那(4號)、德州(11號)擊敗印第安納(6號)以及聖地亞哥州立(11號)擊敗肯塔基(6號)。
在一場驚人的進化展示中,我們的機器人提供了獨特的詳細逐輪分析,而不僅僅是給出最終預測。
它甚至概述了德雷克(12號)如何達到精英八強,但最終會輸給佛羅里達。它還確定聖地亞哥州立(11號)作為“黑馬四強候選”,基於他們精英的防守。
最可靠的四強:
杜克(1號種子)、休斯頓(1號種子)、佛羅里達(1號種子)、奧本(1號種子)→ 這些#1種子隊伍都很優秀。
全國冠軍:
杜克(1號種子)→ 擁有最佳的攻防平衡以及教練團隊。
你可以點擊這個鏈接查看其完整預測。
AI共識:杜克主宰
從所有五個AI模型來看,出現了一些共通點:
- 杜克是壓倒性的冠軍預測,四個模型選擇杜克勝出,只有ChatGPT選擇了奧本。
- 佛羅里達出現在四個模型的四強中,儘管只有兩個模型選擇它作為亞軍。
- 奧本在所有五個預測中至少進入了精英八強,其中兩個模型(ChatGPT和賽程機器人)預測它會進入總決賽。
- SEC的主導地位是一致的,所有模型都預測了來自這一聯盟的多支隊伍能夠深入賽程。
- 多個模型預測的重大冷門包括:耶魯擊敗德州A&M,德雷克擊敗較高種子,聖地亞哥州立意外進入四強。
- 休斯頓的進程最具爭議性,預測範圍從第二輪退出(ChatGPT)到進入四強(Gemini、Grok、賽程機器人)。
- ChatGPT是唯一預測SEC冠軍的模型,儘管所有模型都承認這一聯盟的強大。
每個AI都帶來了獨特的視角。Gemini專注於傷病分析,這很有道理。Grok-3強調SEC的統治地位,該聯盟在比賽中擁有創紀錄的14支隊伍。ERNIE X1則提供了最大膽的冷門選擇——這並非完全愚蠢,畢竟去年也是如此。賽程破壞者機器人則在2024年提供了一些準確的結果,並經過人工配置專門為這一任務服務。
為何AI仍無法解開三月瘋狂的謎題
儘管這些AI模型擁有複雜的算法和數據處理能力,但它們仍然無法達成一致的完美賽程。為什麼?因為三月瘋狂的魅力就在於不可預測——我們所說的是10名具有自由意志的選手,在一個擁有數千名觀眾的場地中與他們的自由意志互動,天氣和其他不可預測的因素,教練和技術人員也在實施不可預測的戰術和情緒。決定論根本無法適用於這樣的比賽。
這些模型再先進,也只不過是根據過去表現做出有根據的猜測——有點像交易者依賴技術分析來預測準確度。所有模型都是基於理論——甚至是科學方法——但沒有人能夠完全捕捉到使大學籃球如此難以預測的人類因素。
這就是為什麼比賽如此精彩的原因。
如果杜克依照AI共