安德魯·巴托和理查德·薩頓獲得計算機最高榮譽,警告不安全的人工智能開發實踐
安德魯·巴托(Andrew Barto)和理查德·薩頓(Richard Sutton)本週因其在強化學習領域的基礎性工作而獲得計算機界的最高榮譽,並迅速利用這一新平台發出警告,指出行業內不安全的人工智能開發實踐。
這對搭檔於週三被宣布為2024年ACM A.M.圖靈獎的獲得者,該獎項常被譽為「計算機界的諾貝爾獎」,並伴隨著由谷歌資助的100萬美元獎金。
他們並未僅僅慶祝自己的成就,反而立即批評他們所認為的人工智能技術危險地匆忙部署。巴托在接受《金融時報》採訪時表示:「將軟件釋放給數百萬人而不採取任何保護措施不是好的工程實踐。工程實踐已經發展到試圖減輕技術的負面影響,但我並未看到這些開發公司在實踐。」
他們的評估將當前的人工智能開發實踐比作「建造一座橋樑並通過讓人們使用它來測試」,而沒有適當的安全檢查,因為人工智能公司試圖優先考慮商業激勵而非負責任的創新。
這對搭檔的旅程始於1970年代末,當時薩頓是馬薩諸塞州大學的巴托學生。在1980年代,他們發展了強化學習——一種人工智能系統通過試錯學習的技術,通過獲得獎勵或懲罰來學習,當時很少有人相信這種方法。
他們的研究成果 culminated in the seminal 1998 textbook “Reinforcement Learning: An Introduction,” which has been cited almost 80 thousand times and became the bible for a generation of AI researchers.
「巴托和薩頓的工作展示了將多學科方法應用於我們領域長期挑戰的巨大潛力,」ACM總裁雅尼斯·伊奧安尼迪斯在公告中表示。「強化學習持續增長,並為計算機和其他許多學科的進一步發展提供了巨大的潛力。」
這100萬美元的圖靈獎是在強化學習持續推動機器人技術、芯片設計和大型語言模型創新之際頒發的,來自人類反饋的強化學習(RLHF)已成為像ChatGPT這樣的系統的一種關鍵訓練方法。
行業普遍的安全擔憂
然而,這對搭檔的警告與計算機科學領域其他知名人士日益增長的擔憂相呼應。
諾希亞·本吉奧(Yoshua Bengio),他本人也是圖靈獎獲得者,公開支持他們在Bluesky上的立場。「祝賀理查德·薩頓和安德魯·巴托獲得圖靈獎,以表彰他們對機器學習的重要貢獻,」他說。「我也與他們站在一起:在沒有正確的技術和社會保障措施的情況下向公眾釋放模型是不負責任的。」
他們的立場與另一位圖靈獎獲得者杰弗里·辛頓(Geoffrey Hinton)的批評相一致——他被稱為人工智能之父,還有2023年來自頂尖人工智能研究者和高管的聲明——包括OpenAI首席執行官山姆·奧特曼(Sam Altman),該聲明呼籲將減少人工智能帶來的滅絕風險作為全球優先事項。
前OpenAI研究人員也提出了類似的擔憂。最近辭去OpenAI對齊計劃負責人的Jan Leike加入了競爭對手人工智能公司Anthropic,他指出安全專注不夠,寫道「建造超越人類智慧的機器本身就是一項危險的事業。」
「在過去幾年中,安全文化和流程在閃亮產品面前退居次位,」Leike說。
另一位前OpenAI安全研究人員利奧波德·阿申布倫納(Leopold Aschenbrenner)稱該公司的安全實踐「極其不足」。同時,保羅·克里斯蒂亞諾(Paul Christiano),他也曾領導OpenAI的語言模型對齊團隊,則建議人工智能接管的可能性可能在「10-20%之間,許多人或大多數人將會喪生。」
儘管有警告,巴托和薩頓對人工智能的潛力仍持謹慎樂觀的態度。在接受Axios的採訪時,他們都表示,當前對人工智能的恐懼可能被誇大,儘管他們承認社會動蕩是可能的。
巴托告訴Axios:「我認為這些系統有很多機會改善我們生活和社會的許多方面,前提是采取足夠的謹慎。」
薩頓將人工通用智能視為一個分水嶺,將其框架作為一個機會,讓新的「思維」進入世界,而不是通過生物進化發展——基本上打開了人類未來與有知覺機器互動的門。
編輯:塞巴斯蒂安·辛克萊(Sebastian Sinclair)