史丹佛大學的研究人員開發了可以以非凡準確度預測人類行為的AI代理。最近一項由朴俊晟博士及其團隊帶領的研究表明,一次兩小時的訪談提供了足夠的數據,讓AI以85%的標準準確度複製人類的決策模式。
一個真實人的數字化克隆不僅僅是深偽或被稱為LoRA的“低階適應”。這些準確的個性化代表可以用來檢視用戶並測試他們對各種刺激的反應,從政治運動到政策提案,情緒評估,甚至更加逼真的當前AI頭像版本。
研究團隊招募了1,052名美國人,精心挑選以代表不同年齡、性別、種族、地區、教育和政治意識形態的多樣人口統計。每位參與者與AI訪問者進行了兩小時的對話,產生了平均6,491字的文字記錄。這些訪談按照美國之聲項目協議的修改版本,探討參與者的生活故事、價值觀和對當前社會問題的看法。
這就是您被檢視並生成一個克隆的一切。
但與其他研究不同,研究人員對處理訪談數據採取了不同的方法。研究人員開發了一個“專家反思”模塊,而不僅僅是將原始記錄餵入他們的系統。這個分析工具通過多個專業的角度來檢查每個訪談——一個心理學家對個性特徵的看法,一個行為經濟學家對決策模式的看法,一個政治科學家對意識形態立場的分析,以及一個人口統計專家對上下文解讀。
一旦這種多維分析完成,AI就能更好地理解被試對象的個性運作方式,獲得比僅僅基於統計預測最可能行為更深入的洞察。結果是一組由GPT-4o驅動的AI代理,能夠在不同受控情景下複製人類行為。
測試表現驚人成功。“生成代理在普通社會調查中以85%的準確度複製參與者的回答,與參與者兩周後複製自己的回答的準確度相當,并且在預測人格特徵和實驗複製結果方面表現相當良好,”該研究稱。該系統在複製五大人格特徵方面表現出色,實現了0.78的相關性,並在經濟決策遊戲中表現出0.66的標準化相關性。(相關係數為1表示完美正相關)
特別值得注意的是,與傳統基於人口統計的方法相比,該系統跨種族和意識形態群體減少了偏見——這似乎是許多AI系統的問題,這些系統難以在刻板印象(假設主體會展現其所屬群體的特徵)和過於包容(避免統計/歷史事實假設以確保政治正確)之間找到平衡。
“我們的架構相比給予人口統計描述的代理,減少了跨種族和意識形態群體的準確性偏見,”研究人員強調,暗示他們基於訪談的方法在人口統計分析中可能非常有幫助。
但這不是第一次利用AI來對人進行檢視。
在日本,alt Inc.的CLONE dev平台一直在通過生活日誌數據整合進行人格生成的實驗。他們的系統結合了先進的語言處理和圖像生成技術,以創建反映用戶價值觀和偏好的數字克隆。alt In在一篇官方博客中表示:“通過我們的P.A.I技術,我們致力於將整個人類數字化。”
有時,您甚至不需要量身定做的訪談。以MileiGPT為例。一位來自阿根廷的AI研究人員能夠通過數千小時的公開可用內容對開源LLM進行微調,並複製阿根廷總統哈維爾·米萊的溝通模式和決策過程。這些進步已經引領研究人員探索思考/有意識的“數字孿生”這一概念,技術分析師和專家如Rob Enderle相信,在未來10年內可能完全功能。
當然,如果AI機器人不會取代您的工作,您的AI孿生可能會。Enderle告訴BBC:“這些的出現將需要大量的思考和倫理考慮,因為我們自己思考的復制品對雇主可能非常有用。”“如果您的公司創建了您的數字孿生,並說,‘嘿,我們有這個不付薪水的數字孿生,為什麼還要雇用您?’”
事情可能看起來有些可怕。不僅深偽會模仿您的外觀,而且AI克隆也將能夠根據對您行為的簡短檢視來模仿您的決策。儘管史丹佛的研究人員已經確保設置了保障措施,但明顯的是,人類和數字身份之間的界線正變得日益模糊。而我們已經在跨越這條線。