清晰的溝通對於當今的全球勞動力至關重要,但對於某些人來說,這比其他人容易得多。
在週二,Krisp,一家音頻人工智能軟體開發公司,推出了一款口音轉換工具,旨在通過改變一個人聲音傳達給聽者的方式來打破語言障礙。
儘管這項技術承諾促進包容性,但它也引發了對文化偏見、文化身份以及“聽起來專業”意味著什麼的擔憂。
Krisp的人工智能口音轉換器旨在通過消除感知偏見,確保一個人的口音不會影響客戶對其專業或可信度的看法,從而實現更具包容性和公平的招聘實踐。
根據Krisp的共同創始人Arto Minasyan的說法,最近的一項研究顯示客戶與聯絡中心之間存在顯著的感知差距。
“在我們的研究中,79%的美國客戶表示他們要求非母語英語的代理在每次通話中至少重複一次,而只有33%的聯絡中心認為這種情況會發生,”Minasyan告訴Decrypt。“這個差距導致雙方的滿意度下降和挫折感。”
Minasyan指出,公司要麼拒絕口音濃重的候選人,平均使64%的代理人被淘汰,要麼不得不投資於昂貴的口音訓練。
從過去到現在
Krisp由Minasyan和Davit Baghdasaryan於2017年創立,是一家總部位於加利福尼亞州伯克利的基於人工智能的音頻處理軟體公司。它專注於實時噪音和語音抑制技術。
Minasyan解釋說,該工具不區分口音,而是將語音轉換為符合特定目標口音。在轉換過程中,Krisp捕捉用戶聲音的特徵並將其納入最終輸出中。
“這種方法有助於保持更自然的聲音,並保留原始輸入的情感基調,”他說。
雖然用戶可以實時開啟和關閉人工智能口音轉換器,但Minasyan表示,目前尚無法調整轉換級別的選項。
儘管人工智能口音工具可能改善就業機會,但它們也存在被濫用的風險。
這些擔憂促使FBI在2024年5月發出警告,稱詐騙者利用人工智能驅動的語音軟體進行網絡釣魚詐騙。
在2024年總統選舉之前,FCC禁止使用人工智能生成候選人聲音的自動撥號電話,此前一個深度偽造的時任總統喬·拜登的聲音被用來試圖欺騙新罕布什爾州的選民不投票。
當被問及網絡犯罪分子濫用的潛力時,Minasyan承認了這些風險,並指出Krisp的工具像手機、筆記本電腦或互聯網一樣,可能被利用,儘管其初衷是良好的。
“雖然我們認識到濫用是個擔憂,但在不妨礙用戶隱私的情況下,完全監控該工具的使用是不可行的,”他說。
不過,人們仍然希望這項技術主要用於善良的目的,而非其他用途。
“我們並未直接諮詢社會語言學家,但在將技術廣泛應用之前,我們已在實際環境中對其進行了測試,”Minasyan說。
創始人指出了幾個內部指標,包括淨推廣者得分改善99%、銷售轉化率增長超過26%以及代理推廣者得分提升12.2%,展示了“更高的代理信心”。
“在用戶和客戶兩方面看到這些改善,增強了我們的信心,認為這項技術不會帶來重大文化或商業上的負面影響,”他說。
編輯:Sebastian Sinclair