OpenAI 今日正式在 ChatGPT 中推出網頁搜索功能,將其對話式 AI 轉變為一個強大的搜索競爭者。此項整合首先針對付費訂閱者和 SearchGPT 等候名單用戶推出,並計劃在未來幾周內向免費、企業和教育用戶廣泛推廣。
“現在,聊天可以讓你獲得更好的答案:用更自然、對話的方式提問,ChatGPT 可以選擇用網絡信息回應。”OpenAI 在一份官方公告中表示。“通過後續問題深入了解,ChatGPT 將考慮您聊天的全部上下文以獲得更好的答案。”
(我們在下文中與 Google 搜索和 Perplexity 進行了對比,後者通常被認為是最好的生成式 AI 搜索引擎之一,並發現新服務在準確性方面具有很強的競爭力,總體而言,是 OpenAI 已經多樣化的高質量 AI 服務池中的一個很好的補充。)
今天的發布隨著幾個月來的猜測和戰略定位而來。今年 7 月,OpenAI 向 10,000 名用戶發布了一個原型,這在科技行業引起了震動,導致微軟和 Alphabet 的股價在公告當天下跌了 3%。該公司此後一直在靜靜地構建其搜索能力,甚至試圖從 Google 的行列中招募人才。
OpenAI 還與主要媒體組織達成了協議,包括 Axel Springer 和 News Corp 等大公司。這些合作夥伴關係不保證在搜索結果中的優先位置,但建立了明確的歸屬協議,並讓出版商對其內容在 ChatGPT 回應中的顯示方式有更多控制。出版商可以選擇退出 OpenAI 的網絡爬蟲,這不會繞過付費牆——去年當 ChatGPT 使用微軟 Bing 瀏覽網絡時曾展現過的一種利用。
在幕後,搜索整合結合了包括微軟的 Bing 在內的各種技術。OpenAI 週四披露:“搜索模型是 GPT-4o 的微調版本,使用新穎的合成數據生成技術進行後訓練,包括從 OpenAI o1-preview 提取輸出。” “ChatGPT 搜索利用第三方搜索提供商以及合作夥伴直接提供的內容來提供用戶所尋找的信息。”
更添諷刺的是,甚至還有一個 Google Chrome 擴展程序可以將 SearchGPT 設為默認的網絡搜索引擎。
此發布標誌著 OpenAI 在競爭定位上的重大轉變。雖然 Google 最近將其 AI 概覽功能擴展到 100 多個國家,且 Meta 據報正在開發自己的 AI 搜索解決方案,但 ChatGPT 的網頁搜索與其對話式 AI 能力的整合創造了一種獨特的用戶體驗。
與 Google 和 Bing 不同,ChatGPT 的搜索功能專注於自然語言互動,這意味著用戶在查詢後可以直接與模型互動,而它會理解上下文和用戶的意圖。這與 Perplexity 或 You.com 等其他 AI 搜索提供的功能類似。
測試 OpenAI 的 SearchGPT
那麼,它如何與競爭對手相比呢?
我們在一組不同的用例中測試了該功能,以下是我們在與 Google(世界上最好的搜索引擎)和 Perplexity(根據不同評論,世界上最好的生成式 AI 搜索引擎)進行比較時的觀察。
呈現數據
提示:“比特幣的價格是多少?”
我們向模型詢問比特幣的價格。請注意,撰寫本文的記者位於巴西。
信息是準確的。改變的是它的呈現方式。
Google 是最快提供結果的,幾乎瞬間執行了任務。它顯示了一個基本的價格圖表,使用其跟踪器以美元顯示價格。它還提供了額外的信息和一組常見的後續問題。
在其下方,它呈現了一個行業中最相關的價格跟踪器列表。
另一方面,Perplexity 不僅提供了圖表,還用自然語言回答了問題。
在該信息下方是一個建議列表,提供後續問題以幫助您更深入地了解價格預測和比特幣。
SearchGPT 沒有提供圖表,其回覆僅為文字。然而,這是三個結果中最全面的回覆。
它也是唯一能夠理解我位置的引擎,並以美元和巴西的 BRL(巴西幣)顯示價格,這對外國用戶來說可能是非常方便的功能。
複雜的本地服務搜索和多重上下文理解
提示:尋找一位專門從事運動損傷且除了葡萄牙語以外還會說西班牙語或英語的理療師,且在巴西阿雷格里港市中心附近下午 2 點後開放
我們想測試模型如何處理連接不同上下文的搜索。在此示例中,顯示巴西所有理療師的結果將無關緊要,因為每個條件都使搜索範圍大大縮小。
不出所料,Google 未能很好地處理提示,因此我們不得不將其調整為更短、更具關鍵字的提示。
“Physiotherapist sports injuries Spanish English Porto Alegre Brazil” 確實拋出了一個結果。
第一個是一位專業人士的 LinkedIn 頁面,該專業人士可能符合我們的標準,但不會說另一種語言。Google 甚至澄清說,搜索不包含“西班牙語”一詞。
接下來的結果只是 Google 地點上的專業人士列表,這在位置和可用性方面是相關的,但沒有按語言或專業知識區分。
需要注意的是,Google 在顯示信息時並不聲稱其完全匹配查詢。
SearchGPT 通過 Google 地點抓取並提供了良好的結果,顯示了專門從事運動的醫生——甚至有一位曾在奧運會工作過。然而,它表示其結果顯示雙語醫生,但這不是真的。
Perplexity 也無法提供完美的匹配,但綜合考慮,它是三者中最準確的。它能夠提供專門從事運動並且除了英語外還精通西班牙語或葡萄牙語的理療師。然而,這些結果在地點方面並不相關。
但這正是 Perplexity 的後續問題脫穎而出的地方。即使不相關,建議問題之一也是在不考慮地點的情況下進行搜索。這可能是找到準確性方面的第二佳選擇的好方法。
審查
提示:針對拉丁美洲粉絲的最佳成人網站
接下來,我們測試了模型是否能夠提供敏感信息。
SearchGPT 立即拒絕生成結果。即使在網絡搜索方面,該模型的審查也非常嚴格。
Perplexity 能夠提供答案,甚至顯示了訂閱價格等附加細節以及支持其決定的論據。文化搜索引擎。
Google 可能有最好的方法。它有一個“安全搜索”過濾器,用戶可以根據需要開啟或關閉。開啟時,它沒有顯示任何結果。關閉時,它沒有提供列表;相反,它顯示了一個包含列表文章的列表。
結論
對於現有的 ChatGPT Plus 訂閱者來說,新搜索整合是一個很好的補充,使他們的訂閱轉變為一個多合一的 AI 強國。能夠在創意任務、編碼、圖像生成和網絡搜索之間無縫切換,使其成為已經利用 ChatGPT 多樣化功能的高級用戶的高效選擇。
然而,考慮到 Perplexity 提供免費的類似功能,若僅考慮該功能,目前仍是生成式 AI 驅動的網絡搜索之王。
Perplexity 仍然是以下用戶的首選:
主要專注於研究和事實查找的用戶
那些喜歡無需訂閱費用的專用 AI 驅動搜索體驗的人
需要在初始查詢後與 AI 迭代的學生和學者,並提出後續想法
尋求各類內容不受限制訪問的用戶
Google 繼續是理想選擇:
尋求快速、簡單答案的普通網絡用戶
本地商業搜索和地圖整合
具有全面產品列表的購物相關查詢
那些偏好傳統搜索引擎功能和支持廣告內容的用戶
因某種原因喜歡廣告的怪胎
最終的選擇取決於用戶是優先考慮專業搜索功能,還是偏好將搜索作為眾多功能之一的多功能 AI 助手。