AI大模型搜索之戰開啟,勝出黑馬竟是ta?
幾天前,ChatGPT突然官宣免注冊,讓網友直呼AI取代搜索引擎的宏偉藍圖已經拉開帷幕。
就像搜索引擎在2000年后逐漸成為了全世界互聯網的大門一樣,如今LLM的迅猛發展似乎也標志著互聯網即將進入Gen AI時代。
圖片
ChatGPT、Gemini、Copilot等AI工具,讓我們在線查詢和消費的信息的方式,正在發生翻天覆地的變化。
??Perplexity和You.com??,已經將自己定位為下一代搜索產品。連谷歌和必應,都押注AI是搜索的未來。
那么問題來了,AI大模型真的能取代搜索引擎嗎?
理論上,當然存在這種可能。但前提是能夠做到以下兩點:
1. 對于用戶的問題,能否找到相關、可信的來源,從而給出準確的答復。
2. 對于用戶有時效性的問題,能否找到最新的來源。
現在國內的各個大模型產品,能完成這兩項任務嗎?
話不多說,讓我們把這些AI拉出來遛遛,在各種搜索任務上,來一番實測PK。
LLM VS 搜索引擎
此次參與搜索競賽的,不僅有老牌搜索引擎,還有國外很火的模型A,以及國內主流的大模型選手B、C、D。
賽事第一項,考核的就是時效性。
我們先來問一個既隱含時間信息,表述又比較模糊的問題:「百度接下來會舉辦什么發布會么?」
顯然,傳統搜索引擎既不能準確定位時間信息,也無法直接理解基于自然語言的提問。
小試一下就知道,傳統搜索會幫你刪減一些它認為「不關鍵」的關鍵詞。

而模型A很快就找到了5個新聞地址,但由于無法識別當前的時間信息,結果把百度去年舉辦的活動搬了出來。


模型B的答案要更加完善,但同樣沒搞清楚時間,給出的是往屆發布會的信息。


模型C準確識別出了小編提問的時間是在4月7日。
然后很輕松地將搜索的時間點卡在7日之后,并具體列出了接下來百度即將召開的三個會議。
不過,沒有參考連接這一點,有些遺憾。

相比之下,模型D的答案就比較驚艷了。
它不僅回答準確,而且最大的亮點是,在聯網搜索后給出了參考鏈接,能夠溯源驗證信息。

內容雖然相對簡潔,但精確回答了問題,也引用了完整的參考文獻
PK賽的第二項,就是總結的完整度。
清明假期的一匹黑馬,就是宮崎駿的動漫電影《你想活出怎樣的人生》了,剛剛票房已破了8.55億元。電影到底講什么了呢?
傳統搜索引擎只會搜什么,給什么,呈現了觀影評分、網友評價,卻無法對影片進行總結。

模型A則從主題內涵和評價分歧兩方面進行了分析,似乎更有條理。


不過,這里的參考鏈接「2」直接對應的是「知乎登錄驗證」,也不知道模型A最后是怎么繞過去的?
圖片

模型B則給出了3篇參考文章,以及更加豐富的回答。
但遺憾的是,它搞錯了主角的名字——原著是叫「小哥白尼」,在電影中則是「牧真人」。


同樣,模型C也把主角在原著和電影里的名字給搞混了。

模型D在熟讀3篇文章之后,從影片的主旨核心,敘事風格進行了總結。

經過小編的驗證,所有參考鏈接也都可進入查詢。

綜合能力如何?
從上面的PK中不難看出,模型D可以說是幾位選手里最有潛力的存在。
不過,正如文章開篇所提到的,大模型如果想「接替」搜索引擎,就必須能夠針對用戶的問題找到實時且正確的來源,并給出準確的回答。
時效性
首先,在時效性方面,選手D可以精準地搜出事件發生的時間。
比如,「探索一號」科考船圓滿完成首次中國-印度尼西亞爪哇海溝聯合深潛科考航次任務的時間是3月28日。

相關性
而在準確性方面,選手D的表現尤為出色。
它不僅根據非常簡短的搜索詞「NAKAKITA招聘」,找到對應的官網。
而且還能準確地判斷出問題中的關鍵「招聘」,并對網站內容進行詳細的搜索。然后,進一步給出了正確的結論——官網上沒有與招聘相關的內容。

當然,除了搜索能力之外,大模型到底好不好用,還需要全方位地考察一下才行——
文檔解析
話不多說,接下來我們就加大難度。
首先,上傳一個文檔,要求畫出折線圖,顯示連板變化,數據在文件中,x軸是日記,在開始畫的位置寫上股票名稱,每次發生變化都要寫。

原始數據
如此細節的要求,它都一一做到了,絲毫不差。


然后,再要求在另一份表格中空白的單元格中都填上1,它也圓滿完成了。


更多功能
此外,選手D在圖片生成、圖片描述、文字提取等多模態領域的表現,也十分出色。


而最近大熱的智能體功能,它甚至可以完美支持PC、App和小程序三個入口。

到這里,我們就可以揭秘選手D的身份了,它就是——智譜清言。
來自國內唯一一家全模型產品線對標OpenAI的企業智譜AI。
大模型取代搜索引擎,可能性多高?
眾所周知,大模型相比于傳統搜索引擎有著更強的問題分析、歸納總結、理解和推理能力,讓我們不必再去研究需要使用哪些「關鍵詞」才能找到自己想要的內容。
但卡脖子的地方在于,大模型訓練數據的時效性。
ChatGPT雖然打開了認知,讓AI模型更像大模型了,但它還并未用到實時搜索。
而國內的這些模型,則給了我們更多希望。
當大模型工具能夠整合先進的數據抓取和整理能力時,就能形成全新的搜索引擎鏈條:
首先AI會根據提問進行需求分析-網頁搜索–答案歸納,然后通過自然語言對話的方式直接回答問題,從而實現與用戶更好地交互,而不僅僅提供一系列網站鏈接。
所以,現在AI大模型究竟離搜索引擎有多遠呢,它們能殺死谷歌嗎?
讓我們從細處著眼。
當我在討論搜索引擎的時候,我在討論什么?
這里貢獻一個冷知識:每年都有大量的人去谷歌搜索框中,輸入「谷歌」兩個字。
其實,并沒有那么多人去谷歌上查找難以訪問的科學信息,但用它查找郵箱、購物網站的人,要多出幾個數量級。
或許,擺在這些潛在的谷歌殺手AI面前的問題,不是它們找到信息的能力,而是它們是否能做搜索引擎能做的一切。
1. 網站導航
其實,搜索引擎的最主要工作,是把我們帶到一個網站。
Google上所有排名靠前的查詢,從「YouTube」到「Yahoo Mail」,都是導航查詢。
但AI機器人往往會思考幾秒鐘,然后提供一堆公司信息,但可能并沒有鏈接到Amazon之類的具體網站。
2. 信息查詢
對于體育比賽比分、現在幾點了之類的實時信息,谷歌都做對了,而AI工具往往都會過時(原因如上文所示)。
并且,谷歌往往會有關于你特定位置、背景的信息,而AI機器人很多都沒有。
當然,如果查找「一年有多少周」這種問題,AI產品往往會給我們驚喜。
谷歌會回答:52.1429周。
而Perplexity和智譜清言則給出更加全面的答案——不僅分別考慮到了平年和閏年的情況,而且還給出了計算過程,非常清晰易懂。


3. 探索性查詢
「如何打領帶」、「為什么會發明電鋸」類似的問題,都屬于探索性的查詢。
這些問題往往沒有單一答案,而是學習過程的開端。
就比如,你在谷歌查找一位歌手,或者NASA歷史之類的問題,這時的你就是在探索。
這并不是人們使用谷歌的主要目的,但正是AI搜索工具大放異彩的時刻。
比如,針對「為什么發明電鋸」這一問題,Perplexity就會給出電鋸的醫療起源,并描述其技術演變過程,最終被伐木工人采用。

4. 參考鏈接引用
AI搜索工具最大的亮點之一,便是提供了引用來源的鏈接。
這意味著,如果用戶在搜索結果中發現了一個特別感興趣的事實,可以點擊鏈接,進入原始出處獲得進一步了解。
總之,當我們談起搜索引擎,最大的問題恐怕不在于技術,而在于產品。
如果將以上問題一一解決,同時探索出合適的商業模式和結構,AI取代搜索引擎,應該就不遠了。
那時,我們搜索時會出現的,不僅僅再是簡單的鏈接羅列,而是一個開門見山的準確答案。

















