語境聚合才是人工智能真正的戰場

人工智能模型掌握的語境信息越多,用戶體驗就越好。如果一家人工智能公司掌握的關于你的語境信息比其他公司多100倍,那么它就擁有了巨大的競爭優勢。語境信息之爭比一系列人工智能瀏覽器之爭更為重要。
一、什么是語境
假設你結婚30年,有三個孩子,住在北京。想想這30年來你積累了多少關于生活、家庭、他們的喜好、愿望、問題等等的知識。誰更適合回答關于你過去30年生活的問題?谷歌、亞馬遜、Meta、DeepSeek?還是你的配偶?當然是你的配偶。他們擁有幾十年的生活閱歷。
向LLM提問:
“我應該如何改造我的主浴室?”
再說一遍,僅僅問這個問題,他們沒有任何背景信息。他們不知道你現在的浴室是什么樣子,也不知道它和你家其他部分的風格是否協調。這樣的回答不會被認為很好,也不會很相關。所以,那些對人工智能持懷疑態度的人,如果嘗試用這種方式回答,會覺得人工智能不太好。但如果你問你的配偶這個問題,你會得到一個更相關的答案。
人工智能模型需要與情境、問題或對話相關的背景信息,才能生成準確、快速且有用的答案。背景信息可以包括:
?聊天記錄
?用戶意圖。您想要實現什么目標?
?領域或任務。這是指編程、寫作、醫學、歷史等方面的內容嗎?
?外部數據:智能手機、Google 云端硬盤、印刷材料等上的數據和信息
?世界知識。關于時間、地點、人物、相關實體的事實。
這不僅僅是大數據的問題。情境是豐富、關聯、基于時間、感知位置且不斷演進的關于你所處世界的知識。想想已婚配偶的例子:情境就是信息,是經驗。它是對你偏好、習慣和過往經歷的切身理解。從這個意義上講,情境可以被視為一種數字配偶……真正了解你的人工智能。(嗯,現在聽起來有點詭異。)
在京東商城上,您可以親身體驗到語境信息的應用。它知道您購買過什么以及搜索過什么。因此,當您再次訪問時,會看到“繼續上次購物”的提示,或者推薦您可能喜歡的商品。此外,它還會建議您重新購買之前購買過的商品。
例如,Instagram Reels 每秒都會運行一個復雜的算法,根據你過去的觀看記錄,為你提供更多你可能喜歡的短視頻。但它對你的亞馬遜購物記錄、谷歌搜索記錄、健康信息、電子郵件、旅行記錄、好友關系,甚至你 iPhone 上的所有信息都一無所知。如果它知道這些呢?
這家名為 MemO 的初創公司致力于保存語境信息。它允許用戶保存與不同學習記憶庫 (LLM) 的交互記錄,并在不同的 LLM 之間共享這些記憶,從而最大限度地減少令牌的使用和重復學習。但在這個系統中,用戶完全掌控著自己的記憶語境。
二、并非所有人都在今天使用人工智能
盡管媒體和市場大肆宣傳,但并非所有人都接受了人工智能。對于人工智能公司而言,挑戰不在于說服高級用戶,而在于轉化持懷疑態度的中間群體。這部分用戶才是市場的主要組成部分,也是機遇所在。
對于那些持懷疑態度的人來說,它面臨的問題與任何新技術都會遇到的問題相同:它有什么好處?它比我目前的方式好在哪里?我的同事/朋友在用它嗎?為什么要改變?
持懷疑態度的中立人群不會因為模型質量而接受人工智能;只有當人工智能讓他們感到個性化、有用且無摩擦時,他們才會接受它;而且,當人工智能擁有足夠的語境信息,能夠為中立人群想要完成的任務提供獨特的用戶體驗時,他們才會接受它。
三、語境聚合
情境聚合是指持續收集和連接用戶生活的每一個片段——他們購買、觀看、閱讀、寫作和說話的內容——形成一個統一的理解。其回報是獲得一種高度個性化的體驗,這種體驗幾乎如同心靈感應一般。每一個精彩的回答都會訓練你提供更多信息,從而創造出一種復利優勢,這種優勢可能會遠遠超過當今的搜索或社交護城河。
這種優勢促使你不斷地向語境聚合器提供信息,使其看起來比你更了解你自己。這構成了一道巨大的競爭護城河,其規模可能超過迄今為止任何其他消費者領域的護城河。
語境聚合是成為以人工智能為中心的新型聚合器的方法,正如Ben Thompson 在聚合理論中所定義的那樣。
通過整合用戶語境信息,以人工智能為中心的公司可以提供獨一無二的卓越用戶體驗(超越同類最佳水平),這是用戶從未體驗過的。它能提供答案,幫助用戶更高效地完成工作,其效果遠超以往,甚至超出用戶的想象。
如今的平臺已經出現了部分內容聚合的現象。問題在于,每個平臺都只包含你生活的一部分。
你目前的信息分散在許多不同的科技公司中。谷歌和Meta都是信息聚合商。他們根據你與他們服務的互動情況了解很多關于你的信息。但他們也有很多信息不了解。
你通過谷歌搜索旅行目的地。他們或許能看到你發送的航班和酒店預訂確認郵件,但不會知道你旅行的全部細節。然而,你手機里的照片卻可能記錄了這一切。
想象一下,如果你在 ChatGPT 上搜索旅行目的地,然后佩戴一個 OpenAI 的語境捕捉設備,它能記錄你去過的所有地方、吃過的食物、住過的地方。有了這些信息,他們是不是就能更好地為你推薦未來的旅行目的地了?也許他們會在你感興趣的地點推送機票和酒店的優惠信息。如果他們提供的建議和細節讓你驚喜不已,你會不會更愿意繼續提供更多信息?而且,如果這一切都是免費的呢?
四、摩擦問題:為什么多模態人工智能至關重要
目前的語言學習模型(LLM)是文本預測模型。輸入和閱讀文本是人工智能應用于大眾市場的一大難點。
多模態輸入能夠加速人工智能的發展。每一種新的輸入方式——語音、照片、攝像頭、傳感器——都能降低提供語境信息的成本。這就是為什么多模態人工智能的普及速度將遠超網絡或移動技術。
對于那些持懷疑態度的人來說,語音和照片似乎更容易被接受。你現在就可以上傳照片,征求別人對房間重新裝修的建議。但這并非人人都知道。而且,一張照片并不能展現房屋的全貌,也無法體現居住者對室內設計的偏好。照片固然有幫助,但它仍然只是冰山一角。它無法展現房屋的全貌,也無法了解你之前的選擇,更無法得知你伴侶的喜好。
再說一遍,如果你佩戴的設備可以在你走動時拍攝你家的照片,并允許你在需要時提供語音解說,那么就能以更少的阻力捕捉到更多相關的語境信息。
降低摩擦不僅能更快地構建情境,還能增強網絡效應。每個新用戶都會為系統貢獻更多有意義的情境。
五、優勢飛輪
像谷歌、Netflix、亞馬遜、Meta 和 Airbnb 這樣的現有聚合平臺服務于非常廣泛的橫向市場。正如本·湯普森在《聚合理論》中所指出的,它們服務的用戶越多,服務質量就越好。
這里存在一些差異。信任和隱私將在用戶是否愿意提供更多背景信息方面發揮更大的作用。而且,毫無疑問,人工智能提供的結果必須至少在某些特定方面表現出色,才能使這種良性循環發揮作用。

如果采用語境聚合技術,情況會如何發展?人工智能公司是否有可能聚合足夠的語境信息,從而無需為新用戶提供過多的語境信息,就能為其提供獨特的用戶體驗?或許他們可以從新用戶那里獲取足夠的語境信息,從而預測出許多用戶未提供的語境信息?這將使人工智能公司能夠更快地整合其聚合信息。
小結
當然,語境聚合涉及諸多深刻的倫理和隱私問題。這本身就是一個龐大的話題,值得單獨探討。當然,監管也是一個需要全面討論的話題。
在這場戰爭中,最終的贏家并非擁有最龐大模型或最佳人工智能瀏覽器的一方,而是那些擁有最豐富、最值得信賴的語境信息,服務于最多用戶,并將這些信息轉化為前所未有的獨特用戶體驗的一方。這種用戶體驗不僅能精準滿足用戶的需求,更能帶來遠超預期的豐富體驗。這樣的體驗將進一步鞏固語境聚合器在人工智能領域“幾乎包攬一切”的地位。
但是,要想獲得成功,這樣的用戶體驗必須幫助大眾,尤其是那些持懷疑態度的中間群體,以他們從未想過的方式更快、更輕松、更經濟地完成事情。而且,正如我所說,它必須以一種令用戶驚嘆不已的方式呈現,超越他們的想象。
如果一家以人工智能為中心的公司想要贏得情境戰爭,它應該開發哪些類型的服務和設備?當薩姆·奧特曼談到實現超級智能時,這在情境戰爭中扮演著怎樣的角色?用戶是否需要感受到他們擁有超級智能,才能與具備豐富情境信息的人工智能伙伴建立聯系?
最后,我們來做一個思想實驗:試著想想,一個超級智能的人工智能會為你做哪些事情,讓你考慮向它提供更多關于你的信息。
對于軟件開發人員來說,編碼就是一個很好的微觀例子。像 Claude Code(以及其他類似工具)這樣的工具了解你的整個代碼庫、文檔、測試和提交歷史。你之所以信任它們,是因為它們返回的結果往往令人驚艷。
同樣的信任循環,語境帶來更好的結果,從而帶來更多信任,這將決定語境聚合之戰的贏家。


























