UCSD首個智能體瀏覽器發布!多頁面設計,顛覆傳統交互
我們早已習慣那排擁擠的標簽頁,這種線性堆疊在信息發現與跨頁整合時不僅加重負擔,也制造了高昂的管理成本。

預訂旅行酒店便是例子:用戶需在多個選項間權衡比較、了解均價,并結合機票與活動隨時調整計劃,而單頁式瀏覽器迫使用戶反復切換界面,頻頻丟失上下文。
即便是基于傳統范式的AI瀏覽器,如Arc的Dia或Perplexity的Comet,也只是在單頁框架下加入了智能體功能。
用戶一次只能啟用、控制并追蹤一個智能體,難以真正擴展為成規模的網頁自動化工作流。
AI智能體的最大潛力,就是將我們從細節性的任務中解放出來(點按按鈕、填寫表單),從而在復雜的信息空間和工作中縱覽全局,操控成百上千的智能體為我們收集、整理、匯總信息,生成報告并完成任務。
然而,現在還沒有一個為此而設計的交互界面。

那么,我們應該怎樣重新定義瀏覽器的界面,讓用戶可以縱覽、比較多個網頁之中的信息,同時調度指揮多個AI智能體?
為調度智能體而生的瀏覽器
為此,加州大學圣地亞哥分校的研究者設計了Orca瀏覽器,把視角拉遠,讓用戶可以在無限的畫布空間中瀏覽、管理網頁,并部署、調度自動化智能體來提取相關的信息并完成具體的操作。

論文鏈接:https://arxiv.org/pdf/2505.22831
項目鏈接:https://orca.jiang.pl

Orca最核心的設計探索,就是將網頁不再看作我們只能瀏覽、操作的固定界面,而是人人可以根據自己的任務和需求實時并行查看、靈活提取、動態重組的可塑材料(malleable materials)。
而瀏覽器也不再僅是渲染網頁的容器,而是可以根據用戶現實的需求動態變化的可塑空間(malleable space)。在這個環境中,用戶和AI可以協作,將這些「網頁材料」組合成一個定制化的工作區。
在這種理念下,用戶可以對多個網頁同時進行導航、操作和整合。研究者將這一過程定義為「編排」(orchestration)。

在這個過程中,AI扮演著促進者的角色:它加速重復性工作,成倍地拓展用戶可接觸的信息,并幫助他們理解;而用戶可以選擇性地深入研究、監控把關AI的執行。
最終的控制權始終掌握在用戶手中,從而讓用戶真正實現大規模瀏覽(browsing at scale)。
Orca如何實現大規模瀏覽?
基于新的空間化的瀏覽范式,研究者設計了一整套針對復雜信息空間中各種信息任務的交互原型。
大規模查看
Orca提供一個空間化的網頁畫布:把多個網頁當成可拖拽/縮放的對象,就像在Figma里排版。用戶可并排對照、按任務分簇,隨探索范圍擴大而能夠在縮放中縱覽全局。
大規模管理
用戶可將網頁按網格或堆棧排列,或是把一組網頁轉換成表格以提取最重要的信息,比如酒店價格、設施的結構化對比。

大規模導航
Orca提供兩種快速而規模化探索網頁的方式。

對搜索結果等密集鏈接頁,用戶可以通過LLM一次性「批量打開」多個符合條件的鏈接。

或者,Orca可以基于當前頁語境給出自動的「情境擴展」建議(如在訂酒店時建議查機票、跨平臺同店比較),用戶可以通過拖拽靈活地控制打開多少頁面。
大規模提取
用戶可以用自然語言同時從多頁抽取關鍵信息(如Wi-Fi、價格、營業時間),并把答案以統一小卡片顯示在每頁上面,便于快速掃過所有網頁。

大規模操作與匯總
最后,用戶可以便捷地在每個頁面中部署調度不同的智能體以完成情境下的任務。每個智能體通過不同顏色的虛擬光標來顯示,以方便用戶追蹤和查看。

和許多其他AI瀏覽器一樣,用戶也可以選擇單個或多個網頁,并對它們進行提問,如果當前頁信息沒有辦法回答用戶的問題,Orca 將會自動部署智能體進行探索并找到答案。
用戶實驗
「再也不怕打開大量頁面了」
研究團隊對8名參與者進行了一項初步的實驗室研究,以評估Orca的有效性。結果非常積極:
激發更強的探索欲
由于Orca顯著降低了管理和導航多頁面的成本,參與者表示更愿意探索更多內容。一位用戶評價道,「現在的一次點擊相當于過去的很多次點擊」。尤其是頁面提取功能,讓用戶「再也不怕一開始就打開一大堆頁面」,因為它能幫助快速篩選信息。
空間布局直觀易用
所有參與者都認為空間畫布易于使用,無論其經驗如何。他們喜歡這種「鳥瞰圖」式的體驗,認為這有助于清晰地掌握自己的探索進度。
增強控制權與信任感
與全自動 AI 搜索引擎相比,用戶在使用 Orca 時感覺對信息來源有更強的控制力,因此更信任其結果。
他們可以親自驗證 AI 的發現,并主導研究過程,而非「盲目」接受摘要。
例如,用戶可以指定 AI 僅從其信任的社區頁面中生成摘要。
總結
Orca 項目展示了一種與當前主流的全自動化AI智能體不同的發展方向。它沒有將用戶從瀏覽過程中「移除」,而是通過AI賦能,將用戶提升為一位「指揮家」,在可塑的瀏覽器空間中,大規模地「編排」海量網頁信息。
這項研究為未來瀏覽器的設計指明了一個充滿希望的方向:將AI能力深度整合到個人化、用戶驅動的信息任務中,在降低認知與交互成本的同時,保留并增強用戶的自主權、參與感和創造力。
Orca 原型將會開源,以促進社區對大規模網頁瀏覽和并行智能體自動化的進一步探索。想查看更多信息及加入等候名單可前往https://orca.jiang.pl。


作者信息
江沛嶺,目前博士就讀于加州大學圣地亞哥分校。本科畢業于紐約大學。他的研究廣泛地將新穎的交互設計應用于復雜多變的信息系統與任務之中。

個人主頁:https://jiang.pl
夏海峻,目前任教于加州大學圣地亞哥分校認知科學系,領導 Foundation Interface 實驗室,研究人機交互并探索以可塑的信息與界面為基礎的人機協作新范式。本科畢業于清華大學。

個人主頁:https://haijunxia.ucsd.edu



























