Manus爆火的秘密武器Browser Use融資1700萬美元!讓AI「讀懂」網(wǎng)頁
AI智能體可能還沒有一個大家都認可的定義,但這并不妨礙一大堆創(chuàng)業(yè)公司爭相打造智能體工具,來自動化處理各種任務。
其中一家名為Browser Use的公司尤其吸引開發(fā)者與投資人的關注,因為他們的工具能使智能體更容易地「讀懂」網(wǎng)站。
據(jù)最新報道,Browser Use剛融了一筆1700萬美元的種子輪資金,由Felicis的Astasia Myers領投,Paul Graham、A Capital和Nexus Venture Partners跟投。此次融資之前還沒被報道過。

網(wǎng)站地址:https://browser-use.com
Browser Use是Y Combinator 2025冬季班的一員,最近幾個月隨著智能體的爆火而名聲大噪。
尤其是火出圈的Manus也用了Browser Use工具,一下子就把它的知名度推到了新高。
Browser Use的創(chuàng)辦人是Magnus Müller和Gregor Zunic,他們去年通過蘇黎世聯(lián)邦理工學院的創(chuàng)業(yè)加速器創(chuàng)辦了這個項目。
Müller多年來一直在研究網(wǎng)頁抓取工具,2024年他在讀數(shù)據(jù)科學碩士時認識了Zunic。Müller說,他們倆一塊兒琢磨出了把網(wǎng)頁抓取和數(shù)據(jù)科學結合起來的想法,打算讓瀏覽器自己完成任務。
Müller和Zunic花了五周時間做出了個Browser Use的demo,結果一炮而紅。后來,他們干脆把Browser Use開源了。

簡單說,Browser Use是把網(wǎng)站上的按鈕和元素拆解成一種更容易理解、更像「文本」的格式給智能體用。
這能幫助AI智能體搞清楚網(wǎng)頁有哪些選項,然后自主做出決策。
「好多智能體靠的是視覺系統(tǒng),通過截圖來瀏覽網(wǎng)站,但這過程中老出問題。」Müller說,「我們把網(wǎng)站轉化成智能體可以理解的東西,這種方法能讓我們以更低的成本反復運行相同的任務。」
隨著越來越多的AI公司想讓他們的智能體跟網(wǎng)站交互得更順暢,Müller覺得Browser Use能成為滿足這些需求的「底層技術」。
他還表示,現(xiàn)在Y Combinator冬季班里有20多家公司都在用Browser Use滿足自己的需求。
有些公司還跑來問他們,怎樣才能使得智能體更容易地瀏覽自己的網(wǎng)站?
Müller說,「像LinkedIn這樣的網(wǎng)站,總是改變網(wǎng)站的功能,智能體在這種情況就經(jīng)常出錯。」
Felicis的Myers說,他們過去幾年一直在關注AI智能體領域,而Browser Use就是一個很好的投資機會。
她說,Browser Use的創(chuàng)始團隊——以及他們開源為先的策略——徹底打動了自己。
「我們覺得網(wǎng)頁AI智能體是下一個前沿技術,能真正使得人類任務實現(xiàn)端到端的自動化,」Myers對TechCrunch說,「網(wǎng)頁AI智能體就像是一座動態(tài)橋梁,連接著靜態(tài)預訓練模型與不斷變化的數(shù)字世界,而這些靜態(tài)模型往往只專注于文本。」
Browser Use:讓智能體簡單地瀏覽網(wǎng)頁
Browser Use可以使AI智能體簡單地瀏覽網(wǎng)頁。
它在GitHub上開源,許多項目都使用了它的功能,目前已經(jīng)獲得超過47k個Star了。

項目地址:https://github.com/browser-use/browser-use
Browser Use通過提取網(wǎng)站的交互元素(如按鈕、表單等),使AI能夠自動化執(zhí)行瀏覽器操作,例如填寫表單、搜索信息或導航網(wǎng)頁。
這對于開發(fā)AI驅動的網(wǎng)絡智能體非常有用。
比如,它可以將商品添加到你的購物車,并完成結賬。
甚至是閱讀你的簡歷,然后幫你找工作!中途如果有需要,還會停下來等待你的指示。

它也可以幫你干活兒。
比如,讓它在Hugging Face上查找具有cc-by-sa-4.0許可證的模型,然后按點贊數(shù)排序,將排名前5的模型保存到文件中。
從MCP到Browser Use的爆火
Browser Use是隨著智能體的快速發(fā)展而爆火起來的。
去11月,Anthropic首次提出「模型上下文協(xié)議」,即MCP,賦予了Claude模型超級能力,一次構建,讓AI與工作流深度集成。
用通俗的話講,MCP就像是專為AI應用設計的通用接口,類似我們日常使用的USB-C。
正如USB-C簡化了不同設備與計算機的連接方式,MCP簡化了AI模型與數(shù)據(jù)、工具和服務之間的交互方式。
通過MCP,AI助手不僅能夠「讀懂」代碼,還能「理解」團隊討論、涉及文檔等外部信息,提供更加精準的回答。

今年1月,OpenAI推出了Operator,能夠自主執(zhí)行網(wǎng)絡任務,如規(guī)劃假期、填寫表單或預訂餐廳 (OpenAI Launches Operator)。
Operator使用名為Computer-Using Agent (CUA)的AI智能體,通過視覺界面控制網(wǎng)頁瀏覽器,模擬人類點擊、輸入和滾動的操作。
這一工具展示了AI智能體在網(wǎng)絡任務自動化中的潛力,但也需要用戶在遇到復雜界面或驗證碼時介入。

差不多同一時間,Browser Use也開源了,它被Manus團隊集成到了Manus智能體中。
Manus因其綜合能力和友好的用戶界面(如實時顯示思考過程)而迅速走紅,吸引了大量關注。
這直接推動了Browser Use知名度的提升。


























