將科研臟活累活真·丟給AI!上海AI Lab推出深度科研智能體FlowSearch
將復(fù)雜科研過程自動化落地,上海人工智能實驗室推出FlowSearch!
在GAIA、HLE、GPQA以及TRQA等科研基準(zhǔn)上,F(xiàn)lowSearch不僅實現(xiàn)了性能全面領(lǐng)先,還展示了AI在復(fù)雜科研任務(wù)中的動態(tài)協(xié)作與深度推理能力。

展開來說,當(dāng)AI在問答基準(zhǔn)和標(biāo)準(zhǔn)化測試中表現(xiàn)卓越之時,其進(jìn)行科學(xué)研究的能力也在被更多關(guān)注。
科學(xué)研究不同于解題或信息檢索,它是一個開放性、長期且復(fù)雜的認(rèn)知過程——研究者需要提出原創(chuàng)問題、設(shè)計實驗方案、收集并整合多源證據(jù),并在不斷迭代中形成系統(tǒng)結(jié)論。
這樣的過程遠(yuǎn)超計算能力本身,它要求的是創(chuàng)新思維、動態(tài)推理能力以及對復(fù)雜知識關(guān)系的精準(zhǔn)掌控。
而FlowSearch,正是一個由動態(tài)結(jié)構(gòu)化知識流驅(qū)動的深度科研智能體。
它通過動態(tài)結(jié)構(gòu)化知識流構(gòu)建科研任務(wù)的多層依賴圖,并在多智能體框架下實現(xiàn)任務(wù)的并行探索、知識的遞歸整合和流程的自適應(yīng)優(yōu)化。
與傳統(tǒng)“輸入—計算—輸出”的封閉式AI不同,F(xiàn)lowSearch更像一個理解你研究思路的伙伴——當(dāng)發(fā)現(xiàn)新信息,它會主動調(diào)整計劃;當(dāng)證據(jù)鏈不完整,它會引導(dǎo)進(jìn)一步探索;當(dāng)推理偏離目標(biāo),它會進(jìn)行自我修正。
研究團(tuán)隊表示,它標(biāo)志著科研智能體從“被動工具”邁向主動探索伙伴的新階段,讓科學(xué)發(fā)現(xiàn)不再只是等待AI輸出結(jié)果,而是與AI一起探索、不斷前進(jìn)。
FlowSearch:讓AI成為你的科研探索伙伴
FlowSearch由三大核心模塊組成,每個模塊都像科研團(tuán)隊中的“關(guān)鍵成員”,協(xié)同完成復(fù)雜任務(wù):
1、Knowledge Flow Planner:規(guī)劃研究路線,像科學(xué)家一樣拆解問題、逐層細(xì)化制定任務(wù);
2、Knowledge Collector:執(zhí)行任務(wù)、收集信息,就像勤奮的實驗助理一樣整理數(shù)據(jù);
3、Knowledge Flow Refiner:反思和優(yōu)化整個研究流程,確保科研思路清晰、連貫、可持續(xù)。
當(dāng)你提出研究問題時,F(xiàn)lowSearch先由Planner構(gòu)建初步的知識流——每個節(jié)點代表一個子問題或關(guān)鍵概念,節(jié)點之間的連接描繪了知識依賴關(guān)系。
隨后,多名“智能體”同時開始執(zhí)行任務(wù),Collector不斷填充節(jié)點內(nèi)容,而Refiner會根據(jù)中間結(jié)果動態(tài)調(diào)整流程——增刪任務(wù)、優(yōu)化依賴,讓科研路徑像有生命一樣逐步演化。

動態(tài)結(jié)構(gòu)化知識流:科研的邏輯網(wǎng)絡(luò)
FlowSearch使用有向無環(huán)圖把科研任務(wù)和知識關(guān)系可視化。每個節(jié)點都攜帶任務(wù)類型(檢索、求解、回答)、描述和知識上下文,而節(jié)點間的邊定義了信息流向。
這種設(shè)計讓科研推理不再依賴線性順序,而能同時展開多條探索路徑,每一步都可追蹤和驗證。
換句話說,它不僅讓 AI 能“想清楚每一步”,也讓你能隨時理解科研過程的脈絡(luò)。
遞歸式知識流規(guī)劃:逐層拆解科研問題
高質(zhì)量的科研規(guī)劃源于逐層細(xì)化的專家式思維。Planner模塊采用遞歸擴(kuò)展策略——從總問題出發(fā),識別每一層需要細(xì)化的子任務(wù),生成新的節(jié)點和依賴關(guān)系。
這一過程持續(xù)進(jìn)行,直到形成完整的初始知識流。FlowSearch中的InternPlanner模型經(jīng)過結(jié)構(gòu)化科研任務(wù)數(shù)據(jù)微調(diào),能夠?qū)W習(xí)專家的拆解方式,讓AI的規(guī)劃既邏輯清晰,又穩(wěn)健可靠。
知識采集與動態(tài)反思:讓科研像“活”起來
Knowledge Collector執(zhí)行任務(wù)、收集信息,并把結(jié)果整理成節(jié)點知識,為后續(xù)推理提供輸入。
任務(wù)執(zhí)行完成后,Knowledge Flow Refiner會啟動反思機(jī)制:它能根據(jù)新信息調(diào)整節(jié)點和依賴關(guān)系,優(yōu)化任務(wù)順序,確保知識流持續(xù)進(jìn)化。
這意味著FlowSearch不只是一個執(zhí)行工具,它具備自組織、自糾錯、自優(yōu)化能力,可以在復(fù)雜科研任務(wù)中保持全局一致性,同時靈活應(yīng)對局部變化。
以上設(shè)計讓FlowSearch同時具備:
- 層次化分解能力:仿佛每個科研問題都能被拆解到最合適的顆粒度;
- 多路并行探索能力:智能體可以同時處理多個任務(wù),提高效率;
- 全局收斂能力:動態(tài)調(diào)整確保最終知識流完整、邏輯自洽。
無論是復(fù)雜跨學(xué)科研究,還是大規(guī)模數(shù)據(jù)分析,F(xiàn)lowSearch都能讓科研不再只是“等待AI輸出”,而是真正的與AI共同探索。
實驗結(jié)果與分析
1、綜合性能突破
FlowSearch在三大權(quán)威基準(zhǔn)GAIA、GPQA-diamond、HLE上,全面超越現(xiàn)有方法。

在生物領(lǐng)域的專業(yè)基準(zhǔn)TRQA上,F(xiàn)lowSearch依托通用工具鏈超越了多個領(lǐng)域?qū)S媚P停@示出強(qiáng)大的專業(yè)問題解決能力。

2、模塊有效性驗證
去除動態(tài)知識流建模或反思模塊均導(dǎo)致顯著性能下降,驗證了結(jié)構(gòu)化規(guī)劃與動態(tài)調(diào)整機(jī)制在提升推理深度與系統(tǒng)穩(wěn)定性方面的關(guān)鍵價值。

3、Internplanner模型訓(xùn)練效果
經(jīng)過微調(diào)的Internplanner-32B相比基礎(chǔ)模型Qwen-3-32B在GAIA上提升約6個百分點,表明結(jié)構(gòu)化知識訓(xùn)練能夠顯著增強(qiáng)模型的規(guī)劃能力與任務(wù)一致性。

4、案例分析
通過FlowSearch與OWL的對比案例可以看出,F(xiàn)lowSearch通過顯式依賴建模與中間結(jié)果整合,有效避免了證據(jù)丟失與邏輯鏈斷裂,展現(xiàn)出更高的推理透明度與可解釋性。

同時,F(xiàn)lowSearch不僅能夠高質(zhì)量地完成科研問答任務(wù),還能直接適配于科學(xué)調(diào)研與報告生成任務(wù),產(chǎn)出完整、全面且邏輯清晰的科學(xué)調(diào)研成果。






應(yīng)用前景與科研影響
團(tuán)隊表示,F(xiàn)lowSearch的提出標(biāo)志著科研智能體從“任務(wù)執(zhí)行”向“知識驅(qū)動推理”的關(guān)鍵轉(zhuǎn)變。
- 對于科研新人,它能夠構(gòu)建完整的知識探索路徑,降低進(jìn)入新領(lǐng)域的學(xué)習(xí)門檻;
- 對跨學(xué)科研究者,它提供了知識流整合與多模態(tài)信息融合能力;
- 對資深學(xué)者,它可作為智能研究助手,在假設(shè)生成、證據(jù)聚合和報告撰寫階段顯著提升效率。
更重要的是,F(xiàn)lowSearch的動態(tài)結(jié)構(gòu)化框架為未來可解釋科研智能體與自演化科學(xué)發(fā)現(xiàn)系統(tǒng)奠定了通用基礎(chǔ)——使智能體具備類研究者的思考、探索與自我反思能力,推動人工智能從工具向真正的科研伙伴演進(jìn)。
論文鏈接:https://arxiv.org/abs/2510.08521
GitHub倉庫:https://github.com/Alpha-Innovator/InternAgent

































