精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

新范式!字節提出智能體上下文折疊框架,1/10活躍量突破長周期任務瓶頸

人工智能
在復雜長周期任務(Deep Research與軟件工程)測試中,基于Seed-OSS-36B-Instruct的折疊智能體僅使用1/10的活躍上下文,持平或優于ReAct基線,顯著優于基于摘要的上下文管理方法,并與基于100B+參數量大模型所構建智能體的性能相媲美。

智能體在執行長周期任務時,始終受限于上下文長度。為此,字節聯合提出上下文折疊(Context-Folding)框架,使智能體能夠主動管理其工作上下文。該框架允許智能體通過程序分支進入子軌跡以處理子任務,完成后將中間步驟折疊壓縮,僅保留結果摘要。為使該行為可學習,研究人員開發了端到端強化學習框架FoldGRPO,通過特定過程獎勵鼓勵有效的任務分解與上下文管理。

在復雜長周期任務(Deep Research與軟件工程)測試中,基于Seed-OSS-36B-Instruct的折疊智能體僅使用1/10的活躍上下文,持平或優于ReAct基線,顯著優于基于摘要的上下文管理方法,并與基于100B+參數量大模型所構建智能體的性能相媲美。

  • 論文標題:Scaling Long-Horizon LLM Agent via Context-Folding
  • 論文鏈接:https://arxiv.org/abs/2510.11967
  • 項目地址:https://context-folding.github.io/

一、方法

1.上下文折疊框架

為應對智能體在執行長周期任務時的上下文挑戰,論文提出上下文折疊,允許智能體通過分支與折疊主動管理其工作上下文。具體而言,論文設計了兩個可供智能體調用的上下文管理工具。從主線程開始解決問題q,智能體可以:

  • branch(description,prompt):從主線程分支,使用獨立工作上下文完成用于解決q的子任務q′。其中“description”是子任務的簡要摘要,“prompt”是該分支的詳細指令。該工具返回一個模板消息,表明分支已創建。
  • return(message):折疊本分支中生成的上下文并返回主線程?!癿essage”用于描述該分支的執行結果。調用此工具后,智能體上下文將切換回主線程,并附加來自分支的模板消息。

上下文折疊智能體的公式建模為:

此處τ<i=(a1, o1, ..., ai-1, oi-1)表示第i步之前所有動作-觀測對的完整歷史記錄,F是上下文管理器,負責折疊branch與return工具調用之間交互歷史。

在上述示例中,a2至a4之間以及a5至a8之間的交互片段均被折疊。

推理效率:在推理過程中,智能體管理著上下文KV-cache:當調用return操作時,KV-cache將回滾至對應的branch位置,該位置的上下文前綴需與調用branch操作前的狀態保持一致。這一機制使得上下文折疊方法在推理效率方面表現優異。

實例化:為在長周期任務中實例化上下文折疊,采用規劃-執行框架,其中智能體在兩種狀態間交替:

  • 規劃狀態:智能體在主線程進行高層推理,分解任務,并決定何時為子任務創建分支。在此狀態下,為保持主上下文聚焦高層策略,不鼓勵使用消耗大量token的工具。
  • 執行狀態:智能體在分支內運行以完成指定子任務。為保持清晰的結構并避免復雜嵌套,執行狀態下禁止創建新的分支。

2.FoldGRPO強化學習

為優化上下文折疊智能體,論文提出一種端到端強化學習訓練框架FoldGRPO。該框架聯合優化包含主線程及子任務分支的完整交互軌跡,并基于上下文折疊建模(公式1)對rollout歷史進行折疊,從而在訓練過程中保持緊湊的工作上下文。此外,FoldGRPO采用創新的過程獎勵設計,可有效指導智能體分支行為的訓練。

(1)整體算法設計

在FoldGRPO的每個訓練步驟中,對于訓練數據集D的任務q,根據上下文折疊建模(公式1)從舊策略圖片中采樣G條軌跡圖片。每條完整軌跡(例如圖片)被定義為token序列圖片。每條軌跡τ?對應最終獎勵R?∈{0,1},遵循可驗證獎勵的強化學習。

學習目標:FoldGRPO的學習目標定義為:

圖片

其中重要性采樣比率與組相對優勢估計為:

圖片

此處圖片確保僅優化LLM生成的token,并掩碼工具觀察token。

其中,FoldGRPO以紅色標出兩個關鍵特性:

  • 上下文折疊:與在策略優化時將完整交互歷史追加至上下文的標準多輪LLM強化學習算法不同,FoldGRPO將上下文管理器F(?)應用于歷史τi,<t,基于branch-return操作對token τi,t的上下文進行折疊。
  • 過程獎勵信號:在計算優勢圖片時,加入token級過程獎勵圖片以規范模型的branch-return行為。

(2)過程獎勵設計

在RLVR中,智能體通常通過基于任務成功或失敗的二元結果獎勵進行優化。然而研究人員發現,這種稀疏獎勵信號不足以有效學習上下文折疊行為。具體表現為兩種關鍵失敗模式:

  • 智能體未能進行策略性規劃,將token密集型操作保留在主上下文中未作折疊,迅速耗盡可用token預算;
  • 智能體難以進行有效的分支管理,常在子任務完成后未能從子分支返回,反而在同一分支內繼續后續工作。

為有效優化折疊智能體,分別針對主軌跡token和分支軌跡token引入token級過程獎勵。

未折疊token懲罰:當主線程的總上下文長度超過工作上下文限制的50%時,對主線程中所有token(創建分支的回合對應的token除外)施加Qi,t=-1的懲罰。此舉旨在懲罰智能體在主線程非分支環境下執行的token密集型操作,并鼓勵其將此類操作在分支中執行。

超范圍懲罰:針對每個分支,采用GPT-5-nano模型,基于分支提示詞與返回消息判斷智能體是否執行了指定子任務范圍之外的操作。若存在此類行為,對該分支內所有token施加Qi,t=-0.2的懲罰,這促使智能體僅執行當前分支既定的確切子任務。

失敗懲罰:對失敗工具調用回合中的所有token施加Qi,t=-1的懲罰。其余所有情況下,Qi,t=0。

3.上下文折疊與其他方法的關聯

與多智能體系統的關系:上下文折疊可被視為廣義多智能體系統的一種特定實現形式,主智能體將子任務委托給子智能體執行。但與主流多智能體系統相比存在以下差異:

  • 上下文折疊不采用預定義的子智能體,而是由主智能體動態創建;
  • 所有智能體共享相同的上下文前綴,使其對KV-cache友好;
  • 主智能體與子智能體交替運行而非并行執行。

與基于上下文摘要方法的關系:相較于基于啟發式摘要的上下文管理方法(其在任意節點丟棄細節信息),上下文折疊可視為一種與子任務邊界對齊的可學習摘要機制。這能確保推理在執行期間得以完整保留,僅在其效用實現后才被壓縮。

二、實驗

圖片圖片

表1總結了在BrowseComp-Plus(Deep Research任務)和SWE-Bench Verified(軟件工程任務)數據集上的主要結果。對于折疊智能體,論文將LLM的最大上下文長度設定為32,768個token,并允許最多創建10個分支,從而實現327,680個token的理論上下文上限。

在未進行強化學習訓練時,折疊智能體的表現已超越32K上下文的ReAct及上下文摘要基線,但尚未達到長上下文ReAct智能體的性能水平。經過強化學習訓練后,智能體性能顯著提升:在BrowseComp-Plus數據集上Pass@1達到0.620(+20%),在SWE-Bench Verified數據集上Pass@1達到0.580(+8.8%)。折疊智能體不僅超越了所有基線(包括具有相同327K最大上下文長度的長上下文ReAct智能體),更與基于100B+參數量大模型所構建智能體的性能相媲美。

深入分析表明,FoldGRPO性能顯著優于基準GRPO(如在BrowseComp上提升7.7%,在SWE-Bench上提升1.6%);其次,性能提升與工具調用頻率的增加相關,而強化學習訓練進一步促進了該行為。表明論文框架使智能體能夠對環境進行更全面的探索,從而發現更魯棒的解決方案。

圖片圖片

上圖展示了折疊智能體在BrowseComp-Plus上的定性案例。針對需要滿足特定條件的文獻檢索任務,智能體首先探索高層主題并確定候選文獻,隨后通過分支搜索驗證具體條件,在獲得關鍵信息但未能完全確認所有要求后,進一步擴展搜索范圍并最終找到正確答案。在此過程中,4個分支將完整的107K token上下文壓縮至僅6K。

責任編輯:武曉燕 來源: 智猩猩AI
相關推薦

2025-10-11 04:22:00

人工海馬體網絡LV-Eval

2025-10-10 09:16:47

2023-10-23 13:23:03

數據訓練

2025-08-14 08:20:38

2024-12-13 14:30:00

AI模型數據

2017-05-11 14:00:02

Flask請求上下文應用上下文

2025-10-15 01:00:00

ACE代理上下文工程

2025-03-21 10:08:37

2025-06-16 14:40:40

模型AI訓練

2025-10-14 10:03:11

CompLLMLLMRAG

2025-08-08 01:45:00

上下文工程優化框架

2025-10-13 08:00:00

2012-12-31 10:01:34

SELinuxSELinux安全

2025-05-09 09:15:00

2024-12-06 18:48:39

2022-09-14 13:13:51

JavaScript上下文

2025-07-29 00:00:00

LLM上下文窗口系統

2025-08-08 14:06:48

MemToolLLM智能體

2025-07-22 08:50:00

AI模型框架

2024-04-07 08:50:00

谷歌框架
點贊
收藏

51CTO技術棧公眾號

国产乱国产乱老熟300| 亚洲欧美日韩一级| 欧洲毛片在线| 日韩国产欧美在线播放| 中文字幕在线看视频国产欧美在线看完整| 香蕉视频网站入口| √天堂8在线网| av成人动漫在线观看| 国产精品久久久久久久久久久新郎| 美国黑人一级大黄| 一区二区三区在线免费看| 亚洲国产成人tv| 日韩精品久久一区| 精品人妻aV中文字幕乱码色欲| 国产欧美一级| 久久久精品亚洲| 中文字幕 亚洲一区| 欧美aaaaaa| 亚洲成av人片一区二区梦乃| 欧美一进一出视频| 精品黑人一区二区三区国语馆| 亚洲男人影院| 日韩在线高清视频| 一女三黑人理论片在线| 亚洲一区二区小说| 丁香五六月婷婷久久激情| 色乱码一区二区三区熟女| 亚洲aaaaaaa| 国产精品亚洲一区二区三区在线| 欧美亚洲另类制服自拍| 妺妺窝人体色www婷婷| 欧美色婷婷久久99精品红桃| 亚洲国产精品电影| www.成人黄色| 日本欧美一区| 亚洲韩国一区二区三区| 在线观看免费91| 欧美另类自拍| 99久久精品99国产精品| 99理论电影网| 国产精品女同一区二区| 日本欧洲一区二区| 欧美亚洲激情在线| 国产无码精品视频| 欧美日韩ab| 精品国内亚洲在观看18黄 | 成熟的女同志hd| 日韩精品免费| 中文字幕日韩精品在线观看| 国产成人福利在线| 国产一区毛片| 一道本无吗dⅴd在线播放一区 | av之家在线观看| 毛片在线导航| 亚洲成人av资源| 国产主播自拍av| 菠萝蜜视频在线观看www入口| 亚洲欧美乱综合| 99re99热| 成人在线免费看黄| 亚洲免费高清视频在线| 国产成人三级视频| 国产福利在线播放麻豆| 亚洲精品一二三四区| 黑人巨茎大战欧美白妇| 日日夜夜天天综合入口| 一二三四社区欧美黄| 成人免费观看在线| 51漫画成人app入口| 亚洲国产成人高清精品| 日本免费不卡一区二区| 超级碰碰久久| 欧美综合一区二区| 天堂视频免费看| 久久精品免视看国产成人| 日韩一区二区三区视频| 亚洲色图欧美另类| 日韩欧美国产大片| 亚洲图片欧美午夜| 久久人妻无码aⅴ毛片a片app | 国产精品日本一区二区不卡视频| 欧美精品在线一区二区三区| 性生活一级大片| 国产精品x8x8一区二区| 亚洲欧美色图片| 日韩在线一卡二卡| 国户精品久久久久久久久久久不卡| 久久久久久久亚洲精品| 久久精品视频1| 麻豆国产精品视频| 国产成人精品一区二区三区福利 | 久久久免费人体| 日韩视频一区在线观看| 国产福利在线观看视频| 久久中文字幕av| 久久久久久亚洲精品不卡| 日韩欧美在线观看免费| 国产在线不卡视频| 久久国产精品久久| 免费在线视频欧美| 午夜视黄欧洲亚洲| 日韩高清第一页| 秋霞在线一区| www亚洲精品| 99久在线精品99re8热| 免费不卡在线观看| 国产专区一区二区| av在线free| 91福利视频久久久久| 岛国大片在线免费观看| 精品产国自在拍| 欧美国产视频一区二区| 青青艹在线观看| 成人精品小蝌蚪| 中文字幕日韩精品久久| 自拍视频在线看| 日韩视频一区二区在线观看| 午夜影院黄色片| 国产欧美精品久久| 不卡一卡2卡3卡4卡精品在| 第一页在线观看| 精品久久中文字幕久久av| 97超碰人人看| 成人无号精品一区二区三区| 国产91av在线| 少妇一级淫片免费看| 亚洲精品国产视频| 国产精品久久久毛片| 亚洲肉体裸体xxxx137| 欧美激情精品久久久久| 国产精品探花视频| 国产精品入口麻豆原神| 国产成人无码一二三区视频| 9999久久久久| 色中色综合影院手机版在线观看| 亚洲无码精品国产| 国产日韩欧美精品一区| 久久精品香蕉视频| 性欧美lx╳lx╳| 国产+人+亚洲| www.五月婷| 亚洲精品成人悠悠色影视| 999在线观看| 日韩欧美精品一区| 国产精品久久久久久亚洲调教| 天堂中文在线8| 第一福利永久视频精品 | 91精品国产乱码久久久竹菊| 不用播放器成人网| 国产精品老熟女视频一区二区| 国产精品人成在线观看免费| 天天干在线影院| 久久不卡国产精品一区二区| 欧美诱惑福利视频| 你懂的免费在线观看| 在线区一区二视频| 精品人妻中文无码av在线| 日韩国产精品久久| 亚洲乱码国产乱码精品天美传媒| 久久亚洲精品人成综合网| 亚洲欧美999| 日韩在线视频不卡| 亚洲国产成人在线| 国产传媒免费观看| 欧美激情 亚洲a∨综合| av成人免费观看| sm久久捆绑调教精品一区| 日韩av一卡二卡| 免费视频网站在线观看入口| 中文字幕免费不卡在线| 在线观看日本www| 欧美日本免费| 精品产品国产在线不卡| 欧美aaa视频| y97精品国产97久久久久久| 99热这里只有精品在线| 亚洲国产精品一区二区久久 | 亚洲色欲综合一区二区三区| 亚洲都市激情| 成人性生交xxxxx网站| 国产三线在线| 亚洲亚裔videos黑人hd| 91久久久久国产一区二区| 亚洲在线视频一区| www.中文字幕av| 久久精品国产99久久6| 国内少妇毛片视频| 国产成人精品999在线观看| 91精品久久久久久久久久入口 | 亚洲黄色小视频| 日韩 中文字幕| 精品影视av免费| 久艹视频在线免费观看| 日韩精品欧美激情一区二区| 99视频在线| 外国电影一区二区| 久久久久免费视频| 国产视频第一页在线观看| 日韩欧美中文一区二区| 懂色av蜜臀av粉嫩av分享吧最新章节| 综合久久一区二区三区| 亚洲第一黄色网址| 久久66热re国产| av动漫在线观看| 中文字幕一区二区精品区| 欧美成人一区二区在线| 国产视频网站一区二区三区| 日本一区二区在线播放| 日本动漫同人动漫在线观看| 亚洲人午夜精品| 亚洲毛片欧洲毛片国产一品色| 日本电影亚洲天堂一区| 国产稀缺真实呦乱在线| 国产精品传媒在线| 粉嫩av蜜桃av蜜臀av| 成人综合婷婷国产精品久久| 亚洲欧美在线精品| 久久在线91| 999在线观看视频| 一精品久久久| 亚洲一区二区三区色| 一本色道久久综合亚洲精品酒店| 亚洲一区二区三区乱码aⅴ蜜桃女| 高清成人在线| 欧美亚洲另类激情另类| 超碰99在线| 欧美极品少妇与黑人| av片在线观看网站| 久久精品99久久香蕉国产色戒| 成人综合影院| 国产一区二区三区在线播放免费观看| 少妇高潮一区二区三区69| 欧美大片在线观看一区| 99国产精品久久久久久久成人| 欧美羞羞免费网站| 久久亚洲精品石原莉奈| 高跟丝袜欧美一区| 青青草成人av| 天天色综合成人网| 国产无遮挡又黄又爽又色| 一区二区成人在线| 国产小视频在线观看免费| 亚洲男人的天堂av| 亚洲综合网在线| 亚洲视频网在线直播| 欧美做爰啪啪xxxⅹ性| 中文字幕一区三区| 一区二区三区在线播放视频| 国产精品久久久久婷婷| 日韩av片在线免费观看| 国产精品免费看片| 中文字幕观看av| 综合欧美一区二区三区| 丝袜美腿小色网| 亚洲黄一区二区三区| 国产精品 欧美 日韩| 午夜精品一区二区三区免费视频 | 成人h猎奇视频网站| 亚洲二区av| 亚洲a∨日韩av高清在线观看| 不卡一区视频| 成人欧美一区二区三区在线观看| 国产福利资源一区| 欧美精品一区二区三区在线四季| 亚洲精品国产setv| 日韩欧美一区二区视频在线播放| 日韩精品一区二区三区免费观看| 亚洲国产另类久久久精品极度| 99久久精品网| 国产黄色激情视频| 国产精品老牛| 欧美黄色性生活| 精品亚洲国产成人av制服丝袜| 色哟哟免费视频| 99精品在线免费| 九九热免费在线| 亚洲视频在线一区二区| 久久精品国产亚洲av高清色欲 | 美女黄页在线观看| 欧美一激情一区二区三区| 人妻精品一区一区三区蜜桃91 | 欧美高清视频| 欧美极品xxxx| 综合在线影院| 亚洲在线视频观看| 香蕉久久99| 色撸撸在线观看| 国产美女诱惑一区二区| 在线观看免费污视频| 成人av电影在线播放| 秋霞网一区二区三区| 亚洲一区二区三区爽爽爽爽爽| 国产99免费视频| 日韩欧美国产综合在线一区二区三区| 污污网站在线免费观看| www.日韩视频| 欧美天堂视频| 91黄色国产视频| 欧美日韩精品一区二区视频| 波多野结衣av一区二区全免费观看| 日韩精彩视频在线观看| 精品国产免费久久久久久婷婷| 久久精品亚洲精品国产欧美 | 国产一区二区丝袜高跟鞋图片| 99re91这里只有精品| 四虎影视永久免费在线观看一区二区三区| 欧美一区激情| 成人中文字幕av| 懂色av噜噜一区二区三区av| 国产第一页精品| 疯狂做受xxxx欧美肥白少妇 | 亚洲国产精品va在线看黑人| 国产在线观看av| 国产精品91在线| 露出调教综合另类| 大地资源网在线观看免费官网| 日本网站在线观看一区二区三区| 亚洲男人在线天堂| 一区二区日韩av| 国产露脸91国语对白| 国产一区av在线| 亚洲最大网站| 精品国产免费人成电影在线观...| 伊人久久大香线| 在线观看av网页| 国产欧美精品日韩区二区麻豆天美| 日本熟妇乱子伦xxxx| 日韩欧美黄色影院| 中文在线观看免费| 91精品在线影院| 日韩欧美高清在线播放| 99草草国产熟女视频在线| 91亚洲精品乱码久久久久久蜜桃| 久久久综合久久| 日韩一区二区三区免费看 | 国产黄色一级网站| av一二三不卡影片| 国产乡下妇女做爰视频| 欧美草草影院在线视频| 尤物在线网址| 91在线短视频| 你懂的视频一区二区| 中文字幕久久久久久久| 一区二区三区在线影院| 精品久久国产视频| 久久久久久久999| 98视频精品全部国产| 精品少妇在线视频| 99国产精品久久久久久久久久 | 欧美在线一区二区三区| 国产高清在线观看| 国产精品黄视频| 日韩精品一卡| 992kp免费看片| 亚洲欧洲综合另类| 国产成人久久精品77777综合| 欧美成人在线免费视频| 亚洲国产欧美国产第一区| 国产精品国三级国产av| 成人av免费在线观看| 久草手机在线视频| 伊人久久五月天| 亚洲精品成a人ⅴ香蕉片| 久久人妻无码一区二区| 成人午夜视频网站| 国语对白永久免费| 欧美老女人性生活| 精品一区91| 国产av熟女一区二区三区| 成人动漫在线一区| 丁香六月婷婷综合| 在线播放精品一区二区三区 | 国产精品成人一区二区不卡| 中文国产在线观看| 亚洲一二三四久久| 日韩三级电影网| 国产精品欧美亚洲777777 | 激情小视频网站| 久久久久久久性| 亚洲最新av网站| 欧美精品videosex牲欧美| 亚洲最好看的视频| 亚洲男人天堂av在线| 一区二区三区高清| 欧美美乳在线| 91在线观看免费| 一本色道88久久加勒比精品| 色撸撸在线视频| 亚洲成人精品在线| 成人黄色视屏网站| 国产欧美精品aaaaaa片| 国产视频一区不卡| 国产黄色片网站| 日韩**中文字幕毛片| 天天综合网网欲色| 丰满少妇在线观看资源站| 3d动漫精品啪啪一区二区竹菊 | 四虎成人免费在线| 成人h视频在线观看播放| 亚洲久久视频|