精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Tree-GRPO:樹式搜索讓小模型也能玩轉多輪智能體

人工智能
阿里巴巴AMAP與廈門大學聯合提出Tree-GRPO,通過樹式搜索將LLM智能體RL的預算效率與信號質量雙雙提升,為小模型執行復雜多輪任務開辟新路徑。

大家好,我是肆〇柒。當你訓練一個LLM智能體完成多輪網頁搜索任務時,是否曾因高昂的工具調用成本而猶豫?每次搜索API調用可能花費0.1美元,1000次訓練迭代就是100美元——而更令人沮喪的是,這些成本換來的往往只是一份稀疏的、僅基于最終結果的反饋信號:模型只知道答案對錯,卻無法判斷哪一步推理或工具調用出了問題。

來自廈門大學與阿里巴巴AMAP團隊的最新研究提出了一種名為 Tree-GRPO 的新方法,直擊這一痛點。它通過樹式搜索結構,在相同滾動預算下獲得約1.5倍的訓練樣本;更驚人的是,僅用1/4的預算就能超越傳統鏈式強化學習方法。這意味著什么?對于每天訓練1000個任務的團隊,每月可節省數千美元成本,同時獲得更強的多輪交互能力。最關鍵的是,Tree-GRPO 無需任何人工標注的中間監督信號——僅靠最終結果獎勵,就能自動生成細粒度的過程監督信號。這究竟是如何做到的?讓我們一探究竟。

兩種范式的直觀對比與核心挑戰

想象一下:LLM智能體執行一個多跳問答任務,需要進行4輪思考-行動-觀察的交互循環。每次交互平均消耗1000 tokens,加上工具調用成本,每個任務的訓練成本迅速攀升。隨著任務復雜度增加,agent軌跡可達數千token,多輪交互導致工具調用成本高昂(如高價位搜索API)。這不僅僅是理論問題——在WebagentQA任務中,工具調用成本已成為訓練的主要瓶頸。

更嚴峻的是,僅靠結果獎勵難以定位多輪交互中具體步驟的優劣。就像盲人摸象,模型只知道最終答案是對是錯,卻無法分辨是哪一步思考或工具調用導致了成功或失敗。即使增加滾動預算生成更多軌跡,訓練信號仍受限于有限的結果反饋,造成"高度不平衡的學習過程甚至 training collapse"。

樹式方法的破局之道

如下圖所示,樹式搜索帶來兩大革命性優勢:

  • 預算效率:通過共享共同前綴,相同預算下獲得約1.5倍的樣本量
  • 信號質量:樹結構自然嵌入過程監督信號,無需額外標注

鏈式vs樹式采樣策略對比

看上圖左側:鏈式方法為每個任務生成獨立軌跡,存在大量重復內容。右側樹式方法則像知識樹一樣共享共同前綴——想象10個人同時探索迷宮,鏈式方法讓他們各自從頭探索,而樹式方法讓他們共享已探索路徑,只在分叉點各自探索新路徑。這種設計使相同滾動預算下獲得約1.5倍樣本量,對多輪agent訓練意義重大

agent步驟級與token/sentence級樹搜索對比

下圖進一步揭示了關鍵創新:Tree-GRPO不是在token級別構建樹,而是在完整的Thought-Action-Observation步驟級別構建樹。如上表所示,token級樹搜索在多跳QA任務中僅得22.2分,遠低于agent步驟級的36.8分。這就像拆散樂高積木的完整模塊——雖然零件可以重用,但破壞了agent步驟的完整性,反而阻礙了學習性能。

agent步驟級與token/sentence級樹搜索對比

范式對比:鏈式RL與樹式RL

預算效率的量化優勢

在滾動采樣機制上,鏈式RL采用獨立軌跡采樣,每個任務生成多條互不相關的完整軌跡,存在顯著冗余。而樹式RL則通過樹搜索策略,生成具有共享前綴的交錯軌跡。如下圖所示,樹式方法包含三個關鍵階段:

1. 初始化:并行生成M條獨立軌跡作為M棵樹的根

2. 采樣:從每棵樹隨機選擇N個非葉節點進行擴展

3. 擴展:基于選定節點的上下文繼續生成響應,作為新分支插入樹中

Tree-GRPO訓練流程概述

特別值得注意的是"GenerateRollout"函數的設計——它確保每次擴展都從選定節點繼續生成完整Thought-Action-Observation步驟,而非僅生成單個token。這一設計正是保持agent步驟完整性的技術關鍵,使模型能夠在保持語義連貫性的同時有效利用滾動預算。

信號質量的革命性突破

樹內過程信號生成機制

如上圖所示,相比之下,樹式結構自然嵌入了過程監督信號。在樹的每個分支點,從各自子樹葉子反向傳播的結果獎勵差異構成了偏好學習目標,提供不同粒度的過程信號。子樹深度決定了過程信號的粒度,而隨機擴展策略則產生不同粒度的信號,使模型能夠學習中間決策過程。

想象一棵知識樹:當模型在某個決策點(A1t)面臨選擇時,它會探索不同路徑。左邊路徑導致A2t→A3t,右邊路徑導致A2t+→A3t+。關鍵在于,即使我們只給最終結果打分,樹結構也能自動告訴我們:在A1t點選擇右邊路徑比左邊更好。這就是"隱式步驟級偏好學習"的魔力——無需人工標注中間步驟的優劣,樹結構本身就能生成細粒度訓練信號。

訓練穩定性的顯著提升

如下圖所示,樹式方法不僅提升了性能,還顯著改善了訓練穩定性。樹式方法使平均工具調用從2.4增至3.0,表明模型更愿意探索更長的交互路徑,這對解決復雜長視野任務至關重要。

樹式vs鏈式RL在獎勵和動作數量上的對比

為什么樹式方法能促進更長交互?因為更細粒度的監督信號使模型敢于探索更長路徑。在多跳QA任務中,模型更愿意進行多次檢索和推理,從而解決更復雜的長視野問題。這種能力對于Webagent等真實場景尤為重要,因為現實世界的問題往往需要多輪交互才能解決。

Tree-GRPO:樹式范式的技術實現

agent步驟級樹搜索的創新設計

Tree-GRPO的核心創新在于agent步驟級樹搜索設計。與現有樹式RL方法將token/sentence作為節點不同,該方法將完整的Thought-Action-Observation步驟作為樹節點單位。

agent步驟級與token/sentence級樹搜索對比

為什么選擇步驟級而非token級節點? 實驗證據如上表所示:在多跳QA任務中,token級樹搜索僅得22.2分,遠低于步驟級的36.8分,甚至低于鏈式GRPO的31.8分。如下圖所示,agent步驟級樹搜索在整個訓練過程中保持穩定上升趨勢,而token/sentence級樹搜索的訓練獎勵波動劇烈且最終崩潰。

token/sentence級與agent步驟級樹搜索的訓練獎勵對比

這從理論和實踐兩方面驗證了兩個關鍵判斷:

1. "探索agent步驟中間分支缺乏明確目的,可能造成滾動預算浪費"

2. "token/sentence級樹結構的信用破壞了agent步驟的完整性,反而阻礙學習性能"

樹內與樹間優勢估計的協同機制

Tree-GRPO創新性地結合了樹內與樹間優勢。如下表所示,這種協同機制至關重要:

  • 僅使用樹內優勢時,各數據集得分僅為1.1-1.7分,表明訓練不穩定
  • 樹間優勢單獨使用得分為40.6-41.3分
  • 兩者結合后性能顯著提升至42.4-43.7分

樹內與樹間優勢估計的消融研究

為什么僅樹內優勢不穩定? 因為"樹內rollout數量有限導致基線估計不可靠"——當M=2,N=2,L=1時,每棵樹僅包含5條軌跡,難以形成穩定的基線。而結合樹間優勢后,基線基于全部M×(L×N+1)條軌跡計算,顯著提高了估計穩定性。

最終優勢估計為,既保留了過程信號,又確保了訓練穩定性。

滾動預算的靈活配置

Tree-GRPO的實用亮點在于滾動預算的靈活配置。通過調整樹數量、擴展節點數和擴展輪數,可以在探索與利用間取得平衡。

不同訓練預算下的性能對比

最令人驚訝的發現是:Tree-GRPO使用1/4滾動預算即可超越鏈式方法。如上表所示,當預算≈4/提示時,鏈式方法得31.8分;而樹式方法在預算≈2/提示時已達到31.6分,卻僅消耗1/4的工具調用成本。

這意味著什么?對于Qwen2.5-3b模型,當鏈式方法需要4次完整交互(4B tokens)時,樹式方法僅用1次完整交互加2次半交互(1B + 2×B/2 = 2B tokens)就能獲得更好性能。這種'預算減半,性能翻倍'的現象在極端預算條件下尤為明顯——當預算≈2/提示時,樹式方法實現112%的性能提升!

如下表所示,參數選擇需考慮任務特性:

  • 當預算≈2/提示時,M=1, N=2, L=1(實現112%相對提升)
  • 當預算≈4/提示時,M=2, N=2, L=1(16%相對提升)
  • 當預算≈16/提示時,M=4, N=5, L=1(10%相對提升)

不同樹結構的性能對比

實驗對比:11個數據集上的全面較量

多跳QA任務:小模型的性能飛躍

最震撼的發現:Tree-GRPO使小模型也能有效執行多輪agent任務。如下表所示,Qwen2.5-1.5b模型上,Tree-GRPO在多跳QA任務中實現69%的相對提升,從11.3分躍升至19.1分。

單跳與多跳QA任務上的性能對比

尤為關鍵的是,"Tree-GRPO能夠成功使基礎模型在沒有監督微調(SFT)的情況下采用預定義的多輪agent交互范式,盡管在極有限的滾動預算下"。這意味著什么?對于資源有限的研究團隊,無需昂貴的SFT階段,就能讓小模型執行復雜的多輪交互任務。

Llama-3.2-3b模型上的表現同樣令人印象深刻:從26.7分提升至36.8分,實現38%的相對提升。這證明了樹式方法的架構普適性——無論Qwen還是Llama系列,都能從中受益。

WebagentQA任務:數據限制下的突破

WebagentQA任務面臨嚴峻的數據挑戰:訓練數據僅有2,200個樣本,訓練步數僅為34(約2個epoch)。這反映了"現有開源WebagentQA基準主要是測試集,缺乏高質量訓練數據"的現實限制。

盡管如此,如下表所示,Tree-GRPO在GAIA上仍實現28%的平均提升。這表明樹式方法在數據有限的情況下仍能有效學習。

WebagentQA任務性能對比

然而,在BrowseComp等高度復雜任務上提升有限,這"主要受訓練數據限制"。這種性能差異揭示了"訓練數據與測試難度不匹配"的根本問題——測試任務要求模型執行多達數十次的網頁交互,而訓練數據無法提供相應難度的樣本。

預算敏感性實驗:樹式方法的"低預算高效益"

預算敏感性實驗揭示了Tree-GRPO的革命性價值。如下表所示,當滾動預算僅為2/提示時,鏈式RL幾乎無法學習多輪交互行為(僅14.9分),而樹式方法實現112%的相對提升(達31.6分)。

不同訓練預算下的性能對比

這種"極端預算表現"源于樹搜索的樣本增益效應:在相同預算下,樹式方法獲得約1.5倍樣本量。更令人驚訝的是,Tree-GRPO使用僅1/4的滾動預算即可超越鏈式方法。在Qwen2.5-3b上,當預算≈4/提示時,鏈式方法得31.8分;而樹式方法在預算≈2/提示時已達到31.6分,卻僅消耗1/4的工具調用成本。

這在實際應用中意義重大——對于高成本工具調用(如搜索API),樹式方法能顯著降低訓練成本,同時提高性能。

深度技術對比:樹式方法的內在機制

隱式步驟級偏好學習的理論證明

Tree-GRPO的理論深度體現在其隱式步驟級偏好學習機制上。研究證明,樹內GRPO與步驟級DPO具有相同的梯度結構:

這意味著"intra-tree GRPO可以被解釋為隱式執行步驟級 preference優化,從而繼承步驟級DPO的關鍵特性,同時在在線滾動設置中運行"。

直觀理解,當樹中某分支獲得更高獎勵時,模型會增加該分支路徑的概率,同時減少低獎勵分支的概率——這正是偏好學習的核心思想。關鍵區別在于,Tree-GRPO無需人工標注偏好對,而是通過樹結構"隱式生成"這些偏好信號,實現了"僅基于結果獎勵構建步驟級過程信號"的突破。

為什么樹式方法能促進更長的交互?

如下圖所示,樹式訓練使平均工具調用從2.4增至3.0。這是因為更細粒度的監督信號使模型敢于探索更長路徑

樹式vs鏈式RL在獎勵和動作數量上的對比

在多跳QA任務中,模型更愿意進行多次檢索和推理,從而解決更復雜的長視野問題。這種能力對于Webagent等真實場景尤為重要,因為現實世界的問題往往需要多輪交互才能解決。

學習率預熱的敏感性

學習率預熱對比

學習率預熱對小模型訓練的敏感性是另一關鍵發現。如上圖所示,學習率預熱是"訓練小模型(<3B參數)時的特別敏感超參數"。

具體的講:

  • 對于單跳/多跳QA任務,推薦使用0.285/0.5的學習率預熱比
  • 對于WebagentQA任務,由于訓練步數較少(僅34步),學習率預熱比設為0更為合適

樹式方法在所有學習率預熱比設置下均優于鏈式方法,展現出更強的魯棒性。這驗證了理論分析:intra-tree GRPO與step-level DPO具有相同梯度結構,使模型能在更小學習率下穩定收斂。

應用場景決策樹

基于實驗結果,可以構建樹式方法的應用決策樹:

推薦使用樹式方法的場景

  • 多輪交互任務:如多跳QA,特別是小模型訓練
  • 滾動預算受限的場景:token/tool call成本高
  • 僅結果獎勵可用的情況:缺乏過程監督信號

如下表所示,樹式方法在小模型(1.5b)上的提升最為顯著(69%),而在大模型(14b)上也有穩定提升(8.4%)。這表明樹式方法對小模型訓練尤其有價值。

單跳與多跳QA任務上的性能對比

鏈式方法仍有優勢的場景

  • 單輪簡單任務:如單跳QA,樹深度有限(通常為2),過程信號收益有限
  • 滾動預算充足的場景:當預算充足時,鏈式方法的簡單性可能更有優勢
  • 高度并行化訓練環境:樹搜索有一定串行依賴,可能影響訓練吞吐量

在參數選擇方面,如下表所示,參數選擇需考慮預算限制:

  • 預算≈2/提示:M=1, N=2, L=1(實現112%相對提升)
  • 預算≈4/提示:M=2, N=2, L=1(16%相對提升)
  • 預算≈16/提示:M=4, N=5, L=1(10%相對提升)

不同樹結構的性能對比

值得注意的是,減少M雖節省預算,但會限制探索范圍。如(M=1,N=5,L=1)配置性能明顯下降,表明在探索與利用間取得平衡至關重要

局限與挑戰

成功案例:多輪交互能力的體現

如下兩表所示的成功案例表明,模型能夠"通過迭代工具調用和自主信息聚合執行多輪agent任務"。例如,在Musique數據集上,模型通過三次搜索逐步確定"Groovy Little Summer Song"的表演者、其唱片公司及公司所有者,最終正確回答問題。

樹式GRPO成功案例

關鍵在于:

1. 每次搜索都基于前次結果提出更精確的問題

2. 模型能整合分散信息形成完整推理鏈

3. 模型敢于進行多輪交互,不因一次搜索結果不理想而放棄

失敗案例:探索不足的局限

如下表所示,模型有時"在開始時從幾個部分符合要求的候選路徑中選擇單一解決方案路徑,未進行進一步探索"。在Musique數據集中,模型將David Hasselhoff(演員)誤認為Deanna Russo(實際答案),原因在于"初始選擇部分符合要求的候選路徑后,未進行進一步探索"。

樹式GRPO失敗案例

在后續推理中,既未重新考慮也未根據新獲取信息驗證選擇,導致錯誤答案。這表明模型仍缺乏反思推理和更豐富探索能力。

樹搜索的探索局限性

樹搜索的探索范圍受限于樹數量M。如下表所示,(M=1, N=5, L=1)配置的性能下降證實了這一點。減少樹數M雖節省滾動預算,但會限制探索范圍,可能導致模型陷入局部最優。

不同樹結構的性能對比

范式選擇的實踐智慧

樹式方法的核心價值總結

Tree-GRPO代表了LLMagent強化學習的范式轉變。其核心價值在于:

  • "僅基于結果獎勵構建過程信號"的革命性突破:無需額外標注,樹結構本身就能生成細粒度訓練信號
  • "低預算高效益"的實用價值:用1/4預算實現更好性能,顯著降低訓練成本
  • 使小模型也能有效執行多輪agent任務:Qwen2.5-1.5b在多跳QA任務中性能提升69%

單跳QA任務中有限的提升(1.1%-9.5%)與多跳QA任務中顯著的收益(16%-69%)形成鮮明對比,這印證了"樹深度限制(通常為2)使過程信號收益有限"的分析。而WebagentQA任務的中等提升(28%平均提升)則揭示了另一維度的挑戰:訓練數據與測試難度不匹配。

實踐啟示:從理論到應用

對實踐者的啟示很簡單:如果你在訓練需要多輪交互的LLM智能體,尤其是預算有限或使用小模型(≤3b)時,樹式方法應成為你的首選

  • 優先在多輪agent任務中采用樹式方法:特別是多跳QA和Webagent任務
  • 根據滾動預算靈活配置樹參數:極端預算條件下樹式方法優勢尤為明顯
  • 小模型訓練時特別關注學習率預熱設置:如下圖所示,學習率預熱對<3B小模型特別敏感

學習率預熱對比

總結,從"軌跡級優化"到"過程級優化"

隨著agent智能體在開放環境中長視野交互能力成為"下一代基礎模型的關鍵",Tree-GRPO所代表的樹式搜索范式將為LLM agent訓練提供重要方向。在滾動預算與信號質量的永恒權衡中,樹式方法找到了更優的平衡點,為構建真正具備agent能力的下一代語言模型鋪平道路。

對于追求高效、低成本訓練的專業團隊而言,樹式方法不僅是技術選擇,更是戰略決策——它重新定義了在有限資源下實現高質量agent訓練的可能性邊界。這不是漸進式改進,而是范式轉變:從“軌跡級優化”到“過程級優化”,為下一代agent基礎模型訓練提供新方向

責任編輯:龐桂玉 來源: 覺察流
相關推薦

2025-10-14 09:06:00

2025-06-06 14:17:11

模型訓練AI

2024-08-27 00:00:01

AI應用框架

2012-07-19 14:42:58

Windows 8微軟

2025-01-23 17:00:00

模型算力數據

2025-10-24 10:58:24

智能體大語言模型LLM

2018-02-09 15:23:35

PC游戲手游Moonlight

2017-02-06 09:28:15

2024-06-13 17:51:47

2023-08-28 06:52:29

2023-04-25 10:05:56

Windows 98ChatGPT聊天機器人

2009-02-20 10:14:00

路由器路由應用ADSL

2024-05-24 08:42:29

智能體訓練

2024-03-11 00:40:00

AI研究

2024-04-01 13:11:00

AI智能體SIMA

2018-08-16 09:41:46

開源項目資源

2018-10-16 17:57:57

開源架構

2025-06-27 15:44:35

蘋果AI模型

2024-07-10 09:37:57

2025-10-13 08:14:48

點贊
收藏

51CTO技術棧公眾號

农村老熟妇乱子伦视频| 免费av手机在线观看| 国产乱淫av免费| 黄色av成人| 日韩精品免费在线视频| 少妇激情一区二区三区| 日本激情在线观看| 国产1区2区3区精品美女| 91av成人在线| 福利视频第一页| 精品福利网址导航| 欧美麻豆精品久久久久久| 精品少妇人欧美激情在线观看| 无码精品在线观看| 国内精品写真在线观看| 久久久之久亚州精品露出| 色欲狠狠躁天天躁无码中文字幕 | 亚洲欧美日韩电影| 国产一区精品视频| 日韩综合在线观看| 99精品视频免费| 久久九九亚洲综合| av网在线播放| 欧美三级午夜理伦三级在线观看| 欧美日韩国产精品成人| 日本免费黄视频| 毛片在线网址| 成人欧美一区二区三区白人| 久久久久一区二区| 精品毛片一区二区三区| 久久成人羞羞网站| 人人爽久久涩噜噜噜网站| 麻豆chinese极品少妇| 国产二区精品| 伊人伊成久久人综合网小说| 国产精品无码毛片| y111111国产精品久久久| 欧美一区二区精品久久911| 国产又黄又猛又粗又爽的视频| 午夜小视频福利在线观看| 中文字幕亚洲一区二区av在线| 欧洲一区二区在线 | 国产一区二区成人| 青青草视频成人| 久久中文字幕导航| 亚洲精品videossex少妇| 三级黄色片免费观看| 免费成人黄色网| 欧美性感一类影片在线播放| 中文字幕无码不卡免费视频| 在线天堂中文资源最新版| 午夜精品一区二区三区电影天堂 | 在线中文字幕第一页| 国产精品国产三级国产aⅴ中文| 欧美一区二区三区四区夜夜大片| 亚洲 欧美 自拍偷拍| 波多野结衣中文字幕一区 | 狠狠人妻久久久久久综合麻豆 | 色婷婷综合久久久中文字幕| 日本免费黄视频| 小视频免费在线观看| 精品女同一区二区三区在线播放| 国产一级爱c视频| 国产一二三在线| 日韩欧美在线播放| 午夜免费精品视频| 欧美一级做a| 欧美一区二区在线视频| 绯色av蜜臀vs少妇| 欧美亚洲色图校园春色| 亚洲美腿欧美激情另类| 天堂在线中文视频| 999久久久亚洲| 久久91精品国产91久久跳| 国产一级生活片| 一本色道久久综合亚洲精品不卡 | 国产又粗又猛又爽又黄的网站| 性国产高清在线观看| 亚洲香肠在线观看| 国精产品一区一区三区视频| 美脚恋feet久草欧美| 欧美亚洲综合一区| 色91精品久久久久久久久| 国产亚洲字幕| 亚洲国产精品免费| 91视频免费在观看| 国内在线观看一区二区三区| 26uuu另类亚洲欧美日本一| 伊人成年综合网| 国产福利一区在线| 美乳视频一区二区| 免费网站成人| 黄色一区二区在线观看| 国内自拍视频网| 中文字幕视频精品一区二区三区| 精品一区二区三区四区| 久久爱一区二区| 国产亚洲午夜| 成人性生交大片免费观看嘿嘿视频| 性一交一乱一伧老太| 久久久一区二区三区| 97超碰人人爱| 欧美aa视频| 精品欧美一区二区久久| аⅴ天堂中文在线网| 欧美日韩久久| 国产日韩欧美在线| 偷拍自拍在线视频| 亚洲精品免费在线| 熟妇人妻无乱码中文字幕真矢织江| 久久爱www.| 一色桃子一区二区| 日韩欧美a级片| 国产在线观看免费一区| 欧美污视频久久久| 色屁屁www国产馆在线观看| 91福利精品视频| 艳妇乳肉豪妇荡乳xxx| 天天综合网网欲色| 国产精品美乳在线观看| 涩爱av在线播放一区二区| 一区二区三区蜜桃| 91亚洲精品久久久蜜桃借种| 国产91精品对白在线播放| 久久久久久午夜| 国产又粗又猛又黄又爽无遮挡| 久久久天堂av| 老太脱裤子让老头玩xxxxx| 久久69av| 欧美成人精品一区二区| 中文字幕一二三四| 久久精品一区蜜桃臀影院| 日本免费不卡一区二区| 中文字幕区一区二区三| 久久国产精品久久久久久久久久| 中文字幕一区二区三区四区视频| ww久久中文字幕| 无码中文字幕色专区| 97超碰成人| 久久亚洲精品国产亚洲老地址| а中文在线天堂| 久久久国产精品麻豆| 凹凸国产熟女精品视频| 日韩成人av在线资源| 国内精品一区二区三区四区| 亚洲精品一区二区三区不卡| 樱桃视频在线观看一区| 男生和女生一起差差差视频| 久久久五月天| 91九色蝌蚪成人| 国精产品一区| 91精品国产一区二区| 久久人妻无码aⅴ毛片a片app| 日韩成人免费电影| 亚洲五月六月| 91嫩草国产线观看亚洲一区二区| 日韩在线一区二区三区免费视频| 在线观看中文字幕av| 中文字幕一区二区三区在线播放 | 久久久99精品视频| 91精品国产自产观看在线| 久久夜色精品国产欧美乱| 国产白浆在线观看| 亚洲综合丁香婷婷六月香| 91人妻一区二区| 亚洲精品极品| 欧美色欧美亚洲另类七区| 国产精品诱惑| 欧美美女操人视频| 色呦呦免费观看| 色综合久久中文字幕综合网| 成人性生交大片免费看无遮挡aⅴ| 蜜桃一区二区三区在线观看| 99精品一级欧美片免费播放| 亚洲精品福利| 欧美亚洲激情视频| av资源种子在线观看| 91精品国产综合久久小美女| 久久久久久久久久久久久久免费看 | 91精品99| 久久大香伊蕉在人线观看热2| 欧美××××黑人××性爽| 日韩在线视频网| 肥臀熟女一区二区三区| 91传媒视频在线播放| 999精品视频在线观看播放 | 国产传媒欧美日韩| 超碰国产一区| 久久亚洲一区二区三区四区五区高| 亚洲第一天堂在线观看| 色婷婷香蕉在线一区二区| 永久免费看片直接| 91天堂素人约啪| 欧美一级视频在线| 中文亚洲免费| 中国成人在线视频| 欧美精品中文| 国产日韩精品视频| 欧美激情网站| 久久精品国产99国产精品澳门 | 欧美久久一区二区三区| 欧美自拍视频在线观看| bestiality新另类大全| 亚洲男女性事视频| 亚洲第一页视频| 欧美日韩日日夜夜| 国产精品久久久免费视频| 日韩美女视频一区二区| 自拍偷拍亚洲天堂| 成人国产精品免费| 在线免费看v片| 免费国产自线拍一欧美视频| 国产911在线观看| 精品国产乱码久久久| 超碰97人人在线| 久久天天久久| 国产va免费精品高清在线观看| 91国内在线| 中文字幕一区电影| 男人av在线| 亚洲国产精久久久久久久| 国产精品国产av| 欧美在线短视频| 黄色在线观看国产| 亚洲第一狼人社区| 久久久久久久久毛片| 国产精品久久精品日日| 色噜噜日韩精品欧美一区二区| 成人免费毛片a| 一个人看的视频www| 蜜臀av一区二区三区| 欧美黄色一级片视频| 国产一区二区你懂的| 欧美视频免费看欧美视频| 狠狠综合久久| 久久综合久久久久| 午夜日本精品| 国产一级片91| 伊人成综合网| 国产精品一区在线免费观看| 911久久香蕉国产线看观看| 亚洲一区二区三区欧美| 视频国产一区| 日韩欧美亚洲在线| 激情五月综合网| 日韩精品欧美专区| 成久久久网站| 亚洲精品高清视频| 日韩在线理论| 欧美日韩视频免费在线观看| 婷婷伊人综合| 色哟哟免费网站| 欧美精品18| 国产成人永久免费视频| 亚洲久久一区| 成人综合视频在线| 三级久久三级久久久| 亚洲黄色av网址| 久久99精品久久久久| 国产在线视频三区| 成人午夜看片网址| 欧美高清性xxxx| 欧美激情一区二区在线| 国产日产在线观看| 亚洲精品乱码久久久久久久久 | 欧美性淫爽ww久久久久无| 国产偷人爽久久久久久老妇app | 亚洲精品写真福利| 久操免费在线视频| 欧美日韩激情美女| 最新在线中文字幕| 日韩三级电影网址| 天天干天天操av| 一本大道久久加勒比香蕉| 老司机午夜在线视频| 欧美激情videoshd| 亚洲天堂手机| 国产精品一区专区欧美日韩| 国产精品一区二区美女视频免费看 | 免费看一级视频| 欧美精品在线观看播放| 囯产精品久久久久久| 亚洲精品综合久久中文字幕| 香蕉视频网站在线观看| 欧美日韩国产第一页| 中文在线аv在线| 成人激情电影一区二区| 国内精品麻豆美女在线播放视频| 日本精品免费| 欧美激情性爽国产精品17p| 亚洲午夜精品久久久久久人妖| 日本亚洲天堂网| 国产精品成人免费一区久久羞羞| 国产亚洲欧美色| 久热精品在线观看| 在线观看精品一区| 成人久久久精品国产乱码一区二区| 亚洲欧洲黄色网| 少女频道在线观看免费播放电视剧| 欧美壮男野外gaytube| 韩国一区二区三区视频| 久久亚洲高清| 自拍欧美日韩| 国产精品亚洲二区在线观看| 国产成人综合亚洲网站| 亚洲AV无码成人精品区明星换面 | www.视频一区| 欧美激情精品久久久久久免费| 欧美日韩中文字幕| www天堂在线| 日韩有码视频在线| 中文在线а√天堂| 国产精品三区四区| 偷拍欧美精品| 午夜dv内射一区二区| 99久久精品国产精品久久| 欧美第一页在线观看| 欧洲一区二区三区在线| 五月婷婷在线观看视频| 欧美精品日韩三级| 精品福利在线| 日本午夜精品一区二区| 一区二区三区四区五区在线 | 久久欧美一区二区| 久久精品无码人妻| 日韩一区二区精品| а√中文在线8| 国产拍精品一二三| 日本道不卡免费一区| 91精品国产91久久久久麻豆 主演| 激情五月婷婷综合网| 免费看的黄色录像| 欧美影视一区在线| 国产福利小视频在线| 国产97在线播放| 神马香蕉久久| 青青艹视频在线| 成人精品在线视频观看| 久草视频在线免费看| 日韩女同互慰一区二区| 羞羞视频在线免费国产| 91亚洲精品一区二区| 亚洲va在线| 伊人五月天婷婷| 亚洲人精品午夜| a网站在线观看| 欧美精品制服第一页| 亚洲国产一区二区三区网站| 日本一道在线观看| 国产成人一级电影| 精品人妻在线播放| 亚洲国产精品中文| 蜜桃视频在线观看免费视频| 久久这里精品国产99丫e6| 性高湖久久久久久久久| 在线国产视频一区| 欧美色欧美亚洲另类二区| 日韩伦理在线观看| 91香蕉亚洲精品| 狠狠噜噜久久| 日本xxxx裸体xxxx| 欧美性猛交xxxx乱大交退制版| av午夜在线| 亚洲自拍高清视频网站| 亚洲午夜一级| 亚洲国产欧美视频| 欧洲在线/亚洲| 91黄色在线| 六月婷婷久久| 日本不卡在线视频| 免费看一级大片| 精品欧美一区二区久久| 中文日产幕无线码一区二区| 午夜精品亚洲一区二区三区嫩草| 久久99精品久久久久久动态图 | 欧美日韩在线看片| 亚洲综合中文字幕在线| 亚洲视频播放| 日韩av片在线免费观看| 日韩一区二区不卡| 天堂中文av在线资源库| 亚洲精品中字| 国产成人无遮挡在线视频| 五月天综合激情网| 日韩有码在线播放| 少妇一区二区三区| 欧美视频国产视频| 激情亚洲一区二区三区四区| www.亚洲免费| 成人h在线播放| 久久激情视频| 精品无码久久久久久久久| 亚洲午夜久久久影院| 午夜久久av| 波多野结衣天堂| 一级日本不卡的影视| 超碰免费97在线观看| 国产精品二区在线观看| 全国精品久久少妇| 97免费在线观看视频|