精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

微軟rStar2智能體:破解AI推理 “工具噪聲 + GPU 閑置” ,“智能體RL” 14B 逆襲 671B!

發布于 2025-9-2 06:37
瀏覽
0收藏

當671B參數的DeepSeek-R1仍被視為數學推理領域的“重量級選手”時,一款僅14B參數的模型卻以更短的推理路徑實現了性能超越——微軟研究院推出的rStar2-智能體(rStar2-Agent),通過智能體強化學習(Agentic Reinforcement Learning)技術,讓小模型擺脫了“靠長度堆性能”的傳統路徑,具備了“更聰明思考”的能力。這款模型僅用64張MI300X GPU、510步強化學習訓練,便在AIME24數學競賽中取得80.6%的pass@1準確率,超越OpenAI o3-mini、Claude-Opus-4.0等主流模型。其背后的技術創新,不僅解決了智能體強化學習的規模化難題,更為小模型高效推理提供了可復用的框架。

我們解讀最新技術,文末有相關信息。

微軟rStar2智能體:破解AI推理 “工具噪聲 + GPU 閑置” ,“智能體RL” 14B 逆襲 671B!-AI.x社區

1 引言:AI數學推理的“兩難困境”

當前AI數學推理的進步,很大程度上依賴“延長思維鏈(CoT)”——通過讓模型生成更長的推理步驟,提升復雜問題的求解能力。微軟研究院的研究員指出,OpenAI o系列、DeepSeek-R1、Gemini-2.5等領先模型雖通過這一思路實現性能突破,但面臨兩大核心困境:

一是內部反思的局限性。對于需中間驗證或思路切換的難題(如多步驟代數推導、數論證明),模型依賴內部反思檢測錯誤,但這種“自檢查”常失效——一旦初始推理方向偏差,后續步驟會持續偏離正確路徑。

二是工具使用的環境噪聲干擾。為彌補內部反思的不足,研究人員引入Python編碼工具(如SymPy符號計算、NumPy數值分析)輔助推理,但工具環境會引入新問題:模型生成的代碼可能存在語法錯誤或邏輯漏洞,導致執行反饋(如報錯信息)與推理任務無關,浪費 tokens 修正工具錯誤而非推進推理。更關鍵的是,傳統強化學習(RL)依賴“僅結果獎勵”(僅根據最終答案是否正確打分),即便中間工具調用出錯,只要最終答案正確,軌跡仍會被賦予正獎勵,導致模型默認“錯誤可接受”,生成低質量推理過程。

微軟rStar2智能體:破解AI推理 “工具噪聲 + GPU 閑置” ,“智能體RL” 14B 逆襲 671B!-AI.x社區

此外,大規模智能體強化學習的基礎設施瓶頸也不容忽視:單訓練批次可能觸發數萬次并發工具調用,傳統本地Python解釋器無法應對,且GPU資源因軌跡長度不均常處于空閑狀態,訓練效率極低。

rStar2-智能體的核心目標,正是通過技術創新破解上述困境——讓小模型在有限計算資源下,通過“智能使用工具+環境反饋學習”實現高效推理。

2 核心突破一:支撐大規模訓練的智能體RL基礎設施

要實現智能體強化學習的規模化,穩定、高效的基礎設施是前提。微軟研究院的研究員團隊設計了兩套關鍵組件,解決了“高并發工具調用”和“GPU負載不均”兩大痛點:

2.1 高吞吐量隔離式代碼環境

針對工具調用的并發與安全問題,研究員構建了分布式代碼執行服務,核心設計包括:

  • ?隔離部署:將代碼執行任務與主訓練流程分離,部署在64張MI300X GPU集群的CPU核心上,避免LLM生成的異常代碼(如死循環、外部庫調用)影響訓練進程;
  • ?批量調度機制:通過集中式任務隊列管理工具調用請求,32個“發送worker”持續從隊列中抓取任務,每批最多整合64個工具調用(或超時后觸發調度),減少通信開銷;
  • ?動態負載分配:worker節點通過輕量級任務調度器,將代碼執行任務分配給空閑的“執行worker”(每節點部署1024個),確保資源利用率。

該環境可支持45K并發工具調用,平均執行延遲僅0.3秒(含調度與執行時間),且通過“答案驗證離線化”進一步優化效率——將CPU密集型的數學答案驗證任務(如規則-based驗證器)也納入該服務,避免阻塞訓練循環。

微軟rStar2智能體:破解AI推理 “工具噪聲 + GPU 閑置” ,“智能體RL” 14B 逆襲 671B!-AI.x社區

2.2 負載均衡軌跡生成(Rollout)調度器

傳統強化學習中,軌跡生成任務按“靜態均勻分配”方式分發到GPU,導致兩大問題:一是軌跡長度差異大(部分推理需多輪工具調用,部分短步驟完成),短軌跡GPU需等待長軌跡完成,產生大量空閑時間;二是KV緩存溢出——Inference引擎(如SGLang)無法預測軌跡長度,并行啟動任務時易超出緩存容量,需驅逐已部分計算的軌跡重新執行,浪費資源。

微軟rStar2智能體:破解AI推理 “工具噪聲 + GPU 閑置” ,“智能體RL” 14B 逆襲 671B!-AI.x社區

研究員設計的動態調度器通過KV緩存剩余容量分配任務:根據各GPU當前可用的KV緩存空間,估算可處理的軌跡數量(而非均勻分配),軌跡生成過程中異步觸發工具調用,避免等待;當某GPU完成任務釋放緩存后,立即分配新任務。實驗顯示,該調度器可將GPU利用率提升30%以上,顯著縮短訓練周期。

3 核心突破二:GRPO-RoC算法——應對環境噪聲的智能體RL方案

智能體強化學習的關鍵挑戰是“環境噪聲干擾”——工具調用錯誤、格式違規等噪聲會導致“高質量推理軌跡被淹沒”。微軟研究院的研究員在Group Relative Policy Optimization(GRPO)基礎上,提出GRPO-RoC(Resample-on-Correct)算法,通過“軌跡重采樣策略”過濾噪聲,同時避免復雜獎勵設計帶來的風險。

微軟rStar2智能體:破解AI推理 “工具噪聲 + GPU 閑置” ,“智能體RL” 14B 逆襲 671B!-AI.x社區

3.1 傳統GRPO的局限與改進方向

GRPO是一種面向推理任務的強化學習算法,通過“分組軌跡對比”計算優勢函數(Advantage):對每個問題采樣G條軌跡,基于軌跡組內的獎勵分布(而非全局分布)計算每條軌跡的相對優勢,提升訓練穩定性。但在工具環境中,該算法存在明顯缺陷:

  • ? 僅結果獎勵(0/1,根據最終答案是否正確)無法區分“中間步驟完美”與“中間錯誤但答案巧合正確”的軌跡,后者會被賦予相同正獎勵,導致模型學習到“容忍錯誤”的策略;
  • ? 環境噪聲(如代碼錯誤、格式違規)會導致正獎勵軌跡中約10%-15%存在工具調用問題,長期訓練會讓模型生成冗長低質的推理過程。

研究員的核心思路是:不修改獎勵函數(保持僅結果獎勵以避免獎勵hacking),而是通過軌跡采樣策略篩選高質量正軌跡

3.2 GRPO-RoC的核心邏輯:重采樣與質量篩選

GRPO-RoC的軌跡處理流程分為兩步:過采樣(Oversampling)與選擇性下采樣(Selective Downsampling):

1. 過采樣階段:對每個問題采樣2G條軌跡(而非傳統GRPO的G條),擴大候選集;

2. 下采樣階段:將軌跡分為正軌跡(獎勵1)與負軌跡(獎勵0),分別采用不同策略篩選,最終保留G條用于訓練:

? 負軌跡:均勻下采樣至目標數量,保留多樣化的失敗模式(如工具調用錯誤、推理思路偏差),確保模型學習到“避免各類錯誤”的信號;

? 正軌跡:按“質量評分”逆概率采樣——評分越低(工具錯誤多、格式違規)的軌跡,被選中的概率越低。

質量評分由兩部分構成:

工具錯誤率(p_err):若軌跡無工具調用,默認p_err=0.5(鼓勵工具使用);否則為“錯誤工具調用次數/總工具調用次數”;

格式違規率(p_format):若軌跡無答案標簽(如缺失標簽),p_format=1;若存在多個答案標簽,按“(標簽數-1)/推理輪次”計算,懲罰重復標注。

總評分p_total = p_err + p_format,采樣概率與1/p_total正相關,確保高質量正軌跡(低p_total)被優先選中。

3.3 算法優勢:穩定與高效的平衡

與“在獎勵函數中加入工具錯誤懲罰”的方案相比,GRPO-RoC有兩大優勢:

避免獎勵hacking:無需人工設計復雜的步驟級獎勵(如“代碼正確得0.5分”),減少因獎勵規則不完善導致的模型“鉆空子”行為(如刻意簡化代碼以避免錯誤,而非優化推理);

提升訓練穩定性:通過篩選高質量正軌跡,模型學習到的是“正確推理+正確工具使用”的聯合策略,實驗顯示,GRPO-RoC可將正軌跡中的工具錯誤率從15%降至5%以下,同時推理長度縮短20%。

4 核心突破三:低計算成本的多階段訓練方案

大規模模型訓練常依賴“大參數量+長訓練周期”,而rStar2-智能體通過“非推理SFT+多階段RL”的設計,讓14B模型在有限計算資源下快速達到前沿水平。

4.1 非推理SFT:避免過擬合的“冷啟動”

傳統推理模型在RL前會進行“推理導向SFT”(用大量數學推理數據微調),但研究員發現,這種方式易導致模型“過擬合初始推理模式”,且初始響應長度過長,增加RL階段的計算成本。

rStar2-智能體的SFT階段僅聚焦基礎能力培養,不涉及數學推理優化:

  • ? 數據選擇:165K函數調用數據(ToolACE、APIGen-MT等)、30K指令跟隨數據(Tulu3數據集,用o4-mini優化響應質量)、27K對話數據(LLaMA-Nemontron數據集);
  • ? 目標:讓模型掌握“工具調用格式(如JSON結構化調用)”“指令跟隨邏輯”“基礎Python編碼能力”,保持初始響應長度約1K tokens。

實驗顯示,該SFT后模型的數學推理能力與基線模型(Qwen3-14B-Base)持平,但工具使用準確率提升40%,為RL階段奠定基礎。

微軟rStar2智能體:破解AI推理 “工具噪聲 + GPU 閑置” ,“智能體RL” 14B 逆襲 671B!-AI.x社區

4.2 多階段RL:逐步提升難度與效率

研究員將RL分為3個階段,逐步增加任務難度與軌跡長度上限,避免資源浪費:

?階段1(8K長度):用42K高質量數學題(整數答案,確保驗證可行性)訓練,強制模型在短長度約束下優化推理效率,平均響應長度從1K增至4K,AIME24準確率從3.3%(SFT后)提升至72.1%;

?階段2(12K長度):當階段1的軌跡截斷率(超過長度上限的軌跡比例)穩定在10%時,提升長度上限至12K,釋放模型推理空間,AIME24準確率進一步提升至77.0%;

?階段3(聚焦難題):用階段2的模型對42K題目生成8條軌跡,移除“8條全對”的簡單題,保留17.3K難題訓練,重置優化器狀態,最終AIME24準確率達80.6%,AIME25達69.8%。


微軟rStar2智能體:破解AI推理 “工具噪聲 + GPU 閑置” ,“智能體RL” 14B 逆襲 671B!-AI.x社區

整個RL過程僅510步,在64張MI300X GPU上1周內完成,計算成本僅為傳統大模型訓練的1/10。

5 實驗驗證:性能與泛化能力的雙重突破

rStar2-智能體的核心價值,不僅體現在數學推理性能的突破,更在于“小模型+高效推理”的性價比,以及跨領域泛化能力。

5.1 數學推理性能:超越大模型的小模型

在三大數學競賽數據集上,rStar2-智能體(14B)表現突出:

AIME24:80.6% pass@1,超越OpenAI o3-mini(79.6%)、DeepSeek-R1(671B,79.8%)、Claude-Opus-4.0(76.0%);

AIME25:69.8% pass@1,與DeepSeek-R1(70.0%)基本持平,遠超DeepSeek-R1-Zero(53.3%);

HMMT25:52.7% pass@1,僅次于OpenAI o3-mini(53.0%),遠超DeepSeek-R1(44.4%)。


微軟rStar2智能體:破解AI推理 “工具噪聲 + GPU 閑置” ,“智能體RL” 14B 逆襲 671B!-AI.x社區

更關鍵的是推理效率:rStar2-智能體的平均推理長度僅10943 tokens,遠短于DeepSeek-R1-Zero(17132 tokens)、QWQ-32B(15865 tokens),證明其“思考更高效”而非“思考更長”。

5.2 跨領域泛化:數學訓練賦能多任務

盡管僅用數學數據訓練,rStar2-智能體在非數學任務上仍表現出強泛化能力:

微軟rStar2智能體:破解AI推理 “工具噪聲 + GPU 閑置” ,“智能體RL” 14B 逆襲 671B!-AI.x社區


科學推理(GPQA-Diamond):60.9%準確率,超越DeepSeek-V3(59.1%),證明數學推理習得的“工具使用+邏輯驗證”能力可遷移至科學問題;

智能體工具使用(BFCL v3):60.8%準確率,與SFT后基線(63.1%)基本持平,未因數學訓練丟失工具能力;

通用對齊(IFEval、Arena-Hard):IFEval 83.4%、Arena-Hard 86.6%,與基線水平一致,說明數學RL訓練不影響通用對齊性能。

6 技術啟示與未來展望

rStar2-智能體的突破,為AI推理領域提供了三大核心啟示:

1. 小模型的潛力:通過“智能體強化學習+工具協作”,小模型可在特定領域超越大模型,降低AI推理的部署成本;

2. 環境交互的價值:相比“純文本思維鏈”,讓模型與工具環境實時交互(接收反饋、修正錯誤),是提升推理可靠性的關鍵路徑;

3. 簡化獎勵設計:復雜獎勵函數易導致模型“鉆空子”,而“僅結果獎勵+高質量軌跡篩選”的組合,是平衡訓練穩定性與推理質量的高效方案。

微軟研究院的研究員表示,未來將進一步擴展rStar2-智能體的應用場景,如工程計算、學術研究輔助等,并通過開源代碼(https://github.com/microsoft/rStar)推動智能體強化學習技術的普及。對于行業而言,rStar2-智能體的技術框架為“高效AI推理系統”提供了可復用的模板——從基礎設施到算法再到訓練方案,每一環的創新都指向“用更少資源實現更強能力”的核心目標。

參考資料

? 標題:rStar2-Agent: Agentic Reasoning Technical Report

? 作者:Ning Shang, Yifei Liu, Yi Zhu, Li Lyna Zhang, Weijiang Xu, Xinyu Guan, Buze Zhang, Bingcheng Dong, Xudong Zhou, Bowen Zhang, Ying Xin, Ziming Miao, Scarlett Li, Fan Yang, Mao Yang

? 單位:微軟研究院(Microsoft Research)

? 鏈接:https://arxiv.org/pdf/2508.20722

本文轉載自??旺知識??,作者:旺知識

已于2025-9-2 06:37:23修改
收藏
回復
舉報
回復
相關推薦
一区二区三区在线观看免费| 日韩精品一区二区三区中文| 国产清纯美女被跳蛋高潮一区二区久久w| 日韩美女在线播放| 日本黄色片免费观看| 国产精品对白| 欧美日韩一区二区三区四区| 丁香色欲久久久久久综合网| 天天操天天干天天干| 蜜臀久久99精品久久久久久9| 久久6免费高清热精品| 日本黄色录像片| 日本国产亚洲| 色综合天天性综合| 天天干天天色天天爽| 精品资源在线看| av日韩在线网站| 91亚洲国产精品| 最新中文字幕在线观看视频| 国产精品豆花视频| 日韩色av导航| 全黄一级裸体片| 久久久久久久久久久久久久久久久久久久| 欧日韩精品视频| 国产精品无码人妻一区二区在线| 日本中文字幕在线2020| 久久精品一区二区三区不卡 | 6080亚洲理论片在线观看| 欧美性猛交xxxxxxxx| 精品少妇一区二区三区在线| 污污的网站在线免费观看| 欧美国产日本韩| 乱色588欧美| 人妻一区二区三区免费| 国产乱子轮精品视频| 国产日韩综合一区二区性色av| 狠狠人妻久久久久久综合| 亚洲精品影视| 午夜精品久久久久久久99黑人 | 素人av在线| 欧美成人激情免费网| 丰满少妇大力进入| 中文在线免费| 亚洲精品免费电影| 国产美女视频免费| 免费在线视频欧美| 国产精品美女久久久久aⅴ国产馆 国产精品美女久久久久av爽李琼 国产精品美女久久久久高潮 | 国产欧美久久久久久| 午夜久久久久久久久久影院| 欧美亚洲专区| 日韩av免费在线观看| www.久久精品视频| 久久蜜桃精品| 国产精品第七影院| 伊人影院中文字幕| 精品写真视频在线观看| 成人性生交大片免费看小说| 国产女人高潮的av毛片| 国产一区二区精品在线观看| 亚洲va久久久噜噜噜| 国产夫妻性生活视频| 国产麻豆精品在线| 国产日韩视频在线观看| 99视频免费看| 成人免费观看视频| 久久久99爱| 电影av一区| 国产精品初高中害羞小美女文| 亚洲一区精彩视频| 亚洲色图美国十次| 天天av天天翘天天综合网色鬼国产| 激情伊人五月天| 日韩在线观看不卡| 91精品国产色综合久久不卡电影| 伊人成人免费视频| 久久99偷拍| 亚洲午夜未满十八勿入免费观看全集| 国产一级淫片久久久片a级| 久久久久久久久久久久久久久久久久 | 欧美aa免费在线| 欧美性猛交xxxx乱大交退制版| jizzzz日本| 97久久亚洲| 亚洲美女在线观看| 三级黄色录像视频| 欧美特黄一区| 国产精品国产自产拍高清av水多| 国产一区二区在线不卡| k8久久久一区二区三区 | 国产美女性感在线观看懂色av| 国产精品灌醉下药二区| 成年女人18级毛片毛片免费| 小明成人免费视频一区| 日韩欧美成人午夜| 久久国产柳州莫菁门| 欧美一区二区三区久久精品茉莉花| 57pao成人国产永久免费| 在线免费观看一区二区| 成人精品免费看| 一区二区不卡视频| 久草在线资源福利站| 欧美精品自拍偷拍| 亚洲精品视频大全| 欧美xxx在线观看| 人人澡人人澡人人看欧美| aaa一区二区三区| 久久日韩粉嫩一区二区三区| 超碰97在线看| 91欧美精品| 亚洲精品国产福利| 婷婷在线精品视频| 欧美a级理论片| 精品国产乱码久久久久软件| 国产成人l区| 在线中文字幕不卡| 中文文字幕文字幕高清| 中文字幕日韩一区二区不卡 | 中文字幕av片| 91视频一区二区三区| 中文精品无码中文字幕无码专区| 99久久亚洲国产日韩美女| 日韩大片免费观看视频播放 | 欧美性感一类影片在线播放| 亚州av综合色区无码一区| 伊人久久大香线| 国产这里只有精品| avtt亚洲| 色久优优欧美色久优优| 粉嫩av懂色av蜜臀av分享| 欧美日韩在线大尺度| 成人免费网站在线| 亚洲成人三级| 欧美在线观看视频一区二区 | 国产精品com| 青青久草在线| 日韩欧美精品网址| 精品国产av无码| 免费亚洲婷婷| 欧美精品中文字幕一区二区| 永久免费毛片在线播放| 亚洲精品电影在线观看| 粉嫩aⅴ一区二区三区| proumb性欧美在线观看| 国产v片免费观看| 久久久久观看| 日韩美女免费视频| 黄色小视频在线观看| 欧美性猛交xxxx免费看久久久| 538国产视频| 免费在线亚洲欧美| 欧美国产一区二区在线| 欧美黑人粗大| 视频在线一区二区| 国产免费叼嘿网站免费| 亚洲精品第1页| 无码人妻一区二区三区精品视频| 国产一区亚洲| 蜜桃av久久久亚洲精品| se01亚洲视频| 久久精品一本久久99精品| a天堂视频在线| 亚洲国产一区二区a毛片| 国产xxxxxxxxx| 久久伊人亚洲| 亚洲一区三区视频在线观看| 精品视频在线播放一区二区三区 | 中文字幕中文字幕99| 国产精品igao视频网网址不卡日韩| 久久精品视频在线观看| 欧美 日韩 中文字幕| 欧美性黄网官网| 国产极品视频在线观看| 国产成人综合网| 大陆极品少妇内射aaaaa| 欧美日韩激情在线一区二区三区| 国产在线久久久| 2001个疯子在线观看| 国产一区二区三区欧美| 国产欧美久久久| 精品久久久久久中文字幕大豆网| 中文字幕第二区| 成人小视频免费在线观看| 成人羞羞国产免费网站| 99久久精品费精品国产| 加勒比在线一区二区三区观看| 成人在线黄色| 久久免费精品视频| www 日韩| 亚洲韩国日本中文字幕| 亚洲天堂免费av| 午夜精品一区二区三区免费视频 | 国产综合亚洲精品一区二| 欧美日韩精品免费观看| 色8久久久久| 91国内免费在线视频| 欧美三级黄网| 精品中文字幕久久久久久| 92久久精品一区二区| 欧美视频一二三| 日韩影院一区二区| 国产亚洲欧美中文| 伊人久久一区二区三区| 蜜乳av一区二区| aaa毛片在线观看| 欧美日韩国产高清| 亚洲激情电影在线| 欧美福利在线播放网址导航| 成人免费视频网址| 日韩经典一区| 欧美一性一乱一交一视频| www.久久ai| 在线播放日韩专区| 日本免费不卡| 亚洲成人av片| 精品国产区一区二| 欧美日本乱大交xxxxx| 国产超碰人人爽人人做人人爱| 尤物在线观看一区| 国产午夜精品理论片在线| 国产欧美日韩亚州综合 | 好吊色在线观看| 91精品在线麻豆| 中文字幕免费观看视频| 色呦呦网站一区| 国产无遮挡又黄又爽又色| 专区另类欧美日韩| 成人信息集中地| 国产精品网友自拍| 亚洲一区二区自偷自拍 | 日韩精品高清在线| 视频一区 中文字幕| 日韩欧美亚洲国产精品字幕久久久| 中文字幕观看在线| 日本韩国一区二区三区| 人妻丰满熟妇av无码区| 欧美日韩性视频在线| 国产大片aaa| 亚洲成国产人片在线观看| 九九热精品免费视频| 亚洲精品高清视频在线观看| 欧美被狂躁喷白浆精品| 亚洲美腿欧美偷拍| 亚洲色图综合区| 亚洲国产欧美日韩另类综合| 免费一级全黄少妇性色生活片| 亚洲欧美欧美一区二区三区| 91aaa在线观看| 亚洲综合男人的天堂| 久久免费视频99| 亚洲成人1区2区| 欧美一级片免费在线观看| 天天综合天天综合色| 五月天综合激情网| 91成人在线免费观看| 中文字幕乱码在线观看| 欧美日产在线观看| 国产jzjzjz丝袜老师水多 | 黄色网址在线播放| 中文字幕欧美日韩精品| 欧美午夜电影一区二区三区| 欧美精品免费在线观看| а√天堂8资源中文在线| 欧美伊久线香蕉线新在线| 日韩精品麻豆| 92国产精品视频| 欧美大胆a级| 亚洲精品在线视频观看| 欧美成人首页| 久久黄色片视频| 免费成人av在线| 国产人妖在线观看| 久久综合一区二区| 国产破处视频在线观看| 夜夜揉揉日日人人青青一国产精品| 国产一级视频在线观看| 色视频一区二区| av网站在线免费看| 国产丝袜精品第一页| 成人精品福利| 欧美激情视频一区二区| 不卡一二三区| 亚洲专区国产精品| 同性恋视频一区| 综合久久国产| 国产亚洲精品久久久久婷婷瑜伽| 另类小说色综合| 成人在线视频一区| 91禁男男在线观看| 午夜激情久久久| 中文字幕日韩经典| 亚洲成人精品在线| 日本三级在线视频| 91成人精品网站| 精品国产亚洲日本| 日本不卡一二三区| 欧美色综合网| 成人免费xxxxx在线视频| 成人h动漫精品一区二| 肉色超薄丝袜脚交69xx图片| 日韩欧美国产视频| 亚洲精品国产手机| 自拍偷拍亚洲欧美| 忘忧草在线影院两性视频| 91社区国产高清| 精品国产乱码| 国产 福利 在线| 国产精品性做久久久久久| www久久久久久久| 精品国产乱码久久久久久婷婷 | 影音先锋亚洲天堂| 欧美一级免费大片| 午夜小视频在线| 日本精品久久久久影院| 成人午夜大片| 久久久久久久久久久综合| 九九精品视频在线看| 亚洲欧洲久久久| 欧美日韩在线视频一区| 国产xxxx孕妇| 久久伊人精品天天| 中文字幕日本一区| 视频一区视频二区视频| 免费在线欧美黄色| 亚洲国产无码精品| 天天操天天色综合| 手机看片1024日韩| 久久久久中文字幕| 91蜜桃臀久久一区二区| 亚洲一区二区三区涩| 日本aⅴ免费视频一区二区三区 | 视频一区 中文字幕| 欧美激情一区二区三区在线视频观看 | 69堂亚洲精品首页| 调教视频免费在线观看| 国产精品高潮视频| 精品一二三区| 一级特黄性色生活片| 久久免费国产精品| 区一区二在线观看| 亚洲片国产一区一级在线观看| √8天堂资源地址中文在线| 国产乱码精品一区二区三区不卡| 亚洲午夜电影| 无码一区二区精品| 欧美性xxxx在线播放| 国产黄在线观看| 国产精品久久久精品| 第九色区aⅴ天堂久久香| a在线观看免费视频| 国产精品久久国产精麻豆99网站| 国产精品久久久久久免费播放| 日韩一区二区久久久| 国产精品1区| a级黄色小视频| 91久色porny| 国产成人精品一区二区色戒| 日韩在线视频网| 国产精品人人人人| 一区在线观看视频| jlzzjlzzjlzz亚洲人| 久久久午夜视频| 久久93精品国产91久久综合| 在线观看免费成人av| 亚洲欧美成人一区二区三区| 亚洲av无码一区二区三区dv| 97在线视频免费观看| 国产99久久| 久久婷婷中文字幕| 亚洲午夜视频在线| 免费毛片在线| 成人激情春色网| 亚洲福利免费| 韩国三级hd中文字幕| 在线综合视频播放| av电影免费在线看| 亚洲不卡1区| 狠狠狠色丁香婷婷综合久久五月| 精品少妇一二三区| 亚洲色图欧美制服丝袜另类第一页| 日本成人一区二区| 国产资源在线视频| 中文字幕欧美日韩一区| 亚洲国产精品欧美久久 | av一区二区三区免费观看| 久久婷婷成人综合色| 国产美女主播在线观看| 51午夜精品视频| 中文无码久久精品| 久久99精品久久久久久琪琪| 精品一区91| 日韩中文字幕组| 亚洲影院久久精品| 国产私人尤物无码不卡| 波多野结衣久草一区| 亚欧美中日韩视频| 老女人性淫交视频| 伊人精品在线观看| 麻豆一区二区| 亚洲男人天堂2021| 一本高清dvd不卡在线观看|