精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

超越DeepSeek GRPO的關鍵RL算法,字節、清華AIR開源DAPO

人工智能 新聞
近日,清華 AIR 和字節聯合 SIA Lab 發布了他們的第一項研究成果

DeepSeek 提出的 GRPO 可以極大提升 LLM 的強化學習效率,不過其論文中似乎還缺少一些關鍵細節,讓人難以復現出大規模和工業級的強化學習系統。

近日,清華 AIR 和字節聯合 SIA Lab 發布了他們的第一項研究成果:DAPO,即 Decoupled Clip and Dynamic sAmpling Policy Optimization(解耦剪輯和動態采樣策略優化)。這是一個可實現大規模 LLM 強化學習的開源 SOTA 系統。此外,使用該算法訓練的模型也將在近期開源發布。

image.png

  • 項目頁面:https://dapo-sia.github.io/
  • 論文地址:https://dapo-sia.github.io/static/pdf/dapo_paper.pdf
  • 代碼地址:https://github.com/volcengine/verl/tree/gm-tyx/puffin/main/recipe/dapo
  • 數據:https://huggingface.co/datasets/BytedTsinghua-SIA/DAPO-Math-17k

使用該算法,該團隊成功讓 Qwen2.5-32B 模型在 AIME 2024 基準上獲得了 50 分,優于同等規模的 DeepSeek-R1-Zero-Qwen-32B,同時 DAPO 版 Qwen2.5-32B 使用的訓練步數還少 50%。

image.png

相較之下,如果使用 GRPO,Qwen2.5-32B 模型在 AIME 2024 基準上只能獲得 30 分。

30 分的成績遠低于 DeepSeek 的強化學習(47 分)。該團隊分析發現,原生版 GRPO 面臨著幾大關鍵問題,比如熵崩潰、獎勵噪音和訓練不穩定。事實上,該團隊表示,很多研究團隊在復現 DeepSeek 的結果時也遇到了類似的難題。他們表示:「這表明 R1 論文中可能省略了開發工業級、大規模且可重現的強化學習系統所需的關鍵訓練細節。」

image.png

Allen AI 研究者 Nathan Lambert 總結了 DAPO 對 GRPO 的改進,包括兩個不同的裁剪超參數、動態采樣、token 層面的策略梯度損失、過長獎勵塑造

下面將從 PPO 到 GRPO 再到 DAPO 逐步介紹,看看這個新的強化學習算法究竟是如何煉成的。

近端策略優化(PPO)

PPO 引入了裁剪式替代目標(clipped surrogate objective)來執行策略優化。通過使用裁剪將策略更新限制在先前策略的近端區域內,PPO 可以讓訓練穩定并提高樣本效率。具體而言,PPO 更新策略的方式是最大化以下目標:

image.png

群組相對策略優化(GRPO) 

與 PPO 相比,GRPO 消除了價值函數并以群組相關的方式來估計優勢。對于特定的問答對 (q, a),行為策略 π_θ_old 采樣一組 G 個個體響應image.png。然后,通過對群組級獎勵image.png進行歸一化來計算第 i 個響應的優勢:

image.png

與 PPO 類似,GRPO 也采用了裁剪目標,同時還有一個直接添加的 KL 懲罰項:

image.png

還值得注意的是,GRPO 是在樣本層級計算目標。確切地說,GRPO 首先會計算每個生成序列中的平均損失,然后再對不同樣本的損失進行平均。正如后面會討論的那樣,這種差異可能會對算法的性能產生影響。

另外兩項改進

消除 KL 偏離

KL 懲罰項的作用是調節在線策略和凍結參考策略之間的偏離情況。在 RLHF 場景中,RL 的目標是在不偏離初始模型太遠的情況下調整模型行為。然而,在訓練長 CoT 推理模型時,模型分布可能會與初始模型有顯著差異,因此這種限制是不必要的。因此,在 DAPO 中,KL 項被排除在外。

基于規則的獎勵建模

獎勵模型的使用通常會受到獎勵 hacking 問題的影響。作為替代,該團隊直接使用可驗證任務的最終準確率作為結果獎勵,計算規則如下:

image.png

事實證明,這是激活基礎模型推理能力的有效方法,這也在多個領域得到了證明,包括自動定理證明、計算機編程和數學競賽。

DAPO

研究者提出了解耦剪輯(Decouple Clip)和動態采樣策略優化(DAPO)算法。DAPO 對每個問題 q 和答案 a 的一組輸出截屏2025-03-18 09.22.10.png進行采樣,并通過以下目標優化策略:

截屏2025-03-18 09.13.29.png

此處

截屏2025-03-18 09.15.49.png

下面將介紹與 DAPO 相關的關鍵技術。

抬高天花板:Clip-Higher

在使用 PPO 或 GRPO 進行的初步實驗中,研究者觀察到了熵崩潰現象:隨著訓練的進行,策略的熵迅速下降(如圖 2b)。某些組的采樣響應通常幾乎相同。這表明有限的探索和早期的確定性策略會阻礙擴展過程。

截屏2025-03-18 09.25.46.png截屏2025-03-18 09.25.46.png

針對這一問題,研究者提出了 Clip-Higher 策略。對重要度采樣率進行剪輯是 PPO-Clip 中的一種策略,用于限制信任區域并增強 RL 的穩定性。上剪輯可以限制策略的探索。在這種情況下,提高「利用 token」的概率要比提高不可能的「探索 token」的概率容易得多。


截屏2025-03-18 09.18.38.png

他們還觀察到,被剪輯 token 的最大概率約為截屏2025-03-18 09.54.21.png(圖 3a)。這一發現支持了他們的分析,即上限剪輯閾值確實限制了低概率 token 的概率增長,從而可能限制了系統的多樣性。

如公式 10 所示,根據 Clip-Higher 策略,研究者將較低和較高的剪輯范圍解耦為 ε_low 和 ε_high:

截屏2025-03-18 09.48.53.png

研究者增加了 ε_high 的值,以便為低概率 token 的增加留出更多空間。如圖 2 所示,這一調整有效地提高了策略的熵,有利于生成更多樣化的樣本。研究者選擇將 ε_low 保持在相對較小的范圍內,因為增大 ε_low 會將這些 token 的概率壓制為 0,從而導致采樣空間的崩潰。

越多越好:動態采樣

當某些提示的準確度等于 1 時,現有的 RL 算法就會出現梯度遞減問題。根據經驗,準確率等于 1 的樣本數量會繼續增加,如圖 3b 所示。這意味著每批樣本中的有效提示次數會不斷減少,從而導致梯度方差增大,抑制了模型訓練的梯度信號。

為此,研究者建議進行過度采樣,過濾掉等式 11 中所示精度等于 1 和 0 的提示語,保留批次中所有具有有效梯度的提示語,并保持一致的提示語數量。在訓練之前不斷采樣,直到批次中全部都是準確率既不等于 0 也不等于 1 的樣本。

截屏2025-03-18 09.45.32.png

另外一點發現如圖 6 所示,在動態采樣的情況下,實驗能更快地實現相同的性能。

截屏2025-03-18 09.59.33.png

Rebalancing Act:Token 級策略梯度損失

研究者觀察到,由于所有樣本在損失計算中的權重相同,因此長回復中的 token 對總體損失的貢獻可能會不成比例地降低,這可能會導致兩種不利影響。

首先,對于高質量的長樣本來說,這種影響會阻礙模型學習其中與推理相關的模式的能力。其次,過長的樣本往往表現出低質量的模式,如胡言亂語和重復詞語。

如圖 4a 和圖 4b 所示,樣本級損失計算由于無法有效懲罰長樣本中的不良模式,會導致熵和響應長度的不健康增長。

截屏2025-03-18 10.06.12.png

捉迷藏:過長的獎勵塑造

為了研究獎勵噪聲的影響,研究者首先應用了超長過濾策略,以掩蓋截斷樣本的損失。如圖 5 所示,這種方法大大穩定了訓練并提高了性能。

截屏2025-03-18 10.10.58.png

此外,他們還提出了「Soft Overlong Punishment」(等式 13),這是一種長度感知懲罰機制,旨在塑造截斷樣本的獎勵。具體來說,當響應長度超過預定義的最大值時,研究者會定義一個懲罰區間。在這個區間內,響應越長,受到的懲罰就越大。這種懲罰會添加到基于規則的原始正確性獎勵中,從而向模型發出信號,避免過長的響應。

截屏2025-03-18 10.09.10.png

DAPO 的實驗表現

基于 Qwen-32B 基礎模型,該團隊進行了一系列實驗,驗證了新提出的 DAPO 算法的有效性和優勢。這里我們略過實驗細節,重點來看看實驗結果。

整體來看,在 AIME 2024 上,使用 DAPO 訓練的 Qwen-32B 模型成長為了一個強大的推理模型,性能優于使用 R1 方法訓練的 Qwen2.5-32B。

如圖 1 所示,可以看到 DAPO 訓練的 Qwen2.5-32B 在 AIME 2024 基準上的性能提升情況。隨著訓練步數增長,模型準確度從 0% 穩步升至了 50%。需要重點指出:達成這一性能所使用的步數僅為 DeepSeek-R1-Zero-Qwen-32B 所需步數的一半。

表 1 展示了新方法中每種訓練技術的貢獻。看得出來,每種技術都對準確度的增長有所貢獻。可以看到,原生 GRPO 只能讓 Qwen2.5-32B 基礎模型的準確度達到 30%。

image.png

至于 token 級損失,雖然它帶來的性能提升較少,但該團隊發現它可增強訓練穩定性并使長度增加得更健康。

訓練動態

為了獲得更透徹的分析,該團隊也分析了訓練動態和中間結果。

image.png

生成響應的長度:該指標與訓練穩定性和性能密切相關。如圖 7a 所示。長度的增加可為模型提供更大的探索空間,允許采樣更復雜的推理行為并通過訓練逐漸強化。但需要注意的是,長度在訓練過程中并不總是保持持續的上升趨勢。在一些相當長的時期內,它可以停滯甚至下降。通常的做法是將長度與驗證準確度結合起來作為評估實驗是否正在惡化的指標。

訓練過程中的獎勵動態:這一直是強化學習中至關重要的監測指標之一,如圖 7b 所示。在這里的大多數實驗中,獎勵增加的趨勢相對穩定,不會因為實驗設置的調整而出現大幅波動或下降。這表明,在給定可靠獎勵信號的情況下,語言模型可以穩健地擬合訓練集的分布。然而,該團隊發現,在訓練集上的最終獎勵往往與在驗證集上的準確度相關性不大,這表明對訓練集存在過擬合現象。

Actor 模型的熵和生成概率:這與模型的探索能力有關,同時也是實驗中密切監控的關鍵指標。直觀地講,模型的熵需要保持在適當的范圍內。過低的熵表示概率分布過于尖銳,這會導致探索能力喪失。相反,過高的熵往往與過度探索的問題有關,例如亂碼和重復生成。對于生成概率,情況恰恰相反。如前所示,通過應用 Clip-Higher 策略,可以有效地解決熵崩潰的問題。在后續的實驗中,該團隊還發現保持熵緩慢上升的趨勢有利于模型提升性能,如圖 7c 和圖 7d 所示。

案例研究

在 RL 訓練過程中,研究者觀察到一個有趣的現象:Actor 模型的推理模式會隨著時間的推移而動態演化。具體來說,算法不僅強化了有助于正確解決問題的現有推理模式,還逐漸產生了最初不存在的全新推理模式。這一發現揭示了 RL 算法的適應性和探索能力,并為模型的學習機制提供了新的見解。

例如,在模型訓練的早期階段,幾乎不存在對之前推理步驟的檢查和反思。然而,隨著訓練的進行,模型表現出明顯的反思和回溯行為,如表 2 所示。這一觀察結果為進一步探索解釋推理能力在 RL 過程中的出現提供了啟示。

截屏2025-03-18 10.12.40.png

更多研究細節,可參考原論文。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-03-13 11:07:30

2025-03-03 09:32:00

2025-06-05 06:36:17

2025-10-08 10:44:16

2025-03-03 01:00:00

DeepSeekGRPO算法

2025-03-11 01:00:00

GRPO算法模型

2025-05-26 08:48:00

2020-05-28 13:20:49

算法谷歌性能

2025-05-15 09:04:00

2025-07-30 09:06:02

2024-10-11 17:22:44

2025-09-16 10:09:00

2025-06-17 08:45:00

模型智能工具

2025-04-03 15:40:41

機器學習大模型DeepSeek

2025-05-30 07:40:56

2025-02-17 09:33:00

AI算法模型

2023-06-06 07:03:02

2025-03-14 10:22:03

2013-05-14 09:54:27

Android開發開源開發環境

2025-10-21 09:04:00

點贊
收藏

51CTO技術棧公眾號

精品女同一区二区三区在线播放| 国产91在线亚洲| 日韩网址在线观看| 影音先锋国产资源| 国产精品qvod| 蜜臀国产一区二区三区在线播放| 亚洲精品久久7777777| 91免费视频黄| 中文字幕一区二区人妻| 外国成人在线视频| 亚洲综合一区二区精品导航| 国产精品人人做人人爽| av直播在线观看| av在线加勒比| 日韩综合精品| 91成人网在线| 日韩av手机在线| 亚洲の无码国产の无码步美| 污视频网站免费在线观看| 久久国产福利国产秒拍| 中文字幕日韩视频| www.色偷偷.com| 久久久资源网| 久久久国产亚洲精品| 亚洲黄色av网站| 午夜宅男在线视频| 91成人高清| 免费成人小视频| 亚洲18私人小影院| 欧美肉大捧一进一出免费视频| 污污片在线免费视频| 国产色综合久久| 午夜精品福利视频| 日本爱爱小视频| 亚洲青青一区| 有码一区二区三区| 成人资源视频网站免费| 久久久久久久9999| 国产精品欧美亚洲| 欧美卡一卡二| 国产不卡在线视频| 欧美贵妇videos办公室| 任你躁av一区二区三区| caoporn视频在线观看| 国产精品电影一区二区| 成人在线一区二区| 久久久全国免费视频| 成人激情在线| 制服丝袜av成人在线看| 国产日韩欧美大片| 人妻91麻豆一区二区三区| 99伊人成综合| 亚洲午夜精品视频| 在线一区二区不卡| brazzers在线观看| 亚洲精品高清在线| 一区二区三区在线观看www| 国产深喉视频一区二区| 亚洲高清av| 在线不卡国产精品| 欧美图片自拍偷拍| 国产精品99久久免费| 亚洲成人免费在线观看| 欧美日本韩国在线| 一级黄色片在线播放| 欧美日韩三区| 国产午夜精品视频免费不卡69堂| 一区二区三区美女| 夜夜爽99久久国产综合精品女不卡 | 精品久久久久香蕉网| 久久精品成人一区二区三区蜜臀 | 51精品久久久久久久蜜臀| 青青草原网站在线观看| 欧美一区二区三区激情| 国产精品99久久久| 欧美又大粗又爽又黄大片视频| 91激情视频在线观看| 五月天色综合| 欧美日韩在线影院| 欧美一区二区三区四区在线| 免费观看国产精品视频| 婷婷综合激情网| 日本欧美大码aⅴ在线播放| 久久躁狠狠躁夜夜爽| 性欧美成人播放77777| 美女呻吟一区| 欧美一级在线视频| 黄色国产小视频| 蜜桃传媒在线观看免费进入 | 91视频91自| 99精品电影| 欧美最新大片在线看| 日本女优爱爱视频| 久久久久久久性潮| 午夜精品福利一区二区蜜股av| 亚洲7777| 亚洲精品国产电影| 中文字幕亚洲影院| 波多野结衣视频一区二区| 国产精品拍天天在线| 精品卡一卡二| 国产精品视频在线免费观看 | 国产亚洲婷婷免费| 一区二区三区不卡在线| 国精产品一区一区三区mba下载| 国产免费成人在线视频| 欧美一区二区三区男人的天堂| 久久综合九色99| 性一交一乱一精一晶| 蜜桃视频在线一区| 亚洲在线第一页| 亚洲视频在线观看免费视频| 国产精品夜夜爽| 91精品视频专区| 人妻妺妺窝人体色www聚色窝| 国产偷国产偷亚洲高清人白洁| 亚洲色婷婷久久精品av蜜桃| 新片速递亚洲合集欧美合集| 在线成人黄色| 日韩一区二区在线看片| 成人免费在线观看视频网站| 警花av一区二区三区| 欧美三级中文字幕| 在线观看国产中文字幕| 深夜视频一区二区| 欧美色综合影院| 四虎精品一区二区| 秋霞在线一区| 亚洲欧美日韩一区二区在线| 在线小视频你懂的| 黑人巨大猛交丰满少妇| heyzo高清在线| 欧美喷水一区二区| www.桃色.com| 九九免费精品视频在线观看| 亚洲新声在线观看| 国产真实乱偷精品视频| 亚洲作爱视频| 97超碰资源| 手机av免费在线观看| 91麻豆免费看| 狠狠干 狠狠操| 91精品短视频| 亚洲欧美国产精品专区久久| 久久国产露脸精品国产| 国产精品毛片| 国产精品一区二区久久久| 国产精品爽爽久久久久久| 久久精品欧美一区二区三区不卡| 久久综合九色综合88i| 日韩成人动漫| 亚洲欧美一区二区精品久久久 | 亚洲国产wwwccc36天堂| 在线观看欧美一区二区| 中文字幕一区二区av| 久久人人爽人人爽人人片av高清| 国产精品第5页| 捆绑调教一区二区三区| 97se在线视频| 日韩欧美一起| 精品国产一二三区| 美国黑人一级大黄| 欧美色图麻豆| 国产精品9999久久久久仙踪林 | 亚洲免费观看在线视频| 日韩精品一区二区三区四区五区| 第四色在线视频| 欧美三级午夜理伦三级中文幕| 3d精品h动漫啪啪一区二区| av网址在线看| 亚洲视频你懂的| 国产无限制自拍| 国产精品麻豆成人av电影艾秋| 亚洲亚裔videos黑人hd| 中文字幕免费播放| 图片区 小说区 区 亚洲五月| 国产亚洲欧美日韩日本| 中国黄色片免费看| 五月天综合网站| 亚洲自拍偷拍一区| caoporn视频在线| 亚洲老头老太hd| 中文字幕第315页| 自拍偷拍国产精品| 毛片av免费在线观看| 精品国产乱码久久久久久樱花| 久久福利视频网| 中文字幕一区二区三区四区欧美| 国产在线精品不卡| 男插女免费视频| www在线观看播放免费视频日本| 日韩亚洲欧美在线| 国产无码精品一区二区| 91在线观看视频| 久久av一区二区三区亚洲| av资源亚洲| 日韩欧美国产午夜精品| 亚洲激情图片网| 翔田千里一区二区| 国内视频一区| 久草在线视频福利| 亚洲人成绝费网站色www| 日韩成人免费观看| 国产·精品毛片| 国产xxxxx在线观看| 日韩伦理视频| 国产一区二区三区高清| 国产亚洲精彩久久| 97成人超碰免| 天天插天天干天天操| 欧美日韩极品在线观看一区| 国产一级一片免费播放| 国产精品久久久久永久免费观看 | 91精品国产麻豆国产自产在线| 日本少妇bbwbbw精品| 丁香婷婷综合网| 久久这里只有精品8| 亚洲综合色婷婷在线观看| 国产97色在线| 国产蜜臀在线| 日韩在线播放一区| 国产精品毛片一区视频播| 狠狠躁夜夜躁人人爽天天天天97| 91嫩草丨国产丨精品| 国产精品1区2区| 免费一级特黄录像| 夜久久久久久| 九九热只有这里有精品| 日韩免费成人| 久久久久久尹人网香蕉| 人妻一区二区三区免费| 在线电影一区二区三区| 欧美成人一区二区三区高清| 成人网在线播放| 国产精品久久久久久久99| 丝袜脚交一区二区| 亚洲国产日韩综合一区| 亚洲日本中文| 国产高清在线不卡| 麻豆av在线免费看| 欧美mv日韩mv亚洲| 国产精品伊人久久| 欧美日韩精品久久久| 天堂av免费在线观看| 狠狠躁夜夜躁人人躁婷婷91| 中文字幕一区二区三区精品| 亚洲成人精品一区二区| 精品少妇theporn| 夜夜夜精品看看| 国产精品白浆一区二小说| 亚洲一区二区三区激情| 亚洲精品成人无码熟妇在线| 美女视频第一区二区三区免费观看网站| 免费在线激情视频| 免费精品视频| 国产裸体舞一区二区三区| 亚洲欧美日韩国产综合精品二区| 97国产精东麻豆人妻电影| 首页国产精品| 国产亚洲精品久久飘花| 国内精品免费| 久久66热这里只有精品| 日韩成人av在线资源| 欧美精品一区二区三区四区五区| 欧美女优在线视频| 亚洲欧洲精品一区| 9191国语精品高清在线| 欧美激情一区二区三区在线视频| 欧美色图婷婷| 日本在线观看一区二区三区| 第一sis亚洲原创| 黄色高清视频网站| 黄色成人精品网站| 亚洲欧洲久久| 久久夜色精品亚洲| 高清视频一区二区| 久久一区二区电影| 久久久一区二区三区捆绑**| xxx中文字幕| 老司机午夜免费精品视频| 成人性做爰aaa片免费看不忠| 日本va欧美va欧美va精品| 男女视频在线观看网站| 不卡欧美aaaaa| 日本成人xxx| 国产成人av电影在线| 超碰男人的天堂| 欧美激情一区在线观看| 亚洲最大的黄色网址| 国产三级精品视频| 国产色无码精品视频国产| 亚洲自拍偷拍av| 麻豆精品久久久久久久99蜜桃| 欧美日韩精品综合在线| 好吊色在线观看| 精品久久人人做人人爽| 日av在线播放| 亚洲精品国产精品久久清纯直播| 北岛玲一区二区三区| 亚洲欧美中文另类| 成人日日夜夜| 55夜色66夜色国产精品视频 | 精品久久久久久久大神国产| 朝桐光av在线| 精品成人av一区| 国产在成人精品线拍偷自揄拍| 亚洲激情国产精品| 色开心亚洲综合| 久久久av网站| 天堂аⅴ在线地址8| 久久久久久69| 欧洲亚洲精品久久久久| 久久av一区二区| 欧美福利网址| 337p亚洲精品色噜噜狠狠p| 久久青草久久| 特级特黄刘亦菲aaa级| 国产精品免费aⅴ片在线观看| 日韩精品乱码久久久久久| 欧美久久久久久蜜桃| 国产一级二级三级在线观看| 在线观看久久av| 人成在线免费网站| 国产成人精品视频在线观看| 亚洲大奶少妇| 亚洲视频精品一区| 久久这里只有| 在线观看av中文字幕| 一区二区三区av电影| 国产精品怡红院| 日韩视频精品在线| 久久青草免费| 色女孩综合网| 日韩电影网1区2区| 精品亚洲视频在线| 欧美高清在线一区| 一区二区三区不卡在线| 在线天堂资源www在线污| 久久久久久久久爱| 亚洲色图图片| 亚洲美女网站18| 日韩高清一区二区| xxxx日本黄色| 色8久久人人97超碰香蕉987| 无码国产伦一区二区三区视频 | 国产肥老妇视频| 亚洲码国产岛国毛片在线| 日本中文字幕第一页| 亚洲精品大尺度| 999福利在线视频| 国产伦精品一区| 999国产精品| 色一情一区二区| 成人黄色国产精品网站大全在线免费观看| 香蕉久久久久久久| 久久91麻豆精品一区| 免费人成自慰网站| 成人激情校园春色| 久久视频免费在线观看| 欧美大肚乱孕交hd孕妇| 男人添女人下部高潮视频在线观看 | 欧美另类网站| 日日摸夜夜添夜夜添精品视频| xxx在线播放| 国产精品色一区二区三区| 无码免费一区二区三区| 欧美一区二区三区在线看 | 久久久久久久999精品视频| 9l视频自拍九色9l视频成人| 日韩av一区二区三区在线| 日韩av网站在线观看| 日本成人免费在线观看| 欧美一区二区视频网站| av手机在线观看| 欧美aaaaa喷水| 美女脱光内衣内裤视频久久网站| 在线观看美女av| 精品动漫一区二区三区在线观看| 麻豆蜜桃在线观看| 亚洲啪啪av| 国产精品一区二区三区四区| 日韩精品成人在线| 在线观看欧美成人| 精品一区二区三区亚洲| 免费不卡av在线| 国产调教视频一区| 99国产精品一区二区三区| 97久久精品国产| 日本欧美视频| 亚洲午夜久久久久久久久| 日本不卡中文字幕| 午夜精品区一区二区三 | 三级4级全黄60分钟| 国产精品视频线看| 国产富婆一级全黄大片| 欧美又大又粗又长| 欧美va天堂| 国精产品一区二区三区| 日韩欧美卡一卡二| 亚洲国产尤物|