精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

DeepSeek同款GRPO訓練大提速!魔搭開源全流程方案,支持多模態(tài)訓練、訓練加速和評測全鏈路

人工智能 新聞
GRPO訓練是來自于PPO算法的一種改進,旨在利用采樣原理對value model進行簡化,以增大訓練的穩(wěn)定性和可維護性。

GRPO訓練又有新的工具鏈可以用,這次來自于ModelScope魔搭社區(qū)。

隨著DeepSeek-R1的成功出圈,其使用的GRPO算法受到了業(yè)界的廣泛關(guān)注。GRPO訓練是來自于PPO算法的一種改進,旨在利用采樣原理對value model進行簡化,以增大訓練的穩(wěn)定性和可維護性。

目前圍繞R1模型的技術(shù)方案,社區(qū)也已經(jīng)有一些開源實現(xiàn),比如來自Hugging Face的Open-R1,以及其他一些RL框架,包括veRL,OpenRLHF等等。然而,在GRPO訓練方面,大部分方案仍然面臨著諸多挑戰(zhàn),包括訓練速度較低、集群配置復(fù)雜,以及對多模態(tài)擴展能力差、訓練后不好評測等等。

為了支持開源社區(qū)在GRPO這個方向上的探索,ModelScope魔搭社區(qū)圍繞MS-SWIFT訓練框架以及EvalScope評估框架,推出了相對完整高效的GRPO全鏈路解決方案,和社區(qū)分享。

GRPO訓練提速

GRPO訓練的耗時主要來自于采樣、訓練等幾個方面。其中,采樣本身是PPO算法的重要組成部分。尤其是GRPO在PPO的基礎(chǔ)上,使用采樣代替value model的方案,這使得在GRPO訓練中,采樣的耗時的占比,更是大大的增加了。而且GRPO中單query的采樣數(shù)(即group size),一般比較大(DeepSeekMath論文中為64個),高采樣頻率對于推理引擎的挑戰(zhàn)是巨大的。優(yōu)化采樣效率是提升GRPO整體訓練速度的核心所在。

基于這些特點,魔搭社區(qū)的SWIFT框架進行了有針對性的優(yōu)化:

多實例數(shù)據(jù)并行采樣

對于GRPO算法,單實例采樣往往無法滿足需求。團隊觀察發(fā)現(xiàn),7B模型在訓練期間,單iter的采樣時間占比約為70%,這意味著應(yīng)該允許訓練資源根據(jù)實際情況,針對性的傾斜分配給采樣計算

尤其在采樣量以及batch_size較大時,采樣耗時對訓練速度影響會更為顯著。因此,在SWIFT中對vLLM和LMDeploy進行了一定的patch(同時也與相關(guān)框架負責同學進行了討論,將會將相關(guān)實現(xiàn)在vLLM/LMDeploy上原生支持),支持在任意比例的訓練卡上拉起采樣實例。例如對于8卡訓練中,配置4張卡負責模型訓練,4張卡負責采樣;或者6張卡負責訓練,2張卡負責采樣。

下圖展示了在同樣的8卡訓練設(shè)置下,分別使用1卡/2卡部署推理引擎進行采樣,剩余卡負責訓練,vLLM/LMDeploy的采樣耗時和訓練耗時如下:

圖片
圖片

可以看到,基于LMDeploy分配2卡進行采樣時,訓練時長約為1卡采樣的87%。而vLLM2卡采樣時,時長為1卡采樣的78%。在這兩個例子中,通過更合理多卡數(shù)分配,對采樣資源進行一定傾斜,都達到了有效降低訓練所需時長都目的。

異步采樣

GRPO訓練中,采樣和模型訓練需要交替進行,即訓練時采樣卡閑置,采樣時訓練卡閑置。對于這個問題,不同的框架給出了不同的解決方案。

例如veRL允許將采樣和訓練部署在同一GPU上,在不同階段讓不同的權(quán)重offload到CPU中;或者針對LLM的不同Layer、不同Tensor進行異構(gòu)式切分,在加載權(quán)重時不必all_gather(而是部分weights進行g(shù)ather并同步),使訓練模型和采樣模型的效率達到最高。然而在中小模型的體量上,這樣的切分未必是最優(yōu)的。

因為隨著模型尺寸和batch_size增大,采樣、訓練的耗時占比會有本質(zhì)差別。對此SWIFT采用了不一樣的技術(shù)路線,即異步采樣(replay buffer),其原理是在訓練時同時進行采樣,采樣結(jié)果用于下一iter的模型訓練。由于采樣使用的是old policy model,因此訓練過程需要額外增加對于logits差異的CLIP。由于old policy model和policy model僅相差一個iter,因此其訓練穩(wěn)定性幾乎沒有下降。二者唯一需要等待(或者stop the world)的過程是權(quán)重加載。

圖片

同樣訓練設(shè)置下的實驗測試表明,在單卡部署LMDeploy的情況下,異步采樣的訓練時間約為同步采樣的2/3。

模型placement

SWIFT除了支持上述訓練和rollout使用兩個資源組進行異步訓采流程之外,也支持二者共用同一資源組。即,在actor模型訓練時,vLLM將開啟sleep模式以減少顯存占用。

這兩種模式的架構(gòu)圖如下:

圖片

并且,SWIFT也支持vLLM的tensor_parallel(MP)模式。

LMDeploy推理框架支持

LMDeploy是來自于上海浦江實驗室的優(yōu)秀推理加速框架。該框架不僅支持了純文本和多模態(tài)模型的推理加速,并且自研了基于FasterTransformer實現(xiàn)的Turbomind推理加速引擎。在推理速度上,LMDeploy相較vLLM在一眾模型上速度有顯著的提升。對Qwen2.5-7B-Instruct模型進行實驗測試,具體配置如下:使用AI-MO/NuminaMath-TIR數(shù)據(jù)集,批量大小設(shè)置為7,每條query采樣24條結(jié)果,訓練50個steps。以下是vLLM框架和LMDeploy框架在相同條件下的推理時長對比。

圖片
圖片

可以看到使用LMDeploy作為采樣的推理引擎,在整體的訓練速度上從44分/50steps加速到37分/50steps,加速比大約為16%。

注:最后50steps的訓練耗時包括了保存模型權(quán)重,測試集評測

SWIFT框架在TRL框架以及vLLM采樣的基礎(chǔ)上,額外引入了LMDeploy采樣的支持。得益于其推理速度和權(quán)重加載速度,可以做到整體采樣耗時只有基礎(chǔ)實現(xiàn)的70%。

多輪更新

多輪更新的核心思想是:讓一次采樣得到的數(shù)據(jù)可以被多次使用。通過這種方式,可以減少采樣的頻率,從而讓采樣和訓練的資源分配更加均衡。

通過設(shè)置參數(shù)num_iterations, 可設(shè)置每輪采樣數(shù)據(jù)的迭代更新輪數(shù),增大該參數(shù)值可以多次利用采樣數(shù)據(jù),緩解采樣過程對訓練的速度影響,從而提高訓練速度。在該值設(shè)置不太大(例如小于等于4)的情況下,基本不會對模型訓練效果有不良影響。這里的更新輪次對應(yīng)論文中的mu值。

多輪更新是TRL庫提供的機制,發(fā)現(xiàn)該機制和團隊提供的其他機制結(jié)合起來有更好的加速效果。

基于1卡部署LMDeploy的設(shè)置下,對比num_iterations從1-4的訓練時間,下面給出了完整的實驗結(jié)果:

圖片

可以看到,在設(shè)置多輪更新輪次為4時(mu=4),整體訓練耗時約為單輪更新的一半。

綜合測試

針對八卡環(huán)境的SWIFT、veRL和trl框架的訓練效率進行了對比。在實驗設(shè)置中整合了前文提到的多種訓練加速技術(shù),并選用LMDeploy作為推理引擎。

具體配置上,采用雙卡進行推理采樣,結(jié)合異步采樣策略,并將多輪更新輪次設(shè)定為4輪。同時,為了更好模擬真實訓練場景,將batch_size調(diào)整為48(每輪6個query,梯度累計步數(shù)為 8),group size設(shè)置為24,基于Qwen2.5-7B-Instruct模型和AI-MO/NuminaMath-TIR數(shù)據(jù)集(1),對多框架的GRPO訓練速度進行了對比評測。

SWIFT:
圖片
veRL:
圖片
trl(mu=4):
圖片
trl(mu=1)
圖片

實驗結(jié)果表明,SWIFT框架的訓練耗時約為120秒/步,而veRL框架訓練耗時約為280秒/步,TRL框架在采用多步更新下約為144秒/步,而不采用多步更新則約為320秒/步。通過整合多種訓練加速技術(shù),SWIFT框架在GRPO的中小集群訓練效率上實現(xiàn)了顯著提升。下圖展示了SWIFT框架下的訓練獎勵走勢,可以看出模型成功實現(xiàn)了獎勵值的提升。

圖片

多模態(tài)GRPO訓練

多模態(tài)GRPO訓練目前已經(jīng)有一些開源解決方案,例如R1-V,open-r1-multimodal等,都是基于Open-R1進行了簡單的擴展。

SWIFT框架目前已經(jīng)支持多模態(tài)模型(圖文、視頻、音頻)的GRPO訓練,只要在數(shù)據(jù)集中給定’images’/‘videos’/‘a(chǎn)udios’字段,GRPO會將多模態(tài)內(nèi)容輸入多模態(tài)模型中進行強化訓練。SWIFT目前在微調(diào)中支持的多模態(tài)模型近兩百個,這些模型均天然支持GRPO訓練。參考R1-V的任務(wù)設(shè)置,在多模態(tài)計數(shù)任務(wù)上進行了訓練,訓練數(shù)據(jù)集為CLEVR-70k-Counting(2)。訓練選取的獎勵函數(shù)一共有兩個,一個是 Deepseek-R1 中提到的格式獎勵函數(shù),用于評估模型輸出格式的準確性;另一是自定義的準確性獎勵函數(shù),用于計算模型輸出的計數(shù)是否與真值一致,目前兩個獎勵函數(shù)都已經(jīng)定義在SWIFT框架中,通過—reward_funcs external_r1v_acc format參數(shù)指定。
選取Qwen2.5-VL-3B-Instruct 作為基礎(chǔ)模型進行訓練,選取 instruct 而不是base模型的主要原因是可以更快地獲取 format reward。整體實驗在8卡 GPU 上完成。當前SWIFT GRPO訓練已支持多卡部署模型以加速rollout,因此設(shè)置num_infer_workers為2,進程數(shù)為6:即2卡vLLM部署采樣,6卡模型訓練。設(shè)置模型的最大輸出為1024,學習率設(shè)置為1e-6,其他參數(shù)設(shè)置詳見最佳實踐(3)。

實驗結(jié)果如下圖所示:
圖片

模型訓練了500個epoch已經(jīng)基本收斂,準確性獎勵(圖中為ClevrCountORM)和格式獎勵(圖中為Format)在不斷增加,證明模型學習到了如何完成這一任務(wù),最終任務(wù)成功率從初始的0.4攀升到1左右;在大概300step左右,reward_std已經(jīng)將到0.1左右,證明模型已經(jīng)基本收斂;completion length最終穩(wěn)定在60-80,模型學習到的任務(wù)推理范式是逐個列舉圖中的物體。
訓練后的模型輸出樣例如下:

user:
How many items are there in the image?
assistant:
<think> Counting the number of items in the image:\n1. Green matte sphere\n2. Large metallic yellow sphere\n3. Small metallic brown cube\n\nThere are three distinct objects in total.\n</think>\n<answer>3</answer>

Reasoning模型評測

EvalScope框架是魔搭社區(qū)上開源的大模型評測工具(4),提供了完整的大模型全面評測框架。

不僅提供O1/R1等推理類模型的推理性能的評測能力,還支持評測結(jié)果的可視化,如下圖所示。

同時,團隊將MATH-500、GPQA-Diamond和AIME-2024三個數(shù)據(jù)集整合為一個數(shù)據(jù)集合,放置于modelscope/R1-Distill-Math-Test數(shù)據(jù)集(5)中,用戶可以直接使用該數(shù)據(jù)集的ID進行評測操作,具體使用流程參考:模型推理能力評測最佳實踐(6)。

圖片
圖片

除此之外,針對Reasoning模型在推理過程中存在Underthinking(思考不足,指模型在推理時頻繁思路跳轉(zhuǎn),無法專注于正確的思路,導致錯誤答案)和Overthinking(過度思考,指模型簡單問題上生成過長思維鏈,浪費計算資源)的問題。

該框架實現(xiàn)了模型思考效率評測能力,可以評估如DeepSeek-R1-Distill-Qwen-7B(7)等推理模型的思考效率,如下圖所示,從token效率、思考長度、子思維鏈數(shù)量和準確率四個方面進行衡量,可以用來評測并優(yōu)化模型在短輸出中獲取正確答案的能力,具體使用流程參考教程:模型思考效率評測最佳實踐(8)。

圖片

效果

從簡單的數(shù)學任務(wù)Countdown Game出發(fā),對SWIFT框架的GRPO有效性進行驗證,并給出了完整的實驗流程(9)。

Coundown Game 的任務(wù)目標是根據(jù)給定的幾個數(shù)字和加減乘除四種運算,得到目標數(shù)字,給出運算公式,因此在模型的輸入中給定了任務(wù)描述、已有數(shù)字和目標數(shù)字。訓練選取的獎勵函數(shù)一共有兩個,一個是標準的格式獎勵函數(shù),用于評估模型輸出格式的準確性;另一是自定義的準確性獎勵函數(shù),用于評估模型輸出運算公式是否能得到目標值,目前兩個獎勵函數(shù)都已經(jīng)定義在SWIFT框架中,通過—reward_funcs external_countdown format參數(shù)指定。

選取Qwen2.5-3B-Instruct模型進行全參數(shù)GRPO訓練,具體參數(shù)設(shè)置詳見實驗流程。發(fā)現(xiàn)GRPO的訓練過程是比較不穩(wěn)定的,一個比較大的學習率和beta(KL散度的權(quán)重)雖然會是模型更快收斂,但往往出現(xiàn)梯度過大而訓練崩潰的情況。最終選取學習率為7e-5,beta為0.001。
實驗結(jié)果如下圖所示:

圖片

一共訓練了2000個step,各項曲線證明了SWIFT GRPO的有效性,從實驗結(jié)果中也能看到模型的收斂過程。

準確性獎勵(CoundownORM)和格式獎勵(Format)的穩(wěn)步上升證明模型逐步學習到了如何更好地完成這一任務(wù),同時reward_std最終處在0.2-0.3左右也證明了模型仍有繼續(xù)上升的空間。

從completion_length的變化上能明確地看到模型思考方式的轉(zhuǎn)變。從初始的500左右降到200,然后又增長到300-400 tokens,能明確看到各個階段模型的思考方式。初始時,模型會直接從結(jié)果出發(fā),反推需要的數(shù)字;然后,模型逐漸精簡了反推過程,顯著縮減了輸出場地;最后,模型發(fā)現(xiàn)完成任務(wù)最好的方式是列舉已有數(shù)字和運算的組合,并逐步運算,輸出范式基本收斂。最終的輸出樣例如下:

user:
"Using the numbers [71, 92, 80], create an equation that equals 59. You can use basic arithmetic operations (+, -, *, /) and each number can only be used once. Show your work in <think> </think> tags. And return the final equation and answer in <answer> </answer> tags, for example <answer> (1 + 2) / 3 = 1 </answer>."

assistant:
"<think>\nWe need to form an expression using the numbers 71, 92, and 80 which results in 59. Let's try some combinations:\n(92 - 80) + 71 = 83 + 71 = 154 (too high)\n(92 - 71) + 80 = 21 + 80 = 101 (too high)\n(92 - 80) + 71 = 12 + 71 = 83 (too high)\n(92 - 71) + 80 = 21 + 80 = 101 (too high)\n(92 + 80) - 71 = 172 - 71 = 101 (too high)\n(92 + 71) - 80 = 163 - 80 = 83 (too high)\n(80 + 71) - 92 = 151 - 92 = 59\n\nSo our solution is: (80 + 71) - 92 = 59</think>\n\n<answer>(80 + 71) - 92 = 59</answer>"

寫在最后

SWIFT正在添加vLLM的MP模式以適配更大體量模型的訓練,并希望在已有的優(yōu)秀框架的技術(shù)沉淀上以差異化技術(shù)的方式為開發(fā)者提供簡單快速的中、小集群RL訓練方案,給開發(fā)者提供新的技術(shù)選型。目前SWIFT已經(jīng)支持的訓練領(lǐng)域有數(shù)學、ReACT結(jié)構(gòu)的Agent、多模態(tài)VQA等,代碼領(lǐng)域的支持也在陸續(xù)更新中。對于Megatron結(jié)構(gòu)的模型SWIFT在支持中,不僅僅是GRPO訓練,SFT和PreTrain也將得到相應(yīng)支持。

評測領(lǐng)域,EvalScope后續(xù)會針對Reasoning models進一步探索模型的“思考效率”問題;另外,從目前的趨勢看,多模態(tài)Reasoning的范式也逐漸引起重視,團隊也會在該領(lǐng)域積極探索最新的評測基準、指標和方法。

責任編輯:張燕妮 來源: 量子位
相關(guān)推薦

2020-08-10 15:05:02

機器學習人工智能計算機

2023-05-04 15:53:34

強化學習開發(fā)

2024-12-12 00:25:09

2025-04-07 00:00:00

多模態(tài)大模型

2025-03-24 10:00:00

2025-03-19 09:20:00

2024-11-04 13:30:00

模型AI

2023-07-18 15:05:00

開源大模型

2025-08-04 08:49:00

2009-12-21 09:13:09

Ubuntu啟動速度

2023-09-12 13:43:00

智能技術(shù)

2009-09-23 18:14:48

2020-07-13 14:30:35

人工智能機器學習技術(shù)

2023-01-05 09:33:37

視覺模型訓練

2025-04-07 02:25:00

DeepSeek模型訓練GRPO

2024-12-16 13:34:35

2024-06-17 00:00:00

MiCo模態(tài)人腦

2025-08-24 09:24:07

2021-07-22 15:25:14

開源技術(shù) 框架
點贊
收藏

51CTO技術(shù)棧公眾號

国产一区二区欧美日韩| 一区二区在线免费观看| 欧洲亚洲在线视频| 伊人影院综合网| 高清不卡一区| 欧美日韩国产激情| 日韩中文字幕一区二区| 国产三级三级在线观看| 国产精品入口| 日韩中文字幕在线| 在线精品视频播放| 999国产精品亚洲77777| 亚洲综合激情另类小说区| 欧美第一黄网| 99精品免费观看| 久久久一二三| 欧美精品久久久久久久| 永久免费av无码网站性色av| 日韩在线精品强乱中文字幕| 一本高清dvd不卡在线观看| 久久av喷吹av高潮av| 日韩专区第一页| 久久精品av麻豆的观看方式| 66m—66摸成人免费视频| 看黄色录像一级片| 在线亚洲a色| 精品99999| 一级 黄 色 片一| 成人做爰视频www| 欧美日韩国产区| 日本香蕉视频在线观看| av成人手机在线| 久久影院午夜片一区| 亚洲一区二区中文字幕| 在线免费观看av网址| 在线综合亚洲| 久久久久国产精品www| 欧美日韩色视频| 日韩片欧美片| 中文字幕亚洲欧美日韩高清| 亚洲第一区第一页| 欧美日韩中文在线视频| 狂野欧美性猛交xxxxx视频| 亚洲视频一区在线| 亚洲欧洲精品一区| 国产福利免费在线观看| 久久色在线观看| 欧美日韩日本网| 日韩二区三区| 99精品视频在线观看免费| 成人片在线免费看| 亚洲黄色在线免费观看| 国产美女主播视频一区| 成人a在线观看| 在线视频 中文字幕| 奇米四色…亚洲| 国产精品高潮在线| 中文字幕日韩国产| 久久精品国产成人一区二区三区 | av毛片在线| 亚洲视频一区在线| 欧美aaa在线观看| 超碰在线无需免费| 一区二区三区不卡在线观看 | 欧美一级理论性理论a| 欧美成人福利在线观看| 亚洲黑人在线| 欧美一卡二卡三卡四卡| 国产乱国产乱老熟300部视频| 91成人在线精品视频| 亚洲成人黄色网| 一级性生活大片| 精品美女久久久| 中文字幕亚洲一区二区三区| 米奇精品一区二区三区在线观看| 精品伦一区二区三区| jizz性欧美23| 亚洲美女av黄| 999精品在线视频| 国内精品嫩模av私拍在线观看| 欧美激情精品久久久久久| 黄网在线观看视频| 免费美女久久99| 97久久天天综合色天天综合色hd| 内射后入在线观看一区| 久久久九九九九| 麻豆中文字幕在线观看| av今日在线| 欧美亚男人的天堂| 久久久久亚洲av无码麻豆| 国产91精品入| 综合欧美国产视频二区| 久久久久亚洲天堂| 久久久久网站| 亚洲自拍高清视频网站| 日韩黄色影片| 一区二区三区色| 无码内射中文字幕岛国片| 久久亚洲精精品中文字幕| 日韩久久免费电影| 欧美三级黄色大片| 久久久国产精品一区二区中文| 国产欧美一区二区白浆黑人| 狠狠人妻久久久久久综合麻豆| 国产日产欧美一区二区三区| 蜜桃网站在线观看| 欧美一级大片| 精品国产1区2区3区| 在线观看日本黄色| 亚洲少妇一区| 亚洲综合自拍一区| jizz日韩| 一本久久综合亚洲鲁鲁五月天 | 国产又粗又猛视频| 91视频免费观看| 日本xxxxx18| 亚洲天堂一区二区| 亚洲第一福利在线观看| 大黑人交xxx极品hd| 日韩成人免费| 日韩美女免费观看| 欧美熟妇另类久久久久久不卡 | 美脚丝袜脚交一区二区| 青青在线精品| 亚洲桃花岛网站| 一级片免费网址| 国产成人免费在线观看| 一区二区精品在线| 日本在线中文字幕一区二区三区| 亚洲福利在线视频| 免费一级片视频| 国产在线视频精品一区| 亚洲一区二区三区乱码| 亚洲a∨精品一区二区三区导航| 亚洲国产日韩欧美在线图片 | 69av亚洲| 日本韩国一区二区三区视频| 精品人妻无码一区二区三区 | 欧美成人激情| 国产精品久久久久久久久久 | 亚洲国产激情av| 精品久久久久久久免费人妻| 色吊丝一区二区| 97免费视频在线| 天天操天天操天天操| 亚洲一区二区三区在线| 国产人妖在线观看| 亚洲一级网站| 国产一级精品aaaaa看| 国产美女精品写真福利视频| 精品粉嫩超白一线天av| 国产无遮挡免费视频| 成人黄色av电影| 俄罗斯av网站| 亚洲国产欧美日韩在线观看第一区| 88xx成人精品| 久草视频视频在线播放| 欧美专区在线观看一区| 国产白丝一区二区三区| 激情五月播播久久久精品| 国产一二三四五| 伊人久久噜噜噜躁狠狠躁| 久久久久久美女| 五月婷婷深深爱| 色综合久久综合中文综合网| 蜜臀久久99精品久久久久久| 久久99久久久久久久久久久| av磁力番号网| 色天下一区二区三区| 国产大片精品免费永久看nba| 欧美性猛交xxx乱大交3蜜桃| 欧美一级理论性理论a| 国产无遮挡又黄又爽| 久久一区二区三区四区| 丝袜制服一区二区三区| 午夜影院欧美| 国产欧美日韩亚洲| 欧美理论影院| 久久综合电影一区| 午夜在线观看视频18| 色国产精品一区在线观看| 国产成人在线网址| 成人福利在线看| 国产真人无码作爱视频免费| 国产精品黑丝在线播放| 国产精品乱码| 九七影院97影院理论片久久 | 国产性色av一区二区| 国产又色又爽又黄又免费| 亚洲一区二区三区中文字幕 | 国产精品稀缺呦系列在线| 国产在线更新| 日韩成人中文字幕| 国产影视一区二区| 欧美三级xxx| 91porn在线视频| 久久色.com| 午夜福利三级理论电影| 日韩vs国产vs欧美| 人人妻人人做人人爽| 欧美精选视频在线观看| 国产精品久久久久免费| 中文成人在线| 国产99久久精品一区二区| 日本动漫同人动漫在线观看| 亚洲视频axxx| 成人精品在线播放| 欧美日韩黄视频| 亚洲婷婷综合网| 亚洲最色的网站| 激情五月激情综合| 久久免费视频一区| 丰满人妻一区二区三区53视频| 久久综合中文| 鲁一鲁一鲁一鲁一澡| 欧美在线三区| 在线观看成人一级片| 亚洲素人在线| 国产日韩三区| 中文字幕久久精品一区二区| 91精品中文在线| 老司机精品视频网| 日韩av色综合| 免费高潮视频95在线观看网站| 免费不卡欧美自拍视频| 在线毛片网站| 国产亚洲激情视频在线| 亚洲av片在线观看| 亚洲国产精彩中文乱码av| hs视频在线观看| 欧美高清hd18日本| 亚洲天堂777| 欧美亚洲愉拍一区二区| 日韩欧美在线观看免费| 欧美性xxxxx| 7799精品视频天天看| 无吗不卡中文字幕| 精品久久免费视频| 亚洲一区在线电影| 国产性70yerg老太| 神马影视一区二区| 2019国产精品视频| 成人黄色91| 96pao国产成视频永久免费| 日韩成人免费av| 国产精品一区二区三区在线播放| 澳门av一区二区三区| 国产ts一区二区| 在线观看精品| 国产日韩在线视频| 中文字幕日韩亚洲| 成人性生交大片免费观看嘿嘿视频| 亚洲精品777| 91久久在线播放| 日韩欧美中文字幕一区二区三区| 成人精品一区二区三区| 国产精品高清一区二区| 91在线观看免费观看| 欧美视频二区欧美影视| 97se国产在线视频| 久9re热视频这里只有精品| 国产精品污www一区二区三区| 国产精品久久久久av蜜臀| 精品毛片久久久久久| 亚洲精品一级二级三级| 日韩少妇中文字幕| 国产精品毛片一区二区在线看| 黄色免费高清视频| 亚洲第一在线| av无码精品一区二区三区| 毛片不卡一区二区| 性生活在线视频| 99精品视频中文字幕| 蜜桃久久精品成人无码av| 中文字幕在线观看不卡视频| 欧美精品色哟哟| 大伊人狠狠躁夜夜躁av一区| 婷婷激情五月综合| 欧美一区在线视频| 五月婷婷丁香六月| 最近2019好看的中文字幕免费| 在线āv视频| 日本欧美精品在线| 成人污版视频| 蜜桃av噜噜一区二区三区| 欧美丰满日韩| 可以在线看的av网站| 男女男精品视频网| youjizz.com日本| 国产欧美精品一区二区色综合| 最新av电影网站| 欧美日韩午夜视频在线观看| 91美女精品网站| 亚洲精品动漫100p| 免费看美女视频在线网站| 午夜精品久久久99热福利| 成人av色网站| 精品午夜一区二区三区| 欧美激情777| 国产a级一级片| 国产精品一卡二卡| 欧美性受xxxx黑人| 五月天激情小说综合| 91精品国产色综合久久不8| 亚洲精品电影在线观看| 成人无遮挡免费网站视频在线观看| 91av视频在线观看| 日韩成人18| 亚洲精品乱码久久久久久蜜桃91| 国内自拍视频一区二区三区| 天天干天天爽天天射| 成人国产精品免费观看视频| 综合五月激情网| 欧美羞羞免费网站| 免费黄网站在线观看| 欧美激情视频一区| 国产精品一区二区三区av | 亚洲一级高清| 色黄视频免费看| 国产精品久久免费看| 特级毛片www| 亚洲精品720p| 久久五月精品中文字幕| 成人免费午夜电影| 日韩在线综合| 看欧美ab黄色大片视频免费| 91免费观看视频在线| 四虎永久在线精品| 精品日产卡一卡二卡麻豆| av激情在线| 91午夜理伦私人影院| 国产精品7m凸凹视频分类| 性欧美videossex精品| 久久久不卡网国产精品一区| xxxx.国产| 精品无人国产偷自产在线| 欧产日产国产精品视频| 狠狠色综合网站久久久久久久| 激情欧美丁香| www国产视频| 午夜精品在线视频一区| 日韩中文字幕免费在线观看| 国产+人+亚洲| 久久aimee| 凹凸国产熟女精品视频| 2023国产精品| 在线免费观看国产精品| 中文字幕日韩综合av| 欧洲午夜精品| 青青草免费在线视频观看| 国产成人免费视频| 国产在线视频二区| 亚洲国内精品视频| 超级碰碰久久| 色姑娘综合网| 老司机精品视频一区二区三区| 极品色av影院| 欧美大胆一级视频| 麻豆免费版在线观看| 欧洲在线视频一区| 麻豆成人91精品二区三区| 久艹在线观看视频| 精品国产污网站| 欧美日韩国产观看视频| 午夜视频在线观看国产| 久久这里只有| 91中文字幕永久在线| 欧美调教femdomvk| gogo在线高清视频| 国产精品手机在线| 日韩激情一二三区| 国产一区二区精彩视频| 精品国产一区二区三区四区四| 精品丝袜在线| 亚洲午夜精品久久| 国产成人av一区二区三区在线 | 粉嫩av一区| 亚洲伊人久久综合| 一区二区日韩免费看| 天堂在线中文视频| 91精品婷婷国产综合久久竹菊| 丁香高清在线观看完整电影视频| 久久伊人资源站| 国内精品国产三级国产a久久| 日韩成人免费在线视频| 一本一本久久a久久精品牛牛影视| 伊人久久大香| 尤物av无码色av无码| 国产精品初高中害羞小美女文| 亚洲高清在线观看视频| 日本一区二区在线播放| 欧美激情成人在线| 好吊视频在线观看| 欧美不卡激情三级在线观看| 香蕉视频亚洲一级| 毛片av在线播放| 中文av一区特黄| 天堂а在线中文在线无限看推荐| 成人美女av在线直播| 性伦欧美刺激片在线观看|