精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

全面超越DPO:陳丹琦團(tuán)隊(duì)提出簡(jiǎn)單偏好優(yōu)化SimPO,還煉出最強(qiáng)8B開(kāi)源模型

人工智能 新聞
近段時(shí)間已有一些研究者探索了更簡(jiǎn)單的離線算法,其中之一便是直接偏好優(yōu)化(DPO)。

為了將大型語(yǔ)言模型(LLM)與人類的價(jià)值和意圖對(duì)齊,學(xué)習(xí)人類反饋至關(guān)重要,這能確保它們是有用的、誠(chéng)實(shí)的和無(wú)害的。在對(duì)齊 LLM 方面,一種有效的方法是根據(jù)人類反饋的強(qiáng)化學(xué)習(xí)(RLHF)。盡管經(jīng)典 RLHF 方法的結(jié)果很出色,但其多階段的過(guò)程依然帶來(lái)了一些優(yōu)化難題,其中涉及到訓(xùn)練一個(gè)獎(jiǎng)勵(lì)模型,然后優(yōu)化一個(gè)策略模型來(lái)最大化該獎(jiǎng)勵(lì)。

近段時(shí)間已有一些研究者探索了更簡(jiǎn)單的離線算法,其中之一便是直接偏好優(yōu)化(DPO)。DPO 是通過(guò)參數(shù)化 RLHF 中的獎(jiǎng)勵(lì)函數(shù)來(lái)直接根據(jù)偏好數(shù)據(jù)學(xué)習(xí)策略模型,這樣就無(wú)需顯式的獎(jiǎng)勵(lì)模型了。該方法簡(jiǎn)單穩(wěn)定,已經(jīng)被廣泛用于實(shí)踐。

使用 DPO 時(shí),得到隱式獎(jiǎng)勵(lì)的方式是使用當(dāng)前策略模型和監(jiān)督式微調(diào)(SFT)模型之間的響應(yīng)似然比的對(duì)數(shù) 的對(duì)數(shù)比。但是,這種構(gòu)建獎(jiǎng)勵(lì)的方式并未與引導(dǎo)生成的指標(biāo)直接對(duì)齊,該指標(biāo)大約是策略模型所生成響應(yīng)的平均對(duì)數(shù)似然。訓(xùn)練和推理之間的這種差異可能導(dǎo)致性能不佳。

為此,弗吉尼亞大學(xué)的助理教授孟瑜與普林斯頓大學(xué)的在讀博士夏夢(mèng)舟和助理教授陳丹琦三人共同提出了 SimPO—— 一種簡(jiǎn)單卻有效的離線偏好優(yōu)化算法。

圖片


  • 論文標(biāo)題:SimPO: Simple Preference Optimization with a Reference-Free Reward
  • 論文地址:https://arxiv.org/pdf/2405.14734
  • 代碼 & 模型:https://github.com/princeton-nlp/SimPO

該算法的核心是將偏好優(yōu)化目標(biāo)中的獎(jiǎng)勵(lì)函數(shù)與生成指標(biāo)對(duì)齊。SimPO 包含兩個(gè)主要組件:(1)在長(zhǎng)度上歸一化的獎(jiǎng)勵(lì),其計(jì)算方式是使用策略模型的獎(jiǎng)勵(lì)中所有 token 的平均對(duì)數(shù)概率;(2)目標(biāo)獎(jiǎng)勵(lì)差額,用以確保獲勝和失敗響應(yīng)之間的獎(jiǎng)勵(lì)差超過(guò)這個(gè)差額。

總結(jié)起來(lái),SimPO 具有以下特點(diǎn):

  • 簡(jiǎn)單:SimPO 不需要參考模型,因此比 DPO 等其它依賴參考模型的方法更輕量更容易實(shí)現(xiàn)。
  • 性能優(yōu)勢(shì)明顯:盡管 SimPO 很簡(jiǎn)單,但其性能卻明顯優(yōu)于 DPO 及其最新變體(比如近期的無(wú)參考式目標(biāo) ORPO)。如圖 1 所示。并且在不同的訓(xùn)練設(shè)置和多種指令遵從基準(zhǔn)(包括 AlpacaEval 2 和高難度的 Arena-Hard 基準(zhǔn))上,SimPO 都有穩(wěn)定的優(yōu)勢(shì)。
  • 盡量小的長(zhǎng)度利用:相比于 SFT 或 DPO 模型,SimPO 不會(huì)顯著增加響應(yīng)長(zhǎng)度(見(jiàn)表 1),這說(shuō)明其長(zhǎng)度利用是最小的。

圖片

該團(tuán)隊(duì)進(jìn)行了大量分析,結(jié)果表明 SimPO 能更有效地利用偏好數(shù)據(jù),從而在驗(yàn)證集上對(duì)高質(zhì)量和低質(zhì)量響應(yīng)的似然進(jìn)行更準(zhǔn)確的排序,這進(jìn)一步能造就更好的策略模型。

如表 1 所示,該團(tuán)隊(duì)基于 Llama3-8B-instruct 構(gòu)建了一個(gè)具有頂尖性能的模型,其在 AlpacaEval 2 上得到的長(zhǎng)度受控式勝率為 44.7,在排行榜上超過(guò)了 Claude 3 Opus;另外其在 Arena-Hard 上的勝率為 33.8,使其成為了目前最強(qiáng)大的 8B 開(kāi)源模型。

SimPO:簡(jiǎn)單偏好優(yōu)化

為便于理解,下面首先介紹 DPO 的背景,然后說(shuō)明 DPO 的獎(jiǎng)勵(lì)與生成所用的似然度量之間的差異,并提出一種無(wú)參考的替代獎(jiǎng)勵(lì)公式來(lái)緩解這一問(wèn)題。最后,通過(guò)將目標(biāo)獎(jiǎng)勵(lì)差額項(xiàng)整合進(jìn) Bradley-Terry 模型中,推導(dǎo)出 SimPO 目標(biāo)。 

背景:直接偏好優(yōu)化(DPO)

DPO 是最常用的離線偏好優(yōu)化方法之一。DPO 并不會(huì)學(xué)習(xí)一個(gè)顯式的獎(jiǎng)勵(lì)模型,而是使用一個(gè)帶最優(yōu)策略的閉式表達(dá)式來(lái)對(duì)獎(jiǎng)勵(lì)函數(shù) r 進(jìn)行重新參數(shù)化:


其中 π_θ 是策略模型,π_ref 是參考策略(通常是 SFT 模型),Z (x) 是配分函數(shù)。通過(guò)將這種獎(jiǎng)勵(lì)構(gòu)建方式整合進(jìn) Bradley-Terry (BT) 排名目標(biāo),圖片,DPO 可使用策略模型而非獎(jiǎng)勵(lì)模型來(lái)表示偏好數(shù)據(jù)的概率,從而得到以下目標(biāo):

圖片

其中 (x, y_w, y_l) 是由來(lái)自偏好數(shù)據(jù)集 D 的 prompt、獲勝響應(yīng)和失敗響應(yīng)構(gòu)成的偏好對(duì)。

一種與生成結(jié)果對(duì)齊的簡(jiǎn)單無(wú)參考獎(jiǎng)勵(lì)

DPO 的獎(jiǎng)勵(lì)與生成之間的差異。使用 (1) 式作為隱式的獎(jiǎng)勵(lì)表達(dá)式有以下缺點(diǎn):(1) 訓(xùn)練階段需要參考模型 π_ref,這會(huì)帶來(lái)額外的內(nèi)存和計(jì)算成本;(2) 訓(xùn)練階段優(yōu)化的獎(jiǎng)勵(lì)與推理所用的生成指標(biāo)之間存在差異。具體來(lái)說(shuō),在生成階段,會(huì)使用策略模型 π_θ 生成一個(gè)能近似最大化平均對(duì)數(shù)似然的序列,定義如下:

圖片

在解碼過(guò)程中直接最大化該指標(biāo)是非常困難的,為此可以使用多種解碼策略,如貪婪解碼、波束搜索、核采樣和 top-k 采樣。此外,該指標(biāo)通常用于在語(yǔ)言模型執(zhí)行多選任務(wù)時(shí)對(duì)選項(xiàng)進(jìn)行排名。在 DPO 中,對(duì)于任意三元組 (x, y_w, y_l),滿足獎(jiǎng)勵(lì)排名 r (x, y_w) > r (x, y_l) 并不一定意味著滿足似然排名圖片。事實(shí)上,在使用 DPO 訓(xùn)練時(shí),留存集中大約只有 50% 的三元組滿足這個(gè)條件(見(jiàn)圖 4b)。

構(gòu)建在長(zhǎng)度上歸一化的獎(jiǎng)勵(lì)。很自然地,我們會(huì)考慮使用 (3) 式中的 p_θ 來(lái)替換 DPO 中的獎(jiǎng)勵(lì)構(gòu)建,使其與引導(dǎo)生成的似然指標(biāo)對(duì)齊。這會(huì)得到一個(gè)在長(zhǎng)度上歸一化的獎(jiǎng)勵(lì):

圖片

其中 β 是控制獎(jiǎng)勵(lì)差異大小的常量。該團(tuán)隊(duì)發(fā)現(xiàn),根據(jù)響應(yīng)長(zhǎng)度對(duì)獎(jiǎng)勵(lì)進(jìn)行歸一化非常關(guān)鍵;從獎(jiǎng)勵(lì)公式中移除長(zhǎng)度歸一化項(xiàng)會(huì)導(dǎo)致模型傾向于生成更長(zhǎng)但質(zhì)量更低的序列。這樣一來(lái),構(gòu)建的獎(jiǎng)勵(lì)中就無(wú)需參考模型了,從而實(shí)現(xiàn)比依賴參考模型的算法更高的內(nèi)存和計(jì)算效率。

SimPO 目標(biāo)

目標(biāo)獎(jiǎng)勵(lì)差額。另外,該團(tuán)隊(duì)還為 Bradley-Terry 目標(biāo)引入了一個(gè)目標(biāo)獎(jiǎng)勵(lì)差額項(xiàng) γ > 0,以確保獲勝響應(yīng)的獎(jiǎng)勵(lì) r (x, y_w) 超過(guò)失敗響應(yīng)的獎(jiǎng)勵(lì) r (x, y_l) 至少 γ:

圖片

兩個(gè)類之間的差額已知會(huì)影響分類器的泛化能力。在使用隨機(jī)模型初始化的標(biāo)準(zhǔn)訓(xùn)練設(shè)置中,增加目標(biāo)差額通常能提升泛化性能。在偏好優(yōu)化中,這兩個(gè)類別是單個(gè)輸入的獲勝或失敗響應(yīng)。

在實(shí)踐中,該團(tuán)隊(duì)觀察到隨著目標(biāo)差額增大,生成質(zhì)量一開(kāi)始會(huì)提升,但當(dāng)這個(gè)差額變得過(guò)大時(shí),生成質(zhì)量就會(huì)下降。DPO 的一種變體 IPO 也構(gòu)建了與 SimPO 類似的目標(biāo)獎(jiǎng)勵(lì)差額,但其整體目標(biāo)的效果不及 SimPO。

目標(biāo)。最后,通過(guò)將 (4) 式代入到 (5) 式中,可以得到 SimPO 目標(biāo):

圖片

總結(jié)起來(lái),SimPO 采用了與生成指標(biāo)直接對(duì)齊的隱式獎(jiǎng)勵(lì)形式,從而消除了對(duì)參考模型的需求。此外,其還引入了一個(gè)目標(biāo)獎(jiǎng)勵(lì)差額 γ 來(lái)分離獲勝和失敗響應(yīng)。

實(shí)驗(yàn)設(shè)置

模型和訓(xùn)練設(shè)置。該團(tuán)隊(duì)的實(shí)驗(yàn)使用了 Base 和 Instruct 兩種設(shè)置下的兩類模型 Llama3-8B 和 Mistral-7B。

評(píng)估基準(zhǔn)。該團(tuán)隊(duì)使用了三個(gè)最常用的開(kāi)放式指令遵從基準(zhǔn):MT-Bench、AlpacaEval 2 和 Arena-Hard v0.1。這些基準(zhǔn)可評(píng)估模型在各種查詢上的多樣化對(duì)話能力,并已被社區(qū)廣泛采用。表 2 給出了一些細(xì)節(jié)。

圖片

基線方法。表 3 列出了與 SimPO 做對(duì)比的其它離線偏好優(yōu)化方法。

實(shí)驗(yàn)結(jié)果

主要結(jié)果與消融研究

SimPO 的表現(xiàn)總是顯著優(yōu)于之前已有的偏好優(yōu)化方法。如表 4 所示,盡管所有的偏好優(yōu)化算法的表現(xiàn)都優(yōu)于 SFT 模型,但簡(jiǎn)單的 SimPO 卻在所有基準(zhǔn)和設(shè)置上都取得了最佳表現(xiàn)。這樣全面的大幅領(lǐng)先彰顯了 SimPO 的穩(wěn)健性和有效性。

基準(zhǔn)質(zhì)量各不相同。可以觀察到,在 Arena-Hard 上的勝率明顯低于在 AlpacaEval 2 上勝率,這說(shuō)明 Arena-Hard 是更困難的基準(zhǔn)。

Instruct 設(shè)置會(huì)帶來(lái)顯著的性能增益。可以看到,Instruct 設(shè)置在所有基準(zhǔn)上都全面優(yōu)于 Base 設(shè)置。這可能是因?yàn)檫@些模型使用了更高質(zhì)量的 SFT 模型來(lái)進(jìn)行初始化以及這些模型生成的偏好數(shù)據(jù)的質(zhì)量更高。

SimPO 的兩種關(guān)鍵設(shè)計(jì)都很重要。表 5 展示了對(duì) SimPO 的每種關(guān)鍵設(shè)計(jì)進(jìn)行消融實(shí)驗(yàn)的結(jié)果。(1) 移除 (4) 式中的長(zhǎng)度歸一化(即 w/o LN);(2) 將 (6) 式中的目標(biāo)獎(jiǎng)勵(lì)差額設(shè)置為 0(即 γ = 0)。

移除長(zhǎng)度歸一化對(duì)結(jié)果的影響最大。該團(tuán)隊(duì)研究發(fā)現(xiàn),這會(huì)導(dǎo)致模型生成長(zhǎng)且重復(fù)的模式,由此嚴(yán)重拉低輸出的整體質(zhì)量。將 γ 設(shè)為 0 也會(huì)導(dǎo)致 SimPO 的性能下降,這說(shuō)明 0 并非最優(yōu)的目標(biāo)獎(jiǎng)勵(lì)差額。

有關(guān)這兩項(xiàng)設(shè)計(jì)選擇的更深度分析請(qǐng)參閱原論文。

深度對(duì)比 DPO 與 SimPO

最后,該團(tuán)隊(duì)還從四個(gè)角度全面比較了 DPO 與 SimPO:(1) 似然 - 長(zhǎng)度相關(guān)性、(2) 獎(jiǎng)勵(lì)構(gòu)建、(3) 獎(jiǎng)勵(lì)準(zhǔn)確度、(4) 算法效率。結(jié)果表明 SimPO 在準(zhǔn)確度和效率方面優(yōu)于 DPO。

DPO 獎(jiǎng)勵(lì)會(huì)隱式地促進(jìn)長(zhǎng)度歸一化。


盡管 DPO 獎(jiǎng)勵(lì)表達(dá)式 圖片(不包含配分函數(shù))缺乏一個(gè)用于長(zhǎng)度歸一化的顯式項(xiàng),但策略模型和參考模型之間的對(duì)數(shù)比可以隱式地抵消長(zhǎng)度偏見(jiàn)。如表 6 與圖 4a 所示,相比于沒(méi)有任何長(zhǎng)度歸一化的方法(記為 SimPO w/o LN),使用 DPO 會(huì)降低平均對(duì)數(shù)似然和響應(yīng)長(zhǎng)度之間的斯皮爾曼相關(guān)系數(shù)。但是,當(dāng)與 SimPO 比較時(shí),其仍然表現(xiàn)出更強(qiáng)的正相關(guān)性。

DPO 獎(jiǎng)勵(lì)與生成似然不匹配。

圖片


DPO 的獎(jiǎng)勵(lì)與平均對(duì)數(shù)似然指標(biāo)之間存在差異,這會(huì)直接影響生成。如圖 4b 所示,在 UltraFeedback 訓(xùn)練集上的實(shí)例中,其中 圖片,幾乎一半的數(shù)據(jù)對(duì)都有圖片。相較之下,SimPO 是直接將平均對(duì)數(shù)似然(由 β 縮放)用作獎(jiǎng)勵(lì)表達(dá)式,由此完全消除了其中的差異。

DPO 在獎(jiǎng)勵(lì)準(zhǔn)確度方面不及 SimPO。

圖片

圖 4c 比較了 SimPO 和 DPO 的獎(jiǎng)勵(lì)準(zhǔn)確度,這評(píng)估的是它們最終學(xué)習(xí)到的獎(jiǎng)勵(lì)與留存集上的偏好標(biāo)簽的對(duì)齊程度。可以觀察到,SimPO 的獎(jiǎng)勵(lì)準(zhǔn)確度高于 DPO,這說(shuō)明 SimPO 的獎(jiǎng)勵(lì)設(shè)計(jì)有助于實(shí)現(xiàn)更有效的泛化和更高質(zhì)量的生成。

SimPO 的內(nèi)存效率和計(jì)算效率都比 DPO 高。

圖片

SimPO 的另一大優(yōu)勢(shì)是效率,畢竟它不使用參考模型。圖 4d 給出了在 8×H100 GPU 上使用 Llama3-Base 設(shè)置時(shí),SimPO 和 DPO 的整體運(yùn)行時(shí)間和每臺(tái) GPU 的峰值內(nèi)存使用量。相比于原版 DPO 實(shí)現(xiàn),得益于消除了使用參考模型的前向通過(guò),SimPO 可將運(yùn)行時(shí)間降低約 20%,將 GPU 內(nèi)存使用量降低約 10%。

 更多詳細(xì)內(nèi)容,請(qǐng)閱讀原文。


責(zé)任編輯:張燕妮 來(lái)源: 機(jī)器之心
相關(guān)推薦

2025-09-28 15:35:32

AI模型強(qiáng)化學(xué)習(xí)

2022-07-26 09:56:48

模型AI

2025-02-13 12:23:28

2023-10-12 12:13:16

AI訓(xùn)練

2025-06-25 09:15:38

AI模型LLM

2022-02-17 14:52:10

模型AI谷歌

2025-01-08 13:05:56

2025-11-03 17:29:54

LeCun世界模型多模態(tài)

2025-06-13 09:03:00

2025-01-16 09:00:00

2025-07-04 16:45:24

AI模型評(píng)測(cè)

2025-07-18 09:55:11

2024-04-16 14:01:40

大型語(yǔ)言模型ORPO

2024-07-18 12:58:03

2024-01-16 12:10:33

模型數(shù)據(jù)

2025-07-18 10:12:00

2024-07-02 01:09:02

2025-07-22 10:22:02

2022-02-21 17:22:35

模型

2024-10-17 18:52:41

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

蜜桃视频网站在线| 无码人妻丰满熟妇精品 | 亚洲美女视频| 亚洲成人激情在线观看| 欧美视频第三页| 国产婷婷视频在线| 久久免费精品国产久精品久久久久| 国产精品福利无圣光在线一区| 国产性xxxx| 综合亚洲自拍| 日韩写真欧美这视频| 看av免费毛片手机播放| 成人免费网址| 国产欧美日韩视频一区二区| 99超碰麻豆| 中文字幕乱码无码人妻系列蜜桃| 好看不卡的中文字幕| 在线电影中文日韩| 私密视频在线观看| 欧美午夜在线播放| 欧美色男人天堂| www.com毛片| 欧美xxxx视频| 国产精品不卡在线| 欧美久久在线| 国产18精品乱码免费看| 三级影片在线观看欧美日韩一区二区| 久久av中文字幕| 中文字幕伦理片| 天堂99x99es久久精品免费| 日韩一区二区在线观看视频播放| 亚洲激情在线观看视频| 中文在线8资源库| 亚洲6080在线| 欧美日韩视频免费| 18网站在线观看| 国产精品高潮久久久久无| 日韩精品久久久免费观看| 天堂视频中文在线| av网站一区二区三区| 成人欧美一区二区| www.中文字幕| 国产成人综合在线播放| 91免费视频网站| 亚洲天堂中文字幕在线| 日韩经典一区二区| 国产极品精品在线观看| 天堂а√在线中文在线新版| 一本色道久久精品| 韩剧1988在线观看免费完整版| 欧美精品一区二区成人| 欧美在线高清| 欧美肥臀大乳一区二区免费视频| 熟女少妇a性色生活片毛片| 国产精品国产一区| 久久在线精品视频| 1024手机在线视频| 国内综合精品午夜久久资源| 欧美国产第二页| 欧美激情精品久久| 樱桃成人精品视频在线播放| 久久久亚洲精选| 欧美一二三区视频| 久久久久国产一区二区| 国产精品久久久久免费a∨大胸| 91porny九色| 久久激五月天综合精品| 91精品中国老女人| 亚洲精品网站在线| av网站一区二区三区| 欧美在线视频二区| 免费在线看黄| 亚洲国产一区在线观看| 免费无码不卡视频在线观看| 亚洲承认视频| 欧美精品黑人性xxxx| 亚洲成年人av| 中文字幕伦av一区二区邻居| 最近2019中文字幕一页二页 | 亚洲一卡二卡三卡四卡五卡| 日本久久久网站| 婷婷电影在线观看| 欧美无砖砖区免费| 一级淫片在线观看| 女仆av观看一区| 正在播放国产一区| 久久久久久天堂| 丝袜美腿一区二区三区| 91久久夜色精品国产网站| 狠狠躁日日躁夜夜躁av | 小泽玛利亚一区二区免费| 欧美精品综合| 国产极品jizzhd欧美| 国产av无码专区亚洲av| 久久免费看少妇高潮| 亚洲成人动漫在线| 91av亚洲| 日韩欧美123| 午夜在线观看一区| 欧美激情第8页| 国产99久久精品一区二区永久免费| 一级做a爰片久久毛片16| 成人av在线影院| 色女孩综合网| 成人影院在线视频| 666欧美在线视频| 国内精品久久99人妻无码| 国产大片一区| 日本伊人精品一区二区三区介绍| av中文字幕免费在线观看| 久久精品欧美日韩精品| 国产一级不卡视频| 亚洲18在线| 亚洲天堂精品在线| 日本在线视频免费观看| 国精产品一区一区三区mba桃花| 久久国产精品久久精品国产| 91亚洲天堂| 欧美日韩精品一区二区三区蜜桃| 丰满大乳奶做爰ⅹxx视频 | 亚洲中文字幕无码中文字| 日韩精品一区国产| 色偷偷888欧美精品久久久| 男人日女人网站| 成人免费观看视频| 伊人网在线免费| 色综合久久久| 亚洲网站在线看| 五月天婷婷久久| 成人激情综合网站| 日本免费a视频| 色妞ww精品视频7777| 久久精品人人爽| 中文字幕欧美色图| 国产欧美精品一区二区色综合| 国产91对白刺激露脸在线观看| www国产精品| 久久99热精品| www.久久久久久| 尤物在线观看一区| 一区二区三区人妻| 欧美三级乱码| 动漫3d精品一区二区三区| av毛片在线免费看| 7777精品伊人久久久大香线蕉经典版下载 | 成人高清视频在线观看| 日本久久久网站| av在线亚洲色图| 国内成人精品视频| 婷婷av一区二区三区| 欧美日韩午夜激情| 黄色片视频免费观看| 久久99伊人| 色狠狠久久av五月综合| 国产一区二区色噜噜| www.精品av.com| 国产哺乳奶水91在线播放| 一个色综合av| 91视频在线免费| 国产精品一二| 日本在线视频不卡| 日韩美女在线| 欧美高清视频一区二区| 日本wwwxxxx| 色综合天天综合网天天看片| 制服 丝袜 综合 日韩 欧美| 奇米亚洲午夜久久精品| 日韩 欧美 自拍| 成人午夜三级| 日韩美女免费线视频| 91这里只有精品| 日韩亚洲欧美在线| 日韩少妇高潮抽搐| 国产亚洲精品aa| 欧美一级特黄aaa| 亚洲第一黄网| 日韩中文字幕av在线| 亚洲在线资源| 91精品国产91久久久久久吃药| 精品成人一区二区三区免费视频| 欧美片网站yy| 日本天堂网在线观看| 国产精品三级久久久久三级| www.久久com| 香蕉久久夜色精品| 中文字幕一区综合| 日本午夜精品| 91久久精品美女高潮| 欧美久久天堂| 久久亚洲私人国产精品va| 日本国产在线观看| 在线视频一区二区三区| 青娱乐国产在线视频| 久久看人人爽人人| 日本在线视频播放| 老司机精品福利视频| 日本一区二区三区四区五区六区| 嫩草国产精品入口| 成人亚洲综合色就1024| 亚洲电影观看| 久久99精品国产99久久6尤物 | 久久天天躁狠狠躁夜夜躁2014| 色综合视频在线| 欧美精品色综合| 午夜影院免费在线观看| 亚洲主播在线观看| 免费一级suv好看的国产网站| 成人a免费在线看| 无码人妻一区二区三区在线视频| 久久成人一区| 久激情内射婷内射蜜桃| 婷婷亚洲五月| 亚洲巨乳在线观看| 香蕉久久夜色精品国产更新时间| 97中文在线| 999精品视频在线观看| 日本aⅴ大伊香蕉精品视频| 538在线视频| 久久国产加勒比精品无码| yiren22综合网成人| 日韩精品亚洲元码| 手机av免费在线观看| 欧美一区午夜精品| 国产一区二区女内射| 在线区一区二视频| 6080午夜伦理| 欧美特级www| 日本中文字幕在线免费观看| 亚洲免费av高清| 日本a级片视频| 亚洲欧洲综合另类| 国产传媒免费在线观看| 国产精品美女久久久久aⅴ| 亚洲成人黄色av| 久久久噜噜噜久久中文字幕色伊伊 | 精品视频在线一区二区在线| 欧美诱惑福利视频| 英国三级经典在线观看| 91av视频在线免费观看| av小说在线播放| 91国内揄拍国内精品对白| 欧美韩日亚洲| 91精品国产高清久久久久久91| 四季久久免费一区二区三区四区| 欧美成人午夜剧场免费观看| 成人在线播放| 久久久久久久一| 婷婷在线播放| 午夜精品蜜臀一区二区三区免费| av影片在线| 欧美中文字幕在线观看| 久久精品女人天堂av免费观看| 日本精品一区二区三区在线| 姬川优奈av一区二区在线电影| 国产成人亚洲精品| 黄色成人在线视频| 国产日韩欧美成人| 日韩高清二区| 国精产品99永久一区一区| 欧美成人基地| 日韩av一区二区三区在线| 国产精品一线天粉嫩av| 一本久道久久综合| 欧美va天堂| 真人抽搐一进一出视频| 久久精品卡一| 天天干天天av| 成人免费高清在线| 99久久人妻无码精品系列| 欧美国产精品久久| 国模无码国产精品视频| 精品国产乱码久久久久酒店| 秋霞av一区二区三区| 911精品国产一区二区在线| 亚洲乱码国产乱码精品精软件| 亚洲精品二三区| 成人在线免费电影| 欧美另类老女人| 自拍视频在线看| 成人黄色大片在线免费观看| 高潮久久久久久久久久久久久久| 久久久免费看| 亚洲高清影视| 国产日产欧美视频| 国内外成人在线| 一级特级黄色片| 亚洲欧美一区二区视频| 亚洲天堂日韩av| 欧美日本韩国一区二区三区视频| www久久久com| 在线观看亚洲区| heyzo高清在线| 国产精品女人久久久久久| 91精品入口| 亚洲一区二区精品在线| 18成人免费观看视频| 中文字幕国产免费| 91丨porny丨国产入口| 男的操女的网站| 色妞www精品视频| 风流老熟女一区二区三区| 中文字幕亚洲欧美日韩高清| 国产美女高潮在线观看| 91香蕉电影院| 欧美精选一区二区三区| 久久久久99精品成人片| 黑人巨大精品欧美一区| 人妻体内射精一区二区| 亚洲r级在线视频| 国产chinasex对白videos麻豆| 国产一区二区三区在线观看网站| 日本高清成人vr专区| 国产中文字幕亚洲| 久久99蜜桃| 国产极品尤物在线| 国产精品1区2区| 永久免费看片直接| 欧美性猛片xxxx免费看久爱| 外国精品视频在线观看| 欧美大肥婆大肥bbbbb| 久久天天久久| 精品伦理一区二区三区| 亚洲图片在线| 一个人看的视频www| 国产精品美女久久久久久久| 亚洲大尺度在线观看| 日韩电视剧在线观看免费网站| 日本在线观看大片免费视频| 91久久久久久久久久| 97视频精品| 国产探花在线看| 国产精品久久久久久久久快鸭| 少妇一级淫片日本| 在线观看日韩av| 国产亚洲精彩久久| 亚洲欧洲三级| 美女视频黄免费的久久| 国产黄色大片免费看| 色综合色综合色综合色综合色综合 | 视频一区在线免费观看| 老司机免费视频久久| 手机av免费看| 一本久久综合亚洲鲁鲁五月天| 亚洲色图欧美视频| 欧美专区在线视频| 久久97视频| 日韩在线xxx| 国产欧美一区二区在线| 中文字幕 国产| 久久精品99久久久久久久久 | 国产一区免费| 99亚洲精品| 亚洲av无码一区二区三区人| 91久久精品一区二区| av网站在线免费观看| 成人a在线视频| 天天av综合| 亚洲乱妇老熟女爽到高潮的片| 亚洲一区二区中文在线| www.欧美国产| 久久免费精品日本久久中文字幕| 波多野结衣欧美| 波多野结衣家庭教师在线播放| 久久精品欧美一区二区三区麻豆| 性高潮视频在线观看| 久久韩剧网电视剧| 狂野欧美xxxx韩国少妇| www.射射射| 久久综合九色综合97婷婷| 五月婷婷丁香在线| 久久人人爽亚洲精品天堂| 日韩欧美久久| 1024精品视频| 国产精品国产三级国产普通话99| 国产日韩欧美一区二区东京热| 欧美激情视频播放| 奇米亚洲欧美| 不卡中文字幕在线观看| 亚洲成a人片综合在线| 韩国福利在线| av免费观看久久| 久久激情久久| a级黄色片免费看| 亚洲欧美日韩成人| 国产一区二区三区精品在线观看| 六月婷婷在线视频| 国产精品天美传媒沈樵| 亚洲精品字幕在线| 国产成人在线精品| 欧美日韩一区二区国产| 超薄肉色丝袜一二三| 亚洲成人黄色在线| 婷婷精品久久久久久久久久不卡| 欧美视频在线观看网站| 中文欧美字幕免费| 香蕉视频911| 亚洲a∨日韩av高清在线观看| 免费精品视频| 激情综合五月网| 中文字幕亚洲在线|