精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

在RTX 4090被限制的時(shí)代下,讓大模型使用RLHF更高效的方法來(lái)了

人工智能 新聞
該論文介紹了一種名為 ReMax 的新算法,專為基于人類反饋的強(qiáng)化學(xué)習(xí)(RLHF)而設(shè)計(jì)。ReMax 在計(jì)算效率(約減少 50% 的 GPU 內(nèi)存和 2 倍的訓(xùn)練速度提升)和實(shí)現(xiàn)簡(jiǎn)易性(6 行代碼)上超越了最常用的算法 PPO,且性能沒有損失。

圖片

  • 論文鏈接:https://arxiv.org/abs/2310.10505
  • 作者:李子牛,許天,張雨舜,俞揚(yáng),孫若愚,羅智泉
  • 機(jī)構(gòu):香港中文大學(xué)(深圳),深圳市大數(shù)據(jù)研究院,南京大學(xué),南棲仙策
  • 開源代碼:https://github.com/liziniu/ReMax

如未額外說(shuō)明,所有圖片來(lái)自于論文。

背景

今年,以 ChatGPT 為首的大語(yǔ)言模型(Large Language Models, LLMs) 在各個(gè)方面大放光彩,由此引發(fā)了學(xué)術(shù)界和商業(yè)界對(duì) GPU 等計(jì)算資源的需求劇增。

圖片

左圖來(lái)自 DALL?E3,右圖來(lái)自 DALL?E3

比如監(jiān)督訓(xùn)練地調(diào)優(yōu) (supervised fine-tuning, SFT) 一個(gè) Llama2-7B 的模型,需要消耗 80GB 以上的內(nèi)存。而這往往不夠,為了和人類對(duì)齊(alignment),大語(yǔ)言模型還要經(jīng)過(guò) RLHF (reinforcement learning from human feedback) 的訓(xùn)練。RLHF 的 GPU 消耗往往是 SFT 的 2 倍以上,訓(xùn)練時(shí)間更能達(dá)到 6 倍以上。

近日,美國(guó)政府宣布限制英偉達(dá) GPU 產(chǎn)品 H100, H800等進(jìn)入中國(guó)市場(chǎng)。這項(xiàng)條款無(wú)疑為中國(guó)發(fā)展大語(yǔ)言模型(LLMs) 和人工智能增添了很多阻力。減小 RLHF 的訓(xùn)練成本(GPU 消耗和訓(xùn)練時(shí)間)對(duì) LLMs 的發(fā)展非常重要。

動(dòng)機(jī)

RLHF 包含三個(gè)階段:

1. 監(jiān)督式地調(diào)優(yōu)(Supervised Fine-Tuning, SFT)。 

2. 從對(duì)比數(shù)據(jù)中學(xué)習(xí)獎(jiǎng)勵(lì)模型(reward model)。

3. 利用強(qiáng)化學(xué)習(xí)(RL)算法來(lái)最大化獎(jiǎng)勵(lì)。

圖片

圖片來(lái)源自 InstructGPT 論文

我們發(fā)現(xiàn) RLHF 的主要計(jì)算開銷來(lái)源于第三階段(獎(jiǎng)勵(lì)最大化)。這一點(diǎn)可以從 DeepSpeed-Chat 的報(bào)告里看到,第三階段的訓(xùn)練時(shí)間是前兩個(gè)階段時(shí)間總和的 4 倍以上。而且,根據(jù)我們的經(jīng)驗(yàn),第三階段的 GPU 消耗是前兩階段的 2 倍以上。

圖片

圖片來(lái)自 DeepSpeed-Chat 技術(shù)報(bào)告

目前 RLHF 第 3 階段的主要計(jì)算瓶頸是什么?

我們發(fā)現(xiàn)該階段的計(jì)算瓶頸主要來(lái)源用來(lái)目前使用的 RL 算法:PPO 算法。PPO 算法是用來(lái)解決普適 RL 問(wèn)題的最流行的算法之一,有非常多成功的案例。我們?cè)谶@里省略 PPO 的技術(shù)細(xì)節(jié),著重介紹 PPO 的一個(gè)關(guān)鍵組件:價(jià)值模型  (The value model)。價(jià)值模型是一個(gè)需要被訓(xùn)練的神經(jīng)網(wǎng)絡(luò),能夠有效地估計(jì)給定策略的預(yù)期長(zhǎng)期回報(bào)。盡管價(jià)值模型為 PPO 帶來(lái)了良好的性能,但它在 RLHF 任務(wù)中也引入了沉重的計(jì)算開銷。例如,為了更好地與人類偏好對(duì)齊,PPO 中的價(jià)值模型通常與 LLM 大小相似,這使存儲(chǔ)需求翻了一番。此外,價(jià)值模型的訓(xùn)練需要存儲(chǔ)其梯度、激活和優(yōu)化器狀態(tài),這進(jìn)一步增加了近 4 倍的 GPU 存儲(chǔ)需求。總結(jié)來(lái)說(shuō),PPO 和它的價(jià)值模型(以及其訓(xùn)練相關(guān)部分)已成為 RLHF 獎(jiǎng)勵(lì)最大化階段的主要計(jì)算障礙。

相比 PPO,ReMax 是輕量級(jí)算法

思路

是否有可能找到比 PPO 更適配 RLHF 的算法?

 我們得出的答案是肯定的。這是因?yàn)?PPO 和價(jià)值模型是為通用 RL 問(wèn)題設(shè)計(jì)的,而不是針對(duì)像 RLHF 這樣的特定問(wèn)題(RLHF 只是 RL 問(wèn)題中的一個(gè)子類)。有趣的是,我們發(fā)現(xiàn) RLHF 具有三個(gè)在 PPO 中未使用的重要結(jié)構(gòu):

1. 快速模擬(fast simulation):  軌跡(即 LLM 中的整個(gè)響應(yīng))可以在很短的時(shí)間內(nèi)迅速執(zhí)行(小于 1s),幾乎沒有時(shí)間開銷。

2. 確定性轉(zhuǎn)移(deterministic transitions):上下文確定性依賴于過(guò)去的標(biāo)記和當(dāng)前生成的標(biāo)記。

3. 軌跡級(jí)獎(jiǎng)勵(lì)(trajectory-level rewards):獎(jiǎng)勵(lì)模型只在響應(yīng)完成時(shí)提供一個(gè)獎(jiǎng)賞值。

通過(guò)這三個(gè)觀察,我們不難發(fā)現(xiàn) value model 在 RLHF 的問(wèn)題中是 “冗余” 的。這是因?yàn)?value model 設(shè)計(jì)的初衷是為了隨機(jī)環(huán)境下的樣本效率和慢仿真環(huán)境的計(jì)算效率。然而這在 RLHF 中是不需要的。

圖片

ReMax 是針對(duì) RLHF 設(shè)計(jì)的算法,PPO 則是為通用 RL 設(shè)計(jì)的算法

方法

ReMax

ReMax 算法基于一個(gè)古老的策略梯度算法 REINFORCE,REINFORCE 使用的策略梯度估計(jì)器如下圖所示:

圖片

REINFORCE 梯度估計(jì)器

REINFORCE可以在計(jì)算層面利用好RLHF任務(wù)的三個(gè)性質(zhì),因?yàn)镽EINFORCE直接利用一個(gè)響應(yīng)的獎(jiǎng)勵(lì)來(lái)進(jìn)行優(yōu)化,不需要像一般的RL算法一樣需要知道中間步驟的獎(jiǎng)勵(lì)和值函數(shù)。然而,由于策略的隨機(jī)性, REINFORCE梯度估計(jì)器存在高方差問(wèn)題(在Richard Sutton的RL書里有指出),這一問(wèn)題會(huì)影響模型訓(xùn)練的有效性,因此REINFORCE在RLHF任務(wù)中的效果較差,見下面兩張圖片。

圖片

REINFORCE 的計(jì)算代價(jià)小,但性能差


圖片

REINFORCE 的(隨機(jī))梯度值遠(yuǎn)遠(yuǎn)大于 ReMax

為解決這一問(wèn)題,ReMax 使用貪婪生成的回答(greedy response)的獎(jiǎng)勵(lì)作為基準(zhǔn)值(baseline value)來(lái)構(gòu)建梯度估計(jì)器,具體公式如下:

圖片

ReMax 梯度估計(jì)器

注意到,貪婪回復(fù)的獎(jiǎng)勵(lì)圖片可以看作為期望獎(jiǎng)勵(lì)圖片的好的近似。在理想情形下(圖片),對(duì)于隨機(jī)變量圖片圖片,因此我們能夠期望估計(jì)器圖片具有更小的方差。

下圖展示了 ReMax 的算法流程,紅色方框中的是核心算法改變。

圖片

ReMax 算法流程

理論保證 

我們證明了 ReMax 使用的梯度估計(jì)器仍然是真實(shí)策略梯度的一個(gè)無(wú)偏估計(jì)器。

詳細(xì)理論介紹見論文。

算法優(yōu)點(diǎn)

  • ReMax 的核心部分可以用 6 行代碼來(lái)實(shí)現(xiàn)。相比之下,PPO 要額外引入重要性采樣(importance sampling),廣義優(yōu)勢(shì)估計(jì)(generalized advantage estimation,GAE),價(jià)值模型學(xué)習(xí)等額外模塊。
  • ReMax 的超參數(shù)很少。相比之下,PPO 有額外的超參數(shù),例如重要性采樣剪切閾值(importance sampling clipping ratio)、GAE 系數(shù)、價(jià)值模型學(xué)習(xí)率,離策略訓(xùn)練輪次(off-policy training epoch)等,這些超參數(shù)都需要花大量時(shí)間去調(diào)優(yōu)。
  • ReMax 能理論上節(jié)省約 50% 內(nèi)存。相比于 PPO,ReMax 成功移除了所有和價(jià)值模型相關(guān)的部件,大大減小了內(nèi)存開銷。通過(guò)計(jì)算,我們發(fā)現(xiàn)相比于 PPO,ReMax 能節(jié)省約 50% 內(nèi)存。

效果

有效性

  • ReMax 可以像 PPO 一樣有效地最大化獎(jiǎng)勵(lì)

圖片

在 OPT-1.3B 上,ReMax 可以有效地最大化獎(jiǎng)勵(lì)

圖片

在 OPT-1.3B 上,ReMax 的訓(xùn)練非常穩(wěn)定

  • 在 GPT-4 評(píng)估下(LIMA Test Questions),ReMax 得到的策略比 SFT 和 PPO 會(huì)更好

圖片

GPT4 打分顯示 ReMax 得到的模型會(huì)更好

高效性

  • ReMax 能節(jié)省近 50% 的 GPU 內(nèi)存。ReMax 移除掉了價(jià)值模型和它的訓(xùn)練部分(梯度,優(yōu)化器,激活值),從而極大節(jié)省了 GPU 內(nèi)存需求。考慮 Llama2-7B,PPO 無(wú)法在 8xA100-40GB 的機(jī)器上跑起來(lái),但是 ReMax 可以。

圖片

在 Llama2-7B 上,ReMax 可以節(jié)省近 50% 的 GPU 內(nèi)存

  • ReMax 能加快 2 倍的訓(xùn)練速度。在每一輪中,ReMax 調(diào)用 2 次生成(generation),1 次反向傳播(backpropagation);而 PPO 使用 1 次生成,2 次反向傳播。對(duì)于大模型而言,生成會(huì)比反向傳播的時(shí)間小,從而 ReMax 可以實(shí)現(xiàn)理論上接近 2 倍的訓(xùn)練加速。

圖片通用性

除了 RLHF 任務(wù),作為一個(gè) RL 算法,ReMax 對(duì)于經(jīng)典的 NLP 任務(wù)也適用。本文考慮了在 GPT-2 上進(jìn)行一個(gè)電影評(píng)論續(xù)寫的任務(wù),這里獎(jiǎng)勵(lì)模型不是從對(duì)比數(shù)據(jù)學(xué)習(xí)的。實(shí)驗(yàn)觀測(cè)到,ReMax 可以實(shí)現(xiàn) 2.2 倍的訓(xùn)練加速和 60% 的 GPU 內(nèi)存節(jié)省。

圖片

在經(jīng)典的 NLP 任務(wù)(文本續(xù)寫)上,ReMax 相比 PPO 實(shí)現(xiàn)了 2.2 倍加速

總結(jié)

最后,我們從實(shí)驗(yàn)中簡(jiǎn)要總結(jié)了 ReMax 相對(duì)于 PPO 的主要優(yōu)勢(shì)。

  • 更簡(jiǎn)單的實(shí)現(xiàn):  ReMax 的核心部分 6 行代碼即可實(shí)現(xiàn)。這與 PPO 中的眾多復(fù)雜的代碼構(gòu)建塊形成鮮明對(duì)比。
  • 更少的內(nèi)存開銷:由于移除了價(jià)值模型及其全部訓(xùn)練組件,相比 PPO,ReMax 節(jié)省了大約 50% 的 GPU 內(nèi)存。
  • 更少的超參數(shù):   ReMax 成功移除了所有和價(jià)值模型訓(xùn)練相關(guān)的超參數(shù),其中包括:GAE 系數(shù)、價(jià)值模型學(xué)習(xí)率、重要性采樣時(shí)期、小批量(mini-batch)大小。這些超參數(shù)往往對(duì)問(wèn)題敏感且難以調(diào)整。我們相信 ReMax 對(duì) RLHF 研究者更加友好。
  • 更快的訓(xùn)練速度:在 GPT2(137M)的實(shí)驗(yàn)中,我們觀察到 ReMax 在真實(shí)運(yùn)行時(shí)間方面相比于 PPO 有 2.2 倍的加速。加速來(lái)自 ReMax 每次迭代中較少的計(jì)算開銷。通過(guò)我們的計(jì)算,該加速優(yōu)勢(shì)在更大的模型上也能維持(假設(shè)在足夠大的內(nèi)存下 PPO 可以被成功部署)。
  • 優(yōu)異的性能:如前所示,ReMax在中等規(guī)模實(shí)驗(yàn)中與PPO實(shí)現(xiàn)了相當(dāng)?shù)男阅埽⑶矣袝r(shí)甚至超越它(可能是由于 ReMax 更容易找到合適的超參數(shù))。我們推測(cè)這種良好的性能可以拓展到更大規(guī)模的模型中。
責(zé)任編輯:張燕妮 來(lái)源: 機(jī)器之心
相關(guān)推薦

2013-07-23 10:50:24

C程序

2023-02-05 13:06:07

ChatGPT看圖方法

2022-04-01 08:02:44

云成本服務(wù)器互聯(lián)網(wǎng)

2019-04-19 08:18:37

神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)圖形

2011-08-29 09:33:48

2018-05-08 14:58:07

戴爾

2015-04-02 12:42:26

HDFS分層存儲(chǔ)高效

2010-12-23 15:55:00

上網(wǎng)行為管理

2025-05-15 00:01:00

2015-07-03 10:46:26

PHP程序員工作高效

2023-05-28 13:13:54

高并發(fā)場(chǎng)景JUC

2023-11-24 11:20:04

functoolsPython

2016-06-30 16:54:49

UCloud愛數(shù)云計(jì)算

2019-04-19 08:47:00

前端監(jiān)控數(shù)據(jù)

2024-08-19 00:35:00

Pythondict遍歷列表推導(dǎo)式

2023-11-16 08:55:14

CSS前端

2025-03-12 12:37:50

VLLMDeepSeekUbuntu

2023-06-20 07:19:49

RTX 4090HWBOT顯卡

2021-05-13 11:35:54

K8STerraform代碼倉(cāng)庫(kù)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

亚洲成人一区| 国产人妻精品久久久久野外| 黄色a在线观看| 小处雏高清一区二区三区| 欧美一区二区视频在线观看2022| 日本电影一区二区三区| 91av国产精品| 中文日韩欧美| 亚洲国产精品第一区二区| 亚洲精品国产suv| 免费看污污网站| 在线网址91| 国产原创一区二区三区| 欧美精品自拍偷拍| 黄色一级片av| 欧美偷拍视频| 午夜影院日韩| 色综合久久悠悠| 亚洲永久精品ww.7491进入| 亚洲综合资源| 日本道在线观看一区二区| 香蕉视频在线网址| 欧美色18zzzzxxxxx| 国产精品一区一区| 国产精品三级网站| 国产午夜视频在线| 91麻豆精品国产91久久久平台| 欧美日韩精品三区| 欧美黄色一级片视频| 在线视频1区2区| av成人免费在线| 国产成人精品免费视频| 成人中文字幕av| 超碰高清在线| 亚洲一卡二卡三卡四卡五卡| 一级做a爰片久久| 日本ー区在线视频| 国产91富婆露脸刺激对白| 国产精品一区二区女厕厕| 成人毛片在线播放| 一区二区国产精品| 久久欧美在线电影| 亚洲精品一区二区三区在线播放| 精品自拍偷拍| 色拍拍在线精品视频8848| 亚洲人精品午夜射精日韩| 四虎亚洲精品| 中文字幕二三区不卡| 欧美三级网色| 黄色av免费播放| 高清日韩欧美| 色天天综合色天天久久| 欧美 国产 综合| 国产小视频你懂的| 成人系列视频| 在线日韩第一页| 久久精品免费一区二区| av中文在线资源| 一区二区欧美精品| 很污的网站在线观看| 色呦呦视频在线观看| ...xxx性欧美| 免费一区二区三区| 日韩永久免费视频| 97精品视频在线观看自产线路二| 97在线资源站| 亚洲熟妇无码久久精品| 麻豆九一精品爱看视频在线观看免费| 久久久久久久久久婷婷| 久久久国产精华液| 久久国产高清视频| 国精一区二区三区| 午夜欧美在线一二页| 国产欧美精品一区二区三区介绍| 中文字幕网址在线| 激情偷乱视频一区二区三区| 91视频最新| 婷婷久久久久久| 久久久久国产精品麻豆ai换脸 | 欧美一区二区在线观看| 婷婷免费在线观看| 欧美视频二区欧美影视| 亚洲第一区在线观看| 波多野结衣办公室33分钟| 精品国产乱码| 欧美巨大黑人极品精男| 欧美成人综合色| 国产精品一卡| 成人黄色片在线| 日韩中文字幕影院| 日本一区二区三区dvd视频在线 | 国产免费一区二区三区在线观看| 一区二区三区精| 精品一区二区三区视频| 国产精品高清一区二区三区| 噜噜噜噜噜在线视频| 欧美激情一区二区三区在线| 一区二区三区国产福利| 国产探花视频在线观看| 91成人免费电影| 日本超碰在线观看| 777久久精品| 国产亚洲欧洲黄色| 久久久.www| 美女脱光内衣内裤视频久久网站| 欧美国产在线电影| 亚洲欧美偷拍视频| 免费观看在线综合| 精品视频一区二区| 伊人在线视频| 99天天综合性| 国产亚洲欧美一区二区三区| 国产黄色在线播放| 亚洲综合自拍偷拍| 丝袜制服一区二区三区| 国产一区二区三区精品在线观看| 亚洲精品网站在线播放gif| 中文字幕av播放| 亚洲精选91| 91免费欧美精品| 影音先锋国产在线| 成人精品国产一区二区4080| 国产在线a不卡| 国产免费一区二区三区最新不卡| 国产成人精品一区二 | 日韩欧美视频在线播放| 91国内精品久久| 性生活三级视频| 亚洲私人黄色宅男| 妞干网在线免费视频| 玖玖玖免费嫩草在线影院一区| 久久视频精品在线| 中文字幕第31页| 91美女蜜桃在线| 久久99精品国产99久久| 快射av在线播放一区| 在线视频国内自拍亚洲视频| 久久久久久无码精品人妻一区二区| 欧美一二区在线观看| 日本91av在线播放| 色老头在线视频| 国产精品99久久久| 国产av第一区| 欧美高清xxx| 中文字幕日韩电影| 欧美成人一区二区视频| 久久精品亚洲精品国产欧美kt∨| 阿v天堂2017| 狼人天天伊人久久| 久久久久久香蕉网| 日韩一级片免费| 午夜国产不卡在线观看视频| 亚洲热在线视频| 欧美福利网址| 成人国产一区二区| 免费在线观看的电影网站| 日韩精品中文字幕在线一区| 九九视频在线观看| 国产福利一区二区三区视频在线| 天堂av免费看| 88久久精品| 96精品视频在线| 日韩av视屏| 欧洲激情一区二区| 亚洲精品乱码久久久久久久久久久久| 国产精品呻吟| 亚欧精品在线| 高清不卡一区| 久久久久久午夜| 男人的天堂在线免费视频| 日本精品一区二区三区四区的功能| 丰满少妇xbxb毛片日本| 国产午夜久久| 久久精品国产第一区二区三区最新章节 | 天堂午夜影视日韩欧美一区二区| 欧美日韩在线一区二区三区| 欧美高清你懂的| 欧美成人精品h版在线观看| 狠狠人妻久久久久久综合麻豆| 五月天欧美精品| 亚洲调教欧美在线| 国产精品一区高清| 国产精品视频久久久久| 182tv在线播放| 国产视频精品免费播放| 亚洲天堂中文网| 亚洲成人av福利| 欧美福利第一页| 国产成人免费视| 欧美日韩怡红院| 欧美天天视频| 天天综合色天天综合色hd| 日本99精品| 国产激情综合五月久久| 天堂8中文在线| 亚洲欧美日韩精品久久亚洲区| 国产精品熟女视频| 亚洲精品一二三| 玖玖爱在线观看| 久久国产日韩欧美精品| 欧美又粗又长又爽做受| 无码日韩精品一区二区免费| 成人亚洲激情网| 最近高清中文在线字幕在线观看1| 一道本成人在线| 国产一区二区三区四区在线| 成人午夜视频在线观看| jizz欧美性11| 欧美三级视频| 亚洲一区二区三区加勒比 | a级大胆欧美人体大胆666| 在线精品91av| 成人1区2区3区| 亚洲免费av高清| 人妻一区二区视频| 福利一区福利二区| 免费看黄色一级大片| 伊人久久大香线| 精品国产_亚洲人成在线| 蜜桃精品在线| 欧美中文字幕在线| 中文字幕中文字幕在线十八区 | 欧美老女人性生活视频| eeuss影院一区二区三区| 亚洲色图欧美自拍| 国产视频久久| 国产 日韩 亚洲 欧美| 欧美成人一品| 日韩欧美一区二区三区四区| 天堂av一区二区三区在线播放| 成人欧美视频在线| 色噜噜成人av在线| 日本亚洲欧美成人| 国产伦子伦对白在线播放观看| 欧美激情一区二区三区在线视频观看 | 91成人影院| 欧美一级爱爱| 美女网站一区| 国产精品视频入口| 国产精品videossex| 国产精品10p综合二区| 亚洲精品一区国产| 51蜜桃传媒精品一区二区| 国产精品日本一区二区三区在线 | 中文字幕日韩在线播放| 国产高清视频免费最新在线| 国产性色av一区二区| 日本韩国免费观看| 精品国产乱码久久久久久免费| www.久久久久久久久久| 欧美性欧美巨大黑白大战| 国产99久久久久久免费看| 欧美亚洲丝袜传媒另类| 国产精品suv一区| 91精品办公室少妇高潮对白| 亚洲大片免费观看| 欧美性一区二区| 一本一道精品欧美中文字幕| 在线观看视频一区| 中文字幕制服诱惑| 91精品国产综合久久精品app | 深夜福利一区二区| 国产口爆吞精一区二区| 欧美精品欧美精品系列| 91丨九色丨丰满| 日韩视频在线一区二区| 国产特级黄色片| 69av一区二区三区| 久草网视频在线观看| 一个色综合av| 91av在线免费视频| 在线观看亚洲精品| aaa国产视频| 亚洲爱爱爱爱爱| 天堂а√在线8种子蜜桃视频| 亚洲人在线观看| 日本中文在线| 中文字幕无线精品亚洲乱码一区| 国产福利在线看| 欧美成人精品xxx| 国产一线二线在线观看| 国产成人精品一区二区三区| 国产aa精品| 国产精品yjizz| 国内精品伊人久久久| 青春草在线视频免费观看| 激情欧美一区二区三区| 免费日韩中文字幕| 国产乱对白刺激视频不卡| 色噜噜在线观看| 综合av第一页| 国产精品美女毛片真酒店| 色狠狠一区二区三区香蕉| 亚洲综合精品在线| 亚洲国产精品美女| 3p视频在线观看| 久久久久久久久久久网站| 人人鲁人人莫人人爱精品| 成人妇女免费播放久久久| 欧美三级自拍| 裸体大乳女做爰69| 日韩精品福利网| 国产51自产区| 国产精品网站一区| 日本熟妇色xxxxx日本免费看| 欧美色偷偷大香| 亚洲欧美一区二区三| 不卡中文字幕av| 高清在线视频不卡| 91在线观看免费| 青青草91久久久久久久久| 性一交一乱一伧国产女士spa| 蜜臀av性久久久久av蜜臀妖精| 精品人妻一区二区免费| 最新欧美精品一区二区三区| 国产又大又黄又粗| 91麻豆精品国产91久久久资源速度| 瑟瑟在线观看| 欧美激情精品久久久久久变态| 日本中文字幕一区二区| 久久狠狠久久综合桃花| 亚洲黄页一区| 91亚洲一区二区| 久久综合色8888| 日本三级中文字幕| 欧美日韩一区不卡| 成人三级黄色免费网站| 精品无人国产偷自产在线| 国产黄色在线观看| 国产精品久久久久av| 夜色77av精品影院| 国产自产在线视频| 国产麻豆91精品| 高h视频免费观看| 91精品国产综合久久婷婷香蕉| 91av资源在线| 国产精品亚洲网站| 日韩精品影视| 亚洲精品久久久中文字幕| 国产精品免费丝袜| 欧美做爰爽爽爽爽爽爽| 精品成人在线视频| 国产综合无码一区二区色蜜蜜| 九九热精品视频| 色综合一区二区日本韩国亚洲 | 欧美在线免费| 久久久久久久久久毛片| 国产精品高潮呻吟| 一级片一区二区三区| 久久精品2019中文字幕| 欧洲精品久久久久毛片完整版| 日韩欧美在线观看强乱免费| 天堂影院一区二区| 免费在线观看a视频| 在线观看www91| 欧美a在线看| 亚洲伊人久久大香线蕉av| 午夜精品视频| caoporm在线视频| 亚洲天堂2016| 亚洲精品国产片| 欧美精品第一页在线播放| 成午夜精品一区二区三区软件| 精品少妇在线视频| 久久婷婷国产综合精品青草| 亚洲午夜无码久久久久| 久久精品成人欧美大片古装| 国产精品久久久久77777丨| 99精品视频网站| 成人午夜免费av| 日日摸天天添天天添破| 色av吧综合网| 日日夜夜一区| 真人抽搐一进一出视频| 国产日韩高清在线| www色aa色aawww| 亚洲一区二区视频在线观看| 午夜老司机福利| 国产91精品青草社区| 国产精品日韩精品中文字幕| 国产一级不卡毛片| 亚洲三级在线播放| 国产乱码精品一区二三区蜜臂| 国产69精品久久久久9999| 国产欧美日韩| gogo亚洲国模私拍人体| 亚洲亚洲人成综合网络| 激情小视频在线| 3d蒂法精品啪啪一区二区免费| 亚洲女人av| 中国一级片在线观看| 欧美揉bbbbb揉bbbbb| 黄色一级大片在线免费看产| 精品伦精品一区二区三区视频| 蜜乳av一区二区| 日韩欧美三级视频| www.久久色.com| 超碰成人免费| 国产成年人视频网站| 懂色av一区二区三区|