精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

OpenAI詳解進化策略方法:可替代強化學習

開發 開發工具
進化策略(ES:evolution strategy)是一種已存在了數十年的優化技術,其在現代強化學習基準(如 Atari/MuJoCo)上的表現可以比肩標準的強化學習技術,同時還能克服強化學習的許多不便。

進化策略(ES:evolution strategy)是一種已存在了數十年的優化技術,其在現代強化學習基準(如 Atari/MuJoCo)上的表現可以比肩標準的強化學習技術,同時還能克服強化學習的許多不便。

特別的幾點包括:進化策略的實現更加簡單(不需要反向傳播),更容易在分布式環境中擴展,不會受到獎勵稀疏的影響,有更少的超參數。這個結果令人吃驚,因為進化策略就好像是在一個高維空間中簡單地爬山,每一步都沿著一些隨機的方向實現一些有限的差異。

我們的發現是這種已有數十年之久思想強大結果的現代延續。比如說,在 2012 年,AlexNet 論文表明可以如何設計、擴展和訓練卷積神經網絡(CNN)以在圖像識別任務上實現極其優秀的結果,而那時候大多數研究者還認為 CNN 并不是一種有希望的計算機視覺技術。類似地,在 2013 年,深度 Q 學習(Deep Q-Learning)論文表明可以將 Q 學習與 CNN 結合起來以成功地解決 Atari 游戲,從而使強化學習(RL)發展成為了一個有激動人心的實驗結果的研究領域,而不再只是理論構想了。同樣,我們的研究也表明進化策略可以在強化學習基準上實現優秀的表現,從而消除了人們之前普遍認為的進化策略方法不能用于高維問題的觀點。

進化策略易于實現和擴展。我們的實現運行在一個包含了 80 臺機器和 1440 個 CPU 內核的計算集群上,其可以僅在 10 分鐘內就訓練出一個 3D MuJoCo 人形步行者(在 32 核上,A3C 需要大約 10 小時)。使用 720 核,我們也能在 Atari 上實現可與 A3C 媲美的表現,同時還能將訓練時間從 1 天降低至 1 小時。

下面,我們將首次簡要描述傳統的強化學習方法與我們的進化策略方法的對比,還會討論進化策略和強化學習之間的權衡,最后還會突出介紹我們的一些實驗。

一、強化學習

首先讓我們簡單看看強化學習的工作方式。假設我們有一些環境(比如游戲),我們想要在其中訓練一個代理。為了描述該代理的行為,我們要定義一個策略函數(policy function),這是該代理的大腦,用于計算該代理如何在一個給定的情形中采取行動。在實踐中,這個策略通常是一個神經網絡,其輸入是該游戲的當前狀態,然后計算可用的所有允許動作的概率。一個典型的策略函數可能有大約 1,000,000 個參數,所以我們的任務就是找到這些參數的確切配置,以使得該策略能夠實現良好的表現(即在很多游戲中獲勝)。

Pong 游戲

上圖:在 Pong 游戲中,策略根據輸入的屏幕像素來計算移動玩家拍子的概率(右邊綠色的拍子):上、下或不動。

該策略的訓練過程如下所示。首先是一個隨機初始化,我們讓該代理與環境進行一陣交互,然后收集交互的「劇情(episode)」(比如,每個 episode 就是一局 Pong 游戲)。由此我們就能得到情況的完整記錄:遇到了什么樣的狀態序列、在每個狀態采取了什么動作、每一步的獎勵如何。下圖給出了一個例子,這三個 episode 每個都表示在一個假想環境中的 10 個時間步驟。其中每個矩形都是一個狀態,如果獎勵是正面的(比如把球擊回給了對方),那么矩形就是綠色;如果獎勵是負面的(比如沒有接到球),那么矩形則為紅色:

Pong 游戲 強化學習策略

這幅圖給出了改善策略的一個方法;導致綠色狀態的行為是好的行為,導致紅色的行為則很糟糕。然后我們可以使用反向傳播來計算該網絡參數的一次小的更新,該更新將使得未來的狀態更有可能是綠色、更少可能是紅色。我們預計更新后的策略會更好一點。然后我們迭代這一過程:收集另一批 episode,進行另一次更新……

通過在這些動作中注入噪聲來進行探索。我們在強化學習中通常使用的策略是隨機的,它們僅計算采取任何動作的概率。通過這種方法,代理可能會在訓練過程中發現自己在不同時間處在同一個特定狀態,而且由于采樣的情況,它也將在不同的時間采取不同的動作。這能提供學習所需的信號:這些動作中有一些會導致好的結果,這些動作就會得到鼓勵;另一些則不會奏效,就會被抑制。因此我們可以說,我們通過向代理的動作注入噪聲而為其學習過程引入了探索(exploration)——我們可以通過在每個時間步驟從動作分布中采樣來做到這一點。這與進化策略不同。

二、進化策略

關于「進化(Evolution)」。在我們探討進化策略(ES)之前,有必要強調一下盡管這種方法名字中有「進化」這個詞,但進化策略和生物進化關系不大。也許這項技術的早期版本從生物進化上獲得了一些啟發——在一定的抽象程度上,這種方法可被視為這樣一個過程:從個體構成的群體中采樣并讓其中成功的個體引導未來后代的分布。但是,其數學細節在生物進化方法的基礎上實現了很大的抽象,我們最好將進化策略看作是一類黑箱的隨機優化技術。

黑箱優化。在進化策略中,讓我們完全忘記代理、環境、涉及的神經網絡和其中的交互吧。進化策略的整個設置就是一大堆數字輸入(假設和前面提到的策略網絡的參數數量一樣,有 1,000,000 個數字),然后輸出 1 個數字(對應總獎勵),我們需要找到這 1,000,000 個數字的最好配置。在數學上,我們可以說是根據輸入向量 w(該網絡的參數/權重)來優化一個函數 f(w),但我們不對 f 的結構做出任何假設,我們只能對其進行評估(因此被稱為「黑箱」)。

進化策略算法。直觀上來講,這種優化就是一種「猜測然后檢測」的過程,即我們從一些隨機參數開始,然后重復執行以下過程:1)隨機對該猜測進行一點調整,2)讓我們的猜測向效果更好的方向移動一點。具體而言,就是在每個步驟輸入一個參數向量 w,然后通過高斯噪聲對 w 進行抖動來生成一群(比如 100 個)有稍微改變的參數向量 w1, w2……w100。然后我們在環境中分別運行這 100 個候選項所對應的策略網絡,從而獨立地對這 100 候選項分別進行評估,然后將每個案例中的獎勵加起來。然后其更新后的參數就變成了這 100 個向量的加權和,其中每個權重都正比于其總獎勵。(即,我們想讓更成功的候選項有更高的權重。)在數學上,你也會注意到這就相當于使用有限差分法(finite difference)來估計參數空間中預期獎勵的梯度,只是我們是沿著 100 個隨機方向來做的。

我們要看的另一種方法是仍然使用強化學習(策略梯度,具體來說是 REINFORCE),其中的代理的動作是使用高斯策略得出整個參數向量。

強化學習(策略梯度,具體來說是 REINFORCE)

上圖:進化策略優化過程,這個環境中只有兩個參數和一個獎勵函數(紅色=高、藍色=低)。在每次迭代,我們都會展示當前參數值(白色)、一群經過抖動的樣本(黑色)和估計的梯度(白色箭頭)。我們不斷將該參數移動到該箭頭的頂點,直到我們收斂到了一個局部最優值。你可以使用本文的代碼重現這些圖。

代碼示例。為了得到具體的核心算法并突出其簡潔性,這里給出了一段使用進化策略優化二次函數的短代碼實例(更長的版本見文末鏈接)。

  1. # simple example: minimize a quadratic around some solution point 
  2. import numpy as np   
  3. solution = np.array([0.5, 0.1, -0.3])   
  4. def f(w): return -np.sum((w - solution)**2) 
  5.  
  6. npop = 50      # population size   
  7. sigma = 0.1    # noise standard deviation   
  8. alpha = 0.001  # learning rate   
  9. w = np.random.randn(3) # initial guess   
  10. for i in range(300):   
  11.   N = np.random.randn(npop, 3) 
  12.   R = np.zeros(npop) 
  13.   for j in range(npop): 
  14.     ww_try = w + sigma*N[j] 
  15.     R[j] = f(w_try) 
  16.   A = (R - np.mean(R)) / np.std(R) 
  17.   ww = w + alpha/(npop*sigma) * np.dot(N.T, A) 

向參數中注入噪聲。注意這里的目標與強化學習優化的目標是一樣的:預期的獎勵。但是,強化學習是將噪聲注入動作空間并使用反向傳播來計算參數更新,而進化策略則是直接向參數空間注入噪聲。換個說話,強化學習是在「猜測然后檢驗」動作,而進化策略則是在「猜測然后檢驗」參數。因為我們是在向參數注入噪聲,所以就有可能使用確定性的策略(而且我們在實驗中也確實是這么做的)。也有可能同時將噪聲注入到動作和參數中,這樣就有可能實現兩種方法的結合。

三、進化策略和強化學習間的權衡

相比于強化學習算法,進化策略有多個優勢(一些優勢有些技術性):

1. 不需要反向傳播。進化策略只需要策略的前向通過,不需要反向傳播(或價值函數評估),這使得代碼更短、在實踐中速度快了 2-3 倍。在內存有限的系統中,也不需要保留 episode 的記錄從而進行后續的更新。我們也不需要擔心 RNN 中的梯度爆炸問題。最后,我們能夠探索更大類別的策略函數,包括不可微分的網絡(比如二值網絡),或者包括復雜模塊的網絡(例如包括 pathfinding 或多種優化層)。

2. 高度可并行。進化策略只需要工作器彼此之間進行少量純數量的通信,然而在強化學習中需要同步整個參數向量(可能會是百萬數值的)。直觀來看,這是因為我們在每個工作器(worker)上控制隨機 seeds,所以每個工作器能夠本地重建其他工作器的微擾(perturbations)。結果是,在實驗中我們觀察到,隨著我們以千為單位增加 CPU 進行優化時,有線性的加速。

3. 高度穩健。在強化學習實現中難以設置的數個超參數在進化策略中被回避掉了。例如,強化學習不是「無標度(scale-free)的」,所以在 Atari 游戲中設置不同的跳幀(frame-skip)超參數會得到非常不同的學習輸出。就像我們所展現的,進化策略在任何跳幀上有同樣的結果。

4. 架構探索。一些強化學習算法(特別是策略梯度)用隨機策略進行初始化,這總是表現為在一個位置有長時間的隨機跳躍。這種影響在 Q 學習方法中因為 epsilon-greedy 策略而有所緩和,其中的 max 運算能造成代理暫時表現出一些一致的動作(例如,維持一個向左的箭頭)。如果代理在原地跳動,在游戲中做一些事情是更有可能的,就像策略梯度的例子一樣。類似于 Q 學習,進化策略也不會受這些問題的影響,因為我們可以使用確定性策略來實現一致的探索。通過研究進化策略和強化學習梯度評估器,我們能看到進化策略是一個有吸引力的選擇,特別是在 episode 中的時間步驟量很長的時候,也就是動作會有長時間的影響。或者是在沒有好的價值函數評估的時候進化策略也是好的選擇。

對應地,在實踐中我們也發現了應用進化策略的一些挑戰。一個核心問題是為了讓進化策略工作,在參數中加入噪聲必然會導致不同的輸出,從而獲得一些梯度信號。就像我們在論文中詳細說明的,我們發現使用虛擬 batchnorm 能幫助緩和這一問題,但在有效地參數化神經網絡上還有進一步的工作要做,從而有不同的行為作為噪聲的功能。還有一個相關的困難,我們發現在 Montezuma’s Revenge 游戲中,用隨機網絡很難在一級的時候得到鑰匙,然而用隨機動作能偶爾獲得鑰匙。

四、進化策略可媲美于強化學習

在兩個強化學習基準上我們對比了進化策略和強化學習的表現:MuJoCo 控制任務和 Atari 游戲。每個 MuJoCo 任務(看以下示例)包含一個模擬身體的鉸接式人物,策略網絡獲得所有關節的位置信息,需要輸出每個關節的力矩(torques)從而前行。以下是在三個 MuJoCo 控制任務上訓練的代理示例,任務目標是前行。

我們通常觀察學習數據的效率來對比算法的表現。作為我們觀察到的多少狀態的函數,什么是我們的平均獎勵?以下是我們獲得的學習曲線,與強化學習進行了對比(在此案例中用的是 TRPO 強化學習算法,參考 https://arxiv.org/abs/1502.05477):

進化策略(橘黃)有著與 TRPO 算法(藍色)相媲美的表現

數據學習效率對比。以上對比表明進化策略(橘黃)有著與 TRPO 算法(藍色)相媲美的表現,盡管在所有情況下它不完全匹配或超越 TRPO 算法。此外,通過水平掃描我們可看到進化策略效率略低,但不低于 1/10(注意橫坐標是指數標度)。

時間對比。取代觀察看到的狀態原數量,我們可以認為要觀察的最重要的標準是時間:解決一個問題需要多久(以秒為計)?這一數值最終指示了一個研究人員可完成的迭代速度。因為進化策略算法需要的工作器(worker)之間的通信幾乎可以忽略,我們能夠使用 80 臺機器上的 1440 個 CPU,10 分鐘就解決最難的 MuJoCo 任務(3D 人形)。作為對比,在典型的一臺機器上 32 個 A3C 工作器配置中,解決該任務需要 10 小時左右。用算法與工程上的努力,當然也能改進強化學習的表現,但我們發現在標準的云 CPU 環境中單純延展 A3C 非常難,因為需要高通信帶寬。

以下是用進化策略訓練的 3D 人形任務行走的動圖。就像我們所看到的,根據優化最終收斂到的局部最優值,結果挺多樣的。

用進化策略訓練的 3D 人形任務行走的動圖

在 Atari 游戲中,用 1 小時在 720 核上訓練進化策略取得了的表現可媲美于在 32 核上訓練一天的 A3C。下面是在 Pong、Seaquest 和 Beamrider 游戲中的結果片段。這些片段顯示了預處理的畫面,也就是代理在玩游戲時所看到的:

特別要注意 Seaquest 游戲中的潛水艇在氧氣值低的時候學習準確率會上升。

五、相關研究

進化策略是源自神經進化系的算法。神經進化在人工智能中有著很長的歷史,完整文獻原因超出本文所覆蓋的范圍。我們鼓勵感興趣的讀者查閱 Wikipedia、Scholarpedia 的相關文獻,以及 Jurgen Schmidhuber 的回顧文章(Section 6.6)。最影響我們研究的一項工作是 Wierstra 等人在 2014 年作出的自然進化策略(Natural Evolution Strategies)。相比于該工作以及它所啟發出的其他工作,我們專注于將這些算法延展到大規模的、分布式環境中,尋找讓這些算法能與深度神經網絡很好結合的組件,并在現在的強化學習基準上評估這些算法。

還值得注意的是神經進化相關的方法最近在機器學習研究中有所復蘇(resurgence),例如 HyperNetworks、Large-Scale Evolution of Image Classifiers 和 Convolution by Evolution。HyperNetworks,「Large-Scale Evolution of Image Classifiers」和「Convolution by Evolution」.

六、結論

我們的研究表明神經進化方法在現在的代理-環境基準上,可與強化學習的方法相媲美,同時在代碼復雜性上也有重大收益、易于延展到大規模分布式環境。我們也期望通過重新回顧這條線上的其他觀點從而作出更多激動人心的工作,比如間接編碼方法,或者除了參數以外用其他方法進化網絡架構。

注意監督學習:要注意的一點是監督學習問題(例如圖像分類、語音識別或者產業中的大部分其他任務)并不受這些成果的直接影響。監督學習可以用反向傳播方法直接計算損失函數的確切梯度。例如,在初步試驗中我們使用進化策略在 MNIST 數字識別任務上評估梯度,發現它要比使用反向傳播的方法慢 1000 倍。只有在強化學習環境中,也就是必須要用采樣評估預期獎勵(expected reward)的梯度,進化策略才具有可比性。

代碼發布:最后,如果你想要嘗試運行下進化策略,你可以閱讀以下論文,或了解 GitHub repo 的詳細細節。

 

論文:

https://arxiv.org/abs/1703.03864

Github:

 

https://github.com/openai/evolution-strategies-starter

【本文是51CTO專欄機構機器之心的原創譯文,微信公眾號“機器之心( id: almosthuman2014)”】

戳這里,看該作者更多好文

責任編輯:趙寧寧 來源: 51CTO專欄
相關推薦

2017-08-22 15:56:49

神經網絡強化學習DQN

2017-08-17 09:15:23

強化學習KerasOpenAI

2024-05-30 16:37:29

2023-06-25 11:30:47

可視化

2022-11-02 14:02:02

強化學習訓練

2021-04-13 16:18:30

人工智能強化學習人臉識別

2017-06-10 16:19:22

人工智能智能體強化學習

2024-12-09 08:45:00

模型AI

2018-11-14 10:28:38

AI數據科技

2025-08-01 09:05:00

2020-05-06 16:07:05

百度飛槳

2025-06-03 06:12:03

2018-06-21 08:51:29

強化學習算法人工智能

2023-03-09 08:00:00

強化學習機器學習圍棋

2020-08-10 06:36:21

強化學習代碼深度學習

2025-04-01 09:10:00

2019-05-28 11:11:27

強化學習AI深度學習

2025-03-25 09:12:00

LIMAI模型

2023-11-07 07:13:31

推薦系統多任務學習

2021-09-26 13:50:52

AI 數據強化學習
點贊
收藏

51CTO技術棧公眾號

98在线视频| www.com亚洲| 日韩三级av高清片| 亚洲最大成人网4388xx| 国产精品二区在线| 无码人妻精品一区二| 91视频一区| 精品毛片乱码1区2区3区| 精品国产一二三四区| 亚洲二区在线播放| 98视频精品全部国产| 色综合一区二区三区| 一本久久a久久精品vr综合| www日本高清| 日韩福利电影在线观看| 亚洲第一精品夜夜躁人人躁| 黑鬼大战白妞高潮喷白浆| eeuss影院在线观看| 成人免费视频视频| 国产欧美日韩精品丝袜高跟鞋| 久久久久噜噜噜亚洲熟女综合| 欧美美女在线观看| 精品久久久久av影院| 污色网站在线观看| 一级日本在线| 99视频一区二区| 欧美激情18p| 精品手机在线视频| 网友自拍区视频精品| 91精品国产综合久久蜜臀| 日本xxxxxxx免费视频| av美女在线观看| 一区二区三区日韩精品视频| 亚洲三级一区| 国产最新视频在线观看| 不卡av免费在线观看| 成人激情春色网| 中文字幕在线观看2018| 精品国产一区一区二区三亚瑟| 亚洲白拍色综合图区| 亚洲高清在线不卡| 亚洲精品成人一区| 欧美揉bbbbb揉bbbbb| 成年人视频网站免费观看| 美女尤物在线视频| 一区二区在线观看不卡| 国产91av视频在线观看| 波多野结衣一区二区| 久久久亚洲欧洲日产国码αv| 国产精品免费在线播放| 午夜精品久久久久久久96蜜桃| 经典一区二区三区| 成人国产精品色哟哟| 一级黄色片免费| 免费在线一区观看| 国产精品露脸自拍| 亚洲一级av毛片| 久久99精品国产.久久久久久| 欧美另类极品videosbest最新版本| 国产18无套直看片| 日韩精品欧美激情一区二区| 91精品国产综合久久精品| 黄色在线视频网| 国产精品久久久久久吹潮| 一个色综合av| 玖玖精品在线视频| 污污网站在线看| 亚洲成av人**亚洲成av**| 日韩一区不卡| 欧美777四色影视在线| 久久精品一区二区三区不卡 | 欧美激情亚洲自拍| 久久视频免费看| 最新成人av网站| 欧美一区二区三区四区在线 | 在线播放欧美女士性生活| 九九九九九国产| 91精品国产自产在线丝袜啪 | 毛葺葺老太做受视频| 在线不卡日本v二区707| 一区二区国产视频| 男人日女人逼逼| 韩国成人在线| 激情懂色av一区av二区av| 免费无码av片在线观看| 成人免费毛片嘿嘿连载视频…| 欧美欧美午夜aⅴ在线观看| 欧美 日韩 国产 高清| 亚洲淫成人影院| 欧美美女直播网站| zjzjzjzjzj亚洲女人| 国产欧美日韩在线一区二区| 久久精彩免费视频| 日韩福利片在线观看| 日本美女一区二区三区视频| 91在线高清免费观看| 四虎成人免费在线| 国产91高潮流白浆在线麻豆| 久久riav二区三区| 欧美一级二级三级区| 午夜不卡在线视频| av亚洲天堂网| 日本欧美高清| 美女黄色丝袜一区| aaaaaa毛片| 国产精品99久久久久久似苏梦涵| 免费成人看片网址| 亚洲三级中文字幕| 亚洲欧洲国产日韩| 成人在线免费在线观看| 日韩一区二区三区精品| 亚洲欧美中文字幕| 精品无码一区二区三区电影桃花| 日韩av二区在线播放| 国产伦精品一区二区三| 久久77777| 亚洲人精品一区| 97成人在线观看视频| 日韩精品免费视频一区二区三区| 亚洲九九九在线观看| 免费毛片在线播放免费| 欧美福利视频| 国产精品久久在线观看| 香蕉视频免费在线看| 亚洲精品视频一区| 99热这里只有精品在线播放| 色吊丝一区二区| 欧美激情视频三区| 成人高潮片免费视频| 国产精品污www在线观看| 国产超级av在线| 国产精品玖玖玖在线资源| 美日韩精品免费视频| 亚洲视频中文字幕在线观看| 久久欧美中文字幕| 亚洲精品视频一二三| 国产精品vvv| 日韩精品一区二区在线观看| 四虎影院中文字幕| 蜜桃视频免费观看一区| 日韩精品大片| 亚洲1234区| 亚洲美女av在线| 国产一级片毛片| 麻豆成人av在线| 91aaaa| 日韩在线资源| 在线观看91视频| 久久精品亚洲天堂| 99精品在线| 91精品久久久久久久久久久久久久 | 久久精品国产77777蜜臀| 日韩精品在在线一区二区中文| av综合电影网站| 国产视频精品免费播放| 亚洲影院在线播放| 久久午夜免费电影| chinese少妇国语对白| 国产一区二区三区网| 国产精品v日韩精品| 国产51人人成人人人人爽色哟哟| 色噜噜狠狠色综合欧洲selulu| 国产精久久一区二区三区| 天堂成人国产精品一区| 亚洲国产日韩美| av日韩一区| 欧美激情一区二区三区成人| 深夜福利视频网站| 色先锋资源久久综合| 永久免费av无码网站性色av| 午夜精品久久| 成人免费视频网站入口| 交100部在线观看| 亚洲午夜未满十八勿入免费观看全集| 亚洲av综合一区| 不卡的av电影| 虎白女粉嫩尤物福利视频| 日韩欧美网站| 97netav| 澳门成人av网| 日韩小视频在线| www.欧美国产| 色综合久久久久网| 黄视频网站免费看| 97久久精品人人爽人人爽蜜臀| 国产情侣av自拍| 午夜视频一区| 欧美日本亚洲| 国产日韩一区二区三免费高清| 国模精品一区二区三区色天香| 欧美性孕妇孕交| 欧美肥胖老妇做爰| 特一级黄色大片| 国产精品久久久久久久第一福利| 任你躁av一区二区三区| 日韩电影一二三区| 日韩成人三级视频| 久久精品九色| 午夜精品免费视频| 久久精品视频观看| 精品视频在线导航| 国产黄色一级大片| 91成人看片片| 国产午夜小视频| 国产精品久久久久久久第一福利| 国产黑丝一区二区| 精油按摩中文字幕久久| 欧美精品一区免费| 影音先锋成人在线电影| 欧洲亚洲一区二区| 激情av综合| 91视频免费网站| 成人日韩精品| 91精品国产高清久久久久久91| 大地资源网3页在线观看| 亚洲跨种族黑人xxx| 性色av蜜臀av| 欧美日韩综合色| 免费看一级视频| 亚洲国产成人av好男人在线观看| 一级免费黄色录像| 国产色一区二区| 亚洲国产第一区| 国产不卡视频在线播放| 91福利免费观看| 欧美日韩亚洲一区在线观看| 亚洲国产欧洲综合997久久| 性欧美lx╳lx╳| 国产在线一区二区三区欧美| 日韩激情综合| 91网站在线免费观看| 91大神在线观看线路一区| 日韩av日韩在线观看| 草草视频在线| 国内精品久久久久伊人av| 1024在线播放| 欧美成人一二三| gogogogo高清视频在线| 日韩天堂在线视频| 免费高清在线观看| 日日摸夜夜添一区| 视频免费一区| 日韩视频一区在线| jizz在线观看视频| 日韩在线视频观看| 美女国产在线| 久久激情五月丁香伊人| 成人ww免费完整版在线观看| 久久久精品久久| 国产福利在线播放麻豆| 欧美成人免费小视频| fc2ppv国产精品久久| 欧美老女人性生活| 久久电影网站| 2021久久精品国产99国产精品| 自由日本语热亚洲人| 日本亚洲欧洲色| 欧美日韩尤物久久| 成人在线精品视频| 国产一区精品二区| 成人综合av网| 丝袜av一区| 日韩久久在线| 国产精品久久久久久久久妇女| 制服诱惑一区| 欧美特黄一区| 成人免费观看视频在线观看| 久久九九电影| 五月激情婷婷在线| 国产成人高清在线| 亚洲制服丝袜在线播放| 欧美激情综合在线| 久久久久久久人妻无码中文字幕爆| 国产成人精品1024| 免费黄色在线视频| 中文字幕视频一区| 日本少妇毛茸茸高潮| 色噜噜久久综合| 国产在成人精品线拍偷自揄拍| 精品少妇一区二区三区日产乱码| 天天操天天干天天干| 亚洲色图五月天| 成人高清免费在线| 欧美孕妇与黑人孕交| 欧美综合影院| 精品日韩电影| 欧美hd在线| 免费看国产曰批40分钟| 欧美/亚洲一区| 久久久999视频| 精品亚洲国产成人av制服丝袜| 黄色污在线观看| 中文字幕一区二区三区在线不卡| 久久99久久98精品免观看软件| 色偷偷久久人人79超碰人人澡| 国产裸体永久免费无遮挡| 欧美亚洲禁片免费| 国产免费无遮挡| 亚洲精品一二区| 99在线播放| 国产精品91在线观看| www.久久爱.com| 奇米精品在线| 欧美日韩精品一本二本三本| 天天操天天摸天天爽| 不卡高清视频专区| 欧美一区二区三区爽爽爽| 在线免费观看日本一区| 亚洲av无码乱码国产精品| 在线精品视频视频中文字幕| yellow字幕网在线| 92看片淫黄大片看国产片| 国产精品免费99久久久| 国产aaa免费视频| 精品亚洲porn| 国产传媒在线看| 欧美性生活大片免费观看网址| 亚洲国产精品欧美久久 | 加勒比精品视频| 亚洲精品自拍动漫在线| 一区二区视频免费观看| 亚洲欧洲国产精品| 国产传媒在线观看| 国产伦精品一区二区三区视频孕妇| 欧美疯狂party性派对| 毛葺葺老太做受视频| 26uuu欧美| 日本三级欧美三级| 精品美女在线观看| 在线看一级片| 114国产精品久久免费观看| 国产二区精品| 亚洲欧美日韩精品一区| 国产精品婷婷午夜在线观看| 国产91精品看黄网站在线观看| 亚洲成人久久一区| 1区2区3区在线| 国产欧美一区二区三区另类精品| 国产精品观看| 国产免费无码一区二区| 一区二区理论电影在线观看| 国产成人精品免费看视频| 欧美精品在线网站| 这里视频有精品| 人人妻人人澡人人爽欧美一区双 | 美女久久久久久久久久| 精品久久香蕉国产线看观看亚洲| 亚洲日本香蕉视频| 欧美一级免费视频| 国产va免费精品观看精品视频| 日本免费一级视频| 亚洲国产激情av| 在线视频 中文字幕| 久久综合免费视频| а√天堂8资源在线| 成人欧美视频在线| 狠狠综合久久| 日韩aaaaa| 色偷偷成人一区二区三区91| av在线天堂| 91精品国产综合久久久久久久久 | 久久五月天综合| 日韩精品三级| 欧美二区在线视频| 国产日产欧美一区二区视频| 亚洲一区二区激情| 欧美成人精品在线播放| 激情小说亚洲图片| aaa毛片在线观看| 自拍偷拍亚洲综合| 成人无码一区二区三区| 欧洲亚洲免费在线| 日韩片欧美片| 国产精品一级无码| 五月激情六月综合| porn视频在线观看| 翡翠波斯猫1977年美国| 亚洲一区亚洲| 日韩在线观看免| 欧美精品一区二区久久婷婷| 日韩免费va| 人妻激情另类乱人伦人妻| 26uuu国产电影一区二区| 一个人看的www日本高清视频| 欧美黑人一区二区三区| 亚洲天堂日韩在线| aa视频在线播放| 国产午夜亚洲精品不卡| 999国产精品视频免费| 欧美一级在线亚洲天堂| 国产精品久久久久久久久久10秀 | 午夜视频在线瓜伦| 一区二区三区中文免费| 户外极限露出调教在线视频| 91视频8mav| 首页国产欧美久久| 久久一区二区三| 这里只有精品在线观看| jazzjazz国产精品麻豆| 免费一区二区三区在线观看 |