精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

拆掉英偉達護城河,細節(jié)曝光!世界最快超算用3072塊AMD GPU訓(xùn)完超萬億參數(shù)LLM

人工智能 新聞
世界上最快超算集群Frontier,用8%的GPU訓(xùn)練出了一個萬億級規(guī)模的大模型,而且是在AMD硬件平臺之上完成。研究人員將訓(xùn)練的細節(jié)和克服的困難寫成了一篇論文,展示了如何用非英偉達的生態(tài)完成大模型訓(xùn)練的技術(shù)框架和細節(jié)。

用AMD的軟硬件系統(tǒng)也能訓(xùn)練GPT-3.5級別的大模型了。

位于美國橡樹嶺國家實驗室(Oak Ridge National Laboratory)的全世界最大的超算Frontier,集合了37888個MI250X GPU和9472個Epyc 7A53 CPU。

最近,研究人員只使用了其中8%左右的GPU,就訓(xùn)練了一個GPT-3.5規(guī)模的模型。

研究人員成功地使用ROCM軟件平臺在AMD硬件上成功地突破了分布式訓(xùn)練模型的很多難點,建立了使用ROCM平臺在AMD硬件上為大模型實現(xiàn)最先進的分布式訓(xùn)練算法和框架。

成功地在非英偉達和非CUDA平臺上為高效訓(xùn)練LLM提供了可行的技術(shù)框架。

訓(xùn)練完成后,研究人員將在Frontier上訓(xùn)練大模型的經(jīng)驗的總結(jié)成了一篇論文,詳細描述了期間遇到的挑戰(zhàn)以及克服的困難。

論文鏈接:https://arxiv.org/abs/2312.12705

在研究人員看來,訓(xùn)練一萬億參數(shù)規(guī)模的LLM最為重大的挑戰(zhàn)是所需的內(nèi)存量——至少需要14TB的內(nèi)存。

而單塊GPU最大的內(nèi)存只有64GB,這意味著需要并行使用多個AMD MI250X GPU才能完成訓(xùn)練。

而并行更多的GPU,對GPU之間的通信提出非常高的要求。如果不能有效地利用GPU之間的帶寬通信,大部分的GPU計算資源都會被浪費。

具體來說,研究人員將Megatron-DeepSpeed分布式訓(xùn)練框架移植到Frontier上,以支持在AMD硬件和ROCM軟件平臺上進行高效的分布式訓(xùn)練。

研究人員將基于CUDA的代碼轉(zhuǎn)換為HIP代碼,還預(yù)構(gòu)建DeepSpeed ops以避免ROCM平臺上的JIT編譯錯誤,并且修改代碼以接受主節(jié)點IP地址為參數(shù)進行PyTorch Distributed初始化。

在220億參數(shù)模型上,F(xiàn)rontier的訓(xùn)練峰值吞吐量達到了38.38%,1750億參數(shù)模型峰值吞吐量的36.14%,1萬億參數(shù)模型峰值吞吐量的31.96%。

訓(xùn)練一個1000B級別的模型,最終研究團隊將縮放效率(scaling efficiency)做到了87%。同時,作為對比,研究人員還同時訓(xùn)練了另一個1750億參數(shù)的模型,縮放效率也達到了89%。

另一方面,因為現(xiàn)在這樣規(guī)模的模型訓(xùn)練都是在基于英偉達的硬件和CUDA生態(tài)中完成的,研究人員表示在AMD的GPU之上想要達到類似的訓(xùn)練效率和性能,還有很多工作需要做。

訓(xùn)練細節(jié)

GPT式模型結(jié)構(gòu)和模型尺寸

Transformer模型由兩個不同的部分組成,編碼器塊和解碼器塊。

編碼塊有助于捕捉非因果自注意力,即句子中的每個標(biāo)記都能注意到左右兩邊的token。

另一方面,解碼塊有助于捕捉因果自注意,即一個token只能注意到序列中過去的標(biāo)記。

最簡單的GPT類模型由一疊類似的層組成。

每一層都有一個注意力區(qū)塊和一個前饋網(wǎng)絡(luò)(FFN)2。注意力區(qū)塊有三組參數(shù)圖片,其中d是模型的隱藏維度。FFN模塊有兩層,分別為權(quán)重圖片圖片所以,每層有11d^2個參數(shù)。

由于嵌入層位于模型的起始層,參數(shù)數(shù)大致為12Ld^2,其中L為層數(shù),d為隱藏維度。

根據(jù)這個公式,研究人員可以定義出下表中大小分別為22B、175B和1T的三個模型。

大部分內(nèi)存需求來自模型權(quán)重、優(yōu)化器狀態(tài)和梯度。

在混合精度訓(xùn)練中,每個模型參數(shù)需要6個字節(jié),4個字節(jié)用于在fp32中保存模型,2個字節(jié)用于在fp16中進行計算。

優(yōu)化器狀態(tài)的每個參數(shù)需要4個字節(jié),以將動量保存在fp32中。

研究人員需要為每個參數(shù)保存一個fp32梯度值。因此,在使用Adam優(yōu)化器進行混合精度訓(xùn)練時,最小內(nèi)存需求如下表所示。

每個Frontier節(jié)點有8個MI250X GPU構(gòu)成,每個都有64GB的HBM內(nèi)存。

因此,內(nèi)存需求表中,可以得出結(jié)論:要擬合模型的一個副本,模型并行化是必要的。模型并行可以通過張量和碎片數(shù)據(jù)并行在隱維度上實現(xiàn),也可以通過管線并行(pipeline paralism)在層維度上實現(xiàn)。

管線并行

管線并行將模型分成p個階段,每個階段大約有L/p層。然后,將批次分割成微批次,每執(zhí)行一步,一個微批次通過一個階段。

每個階段都放置在一個GPU上。

最初,只有第一個GPU可以處理第一個微批次。在第二個執(zhí)行步驟中,第一個微批次進入第二個階段,而第一個微批次現(xiàn)在可以進入第一個階段。

如此反復(fù),直到最后一個微批次到達最后一個階段。

然后,反向傳播開始,整個過程反向繼續(xù)。在每個批次之后引入同步點,以保持正確的計算順序,這需要沖洗管線階段。

因此,在一個批次處理的開始和結(jié)束時,托管較早和較晚階段的GPU會處于空閑狀態(tài),從而導(dǎo)致計算時間的浪費或管線泡沫。

管線泡沫分?jǐn)?shù)為p-1m,其中m是批次中微批次的數(shù)量。

簡單的GPipe調(diào)度會產(chǎn)生很大的管線泡沫。有一些額外的方法可以減少管線泡沫。

其中一種方法是PipeDream提出的1F1B調(diào)度,在前向傳遞過程中,最初允許微批次向前流動,直到最后一組收到第一個微批次。

但隨后第一個批次開始向后傳播,從那時起,前向傳遞總是伴隨著后向傳遞,因此被稱為1F1B。為了進一步縮小氣泡大小,研究人員提出了一種交錯計劃,即在單個GPU上放置多個較小的管線組,而不是在單個GPU上放置一個管線組。

1F1B計劃的管線泡沫大小大約為p/m,其中p是管線組的數(shù)量,m是微批次的數(shù)量。

微批次的數(shù)量。對于帶交錯功能的1F1B計劃,泡沫大小為m×v p-1,其中v是放置在單個GPU上的交錯組的數(shù)量。

分片數(shù)據(jù)并行(Sharded Data Parallelism)

分片數(shù)據(jù)并行將模型參數(shù)、優(yōu)化器狀態(tài)和梯度按行分片,并在每個GPU上放置一個分區(qū)。

由于訓(xùn)練一次推進一個層,因此計算設(shè)備的內(nèi)存中只需要一個完整的層和相關(guān)值(優(yōu)化器狀態(tài)、梯度和參數(shù))。

分片數(shù)據(jù)并行性正是利用了這一點;在執(zhí)行一個層之前,通過在所有GPU上執(zhí)行該層的所有收集,在所有GPU 上將該層實體化4b。

現(xiàn)在,所有GPU都有相同層的副本。然后,在不同的GPU上對不同的數(shù)據(jù)批次執(zhí)行該層。之后,每個GPU會刪除該層的所有收集部分,并通過全收集為下一層的實體化做好準(zhǔn)備。

通過這種方式,它模擬了數(shù)據(jù)并行性,但不是每個GPU都托管了整個模型的完整副本,而只是托管當(dāng)前活動層的副本。

分片數(shù)據(jù)并行可以促進大型模型在GPU上的數(shù)據(jù)并行訓(xùn)練,即使模型太大,無法容納在單個GPU的內(nèi)存中。

DeepSpeed的ZeRO優(yōu)化器在不同程度上支持分片數(shù)據(jù)并行。ZeRO-1只對優(yōu)化器狀態(tài)進行分片,ZeRO-2對梯度和優(yōu)化器狀態(tài)進行分片,ZeRO-3則對優(yōu)化器狀態(tài)、梯度和模型參數(shù)進行分片。

另一方面,PyTorch FSDP(完全分片數(shù)據(jù)并行)對所有三種數(shù)據(jù)進行了分片,并通過將分片數(shù)據(jù)并行與傳統(tǒng)數(shù)據(jù)并行相結(jié)合,支持混合數(shù)據(jù)并行。

3D并行和Megatron-DeepSpeed

僅使用單一并行策略來實現(xiàn)模型并行可能是一種低效方法。例如,如果研究人員只使用張量并行來對模型進行水平切分,那么張量可能太薄,需要頻繁進行全還原通信,從而減慢訓(xùn)練速度。

另一方面,如果研究人員將模型劃分為過多的管線階段,每個階段的計算量就會很小,這就需要頻繁的通信。一個已知的問題是,在多個節(jié)點上執(zhí)行張量并行訓(xùn)練需要緩慢的樹狀allreduce。

以混合方式使用多種并行模式,可以最大限度地減少性能不佳的地方。三維并行結(jié)合了張量、管線和數(shù)據(jù)(傳統(tǒng)和分片)并行技術(shù),以充分利用資源。

通過適當(dāng)?shù)脑O(shè)置,三維并行技術(shù)可將通信與計算重疊,從而減少通信延遲。

人工智能領(lǐng)域使用的三維并行標(biāo)準(zhǔn)代碼庫基于Megatron-LM。MegatronDeepSpeed擴展了Megatron-LM的功能,增加了DeepSpeed功能,如ZeRO-1 sharded數(shù)據(jù)并行和重疊1F1B的管線并行。

計劃的管線并行。不過,這些標(biāo)準(zhǔn)代碼庫都是針對英偉達GPU和CUDA平臺開發(fā)的。

作為最完整的框架,研究人員希望在Frontier上使用Megatron-DeepSpeed,F(xiàn)rontier 是AMD系統(tǒng),其軟件棧建立在ROCM軟件平臺上。

將Megatron-DeepSpeed移植到Frontier

Megatron-DeepSpeed代碼庫來源自英偉達公司的Megatron-LM代碼庫,然后微軟在其中添加了DeepSpeed ZeRO優(yōu)化器、管線并行性和MoE。

英偉達負(fù)責(zé)開發(fā)Megatron-LM,因此其代碼庫是以英偉達GPU和CUDA環(huán)境為目標(biāo)平臺開發(fā)的。

將該代碼庫移植到AMD平臺上運行會面臨一些挑戰(zhàn)。

1. CUDA代碼:CUDA代碼不能在AMD硬件上運行,但HIP(一種類似CUDA的C/C++擴展語言)可以。

研究人員使用hipify工具將CUDA源代碼轉(zhuǎn)換為HIP代碼,使用hipcc構(gòu)建可共享對象(so文件)然后使用pybind從Python代碼訪問這些可共享對象。

2. DeepSpeed操作:大多數(shù)DeepSpeed操作都是在執(zhí)行訓(xùn)練管線期間通過JIT(及時)編譯構(gòu)建的。

但是,DeepSpeed操作的JIT編譯在ROCM平臺上不起作用,因此研究人員在安裝DeepSpeed時預(yù)先構(gòu)建了所有操作。

研究人員禁用了Megatron-DeepSpeed代碼庫中的所有JIT功能,以避免任何運行時錯誤。

3. 初始化PyTorch分布式環(huán)境:Megatron-DeepSpeed利用PyTorch分布式初始化創(chuàng)建各種數(shù)據(jù)和模型并行組。

初始化過程需要指定一個計算節(jié)點作為「主」節(jié)點,所有分布式進程都需要它的IP地址。

研究人員修改了代碼庫,以接受MASTER ADDR作為參數(shù)。

研究人員準(zhǔn)備了一個啟動腳本,從SLURM節(jié)點列表中讀取第一個節(jié)點的IP地址,并將其作為參數(shù)傳遞給所有使用srun啟動的進程。

然后,初始化代碼會使用這個MASTER ADDR進行PyTorch分布式初始化。

4. 通過ROCM平臺軟件提供的庫/軟件包:研究人員與AMD開發(fā)人員合作,獲得了一些基本CUDA軟件包的ROCM版本,如APEX。

APEX是英偉達的混合精度庫,Megatron-DeepSpeed代碼庫大量使用該庫進行混合精度訓(xùn)練。

他們還改編了支持ROCM的FlashAttention和FlashAttention2庫版本,供Frontier上的編譯器使用。Flash-Attention操作被移植到AMDGPU上,使用的內(nèi)核來自Composable Kernel庫。

各種分配策略的實證分析

張量并行

張量并行法按行劃分模型層,每層之后都需要通過Allreduce對部分激活值進行聚合。

每層執(zhí)行后的AllReduce成本很高,這取決于張量并行組中GPU之間的通信帶寬,通信量取決于隱藏大小和微批量大小。

下圖5顯示了前沿GPU之間的通信帶寬。一個節(jié)點中有8個GPU,單個芯片中的GPU通過四個(50+50 GB/s)無限結(jié)構(gòu)連接。

跨芯片的GPU之間的帶寬是它的一半。但是,跨節(jié)點的GPU之間的帶寬是25+25 GB/s。

因此,從網(wǎng)絡(luò)拓?fù)浜团渲脕砜矗琓P = 2的通信速度最快,TP = 4或8的通信速度次之。

但是,如果TP ? 8,通信將通過較慢的以太網(wǎng)進行,通信速度將大大降低。因此,將TP保持在[2, 4, 8]范圍內(nèi)應(yīng)該是最佳策略。

研究人員使用8個GPU訓(xùn)練一個1.4B的模型,TP值從1到8不等,結(jié)果發(fā)現(xiàn)TP值越小,吞吐量越高。

觀察結(jié)果III.1:TP值越大,訓(xùn)練效果越差。

B. 管線并行

管線并行化沿著層維度劃分模型,并將連續(xù)的層劃分為管線階段。一個微批次的執(zhí)行從一個階段流向下一個階段。

管線氣泡是使用這種并行方式進行高效訓(xùn)練的限制因素。

研究人員觀察了大M或大GBS的效果,以了解22B參數(shù)和1T參數(shù)大小的兩個模型對GPU吞吐量的影響(下圖7)。

觀察結(jié)果III.2:使用大的全局批次大小或許多微批次使管線階段飽和,可將管線氣泡大小降至最低。

管線階段數(shù)量的影響:接下來,研究人員研究管線級數(shù)對訓(xùn)練性能的影響。直觀地說,管線階段越多,意味著通信發(fā)生前的計算量越少。

在全局批次大小(微批次數(shù)量)固定的情況下,管線階段數(shù)量越多,計算量越少。

氣泡大小會隨著管線級數(shù)的增加而增加。研究人員還嘗試增加管線級數(shù),同時保持PMP固定不變,按比例增加全局批量大小。

觀察結(jié)果III.3:在保持全局批量大小不變的情況下,增加管線級數(shù)會增加管線氣泡的大小,并降低訓(xùn)練性能。

觀察結(jié)果III.4:如果管線級數(shù)與微批次數(shù)的比例保持不變,則隨著管線級數(shù)的增加,訓(xùn)練性能也會保持不變。

從第一個實驗(上圖8a)來看,隨著管線級數(shù)的增加,訓(xùn)練性能會下降。但是,通過調(diào)整全局批次大小來固定氣泡比例,可以保持吞吐量(上圖8b)。

通過實驗、超參數(shù)調(diào)整和分析,研究人員確定了在Frontier上訓(xùn)練Trillionparameter模型的高效策略,該策略結(jié)合了各種分布策略和軟件優(yōu)化。

訓(xùn)練萬億參數(shù)模型

訓(xùn)練萬億參數(shù)模型的高效策略

通過增加微批次數(shù)量使管線階段飽和:研究人員使用DeepSpeed(來自 DeepSpeed-Megatron,但不是Megatron的版本)提供的管線并行性。這種管線并行算法是PipeDream的算法,其中多個階段相互重疊,并采用1F1B算法來減少氣泡大小。

但是,如果管線級數(shù)沒有達到飽和,氣泡大小就會增大。為確保飽和,微批次的數(shù)量必須等于或超過管線級數(shù)。

將張量并行限制為單個節(jié)點/八個GPU:由于AllReduce操作過于頻繁,而且需要對每一層都執(zhí)行,因此分散在不同節(jié)點上的層會導(dǎo)致跨節(jié)點GPU之間基于樹狀結(jié)構(gòu)的AllReduce,而通信延遲則會成為一個重要瓶頸。

使用Flash-Attention v2:與普通注意力實現(xiàn)相比,研究人員觀察到使用Flash-attention可將吞吐量提高30%。

使用ZeRO-1優(yōu)化器實現(xiàn)數(shù)據(jù)并行:研究人員使用ZeRO-1實現(xiàn)數(shù)據(jù)并行,以減少內(nèi)存開銷。

使用AWS的RCCL插件提高通信穩(wěn)定性:AWS OFI RCCL插件使EC2開發(fā)人員能夠在運行基于AMD RCCL的應(yīng)用程序時將libfabric用作網(wǎng)絡(luò)提供商。在Frontier上,該插件的使用顯示了通信的穩(wěn)定性。

萬億參數(shù)模型的訓(xùn)練性能

根據(jù)從超參數(shù)調(diào)整中吸取的經(jīng)驗教訓(xùn),研究人員確定了一組大小為220億個參數(shù)和1750億個參數(shù)的模型組合。

在這兩個模型的GPU吞吐量的鼓舞下,研究人員最終使用表V中列出的分布策略組合訓(xùn)練了一個萬億參數(shù)模型,并進行了十次迭代,以觀察其訓(xùn)練性能。

對于22B參數(shù)模型,研究人員可以提取其峰值吞吐量(191.5 TFLOPS)的38.38%(73.5 TFLOPS)。

對于175B模型訓(xùn)練,研究人員實現(xiàn)了峰值吞吐量的36.14% (69.2 TFLOPs)。

最后,對于1T模型,實現(xiàn)了峰值吞吐量的31.96%(61.2 TFLOPs)。

擴展性能

通過數(shù)據(jù)并行來維持模型并行訓(xùn)練的性能,讓系統(tǒng)中的大量GPU參與進來,是一項極具挑戰(zhàn)性的任務(wù)。性能最強的GPU通過不同速度的通信鏈路連接,如果對網(wǎng)絡(luò)中較大的部分施加壓力,可能會導(dǎo)致性能損失。

因此,研究人員通過數(shù)據(jù)并行化將175B模型的訓(xùn)練擴展到1024個GPU,將1T模型的訓(xùn)練擴展到3072個GPU,以衡量訓(xùn)練策略的擴展效率。

1. 弱擴展:研究人員在1024、2048和3072個GPU上使用全局批量大小3200、6400和9600執(zhí)行數(shù)據(jù)并行訓(xùn)練,對1T模型進行弱擴展實驗。數(shù)據(jù)并行訓(xùn)練實現(xiàn)了100%的弱擴展效率(下圖12)。

2. 強擴展:研究人員進行了強擴展實驗,將全局批量大小保持在8000,然后改變GPU的數(shù)量。研究人員在1024個GPU上對一個175B模型實現(xiàn)了89.93%的強擴展性能(圖13a)。研究人員在3072個GPU上對一個1萬億參數(shù)的模型實現(xiàn)了87.05%的強擴展性能(圖13b)。

世界最快超算

AMD加持的Frontier超級計算機現(xiàn)在是世界上第一臺官方認(rèn)可的百億億次超級計算機,算力高達1.102 ExaFlop/s。

它在新發(fā)布的全球最快超級計算機Top500榜單中名列第一。

Frontier的速度比榜單上接下來的七臺超級計算機的總和還要快。

Frontier現(xiàn)在也被列為地球上最快的AI系統(tǒng),在HPL-AI基準(zhǔn)測試中提供6.88 ExaFlops的混合精度性能。

這相當(dāng)于大腦中860億個神經(jīng)元中的每一個每秒執(zhí)行6800萬條指令。

Frontier超級計算機的規(guī)模之大令人驚嘆,但這只是AMD在今年Top500榜單中取得的眾多成就之一——全球排名前10的超級計算機中,有5臺采用AMD EPYC系統(tǒng),而排名前20的超級計算機中,有10臺采用AMD EPYC系統(tǒng)。

Frontier超級計算機由HPE制造,安裝在橡樹嶺國家實驗室 (ORNL)。

該系統(tǒng)擁有9408個計算節(jié)點,每個節(jié)點配備一個64核AMD「Trento」CPU,搭配512 GB DDR4內(nèi)存和四個AMD Radeon Instinct MI250X GPU。

這些節(jié)點分布在74個HPE Cray EX機柜中,每個機柜重8000磅。整個系統(tǒng)擁有 602112個CPU核心,4.6 PB DDR4內(nèi)存。

責(zé)任編輯:張燕妮 來源: 新智元
相關(guān)推薦

2023-10-09 13:19:51

AI軟件

2025-10-30 09:18:35

2024-01-22 09:28:27

2025-10-11 10:34:49

2010-10-29 14:34:10

中國超算世界最快電腦

2024-09-18 07:50:00

超算AI

2012-06-20 10:19:00

IBM超級計算機Sequoia

2018-11-25 22:16:30

超算芯片計算機

2014-12-22 15:51:52

AMDAMD FirePro

2024-03-29 12:40:24

模型數(shù)據(jù)

2013-06-19 10:28:19

巴塞羅那超算中心部署

2023-05-29 18:36:31

英偉達元宇宙AI

2024-03-28 12:44:09

英偉達CUDA高通

2015-07-16 15:15:55

超算Linux

2023-09-25 07:31:19

算力AI框架

2025-10-29 04:15:00

RAGLLM檢索系統(tǒng)

2024-05-22 08:36:30

2023-04-06 09:37:22

谷歌AI

2024-06-24 09:51:24

點贊
收藏

51CTO技術(shù)棧公眾號

另类图片亚洲另类| 欧美日韩国产限制| 高清视频一区二区三区| 亚洲欧美在线视频免费| 神马影视一区二区| 欧美人xxxx| 日韩a级在线观看| 欧美日韩激情视频一区二区三区| 麻豆一区二区99久久久久| 日日噜噜噜夜夜爽亚洲精品| 性猛交╳xxx乱大交| 亚洲天堂免费电影| 最新中文字幕一区二区三区| a级国产乱理论片在线观看99| 日韩精品久久久久久免费| 国产精品91一区二区三区| 亚洲第一区第一页| 一路向西2在线观看| 国产蜜臀在线| 亚洲欧美综合在线精品| 久久精品综合一区| 国产成人精品av在线观| 爽好多水快深点欧美视频| 欧美精品在线观看91| avhd101老司机| 日韩在线影视| 精品久久人人做人人爱| gai在线观看免费高清| 最近高清中文在线字幕在线观看1| 亚洲欧美日韩国产另类专区| 日韩高清在线播放| 午夜视频1000| 国产91精品欧美| 91精品国产综合久久男男| 欧美h在线观看| 亚洲青涩在线| 九九热99久久久国产盗摄| 九九热久久免费视频| 国产精品一区二区av日韩在线| 精品人伦一区二区色婷婷| 久久久久xxxx| 欧美极品在线| 欧美在线观看18| 国产精品wwwww| 英国三级经典在线观看| 午夜视频在线观看一区二区三区| 国产在线观看欧美| 伊人在我在线看导航| 国产精品久99| 亚洲视频sss| 91看片在线观看| 中文字幕免费不卡| 日韩影片在线播放| 成年网站在线| 国产精品系列在线| 亚洲韩国在线| 日韩在线资源| 亚洲美女视频一区| 黄色一级片av| 精品精品导航| 性做久久久久久免费观看| 日韩久久久久久久久久久久| 欧美精品videossex少妇| 亚洲黄色免费电影| 成人短视频在线观看免费| 黄页网站在线| 精品久久久国产| 国产主播在线看| 在线观看v片| 在线中文字幕不卡| 亚洲欧美自偷自拍另类| 国产95亚洲| 精品久久人人做人人爽| 污片免费在线观看| 国产精品手机在线播放| 中文字幕欧美亚洲| 欧美另类视频在线观看| 亚洲黄色在线| 国产精品美女av| 99久久免费国产精精品| 成人一区二区三区在线观看| 精品国产一区二区三区久久久久久| 日本一卡二卡四卡精品| 中文子幕无线码一区tr| 久久天天东北熟女毛茸茸| 97在线超碰| 欧美综合一区二区| 交换做爰国语对白| 奇米影视777在线欧美电影观看| 精品中文视频在线| chinese全程对白| 亚洲黄色av| 国产玖玖精品视频| 亚洲国产精品无码久久| 国产亚洲成av人在线观看导航| 伊人精品久久久久7777| 97久久人人超碰caoprom| 91电影在线观看| 少妇丰满尤物大尺度写真| 日韩手机在线| 欧美乱大交xxxxx| 五月天婷婷导航| 国产成人综合亚洲网站| 欧美极品色图| 欧美bbbxxxxx| 欧美日韩精品一区视频| 北京富婆泄欲对白| 97视频精品| 欧美资源在线观看| 国内精品久久久久久久久久| 久久久欧美精品sm网站| 欧美激情亚洲天堂| 韩国精品视频在线观看| 亚洲第五色综合网| 免费看特级毛片| 天堂蜜桃一区二区三区| 国产精品对白一区二区三区| 9色在线视频| 欧美日韩在线第一页| 99国产精品免费视频| 日韩精品dvd| 欧洲精品久久久| 男人天堂网在线视频| 国产精品久久久久婷婷| 日韩中文字幕二区| 群体交乱之放荡娇妻一区二区| 久久国产精品影片| 一本一道人人妻人人妻αv| 91免费看`日韩一区二区| japanese在线播放| 色综合视频一区二区三区44| 亚洲性日韩精品一区二区| 亚洲国产成人精品激情在线| 国产·精品毛片| avove在线观看| 日本中文字幕视频一区| 亚洲人成在线观| 国产精品免费精品一区| 不卡一区在线观看| 日本xxxxxxxxxx75| 成人av地址| 欧美激情一级二级| 亚洲男人第一天堂| 亚洲国产视频直播| 波多野结衣三级视频| 影音先锋日韩精品| 91久久综合亚洲鲁鲁五月天| 日本在线免费| 欧美精品成人一区二区三区四区| 五月天婷婷丁香网| 久久99精品久久久久久久久久久久| 色视频一区二区三区| 欧美片第一页| 国产午夜精品全部视频在线播放| 成人午夜精品视频| 国产精品日韩精品欧美在线| 欧美日韩一区二区三区69堂| 日韩欧美中文| 亚洲自拍偷拍色片视频| 在线电影福利片| 精品久久久久久久久久久久包黑料| 久久久久成人精品无码| 成人美女在线视频| 高清在线观看免费| 国精一区二区| 国产在线观看不卡| 亚洲按摩av| 日韩电影网在线| 亚洲av无码不卡| 国产精品久久久久桃色tv| 久久精品亚洲天堂| 国模大胆一区二区三区| 久久久久久一区| 久久精品超碰| 欧美福利视频在线| 日本高清中文字幕二区在线| 欧美网站一区二区| 真实国产乱子伦对白在线| 不卡av电影在线播放| 无码人妻精品一区二区三区66| 久久精品国产大片免费观看| 7777奇米亚洲综合久久| 亚洲精华液一区二区三区| 日韩亚洲欧美中文高清在线| 亚洲AV无码成人片在线观看| 狠狠做深爱婷婷久久综合一区| 国产三级在线观看完整版| 国产精品自拍网站| 黄www在线观看| 99精品美女| 国产一区免费在线| 六九午夜精品视频| 亚洲18私人小影院| av网站在线播放| 亚洲福利在线看| 一级欧美一级日韩| 天天爽夜夜爽夜夜爽精品视频 | 91日韩一区二区三区| 亚洲成色www.777999| 国内自拍一区| 午夜视频久久久| 国产66精品| 国产日本欧美视频| 色多多在线观看| 久久成人综合视频| 裸体xxxx视频在线| 精品伦理精品一区| 中国一级特黄视频| 婷婷开心激情综合| 农村妇女精品一区二区| 国产三级一区二区三区| 国产精品果冻传媒| 精品在线观看免费| 成年人在线看片| 亚洲夜间福利| 国产女人18毛片| 9999国产精品| 亚洲va韩国va欧美va精四季| 国产日韩三级| 91久久伊人青青碰碰婷婷| 岛国精品在线| 浅井舞香一区二区| 国产黄色大片在线观看| 久久电影一区二区| 求av网址在线观看| 伊人伊人伊人久久| 免费在线黄色影片| 亚洲国产欧美在线成人app| 国产视频一区二区三区四区五区| 欧美中文字幕一区| 久久久久在线视频| 疯狂做受xxxx高潮欧美日本| 久久久香蕉视频| 亚洲综合色噜噜狠狠| tube国产麻豆| 日韩美女视频19| 日韩高清dvd碟片| 国产精品久久久久久久午夜片 | 国产精选一区| 久久精品女人的天堂av| 猫咪成人在线观看| 黑人另类av| 欧美久久精品| 美女视频久久| 欧美男gay| 亚洲国产精品一区二区第一页| 精品国产一区二区三区久久久樱花| 久久久久久99| 一区二区三区韩国免费中文网站| 欧美18视频| blacked蜜桃精品一区| 日本一区二区三区在线视频| 精品久久国产| 亚洲一区二区三区涩| 国产精品久久久久久久久久10秀| 亚洲永久激情精品| 日韩在线看片| 久久久99精品视频| 国内精品久久久久久久97牛牛| 日本中文字幕在线视频观看| 日韩亚洲国产欧美| 激情五月开心婷婷| 奇米色777欧美一区二区| 亚洲第一狼人区| 精东粉嫩av免费一区二区三区| 日本高清免费在线视频| 成人小视频在线| 中出视频在线观看| 国产免费观看久久| 国产麻豆a毛片| 一区二区三区在线视频观看58| 久久久综合久久久| 日韩欧美中文在线| 伊人网视频在线| 日韩免费一区二区| 亚洲三级中文字幕| 在线观看欧美成人| av中文字幕在线观看| 69av视频在线播放| 成人1区2区| 超碰97人人在线| 欧美精美视频| 99精品一区二区三区的区别| 亚洲精品影院在线观看| 宅男噜噜噜66国产免费观看| 国产一区二区调教| 香蕉视频黄色在线观看| 国产精品久久午夜夜伦鲁鲁| 日本中文字幕免费| 欧美性受xxxx黑人xyx| 精品人妻无码一区二区三区蜜桃一| 日韩电影免费在线观看中文字幕| 在线免费看黄| 午夜精品视频网站| 人人精品久久| 久久超碰亚洲| 欧美1区2区| 亚洲爆乳无码专区| 国产很黄免费观看久久| 在哪里可以看毛片| 亚洲综合色成人| 在线亚洲欧美日韩| 日韩经典中文字幕在线观看| 国产网站在线免费观看| 欧美中文在线免费| 日韩精品视频一区二区三区| 日韩久久在线| 国产精品毛片在线| 亚欧精品在线视频| 国产亚洲精品资源在线26u| 黄色一级视频在线观看| 欧美日韩在线播放三区四区| 天天射天天色天天干| 欧美成人剧情片在线观看| 欧美日韩国产网站| 久久久综合亚洲91久久98| 中文字幕日韩一区二区不卡| 黄色一级二级三级| 91麻豆福利精品推荐| 国产一卡二卡在线播放| 69堂国产成人免费视频| 国产1区2区3区在线| 欧美性受xxxx黑人猛交| 中文无码日韩欧| 日韩不卡一二区| 国内久久精品视频| 亚洲色图 激情小说| 日韩欧美在线网址| 深夜福利在线观看直播| 久久免费在线观看| 亚洲精品影片| 妞干网这里只有精品| 精品一区中文字幕| 天美传媒免费在线观看| 在线国产亚洲欧美| 精品久久久久一区二区三区| 8x海外华人永久免费日韩内陆视频| 日韩视频一二区| 欧美精品久久96人妻无码| 久久 天天综合| 亚洲色图 激情小说| 欧美日韩一区二区在线观看 | 精品欧美午夜寂寞影院| 成人在线观看毛片| 国产成人精品午夜视频免费| 欧美日韩国产精品综合| 日韩一区二区三区视频在线观看| 黄色动漫在线| 97久草视频| 亚洲电影成人| 欧美丰满少妇人妻精品| 日韩欧美在线视频日韩欧美在线视频| 三级视频在线播放| 国产成人av在线| 欧美日韩激情在线一区二区三区| 国产超碰在线播放| 国产精品乱码久久久久久| 一区二区的视频| 欧美成人免费小视频| 成人午夜三级| 欧美性大战久久久久xxx| 国产欧美综合在线观看第十页 | 亚洲电影免费观看高清完整版在线观看 | 日韩大胆成人| 日韩中文字幕免费在线| 国产精品每日更新在线播放网址| 97视频免费在线| 欧美激情伊人电影| 亚洲日本三级| 一女二男3p波多野结衣| 亚洲另类春色国产| 五十路在线视频| 国产精品免费视频xxxx| 中文字幕亚洲精品乱码| 超碰caoprom| 欧美在线观看一二区| 中中文字幕av在线| 国产精品麻豆免费版| 天堂va蜜桃一区二区三区漫画版| 午夜激情福利电影| 精品国产一区二区三区av性色| 涩涩视频在线免费看| 免费看啪啪网站| 成人av午夜电影| 中文字幕 自拍偷拍| 九九热最新视频//这里只有精品 | 永久久久久久| 成人av在线播放网站| 亚洲精品一区二区二区| 欧美高清视频免费观看| 红桃成人av在线播放| 欧美一区二区三区影院| 色婷婷综合久久久| 午夜小视频在线观看| 欧美日韩精品一区| 国产精品一区2区| 欧美日韩 一区二区三区| 精品自在线视频| 日韩中文首页| jizz欧美性20|