精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

#AIGC創新先鋒者征文大賽# 部署 LLMs 前如何計算與優化 GPU 內存需求? 原創 精華

發布于 2024-10-10 09:52
瀏覽
0收藏

??【本文正在參與 AI.x社區AIGC創新先鋒者征文大賽】??

??http://www.jxzklqfsx.com/aigc/2223.html??


編者按:想要部署大語言模型(LLMs),卻不知該如何估算所需的 GPU 內存?在項目預算有限的情況下,是否曾因為 GPU 內存估算不準而導致資源浪費或性能不足?這些問題不僅影響項目進度,還可能直接導致成本超支或服務質量下降。

本文作者憑借豐富的 LLM 部署經驗,深入剖析了 GPU 內存需求的計算方法。從模型參數到 KV 緩存,從激活值到系統開銷,文章全面而詳細地講解了各個組成部分的內存占用。文章還討論了內存管理面臨的挑戰,如內存碎片、過度分配和高級解碼算法帶來的額外需求。為解決這些問題,作者介紹了 PagedAttention 和 vLLM 等優化技術,當 GPU 內存不足時,還可以采用 Swapping 和 Recomputation 等優化策略。

作者 | Muhammad Saad Uddin

編譯 | 岳揚

將 LLMs 投入生產環境使用,會遇到諸多挑戰,尤其是想要為 LLMs 高效提供所需的計算資源時。有過此類經驗的人可能深有體會,GPU 內存是支持 LLMs 運行的一項關鍵資源。由于這些模型體積巨大,且推理過程具有動態性質,因此對 GPU 內存使用的規劃和優化提出了更高的要求。

#AIGC創新先鋒者征文大賽# 部署 LLMs 前如何計算與優化 GPU 內存需求?-AI.x社區

Image by Author via DallE

出于以下幾個原因,準確估算 GPU 內存的需求至關重要:

  • 成本效益:GPU資源成本高昂。高估內存需求會導致不必要的硬件支出,而低估內存需求則會導致系統故障或性能下降。
  • 性能優化:合理的內存管理能夠保障模型的高效運行,從而快速響應用戶需求,并提高并發處理能力。
  • 可擴展性:隨著業務需求的增長,準確掌握內存需求對于在不影響性能和不產生過高成本的情況下擴展服務至關重要。

然而,計算 LLMs 服務所需的 GPU 內存并非一件簡單的事。模型的大小(model size)、序列長度(sequence lengths)、批處理數量(batch sizes)以及解碼算法(decoding algorithms)等多種因素,都會以復雜的方式影響內存使用。而且,傳統的內存分配方法常因內存碎片和鍵值(KV)緩存等動態內存組件的低效管理而造成大量浪費。

在本文中,我將盡可能詳細地解釋如何計算 LLMs 服務所需的 GPU 內存。我將分析影響內存使用的各部分,并根據模型參數和工作負載特征(workload characteristics),逐步介紹如何估算內存占用大小。同時,我還會探討 Paged Attention 和 vLLM 等先進的優化技術,這些技術能顯著降低內存消耗并提升處理能力。通過閱讀本文,你將能夠全面了解如何規劃和優化 LLMs 的 GPU 內存使用,從而在實際應用中實現高效且低成本的 LLMs 部署。

01 了解 LLM 推理過程中,主要消耗 GPU 內存的幾部分

要想掌握 GPU 內存的計算方法,最關鍵的是了解各部分如何占用 GPU 內存的。了解內存的使用去向有助于我們更好地規劃與優化資源。在 LLMs 推理過程中,主要消耗 GPU 內存的幾部分包括權重(模型參數)、鍵值緩存內存(Key-Value Cache Memory)、激活值(Activations)與臨時緩沖區(Temporary Buffers),以及系統開銷(Overheads)(如果你對并行處理或分布式計算有所研究,可能對這個概念已有一定的認識)。

1.1 模型參數(權重)

模型參數是神經網絡在訓練過程中學到的數值(權重(weights)和偏置(biases))。這些參數定義了模型如何處理輸入數據生成輸出。

模型大小對 GPU 內存的影響

  • 直接關系:模型越大(參數越多),存儲這些權重所需的 GPU 內存就越多。
  • 內存計算:在使用半精度(FP16)格式時,每個參數通常需要 2 個字節,這在推理過程中很常見,可以節省內存而不會明顯損失精度。

讓我們看看這些模型:

  1. 擁有 34.5 億參數的小型 LLM:
  • 所需內存:34.5 億 × 2 字節 = 69 MB。單 GPU 即可輕松支持。
  1. 現在如果使用 llama2-13b 模型:
  • 擁有 130 億參數,所需內存將是:130 億 × 2 字節 = 26 GB。這種情況下,需要一個擁有 40 GB內存的 A100 GPU。
  1. 如果我們看看據說擁有 1750 億參數的 GPT-3 模型:
  • 所需內存:1750 億 × 2 字節 = 350 GB,我們至少需要 9 個 GPU 來僅存放模型權重。

請記住,對于 GPT-3 及其之后的模型,使用模型并行化(model parallelism)將模型參數分布到多個 GPU 上是十分必要的。

1.2 鍵值(KV)緩存內存

KV緩存存儲生成序列中每個 token 所需的中間表示。簡單來說,當模型每次生成一個 token 時,它需要記住之前的 tokens 以保持上下文。KV緩存存儲了目前為止生成的每個 token 的鍵(key)和值(value)向量,使模型能夠高效地處理過去的 tokens ,而無需重新計算。

工作原理:

  • Key 和 Values:在注意力機制中,模型為每個 token 計算一個鍵向量和一個值向量。
  • Storage:這些向量存儲在 KV 緩存中,并在后續步驟中用于生成新 tokens 。

序列長度(Sequence Length)和并發請求(Concurrent Requests)的影響:

  • Longer Sequences:tokens 越多,KV緩存中的條目就越多,內存使用量增加。
  • Multiple Users:同時服務多個請求會成倍增加所需的KV緩存內存。

計算每個 token 的 KV 緩存大小

讓我們來分析一下如何得出每個 token 的 KV 緩存大小:

  1. 每個 token 的 KV 緩存組件:

鍵向量(每層一個鍵向量)和值向量(每層一個值向量)

  1. 每個 token 的向量總數:

模型層數(L)× 隱藏層大小(H):模型的深度 × 每個向量的維度。

再次以 llama-13b 模型為例,假設模型具有以下特征:

  • 模型層數(L):40層
  • 隱藏層大小(H):5120維度(這種大小的模型中的常見維度)
  1. 計算每個 token 占用的內存:

i. 鍵向量:

  • 總數量:L層 × H維度 = 40 × 5120 = 204,800 個
  • 內存大小:204,800 個 × 2字節(FP16)= 409,600字節(或400 KB)

ii. 值向量:

  • 與鍵向量相同:也是400 KB

iii. 每個 token 的總KV緩存:

  • 鍵向量 + 值向量:400 KB + 400 KB = 800 KB

現在考慮輸出內容為2000個 tokens 的情況:

800 KB/token × 2000 tokens = 每個輸出序列 1.6 GB

假如有 10 個并發請求(模型同時為 10 個用戶服務):1.6 GB/輸出序列 × 10 輸出序列 = 16 GB 的 KV 緩存內存

KV緩存隨著序列長度和并發請求數量的增加而線性增長。我從一篇論文[1]中了解到,KV緩存可以消耗多達 30% 甚至更多的GPU內存。

1.3 激活值和臨時緩沖區

激活值(Activations)是指推理過程中神經網絡層的輸出,而臨時緩沖區(temporary buffers)用于中間計算。激活值和緩沖區通常消耗的內存比模型權重和 KV 緩存要少。

它們可能使用大約 5-10% 的總 GPU 內存。

盡管它們的容量較小,但激活值對于模型計算每一層的輸出是十分必要的。它們在前向傳遞過程(forward pass)中被創建和丟棄,但仍需要足夠的內存分配。

1.4 內存開銷

額外的內存使用開銷來自于內存分配和使用的低效率。下面是對其的簡要介紹:

內存碎片:

  • Internal Fragmentation:當分配的內存塊沒有被完全利用時產生。
  • External Fragmentation:隨著時間的推移,空閑內存被分割成小塊,使得在需要時難以分配較大的連續內存塊。

計算過程中產生的中間步驟:

  • 臨時數據:像矩陣乘法這樣的操作可能會創建消耗內存的臨時張量。

低效內存管理的影響:

  • 性能降低:浪費的內存可能會限制系統可以處理的并發請求數量。
  • 吞吐量降低:低效的內存管理可能會導致延遲并降低向用戶提供服務響應的整體速度。

示例:如果內存碎片在 40 GB GPU 上浪費了 20 %的內存,那么就有 8 GB 的內存本可以用來處理更多請求,但是現在被浪費了。

02 計算 GPU 內存需求

既然我們已經對關鍵內容有了足夠的了解,那么就不再拖延,直接計算完整的 GPU 內存需求!

逐步計算:

要計算任何模型的內存需求,幾乎以下內容都需要:了解模型權重、KV緩存、激活值和臨時緩沖區以及系統內存開銷。以 llama-2 13B 模型為例,公式為:

所需內存總量:模型權重 + KV緩存 + 激活值和系統內存開銷

對于 13 B 模型來說:

模型權重 = 參數數量 × 每個參數的字節數

總 KV 緩存內存 = 每個 token 的 KV 緩存內存 × 輸出序列長度 × 輸出序列數量

激活值和系統內存開銷 = GPU總內存的 5–10 %

激活值和系統內存開銷通常消耗模型參數和 KV 緩存使用的 GPU 總內存的大約 5–10 %。你可以額外分配目前計算出的總內存的 10 %作為這部分的內存消耗預留量。

模型權重 = 130 億 × 2 字節 = 26 GB

總 KV 緩存內存 = 800 KB × 8192* tokens × 10* 并發請求 = 66 GB

激活值和系統內存開銷 = 0.1 × (26 GB + 66GB) = 9.2 GB

*假設模型的輸出系列長度為 8192,有 10 個并行請求。

所需內存總量:26 GB + 66 GB + 9.2 GB = 101.2 GB

所以,運行 llama-2 7B 模型至少需要 3 個 A100 40GB GPU。

如果我想要托管一個 GPT-3 模型(我知道這很瘋狂;D),計算方法與此類似,但這次我會假設每次只處理一個請求,并使用 OPT-175B[2] 模型的大小( 96 層和每層 12288 維度)作為參考。

模型權重 = 1750 億 × 2 字節 = 350 GB

總 KV 緩存內存 = 4.5 MB × 8192 token × 1 并發請求 = 36 GB

激活值和系統內存開銷 = 0.1 × (350 GB + 36GB) = 38.6 GB

所需總內存:350 GB + 36 GB + 38.6 GB = 424.6 GB 幾乎需要 11 個 A100 ??。

如果假設 GPT-4 是一個擁有 1 萬億參數的模型,那么將需要 2.3 TB的內存。

根據有關模型大小和參數的公開信息,計算出的內存計算表如下所示:

#AIGC創新先鋒者征文大賽# 部署 LLMs 前如何計算與優化 GPU 內存需求?-AI.x社區

Table calculated by Author

同樣,如果我將模型部署給許多用戶(比如 10 個)同時使用,計算出的內存計算表如下所示:

#AIGC創新先鋒者征文大賽# 部署 LLMs 前如何計算與優化 GPU 內存需求?-AI.x社區

Table calculated by Author

在處理多個請求時,內存消耗明顯增加。主要是KV緩存大量增加,因為模型權重和系統內存開銷保持不變,KV 緩存會隨著 tokens 數量和并發請求的增加而大幅增加,矩陣的行數就會越多,從而直接增加內存消耗。

現在想象一下 OpenAI[3] 或 Anthropic[4] 的大模型擁有數百萬用戶的情況吧!!

03 使用 GPU 內存過程中遇到的挑戰及其優化策略

經過上述計算,我意識到如果不探討在部署大語言模型(LLMs)時遇到的一些挑戰,以及目前的研究是如何針對這些問題進行優化的,那么這篇文章將顯得不夠完整。對于我們許多人來說,了解、掌握高效的 GPU 內存管理技巧至關重要。下面我們簡要分析一下。

3.1 挑戰一:內存碎片與內存過度分配

在部署過程中,我們通常會靜態地為 KV cache 分配內存,為每個請求預留盡可能大的內存空間。這樣往往會導致內存過度分配,因為盡管實際的輸出序列往往更短,系統會為可能的最長輸出序列預留內存空間。

此外,內存碎片會降低有效的可用內存,從而限制系統同時處理的請求數量。內存碎片分為內部(Internal)和外部(External)兩種。內部內存碎片是指分配的內存塊未被充分利用,留下未使用的內存空間。而外部內存碎片則是指隨著時間推移,空閑內存被分割成多個小的且不連續的內存塊,這樣就難以在需要時分配足夠大的連續內存塊。

內存使用效率低下意味著 GPU 的計算資源并未得到充分利用。結果,系統受內存限制而非計算能力的限制,浪費了處理器性能。(這也是我們在并行或分布式系統中力求避免的問題)

3.2 挑戰二:解碼算法

大量的 LLM 應用都傾向于采用先進的解碼算法來優化輸出質量或是產生多樣化的輸出結果。盡管這些方法效果顯著,但它們也對內存管理提出了新的挑戰。以束搜索(Beam Search)為例,該算法會生成多個備選輸出序列(即“束(beams)”),并根據評分標準保留得分最高的輸出序列。這意味著,每個“束(beams)”都需要專屬的 KV 緩存空間,從而增加了內存使用量。同樣,Parallel Sampling 通過從模型生成的概率分布(probability distribution)中抽取樣本,一次性生成多個獨立輸出,每個輸出同樣需要獨立的 KV 緩存,這無疑進一步增加了內存消耗。

在動態內存分配這種情況下,解碼過程中“束(beams)”或樣本的數量可能會發生變化,從而導致不可預測的內存需求。在不產生內存碎片和過度內存開銷的情況下,動態地分配和釋放內存,成為一項技術挑戰。此外,這些解碼方法可能會成倍增加內存需求,有時甚至超出了 GPU 的處理能力。如果 GPU 內存不足,系統可能不得不將數據轉移到速度較慢的 CPU 內存或硬盤上,這無疑會延長處理時間。

面對這些問題,我們可能會思考:

我們該如何突破這些限制?

3.3 PagedAttention

受操作系統內存管理方式的啟發,PagedAttention 技術將虛擬內存的分頁原理應用于 KV 緩存的管理。這種方法使得 KV 緩存數據不必占據一大塊連續的內存空間,而是可以分散存儲于多個不連續的內存頁面上。PagedAttention 采用動態內存分配策略,即根據實際需求為 KV 緩存分配內存,無需提前預留出最大輸出序列長度所需的內存。這樣的注意力機制能夠順暢地從不同內存地址中檢索 KV 緩存數據。

PagedAttention 的優勢在于,通過使用較小的內存塊,有效減少了內存碎片,降低了因內存碎片導致的內存浪費,從而提升了內存的整體使用率。

3.4 vLLM

簡單來說,vLLM 是一個基于 PagedAttention 構建的高吞吐量 LLM 服務系統。其核心目的是在推理過程中高效管理 GPU 內存,尤其是 KV 緩存。從理論上看,vLLM 幾乎實現了零內存浪費的解決方案。通過內存的動態分配和非連續存儲,它幾乎消除了內存浪費。理論上,它還支持在單個請求內部和跨請求之間共享 KV 緩存數據,這對于高級解碼方法尤其有用。在此基礎上,vLLM 能夠處理更大的批處理數量和更多的并發請求,從而提升整體性能。

即使進行了優化,有時也可能出現 GPU 內存不足的情況。vLLM 可通過 swapping 和 recomputation 來應對這個問題。讓我們進一步了解這一機制。

3.5 Swapping KV Cache to CPU Memory

  • Swapping:當 GPU 內存滿載時,系統會將 KV 緩存數據從 GPU 內存臨時轉移到 CPU 內存中。
  • 優點:
  • 內存釋放(Memory Relief):通過將數據移出 GPU 內存,可以為新的請求騰出空間,確保 GPU 內存不會因為資源不足而阻礙新任務的執行。
  • 代價:
  • 延遲增加:由于 CPU 內存的訪問速度通常低于 GPU 內存,因此從 CPU 內存讀取數據會比從 GPU 內存讀取數據更加耗時。
  • 數據傳輸開銷:在 GPU 內存和 CPU 內存之間轉移數據需要消耗帶寬和處理器時間。

3.6 Recomputation

不存儲所有 KV 緩存數據,而是在需要時按需重新計算。

  • 優點:
  • 減少內存使用:在內存中需要存儲的數據量減少。
  • 代價:
  • 增加計算量:重新計算數據需要額外的處理能力。
  • 延遲影響:由于增加的額外計算量,可能會導致響應時間變長。

Swapping 和 Recomputation 兩種方法比較表

#AIGC創新先鋒者征文大賽# 部署 LLMs 前如何計算與優化 GPU 內存需求?-AI.x社區

Table by Author

單獨使用 Swapping 或 Recomputation 可能各有優缺點,但是將兩者結合起來使用,可以相互彌補對方的不足,從而在節省內存、減少計算量、降低延遲等方面達到一個較為理想的平衡狀態。

Thanks for reading!

Hope you have enjoyed and learned new things from this blog!

About the authors

Muhammad Saad Uddin

Data Science is poetry of math where data is your love and its on you how you write your verses to show world your poetic expressions with utmost clarity?.

END

本期互動內容 ??

?你是否遇到過因為模型過大而導致的 GPU 內存不足問題?

??文中鏈接??

[1]??https://arxiv.org/pdf/2309.06180??

[2]??https://medium.com/@plienhar/llm-inference-series-4-kv-caching-a-deeper-look-4ba9a77746c8??

[3]??https://openai.com/??

[4]??https://www.anthropic.com/??

原文鏈接:

??https://ai.gopubby.com/stop-guessing-heres-how-much-gpu-memory-you-really-need-for-llms-8e9b02bcdb62??


?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
標簽
1
收藏
回復
舉報
回復
相關推薦
亚洲一区二区三区四区五区xx| 91久久偷偷做嫩草影院| 国产男男chinese网站| www.久久.com| 一区二区三区国产| 日韩国产精品一区二区| 国产农村老头老太视频| 国产日本精品| 久久久国产精品免费| 毛茸茸多毛bbb毛多视频| 亚洲成人1区| 欧美丝袜美女中出在线| 三年中国中文在线观看免费播放| 亚洲大尺度视频| 青青草97国产精品免费观看无弹窗版| 欧美高清电影在线看| 免费一级黄色录像| 欧美18xxxx| 日韩欧美一区二区不卡| 中文字幕国内自拍| 中文字幕资源网在线观看免费| 亚洲图片激情小说| 欧美一区二区视频17c| 亚洲精品久久久久久动漫器材一区| 久久大逼视频| 777精品视频| 久久99久久98精品免观看软件 | 免费观看一级特黄欧美大片| 97在线观看视频国产| 最新一区二区三区| 成人a'v在线播放| 精品无人区乱码1区2区3区在线 | 97久久超碰精品国产| 91在线播放国产| 做爰无遮挡三级| 香蕉久久夜色精品国产| 孩xxxx性bbbb欧美| 久久人人爽人人爽人人| 在线观看国产精品入口| 久久伊人精品视频| 成人三级视频在线观看| 日韩av在线播放网址| 国产午夜精品美女视频明星a级| 日b视频在线观看| 成人在线超碰| 亚洲成人久久一区| 精品人妻一区二区免费| 99re91这里只有精品| 欧美大片顶级少妇| 制服.丝袜.亚洲.中文.综合懂| 国产美女亚洲精品7777| 91精品国产综合久久久蜜臀粉嫩| 亚洲这里只有精品| 色综合视频一区二区三区日韩| 欧美色图天堂网| 亚洲欧美自偷自拍另类| av在线播放一区| 欧美日韩电影一区| 国产5g成人5g天天爽| 国产欧美视频在线| 日韩欧美国产一区二区在线播放| 日本中文字幕精品| 国产一级成人av| 日韩av中文字幕在线| 黄色a一级视频| 精品久久不卡| 日韩一区二区三区xxxx| www.毛片com| 国内精品99| 91成人在线视频| 亚洲婷婷综合网| 奇米888四色在线精品| 国产精品亚洲片夜色在线| 91亚洲精品国偷拍自产在线观看 | 国内精品久久久久久久97牛牛 | 欧美日本高清视频| 国产一级特黄视频| 免费一区视频| 成人av.网址在线网站| 国产激情视频在线播放| 92精品国产成人观看免费| 视频一区在线免费观看| bestiality新另类大全| 亚洲777理论| 人人爽人人av| 日韩免费精品| 日韩精品日韩在线观看| 男人的午夜天堂| 在线免费高清一区二区三区| 国产成人精品一区二区三区| 国产精品视频在线观看免费| 99久久亚洲一区二区三区青草 | 9191在线| 亚洲一级二级三级| 免费看a级黄色片| 免费精品一区| 亚洲无av在线中文字幕| 四虎永久免费在线| 久久亚洲国产精品一区二区| 成人亚洲激情网| 日本在线丨区| 尤物在线观看一区| 国产一级做a爰片久久| 4438全国亚洲精品观看视频| 国产一区二区欧美日韩| 国产无遮挡免费视频| 奇米影视一区二区三区| 精品一卡二卡三卡四卡日本乱码| 在线播放毛片| 色先锋资源久久综合| 免费人成视频在线播放| 欧美一区电影| 欧洲s码亚洲m码精品一区| 99久久精品日本一区二区免费| 久久天天做天天爱综合色| 成人毛片100部免费看| 国产成人精品一区二区三区免费| 日韩av一卡二卡| 久久国产精品国语对白| 日韩国产欧美在线播放| 久久久福利视频| 美女航空一级毛片在线播放| 7777精品伊人久久久大香线蕉的| 亚洲精品色午夜无码专区日韩| 一本色道久久综合亚洲精品不| 国产日本欧美一区| 国产三级在线观看| 一本一道久久a久久精品综合蜜臀| 在线播放av网址| 欧美.www| 91九色在线观看| a视频在线观看免费| 欧美裸体bbwbbwbbw| 国产伦精品一区二区三区视频女| 蜜桃久久av| 免费成人在线观看av| xxx性欧美| 亚洲第一二三四五区| 久久免费视频6| 国产精品99久| 国产xxxx振车| eeuss鲁片一区二区三区| 久久99久久99精品中文字幕| 国产三级精品在线观看| 亚洲青青青在线视频| 青青草原播放器| 综合精品久久| 成人蜜桃视频| av手机在线观看| 亚洲国产精品va在线看黑人| 1级黄色大片儿| 2017欧美狠狠色| 日韩欧美在线免费观看视频| 精品国产aⅴ| 国产精品自拍小视频| 免费网站免费进入在线| 91精品国产免费| 国产一级片播放| 成人高清视频在线| 成人av一级片| 黑人操亚洲人| 国产精品偷伦一区二区| 麻豆传媒在线完整视频| 精品久久一区二区三区| 国产特黄大片aaaa毛片| 国产亚洲一区二区三区四区| 色综合色综合色综合色综合| 在线精品视频在线观看高清| 成人永久免费| 中文字幕成在线观看| 亚洲网站在线播放| 国产美女免费视频| 亚洲一二三四区| 久久精品一区二区免费播放| 男女激情视频一区| 国产欧美123| 亚洲婷婷影院| 91久久精品久久国产性色也91| 国精一区二区三区| 亚洲区一区二区| 91资源在线视频| 天天色综合成人网| 精品成人无码一区二区三区| 国产精品99久久久| 大香煮伊手机一区| 欧美精品国产一区| 欧美午夜精品久久久久久蜜| 成人97精品毛片免费看| 88xx成人精品| 成人在线视频亚洲| 亚洲午夜未删减在线观看| 国产成人精品a视频| 欧美色道久久88综合亚洲精品| 免费一级suv好看的国产网站| 成人免费视频caoporn| 亚洲天堂网一区| 亚洲国产日本| 制服诱惑一区| 伊人久久综合影院| 不卡一区二区三区四区五区| 成人网ww555视频免费看| 欧美激情国产高清| 麻豆影院在线观看| 亚洲欧美制服另类日韩| 精品人妻久久久久一区二区三区| 91国偷自产一区二区开放时间 | 国内不卡的二区三区中文字幕| 大西瓜av在线| 久久久久久久久久久久久久久久久久| 欧美大香线蕉线伊人久久| 奇米一区二区| 国产美女高潮久久白浆| 中文在线资源| 韩国日本不卡在线| 色操视频在线| 久久精品99国产精品酒店日本| 日本大臀精品| 亚洲精品99久久久久中文字幕| av无码精品一区二区三区宅噜噜| 欧美影院一区二区三区| 五月婷婷激情视频| 欧美日韩国产中文精品字幕自在自线| 激情五月婷婷小说| 亚洲免费成人av| 男人晚上看的视频| 国产精品美女视频| 成人福利在线视频| 国产xxxx孕妇| 欧美老年两性高潮| 在线观看国产小视频| 日本道免费精品一区二区三区| 国产又色又爽又黄的| 亚洲国产一二三| 国产精品伊人日日| 黄色网页在线播放| 日韩性xxxx爱| 免费大片在线观看www| 色一区av在线| 在线视频91p| 神马国产精品影院av| 91视频在线观看| 色妞久久福利网| 五月天婷婷在线视频| xxxx欧美18另类的高清| 久操视频在线免费播放| 久久韩国免费视频| a视频在线免费看| 欧美日本黄视频| 婷婷色在线播放| 久久久久久国产精品| 7777kkk亚洲综合欧美网站| 久久人人97超碰精品888| 国内激情视频在线观看| 欧美一性一乱一交一视频| 97成人资源| 国产精品一区专区欧美日韩| 2020国产精品小视频| 亚洲自拍偷拍色片视频| 北条麻妃在线一区二区免费播放| 狠狠爱一区二区三区| 免费看日本一区二区| 亚洲不卡1区| 一本精品一区二区三区| 国产乱子伦精品无码专区| 国产亚洲亚洲| 激情五月俺来也| 国产一区二区三区久久悠悠色av | av在线这里只有精品| 手机免费看av| 亚洲视频网在线直播| 久青草免费视频| 色呦呦国产精品| 97人妻精品一区二区三区软件 | 色三级在线观看| 日韩有码视频在线| 丁香花高清在线观看完整版| 欧美一级免费看| 电影91久久久| 精品免费一区二区三区蜜桃| 日韩1区在线| 欧美亚洲黄色片| 奇米影视一区二区三区| 岛国精品一区二区三区| 欧美激情在线看| 欧美日韩中文视频| 欧美亚洲精品一区| 国产 日韩 欧美 精品| 伊人伊成久久人综合网站| 影院在线观看全集免费观看| 日本精品视频在线| 久久的色偷偷| 午夜精品区一区二区三| 亚洲精品偷拍| 午夜福利123| 久久久精品天堂| 久久久久久激情| 欧美主播一区二区三区| 人妻无码中文字幕| 久久色在线播放| 澳门av一区二区三区| 国产精品免费看一区二区三区| 成人短片线上看| 欧美啪啪免费视频| 国产精品一区二区x88av| 中文字幕第24页| 都市激情亚洲色图| 国产夫绿帽单男3p精品视频| 国产一级揄自揄精品视频| free性m.freesex欧美| 成人综合网网址| 成人免费电影网址| 三级4级全黄60分钟| jvid福利写真一区二区三区| 乱h高h女3p含苞待放| 欧美性受极品xxxx喷水| 色中色在线视频| 国产69精品久久久久9| 欧美日韩国产一区二区在线观看| 视频一区国产精品| 美女被久久久| 无码人妻aⅴ一区二区三区 | 26uuu欧美| 国产精品7777777| 欧美r级在线观看| av黄色在线| 91精品入口蜜桃| 91tv官网精品成人亚洲| 一起操在线视频| 国产日产欧美精品一区二区三区| 久久国产黄色片| 亚洲黄色av网站| 女人高潮被爽到呻吟在线观看| 国产精品日韩高清| 在线精品福利| 欧美熟妇精品一区二区蜜桃视频| 亚洲一区二区av电影| 丰满人妻一区二区三区免费视频| 欧美丰满片xxx777| a级日韩大片| 日韩视频免费播放| av亚洲精华国产精华精| 欧美日韩综合在线观看| 精品亚洲一区二区三区| 2022成人影院| 欧美精品欧美精品| 日本伊人色综合网| 天堂av免费在线| 91精品国产一区二区三区| 黄色av电影在线播放| 99视频免费观看| 亚洲免费高清| 无码一区二区三区在线| 欧洲精品视频在线观看| 1024视频在线| 97人人干人人| 亚洲人成人一区二区三区| 国产精品无码久久久久久| 色婷婷国产精品| 黄网站视频在线观看| 99re在线国产| 国产精品主播| 男人天堂资源网| 欧美一级高清大全免费观看| 丁香高清在线观看完整电影视频| 久久久久久a亚洲欧洲aⅴ| 免费av成人在线| 加勒比av在线播放| 亚洲精品在线不卡| 欧美一级做a| 黄色一级片黄色| 国产日韩一级二级三级| 国产三级三级在线观看| 97国产suv精品一区二区62| 精品一区毛片| 亚洲一区二区偷拍| 五月婷婷激情综合网| 国产高清视频免费最新在线| 亚洲直播在线一区| 国产亚洲亚洲| 黄色香蕉视频在线观看| 亚洲国产古装精品网站| 亚洲国产91视频| 黄色影院一级片| 亚洲精选在线视频| 日韩av高清在线| 99久热re在线精品视频| 老司机亚洲精品| 妺妺窝人体色www婷婷| 国产一区二区三区丝袜| 在这里有精品| 一区二区三区韩国| 亚洲一区二区偷拍精品| 成人在线免费看| 狠狠色综合欧美激情| 韩国理伦片一区二区三区在线播放 | 国产成人精品在线观看| 欧美午夜免费影院| 日本不卡一区视频| 精品视频—区二区三区免费| 九九九九九九精品任你躁|