精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

鴻蒙開發者社區

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發者社區

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發者社區訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業版APP

鴻蒙開發者社區視頻號

51CTO軟考題庫

賬號設置退出

讓算力不再成為瓶頸，小紅書機器學習異構硬件推理優化之道

作者：智能分發部 2023-09-07 11:16:15

人工智能機器學習

近些年，機器學習領域的視頻、圖像、文本和推廣搜等應用，其模型計算量和參數量遠遠超過 CPU 摩爾定律的增長速度。在此背景下，GPU 的算力發展和大模型的發展不謀而合。

很多公司都在結合 GPU 的算力發展，探索出適合自己的機器學習問題解決方案。例如，小紅書在 2021 年開始進行推廣搜模型的 GPU 化改造，以提升推理性能和效率。在遷移過程中，我們也面臨一些困難，例如如何平滑遷移到異構硬件，如何結合小紅書的業務場景和在線架構發展出自己的解決方案等等。在全球降本增效的趨勢下，異構計算成為了一種很有前途的方向，可以通過將不同類型的處理器（如 CPU、GPU、FPGA 等）組合在一起來提高計算性能，從而實現更好的效率和更低的成本。

1.背景

小紅書推薦、廣告、搜索等主要場景的模型服務，統一由中臺推理架構承載。隨著小紅書業務的不斷發展，推廣搜等場景的模型規模也在不斷增大。以主推薦場景精排的主模型為例，從 2020 年初開始，算法推出了全興趣建模，用戶歷史行為記錄長度均值擴大了約 100 倍。模型結構也從最初的 muti-task 經過多輪迭代，模型結構復雜度也不斷提升，這些變化導致模型推理的浮點運算數增加了 30 倍，模型訪存增加了約 5 倍。

圖片

2.模型服務架構概覽

模型特點：以小紅書 2022 年底的推薦主模型為例，該模型具有充分的稀疏性，部分結構由連續值特征和矩陣運算構成，也存在大規模的稀疏參數比如 < 筆記id * 用戶城市 >，單個模型的 sparse 特征多達 1TB，但通過比較有效的模型結構優化，dense 部分控制在 10GB 以內，可放在顯存中。用戶每刷一次小紅書，計算的總 FLOPs 達到了 40B，超時的控制在 300ms 以內 ( 除去特征處理，帶 lookup ) 。

推理框架：在 2020 年之前，小紅書采用 TensorFlow Serving 框架作為在線服務框架，2020 年后，逐漸迭代成基于 TensorFlowCore 自研的 Lambda Service 服務。TensorFlow Serving 在進圖之前進行一次內存拷貝 TensorProto -> CTensor，以確保模型推理的正確性和可靠性。然而，隨著業務規模的擴大，內存拷貝操作會對模型性能產生影響。小紅書自研框架通過優化免去一次不必要的拷貝，同時保留 Runtime、圖調度能力、優化能力可插拔的特點，并為后期 TRT、BLADE、TVM 等不同優化框架的配合使用奠定了基礎?，F在看來，在合適的時候選擇自研是一個明智的選擇，同時為了最大化減少數據傳輸帶來的成本，推理框架還承擔了一部分特征抽取和轉化的實現，這里小紅書還在預估服務近側部署自研的邊緣存儲，解決了遠端拉取數據的成本問題。

機型特性：小紅書沒有自建機房，所有機器采購自云廠商，因此，選擇不同機型的決策很大程度上取決于能夠采購到什么型號的機器。而模型推理的計算并不是純粹的 GPU 計算，合理找到硬件配比，除考慮 GPU\CPU 外，還涉及帶寬、內存帶寬、跨 numa 通信延遲等問題。

圖片

GPU 特性

GPU 特性：在這里，小紅書和其它公司遇到的問題是一樣的，GPU kernel 的執行可以分為以下幾個階段：數據傳輸、kernel 啟動、kernel 計算和結果傳輸。其中，數據傳輸是將數據從主機內存傳輸到GPU內存；kernel 啟動是將 kernel 代碼從主機端傳輸到 GPU 端，并在 GPU 上啟動 kernel；kernel 計算是實際執行 kernel 代碼計算結果；結果傳輸是將計算結果從 GPU 內存傳輸回主機內存。如果大量時間都花費在數據傳輸和 kernel 啟動上，而交付給 kernel 計算的活不重，實際計算時間很短，則會導致 GPU 的利用率無法提升，甚至出現空跑的情況。

圖片

預估服務框架

3.GPU優化實踐

3.1 系統優化

3.1.1 物理機

在物理機優化方面，可以采用一些常規的優化思路，主要目的是降低除 GPU 以外的其它系統開銷成本，降低虛擬化的中間商賺差價。一般來說，一套系統優化可以提升 1%-2% 的性能，從我們實踐來看，需要結合云廠商實際能力來進行優化。

● 中斷隔離：將 GPU 的中斷單獨分離出來，避免因為其他設備的中斷而影響 GPU 的計算性能。

● 內核版本升級：提高系統的穩定性和安全性，提高 GPU 驅動程序的兼容性和性能。

● 指令透傳：將 GPU 的指令直接透傳到物理設備上，加速 GPU 的計算速度。

3.1.2 虛擬化和容器

在多卡情況下，將單個 pod 綁定到特定的 NUMA 節點上，從而提高 CPU 和 GPU 之間的數據傳輸速度。

● CPU NUMA Affinity，親和性是指從 CPU 角度來看，哪些內存訪問更快，延遲更低。如前所述，與該 CPU 直接相連的本地內存是更快的。因此，操作系統可以根據任務所在 CPU 來分配本地內存，以提高訪問速度和性能，這就是基于 CPU NUMA Affinity 的考慮，盡量讓任務運行在本地的 NUMA Node 里。在小紅書場景里，CPU 上面的訪存開銷并不小。能夠讓 CPU 直連本地內存可以節約大量的 CPU 上 kernel 執行的耗時，從而給 GPU 留足夠的空間。

● 將 CPU 使用率控制在 70% 下，可以將延遲由 200ms -> 150ms。

3.1.3 鏡像

編譯優化。不同 CPU 對指令級的支持能力是有差異的，不同云廠商采買的機型也有所不同。一個比較簡單的思路是在不同的硬件場景下，編譯鏡像時帶上不同的指令集合。在實現算子時，大量的算子本身已經帶有如 AVX512 等指令。以阿里云的 Intel(R) Xeon(R) Platinum 8163 + 2 A10 的機型為例，我們根據該機型的特點和支持的指令集，編譯優化調整合適的指令集，整體相比于不進行指令優化的情況下，在該機型上的 CPU 吞吐量提高了 10% 。

# Intel(R) Xeon(R) Platinum 8163 for ali intel
build:intel --copt=-march=skylake-avx512 --copt=-mmmx --copt=-mno-3dnow --copt=-msse
build:intel --copt=-msse2 --copt=-msse3 --copt=-mssse3 --copt=-mno-sse4a --copt=-mcx16
build:intel --copt=-msahf --copt=-mmovbe --copt=-maes --copt=-mno-sha --copt=-mpclmul
build:intel --copt=-mpopcnt --copt=-mabm --copt=-mno-lwp --copt=-mfma --copt=-mno-fma4
build:intel --copt=-mno-xop --copt=-mbmi --copt=-mno-sgx --copt=-mbmi2 --copt=-mno-pconfig
build:intel --copt=-mno-wbnoinvd --copt=-mno-tbm --copt=-mavx --copt=-mavx2 --copt=-msse4.2
build:intel --copt=-msse4.1 --copt=-mlzcnt --copt=-mrtm --copt=-mhle --copt=-mrdrnd --copt=-mf16c
build:intel --copt=-mfsgsbase --copt=-mrdseed --copt=-mprfchw --copt=-madx --copt=-mfxsr
build:intel --copt=-mxsave --copt=-mxsaveopt --copt=-mavx512f --copt=-mno-avx512er
build:intel --copt=-mavx512cd --copt=-mno-avx512pf --copt=-mno-prefetchwt1
build:intel --copt=-mno-clflushopt --copt=-mxsavec --copt=-mxsaves
build:intel --copt=-mavx512dq --copt=-mavx512bw --copt=-mavx512vl --copt=-mno-avx512ifma
build:intel --copt=-mno-avx512vbmi --copt=-mno-avx5124fmaps --copt=-mno-avx5124vnniw
build:intel --copt=-mno-clwb --copt=-mno-mwaitx --copt=-mno-clzero --copt=-mno-pku
build:intel --copt=-mno-rdpid --copt=-mno-gfni --copt=-mno-shstk --copt=-mno-avx512vbmi2
build:intel --copt=-mavx512vnni --copt=-mno-vaes --copt=-mno-vpclmulqdq --copt=-mno-avx512bitalg
build:intel --copt=-mno-movdiri --copt=-mno-movdir64b --copt=-mtune=skylake-avx512

3.2 計算優化

3.2.1 充分使用算力

● 計算優化，首先需要充分了解硬件性能，將其吃透。在小紅書的場景中，如下圖所示，我們遇到了兩個核心問題：

1. CPU 上的訪存較多，內存 page fault 頻率較高，導致 CPU 資源浪費，以及請求 latency 過高

2. 在線推理服務中，計算通常具有兩個特點：單次請求的 batch size 小，單個服務的并發規模大。小 batch size 會導致 kernel 無法充分利用 GPU 的計算能力。GPU kernel 執行時間一般較短，無法充分掩蓋 kernel launch 的開銷，甚至 kernel launch 的時間比 kernel 執行時間還長。在 TensorFlow 中，單個 Cuda Stream launch kernel 成為瓶頸，導致推理場景下 GPU 利用率只有 50% 。此外，對于小模型場景（簡單的 dense 網絡），用 GPU 替換 CPU 完全不劃算，限制了模型的復雜度。

圖片

● 為解決上述兩個問題，我們采取了以下措施：

1. 針對內存 page fault 頻率高的問題，我們使用 jemalloc 庫來優化內存回收機制，并開啟了操作系統的透明大頁功能。此外，針對 lambda 特殊的內存訪問特點，我們設計專門的數據結構，并優化內存分配策略，盡可能地避免內存碎片。與此同時，我們直接繞開了 tf_serving 的接口，直接調用 TensorFlow，減少了一次數據的序列化與反序列化。這些優化在首頁精排和內流精排場景下，提升了 10+% 的吞吐，在廣告大多數場景下，降低了 50% 的 latency。

圖片

兼容 tensorflow::Tensor 格式，在將特征傳遞給 tensorflow::SessionRun 之前是零拷貝

2. 針對 TensorFlow 單 Cuda Stream 的問題，我們支持了 Multi Streams , Multi Contexts 的功能，避免了互斥鎖導致的性能瓶頸，成功將 GPU 利用率提升到 90+% 。同時，我們利用 Nvidia 提供的 Cuda MPS 功能，實現了 GPU 的空分復用 (同一時間支持多個 kernel 執行)，使得 GPU 的利用率進一步提升?；诖耍琒earch 的排序模型成功在 GPU 上實現。此外，我們也在其他業務線上成功落地，包括首頁初排、廣告等等。下表是在搜索排場景下的一個優化情況。

圖片

3. Op/Kernel fusion 技術：通過手寫或者圖編譯優化工具生成性能更高的 Tensorflow 算子，充分利用 CPU 的 Cache 以及 GPU 的 Shared Memory，提升系統的吞吐。

圖片

在內流場景下，算子進行融合，可以看到單次調用 12ms -> 5ms

3.2.2 避免算力浪費

1. 系統鏈路上存在優化空間

a. 初排前置計算：在處理用戶側相關計算時，初排需要計算大量筆記，例如以外流為例，需要計算約 5000 篇筆記，lambda 對其有切片處理。為避免重復計算，將初排的用戶側計算前置到和召回階段并行，從而使得用戶向量的計算從多次重復變成了只需要 1 次，在粗排場景下優化了 40% 機器。

2. 圖內訓練到推理過程中：

a. 計算前置：通過 graph freeze 可以將一部分計算提前處理。在推理時，不需要重復計算。

b. 產出模型 freeze 優化：模型產出時把所有的參數和圖本身一起生成凍結圖（ frozen graph ）并進行預處理計算，可以將很多預計算的 Variable 算子轉換成 Const 算子（ GPU 使用率下降 12% ）

c. 推理場景下的合并計算：每個 batch 只包含一個 user ，即用戶側存在大量重復計算，具備合并的可能性

d. CPU/GPU 算子拆分：將 lookup 之后的全部算子移至 GPU ，避免了 CPU 和 GPU 之間的數據拷貝

e. GPU 到 CPU 數據拷貝：將數據打包一次拷貝???????

f. BilinearNet 算子 GPU cuda 實現：通過 GPU 加速計算，提升性能???????

g. 部分算子 GPU 化：省去 CPU -> GPU 拷貝???????

h. BatchNorm & MLP 合并：通過實現新的 MLP 層，根據一個目標減少進 GPU 的次數（ N -> 1)，增大一次計算的計算量（重復利用 GPU 小核心的并發能力)???????

圖片

3.2.3 全天動態算力

● 動態計算降級提升全天資源使用效率，秒級別的對 lambda 負載進行自動負反饋調整，做到對單區壓測之前不需要人工做降級準備。

● 在外流精排、外流初排、內流精排、內流初排、搜索等主要業務場景均已經上線。

● 在多個業務線解決了容量問題，有效緩解了業務增長導致的資源線性上升，同時大幅提升了系統的魯棒性。在功能上線后的業務線中，均沒有出現因為瞬間成功率大幅下降導致的 P3 及以上事故。

● 大幅提升全天資源使用效率，以內流精排為例（如下圖所示），五一假期三天的 10:00-24:00 的 CPU 使用核數均保持 50 核的一條平線（抖動對應發版）

圖片

3.2.4 換更好的硬件

● A10 GPU 的性能是 T4 GPU 性能的 1.5 倍，同時 A10 機型配備的 CPU ( icelake, 10nm ) 比 T4 機型 ( skylake, 14nm ) 更新一代，價格僅為 T4 機型的 1.2 倍。未來我們還會考慮在線使用 A30 等機型。

3.3 圖優化

圖片

3.3.1 DL 棧的自動編譯優

● BladeDISC 是阿里最新開源的基于 MLIR 的動態 shape 深度學習編譯器，小紅書的自動圖優化部分來自于這套框架（ Blade 推理加速庫是 Apache 2.0 開源，可以跨任何云使用，無知識產權風險）。該框架提供了 TF 圖編譯優化（包含 Dynamic Shape Compiler ，稀疏子圖優化），同時能疊加我們本身做的算子定制化優化，可以較好的適配我們的業務場景。在壓測單機 inference 中，QPS 能提升 20% 。

● 這套框架關鍵技術

（1） MLIR 基礎架構

MLIR，即多層次中間表示語言（Multi-Level Intermediate Representation），是由 Google 發起的開源項目。其目的是提供一個靈活、可擴展的多層 IR 基礎設施和編譯器實用工具庫，為編譯器和語言工具的開發者提供一個統一的框架。

MLIR 的設計受到 LLVM 的影響，但與 LLVM 不同的是，MLIR 主要關注于中間表示（ IR ）的設計和擴展。MLIR 提供了一個多層次的 IR 設計，可以支持從高層語言到底層硬件的編譯過程，并提供了豐富的基礎設施支持和模塊化設計架構，使得開發者可以很方便地擴展 MLIR 的功能。此外，MLIR 還具有較強的膠水能力，可以與不同的編程語言和工具進行集成。MLIR 是一個強大的編譯器基礎設施和工具庫，為編譯器和語言工具的開發者提供了一種統一的、靈活的中間表示語言，可以方便地進行編譯優化和代碼生成。

（2）動態 shape 編譯

靜態 shape 的限制意味著在編寫深度學習模型時需要提前確定每個輸入和輸出的形狀，并且不能在運行時改變它們。這限制了深度學習模型的靈活性和可擴展性，因此需要一種支持動態 shape 的深度學習編譯器。

3.3.2 精度調整

● 量化的實現方式之一是使用 FP16

FP16 計算優化：在 MLP 層時用 FP16 替換 FP32 計算，能夠較大地減少 GPU 使用率(相對下降 13% )

在調整 FP16 的過程中，選擇白盒方式進行精度優化意味著可以更加精細地控制哪些層使用低精度計算，并能夠根據經驗進行不斷調整和優化。這種方式需要對模型結構有較為深入的了解和分析，可以根據模型的特性和計算要求進行有針對性的調整，以達到更高的性價比。

相比之下，黑盒方式則相對簡單，不需要了解模型的內部結構，只需要設置一定的容忍閾值即可完成精度優化。這種方式的優點是操作簡單，對模型同學的要求也相對較低，但是可能會犧牲一定的性能和精度。

因此，選擇白盒還是黑盒方式進行精度優化需要根據具體情況而定。如果需要追求更高的性能和精度，同時擁有足夠的經驗和技術能力，那么白盒方式可能更加適合。如果操作簡單、快速迭代更加重要，那么黑盒方式可能更加實用。

4.總結

從 2021 年開始到 2022 年底，經過本項目優化，小紅書推理計算算力增加 30 倍，關鍵用戶指標提升 10%+ ，同時累積節約集群資源 50%+ 。在我們看來，小紅書在 AI 技術方面的發展路徑應該是以業務需求為導向，平衡技術和商業的發展：實現技術創新的同時，也要考慮成本、效益和可持續性。以下是一些優化過程中的思考：

優化算法和提高系統性能。這是小紅書機器學習團隊的核心任務。優化算法和提高系統性可以更好地支持業務需求，提高用戶體驗。然而，在資源有限的情況下，團隊需要明確優化的重點，避免過度優化。

構建基礎設施和提高數據處理能力。基礎設施對于支持 AI 應用是非常關鍵的。小紅書可以考慮進一步投入基礎設施的建設，包括計算和存儲能力、數據中心和網絡架構等。此外，提高數據處理能力也是非常重要的，可以更好地支持機器學習和數據科學應用。

提高團隊人才密度和組織架構。一個優秀的機器學習團隊需要擁有具有不同技能和背景的人才，包括數據科學家、算法工程師、軟件工程師等；優化組織架構也有助于提高團隊效率和創新能力。

合作共贏和開放創新。小紅書持續與其他公司、學術機構和開源社區合作，共同推進 AI 技術的發展，這有助于小紅書獲取更多資源和知識，成為更加開放和創新的組織。

該方案讓小紅書機器學習架構水平達到了業界一流水平。未來，我們將不斷推進引擎升級和降本增效，引入新技術提高小紅書機器學習的生產力，將更加結合小紅書的實際業務場景，從單模塊的優化升級為全系統優化，并進一步引入業務側流量的個性化差異特征，將降本增效做到極致。期待有志之士，一同加入我們！

5.團隊

張楚嵐（杜澤宇）：商業技術部

畢業于華東師范大學，商業化引擎團隊負責人，主要負責商業化在線服務搭建。

陸光（彭鵬）：智能分發部

畢業于上海交通大學，機器學習引擎工程師，主要負責 Lambda GPU 優化。

伊恩（陳建新）：智能分發部

畢業于北京郵電大學，機器學習引擎工程師，主要負責 Lambda 參數服務器和 GPU 優化。

赤羽（劉兆宇）：智能分發部

畢業于清華大學，機器學習引擎工程師，主要負責特征引擎方向的相關研究和探索。

特別感謝：智能分發部所有同學

責任編輯：龐桂玉來源：小紅書技術REDtech

GPU 機器學習

51CTO技術棧公眾號

業務
速覽

媒體

51CTO CIOAge HC3i

社區

51CTO博客鴻蒙開發者社區 AI.x社區

教育

51CTO學堂精培企業培訓 CTO訓練營

国产视频不卡在线| 波多野结衣在线一区| 又骚又黄的视频| 国产精品嫩草影院8vv8| 在线观看中文字幕码| 一本一本久久a久久综合精品| 在线观看91精品国产麻豆| 最近免费观看高清韩国日本大全| 中日韩av在线播放| 婷婷伊人综合中文字幕| 日韩国产高清在线| 欧美激情视频在线观看| 精品无码国产一区二区三区51安| 中老年在线免费视频| 亚洲国产精品激情在线观看| 亚洲一区免费网站| 午夜精品一区二区三区av| 阿v天堂2018| 亚洲欧美激情另类| 蜜桃久久av一区| 欧美成人午夜激情在线| 精品人妻无码一区二区三区换脸| 日韩精品视频在线看| 亚洲444eee在线观看| 成人爽a毛片免费啪啪红桃视频| 黄色一级片在线免费观看| 欧美在线一级片| 国产在线你懂得| 另类人妖一区二区av| 国内成人精品视频| 欧美精品v日韩精品v韩国精品v| 91高清视频免费| 久久国产波多野结衣| 一区二区小说| 亚洲国产福利在线| 色哟哟在线观看视频| 国产精品66| 色视频成人在线观看免| 国产一级做a爰片久久毛片男| 777电影在线观看| 久久色在线观看| 国产一区二区三区黄| 国产乱淫a∨片免费视频| 琪琪一区二区三区| 国产精品国产福利国产秒拍| 日本在线播放视频| 擼擼色在线看观看免费| 中文字幕人妻一区二区| 成人福利视频网| 亚洲欧洲美洲综合色网| 欧美一二三区在线| 99热手机在线| 在线免费三级电影网站| 午夜精品一区二区三区电影天堂| 欧美一级特黄aaaaaa在线看片| a天堂中文在线88| 国产日韩亚洲欧美综合| 日本不卡一区| bbbbbbbbbbb在线视频| 欧美激情综合在线| 日本一区视频在线| av网站在线免费观看| 亚洲国产成人午夜在线一区| 四虎永久国产精品| 免费人成在线观看播放视频| 综合亚洲深深色噜噜狠狠网站| 亚洲图色在线| av网站在线免费看推荐| 亚洲黄网站在线观看| 嫩草影院中文字幕| 黄视频免费在线看| 色综合天天狠狠| 亚洲国产精品毛片av不卡在线| 欧美成人精品三级网站| 欧美亚洲一区二区在线观看| 97超碰成人在线| 亚洲国产综合在线观看| 日韩亚洲欧美高清| 少妇一级淫免费观看| 香蕉一区二区| 最近2019中文字幕第三页视频| 国产第一页精品| 欧美国产91| 2020国产精品视频| 中文字幕视频一区二区| 国产精品亚洲一区二区三区妖精 | 91麻豆精品国产自产在线 | 青青草视频在线免费观看| 99视频在线精品| 欧美三日本三级少妇三99| 91短视频版在线观看www免费| 亚洲美女一区二区三区| 怡红院av亚洲一区二区三区h| 精品123区| 日韩一区二区麻豆国产| 中文字幕丰满乱子伦无码专区| 日韩理论电影| 国内揄拍国内精品| 夜夜嗨aⅴ一区二区三区| 成人动漫中文字幕| 亚洲春色在线视频| av手机在线观看| 欧美性淫爽ww久久久久无| 无码国产精品一区二区高潮| 奇米狠狠一区二区三区| 九九九久久久久久| 懂色av蜜臀av粉嫩av喷吹| 成人少妇影院yyyy| 四虎永久国产精品| 黄色18在线观看| 欧美高清dvd| 男人天堂av电影| 国产精品v欧美精品v日本精品动漫| 国产成人久久久| 丰满人妻妇伦又伦精品国产| 国产精品国产三级国产a| 欧美不卡在线播放| 欧洲精品99毛片免费高清观看| 亚洲亚裔videos黑人hd| 日韩毛片在线播放| 国产寡妇亲子伦一区二区| 亚洲日本精品| 美女福利一区二区| 亚洲精品国产精品乱码不99按摩| 天天看片中文字幕| 另类人妖一区二区av| 日本在线成人一区二区| 国产夫妻在线| 亚洲成色777777女色窝| 亚洲精品卡一卡二| 久久精品二区亚洲w码| 欧美一区二区综合| 涩涩视频在线免费看| 精品国产乱码久久久久久牛牛| 成人免费精品动漫网站| 久久精品噜噜噜成人av农村| 日本亚洲自拍| 欧美极品免费| 亚洲欧洲日产国码av系列天堂| 日韩欧美亚洲一区二区三区| 欧美人成在线观看ccc36| 亚洲成人免费在线视频| 国产亚洲第一页| 国产精品99久久不卡二区| 久久影院理伦片| 校园春色亚洲| 亚洲码在线观看| 久久午夜免费视频| av午夜一区麻豆| 亚洲自拍另类小说综合图区| 中文久久电影小说| 久久久久久一区二区三区 | 美女的胸无遮挡在线观看| 日韩av二区在线播放| 欧美lavv| 婷婷激情一区| 一区二区三区欧美日韩| 亚洲黄色av片| 久久精品亚洲欧美日韩精品中文字幕| 国产精品久久久久久久久久久久久久 | 怡红院精品视频在线观看极品| 欧美日本高清视频| 六月丁香色婷婷| 97久久超碰国产精品电影| 精品无人区一区二区三区| av小说在线播放| 日韩欧美国产激情| 成人激情五月天| 麻豆一区二区三| 98国产高清一区| 免费黄色电影在线观看| 欧美三级日韩在线| 亚洲最大的黄色网| 女同性一区二区三区人了人一| av在线不卡观看| 日本乱码一区二区三区不卡| 亚洲欧美在线第一页| 在线播放亚洲精品| 日本一区二区在线看| 日韩一级高清毛片| 久久久久久激情| 99久久精品国产一区二区三区| 成人一级片网站| 99精品综合| 亚洲一区二区中文字幕| 亚洲资源一区| 欧美日韩国产免费| 国产精品老熟女一区二区| 不卡的av在线| 污污动漫在线观看| 亚洲国产二区| 精品欧美日韩在线| 欧美成人精品三级网站| 欧美日韩成人精品| 国产三级在线免费观看| 欧美性生交片4| 蜜桃av.com| 国语精品一区| 免费一区二区三区在在线视频| 九九九伊在线综合永久| 91精品国产黑色紧身裤美女| 日韩精品视频播放| 最新热久久免费视频| 久久久精品人妻无码专区| 综合在线视频| 日韩欧美手机在线| 国产一级成人av| 成人黄色av网站| 日韩pacopacomama| 久久久久久久成人| 日韩免费成人av| 成人激情久久| 九九热这里只有精品6| 激情综合闲人网| 欧美变态凌虐bdsm| 日本天堂网在线观看| 国产77777| 一本一道波多野毛片中文在线| 天堂99x99es久久精品免费| 亚洲精品在线不卡| 日韩女优在线观看| 亚洲免费毛片网站| 日韩黄色中文字幕| 久久你懂得1024| 亚洲av成人精品一区二区三区| 日日嗨av一区二区三区四区| 国产91在线播放精品91| 国产理论在线| 久久男人的天堂| 污影院在线观看| 亚洲精品一区av在线播放| 亚洲国产精品人久久电影| 444亚洲人体| 国产一二三区在线观看| 国产亚洲xxx| 欧美一区二区少妇| 亚洲视频久久久| 国产视频三区四区| 欧美一级大片| 在线观看久久久久久| 天天操天天射天天| 欧美va在线播放| 中文字幕免费观看视频| 久久久国产亚洲精品| 精品精品国产国产自在线| 天天综合网入口| 国产精品护士白丝一区av| 亚洲欧美激情一区二区三区| 日韩一区欧美| 亚洲国产另类久久久精品极度| 国产精品蜜月aⅴ在线| 国产精品香蕉在线观看| 日韩精品第二页| 国产日韩在线视频| 色综合视频一区二区三区44| 成人免费黄色网| 国产一区二区三区免费观看在线 | 亚洲天堂成人在线| 精品视频一二区| 中文国产成人精品久久一| 一级毛片视频在线| 久久福利视频导航| 久草在线视频资源| 8x海外华人永久免费日韩内陆视频| 老司机深夜福利在线观看| 日韩免费在线播放| a屁视频一区二区三区四区| 成人性生交xxxxx网站| 蜜桃精品一区二区三区| 国产在线精品一区二区三区》 | 日韩在线免费| 成人免费看吃奶视频网站| 九九99久久精品在免费线bt| 成人免费在线看片| 蜜桃精品wwwmitaows| 亚洲精品第一区二区三区| 一二三区不卡| 久久久一本二本三本| 日韩av不卡在线观看| 人人爽人人爽av| 99久久99久久免费精品蜜臀| 微拍福利一区二区| 一区二区三区精品久久久| 亚洲欧美成人| 51精品秘密在线观看| 三级网站在线看| 中文字幕最新精品| 成年女人在线看片| 国产欧美在线视频| 精品久久对白| 亚洲综合自拍一区| 欧美日韩人妻精品一区在线| 激情开心成人网| 国产精品尤物福利片在线观看| 精品精品视频| 蜜桃在线一区二区三区精品| 99久久精品费精品国产风间由美| 日韩极品视频在线观看| 日本人妖一区二区| 欧美肉大捧一进一出免费视频 | 久久久久在线观看| www.涩涩涩| 美女露胸视频在线观看| 欧美孕妇毛茸茸xxxx| www.欧美视频| 欧美高清视频一区| 亚洲视频久久| 色噜噜狠狠一区二区| 91麻豆国产精品久久| 极品颜值美女露脸啪啪| 欧美在线短视频| 婷婷色在线观看| 婷婷久久综合九色综合绿巨人| 97在线观看免费高| 色菇凉天天综合网| 欧美特黄一级视频| 久久国产精彩视频| 粉嫩91精品久久久久久久99蜜桃| 国产一区二区高清不卡| 欧美精选一区| www.污网站| 国产精品女人毛片| 黄色在线视频网址| 亚洲精品电影网| 少女频道在线观看免费播放电视剧| 国产精品欧美一区二区| 妖精视频一区二区三区免费观看| 国产www免费| 懂色一区二区三区免费观看| av最新在线观看| 欧美日韩午夜在线视频| 黄色av免费在线看| 青青a在线精品免费观看| 欧美人妖在线观看| 国产真人做爰毛片视频直播| 国产成人av电影在线| 日韩一级片av| 日韩视频一区二区| 91高清在线观看视频| 亚洲一区二区三区成人在线视频精品| 日韩欧美午夜| 97人人爽人人| 亚洲色图欧美激情| 999精品国产| 欧美精品中文字幕一区| 亚洲高清在线一区| 欧美狂野激情性xxxx在线观| 国产一区二区三区香蕉| 国产精品wwww| 久久久久久成人网| 国产精品免费看片| 最好看的日本字幕mv视频大全| 亚洲欧美在线磁力| 中文字幕系列一区| 亚洲天堂电影网| 国产一区二区久久| 国产亚洲精品码| 亚洲精品福利视频| 三级成人在线| 一区二区三区四区欧美| 韩国一区二区三区| 一区中文字幕在线观看| 日韩精品亚洲一区二区三区免费| 国产免费无遮挡吸奶头视频| 精品1区2区3区| av网站网址在线观看| 国产高清自拍一区| 一本色道久久综合亚洲精品不| 中文字幕高清视频| 欧美卡1卡2卡| 污视频在线免费观看网站| 精品欧美国产| 免费人成在线不卡| 日本天堂中文字幕| 日韩成人在线播放| 国产精品伦一区二区| 国产激情在线看| 91网站黄www| 亚洲中文一区二区三区| 久久久久久69| 国内爆初菊对白视频| 91av在线看| 日韩国产一区二区| 91超薄肉色丝袜交足高跟凉鞋| 粉嫩老牛aⅴ一区二区三区| 污污网站在线免费观看| 国产精品网址在线| 亚洲小说欧美另类社区| 国产人妻大战黑人20p| 日韩三级在线免费观看| 性欧美又大又长又硬| 正在播放亚洲| 国产一区二区观看| 97精品国产97久久久久久| 一区二区在线免费播放| 成年人在线看片| 亚洲精品第1页| 大地资源中文在线观看免费版| 91手机视频在线观看| 国产亚洲一级|