精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

LLM運行框架對比:ollama與vllm淺析

原創 精選
人工智能
大模型運行框架的采用是項目獨特需求和約束最密切相關的選擇。在某些情況下,甚至可以同時使用: 用于快速成型和初始開發的Ollama ,以及用于擴展和優化生產環境的 vLLM。

開源的LLM已經成為程序員、愛好者和希望在日常工作中使用生成式AI并保持隱私的用戶的最佳選擇,對于企業的私有化部署而言也是如此。這些模型提供了優秀的性能,有時在許多任務中可以與大型的閉源模型 (如 GPT-4o 或 Claude Sonnet 3.5) 相媲美。

這些LLM是開源的,但并不意味著它們可以開箱即用,需要一個運行框架在本地或服務器上運行大模型以獲得特定的用例。另外,兼容 OpenAI 的服務器已經成為部署任何模型的最流行方式,因為這些API 允許我們在幾乎任何 SDK 或客戶端上使用 LLM服務能力,如 OpenAI SDK,Transformers,LangChain 等等。

那么,部署LLM以兼容 OpenAI 的最佳運行框架是什么呢?這里嘗試分析 Ollama 和 vLLM,這兩個流行的運行框架都可以用于部署具有兼容 OpenAI API 的模型。我們可以從性能、易用性、定制和其他方面對二者進行比較。

1. Ollama

Ollama 是一個強大的運行框架,旨在使運行LLM盡可能簡單。Ollama 簡化了在本地機器或服務器上下載、運行和管理大型語言模型的整個過程。

使用 Ollama 很簡單,可以在不同的平臺上完成安裝:

curl -fsSL https://ollama.com/install.sh | sh (Linux)
brew install ollama (macOS)

Ollama 提供了一個現成的模型運行環境,可以用一行命令運行大模型服務: Ollama run <anymodel> 。這一命令將輕松地運行終端中 Ollama 模型存儲庫中列出的任何模型。例如:

ollama run qwen2.5:14b --verbose

添加了--verbose這一標志,這樣就可以看到每秒的token 吞吐量(token/sec)。

1.1 Ollama 的參數

如果需要創建具有特定參數的私有模型,我們需要創建一個 Modelfile,這是一個單獨的純文本文件,其中包含了需要設置的參數。

FROM qwen2.5:14b

PARAMETER temperature 0.5

# 上下文大小
PARAMETER num_ctx 8192

# tokens最大為4096 
PARAMETER num_predict 4096

# 系統的提示詞配置
SYSTEM """You are a helpful AI assistant."""

我們可以構建并運行該定制的模型:

# 構建模型
ollama create mymodel -f Modelfile

# 運行
ollama run mymodel --verbose

Ollama 提供了兩種與模型交互的方式:

  • 原生的REST API: Ollama 默認在端口 11434 上運行一個本地服務器,我們可以使用標準的 HTTP 請求與它交互:
import requests

response = requests.post('http://<my_ollama_server_ip>:11434/api/chat', 
    jsnotallow={
        'model': 'qwen2.5:14b',
        'messages': [
            {
                'role': 'system',
                'content': 'You are a helpful AI assistant.'
            },
            {
                'role': 'user',
                'content': 'What is AI Agent?'
            }
        ],
        'stream': False
    }
)
print(response.json()['message']['content'])

  • 為了實現與現有應用程序的無縫集成,Ollama 提供了 OpenAI API 兼容性,可以與 OpenAI Python SDK 一起使用:
from openai import OpenAI

client = OpenAI(
    base_url="http://<my_ollama_server_ip>:11434/v1",
    api_key="Abel" # 可設成任意字符串
)

response = client.chat.completions.create(
    model="qwen2.5:14b",
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "What is AI Agent?"}
        ]
)
print(response.choices[0].message.content)

1.2 Ollama API 的功能特性

Ollama的API具有許多基本功能,使其成為開發人員的重要選擇之一,其主要功能如下:

  • 流支持:實時token生成,完全兼容OpenAI API,非常適合創建響應式應用程序。
  • 多模型管理: 能夠同時運行不同的模型,但有一個警告。 當 VRAM 有限時,Ollama 將停止一個模型來運行另一個模型,這需要仔細的資源規劃。
  • 參數控制: 通過 API 調用進行高度可定制的設置,它提供了很大的靈活性,但對于初學者和生產環境的服務器來說并不友好。
  • CPU 兼容性: 當 VRAM 不足時,智能資源管理可以自動將模型卸載到 CPU執行,使得在 GPU 內存有限的系統上也可以運行大模型服務。
  • 語言無關性: 可以自由使用Python、 JavaScript、 Go等編程語言,以及其他任何具有 HTTP 功能的編程語言。

2. vLLM

vLLM 是一個為 LLM 推理設計的高性能框架,側重于效率和可伸縮性。它基于 PyTorch,它利用 CUDA 加速 GPU,并實現先進的優化技術,如連續批處理和有效的內存管理以及張量并行性,使其特別適合生產環境和高吞吐量場景。

vLLM 并不像使用 Ollama 那樣簡單,最佳方可能是使用 Docker 進行安裝。Docker 提供了一致的環境,使得跨系統部署更加簡單。使用Dock來執行vLLM的先決條件如下:

  • 系統上安裝了 Docker。
  • NVIDIA 容器工具包 (支持 GPU)。
  • 至少 16GB 內存 (推薦)。
  • 為目標模型配置 NV的GPU與足夠的 VRAM。

2.1 GGUF (GPT-Generated Unified Format)

GGUF 被許多人認為是 GGML 的繼承者,它是一種量化方法,能夠混合 CPU-GPU 執行大型語言模型,優化內存使用和推理速度。它是Ollama支持的模型運行的唯一格式。該格式在 CPU 架構和 Apple Silicon 上特別有效,支持各種量化級別 (從 4 位到 8 位) ,同時保持模型質量。

雖然 vLLM 目前僅提供了有限的 GGUF 支持,重點放在本地 GPU 優化,但是理解這種格式對于大模型運行框架的比較分析非常重要。

2.2 Docker 部署與運行

我們繼續部署 Qwen 2.5-14B 作為參考模型,下載模型可能需要一點時間,取決于當前的互聯網連接速度:

mkdir models/
mkdir models/Qwen2.5-14B-Instruct/

# 下載一個4bit 量化模型
wget -P models/Qwen2.5-14B-Instruct/ https://huggingface.co/lmstudio-community/Qwen2.5-14B-Instruct-GGUF/resolve/main/Qwen2.5-14B-Instruct-Q4_K_M.gguf

我們還需要設置 generation_ config.son 文件, 為了測試方便,這里設置temperature = 0。

{
  "bos_token_id": 151643,
  "pad_token_id": 151643,
  "do_sample": true,
  "eos_token_id": [
    151645,
    151643
  ],
  "repetition_penalty": 1.05,
  "temperature": 0.0,
  "top_p": 0.8,
  "top_k": 20,
  "transformers_version": "4.37.0"
}

因此,需要創建一個文件夾,其中包含這個 JSON 文件,并確保它的名稱為 generation_ config. json。然后,使用多個參數運行 docker 容器:

# 需要GPU支持
docker run -it \
    --runtime nvidia \
    --gpus all \
    --network="host" \
    --ipc=host \
    -v ./models:/vllm-workspace/models \
    -v ./config:/vllm-workspace/config \
    vllm/vllm-openai:latest \
    --model models/Qwen2.5-14B-Instruct/Qwen2.5-14B-Instruct-Q4_K_M.gguf \
    --tokenizer Qwen/Qwen2.5-14B-Instruct \
    --host "0.0.0.0" \
    --port 5000 \
    --gpu-memory-utilization 1.0 \
    --served-model-name "VLLMQwen2.5-14B" \
    --max-num-batched-tokens 8192 \
    --max-num-seqs 256 \
    --max-model-len 8192 \
    --generation-config config

這些參數的含義如下:

--runtime nvidia --gpus all: 啟用對容器的 NVIDIA GPU 支持。
--network="host": 使用主機網絡模式以獲得更好的性能。
--ipc=host:  允許主機和容器之間共享內存。
- v ./model:/vllm-workspace/model: 將本地模型目錄裝入容器,目錄包含了示例的Qwen2.5–14B模型
--model: 指定 GGUF 模型文件的路徑。
--tokenizer: 定義要使用的 HuggingFace tokenizer。
--gpu-memory-utilization 1: 將 GPU 內存使用率設置為 100% 。
--served-model-name: 通過 API 提供服務時模型的自定義名稱,可以指定所需的名稱。
--max-num-batched-tokens: 批處理中的最大token數量。
--max-num-seqs: 同時處理的序列的最大數目。
--max-model-len: 模型的最大上下文長度。

這些參數可以根據具體的硬件能力和性能要求進行調整。運行此命令后,將顯示大量日志,一旦看到類似如下的輸出,就可以使用它了。

圖片圖片

默認情況下,vLLM的REST API 在端口 8000 上運行本地,可以使用標準的 HTTP 請求與它交互:

import requests

response = requests.post('http://192.168.123.23:5000/v1/chat/completions', 
    jsnotallow={
        'model': 'VLLMQwen2.5-14B',
        'messages': [
            {
                'role': 'system',
                'content': 'You are a helpful AI assistant.'
            },
            {
                'role': 'user',
                'content': 'What is artificial intelligence?'
            }
        ],
        'stream': False
    }
)
print(response.json()['choices'][0]['message']['content'])

為了與現有應用程序無縫集成,vLLM 也提供了 OpenAI API 的兼容性接口。

from openai import OpenAI

client = OpenAI(
    base_url="http://<my_vLLM_server_ip>:5000/v1",
    api_key="Abel" # vLLM 支持API的權限認證,為了測試對比,也設為Abel 
)

response = client.chat.completions.create(
    model="VLLMQwen2.5-14B",
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "What is AI Agent?"}
        ]
)
print(response.choices[0].message.content)

2.3 vLLM API 特性

vLLM 的 API 是為高性能推理和生產環境設計的,主要特性如下:

  • 高效 GPU 優化: 利用 CUDA 和 PyTorch 最大限度地利用 GPU,導致更快的推理速度。
  • 批處理能力: 實現連續批處理和高效的內存管理,從而提高多個并發請求的吞吐量。
  • 安全特性: 內置的 API 密鑰支持和正確的請求驗證,而不是完全跳過身份驗證。
  • 靈活部署: 對 GPU 內存使用和模型參數進行細粒度控制的全面 Docker 支持。

雖然vLLM需要更多的參數和環境設置,但它展示了出色的性能和面向生產環境的特性。

3. Ollama 與 vLLM 的對比

我們更應該使用哪個運行推理框架呢?我們可以從以下幾個維度對比Ollama 與 vLLM :

  • 資源利用和效率
  • 易于部署和維護
  • 特定的用例和推薦
  • 生產環境就緒和安全性
  • 文檔的支持程度

3.1 基準

我們對兩個框架使用相同的硬件和模型:

硬件配置:

  • GPU: NVIDIA RTX 4060 16GB Ti
  • RAM: 64GB 內存
  • CPU: AMD Ryzen 7
  • 儲存: NVMe SSD固態硬盤。

模型:

  • Qwen2.5–14B-Instruct (4-bit 量化)
  • 上下文長度: 8192 令牌。
  • 批量大小: 1 (單用戶情況)。

3.2 模型運行

一個簡單的問題 “生成一個 1000 詞的故事” 的示例。

Ollama的一個請求時間是 25秒左右,且沒有執行并行請求。對于并行請求,用戶必須修改位于 /etc/systemd/system/OLLAMA.service 中的文件 ( 服務器為Ubuntu的操作系統) ,并添加一行 Environment = “OLLAMA _NUM_PARALLEL = 4”,即可以最多執行 4 個并行請求。

[Unit]
Descriptinotallow=Ollama Qwen Service
After=network-online.target

[Service]
ExecStart=/usr/local/bin/ollama serve
User=ollama
Group=ollama
Restart=always
RestartSec=3
Envirnotallow="PATH=/home/abel_cao/.local/bin:/usr/local/cuda/bin/:/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin"
Envirnotallow="OLLAMA_HOST=0.0.0.0:11434"
Envirnotallow="OLLAMA_DEBUG=1"
Envirnotallow="OLLAMA_NUM_PARALLEL=4"
Envirnotallow="OPENAI_BASE_URL=http://0.0.0.0:11434/api"

[Install]
WantedBy=multi-user.target

這就是Ollama的局限性,不是面向生產環境的大模型運行框架。即使當前僅使用了部分內存,Ollama占用了所有需要的內存。即使只是 4 個并行請求,Ollama加載整個神經網絡似乎仍然非常困難,而且沒能找到相關的參考文檔。

Ollama 可以支持的最大上下文數量是多少,以便在GPU中 100% 加載模型呢?嘗試通過設置 PARAMETER num_ ctx 24576 來修改模型文件。盡管 GPU 中幾乎有 2GB 的 VRAM 是空閑的,但仍然使用了 4% 的 CPU。

VLLM 有一個純 GPU 的優化方法,GGUF 量化卻仍然處于實驗階段。經過幾次嘗試,RTX 4060Ti 也支持了 24576 上下文數量。 

import requests
import concurrent.futures

BASE_URL = "http://<my_vLLM_server_ip>:5000/v1"
API_TOKEN = "Abel-1234"
MODEL = "VLLMQwen2.5-14B"

def create_request_body():
    return {
        "model": MODEL,
        "messages": [
            {"role": "user", "content": "生成一個 1000 詞的故事"}
        ]
    }

def make_request(request_body):
    headers = {
        "Authorization": f"Bearer {API_TOKEN}",
        "Content-Type": "application/json"
    }
    response = requests.post(f"{BASE_URL}/chat/completions", jsnotallow=request_body, headers=headers, verify=False)
    return response.json()

def parallel_requests(num_requests):
    request_body = create_request_body()
    with concurrent.futures.ThreadPoolExecutor(max_workers=num_requests) as executor:
            futures = [executor.submit(make_request, request_body) for _ in range(num_requests)]
            results = [future.result() for future in concurrent.futures.as_completed(futures)]
    return results

if __name__ == "__main__":
    num_requests = 50  # 并發輕輕數
    responses = parallel_requests(num_requests)
    for i, response in enumerate(responses):
            print(f"Response {i+1}: {response}")

每秒可以得到超過 100 個token,GPU 利用率達到 100% 。這里設置了并發請求數為50,所以理論上可以并行發送 50個請求!

總體而言, Ollama 和 vLLM 的綜合對比如下:

  • 性能概述: 獲勝者顯然是 vLLM,只有一個請求,也得到了 10% 以上的提升 (Ollama 約25 token/sec vs vLLM 約 29 token/sec)。
  • 資源管理: vLLM 再次獲勝, Ollama 不能并行處理多個請求非常令人失望,由于資源管理效率低下,它甚至不能并行處理 4 個請求。
  • 易于使用和開發:Ollama 更容易使用,一行代碼就可以輕松地與 LLM 進行快速聊天。同時,vLLM 需要一些像 docker 這樣的知識和更多的參數配置。
  • 面向生產環境: vLLM 更適合于生產環境,甚至許多AI服務提供商也在使用這個運行框架作為AI服務的端點。
  • 安全性: vLLM 出于安全目的支持token授權,而 Ollama 不支持。因此,任何人都可以訪問你的Ollama 端點,如果你沒有很好地保護它。
  • 文檔化支撐: 兩個框架采用不同的文檔支撐方式,Ollama 的文檔簡單且對初學者友好,但缺乏技術深度,特別是關于性能和并行處理方面。 GitHub 上的討論經常留下一些關鍵問題沒有得到解答。相比之下,vLLM 提供了包含詳細 API 參考和指南的全面技術文檔,其GitHub 得到了開發人員的良好維護,有助于故障排除和理解,甚至還專門為此建立了一個網站。

所以,如果目標是在本地環境中或甚至在遠程服務器上快速試驗大模型,那么 Ollama 無疑是首選解決方案。它的簡單易用性非常適合快速成型、測試想法,或者面向剛開始使用 LLM 的開發人員,學習曲線非常平滑。

然而,當重點轉移到性能、可伸縮性和資源優化的生產環境時,vLLM 大放異彩。它對并行請求的出色處理、高效的 GPU 利用率和健壯的文檔使其成為在生產環境大規模部署的有力競爭者。該運行框架從可用硬件資源中擠出最大性能的能力尤其令人心動。

圖片圖片

4. 大模型運行框架的其他考量

大模型運行框架的選擇必須取決于我們自己的特定用例,同時考慮以下因素:

  • 項目的規模
  • 團隊的技術專長
  • 應用程序的特定性能要求
  • 開發時間表和資源
  • 是否需要定制和微調
  • 長期的維護和支持方面的考量

從本質上說,盡管 vLLM 可以為生產環境提供卓越的性能和可伸縮性,但是 Ollama 的簡單性對于某些場景可能更具價值,特別是在開發的早期階段或者demo級的項目中。

5. 一句話小結

大模型運行框架的采用是項目獨特需求和約束最密切相關的選擇。在某些情況下,甚至可以同時使用: 用于快速成型和初始開發的Ollama ,以及用于擴展和優化生產環境的 vLLM。這種混合方法可以允許我們在項目生命周期的不同階段利用不同運行框架的優勢。

責任編輯:武曉燕 來源: 喔家ArchiSelf
相關推薦

2025-04-24 10:26:40

2025-04-09 08:20:00

2025-07-31 06:45:00

大模型LLMOpenAI

2024-06-04 12:59:41

2011-04-19 13:26:47

DB(BDB)SQLite

2009-07-24 11:01:12

jQuery框架

2025-01-08 08:00:00

2019-07-10 10:00:42

PHPPython語法

2025-04-29 07:47:27

2024-02-26 07:43:10

大語言模型LLM推理框架

2009-10-23 12:53:25

VB.NET語言

2025-03-27 03:30:00

Web框架組件

2009-09-14 16:46:15

LINQ to XML

2009-07-16 09:14:26

iBATIS DAO

2025-04-09 10:47:02

2009-09-22 13:09:06

Hibernateorm框架

2024-12-02 14:41:00

2024-11-27 08:14:43

2009-07-15 14:21:03

MyEclipse S

2011-07-19 13:26:50

iPhone PhoneGap 框架
點贊
收藏

51CTO技術棧公眾號

亚洲黄色av网址| 日韩久久久久久久久久久久久| 成年人看的免费视频| **欧美日韩在线| 亚洲另类一区二区| 麻豆一区区三区四区产品精品蜜桃| 国产亚洲欧美日韩高清| 91tv精品福利国产在线观看| 精品国产乱码91久久久久久网站| 鲁一鲁一鲁一鲁一澡| aiai在线| 成人av在线资源网站| 日本亚洲欧美成人| 欧美成人精品激情在线视频| 日韩欧美ww| 欧美美女激情18p| 国产精品无码一区二区在线| 色网站在线看| 久久女同性恋中文字幕| 国产在线视频一区| 男人日女人网站| 欧美成人69| 中文字幕在线观看亚洲| 欧洲一级黄色片| 国产成人免费av一区二区午夜| 狠狠色狠色综合曰曰| 超碰在线免费观看97| 美女欧美视频在线观看免费| 国产成人啪午夜精品网站男同| 国产精品嫩草视频| 亚洲国产成人精品激情在线| 亚洲人体av| 在线播放日韩精品| 国产三级国产精品| 嗯用力啊快一点好舒服小柔久久| 欧美日韩国产首页在线观看| caopor在线视频| 老司机深夜福利在线观看| 一区二区三区在线视频免费| 亚洲日本无吗高清不卡| 久久99久久| 99精品视频一区二区| 9a蜜桃久久久久久免费| 国产精品久久免费| 麻豆传媒一区二区三区| 国产精品福利在线观看网址| wwwxxx亚洲| 99国产精品99久久久久久粉嫩| 欧美成人精品一区二区三区| 天天看天天摸天天操| 少妇精品久久久| 精品一区电影国产| 中国极品少妇videossexhd| 色悠久久久久综合先锋影音下载| 欧美丰满美乳xxx高潮www| 中文字幕网av| 国产激情欧美| 欧美剧情电影在线观看完整版免费励志电影 | **性色生活片久久毛片| 日韩国产精品一区二区| 国产精品99999| 中文字幕不卡在线播放| 婷婷四房综合激情五月| 97视频在线观看网站| 国产精品天天看| 亚洲一区二区三区精品动漫| 日本不卡三区| 有码一区二区三区| 免费一级特黄毛片| 天天综合av| 在线国产亚洲欧美| 亚洲视频一二三四| 奇米一区二区| 日韩成人在线视频观看| 在线观看av中文字幕| 人妖一区二区三区| 国产亚洲成精品久久| 蜜桃视频最新网址| 欧美成人日本| 992tv成人免费影院| 色老头一区二区| 狠狠色2019综合网| 国产精品区一区二区三含羞草| 无码国产伦一区二区三区视频| 久久久777精品电影网影网 | 亚洲精品日韩久久| 日韩av高清不卡| 一卡二卡在线视频| 成人夜色视频网站在线观看| 看高清中日韩色视频| 三区四区电影在线观看| 夜夜嗨av一区二区三区网页| 久久久免费视频网站| 免费成人毛片| 亚洲国产精品久久久久秋霞蜜臀| 久久久久久久久久久久| 亚洲情侣在线| 国产成人精品国内自产拍免费看| 99国产精品99| 久久久久国产一区二区三区四区 | 欧美在线制服丝袜| 下面一进一出好爽视频| 伊人成综合网yiren22| 久久精品成人一区二区三区 | 亚洲欧洲一区| 国产在线高清精品| 亚洲欧美日韩综合在线| 国产精品女同互慰在线看| 欧美久久久久久久久久久久久| 色猫猫成人app| 精品国产第一区二区三区观看体验| 国产伦理片在线观看| 激情婷婷亚洲| 成人美女免费网站视频| 男女污视频在线观看| 一区二区三区欧美亚洲| 91高清国产视频| 久久不见久久见免费视频7| 欧美大片免费观看在线观看网站推荐| 亚洲无码精品一区二区三区| 播五月开心婷婷综合| 好吊色视频988gao在线观看| 天然素人一区二区视频| 亚洲激情在线观看视频免费| 欧美在线视频第一页| 日本伊人午夜精品| 免费在线国产精品| 免费毛片b在线观看| 欧美成人精品福利| 国产盗摄一区二区三区在线| 六月丁香综合在线视频| 欧美一区二区三区在线免费观看| av福利在线导航| 日韩精品一区国产麻豆| 欧美三级 欧美一级| 精品中文av资源站在线观看| 亚洲精品在线免费| 亚洲综合在线电影| 亚洲欧洲偷拍精品| 欧美一区二区三区网站| 91一区二区三区在线播放| 91网站在线观看免费| 欧美magnet| 欧美一区二区三区日韩视频| 亚洲人做受高潮| 久久国产夜色精品鲁鲁99| 亚洲成人自拍视频| 99久久久国产精品免费调教网站| 亚洲欧洲第一视频| 五月激情丁香网| 国产免费久久精品| 天天干天天草天天| 99国产精品免费视频观看| 国产日韩欧美在线视频观看| 午夜激情视频在线| 51精品久久久久久久蜜臀| 婷婷激情四射网| 国产一区二区三区四区在线观看| 中国一级大黄大黄大色毛片| 亚洲成人五区| 国外成人在线视频| 香蕉视频黄在线观看| 一本大道久久a久久精品综合| 性少妇bbw张开| 日本aⅴ免费视频一区二区三区| 亚洲国产婷婷香蕉久久久久久99| 伊人久久精品| 欧美激情亚洲激情| 三级在线视频| 欧美日韩免费一区二区三区| www色aa色aawww| 粉嫩aⅴ一区二区三区四区| 免费 成 人 黄 色| 精品国精品国产自在久国产应用 | 亚洲自偷自拍熟女另类| 中文字幕伦av一区二区邻居| 国产免费一区二区三区香蕉精| 黄在线免费观看| 亚洲国产精品人久久电影| 一级片免费在线播放| 国产精品乱码妇女bbbb| 亚洲一区和二区| 久久午夜精品一区二区| 伊人久久大香线蕉av一区| 一区二区三区视频播放| 日av在线播放中文不卡| 久操视频在线观看| 日韩国产一区三区| 96日本xxxxxⅹxxx17| 香蕉成人啪国产精品视频综合网| 日本xxxxxxxxx18| 国产成人在线视频网站| 久久9精品区-无套内射无码| 天天插综合网| 久久伊人资源站| 在线视频成人| 欧美中在线观看| 91亚洲天堂| 亚洲色图校园春色| 超碰福利在线观看| 欧美在线观看禁18| 国产午夜免费视频| 国产精品成人一区二区三区夜夜夜| 白丝校花扒腿让我c| 青青草原综合久久大伊人精品优势 | 亚洲国产色一区| 少妇高潮惨叫久久久久| 久久这里只精品最新地址| 性久久久久久久久久久久久久| 亚洲一区免费| 日韩成人三级视频| 日韩欧美自拍| 欧美国产综合视频| 大桥未久女教师av一区二区| 国产精品直播网红| 成人影院入口| 午夜美女久久久久爽久久| 国产福利视频在线| 中文字幕精品在线| 欧美日韩免费做爰大片| 亚洲成人久久一区| 国产aⅴ爽av久久久久成人| 欧美色网站导航| 精品黑人一区二区三区| 精品久久久久久久久国产字幕| 极品久久久久久| 中文字幕一区日韩精品欧美| 中文字幕被公侵犯的漂亮人妻| 成人高清免费观看| 久久发布国产伦子伦精品| 加勒比av一区二区| 亚洲精品www.| 免费成人在线观看| 国产三级三级三级看三级| 国产亚洲激情| 亚洲熟妇国产熟妇肥婆| 伊人久久久大香线蕉综合直播 | 青青草华人在线视频| 久久久精品人体av艺术| 变态另类丨国产精品| 99在线精品一区二区三区| 性农村xxxxx小树林| 丁香六月久久综合狠狠色| 波多野结衣三级视频| 国产精品亚洲午夜一区二区三区 | 久久久国产精彩视频美女艺术照福利| 岛国视频免费在线观看| 国产亚洲欧美日韩美女| 国产三级电影在线| 在线视频一区二区| 91在线观看| 久久精品久久久久| 国产精品剧情| 欧美激情小视频| 嗯啊主人调教在线播放视频 | 色老头一区二区三区| 国产黄在线看| 日韩中文在线中文网三级| 欧美极品另类| 欧美日韩国产成人在线| 超碰97免费在线| 欧美亚洲成人网| 日韩精品一区二区三区av| 国产精品久久久久久久久久久不卡| 欧美国产日韩电影| 成人国产精品日本在线| 免费一级欧美在线大片| 丁香五月网久久综合| 午夜a一级毛片亚洲欧洲| 欧美午夜精品久久久久免费视| 日本不卡二三区| 亚洲五码在线观看视频| 亚洲激情自拍| 日本精品久久久久中文字幕| 美腿丝袜亚洲综合| 欧美国产在线一区| av成人动漫在线观看| 五月天综合视频| 综合分类小说区另类春色亚洲小说欧美| 黑人狂躁日本娇小| 午夜欧美视频在线观看| 天天射天天干天天| 91精品一区二区三区久久久久久 | 99tv成人影院| 国产精品久久精品国产| 狠狠操综合网| 国产亚洲精品久久久久久久| 亚洲深夜福利| 性chinese极品按摩| 福利一区福利二区| 国产综合精品在线| 亚洲黄色在线视频| 欧美一区二区三区久久久| 91麻豆精品国产91久久久久 | 大奶在线精品| 亚洲欧洲日本国产| 亚洲最黄网站| 亚洲综合123| 久久精品亚洲麻豆av一区二区| 欧美激情精品久久久久久免费| 性做久久久久久久免费看| 这里只有精品6| 亚洲精品美女久久久| 日日夜夜精品一区| 人人澡人人澡人人看欧美| 99re8这里有精品热视频8在线| 欧洲精品亚洲精品| 激情综合久久| 香蕉视频xxxx| 中文字幕永久在线不卡| 成人公开免费视频| 精品免费日韩av| 国内精品久久久久久野外| 91成人在线观看国产| 日本在线成人| 亚洲一区二区三区四区中文| 久久xxxx| 人妻av一区二区| 亚洲卡通欧美制服中文| 在线免费看av片| 一区二区三区天堂av | 国产精品视频一区二区三区四 | 国产精品主播直播| 国产福利在线导航| 色婷婷综合五月| 五月激情婷婷网| 国产69精品99久久久久久宅男| 日韩美香港a一级毛片| 日韩精品欧美一区二区三区| 中文亚洲字幕| 五十路六十路七十路熟婆| 一区二区三区丝袜| 国产福利资源在线| 久久久999国产精品| 欧美另类激情| 中文精品视频一区二区在线观看| 亚洲欧美高清| 丰满少妇一区二区三区| 亚洲成人自拍网| 亚洲国产视频一区二区三区| 久久久国产一区| 日韩电影精品| 在线成人av电影| 精品中文字幕一区二区| 自拍偷拍第9页| 欧美日韩国产综合久久| 亚洲1卡2卡3卡4卡乱码精品| 国产精品视频网址| 久久综合成人| 污污视频在线免费| 亚洲免费观看在线观看| av网站免费大全| 欧美精品18videos性欧美| 超碰97久久| 成年人视频观看| 久久久青草青青国产亚洲免观| 亚洲欧美日韩激情| 亚洲最大中文字幕| 日韩毛片免费视频一级特黄| 久久av喷吹av高潮av| 激情综合网激情| 久久丫精品久久丫| 亚洲精品国产品国语在线| 日韩电影毛片| 色一情一区二区三区四区| 美日韩一区二区| 欧美成人黄色网| 精品无人区乱码1区2区3区在线| 中文字幕乱码中文乱码51精品| 日韩欧美亚洲日产国产| 韩国午夜理伦三级不卡影院| 欧美日韩亚洲国产另类| 亚洲福利在线看| 日韩一区精品| 国产一级大片免费看| 99re热视频精品| 中文字幕免费高清在线观看| 久久精品久久久久| 欧美1区2区3区4区| 一区二区三区入口| 亚洲一区在线视频| 蜜桃视频在线观看网站| 91午夜理伦私人影院| 99综合在线| 丝袜美腿小色网| 日韩电影免费观看在线观看| 另类一区二区| 成熟丰满熟妇高潮xxxxx视频| 国产目拍亚洲精品99久久精品| www.久久精品.com| 国产mv免费观看入口亚洲| 欧美一区二区三区久久精品茉莉花| 精品影片一区二区入口| 欧美性一区二区| av在线小说| 亚洲自拍偷拍二区| 99精品欧美一区二区三区综合在线| 亚洲最新av网站| 欧美亚洲成人精品| 午夜精品免费|