精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

DeepSeek 系列模型詳解之 DeepSeek Math

人工智能
DeepSeek Math發布于2024年2月,雖然是一個7B參數量的模型,但在Math基準榜單上的表現卻超過了多個30B~70B參數量的開源模型。

DeepSeek Math發布于2024年2月,雖然是一個7B參數量的模型,但在Math基準榜單上的表現卻超過了多個30B~70B參數量的開源模型。

一、技術亮點

1. 數據集

使用Common Crawl提取的120B(1200億個)高質量數學網頁數據(具體包括與數學相關的token,以及自然語言和代碼數據等),總數據量是開源數據集OpenWebMath的9倍。如此大規模且高質量的數據集為模型提供了豐富的數學知識背景,使得它在處理數學相關任務時具有更強的能力。

2. 訓練策略

基于代碼領域模型DeepSeek-Coder-v1.5進行初始化,而不是從通用語言模型開始。從而賦予模型更好的數學推理能力。

3. 對齊技術

引入了一種近端策略優化(PPO)的變體——群組相對策略優化(GRPO)。GRPO通過將相似的任務或狀態分組,并根據它們之間的相對關系來調整獎勵信號,從而增強了模型的泛化能力和推理性能。此外,GRPO丟棄了Critic Model,顯著減少了訓練所需的顯存,提高了訓練效率和對齊效果。

4. 數學基準表現

在中文和英文數學基準榜單上,DeepSeek Math的表現超過了Mistral 7B、Llemma-34B等模型,并且其數學推理能力逼近GPT-4,與Minerva 540B的效果相當。

二、數據

1. 數據采集

如圖所示,是一個迭代Pipeline,展示了如何從一個種子語料庫(例如,一個小規模但質量高的數學相關數據集)開始,系統地從Common Crawl收集大規模數學語料庫。

整體數據采集過程是迭代式的。經過四輪數據收集迭代,最終收集了3550萬個數學網頁,總計1200億個token。具體流程如下:

  • 選擇OpenWebMath(一個高質量數學網頁文本的集合)作為初始種子語料庫。并使用這個語料庫,訓練fastText模型。
  • 利用訓練好的FastText模型,在包含400億網頁的Common Crawl中召回更多與數學相關的網頁。
  • 在召回的數學網頁中,通過統計識別出與數學相關的域名(例如,mathoverflow.net)。
  • 對這些域名下的URL路徑進行人工標注,標記出與數學內容相關的路徑(例如,mathoverflow.net/questions)。
  • 將這些特定路徑下的網頁,如果它們未被前述步驟召回,則將它們作為正樣本加入到種子集合中,以供下一輪迭代使用。重復這一過程直到完成四輪迭代。

為了避免基準污染,沿用DeepSeek-Coder的n-gram過濾方法,過濾掉包含來自英語數學基準(如GSM8K和MATH)以及中文基準(如CMATH和AGIEval)的問題或答案的網頁。過濾標準如下:

  • 10-gram匹配:任何包含與評估基準中的子字符串完全匹配的10-gram文本段落都將從數學訓練語料庫中移除。
  • 短文本精確匹配:對于長度不足10-gram但至少有3-gram的基準文本,采用精確匹配方法過濾受污染的網頁。

2. 與開源數據對比

為了驗證DeepSeekMath數據的質量,采用相同的初始化模型(DeepSeek-Coder-v1.5)和訓練設置,在多個不同的數學數據集上分別訓練了1500億個token,并對比最終模型的效果。

如下圖展示了不同數學數據集訓練模型的效果對比。紅線代表使用DeepSeekMath數據訓練的模型,其在多個數學基準上的表現顯著領先于其他數據集。特別地,在一個epoch范圍內(例如對于Proof-Pile-2是50B tokens),DeepSeekMath數據訓練的模型效果更好,進一步證明了其數據質量的優越性。

下表展示了更多詳細的榜單和數據集結果對比,DeepSeekMath數據在以下幾個方面表現出優勢:中英雙語、更大規模、更高質量。

三、訓練設置

DeepSeek Math對一個具有13億參數的通用預訓練語言模型進行數學訓練。該模型與DeepSeek LLM采用相同框架,記為DeepSeek LLM 1.3B。在每個數學語料庫上分別對模型進行1500億token的訓練。所有實驗均使用高效輕量的HAI-LLM訓練框架進行。以下是詳細的訓練設置:

(1) 使用AdamW優化器,參數設置如下:

  • 動量參數 (\beta_1 = 0.9)
  • 動量參數 (\beta_2 = 0.95)
  • 權重衰減系數 (weight_decay = 0.1)

(2) 采用多步學習率調度策略:

  • 預熱階段:學習率在前2000個warmup steps后線性增加到最大值。
  • 第一階段:在訓練進程的80%時,學習率降低到峰值的31.6%。
  • 第二階段:在訓練進程的90%時,學習率進一步降低到峰值的10.0%。

(3) 最大學習率設置為

(4) 使用400萬個token的批量大小(batch size)。

(5) 上下文長度設置為4000個token(context length)。

四、對齊階段

1. 監督式微調SFT

(1) 數據集

DeepSeek Math構建了一個數學指令微調數據集,涵蓋來自不同數學領域、具有不同復雜程度的中英文數學問題。這些問題與鏈式思維(Chain-of-Thought, CoT)、程序思維(Program-of-Thought, PoT)和工具集成推理格式(Tool-Integrated Reasoning Format)呈現的解決方案一一配對。總共有776,000個訓練樣本。

  • 英語數學數據集:為GSM8K和MATH問題標注了工具集成解決方案,并采用了MathInstruct的一個子集,以及Lila-OOD的訓練集,其中的問題通過思維鏈(CoT)或程序思維(PoT)解決。英文數據集涵蓋了數學的多個領域,如代數、概率、數論、微積分和幾何等。
  • 中國數學數據集:收集了涵蓋76個子主題(如線性方程)的中文 K-12 數學問題,并標注了 CoT 和工具集成推理格式的解決方案。

(2) 微調訓練

基于 DeepSeekMath-Base 進行數學指令調優,得到DeepSeekMath-Instruct 7B。訓練樣本隨機拼接,直到達到4K token的最大上下文長度。對模型進行500個步驟的訓練,批量大小為256,恒定學習率為

2. 強化學習RL

(1) 從PPO到GRPO

近端策略優化(Proximal Policy Optimization,PPO)是一種基于演員-評論家(actor-critic)的強化學習算法,廣泛應用于大語言模型的強化學習微調階段。PPO通過最大化以下替代目標來優化大模型:

其中,

  • 分別是當前策略模型和舊策略模型
  • q和o分別是從問題數據集和舊策略模型中采樣得到的問題和輸出。
  • 參數是PPO中引入的剪切相關超參數,用于穩定訓練。
  • 是優勢值,通過廣義優勢估計(Generalized Advantage Estimation, GAE)計算得出。

在PPO中,獎勵函數  和一個學習的價值函數  起著關鍵作用。因此,價值函數需要與策略模型一同訓練,為了緩解獎勵模型的過優化問題,標準方法是在每個 token 的獎勵中添加來自參考模型的每個 token 的 KL 散度懲罰項,即:

其中,

  •  是獎勵模型。
  • 是參考模型,通常是初始的監督微調(SFT)模型。
  •  是KL懲罰的系數。

由于PPO中使用的價值函數通常是與策略模型規模相當的另一個模型,這帶來了巨大的內存和計算負擔。此外,在強化學習訓練期間,價值函數在優勢值計算中被用作基線以減少方差。然而,在大語言模型的情境中,通常只有最后一個 token 由獎勵模型賦予獎勵分數,這可能會使在每個 token 上都準確的價值函數的訓練變得復雜。

為了解決這些問題,DeepSeekMath提出了群組相對策略優化(Group Relative Policy Optimization,GRPO)。GRPO無需像PPO那樣進行額外的價值函數近似,而是使用針對同一問題生成的多個采樣輸出的平均獎勵作為基線。如下圖所示:

對于每個問題q,GRPO從舊策略中采樣個輸出然后通過最大化以下目標來優化策略模型:

其中,

  • 是超參數。
  • 是基于同一組內輸出的相對獎勵計算的優勢值。

具體步驟如下:

① 初始化策略模型:使用初始策略模型

② 迭代優化:

  • 參考模型更新:將當前策略模型作為參考模型
  • 采樣輸出:對于每個問題,從舊策略模型中采樣個輸出
  • 計算獎勵:使用獎勵模型計算每個采樣輸出的獎勵
  • 計算優勢值:通過組相對優勢估計計算每個 token 的優勢值
  • 更新策略模型:通過最大化 GRPO 目標函數更新策略模型
  • 更新獎勵模型:通過連續訓練使用回放機制更新獎勵模型

GRPO利用組相對的方式計算優勢值,這與獎勵模型的比較性質非常契合,因為獎勵模型通常是在關于同一問題的輸出之間的比較數據集上進行訓練的。

此外,與PPO中使用的KL懲罰項不同,GRPO通過以下無偏估計器估計KL散度:

(2) 采用GRPO的結果監督強化學習

對于每個問題,從舊策略模型中采樣個輸出。然后,使用獎勵模型對這些輸出進行評分,得到 個獎勵

接下來,這些獎勵通過減去組平均值并除以組標準差進行歸一化。歸一化后的獎勵用于設置每個輸出的優勢值,即

最后,通過最大化目標函數來優化策略模型。

(3) 采用GRPO的過程監督強化學習

結果監督(Outcome Supervision)僅在每個輸出的末尾提供獎勵,這在復雜的數學任務中可能不夠充分和高效。過程監督(Process Supervision)在每個推理步驟的末尾提供獎勵。

具體來說,給定問題和從舊策略模型中采樣的個輸出 ,使用過程獎勵模型對每個步驟的輸出進行評分,得到相應的獎勵:

其中,

  • 是第步的結束token索引。
  • 是第個輸出的總步數。

接下來,這些獎勵通過減去組平均值并除以組標準差進行歸一化:

然后,過程監督計算每個 token 的優勢值為后續步驟的歸一化獎勵之和:

最后,通過最大化目標函數來優化策略模型。

(4) 迭代強化學習

在強化學習訓練過程中,舊的獎勵模型可能不足以監督當前的策略模型。因此,DeepSeek Math還探索了迭代強化學習(Iterative RL)與GRPO的結合。

如下算法所示,在迭代 GRPO 中,根據策略模型的采樣結果為獎勵模型生成新的訓練集,并使用一種納入 10% 歷史數據的回放機制持續訓練舊的獎勵模型。然后,將參考模型設置為策略模型,并使用新的獎勵模型持續訓練策略模型。

具體步驟詳解如下:

(1) 初始化策略模型和獎勵模型

(2) 迭代過程:

  • 參考模型更新:將當前策略模型 作為參考模型
  • 采樣輸出:對于每個問題,從舊策略模型 中采樣個輸出
  • 計算獎勵:使用獎勵模型 計算每個采樣輸出  的獎勵 。
  • 歸一化獎勵:對獎勵進行歸一化處理,得到
  • 計算優勢值:計算每個 token 的優勢值 為后續步驟的歸一化獎勵之和。
  • 更新策略模型:通過最大化 GRPO 目標函數更新策略模型 
  • 更新獎勵模型:通過連續訓練使用回放機制更新獎勵模型,并保留10%的歷史數據以確保獎勵模型的穩定性。

五、模型效果

下表評估的是模型未使用工具情況下,通過自身CoT解決數學題的能力。在MATH數學競賽數據集上,DeepSeekMath-RL 7B超過了7B~70B所有開源模型,以及大多數閉源模型(例如Inflection-2和Gemini Pro)13%的絕對值,非常接近GPT-4和Gemini Ultra性能。

其中值得注意的是,DeepSeekMath-RL 7B所有評估指標上都超過了基準模型DeepSeekMath-Instruct 7B,展示了GRPO強化學習訓練的有效性。

參考:https://arxiv.org/abs/2402.03300

責任編輯:趙寧寧 來源: 小喵學AI
相關推薦

2025-02-13 11:00:30

2025-03-06 07:28:31

DeepSeek大模型人工智能

2025-02-17 09:03:26

DeepSeekAI工具人工智能

2025-02-17 09:00:00

DeepSeek人工智能AI

2025-05-08 08:10:25

大模型DeepSeekAPI

2025-02-13 08:30:11

2025-04-03 15:40:41

機器學習大模型DeepSeek

2025-03-19 07:37:54

2025-02-27 09:17:41

DeepSeekPythonAI

2025-02-08 09:30:00

2025-02-27 10:41:53

2025-09-23 18:18:41

DeepSeekAPI

2025-02-20 09:27:46

2025-08-19 21:23:45

DeepSeekAPP接口

2025-02-14 09:00:00

火山引擎大模型DeepSeek

2025-02-17 00:25:00

SpringAIOpenAI

2025-03-05 09:10:00

AI生成模型

2025-05-19 08:41:00

AI模型開發者
點贊
收藏

51CTO技術棧公眾號

二区三区四区高清视频在线观看| 久久久久亚洲av无码专区桃色| 成人在线免费观看| 久久国产婷婷国产香蕉| 欧美久久精品一级黑人c片| 91传媒理伦片在线观看| av在线日韩| 一区二区高清免费观看影视大全| 美女黄毛**国产精品啪啪| 日本成人一级片| 欧美日韩一区自拍 | 性欧美极品xxxx欧美一区二区| 伊人免费在线| 97久久精品人人爽人人爽蜜臀| 国产精品久久久久久网站| 欧美日韩亚洲国产另类| 国产一区二区三区日韩精品| 日韩一级免费一区| 欧美极品欧美精品欧美图片| a级影片在线| 国产日韩成人精品| 国产精品一区二区在线观看| 中文字幕福利视频| 国产一区二区你懂的| 毛片精品免费在线观看| 免费视频91蜜桃| 欧美日韩看看2015永久免费| 91麻豆精品91久久久久同性| 狠狠操精品视频| 国产在线美女| 亚洲一区视频在线| 婷婷视频在线播放| www日韩tube| 久久久久久久久久看片| 国产精品一 二 三| 国产a级免费视频| 久久精品国内一区二区三区| 性色av一区二区三区在线观看| 激情五月婷婷小说| 亚洲天堂免费| 日韩中文字幕在线免费观看| 欧美色图亚洲激情| 激情亚洲另类图片区小说区| 日韩欧美另类在线| 中文 日韩 欧美| 日本黄色成人| 欧美日韩高清不卡| 色婷婷狠狠18| 日韩av电影资源网| 欧美亚洲国产bt| 日韩视频在线免费看| 在线看片福利| 狠狠躁夜夜躁久久躁别揉| 成人免费视频91| av资源一区| 欧美日韩国产激情| 精品少妇人妻av免费久久洗澡| 免费毛片在线看片免费丝瓜视频| 夜色激情一区二区| 国产女教师bbwbbwbbw| 国产婷婷视频在线 | 在线观看 中文字幕| 国内精品福利| 午夜精品三级视频福利| 欧美黄色免费在线观看| 欧美视频官网| 97碰在线观看| 久久青青草原亚洲av无码麻豆 | 日韩1区2区| 色黄久久久久久| 蜜臀av午夜精品久久| 伊人久久大香线蕉综合四虎小说| 欧美成人午夜影院| 日本免费在线播放| 亚洲永久免费精品| 国产精品老女人精品视频| 曰批又黄又爽免费视频| 国产精品主播直播| 国内精品**久久毛片app| 日本福利午夜视频在线| 欧美激情综合网| 大地资源网在线观看免费官网| 欧美videos另类精品| 亚洲va天堂va国产va久| 久久精品香蕉视频| 综合久草视频| 日韩国产精品一区| 中文字幕在线观看免费高清| 亚洲二区三区不卡| 97免费中文视频在线观看| 波多野结衣人妻| 国产一区二区成人久久免费影院| 国产精选在线观看91| 毛片免费在线播放| 综合久久一区二区三区| 青青青国产在线观看| av在线日韩| 精品国产电影一区二区| 国产免费一区二区三区网站免费| 亚洲影视一区二区三区| 91高清免费视频| 一级黄色片视频| 成人手机电影网| 亚洲精品视频一区二区三区| 高h视频在线播放| 欧美日韩中文一区| 99久久免费看精品国产一区| 91综合在线| 欧美亚洲国产另类| 国产色综合视频| 国产欧美一区二区三区在线老狼| www.avtt| 青草综合视频| 亚洲男人天堂2024| 精品97人妻无码中文永久在线| 久久久精品网| 国产亚洲情侣一区二区无| 免费在线观看黄色网| 色综合久久中文字幕| 国产成人精品综合久久久久99 | 日韩一区二区三区色| 亚洲欧美在线x视频| 国产一级片播放| 久久国产精品无码网站| 欧美重口乱码一区二区| gogo久久| 精品噜噜噜噜久久久久久久久试看 | 国产人妻精品一区二区三| 2023国产精品自拍| 2018国产在线| 爱爱精品视频| 欧美人与性动交| 国产精品无码免费播放| 中文av一区特黄| 久草综合在线观看| 性欧美lx╳lx╳| 97色在线视频观看| 亚洲精品视频91| 亚洲综合清纯丝袜自拍| 三年中文在线观看免费大全中国| 欧美中文字幕一区二区| 国产91在线视频| 日本视频在线观看一区二区三区 | 99re热视频| 久久久久久久久蜜桃| 99色精品视频| 妖精视频一区二区三区| 538国产精品一区二区免费视频 | 久久综合九色综合久久久精品综合| 996这里只有精品| 日本在线成人| 欧美福利小视频| 亚洲美女性生活| 亚洲成人免费电影| 999精品免费视频| 99国产精品久久久久久久| 国产一区免费在线| 成人短视频app| 亚洲欧美激情四射在线日| 亚洲欧美综合另类| 99久久综合色| 99999精品视频| 欧美色爱综合| 91精品国产综合久久香蕉| 国产在线激情视频| 欧美成人一区二区三区片免费| 久草视频中文在线| 99精品桃花视频在线观看| 久久婷婷五月综合色国产香蕉| 欧美伦理在线视频| 成人女保姆的销魂服务| 青青青草视频在线| 日韩精品在线视频美女| 久久久久久久久久一级| 亚洲欧洲www| 国产一级黄色录像| 日韩有码一区二区三区| 亚洲欧洲日韩综合二区| 日韩欧美久久| 国产最新精品视频| 福利在线观看| 日韩午夜激情av| 国产成人一级片| 中文字幕亚洲一区二区av在线| 国产成人精品一区二区三区在线观看 | 农村妇女精品一二区| 久久国产精品亚洲人一区二区三区 | 日本亚洲欧洲无免费码在线| 久久天天躁狠狠躁夜夜av| 精品黑人一区二区三区国语馆| 午夜免费久久看| 九九九视频在线观看| 国产一区不卡精品| 午夜肉伦伦影院| 91精品国产调教在线观看| 国产一区二区黄色| 另类一区二区| 91精品国产91久久久久久久久| 91精品国产91久久久久游泳池| 日韩视频不卡中文| 波多野结衣视频免费观看| 一区二区三区资源| 天天操天天干天天操天天干| www.亚洲精品| 性生生活大片免费看视频| 亚洲日韩视频| 大陆极品少妇内射aaaaaa| 欧美日韩导航| 99电影网电视剧在线观看| 精品网站在线| 97avcom| 国产区在线看| 一区二区三区黄色| 视频一区二区三区在线看免费看 | 亲爱的老师9免费观看全集电视剧| 暖暖日本在线观看| 亚洲天堂精品在线| 天天干天天干天天干| 欧美一区二区三区视频| 中文字幕+乱码+中文| 欧美性色视频在线| 日本五十熟hd丰满| 亚洲黄色在线视频| 欧美a级片免费看| 久久日一线二线三线suv| 成年女人免费视频| 国产美女娇喘av呻吟久久| jizz欧美性11| 日韩电影免费在线看| 99999精品视频| 国产精品入口66mio| av在线com| 欧美区亚洲区| 日本免费黄色小视频| 性欧美欧美巨大69| 一本色道久久99精品综合| 精品日韩毛片| 欧美深深色噜噜狠狠yyy| 台湾色综合娱乐中文网| 精品国产一区二区三区麻豆小说 | 日韩av电影网| 亚洲成av人片在www色猫咪| 免费中文字幕视频| 一区二区三区久久久| 免费在线观看日韩| 一个色综合网站| 麻豆一区二区三区精品视频| 一区二区久久久| 国产午夜小视频| 欧美日韩国产精品一区| 中文字幕精品三级久久久| 精品动漫一区二区| 狠狠人妻久久久久久综合| 91黄色免费观看| 在线免费观看高清视频| 欧美美女黄视频| 国产99视频在线| 亚洲精品在线一区二区| 网站黄在线观看| 亚洲欧美国产视频| 日本在线观看网站| 久热爱精品视频线路一| 欧美精品videosex| 欧美亚洲在线观看| 成人免费视频观看| 91久久国产综合久久蜜月精品| 国产精品xxx在线观看| 免费av一区二区三区| 成人嘿咻视频免费看| 一本一本久久a久久精品综合妖精| 午夜日韩电影| 国产精品333| 秋霞午夜av一区二区三区| 拔插拔插华人永久免费| 国产成人在线视频网址| 自拍视频一区二区| 亚洲国产成人私人影院tom | 欧美性xxxxx极品娇小| 一区二区三区麻豆| 日韩欧美123| 韩国中文字幕2020精品| 伦理中文字幕亚洲| 国模私拍一区二区国模曼安| 国产精品av在线播放| 国产不卡精品| 久久国产一区| 欧美在线不卡| 中文字幕无码不卡免费视频| 精品一区二区影视| 在线视频 日韩| 国产精品三级视频| 日本一区二区欧美| 欧美日韩精品一区二区三区四区| 黄色一级大片在线免费看国产一 | 调教驯服丰满美艳麻麻在线视频| 亚洲麻豆国产自偷在线| 久久亚洲精品石原莉奈| 欧美一激情一区二区三区| 黄色视屏网站在线免费观看| 欧美成人中文字幕在线| 草莓视频成人appios| 国产嫩草一区二区三区在线观看| 91欧美在线| 国产偷人视频免费| 粉嫩高潮美女一区二区三区| 国产精品理论在线| 欧美日韩黄色大片| 国产成人三级在线播放| 这里只有精品视频| 涩涩视频网站在线观看| av在线不卡一区| 日韩成人影院| 熟女人妇 成熟妇女系列视频| 国产91丝袜在线播放| 免费成人美女女在线观看| 色综合中文字幕国产| 午夜影院免费视频| 欧美国产日韩二区| 97精品资源在线观看| 日本一区视频在线观看免费| 在线亚洲伦理| 美女黄色一级视频| 亚洲乱码一区二区三区在线观看| 伊人免费在线观看高清版| 波多野结衣与黑人| 91九色鹿精品国产综合久久香蕉| 一本一道久久a久久综合精品| 亚洲在线播放| 日本三级日本三级日本三级极| 亚洲欧美另类在线| 国产人妻精品一区二区三| 日韩在线资源网| 日韩av首页| 欧洲亚洲一区二区三区四区五区| 国产欧美大片| 亚洲av无码一区二区三区网址| 亚洲亚洲人成综合网络| 亚洲av无码国产精品永久一区| 插插插亚洲综合网| 成人在线日韩| 2021狠狠干| 国产老妇另类xxxxx| h色网站在线观看| 欧美一区二区播放| 成人免费看片| 99porn视频在线| 欧美人成在线| 在线天堂www在线国语对白| 亚洲成av人影院在线观看网| 天堂在线视频免费| 91精品国产色综合久久不卡98| 成人av资源网址| 欧美 日韩 国产在线观看| 91麻豆免费观看| 欧美brazzers| 日韩视频在线免费观看| 亚洲一区二区小说| 欧美少妇一区二区三区| 国产99精品国产| 影音先锋亚洲天堂| 亚洲片av在线| 亚洲男男av| 国产美女永久无遮挡| 99国产精品久久久久久久久久 | 欧美高清hd18日本| av黄色在线| 久久精品成人一区二区三区蜜臀 | 99国产精品免费视频| 亚洲狠狠爱一区二区三区| 亚洲色大成网站www| 国产精品成人国产乱一区| 婷婷亚洲五月色综合| 国产精品日日摸夜夜爽| 色综合久久99| 里番在线观看网站| 国产区一区二区三区| 丝袜美腿一区二区三区| 中国一级片在线观看| 精品精品国产高清a毛片牛牛| 周于希免费高清在线观看| 亚洲一区精品视频| 成人毛片在线观看| 午夜精品一区二| 成人h版在线观看| 国产精选在线观看91| 欧美在线不卡| 特级西西人体4444xxxx| 欧美日韩一级大片网址| 日本在线视频网址| 日韩三级电影网站| 国产成人精品aa毛片| 在线观看亚洲黄色| 欧美激情亚洲国产| 精品盗摄女厕tp美女嘘嘘| 极品白嫩少妇无套内谢| 欧美午夜不卡视频| 波多野结衣中文在线| 亚洲精品永久www嫩草| 99精品黄色片免费大全| 国产精品久久久久久久一区二区 |