精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

32B IOI奧賽擊敗DeepSeek-R1!Open R1開源復(fù)刻第三彈,下一步R1-Zero

人工智能 新聞
Hugging Face的Open R1重磅升級,7B擊敗Claude 3.7 Sonnet等一眾前沿模型。憑借CodeForces-CoTs數(shù)據(jù)集的10萬高質(zhì)量樣本、IOI難題的嚴(yán)苛測試,以及模擬真實(shí)競賽的提交策略優(yōu)化,這款模型展現(xiàn)了驚艷的性能。

Hugging Face的Open R1再度升級!

Hugging Face的Open R1是一個社區(qū)驅(qū)動的項(xiàng)目,目標(biāo)是創(chuàng)建一個完全開源的DeepSeek-R1版本。目前,已有模型如OlympicCoder-32B和數(shù)據(jù)集如codeforces發(fā)布,顯示了項(xiàng)目的進(jìn)展。

最新發(fā)布的7B和32B OlympicCoder,在IOI挑戰(zhàn)上超越了一眾前沿模型,比Claude 3.7 Sonnet還猛。

OlympicCoder已經(jīng)成了代碼推理界的「肌肉猛男」,有些模型規(guī)模比它大100倍,結(jié)果還是被它按在地上摩擦……

圖片

模型在2024年國際信息學(xué)奧林匹克競賽(IOI)50次提交中的表現(xiàn)

而這一切,得感謝Open R1的一系列騷操作:

  • CodeForces-CoTs數(shù)據(jù)集:近10萬個高質(zhì)量樣本,提煉自DeepSeek-R1,專門訓(xùn)練C++和Python代碼生成。
  • IOI基準(zhǔn)測試:拿2024年國際信息學(xué)奧林匹克競賽(IOI)的難題來虐AI,看看誰是真正的「代碼戰(zhàn)神」。
  • 提交策略優(yōu)化:模擬OpenAI的策略,讓模型最大化得分,像真正的選手一樣參加比賽。

我們來扒一扒它是怎么煉成的,以及Hugging Face團(tuán)隊(duì)踩過的那些坑。

(小心,可能會讓你懷疑人生:AI連刷題都比你強(qiáng)了……)

CodeForces-CoTs數(shù)據(jù)集

CodeForces作為編程競賽的熱門平臺,其中的算法優(yōu)化問題極具挑戰(zhàn)性。

這使其成為一個有趣的數(shù)據(jù)集,用于提升和測試模型的代碼推理能力。

此次發(fā)布的open-r1/codeforces包含了超過1萬個問題,時間跨度從最初的競賽一直到2025年,其中約3000個問題是DeepMind和CodeContests中沒有的。

對于約60%的問題,數(shù)據(jù)集提供了競賽組織者撰寫的解題思路,這對理解原理至關(guān)重要。

同時,每個問題都從官方網(wǎng)站提取了3個正確解決方案。

open-r1/codeforces-cots數(shù)據(jù)集更是一大亮點(diǎn),其中包含了DeepSeek-R1針對這些問題生成的近10萬個思維鏈(CoT)樣本,用C++和Python兩種語言呈現(xiàn)。

研究團(tuán)隊(duì)在這個數(shù)據(jù)集上對Qwen2.5 Coder Instruct 7B和32B進(jìn)行微調(diào),得到了OlympicCoder-7B和OlympicCoder-32B模型。

代碼可驗(yàn)證性危機(jī)

雖然DeepMind和其他競賽數(shù)據(jù)集都包含測試用例,并聲稱是可驗(yàn)證的,但這些通常只是競賽網(wǎng)站上全套測試用例的一小部分。

特別是CodeForces,顯示的測試用例上限約為500個字符,這意味著這些數(shù)據(jù)集只包含符合此限制的較短、較簡單的測試用例。

例如,研究者選取了7個問題,R1生成的解決方案通過了全部公開測試用例,并將它們提交到CodeForces平臺:

圖片

盡管這些方案通過了較短的測試,但均未通過完整測試集。這凸顯了對新的可驗(yàn)證的編程競賽數(shù)據(jù)集的需求。

國際信息學(xué)奧林匹克競賽(IOI)

國際信息學(xué)奧林匹克競賽(IOI)是全球頂尖的編程競賽。

完整測試集遵循寬松的(CC-BY)許可發(fā)布,使其成為測試代碼推理能力的理想數(shù)據(jù)集。

如果你熟悉美國數(shù)學(xué)邀請賽(AIME),IOI就相當(dāng)于數(shù)學(xué)奧林匹克競賽(IMO)的編程版,參加AIME的最優(yōu)秀學(xué)生才有資格受邀參加IMO。

IOI的問題設(shè)計(jì)獨(dú)特,每個問題細(xì)分為多個子任務(wù),各子任務(wù)輸入約束不同。

參賽者要解決子任務(wù),提交的方案須在嚴(yán)格時限內(nèi)通過所有測試用例。

最后子任務(wù)通常是完整復(fù)雜問題,而前面子任務(wù)相對簡單、約束更多,參賽者常針對特定子任務(wù)拿部分分?jǐn)?shù),競賽中得滿分十分罕見。

團(tuán)隊(duì)整理了2020-2024年的IOI問題,將它們拆分為子任務(wù),使每個提示都能解決一個特定的子任務(wù),便于有針對性地訓(xùn)練和評估。

他們還在open-r1/ioi和open-r1/ioi-test-cases中發(fā)布了處理后的問題陳述、評分檢查文件及測試用例,同時創(chuàng)建了自定義代碼,用于運(yùn)行解決方案并按IOI規(guī)則評分,代碼可在https://github.com/huggingface/ioi上獲取。

研究者對2024年IOI上40多個領(lǐng)先的推理模型進(jìn)行了全面評估。

每個問題的提交次數(shù)限制為50次,采用與OpenAI類似的選擇策略模擬得分。

評估結(jié)果顯示,OlympicCoder模型表現(xiàn)出色。

OlympicCoder-32B在50次提交限制下,超越了o1-mini、DeepSeek-R1、Claude-3.7-Sonnet-thinking等模型。

圖片

模型在2024年國際信息學(xué)奧林匹克競賽(IOI)50次提交中的表現(xiàn)

提交策略

這種提交策略可能不利于非推理模型,像OlympicCoder-32B-Instruct和Qwen-2.5-Coder-32B-Instruct。

為模擬真實(shí)競賽,團(tuán)隊(duì)采用類似OpenAI用于o1-ioi的循環(huán)提交策略。

首先提交針對最后一個子任務(wù)的解決方案,然后是倒數(shù)第二個子任務(wù)的方案,以此類推,只有選定提交時才評估解決方案。

若子任務(wù)已被之前選定的提交解決,就跳過針對該子任務(wù)的提交。

在每個目標(biāo)子任務(wù)里,傾向于選擇更長的生成內(nèi)容,這對推理模型合理,對其他模型不太適用。

如果取消50次提交限制,并評估生成的所有提交,會得到以下結(jié)果:

圖片

國際信息學(xué)奧林匹克競賽(2024年)無提交限制時模型的表現(xiàn)

基于R1軌跡訓(xùn)練的經(jīng)驗(yàn)教訓(xùn)

在創(chuàng)建OlympicCoder模型時,研究者進(jìn)行了大量SFT實(shí)驗(yàn),以了解用于CodeForces數(shù)據(jù)集的各種篩選條件的作用。

發(fā)現(xiàn)open-r1/codeforces-cots的以下子集表現(xiàn)最佳:

  • solutions:R1根據(jù)問題陳述生成的方案。
  • solutions_w_editorials:R1根據(jù)問題陳述和解釋正確解決方案的說明生成的方案。

請注意,這里只關(guān)注了C++解決方案,融入Python解決方案可能進(jìn)一步提高性能。

用LiveCodeBench作為模型的測試平臺,然后將表現(xiàn)最佳的checkpoints用于更具挑戰(zhàn)性的IOI基準(zhǔn)測試。

研究者測試了各種超參數(shù)配置來訓(xùn)練模型,最終確定如下:

  • 模型:Qwen2.5 Coder Instruct 7B和32B
  • 輪數(shù):10
  • 有效批大小:128
  • 學(xué)習(xí)率:4e-5
  • 調(diào)度器:余弦衰減至峰值學(xué)習(xí)率的10%
  • 上下文長度:7B為32,768個token,32B為22,528個token

樣本打包會損害推理性能

樣本打包是一種在訓(xùn)練中常用的加速方法,它將訓(xùn)練樣本連接成大小相等的塊,無需填充token。

圖片

打包后,樣本可能會跨塊邊界重疊。不過,要是大部分樣本比塊小很多,這種重疊影響不大。

然而,對于從R1提取的推理軌跡,這可能會帶來負(fù)面影響。

因?yàn)楹芏嘬壽E長,答案被截?cái)嗟目赡苄愿摺_@就導(dǎo)致訓(xùn)練時,它很難關(guān)注長上下文信息,尤其是問題和答案被分到不同塊的時候。

如下圖所示,打包會嚴(yán)重?fù)p害模型的性能。用打包時,模型幾乎解不出LiveCodebench里的題;不用打包,性能在幾個訓(xùn)練周期后趨于平穩(wěn)。

圖片

這種差異可能是由于訓(xùn)練集僅包含C++解決方案,而LiveCodeBench僅評估Python的性能。

盡管如此,在所有分析過的數(shù)據(jù)集里,打包的效果都更差。

用較大的學(xué)習(xí)率獲得最佳表現(xiàn)

在用Qwen進(jìn)行的大多數(shù)SFT實(shí)驗(yàn)中,2e-5的學(xué)習(xí)率通常足以獲得強(qiáng)大的性能。

但是,當(dāng)將帶有推理數(shù)據(jù)的SFT用于現(xiàn)有指令模型時,將學(xué)習(xí)率大幅提高到4e-5,性能會顯著提升。

如下圖所示,學(xué)習(xí)率每提高一倍,在LiveCodeBench上的得分就會提高近10分!

圖片

納入解題思路無助于提升性能

在創(chuàng)建open-r1/codeforces-cots數(shù)據(jù)集中的solutions_w_editorials子集時,原以為給R1輸入問題及解答,能獲得更好的推理軌跡。

但出人意料的是,結(jié)果并非如此。訓(xùn)練時,直接從問題描述采樣,反倒讓性能有了一定的持續(xù)提升。

圖片

用<think>預(yù)填充以持續(xù)生成長CoT

在測試模型時,發(fā)現(xiàn)個奇怪現(xiàn)象:拿領(lǐng)域內(nèi)問題(比如競技編程)提問,模型會在<think>和</think>標(biāo)簽里,輸出長長的CoT,然后給出答案。

可要是問領(lǐng)域外的問題,像「瑞士首都是哪」,模型就變回原來指令模型的回答方式了。

舉個例子,簡單問題「1+1等于幾」,模型正常回答是這樣:

用戶:1+1等于多少?

模型回答:2。這是最基礎(chǔ)的數(shù)學(xué)加法題,1+1就是 2。這題常出現(xiàn)在面試或者在線測試?yán)铮脕砜疾齑痤}人能不能快速解決問題。雖說答案大家都知道,但雇主能通過這題,看看答題人有沒有批判性思維和解決問題的能力。而且,這也是數(shù)學(xué)里復(fù)雜運(yùn)算的基礎(chǔ)。下次再有人問,你就放心答2就行!

圖片

這段代碼里,定義了add_numbers函數(shù),輸入兩個數(shù)返回它們的和。接著用1和1調(diào)用函數(shù),把結(jié)果存進(jìn)result,再打印出來。

但要是預(yù)先在模型回答里加上<think>,情況就不一樣了:

用戶:1+1等于多少?

模型回答:<think>好的,我要回答「1+1等于多少」這個問題。1+1等于2。不過,會不會有別的考法?或者不同進(jìn)制?十進(jìn)制里是2,二進(jìn)制就是10了。但這問題問得直接,用戶估計(jì)就想要個簡單答案,那就是2。直接說出來?</think>對,1+1等于2,你還有別的想了解的嗎?

這說明,將推理軌跡融入現(xiàn)有預(yù)訓(xùn)練模型時,得在最終模型的對話模板里,默認(rèn)強(qiáng)制加上預(yù)填充。DeepSeek處理提煉模型用的也是這招,這可能就是原因所在。

把這些經(jīng)驗(yàn)都用上,團(tuán)隊(duì)做出了OlympicCoder-7B,性能和DeepSeek的提煉模型差不多,比基礎(chǔ)的Qwen2.5-Coder強(qiáng)多了。

圖片

巧用8位優(yōu)化器,拓展長上下文大模型

訓(xùn)練OlympicCoder-7B時,研究者發(fā)現(xiàn)DeepSpeed ZeRO-3在配有8個H100的單節(jié)點(diǎn)上,訓(xùn)練32k上下文長度的模型沒問題。

可一旦把訓(xùn)練方案用于32B模型,就遇到了一系列內(nèi)存問題。尤其是上下文長度超過20k token時,哪怕用16個節(jié)點(diǎn),也會因內(nèi)存不足而崩潰。

這可不妙,CodeForces-CoTs里20%的軌跡長度都超過20k token,意味著它們會在訓(xùn)練期間被截?cái)唷?/span>

問題的根源在于transformerstrl尚不支持上下文并行。

團(tuán)隊(duì)嘗試了各種節(jié)省內(nèi)存的辦法,發(fā)現(xiàn)將FSDP與paged_adamw_8bit優(yōu)化器結(jié)合起來,可以將上下文擴(kuò)展到 22,528個token,但仍有9%的數(shù)據(jù)被截?cái)唷?/span>

更新

最近,團(tuán)隊(duì)在改進(jìn)TRL中GRPO的實(shí)現(xiàn)方面取得了進(jìn)展,帶來了一些提升,進(jìn)一步提高了效率、可擴(kuò)展性和資源利用率。

以下是這次更新最重要的變化概要:

生成重復(fù)使用

GRPO的主要瓶頸與其他在線方法相同:生成過程需要時間。

提高GRPO樣本效率的一個關(guān)鍵方法是在優(yōu)化過程中多次重用生成的樣本,而不是在單次使用后丟棄。這一技術(shù)實(shí)際上早在PPO中就已經(jīng)引入。

對于GRPO,樣本重用的次數(shù)用μ表示。

圖片

現(xiàn)在,可以多次重用生成的樣本,從而顯著加快處理速度。

from trl import GRPOConfig

training_args = GRPOConfig(..., num_iteratinotallow=...)

不過需要注意的是,如果μ過大,可能會對學(xué)習(xí)產(chǎn)生負(fù)面影響。根據(jù)他們的經(jīng)驗(yàn),2到4之間的值是一個較好的平衡點(diǎn)。

圖片

獎勵加權(quán)

在訓(xùn)練模型時,并非所有獎勵都同等重要。例如,可能希望模型優(yōu)先關(guān)注正確性而非格式,而不是平等對待兩者。

為了解決這個問題,現(xiàn)在可以為不同的獎勵分配不同的權(quán)重,從而更精細(xì)地控制優(yōu)化過程。通過調(diào)整這些權(quán)重,我們可以引導(dǎo)模型更加關(guān)注特定任務(wù)中最重要的方面。

下面代碼配置了一個GRPO訓(xùn)練器,通過GRPOConfig設(shè)置訓(xùn)練參數(shù),并為兩個獎勵函數(shù)(very_important_reward 和 less_important_reward)分配了不同的權(quán)重(0.9和0.1),以控制優(yōu)化過程中不同獎勵的重要性。

from trl import GRPOConfig, GRPOTrainer

def very_important_reward(completions, **kwargs):
    ...

def less_important_reward(completions, **kwargs):
    ...

training_args = GRPOConfig(
    ...,
    reward_weights=[0.9, 0.1],
)
trainer = GRPOTrainer(
    ...,
    reward_funcs=[very_important_reward, less_important_reward],
    args=training_args,
)

其他改進(jìn)

GRPO還進(jìn)行了一些較小但影響深遠(yuǎn)的改進(jìn):

  • PEFT+vLLM集成:現(xiàn)在可以將PEFT(參數(shù)高效微調(diào))與vLLM結(jié)合使用,將高效微調(diào)與優(yōu)化的推理相結(jié)合,提升可擴(kuò)展性。
  • 梯度檢查點(diǎn):通過重新計(jì)算某些激活值而非存儲它們來減少訓(xùn)練過程中的內(nèi)存消耗,從而支持訓(xùn)練更大的模型。
  • 優(yōu)化的選擇性Log Softmax計(jì)算:引入了一種新的Log Softmax計(jì)算方法,降低了訓(xùn)練期間的內(nèi)存峰值。

接下來的工作

團(tuán)隊(duì)當(dāng)前的重點(diǎn)集中在兩個關(guān)鍵領(lǐng)域:

  • 提升生成速度:正在探索進(jìn)一步的優(yōu)化(如靜態(tài)緩存),以使生成過程更快。
  • 將GRPO擴(kuò)展到多節(jié)點(diǎn)設(shè)置:正在努力使 GRPO 能夠在多節(jié)點(diǎn)上擴(kuò)展,從而支持訓(xùn)練更大的模型。

Open R1 Math-Dataset更新

研究團(tuán)隊(duì)還進(jìn)一步豐富了之前發(fā)布的OpenR1-Math-Raw數(shù)據(jù)集,添加了新的元數(shù)據(jù),以在過濾和驗(yàn)證過程中支持更明智的決策。具體來說,新增了以下列:

  • reparsed_answers:注意到答案列中的許多條目要么LaTeX格式不正確,要么僅包含部分答案。此外,由于一些問題是多項(xiàng)選擇題,正確答案本身及其對應(yīng)的字母都應(yīng)視為有效響應(yīng)。

為此,他們使用Llama-3.3-70B-Instruct模型從解決方案列中重新提取了所有答案,確保reparsed_answers包含正確答案,并在多項(xiàng)選擇題中同時包含對應(yīng)的字母。

  • correctness:基于模型的答案驗(yàn)證可能需要大量資源。因此,團(tuán)隊(duì)使用Llama-3.3-70B-Instruct作為評判模型,并結(jié)合math_verify對答案列和reparsed_answers列進(jìn)行了評估。

訓(xùn)練與評估

在數(shù)據(jù)受限的過濾場景中,精確度和召回率都是重要的考慮因素。

因此,研究團(tuán)隊(duì)沒有為每個實(shí)驗(yàn)設(shè)定相同的token預(yù)算,而是對所有數(shù)據(jù)進(jìn)行了單個周期的訓(xùn)練。

他們選擇了Qwen7B-Instruct模型,并通過RoPE擴(kuò)展將其微調(diào)至32k的上下文長度,采用余弦調(diào)度。

為了跟蹤性能進(jìn)展,每隔40步在AIME-24、AIME-25和MATH-500數(shù)據(jù)集上使用lighteval評估模型。

下圖展示了在AIME-24、AIME-25和MATH-500數(shù)據(jù)集上,不同方法(包括無限制、LLaMA驗(yàn)證、math_verify等)對模型準(zhǔn)確率隨訓(xùn)練步數(shù)變化的影響。

圖片

結(jié)果顯示,驗(yàn)證顯著影響了早期性能。過濾在前40步尤為重要。

在MATH-500數(shù)據(jù)集上,較嚴(yán)格的驗(yàn)證方法在早期階段顯著提升了性能(例如,no_restrictions得分為 0.61,而LandMV 為0.72)。然而,隨著訓(xùn)練的進(jìn)行,這種性能差距逐漸縮小,擁有更多樣本(即使其中包含錯誤)變得更有利。

使用math_verify過濾的數(shù)據(jù)集始終表現(xiàn)出較低的訓(xùn)練損失。

研究團(tuán)隊(duì)推測math_verify能有效識別特定任務(wù)子集(主要是數(shù)值型任務(wù)),而基于Llama的驗(yàn)證或未過濾的數(shù)據(jù)集則保持了更廣泛的數(shù)據(jù)多樣性。

不僅如此,還有個意外發(fā)現(xiàn),未過濾數(shù)據(jù)集并未嚴(yán)重退化。盡管包含錯誤樣本,no_restrictions數(shù)據(jù)集在長時間訓(xùn)練中仍保持了競爭力。

下一步是什么?

通過這次更新,團(tuán)隊(duì)現(xiàn)已具備完成復(fù)刻DeepSeek-R1計(jì)劃第1步和第2步的主要組件:

圖片

在接下來的幾周,他們計(jì)劃重點(diǎn)關(guān)注:

  • 完善蒸餾數(shù)據(jù)集的組合,以訓(xùn)練通用推理模型。
  • 將GRPO擴(kuò)展到更大的模型,如Qwen/Qwen2.5-Coder-32B-Instruct,從而推導(dǎo)出R1-Zero變體。
  • 結(jié)合來自數(shù)學(xué)和代碼等多領(lǐng)域的獎勵信號,并引入獎勵模型來評分非推理數(shù)據(jù)。
責(zé)任編輯:張燕妮 來源: 新智元
相關(guān)推薦

2025-06-12 09:48:27

2025-02-19 08:00:00

2025-01-27 12:30:07

2025-03-07 08:50:03

2025-02-20 15:32:28

2025-01-26 12:08:03

2025-03-24 10:00:00

2025-03-27 10:28:32

2025-02-26 11:16:18

2025-04-14 09:27:00

2025-03-10 07:00:00

阿里開源QwQ-32B

2025-04-29 10:39:46

2025-03-13 08:13:47

DeepSeekMLLMVision-R1

2025-03-06 17:29:21

2025-02-07 13:10:06

2025-02-19 08:33:18

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

国产色视频一区二区三区qq号| 国产又黄又爽免费视频| 亚洲免费在线观看av| 思热99re视热频这里只精品| 在线观看不卡一区| 日日噜噜噜夜夜爽爽| 黄色av一区二区三区| 久久激情中文| 欧美成人精品在线视频| 国产亚洲色婷婷久久99精品91| 激情开心成人网| 一区二区在线看| 明星裸体视频一区二区| 国产精品久久久久久免费免熟| 日韩五码在线| 久久香蕉国产线看观看网| 亚洲av成人片无码| 色综合视频一区二区三区日韩 | 日韩av有码在线| 亚洲另类第一页| 欧美极品videos大乳护士| 亚洲欧洲av另类| 欧美午夜欧美| 日韩在线观看视频一区| 九九热在线视频观看这里只有精品 | 黑丝av在线播放| 在线欧美激情| 日本道精品一区二区三区| 日本黄色片一级片| 久草资源在线| 2017欧美狠狠色| 成人欧美一区二区三区在线观看| 亚洲熟妇av乱码在线观看| 香蕉久久久久久久av网站| 欧美疯狂做受xxxx高潮| 亚洲女人久久久| 欧美少妇性xxxx| 亚洲人在线观看| 人体私拍套图hdxxxx| 视频二区欧美| 欧美不卡在线视频| 成人不卡免费视频| 青青在线精品| 欧美军同video69gay| 国产精品久久久毛片| 美女100%一区| 日韩欧美国产免费播放| 日本人体一区二区| 金瓶狂野欧美性猛交xxxx| 亚洲美女屁股眼交3| 婷婷视频在线播放| 久草中文在线| 一区二区三区中文字幕精品精品 | 中文字幕一二三四区| 欧美a一欧美| 亚洲国产成人精品女人久久久| 少妇高潮一69aⅹ| 日韩有吗在线观看| 精品少妇一区二区三区视频免付费 | 日韩av在线天堂网| 亚洲综合自拍网| 亚洲免费观看高清完整版在线观| 精品中文视频在线| 亚洲码无人客一区二区三区| 免费看成人哺乳视频网站| 亚洲欧美综合v| 成人一级片免费看| 天天综合网网欲色| 欧美激情第99页| 日韩精品国产一区二区| 亚洲区第一页| 欧洲亚洲免费在线| 日韩欧美国产另类| 久草热8精品视频在线观看| 91久久中文字幕| 亚洲国产成人一区二区| 成人国产精品免费观看| 久久精品丝袜高跟鞋| 男男电影完整版在线观看| 久久亚洲私人国产精品va媚药| 鲁丝一区二区三区免费| av在线首页| 亚洲精品视频在线看| 美女扒开大腿让男人桶| 美女日韩欧美| 欧美二区三区的天堂| 制服丝袜av在线| 国产99久久久国产精品成人免费| 最新中文字幕亚洲| 国产无遮挡免费视频| 日韩在线观看一区二区| 91香蕉电影院| 四虎影视精品成人| 久久精品视频一区二区三区| 久久99国产精品一区| 国产精品vvv| 精品污污网站免费看| 亚洲精品鲁一鲁一区二区三区| 欧美美女黄色| 精品国内产的精品视频在线观看| 久久精品国产亚洲AV无码麻豆 | 成人免费看吃奶视频网站| 韩国av免费在线观看| 国产女人水真多18毛片18精品视频| 熟妇熟女乱妇乱女网站| 亚洲欧美一区二区三区| 91麻豆精品国产自产在线| xxxx黄色片| 五月天综合网站| 欧美专区在线播放| 国产成人免费看一级大黄| 久久日韩粉嫩一区二区三区| 欧美另类videosbestsex日本| 国产一区一一区高清不卡| 欧美xfplay| 黄色精品视频在线观看| 香蕉久久夜色精品| 丁香五月网久久综合| eeuss影院在线播放| 欧美日韩亚洲视频一区| 极品白嫩少妇无套内谢| 久久精品国产www456c0m| 欧美最近摘花xxxx摘花| 高清乱码毛片入口| 国产精品美女久久久久久2018| 国产极品尤物在线| 日韩一区二区三区高清在线观看| 中文字幕久热精品在线视频| 91精品国产高清一区二区三密臀| 成人免费三级在线| 青青草综合视频| 欧美综合社区国产| 最好看的2019的中文字幕视频| 性无码专区无码| 国产91在线观看丝袜| 超碰免费在线公开| 精品国产黄a∨片高清在线| 亚洲少妇中文在线| 天堂中文在线网| 91视视频在线直接观看在线看网页在线看| 色婷婷777777仙踪林| av成人在线网站| 久久亚洲精品网站| 国产精品人人爽| 亚洲欧美在线视频| 欧美国产日韩另类| 中文字幕一区二区三区乱码图片| 91精品视频在线看| 成人日韩欧美| 欧美一二三在线| 青青草激情视频| 国产成人免费在线观看不卡| 久久福利一区二区| 北条麻妃一区二区三区在线观看| 欧美黄色三级网站| 欧美 日韩 国产 成人 在线 91| 亚洲一区二区av电影| 国产十八熟妇av成人一区| 国产欧美午夜| 欧洲一区二区日韩在线视频观看免费| 涩涩涩视频在线观看| 亚洲视频一区二区| 又色又爽又黄无遮挡的免费视频| 中文字幕中文字幕一区二区| 日本中文字幕在线不卡| 亚洲激情国产| 日本视频一区在线观看| 国产第一亚洲| 色在人av网站天堂精品| 日本wwwxxxx| 色偷偷久久人人79超碰人人澡| 亚洲AV无码成人精品区明星换面| 青椒成人免费视频| 亚洲五码在线观看视频| 黄色欧美网站| 国产精品美女www| 含羞草www国产在线视频| 日韩一级高清毛片| 成人免费视频毛片| 国产精品国产自产拍高清av| 男人添女人荫蒂国产| 久久www成人_看片免费不卡| 一区二区成人国产精品 | av资源网一区| 成人亚洲精品777777大片| 91精品国产91久久久久久密臀| 成人午夜电影免费在线观看| 三级成人黄色影院| 久久艳片www.17c.com| 手机看片1024国产| 在线观看成人小视频| 久久久精品一区二区涩爱| 9色porny自拍视频一区二区| 日韩一区二区三区不卡视频| 精品9999| 在线不卡日本| 婷婷激情久久| 91在线视频九色| 亚洲欧美韩国| 欧美丰满老妇厨房牲生活| 国产一级免费在线观看| 欧美刺激午夜性久久久久久久| 日本视频免费观看| 亚洲一区日韩精品中文字幕| 亚洲av熟女国产一区二区性色| 国产91丝袜在线18| 亚洲欧洲日本精品| 一区二区国产在线观看| 最新不卡av| 自拍偷拍欧美一区| 粉嫩高清一区二区三区精品视频| 成人高清一区| 青草青草久热精品视频在线网站| av中文字幕在线观看| 在线观看不卡av| 五月婷婷六月丁香综合| 日韩午夜精品电影| 亚洲天堂777| 91精品办公室少妇高潮对白| 国产网站在线看| 亚洲精品一二三| 97在线观看免费高| 国产精品久久夜| 国产成人一区二区在线观看| 91丨porny丨户外露出| 娇妻高潮浓精白浆xxⅹ| 国产精品一卡二卡在线观看| 538任你躁在线精品免费| 免费在线亚洲欧美| 国产一级爱c视频| 黑丝一区二区三区| 狠狠精品干练久久久无码中文字幕 | 免费污视频在线一区| 8090成年在线看片午夜| xxx.xxx欧美| 欧美国产乱视频| 直接在线观看的三级网址| 日韩视频免费大全中文字幕| av在线播放免费| 亚洲视频在线免费观看| 你懂的免费在线观看视频网站| 亚洲精品www久久久| 免费观看成年人视频| 日韩欧美国产三级电影视频| 国产福利免费视频| 欧美一区二区女人| 国产黄色一区二区| 日韩一级黄色大片| 亚洲男女视频在线观看| 亚洲丁香久久久| 五月天福利视频| 日韩久久精品成人| 精品久久av| 中文国产成人精品| 69xxxx欧美| 久久精品视频99| 日本h片在线观看| 性欧美亚洲xxxx乳在线观看| 欧美aa在线观看| 人人爽久久涩噜噜噜网站| 欧美xxx网站| 国产欧美一区二区三区久久人妖| 日韩护士脚交太爽了| 91精品婷婷国产综合久久蝌蚪| 99国产精品免费网站| 国产在线资源一区| 国产欧美一区二区精品久久久| 色播五月综合| 亚洲欧洲中文字幕| 欧美一级免费播放| 久久亚洲不卡| 天堂中文av在线| 成人国产一区二区三区精品| 成年人网站免费在线观看| 中文一区在线播放| 青青草原在线免费观看视频| 欧美日韩一区免费| 亚洲综合精品国产一区二区三区| 日韩精品一区二区三区四区| 日本免费不卡| 久久精品国产精品亚洲| 91丝袜在线| 国产精品影院在线观看| 97久久亚洲| 五月婷婷一区| 今天的高清视频免费播放成人| 欧美a在线视频| 国产在线国偷精品产拍免费yy| 一级国产黄色片| |精品福利一区二区三区| 国产成人精品亚洲男人的天堂| 在线一区二区视频| 成人激情四射网| 国产一区二区三区在线观看网站 | 亚洲一区二区偷拍| 久久综合久色欧美综合狠狠| 成年人免费视频播放| 精品国产91久久久久久老师| 91国内精品视频| 国产午夜精品理论片a级探花| 免费a级在线播放| 欧美性资源免费| 亚洲视频国产| 一级特黄录像免费播放全99| 久久www成人_看片免费不卡| 国产精品嫩草69影院| 国产精品视频一区二区三区不卡| 日本少妇性生活| 欧美一区二区视频免费观看| 深夜福利免费在线观看| 久久精品国产91精品亚洲| 黄色成人在线网| 成人av电影天堂| 精品不卡一区| 国模吧无码一区二区三区| 国产99久久久国产精品潘金| 自拍偷拍第9页| 在线观看亚洲成人| 亚洲欧洲视频在线观看| 欧美理论片在线观看| 欧洲精品久久久久毛片完整版| 日本不卡一区二区三区视频| 亚洲乱码久久| 精品伦一区二区三区| 亚洲免费毛片网站| 这里只有精品9| 中文字幕精品网| 欧美精品总汇| 欧美aaaaa喷水| 亚洲欧美日韩专区| 你懂的在线观看网站| 亚洲一区二区高清| 亚洲精品911| 色综合天天综合网国产成人网| 亚洲人体在线| 最新视频 - x88av| 精品在线一区二区| 日本美女黄色一级片| 欧美视频中文字幕| 日韩伦理在线观看| 国产精品人成电影在线观看| 精品国产日韩欧美| 欧美国产日韩在线播放| 久久久国产午夜精品| www.色国产| 国产亚洲成精品久久| 欧美free嫩15| 伊人天天久久大香线蕉av色| 麻豆极品一区二区三区| 任你操精品视频| 制服丝袜一区二区三区| 在线中文字幕视频观看| 成人欧美一区二区| 国产欧美成人| 自拍偷拍视频亚洲| 欧美日韩国产高清一区二区| 天堂地址在线www| 成人在线精品视频| 欧美日韩一区二区三区四区在线观看 | 成人涩涩免费视频| www.日本精品| 一本大道亚洲视频| 日韩毛片网站| 久久综合久久久久| 91首页免费视频| 伊人久久成人网| 欧美肥婆姓交大片| 婷婷精品视频| 欧美男女交配视频| 亚洲免费在线看| 婷婷在线观看视频| 国产精品成人一区| 五月天激情综合网| 亚洲中文字幕无码av| 色婷婷激情综合| 视频免费一区| 国产视频一区二区三区四区| 另类国产ts人妖高潮视频| 久久久久人妻一区精品色| 日韩一卡二卡三卡| 国产精品原创| 亚洲一区二区三区在线观看视频| 国产精品888| 天天干,天天干| 色综合久久中文字幕综合网小说| 色先锋久久影院av| 五月天丁香花婷婷| 精品美女永久免费视频| av在线播放免费| 国产一区二区三区四区hd | 手机在线观看日韩av| 激情懂色av一区av二区av| 在线观看a视频| 国产一区在线免费观看| 老司机午夜精品视频在线观看| 中日韩一级黄色片| 日韩av一卡二卡| 91精品麻豆| 国产黄色特级片| 亚洲国产精品综合小说图片区|