精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

田淵棟和Sergey Levine參與開發(fā)新型RL算法,能通過多輪訓(xùn)練讓智能體學(xué)會協(xié)作推理

人工智能 新聞
強化學(xué)習(xí)提升了 LLM 各方面的能力,而強化學(xué)習(xí)本身也在進化。

現(xiàn)實世界中,很多任務(wù)很復(fù)雜,需要執(zhí)行一系列的決策。而要讓智能體在這些任務(wù)上實現(xiàn)最佳性能,通常需要直接在多輪相關(guān)目標(比如成功率)上執(zhí)行優(yōu)化。不過,相比于模仿每一輪中最可能的動作,這種方法的難度要大得多。

在直接優(yōu)化多輪目標方面,一類自然的方法是應(yīng)用單輪 RLHF 算法,例如 RAFT、DPO 和 PPO ,不過這些方法不會在不同輪次間執(zhí)行顯式的 credit 分配。因此,由于復(fù)雜順序決策任務(wù)的長期性,它們可能會出現(xiàn)高方差和較差的樣本復(fù)雜性等問題。

另一種選擇是應(yīng)用價值函數(shù)學(xué)習(xí)方法,例如 TD 學(xué)習(xí)。然而,這需要在 LLM 表征的基礎(chǔ)上訓(xùn)練一個新的特定于任務(wù)的價值頭,這可能無法在有限的微調(diào)數(shù)據(jù)下很好地泛化。因此,目前尚不清楚哪種多輪 RL 算法最有效,能夠充分利用 LLM 的推理能力來訓(xùn)練通用、有能力和目標導(dǎo)向的智能體。

近日,Meta FAIR 和加利福尼亞大學(xué)伯克利分校一個研究團隊在這個研究課題上取得了新的突破。首先,他們?yōu)樵搯栴}構(gòu)建了一個新的基準:ColBench(Collaborative Agent Benchmark)。在此基礎(chǔ)上,他們還提出了一種易于實現(xiàn)但非常有效的 RL 算法:SWEET-RL(RL with Step-WisE Evaluation from Training-Time Information)。

圖片

  • 論文標題:SWEET-RL: Training Multi-Turn LLM Agents on Collaborative Reasoning Tasks
  • 論文地址:https://arxiv.org/pdf/2503.15478
  • 代碼地址:https://github.com/facebookresearch/sweet_rl

這篇論文的一作為伯克利 AI 研究所(BAIR)二年級博士生周逸飛(Yifei Zhou)。并有多位著名 AI 研究者參與其中,包括田淵棟、Jason Weston 和 Sergey Levine。

下面我們就來簡單解讀一下這項研究,更多詳情請參閱原論文。

ColBench

先來看看他們提出的新基準。首先,為了解決為 LLM 智能體開發(fā)多輪 RL 算法的挑戰(zhàn),該團隊構(gòu)建了一些基本設(shè)計原則,包括:

  • 應(yīng)具有足夠的任務(wù)復(fù)雜性,可以挑戰(zhàn)智能體的推理和泛化能力。
  • 盡可能地降低開銷,以支持快速研究原型設(shè)計。
  • 應(yīng)該有足夠的任務(wù)多樣性,以便在 RL 訓(xùn)練時不會過擬合。

接下來,具體看看該基準中的兩個任務(wù):后端編程和前端設(shè)計。

圖片

后端編程協(xié)作

在此任務(wù)中,智能體需要與人類模擬器協(xié)作編寫自定義 Python 函數(shù)(最多 50 行)。

在協(xié)作開始時,智能體會先獲得高級描述和函數(shù)簽名。但并不會提供很多具體的細節(jié),例如應(yīng)考慮哪些條件以及在邊緣情況下該怎么做。智能體必須推理并決定需要人類模擬器提供哪些具體說明。人類模擬器需要根據(jù)只有它們自己可見的參考代碼,用自然語言對每個需要說明的問題提供簡要解釋,但不會編寫代碼。

智能體和人類模擬器之間的交互僅限于 10 輪來回。當(dāng)智能體決定給出最終解決方案或達到最大輪數(shù)時,交互結(jié)束。

在評估智能體是否成功時,需要對每個函數(shù)進行 10 次隱藏單元測試,并對每次協(xié)作給出 0 或 1 的獎勵。

前端設(shè)計協(xié)作

在此任務(wù)中,智能體需要與人類模擬器協(xié)作,通過編寫 HTML 代碼片段(約 100 行)來設(shè)計網(wǎng)頁。

在協(xié)作開始時,智能體會獲得網(wǎng)頁的高級描述。同樣,許多具體細節(jié)(例如網(wǎng)頁的布局和調(diào)色板)都缺失,只有人類模擬器才能看到。在每一輪中,智能體都有機會編寫 HTML 結(jié)果并通過 Web 瀏覽器呈現(xiàn)出來。人類模擬器可以對比來自智能體的網(wǎng)頁和參考網(wǎng)頁,然后向智能體描述它們的差異。與后端編程協(xié)作類似,當(dāng)智能體決定給出最終解決方案或達到最大 10 輪交互時,交互結(jié)束。

評估指標方面,使用了智能體解答與參考網(wǎng)頁之間的 CLIP 嵌入的余弦相似度。同樣,協(xié)作結(jié)束時,會發(fā)放 0 或 1 的獎勵。

表 1 比較了 ColBench 與現(xiàn)有的其它基準。

圖片

SWEET-RL

SWEET-RL 是一種兩階段訓(xùn)練方法,如圖 2 所示。

圖片

第一階段:學(xué)習(xí)各個輪次的優(yōu)勢函數(shù)

為了在推理密集型任務(wù)中執(zhí)行顯式 credit 分配,之前一些研究使用的方法是:先學(xué)習(xí)一個顯式的價值函數(shù),然后從學(xué)習(xí)到的價值函數(shù)中得出每個單獨動作的優(yōu)勢。

然而,該團隊的實驗發(fā)現(xiàn),當(dāng)微調(diào)只能使用有限數(shù)量的樣本時,這種價值函數(shù)不能很好地泛化。他們猜想這是因為在推理密集型任務(wù)中學(xué)習(xí)準確的價值函數(shù)本身就是一項艱巨的任務(wù),并且不能有效地利用預(yù)訓(xùn)練 LLM 的推理和泛化能力。

由于執(zhí)行 credit 分配的最終目標是得出每個動作的優(yōu)勢,這對于 LLM 來說可能比估計預(yù)期的未來回報更容易,因此該團隊提出直接學(xué)習(xí)每個輪次動作的優(yōu)勢函數(shù)。

考慮到偏好優(yōu)化已經(jīng)在 LLM 微調(diào)方面得到成功應(yīng)用,因此該團隊提出根據(jù)軌跡的偏好對來訓(xùn)練每輪次優(yōu)勢函數(shù)。

給定同一任務(wù)的兩條軌跡,并附加訓(xùn)練時間信息 c,根據(jù)它們的累積獎勵將它們標記為選取 τ+ 和拒絕 τ?。這樣一來,便可以采用 Bradley-Terry 目標進行微調(diào):

圖片

然后,可以使用優(yōu)勢函數(shù)重寫這個目標函數(shù):

圖片

直觀地講,類似于單輪 RLHF 的目標,即學(xué)習(xí)每個選取響應(yīng)的高獎勵和每個拒絕響應(yīng)的低獎勵,2 式的效果是增加選取軌跡中每個動作的優(yōu)勢并降低拒絕軌跡中每個動作的優(yōu)勢。

為了進一步將學(xué)習(xí)目標與下一 token 預(yù)測預(yù)訓(xùn)練對齊,該團隊的做法是重新利用 LLM 的現(xiàn)有語言模型頭來參數(shù)化優(yōu)勢函數(shù):

圖片

第二階段:通過每輪流的優(yōu)勢優(yōu)化智能體

該團隊得到的一個重要觀察是:雖然最終策略 π_φ 不能以隱藏信息 h 為條件,但此類信息在訓(xùn)練期間是可用的。由于優(yōu)勢 LLM π_θ 只會在訓(xùn)練期間使用,因此它可以將 c 作為 3 式的輸入。

直觀地講,許多現(xiàn)實問題(例如協(xié)作和數(shù)學(xué)推理)都具有一些隱藏的訓(xùn)練時間信息,例如參考解。如果每輪次的優(yōu)勢函數(shù)可以訪問此類訓(xùn)練時間信息,那么它應(yīng)該能夠更好地判斷策略采取的行動是否在正確的軌道上。

因此,他們?yōu)槊枯喆蔚膬?yōu)勢函數(shù)提供了額外的訓(xùn)練時間信息 c,而僅向策略提供了交互歷史 o_t,從而產(chǎn)生了不對稱的 actor-critic 結(jié)構(gòu)。原則上,RLHF 文獻中的任何成功算法都可用于優(yōu)化每輪次策略 π_φ,方法是將交互歷史視為提示詞,將每輪次優(yōu)勢函數(shù) A_θ 視為獎勵模型。在訓(xùn)練策略的這個階段,不需要人類合作者的互動。

為了簡單,該團隊選擇使用 DPO 進行訓(xùn)練。對于每個輪次 t,首先從給定交互歷史 o_t 的當(dāng)前策略中抽取候選動作,并根據(jù)學(xué)習(xí)到的每輪次優(yōu)勢函數(shù)對它們進行排序,以獲得要選取和拒絕的動作。然后,使用標準 DPO 損失優(yōu)化每個輪次的策略:

圖片

在實踐中,每個輪次都會采樣 16 個候選動作,并從前 50% 分位數(shù)中隨機選擇動作作為選取動作,從后 50% 分位數(shù)中隨機選擇動作作為拒絕動作。

實驗表現(xiàn)

作為多輪強化學(xué)習(xí)算法,SWEET-RL 究竟能不能有效地訓(xùn)練 LLM 智能體來完成復(fù)雜的協(xié)作任務(wù)呢?為此,該團隊進行了實驗驗證。

在 ColBench 上的表現(xiàn)

表 2 展示了在 ColBench 上,不同 LLM 和多輪 RL 算法的性能情況。

圖片

首先,比較「單輪」結(jié)果和其他協(xié)作結(jié)果,可以看到多輪協(xié)作可以通過將最終結(jié)果與人類模擬器的參考「期望」更緊密地結(jié)合起來,從而大大提高 LLM 智能體在 artifact 創(chuàng)建方面的性能。如果智能體必須在一個輪次內(nèi)直接生產(chǎn)最終結(jié)果,那么即使是表現(xiàn)最好的 GPT-4o 也只能達到 16.2%。相比之下,如果讓所有模型有機會與人類模擬器進行多輪交互并收集更多信息,則所有模型的成功率都能倍增(例如,Llama-3.1-8B-Instruct 的成功率從 6.9% 增加到 22.4%)。

盡管如此,即使對于 GPT-4o 和 o1-mini 等專有 LLM 來說,多輪協(xié)作仍然是一項具有挑戰(zhàn)性的任務(wù),它們的成功率分別只能達到 40.4% 和 30.3%。盡管 o1-mini 在數(shù)學(xué)和編碼等符號推理任務(wù)上有所改進,但該團隊觀察到這些改進并沒有直接讓多輪協(xié)作智能體采用更好的策略,這表明為了讓 LLM 優(yōu)化與人類的協(xié)作,下游微調(diào)仍然是必要的。

SWEET-RL 與其它算法的比較

在使用下游數(shù)據(jù)進行微調(diào)后,可以看到即使是最簡單的 RL 算法拒絕式微調(diào)(Rejection Fine-Tuning)也可以提高在這兩項任務(wù)上的性能。具體來說,后端編程成功率和前端設(shè)計成功率分別提高了 5.8% 和 4.8%。

然而,該團隊觀察到,拒絕式微調(diào)往往只是教 LLM「記住」每個訓(xùn)練任務(wù)的解決方案,而沒有學(xué)習(xí)一種可泛化的策略來應(yīng)對新的測試任務(wù)。

多輪次 DPO 通過為被拒絕的軌跡引入「負梯度」可以緩解這個問題,但如果沒有在長期時間上進行適當(dāng)?shù)?credit 分配,改進仍然有限。

而如果利用訓(xùn)練時間信息顯式地訓(xùn)練每輪次的獎勵模型來執(zhí)行 credit 分配,可以觀察到相比于多輪次 DPO,SWEET-RL 在兩個任務(wù)上都有顯著提升(后端編程成功率提高 6%,前端設(shè)計勝率提高 5.4%)。

事實上,使用 Llama-3.18B-Instruct 得到的 SWEET-RL 模型不僅在參數(shù)上與 Llama-3.1-70B-Instruct 的性能相當(dāng),而且在性能上也足以與 GPT-4o 和 o1-mini 等 SOTA 專有模型比肩。

有關(guān) SWEET-RL 的更多實驗細節(jié)和分析請參閱原論文。

責(zé)任編輯:張燕妮 來源: 機器之心
相關(guān)推薦

2025-10-08 10:19:29

2024-10-28 08:50:00

2024-03-08 12:35:41

模型數(shù)據(jù)

2024-02-26 00:20:00

AI模型

2024-12-12 09:00:00

2024-12-19 09:48:07

2025-09-24 09:10:24

2023-03-17 08:28:17

GPT-4AI

2025-02-17 09:30:00

AI訓(xùn)練模型

2023-12-26 12:12:01

模型訓(xùn)練

2021-12-06 17:38:51

強化學(xué)習(xí)工具人工智能

2024-10-17 14:10:00

模型訓(xùn)練

2023-06-12 09:57:22

AIChatGPT

2025-07-30 01:00:00

多智能體智能體Agent

2023-12-07 06:51:18

AI模型

2025-10-27 08:47:00

2025-06-20 08:47:00

量子計算AI模型

2020-09-22 09:54:19

谷歌Android開發(fā)者

2025-10-23 12:28:40

2024-09-20 15:35:33

點贊
收藏

51CTO技術(shù)棧公眾號

强开小嫩苞一区二区三区网站 | 国产在线久久久| av片在线免费看| 久久久久久爱| 色一区在线观看| 国产人妻人伦精品| 精品资源在线看| 国产精品88av| 国产精品久久久久久久久久免费| 久久r这里只有精品| 少妇精品久久久一区二区| 91精品国产一区二区三区| 精品99在线视频| 2020国产在线视频| 国产夜色精品一区二区av| 超碰在线97av| 国产精品无码久久久久成人app| 在线看片一区| 麻豆成人在线看| www.中文字幕av| 视频精品一区| 欧美精品久久久久久久多人混战| www一区二区www免费| 麻豆视频在线观看免费| 久久影院电视剧免费观看| av资源站久久亚洲| 91theporn国产在线观看| 午夜影院日韩| 91国内产香蕉| 粉嫩aⅴ一区二区三区| 一区二区三区在线电影| 中文字幕欧美日韩精品| 四虎影成人精品a片| 精品精品国产三级a∨在线| 91精品国产乱| 91小视频在线播放| 久久人人视频| 欧美三级日韩三级| 999精品网站| 精产国品一区二区| 国内精品一区二区| 亚洲一区在线观看免费 | 视频一区二区精品| 亚洲国产小视频在线观看| 久久国产精品毛片| 色一区在线观看| 国产尤物av一区二区三区| 超碰国产在线| 国产午夜精品一区二区| 免费国产一区| 午夜视频免费在线| 国产成人av资源| av成人免费观看| 国产男男gay体育生白袜| jizzjizz少妇亚洲水多| 国产目拍亚洲精品99久久精品| 国内精品视频免费| 污污视频在线免费看| av亚洲精华国产精华精| 国产在线一区二| 五月天婷婷在线观看| 91亚洲永久精品| 免费看成人午夜电影| 黄色片免费在线| 欧美激情在线一区二区| 亚洲一区二区三区在线观看视频 | 成人黄色免费网站| 欧美私模裸体表演在线观看| 日本激情综合网| 欧美一级做一级爱a做片性| 在线不卡的av| 在线播放av网址| 牲欧美videos精品| 国产亚洲激情视频在线| 国精品人伦一区二区三区蜜桃| 天天天综合网| 久久久久久国产精品| 日韩熟女精品一区二区三区| 久久综合九色综合欧美狠狠| 国产精品一区二区久久国产| 国产特级黄色片| 99精品国产91久久久久久| 欧美在线一区二区三区四区| 在线观看免费高清完整| 一区二区成人在线| 人妻丰满熟妇av无码区app| 亚洲男人在线| 亚洲精品按摩视频| 日韩欧美在线视频播放| 国产伊人精品| 国产精品都在这里| 亚洲av少妇一区二区在线观看| eeuss鲁片一区二区三区在线观看| 日韩国产高清一区| 欧洲性视频在线播放| 色狠狠一区二区| www.com污| 性人久久久久| 欧美国产在线视频| 欧美日韩 一区二区三区| 国产尤物一区二区在线| 美女精品国产| 亚洲七七久久综合桃花剧情介绍| 欧美香蕉大胸在线视频观看| 国产免费中文字幕| 国产精品片aa在线观看| 欧美猛交ⅹxxx乱大交视频| 特级西西444www大精品视频免费看| 老司机免费视频一区二区| 国产视色精品亚洲一区二区| 日本三级视频在线播放| 狠狠躁夜夜躁人人爽天天天天97 | **国产精品| 国产视频自拍一区| 欧美精品一区二区蜜桃| 日韩精品免费视频人成| 精品日本一区二区| 超鹏97在线| 91福利资源站| 无码一区二区精品| 欧美性久久久| 成人欧美在线观看| 午夜激情在线观看| 色综合网站在线| 成人在线视频免费播放| 欧美激情在线| 91日本视频在线| 91福利在线视频| 色视频成人在线观看免| 一级特级黄色片| 极品中文字幕一区| 亚洲综合中文字幕在线| 老司机精品视频在线观看6| 色婷婷亚洲综合| 中文字幕免费高清视频| 欧美日韩少妇| 91成人免费看| 亚洲wwwww| 欧美一区二区三区公司| 国产67194| 国产精品小仙女| 黄色影视在线观看| 欧美日本三级| 欧美国产日韩一区二区三区| jizz中国少妇| 亚洲中国最大av网站| 久草福利在线观看| 欧美日韩伊人| 国内成+人亚洲| 女海盗2成人h版中文字幕| 亚洲国内精品视频| 伊人中文字幕在线观看| 国产亚洲午夜高清国产拍精品| 欧美少妇性生活视频| 欧美日韩在线观看视频小说| 国产成人极品视频| 在线看免费av| 欧美一级艳片视频免费观看| 久久99久久久| 91麻豆精品视频| 密臀av一区二区三区| 久久高清免费| 92看片淫黄大片看国产片| 日本无删减在线| 日韩电影大全免费观看2023年上| 色一情一乱一伦| 久久久综合精品| 日本成人中文字幕在线| 日韩激情图片| 7777精品伊久久久大香线蕉语言| av在线加勒比| 亚洲欧美日韩网| 亚洲无码久久久久| 亚洲精品国产无套在线观| 日韩av手机在线播放| 久久久精品网| 男同互操gay射视频在线看| 国产96在线亚洲| 国产精品91久久久久久| 免费黄网在线观看| 精品国产髙清在线看国产毛片| 亚洲免费在线视频观看| 国产精品丝袜在线| 四虎精品一区二区| 日本美女一区二区| 日本中文字幕一级片| 午夜精品影视国产一区在线麻豆| 国产精品视频一区国模私拍| 黄网av在线| 亚洲最新中文字幕| 国产91绿帽单男绿奴| 欧洲av在线精品| 免费人成年激情视频在线观看| 99re66热这里只有精品3直播| 另类小说色综合| 亚洲韩日在线| 欧美aaa在线观看| 日韩极品在线| 97免费资源站| 99欧美精品| 国产做受69高潮| 国产最新在线| 亚洲视频在线播放| 欧美视频xxx| 欧美精品久久久久久久多人混战 | 免费无遮挡无码永久在线观看视频| 95精品视频在线| 成人免费播放视频| 日本不卡的三区四区五区| 国产日韩欧美精品在线观看| 欧美hd在线| 欧洲一区二区在线| 欧美男男freegayvideosroom| 成人自拍性视频| 亚洲日本在线观看视频| 海角国产乱辈乱精品视频| 黄色片免费在线观看| 在线日韩日本国产亚洲| 四虎在线观看| 亚洲国产精品高清久久久| 国产手机av在线| 欧美高清视频一二三区| 精品一区二区无码| 狠狠干狠狠久久| 久草精品视频在线观看| 一区二区三区四区激情 | 中文字幕免费精品| 亚洲五月六月| 日本道不卡免费一区| 欧美一区二区三区在线免费观看| 国产一区福利| 国产欧美一区二区三区另类精品| 秋霞午夜一区二区三区视频| 91精品视频免费| 日日夜夜精品| 国产专区精品视频| 色综合一区二区日本韩国亚洲 | 中文字幕+乱码+中文乱码91| 一本色道久久综合亚洲精品按摩| 黑人一级大毛片| 精品久久久久久国产91| 五月天综合激情| 精品免费在线视频| 免费看日韩毛片| 日韩欧美国产高清91| wwwwww国产| 欧美伊人精品成人久久综合97| 欧美日韩a v| 在线精品视频免费观看| 中文字幕 国产精品| 在线免费观看日本欧美| 亚洲天堂手机版| 欧美精品 国产精品| 国产av无码专区亚洲av| 日韩精品一区二| 午夜性色福利影院| 亚洲人成绝费网站色www| 高清美女视频一区| 精品国产网站地址| 中文在线免费| 久久久久久久久电影| 色偷偷色偷偷色偷偷在线视频| 日本最新高清不卡中文字幕| 成人精品国产亚洲| 91免费版黄色| 久久亚州av| 日韩欧美在线一区二区| 图片区亚洲欧美小说区| 免费人成自慰网站| 快she精品国产999| 国产5g成人5g天天爽| 成人午夜在线免费| 免费一级做a爰片久久毛片潮| 国产精品成人一区二区艾草| 免费在线视频观看| 色一情一乱一乱一91av| 999国产精品视频免费| 亚洲精品成人免费| 91视频在线观看| 九九精品在线视频| 欧美特黄aaaaaaaa大片| 亚洲一区二区三区777| 欧美aaaaa级| 亚洲无玛一区| 国产日韩欧美在线播放不卡| 天天干天天玩天天操| 成人午夜电影小说| 中文乱码字幕高清一区二区| 亚洲一区二区三区三| 亚洲av综合一区| 精品对白一区国产伦| 思思99re6国产在线播放| 久久全球大尺度高清视频| 国产精品无码久久久久| 黄色小网站91| 中出一区二区| 欧美国产日韩在线播放| 成人性生交大片| 欧美性x x x| 色屁屁一区二区| 男人天堂网在线视频| www.色综合| 欧美magnet| 国产日韩欧美精品| 99视频精品全国免费| 超碰影院在线观看| hitomi一区二区三区精品| 男人操女人的视频网站| 在线精品视频小说1| 天堂av在线播放| 欧美激情一级欧美精品| 国产一区 二区| 亚洲精品中文字幕乱码三区不卡| 亚洲一区日韩| 影音先锋资源av| 亚洲精品免费看| 国产精品无码在线播放| 中文字幕欧美日韩| 视频在线日韩| 欧美精品123| 亚洲一区二区动漫| www男人天堂| 一区二区三区资源| 99热这里是精品| 日韩在线资源网| 国产亚洲欧美日韩精品一区二区三区 | 99精品国产热久久91蜜凸| 麻豆亚洲av成人无码久久精品| 欧美日本乱大交xxxxx| 97电影在线| 国产精品久久久| 欧州一区二区| 情侣黄网站免费看| 91免费观看视频在线| 久久久久久久极品| 国产视频精品自拍| 欧美大片1688| 日产国产精品精品a∨| 日韩国产在线观看| 538精品视频| 欧美日韩在线播| 视频免费一区| 91中文字幕在线观看| 91精品国产视频| 亚洲一级片免费观看| 亚洲一区在线观看免费| 日本成人动漫在线观看| 97在线精品视频| 久久91成人| 中文字幕av不卡在线| 国产精品免费aⅴ片在线观看| 又色又爽又黄无遮挡的免费视频| 中文字幕亚洲国产| 99久久99九九99九九九| 一二三四中文字幕| 91在线小视频| 久久久精品毛片| 久久精品中文字幕| 欧美成人精品一级| 婷婷无套内射影院| 国产日产精品1区| 一级片在线免费观看视频| 欧美大尺度在线观看| 精品国产一区二区三区成人影院| 丁香啪啪综合成人亚洲| 国产精品美女一区二区在线观看| 97久久人国产精品婷婷| 欧美极品美女电影一区| 久草精品在线| 人妻体体内射精一区二区| 精品国产91久久久久久老师| 国产三级在线| 亚洲free性xxxx护士hd| av不卡在线看| 精品少妇一区二区三区密爱| 日韩亚洲电影在线| 欧美电影免费观看高清完整| 亚洲看片网站| 成人精品免费视频| 一级久久久久久| 欧美激情精品久久久久久| 欧美精美视频| 成人性生交视频免费观看| 欧美日韩国产专区| 国产一二区在线观看| 久久综合九色综合网站| 韩国成人在线视频| 国语对白永久免费| 久久夜色精品国产亚洲aⅴ| 小嫩嫩12欧美| 在线播放国产视频| 欧美天堂亚洲电影院在线播放| 日韩伦理av| 亚洲精品成人三区| aaa亚洲精品| 精品国产无码AV| 国产精品美女在线观看| 一本一本久久| 欧美色图一区二区| 最近2019年日本中文免费字幕|