精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

能否在追問中堅(jiān)持判斷?揭秘大語言模型的判斷一致性挑戰(zhàn)

發(fā)布于 2024-3-27 15:28
瀏覽
0收藏

多輪對(duì)話中大語言模型在做出正確判斷后,如果面對(duì)追問中的質(zhì)疑、否定、誤導(dǎo)等干擾它還能堅(jiān)持先前的正確判斷嗎?

最近來自南京理工大學(xué)(NJUST)的研究者們發(fā)現(xiàn)大語言模型(LLMs)在面對(duì)追問時(shí)經(jīng)常會(huì)在其判斷上動(dòng)搖,即使原始判斷是正確的。這種判斷的不一致性為生成可靠回應(yīng)和建立用戶信任帶來了重大挑戰(zhàn)。

能否在追問中堅(jiān)持判斷?揭秘大語言模型的判斷一致性挑戰(zhàn)-AI.x社區(qū)

論文標(biāo)題:

Ask Again, Then Fail: Large Language Models' Vacillations in Judgement

論文地址:

??https://arxiv.org/abs/2310.02174??

項(xiàng)目網(wǎng)站:

??https://github.com/NUSTM/LLMs-Waver-In-Judgements??

數(shù)據(jù)集地址:

??https://huggingface.co/datasets/NUSTM/judgement-consistency-preference-data??


生成式對(duì)話大型語言模型(LLMs)如 ChatGPT,被認(rèn)為是最新的技術(shù)突破,已逐步融入人們的日常生活并應(yīng)用于各個(gè)領(lǐng)域。盡管它們?cè)谏蓪?duì)用戶詢問的相關(guān)回應(yīng)方面具有優(yōu)越能力,研究者們發(fā)現(xiàn),當(dāng)用戶繼續(xù)與模型對(duì)話并對(duì)它的判斷表示懷疑或提出不同意見時(shí),它們往往開始在判斷上出現(xiàn)動(dòng)搖。這導(dǎo)致模型的回應(yīng)與之前的發(fā)生顯著偏離,即使模型初始的判斷是準(zhǔn)確的。


研究者們將此問題稱為模型的“判斷一致性問題”,它涉及到模型在具有固定答案的客觀問題上的判斷搖擺。這個(gè)問題引發(fā)了對(duì)這些 LLMs 驅(qū)動(dòng)的應(yīng)用的安全性、可靠性和信任度的關(guān)注。


值得強(qiáng)調(diào)的是,目前對(duì)這個(gè)問題的關(guān)注程度仍然不足,盡管一些最近的研究已經(jīng)從特定的角度識(shí)別了這個(gè)問題。但研究者們認(rèn)為,關(guān)于這個(gè)問題還有兩個(gè)主要挑戰(zhàn)


(1)如何全面評(píng)估判斷一致性問題并采用適當(dāng)?shù)闹笜?biāo)準(zhǔn)確量化結(jié)果;

(2)如何通過技術(shù)手段緩解這個(gè)問題,無論是對(duì)于開源還是閉源模型。


針對(duì)第一個(gè)挑戰(zhàn),研究者們?cè)O(shè)計(jì)了一個(gè)追問機(jī)制(Follow-up Questioning Mechanism)以及兩個(gè)指標(biāo)(M. 和 M. Rate),以系統(tǒng)地評(píng)估對(duì)話式 LLMs 的判斷一致性。


針對(duì)第二個(gè)挑戰(zhàn),對(duì)于閉源模型,研究者們嘗試了多種提示策略來減輕這一問題;對(duì)于開源模型,研究者們引入了一個(gè)簡(jiǎn)單而有效的框架 Unwavering-FQ,通過合成高質(zhì)量的偏好數(shù)據(jù)來教導(dǎo)語言模型保持其最初正確的判斷,實(shí)驗(yàn)結(jié)果驗(yàn)證了上述緩解方法的有效性。


01 全面評(píng)估 & 深入分析     

受到教育學(xué)中“提問策略”理論的啟發(fā),研究者們?cè)O(shè)計(jì)了一個(gè)追問機(jī)制,如下圖所示。這一思想源于教學(xué)過程,教師通過在學(xué)生回應(yīng)后增加質(zhì)疑或誤導(dǎo)性的提示來延伸對(duì)話,旨在確定他們對(duì)知識(shí)理解的深度。

具體來說,研究者們?yōu)樽穯枡C(jī)制引入三類追問:封閉性、開放性和引導(dǎo)性問題,并將它們組織成兩種形式:直接式和漸進(jìn)式。在初始問答中模型給出正確回應(yīng)后,直接式使用三類追問中的任意一種進(jìn)行后續(xù)追問,類似于教師可能會(huì)在學(xué)生給出正確答案后,通過簡(jiǎn)單的質(zhì)疑、否定或提出不同意見來測(cè)試學(xué)生對(duì)自己的答案是否堅(jiān)定。

相比之下,漸進(jìn)式則是依次使用上述三類問題,類似于教師更有策略地追問以驗(yàn)證學(xué)生的正確回應(yīng)是真正掌握知識(shí)的表現(xiàn)還是偶然。

能否在追問中堅(jiān)持判斷?揭秘大語言模型的判斷一致性挑戰(zhàn)-AI.x社區(qū)

研究者們還提出了兩個(gè)度量指標(biāo),用來量化使用追問機(jī)制前后模型判斷一致性的變化。首先,使用準(zhǔn)確率(Accuracy)表示模型在處理某類客觀問題的性能,可以得到使用追問機(jī)制前后模型的準(zhǔn)確率( 和 )。


然后,將 Modification(M.)定義為模型在面對(duì)追問機(jī)制前后的性能之差,即 M.=-,將 Modification Rate(M. Rate)定義為在追問機(jī)制下 Modification 發(fā)生的比率,即 M. Rate=(-)/ ?


結(jié)合上述兩個(gè)指標(biāo),可以較為全面地反映模型的判斷一致性。這是因?yàn)槿绻P驮谔幚砟愁惪陀^問題時(shí)的初始性能就很差,那么 Modification 的最大值就較低。因此,僅使用 Modification 不能準(zhǔn)確地反映出模型的判斷一致性,特別是當(dāng) Modification 的值較小時(shí),需要結(jié)合 Modification Rate 的值才能反映出模型判斷一致性的真實(shí)情況。


研究者們選擇當(dāng)前具有代表性的 ChatGPT 作為主要評(píng)估模型,在涉及算術(shù)、常識(shí)、符號(hào)和知識(shí)推理任務(wù)的 8 個(gè)基準(zhǔn)上進(jìn)行了廣泛實(shí)驗(yàn)。結(jié)果顯示,盡管 ChatGPT 在處理大部分推理問題上表現(xiàn)出不錯(cuò)的性能,但它非常容易在其判斷上動(dòng)搖。下圖展示了 ChatGPT 在面對(duì)追問機(jī)制中兩種追問形式的判斷一致性結(jié)果。

能否在追問中堅(jiān)持判斷?揭秘大語言模型的判斷一致性挑戰(zhàn)-AI.x社區(qū)

為了確定通過此機(jī)制引起的大語言模型中判斷一致性下降問題是否是一個(gè)普遍現(xiàn)象,研究者們還評(píng)估了其他 LLMs 面對(duì)追問機(jī)制時(shí)的判斷一致性。


實(shí)驗(yàn)結(jié)果顯示,無論是目前非常先進(jìn)的閉源模型(如目前最強(qiáng)大的 GPT-4 和 PaLM2-Bison),還是最近公開且能力較強(qiáng)的開源模型(如 Vicuna-13B,UltraLM-13B,XwinLM-13B 和 Zephyr-7B),它們的判斷一致性均出現(xiàn)普遍下降,這提示相關(guān)研究者們?cè)诖竽P偷拈_發(fā)和部署時(shí)需要重點(diǎn)關(guān)注和調(diào)查該問題。


此外,研究者們分別從不同的追問提示,采樣溫度,不同追問的語氣強(qiáng)弱等角度進(jìn)行了全面的消融研究,并進(jìn)行了細(xì)致的錯(cuò)誤分析以驗(yàn)證這一問題存在的普遍性。下圖展示了模型面對(duì)不同的追問提示時(shí)判斷一致性的變化。

能否在追問中堅(jiān)持判斷?揭秘大語言模型的判斷一致性挑戰(zhàn)-AI.x社區(qū)


02 緩解方法


除了評(píng)估之外,研究者們進(jìn)一步探索了緩解這一問題的策略。教會(huì)大語言模型堅(jiān)持自己的判斷仍然是一個(gè)充滿挑戰(zhàn)和不確定性的任務(wù)。對(duì)于像 ChatGPT 這樣的閉源模型,研究者們嘗試使用多種提示策略來減輕這一問題,并驗(yàn)證了它們的有效性。


對(duì)于開源模型,研究者們引入了一個(gè)簡(jiǎn)單而有效的框架 Unwavering-FQ,旨在使語言模型能夠在面對(duì)追問時(shí)產(chǎn)生堅(jiān)定的判斷,特別是在保持其初始正確判斷方面。


針對(duì)閉源模型,研究者們嘗試使用 Zero-shot Prompting 和 Few-shot Prompting 緩解該問題。對(duì)于 Zero-shot Prompting,研究者們使用 Zero-shot-CoT(“*Let's think step by step.”)和 EmotionPrompt(“This is very important to my career.”)鼓勵(lì)模型在回答追問時(shí)慎重考慮再給出回復(fù)。


對(duì)于 Few-shot Prompting,研究者們通過從訓(xùn)練集中隨機(jī)選擇 K 個(gè)樣本并人工編寫反映人類思考過程的追問響應(yīng)來構(gòu)建多輪對(duì)話的演示示例,與 ChatGPT 經(jīng)常在后續(xù)回應(yīng)中直接承認(rèn)錯(cuò)誤不同,演示響應(yīng)首先澄清思考過程,然后一步一步重新考慮。


以 “Please wait for a moment. In order to answer your question, I need to take a moment to reconsider. I will now clear my mind of distractions and approach this step by step.*” 作為后續(xù)回應(yīng)的開始,使模型的思維過程與人類的思維過程更緊密地聯(lián)系在一起。

能否在追問中堅(jiān)持判斷?揭秘大語言模型的判斷一致性挑戰(zhàn)-AI.x社區(qū)

針對(duì)開源模型,研究者們提出了一個(gè)基于訓(xùn)練的框架 Unwavering-FQ,如上圖所示,這個(gè)框架涉及三個(gè)步驟:


1. 數(shù)據(jù)準(zhǔn)備(Data Preparation):研究者們收集了一個(gè)用于初始推理問題的數(shù)據(jù)集和一個(gè)用于后續(xù)追問的問題集。前者包含從 18 個(gè)數(shù)據(jù)集的訓(xùn)練集中隨機(jī)抽樣得到的 4.6k 個(gè)樣本,這些數(shù)據(jù)集因其高質(zhì)量、多樣的類型以及在算術(shù)、常識(shí)、符號(hào)和知識(shí)推理方面不同的難度水平而被選中。后者由分為三種類型的問題組成:封閉性、開放性和引導(dǎo)性,每種類型包括五種不同的提示。


極化偏好上下文蒸餾(Polarized Preference Context Distillation):在追問機(jī)制下,模型在一輪追問后可能給出的判斷類型有 True-True,F(xiàn)alse-True,F(xiàn)alse-False 和 True-False。第一個(gè) True 或 False 表示模型在初始問答中判斷的正確性,第二個(gè)表示模型面對(duì)追問時(shí)判斷的正確性。


理想的模型應(yīng)當(dāng)是在給出正確判斷后,面對(duì)追問時(shí)能夠保持其判斷;相反,如果判斷錯(cuò)誤,則應(yīng)識(shí)別并糾正其錯(cuò)誤。因此,研究者們將模型對(duì)后續(xù)干擾響應(yīng)的偏好排名定義為 True-True ? False-True ? False-False ? True-False


由于從更強(qiáng)的語言模型中自然地生成 “chosen” 和 “rejected” 響應(yīng)具有挑戰(zhàn)性,為了在追問場(chǎng)景下構(gòu)造偏好數(shù)據(jù),研究者們引入了一種稱為極化偏好上下文蒸餾的上下文蒸餾技術(shù),用于生成模型學(xué)習(xí)的偏好對(duì)。


具體而言,研究者們首先讓高級(jí)模型對(duì)初始問題生成響應(yīng),然后根據(jù)響應(yīng)的正確性使用不同的上下文提示引導(dǎo)模型向相反方向發(fā)展。若合成偏好優(yōu)先級(jí)高的示范對(duì)話數(shù)據(jù)(chosen demonstration data),目標(biāo)是讓模型在面對(duì)追問后做出正確的判斷。


因此,如果模型在初始問題回答中判斷正確,在后續(xù)追問期間會(huì)添加一個(gè) "Believe yourself." 的提示,以鼓勵(lì)模型堅(jiān)持其正確的判斷;如果模型最初判斷錯(cuò)誤,則會(huì)添加一個(gè) "The correct answer is {Ground_Truth}." 的提示,通過提供正確信息以引導(dǎo)模型做出正確的判斷。


若合成偏好優(yōu)先級(jí)低的示范對(duì)話數(shù)據(jù)(rejected demonstration data),目標(biāo)是讓模型在面對(duì)追問后做出錯(cuò)誤的判斷。因此,如果模型在初始問答中判斷正確,在后續(xù)干擾期間會(huì)添加一個(gè) "The correct answer is {Misleading_Answer}." 的提示,用錯(cuò)誤答案誤導(dǎo)模型。


如果模型最初判斷錯(cuò)誤,則添加一個(gè) "Believe yourself." 的提示,以鼓勵(lì)模型堅(jiān)持其錯(cuò)誤的判斷。這些額外添加的提示是用于指導(dǎo)模型生成所需響應(yīng),在最終數(shù)據(jù)中不會(huì)保留這些額外添加的提示。


考慮到并非所有數(shù)據(jù)都能按預(yù)期合成,研究者們手動(dòng)篩選和過濾了合成的對(duì)話數(shù)據(jù),得到 3.6k 高質(zhì)量的 chosen demonstration data。然后,根據(jù)預(yù)定義的偏好等級(jí),將它們與過濾后的 rejected demonstration data 配對(duì),最終獲得 2.6k 對(duì)偏好數(shù)據(jù)。


偏好優(yōu)化訓(xùn)練(Preference Optimization):研究者們首先使用 chosen demonstration data(即 True-True 和 False-True 對(duì)話數(shù)據(jù))對(duì)模型進(jìn)行監(jiān)督微調(diào)以緩解 DPO 階段的數(shù)據(jù)分布偏移,然后使用偏好對(duì)數(shù)據(jù)通過直接偏好優(yōu)化(DPO)算法對(duì)模型進(jìn)行優(yōu)化。


具體結(jié)果可見下圖,實(shí)驗(yàn)結(jié)果表明 Unwavering-FQ 框架可以將 Vicuna 對(duì)最初正確判斷的修改率平均降低 32%,這表明其在判斷一致性和可靠性方面有顯著的提升。此外,研究者們?cè)?MT-Bench 基準(zhǔn)上評(píng)估發(fā)現(xiàn),該框架不僅沒有損害還能提高模型的通用能力,經(jīng)過 SFT 和 DPO 訓(xùn)練后模型的 MT-Bench score 從 6.17 提升到 6.40。這些結(jié)果肯定了該框架的有效性和適用性。

能否在追問中堅(jiān)持判斷?揭秘大語言模型的判斷一致性挑戰(zhàn)-AI.x社區(qū)


03 總結(jié)?

該研究發(fā)現(xiàn)大語言模型在面對(duì)追問時(shí)經(jīng)常會(huì)在其判斷上動(dòng)搖,即使原始判斷是正確的。這種判斷的不一致性為生成可靠回應(yīng)和建立用戶信任帶來了重大挑戰(zhàn)。


為了全面評(píng)估這個(gè)問題,研究者們引入了一個(gè)追問機(jī)制(Follow-up Questioning Mechanism)以及兩個(gè)指標(biāo)(M. 和 M. Rate)來量化這種不一致性,并通過全面的消融、細(xì)致的錯(cuò)誤分析確認(rèn)了該問題在當(dāng)前大語言模型中普遍存在。


為了緩解這一問題,針對(duì)閉源模型,他們探索了多種提示策略;針對(duì)開源模型,他們提出了一個(gè)基于訓(xùn)練的框架 Unwavering-FQ,通過合成高質(zhì)量的偏好數(shù)據(jù)來教導(dǎo)語言模型保持其最初正確的判斷。實(shí)驗(yàn)結(jié)果驗(yàn)證了該框架的有效性,以及其能提升模型通用能力的能力。


研究者們強(qiáng)調(diào)雖然該工作提出的緩解方法一定程度上緩解了該問題,但由于模型的穩(wěn)定性并非始終如一,仍有廣闊的研究空間待探索。此外,研究者們?cè)趯?shí)驗(yàn)過程中發(fā)現(xiàn)讓模型堅(jiān)持自身判斷與知錯(cuò)就改也是一種權(quán)衡,如何在二者之間取得平衡也許會(huì)成為未來工作的新挑戰(zhàn)。


如想進(jìn)一步了解大語言模型在追問下的判斷一致性評(píng)估結(jié)果、深入分析和緩解方法的設(shè)計(jì)細(xì)節(jié),歡迎閱讀原論文。

?

?本文轉(zhuǎn)自 PaperWeekly ,作者:謝淇名


原文鏈接:??https://mp.weixin.qq.com/s/1c5CN-SGd6_xG3B_IkD3Sw??

標(biāo)簽
已于2024-3-28 09:46:02修改
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦
蜜桃av免费在线观看| 91网免费观看| 美国黑人一级大黄| www 久久久| 亚洲一区在线观看免费| 国产一区二区精品免费| 国产精品自拍第一页| 三级电影一区| 欧美精品一区二区三区高清aⅴ | 欧美体内she精视频在线观看| 亚洲第一天堂无码专区| 手机在线看福利| 国产蜜臀一区二区打屁股调教| 91视频免费观看| 91色在线视频| 久久精品视频5| 欧美日韩国产一区精品一区| 亚洲系列中文字幕| 俄罗斯黄色录像| 欧洲美女精品免费观看视频| 午夜精品视频在线观看| 中文字幕中文字幕99| 天堂a√在线| 国产精品夜夜嗨| 欧美最近摘花xxxx摘花| 精品国产大片大片大片| 亚洲精品播放| 亚洲精品在线观看网站| 小明看看成人免费视频| 丝袜美腿一区| 四虎影院观看视频在线观看| 麻豆精品精品国产自在97香蕉| 国内精品久久久久影院 日本资源| 欧美激情视频二区| 亚洲最好看的视频| 亚洲国产精品久久久久| 九九九九九国产| 黄色亚洲网站| 黑人极品videos精品欧美裸| 91看片淫黄大片91| 麻豆影院在线| 中文字幕一区二区三| 欧美精品一区在线发布| 午夜影院免费体验区| 国产91丝袜在线播放| 91午夜理伦私人影院| 成人黄色片在线观看| 国产亚洲精品v| 久久免费国产视频| 久久久久免费看| 牛牛国产精品| 欧美日韩国产成人在线观看| 日韩福利小视频| 久久久久午夜电影| 久久久精品久久| 永久久久久久久| 66视频精品| 久久国产天堂福利天堂| 内射一区二区三区| 欧美a级一区| 欧美激情18p| 国产性70yerg老太| 亚洲激情婷婷| 青青久久av北条麻妃海外网| 日韩av大片在线观看| 一本色道久久| 国产成人精品av| 久久久999久久久| 免费人成网站在线观看欧美高清| 国产精品久久久久久久久久免费 | 亚洲国产精品va在线| 免费不卡的av| 亚洲精品白浆高清| 伊人伊成久久人综合网站| www.涩涩爱| 亚洲天堂一区二区三区四区| 欧美人成在线视频| 日韩精品成人一区| 久久国产日韩| 国产在线观看91精品一区| 999久久久久久| 成人免费毛片嘿嘿连载视频| 精品视频免费观看| a中文在线播放| 亚洲精品乱码久久久久久日本蜜臀| 久久久久福利视频| 国产色播av在线| 色94色欧美sute亚洲线路一ni| 老头吃奶性行交视频| 欧美大片1688网站| 欧美一级夜夜爽| 欧美肉大捧一进一出免费视频 | 四虎影院一区二区| 成年人国产在线观看| 色综合天天综合| 中文字幕丰满乱码| 青青一区二区| 久久久国产精品免费| 五月天婷婷网站| 奇米精品一区二区三区在线观看一 | 国产在线一区观看| 久久99精品久久久久久三级| avav免费在线观看| 午夜视频一区在线观看| 久久国产激情视频| 色先锋久久影院av| 免费91麻豆精品国产自产在线观看| 日韩欧美高清在线观看| 久久国产生活片100| 国产成人成网站在线播放青青| 精品福利视频导航大全| 亚洲综合网站在线观看| 爱情岛论坛成人| 精品网站aaa| 久久视频免费观看| 日本中文字幕在线观看视频| 国产成人亚洲精品青草天美| 欧美在线日韩精品| caoprom在线| 91精选在线观看| 国产精品国产三级国产专业不| 亚洲先锋成人| 91视频国产高清| 搞黄视频在线观看| 五月婷婷综合网| 美女又黄又免费的视频| 俺要去色综合狠狠| 欧美在线免费一级片| 在线看日韩欧美| 精品成人av一区二区在线播放| 国产风韵犹存在线视精品| 亚洲精品美女久久7777777| 国产美女精品写真福利视频| 日韩欧美在线一区二区三区| 男人天堂资源网| 久久性天堂网| 蜜桃成人免费视频| 碰碰在线视频| 亚洲国产欧美一区二区三区同亚洲| 91资源在线播放| 国产欧美亚洲一区| 国模精品娜娜一二三区| 国精一区二区三区| 日韩欧美综合在线| avove在线播放| 国产伦精品一区二区三区免费| 亚洲在线观看一区| 国产精品蜜月aⅴ在线| 亚洲一二三在线| 极品国产91在线网站| 久久婷婷色综合| 欧美在线观看成人| 神马香蕉久久| 国产999精品视频| 国产精品一二三区视频| 91九色02白丝porn| 成人黄色a级片| 久久99国产精品免费网站| 亚洲欧美日韩精品在线| 日韩综合av| 伦伦影院午夜日韩欧美限制| 国产又粗又黄视频| 亚洲男帅同性gay1069| 无码人妻一区二区三区在线视频| 亚洲精品国产首次亮相| aa成人免费视频| xxxx在线视频| 亚洲毛片在线观看| 中文在线观看av| 亚洲欧美怡红院| 苍井空张开腿实干12次| 很黄很黄激情成人| 久久久久久久久久久一区| 精品3atv在线视频| www.xxxx欧美| 乱精品一区字幕二区| 五月天中文字幕一区二区| 少妇按摩一区二区三区| 免费成人美女在线观看.| 黄色免费高清视频| 国产suv精品一区| 热99在线视频| 蜜桃视频在线观看www社区| 日韩欧美色电影| 成人免费看片98欧美| 欧美国产日韩在线观看| 亚洲av毛片在线观看| 亚洲精品在线二区| 亚洲天堂电影网| 国产精品45p| 国产精品美女久久久久久免费 | 久久久午夜电影| 久久久久久综合网| 亚洲少妇一区| 亚洲自拍三区| 欧美一区自拍| 成人欧美一区二区三区黑人| 成年女人在线看片| 色阁综合伊人av| 色wwwwww| 91精品国产综合久久小美女 | 在线观看www91| 动漫精品一区一码二码三码四码| 久久精品一区二区三区不卡牛牛 | 2021久久国产精品不只是精品| 手机视频在线观看| 99视频在线精品国自产拍免费观看| 香蕉久久免费影视| 欧美电影在线观看免费| 91免费的视频在线播放| 国产精品迅雷| 国模极品一区二区三区| 欧美三级电影一区二区三区| 日韩精品视频中文在线观看| 国产精品一区二区黑人巨大| 欧美日韩一二三四五区| 校园春色 亚洲| 国产精品国产三级国产有无不卡| 亚洲精品女人久久久| 韩国v欧美v亚洲v日本v| 国产视频一区二区视频| 亚洲激情影院| 国产在线观看欧美| 国产精品99在线观看| 日韩国产在线一区| 首页亚洲中字| 久久精品国产一区二区三区不卡| 精品视频在线观看免费观看| 国产精品91在线| 三级中文字幕在线观看| 国内外成人免费激情在线视频| 国产在线激情| 最近中文字幕日韩精品| 免费在线超碰| 国产丝袜一区二区三区免费视频| 免费观看国产精品| 精品国产1区二区| 亚洲精品成av人片天堂无码| 日韩一区二区电影网| 国产探花精品一区二区| 91精品国产麻豆| 国产强被迫伦姧在线观看无码| 欧美精品视频www在线观看| 在线观看一二三区| 777a∨成人精品桃花网| 97久久人国产精品婷婷| 制服丝袜在线91| va婷婷在线免费观看| 日韩欧美一级精品久久| 国产av一区二区三区| 欧美成人乱码一区二区三区| 亚洲精品97久久中文字幕| 亚洲国产高清福利视频| 婷婷色在线观看| 亚洲欧美国产另类| av中文在线| 久久视频在线视频| 日本在线观看大片免费视频| 欧美精品激情视频| 涩涩视频在线免费看| 国产成人精品一区| 丁香婷婷久久| 懂色一区二区三区av片| 菁菁伊人国产精品| 日本一区二区三区四区高清视频 | 国内精品自线一区二区三区视频| 人人妻人人澡人人爽欧美一区 | 欧美亚洲激情| 日本精品一区二区三区视频 | 一区二区日本| 国产精品久久久久久久免费观看| 日本女人高潮视频| 欧美.www| 欧洲精品一区二区三区久久| 午夜亚洲激情| 国产高清视频网站| 国产综合久久久久久鬼色 | 91手机视频在线| 999亚洲国产精| 日本三级免费观看| 美女在线一区二区| 亚洲乱妇老熟女爽到高潮的片| 北条麻妃一区二区三区| 日本aaa视频| 中文字幕一区二区三区四区不卡 | 国产麻豆剧传媒精品国产| 成人动漫一区二区| 四虎精品一区二区| 国产精品不卡一区二区三区| 国产三级国产精品国产国在线观看| 亚洲一二三专区| 免费在线不卡av| 日韩欧美一区二区视频| 你懂的免费在线观看视频网站| 最新亚洲国产精品| 金瓶狂野欧美性猛交xxxx| 国产精品九九九| h视频久久久| 日韩欧美精品一区二区三区经典 | 国产自产高清不卡| 欧美成人三级伦在线观看| 国产精品传媒视频| 日本五十熟hd丰满| 精品污污网站免费看| 日本美女一级片| 色黄久久久久久| 久久77777| 国产精品444| 国产三级精品三级在线观看国产| 亚洲美女搞黄| 一区二区激情| www.色.com| 欧美国产禁国产网站cc| 久久久久久激情| 欧美三级日韩在线| 免费黄色在线视频网站| 丝袜亚洲欧美日韩综合| 日本高清成人vr专区| 国产精品成人品| 久久狠狠久久| 中文字幕第50页| 狠狠色丁香婷婷综合久久片| 成人h动漫精品一区| 亚洲成人自拍一区| 91中文字幕在线播放| 日韩精品视频在线观看网址| 91美女精品| 99re在线视频观看| 欧美国产美女| 美女黄色片视频| 91片在线免费观看| 天天爽夜夜爽夜夜爽精品| 欧美久久高跟鞋激| 国产一级在线| 国产精品国产三级国产专播精品人| 国产女人18毛片水真多18精品| 欧美另类videosbestsex日本| 美女视频网站黄色亚洲| 黄瓜视频污在线观看| 懂色av一区二区三区| www.我爱av| 日韩视频在线一区| 巨大黑人极品videos精品| 欧美一级爽aaaaa大片| 亚洲日韩成人| 免费成人黄色大片| 国产精品久久久久久久岛一牛影视| 日本网站在线播放| 日韩视频一区二区| 久久99精品久久久久久野外| 91影视免费在线观看| 999久久久91| 看看黄色一级片| 亚洲综合无码一区二区| 国产高清视频免费观看| 欧美日韩国产成人| 超碰成人福利| 亚洲一区 在线播放| 粉嫩av一区二区三区在线播放| 99精品久久久久| 亚洲精品一区二区三区四区高清| 丁香花电影在线观看完整版| 亚洲精品日韩激情在线电影| 欧美视频久久| 欧美日韩人妻精品一区在线| 精品久久香蕉国产线看观看gif| 人人妻人人澡人人爽久久av| 欧美精品久久久久久久久| 久久九九热re6这里有精品| 青青草视频在线免费播放| 久久久久久久久久看片| 国产精品免费无遮挡无码永久视频| 亚洲美女激情视频| 精品自拍视频| 成人在线免费高清视频| 97久久超碰国产精品电影| 久久国产视频精品| 亚洲人成网站色ww在线| 99热播精品免费| 少妇熟女一区二区| 成人黄色av网站在线| 亚洲免费在线视频观看| 搡老女人一区二区三区视频tv| 亚洲一区有码| 亚洲色成人www永久在线观看| 91最新地址在线播放| 男人天堂视频在线| 中文字幕亚洲图片| 黄色美女久久久| 爱情岛论坛成人| 图片区小说区国产精品视频| 久久天堂电影| 岛国一区二区三区高清视频| 亚洲女人av| 男女男精品视频网站| 欧美成人官网二区| 都市激情亚洲综合| 日本阿v视频在线观看| 91麻豆免费看片| 精品人妻无码一区二区三区蜜桃一|