精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

NATURAL PLAN:LLMs在自然語言規劃上的基準

發布于 2024-6-21 16:02
瀏覽
0收藏

NATURAL PLAN:LLMs在自然語言規劃上的基準-AI.x社區

一、結論寫在前面

論文來自Google DeepMind。

論文標題:NATURAL PLAN: Benchmarking LLMs on Natural Language Planning

論文鏈接:??https://arxiv.org/pdf/2406.04520??

論文提出了NATURAL PLAN,一個包含三個關鍵任務(旅行規劃、會議規劃和日歷調度)的自然語言現實規劃基準。論文的評估重點在于LLMs在完全了解任務情況下的規劃能力,通過提供來自Google Flights、Google Maps和Google Calendar等工具的輸出作為模型的上下文。    

這消除了在規劃方面評估LLMs時對工具使用環境的需要。論文觀察到,NATURAL PLAN對當前最先進模型來說是一個挑戰。例如,在旅行規劃任務中,GPT-4和Gemini 1.5 Pro分別僅能達到31.1%和34.8%的解決率。論文發現,隨著問題復雜度的增加,模型性能急劇下降:當涉及10個城市時,所有模型的表現均低于5%,凸顯了當前最先進LLMs在自然語言規劃方面存在顯著差距。

論文還對NATURAL PLAN進行了廣泛的消融研究,進一步揭示了自校正、少樣本泛化以及長上下文情境下的規劃等方法在提升LLM規劃效果上的(不)有效性。

?二、論文的簡單介紹

2.1 論文的背景?

LLM的規劃能力仍遠落后于人類表現。盡管許多近期工作旨在解決這一問題,但沒有反映真實世界應用的現實基準,難以在增強這些模型的規劃能力方面取得有意義的進展。

規劃在機器人學和具身環境中已被廣泛研究。自動化規劃算法已被廣泛應用于此類系統中,以實現規劃功能。在這些場景中,規劃涉及制定一系列行動,當執行這些行動時,可以將代理從一個特定的初始狀態帶到期望的世界狀態。這些系統通常使用規劃域描述語言(PDDL)或答案集編程(ASP)作為規劃器的底層動作語言。盡管最近的工作已經探索了LLM驅動的代理在經典規劃設置中的潛力,但規劃場景并非實際設置,并且它們通常包含模板,而非自然語言。    

NATURAL PLAN:LLMs在自然語言規劃上的基準-AI.x社區

圖1:旅行規劃任務的示例

NATURAL PLAN:LLMs在自然語言規劃上的基準-AI.x社區

圖2:會議規劃任務的示例

NATURAL PLAN:LLMs在自然語言規劃上的基準-AI.x社區

圖3:日歷安排任務的示例

論文引入了NATURAL PLAN,這是一個專為評估大型語言模型(LLMs)處理自然語言描述的規劃任務能力而設計的新基準。NATURAL PLAN包含三種不同的規劃任務,即旅行規劃、會議規劃和日歷調度。對于每項任務,論文從現有工具中收集真實信息。例如,在旅行規劃中,論文查詢Google Flights API,并提供城市間的航班連接信息作為上下文。圖1至圖3展示了這些任務及其相關的谷歌工具,這些工具提供的信息作為上下文。    

2.2 論文的方法--NATURAL PLAN

NATURAL PLAN是一個旨在評估LLMs執行自然語言表達的規劃任務能力的基準。

?2.2.1 數據集類別

NATURAL PLAN包含三個規劃類別:旅行規劃、會議規劃和日歷調度。每個類別旨在捕捉涉及某些工具(如Google Flights)的真實世界規劃任務。論文將工具使用與推理任務分離,并在上下文中提供工具輸出,以確保NATURAL PLAN專注于規劃。論文相信這將顯著簡化評估LLMs規劃過程的復雜性。

2.2.1.1 旅行規劃

旅行規劃是一項任務,專注于在給定約束條件下規劃旅行行程。附錄A展示了一個示例提示及其解決方案。該任務是關于確定訪問NATURAL PLAN:LLMs在自然語言規劃上的基準-AI.x社區個城市的順序。論文添加足夠的約束條件,使得任務只有一個解決方案,從而使得對預測的評估變得直接。

2.2.1.2 會議安排

本部分基準專注于在各種給定約束下安排會議。給定NATURAL PLAN:LLMs在自然語言規劃上的基準-AI.x社區個朋友,該任務提供了會議時間和地點。附錄A展示了一個示例問題。目標是在給定的約束條件下,盡可能多地與朋友見面,這些約束包括地點之間的旅行時間。

2.2.1.3 日歷調度

日歷調度是一項任務,專注于在多人之間根據現有日程和各種約束條件安排工作會面。論文通過改變參與會議的人數和工作的天數來調整任務難度。附錄A展示了一個示例問題。

2.2.2 數據集構建

論文通過使用相應的工具數據并創建各種約束條件,人工合成了NATURAL PLAN數據集。下面描述了每類任務的具體創建過程。    

2.2.2.1 旅行規劃?

論文創建數據集的方式如下:為了創建一個問題,論文從歐洲訪問量最大的48個城市中隨機抽取NATURAL PLAN:LLMs在自然語言規劃上的基準-AI.x社區

個城市。論文還隨機抽取總持續時間和在每個城市停留的天數,設為NATURAL PLAN:LLMs在自然語言規劃上的基準-AI.x社區。論文在行程中添加約束條件,要求在特定日期訪問某些城市,例如在旅行中的第3天到第5天在巴黎與朋友見面。作為一個全局約束,論文增加了只使用直飛航班在城市間通行的偏好,排除了如果沒有從NATURAL PLAN:LLMs在自然語言規劃上的基準-AI.x社區NATURAL PLAN:LLMs在自然語言規劃上的基準-AI.x社區的直飛航班,就不能在訪問NATURAL PLAN:LLMs在自然語言規劃上的基準-AI.x社區后訪問NATURAL PLAN:LLMs在自然語言規劃上的基準-AI.x社區的可能性。為了幫助LLM理解連通性約束,論文查詢Google Flights API,并在上下文中提供城市之間的航班連通性信息。

2.2.2.2 會議規劃

對于此數據集類別,論文隨機抽樣人員姓名以安排會議,并相應地抽樣地點。論文還抽樣時間框架,顯示人員的可用性。論文增加了約束條件,例如您將在舊金山訪問一天。在此設置中,目標是要盡可能多地會見朋友。為了使問題更加真實,時間約束/地點遵循現實世界的地點。旅行距離通過查詢Google地圖API的駕駛時間來估算。

表1:NATURAL PLAN任務的統計數據

NATURAL PLAN:LLMs在自然語言規劃上的基準-AI.x社區

2.2.2.3 日歷調度

數據集的這一部分包括在多個工作日中安排30分鐘或1小時會議的任務,涉及不同數量的與會者。論文實例化了兩個子集:第一個子集固定會議在特定的一天,例如星期一,同時變化與會者的數量在[2, 7]之間;第二個子集固定與會者數量為2,同時變化會議可以安排的工作日數量為1, 5。每個參與會議的人都有他們當天的現有會議安排(第一個子集)或一周(第二個子集),這是通過向每天添加隨機的30分鐘會議直到n小時的會議時間被填滿來創建的。    

論文隨機為每個與會者分配n,以確保一半的與會者有繁忙的日程,意味著他們超過一半的工作時間用于會議,而另一半有較輕的日程,不到一半的工作時間用于會議。每個與會者的連續會議被合并成一個單獨的塊,如圖3所示。一旦論文有了所有與會者的現有日程,論文添加兩種類型的約束:1) 最早可用性;2) 避免在特定時間段內開會,以確保問題有一個單一的解決方案。

2.2.3 統計數據

表1展示了NATURAL PLAN中涉及的行程規劃、會議規劃和日歷調度等多個任務的統計數據。

?2.3 論文的效果

論文進行了一系列實驗,以評估當前最先進的語言模型(LMs)在NATURAL PLAN中規劃任務的表現。

2.3.1 模型

論文實驗了多個頂尖的LLMs:GPT-4(gpt-4-turbo-2024-04-09),GPT-3.5(gpt-3.5-turbo-0125),GPT-4o(gpt-4o-2024-05-13),以及Gemini 1.5 Flash和Pro 。

2.3.2 設置?

少量示例學習 對于NATURAL PLAN中的每個任務,論文提供5個同一任務內的示例作為少量示例,以使LLM通過上下文學習[Brown et al., 2020]從這些示例中學習。此設置還確保輸出可以輕松解析以進行評分。

約束復雜性理解 為了更好地理解LLMs的規劃能力,論文通過控制變量改變每個任務的難度級別。論文通過改變約束條件(如人數、城市數、天數等)進行分析,以更好地理解模型在規劃任務復雜性變化中的行為。

少量示例泛化 論文通過分別提供簡單和困難示例作為上下文示例,進行由易到難和由難到易的泛化研究。例如,在行程規劃中,對于由易到難(由難到易)的泛化,論文提供5個比評估任務實例少(多)2個城市更簡單(困難)的示例。    

自我修正 論文評估模型是否能在NATURAL PLAN中各種任務類別中自我修正其錯誤。論文提示模型識別是否存在任何錯誤,并在必要時進行自我修正。

長上下文中的上下文規劃 論文評估模型如何利用長上下文能力進行規劃中的上下文學習。論文將測試集分為80%和20%,其中80%用作上下文示例,同時論文在20%的測試集上評估模型性能。論文將使用的少量示例數量增加到800個。

評估 論文解析LLM的輸出,并與黃金計劃進行比較。論文計算LLM生成的計劃與黃金計劃完全匹配(EM)的分數。

2.3.3 結果與分析

表2:5種模型在NATURAL PLAN上的準確性

NATURAL PLAN:LLMs在自然語言規劃上的基準-AI.x社區

2.3.3.1 結果

表2展示了在5次嘗試設置中,各種LLM在NATURAL PLAN任務中的表現。論文從結果中得出以下見解。

所有模型在NATURAL PLAN上的表現都不佳。Gemini 1.5 Pro在旅行規劃和日歷調度上表現最佳,而GPT-4在會議規劃上表現最佳。

在旅行規劃中,Gemini 1.5 Pro達到34.8%的準確性,而GPT-4為31.1%。特別是,論文觀察到GPT-4o僅為3.7%。進一步分析顯示,GPT-4o在理解和遵守航班連接和旅行日期限制方面遇到困難,更多詳細分析見附錄D。在會議規劃上,GPT-4和GPT-4o分別達到47%和45.29%的準確性,而Gemini 1.5 Pro為39.1%。對于日歷調度,Gemini 1.5 Pro以48.9%的準確性超過了GPT-4和GPT-4o。

在NATURAL PLAN的三個任務中,旅行計劃是其中最難的,最佳準確率僅為34.8%。值得注意的是,所有模型在這三個任務上的準確率均未超過50%,這表明即使所有必要的工具使用信息都已在上下文中提供,自然語言規劃對于最先進模型來說仍然是一個極具挑戰性的任務。    

2.3.3.2 約束復雜性

圖4至圖6展示了模型在旅行計劃中城市數量、會議安排中人數、日歷安排中參與者和天數變化下的性能變化。論文觀察到以下關鍵見解:

NATURAL PLAN:LLMs在自然語言規劃上的基準-AI.x社區

NATURAL PLAN:LLMs在自然語言規劃上的基準-AI.x社區

    

圖5:NATURAL PLAN中會議規劃任務的約束復雜性分析,作為人數的函數                  

NATURAL PLAN:LLMs在自然語言規劃上的基準-AI.x社區

                  圖6:日歷調度任務的約束復雜性分析,作為一天內涉及的人數(左)和兩個與會者之間選擇會議時間的工作日數量(右)的函數

隨著城市/人數/與會者/天數的增加,性能下降。對于旅行規劃,圖4顯示,當規劃中涉及更多城市時,模型開始失敗。在旅行規劃中,所有五個模型在涉及10個城市時,性能都低于5%。對于會議規劃,論文評估了從1到10的人數場景。圖S再次顯示,隨著需要會見的人數增加,性能急劇下降。超過8人后,所有模型的得分都低于10%。對于日歷調度,與其他兩個任務相比,增加與會者或天數時,準確性的下降并不顯著。

2.3.3.3 泛化分析

NATURAL PLAN:LLMs在自然語言規劃上的基準-AI.x社區

                  圖7:模型在旅行規劃任務上的性能,作為城市數量對少數鏡頭泛化消融的影響函數:E2H=從易到難,H2E=從難到易    

圖7展示了論文對從易到難和從難到易泛化實驗的總結。對于從易到難(從難到易)泛化,論文提供了5個更簡單(更難)的例子,這些例子比任務少2個(多2個)城市,以測試大型語言模型(LLMs)是否能從更簡單(更難)的上下文學習示例中泛化。論文選擇旅行規劃任務來進行消融研究,因為它是自然規劃任務中最困難的任務。

總體而言,論文觀察到從易到難的泛化效果優于從難到易的泛化,跨越了不同的模型家族。第4.2節顯示,當任務復雜度較高時,模型的表現更差。這一結果表明,即使是對于最先進的LLMs,理解和利用上下文學習中的困難示例仍然具有挑戰性。然而,論文確實觀察到,對于GPT-4和Gemini 1.5 Flash,隨著任務復雜度的增加,趨勢發生了逆轉:對于

NATURAL PLAN:LLMs在自然語言規劃上的基準-AI.x社區到8,從難到易的示例比從易到難的示例表現更好。

2.3.3.4 自我修正

NATURAL PLAN:LLMs在自然語言規劃上的基準-AI.x社區

                  圖8:自我修正消融實驗中,行程規劃準確率隨城市數量的變化。SC=自我修正

圖8展示了在行程規劃任務中對模型預測進行自我修正的結果。論文提示大型語言模型(LLM)檢查生成的計劃是否正確,如果判定為不正確,則修正計劃(見附錄B中的提示)。

自我修正導致所有模型性能顯著下降。有趣的是,如GPT-4和Gemini 1.5 Pro這樣的更強模型相比GPT-3.5遭受了更大的損失。如GPT-4和Gemini 1.5 Pro這樣的更強模型相比GPT-3.5遭受了更大的損失。這與先前發現自我修正可能導致推理任務性能下降的研究結果一致[Huang et al., 2023]。像GPT-4和Gemini 1.5 Pro這樣的經過指令調優的強模型可能在被提示時對自己的解決方案過于自信,自我修正的示例見附錄E。    

2.3.3.5 長上下文情景下的即時規劃

NATURAL PLAN:LLMs在自然語言規劃上的基準-AI.x社區

                  圖9 展示了在旅行規劃和日歷調度任務中利用長上下文進行情境規劃的情況。Gemini 1.5 Pro在規劃任務上展現出強大的長上下文學習能力,相較于其他模型表現更優

論文研究了通過利用近期模型的長上下文能力進行情境規劃的可能性。圖9展示了四種模型在最多800個示例下的性能。

由于強大的長上下文能力,Gemini Pro 1.5能夠利用多達35.5萬個上下文示例,并持續顯示出穩定的改進。例如,在旅行規劃中,將示例數量從1增加到800,Gemini Pro 1.5的準確率從2.7%提升至39.9%。與此同時,GPT-4和Gemini 1.5 Flash在20個示例時達到性能峰值,并開始出現性能下降。在日歷調度任務中,Gemini 1.5 Pro持續改進至400個示例。這些結果展示了情境規劃的潛力,其中長上下文能力使得大型語言模型能夠利用更廣泛的上下文來提升規劃能力。

本文轉載自 ??AI帝國??,作者: 無影寺

收藏
回復
舉報
回復
相關推薦
一区二区三区免费在线| 亚洲第一天堂久久| 国产香蕉视频在线看| 欧美aaaaaa午夜精品| 精品国产一区二区三区久久| 中国男女全黄大片| 国产一区二区精品调教| 一区二区三区中文字幕| 欧洲精品一区色| 国产欧美第一页| 亚洲在线播放| 九色精品美女在线| 亚洲图片另类小说| 99亚洲乱人伦aⅴ精品| 欧美网站一区二区| 国产乱子伦农村叉叉叉| dy888亚洲精品一区二区三区| www精品美女久久久tv| 亚洲最大av在线| 波多野结衣小视频| 国产精品综合| 欧美放荡办公室videos4k| 日韩av片在线| 香蕉久久夜色精品国产使用方法| 日韩一区二区三区在线| 国产喷水theporn| 色戒汤唯在线观看| 校园春色亚洲| 美日韩一区二区| 欧美在线视频播放| 久久免费公开视频| 亚洲经典一区| 日韩视频一区在线| 国产日韩精品中文字无码| 免费看av成人| 国产视频亚洲视频| 久久久久麻豆v国产精华液好用吗| 久久久精品区| 911精品产国品一二三产区| 国产情侣av自拍| 午夜裸体女人视频网站在线观看| 亚洲国产精品一区二区尤物区| 中国成人亚色综合网站| 77777影视视频在线观看| 91麻豆免费看片| 久精品国产欧美| 四虎影视精品成人| 不卡的看片网站| 国产精品日韩欧美一区二区| 国产91视频在线| 国产中文字幕一区| 91亚洲国产成人精品性色| 亚洲天堂中文在线| 人人超碰91尤物精品国产| 国产成人激情小视频| 91精品国产综合久久久蜜臀九色 | 天天综合色天天综合色hd| 毛片网站在线观看| 欧美激情一区二区三区不卡| 亚洲国产精品一区在线观看不卡 | 精品久久久久久中文字幕2017| 亚洲精品永久免费视频| 一本久久精品一区二区| 午夜dv内射一区二区| 精品欧美一区二区三区在线观看| 在线看一区二区| 奇米视频7777| 亚洲精品aⅴ| 亚洲福利小视频| 精品人妻一区二区三区香蕉| 伊人久久大香线蕉综合网蜜芽| 亚洲午夜女主播在线直播| 91l九色lporny| 日韩中文字幕高清在线观看| 欧美xxxx做受欧美| 久久久久久久伊人| 日韩专区欧美专区| 成人伊人精品色xxxx视频| 六月婷婷综合网| 久久久国产一区二区三区四区小说| 日本成人黄色免费看| 香蕉视频在线看| 一区2区3区在线看| 欧美视频在线观看网站| 91国内外精品自在线播放| 欧美日韩和欧美的一区二区| 国产xxx在线观看| 夜色77av精品影院| 精品久久久91| 日本在线视频免费| 欧美a级理论片| 国产成人女人毛片视频在线| 精品美女视频在线观看免费软件| 国产精品久久久久久久久动漫 | 99久久婷婷国产综合精品| 日韩av电影免费在线| www视频在线免费观看| 欧美丝袜一区二区三区| 中文字幕日韩久久| 蜜桃成人av| 久久99精品国产99久久6尤物| www.伊人久久| 国产精品亚洲成人| 欧美亚洲爱爱另类综合| 亚洲区欧洲区| 欧美午夜一区二区| 亚洲一区二区三区四区五区六区 | 久久精品国产综合| 国产成人一区二区三区影院在线| 看片的网站亚洲| 蜜桃传媒视频第一区入口在线看| 羞羞电影在线观看www| 欧美影院一区二区三区| 五月天激情小说| 欧美在线国产| 成人免费淫片aa视频免费| 看电影就来5566av视频在线播放| 亚洲黄色av一区| 国产亚洲视频一区| 精品久久久久久久久久久aⅴ| 午夜精品视频网站| 成人av手机在线| 国产精品久久国产精麻豆99网站| 日本国产在线播放| 99精品国产高清一区二区麻豆| 日韩网站免费观看| 正在播放亚洲精品| 久久噜噜亚洲综合| 97av视频在线观看| 九色丨蝌蚪丨成人| 久久久免费在线观看| 国产夫妻自拍av| 亚洲美女一区二区三区| 日本中文字幕二区| 久久精品影视| 国产有码一区二区| 日本欧美在线视频免费观看| 欧美三区免费完整视频在线观看| 最近中文字幕免费| 免费亚洲一区| 欧美午夜欧美| 日韩一区二区三区免费| 亚洲一级免费视频| 中文字幕av第一页| 国产精品乱子久久久久| 国产三级三级看三级| 欧美丝袜一区| 成人免费看片视频| 羞羞视频在线观看不卡| 精品国产电影一区二区| 懂色av.com| 91视频一区二区| 男人亚洲天堂网| 欧美精品羞羞答答| 成人黄色影片在线| 亚洲妇熟xxxx妇色黄| 精品国产91乱码一区二区三区 | 精品国产免费一区二区三区香蕉| 欧美极品视频在线观看| 大美女一区二区三区| 国产一区二区三区小说| 林ゆな中文字幕一区二区| 91国内精品久久| 久青青在线观看视频国产| 91极品美女在线| 蜜桃视频最新网址| 国产成人欧美日韩在线电影| 美女扒开大腿让男人桶| 色老板在线视频一区二区| 国产精品久久久久久av福利软件 | 色综合五月天导航| 五月天婷婷视频| 在线日韩国产精品| 午夜精品一区二区三级视频| 夫妻av一区二区| 成年人在线看片| 91精品啪在线观看国产18| 国产乱人伦精品一区二区| 亚洲深夜视频| 日韩最新在线视频| 亚洲精品一级片| 一本到高清视频免费精品| 日本人亚洲人jjzzjjz| 国产一区二区在线视频| 国产av天堂无码一区二区三区| 精品一区二区三| yellow视频在线观看一区二区| 亚洲一区资源| 久久综合网hezyo| 欧美拍拍视频| 宅男噜噜噜66一区二区66| 精品在线播放视频| 成人欧美一区二区三区| 成人免费无码大片a毛片| 老司机免费视频一区二区| 国产爆乳无码一区二区麻豆| 神马电影久久| 丁香五月网久久综合| jizzyou欧美16| 久久人人爽人人| 美女免费久久| 亚洲欧美www| 国产高潮在线观看| 色欲综合视频天天天| 欧洲猛交xxxx乱大交3| 久久久噜噜噜久久中文字幕色伊伊| 日本人dh亚洲人ⅹxx| 男男视频亚洲欧美| 成年人观看网站| 激情另类综合| 激情五月五月婷婷| 欧美综合一区| 欧美福利精品| 给我免费播放日韩视频| 亚洲一区二区中文| 国产亚洲欧美日韩精品一区二区三区| 欧美亚洲免费电影| 福利小视频在线| 欧美精品亚州精品| 中文字幕日本在线观看| 亚洲三级av在线| 五月婷婷在线播放| 精品国产青草久久久久福利| 国产精品天天操| 欧美专区在线观看一区| 一级片中文字幕| 午夜电影久久久| 免费毛片在线播放免费| 一区二区三区欧美日韩| 四虎永久免费在线| 亚洲三级理论片| 伊人久久久久久久久久久久久久| 国产女人aaa级久久久级 | 亚洲五码中文字幕| 久久无码精品丰满人妻| 亚洲日本在线a| 成人涩涩小片视频日本| 国产精品沙发午睡系列990531| 欧美日韩高清丝袜| 国产色综合久久| 亚洲国产天堂av| 欧美激情一区二区三区四区| 国产精品美女高潮无套| 欧美国产激情二区三区| 日本理论中文字幕| 欧美国产日韩一二三区| 中文字幕91视频| 中文字幕一区二区在线播放| 美女网站视频色| 亚洲欧美成人一区二区三区| 国产女片a归国片aa| 亚洲一区二区在线免费看| 91精品国产高潮对白| 欧美天天综合色影久久精品| 9i精品福利一区二区三区| 色8久久精品久久久久久蜜| 一级黄色av片| 欧美日韩电影在线| 国产成人毛毛毛片| 亚洲第一天堂无码专区| 九色在线免费| 久久久精品美女| 好吊日av在线| 国产v综合ⅴ日韩v欧美大片 | 国产精品免费一区二区三区在线观看 | 精品久久久久久中文字幕大豆网| 国产精品久久久免费视频| 91久久久免费一区二区| 国产免费黄色录像| 日韩高清中文字幕| 浮生影视网在线观看免费| www.亚洲成人| www中文字幕在线观看| 欧美在线影院在线视频| 日韩欧国产精品一区综合无码| av日韩中文字幕| 国产一区二区三区电影在线观看 | 免费一区二区三区在在线视频| 欧美日韩亚洲在线观看| 亚洲小视频在线播放| 妖精视频成人观看www| 午夜视频你懂的| 国产aⅴ综合色| 伊人网在线视频观看| 亚洲男帅同性gay1069| 一级成人黄色片| 欧美一区二区三区免费视频| 午夜影院在线视频| 久久久电影免费观看完整版| 少妇在线看www| 91网在线免费观看| 香蕉国产成人午夜av影院| 日韩 欧美 自拍| 天堂影院一区二区| 激情小说欧美色图| 亚洲国产经典视频| 国产真人真事毛片| 欧美精品久久天天躁| 五月天婷婷激情网| 久久国产精品久久久久久久久久| 日韩不卡免费高清视频| 国产精品久久久久久久久久直播| 国产精品一区二区av交换| 国产精品久久久久9999爆乳| 精品一区二区三区的国产在线播放| 7788色淫网站小说| 亚洲欧美成人一区二区三区| 国产性生活视频| 亚洲精品白浆高清久久久久久| dj大片免费在线观看| 国产精品亚洲欧美导航| 亚洲人成精品久久久 | 日本三级中国三级99人妇网站| 欧美日韩精品一本二本三本| 色播五月综合网| 国产亚洲欧美日韩在线一区| 日本中文字幕免费| 日韩欧美国产电影| 国产精品一区二区三区视频网站| 国产精品久久久久久久av大片| 婷婷五月色综合香五月| 久草视频国产在线| 国产精品夜夜嗨| 亚洲天堂黄色片| 欧美人妇做爰xxxⅹ性高电影| 人成在线免费视频| 96精品视频在线| 国产精品一线| 成人av在线播放观看| 国产九色精品成人porny| 四虎地址8848| 欧美日韩三级在线| jizzjizz在线观看| 国产精品激情自拍| 精品久久美女| 激情视频免费网站| 中文字幕第一页久久| 中文字幕 视频一区| 中文字幕不卡在线视频极品| free欧美| 亚洲国产另类久久久精品极度| 奇米亚洲午夜久久精品| 91动漫免费网站| 91精品综合久久久久久| 黄色av电影在线观看| 91视频国产高清| 欧美a级片网站| 国产精久久久久| 亚洲成a人v欧美综合天堂下载| 天天干天天操av| 欧洲亚洲在线视频| 国产一区二区电影在线观看| 能看的毛片网站| 国产精品盗摄一区二区三区| 国产精品一品二区三区的使用体验| www.亚洲人.com| 一区二区在线视频观看| 精品无码一区二区三区在线| 久久综合九色欧美综合狠狠| 国产女主播喷水视频在线观看| 中文字幕精品www乱入免费视频| 免费视频观看成人| 国产精品视频一二三四区| 99久久99久久精品国产片果冻| 国产嫩bbwbbw高潮| 色青青草原桃花久久综合| 亚洲一区二区三区四区电影| 国产综合中文字幕| 国产人久久人人人人爽| 91女人18毛片水多国产| 欧美激情xxxx性bbbb| 日韩av网址大全| 欧美日韩中文不卡| 亚洲五码中文字幕| 成人不用播放器| 666精品在线| 久久久精品日韩| 少妇被躁爽到高潮无码文| 亚洲第一av网| 国产精品66| 一女被多男玩喷潮视频| 国产精品麻豆一区二区| 神马午夜精品95| 国产精品视频一区二区高潮| 红桃视频亚洲| 天天操天天舔天天射| 亚洲第一页在线| 亚洲18在线| 69堂免费视频| 亚洲视频在线一区| 欧美老女人性开放| 亚洲一区二区三区四区视频| 久久精品国产清高在天天线| 中文字幕在线有码| 亚洲香蕉成人av网站在线观看| 亚洲精品aⅴ| 免费av不卡在线| 欧美性xxxxx极品娇小| 亚洲第一图区| 亚洲欧洲精品在线观看|