精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

MetaGPT推出全新工作:打破數據壁壘,挑戰機器學習建模流程,數據科學家或將被取代?

發布于 2024-3-28 09:51
瀏覽
0收藏

01 研究背景

目前,由大型語言模型(LLM)驅動的智能體已經證明了它們在處理復雜任務方面的顯著潛力。此外,通過賦予 LLM 代碼執行能力來提升其問題解決能力正逐漸成為一種趨勢,這一點已經通過 Code-Interpreter [1]、Open Interpreter [2]、TaskWeaver [3] 等工作得到了實踐驗證。


然而,在數據科學領域,面對數據的實時變化、任務間依賴關系復雜、流程優化的專業性,以及執行結果反饋的邏輯一致性識別等挑戰,現有 LLM-based 智能體的性能仍有待提升。


MetaGPT 團隊聯合北京工業大學、復旦大學、華東師范大學、河海大學、加拿大蒙特利爾大學、KAUST、圣母大學、廈門大學、香港中文大學(深圳)、香港大學、耶魯大學、中國科學院深圳先進技術研究院、中國人民大學等多所頂尖高校和研究機構,共同推出了 Data Interpreter(https://arxiv.org/abs/2402.18679)。


這是一種全新的解決方案,旨在通過增強智能體的任務規劃,工具集成以及推理能力,直面數據科學問題的挑戰。


Data Interpreter 提出了三個關鍵技術:


1)動態規劃與層次圖結構基于分層的圖結構進行任務和代碼規劃,有效管理任務間的復雜依賴,靈活應對數據科學任務的實時數據變化;


2)工具集成與進化通過在代碼生成過程中自動集成代碼片段作為工具,動態嵌入了數據科學領域所需的領域知識;


3)基于驗證與經驗驅動的推理自動在反饋中增強邏輯一致性檢測,通過基于置信度的驗證提升執行代碼的邏輯合理性,并借助經驗庫增強推理能力。在各種數據科學和現實世界任務上的評估表明,與開源基線相比,Data Interpreter 在機器學習任務中表現出色,準確率從 0.86 提升至 0.95。此外,在 MATH 數據集上提高了 26%,在開放式任務中實現了顯著的 112% 提升。

MetaGPT推出全新工作:打破數據壁壘,挑戰機器學習建模流程,數據科學家或將被取代?-AI.x社區


▲ 在機器學習任務和現實世界的開放式任務中與各種開源框架進行比較,Data Interpreter 在多種任務上取得 sota


02 方法介紹

2.1 DYNAMIC PLANNING WITH HIERARCHICAL STRUCTURE


在數據科學領域,實時數據的動態變化和任務間復雜的變量依賴關系對大型語言模型(LLM)提出了重大挑戰。為了有效應對這些挑戰,Data Interpreter 提出了一種創新解決方案:動態規劃與層次圖結構(DYNAMIC PLANNING WITH HIERARCHICAL STRUCTURE)


這種方法借鑒了自動化機器學習中的層次規劃技術,通過層次結構將復雜的數據科學問題分解為易于管理的小任務,并進一步將這些任務轉化為具體的代碼執行動作,從而實現細致的規劃與執行。

MetaGPT推出全新工作:打破數據壁壘,挑戰機器學習建模流程,數據科學家或將被取代?-AI.x社區

▲ 分層結構:(a)一個有組織的任務和動作圖,展示了高層級機器學習項目的工作流程,包括實現項目目標所需的任務依賴和動作序列。(b)任務的有向無環圖(DAG),以機器操作狀態預測問題為例。任務圖展示了拆解的計劃任務,而動作圖(也稱為執行圖)則根據計劃的任務圖執行各個節點。每個節點的執行代碼由 LLM 轉換。


這種動態規劃方法賦予了 Data Interpreter 在任務變化時的適應性,而有向無環圖(Directed acyclic graph)結構則在監控和處理數據科學問題中的任務依賴關系方面展現出了高效性。通過這種方式,Data Interpreter 能夠有效地管理和優化數據科學任務的執行流程,提高了問題解決的準確性。

MetaGPT推出全新工作:打破數據壁壘,挑戰機器學習建模流程,數據科學家或將被取代?-AI.x社區

▲ 數據解釋器的動態計劃管理:(a)通過人工編輯進行計劃細化。左側圖像顯示了在圖上經過人工編輯的任務,右側圖像則展示了細化后的計劃,包括更新后的任務 3.1'、3.2' 以及新增的任務 3.3。(b)對失敗任務的計劃進行細化。在任務執行后,如果任務 3.3 失敗,細化后的計劃將整合已有的成功任務,用更新后的任務 3.3' 替換原任務 3.3,并引入新任務 4.1、4.2、4.3 和 5。


2.2 TOOL UTILIZATION AND GENERATION

在數據科學任務中,任務的多樣性與專業性要求基于 LLM 框架具備廣泛的工具調用能力。現有的工具調用方式往往局限于 API 的形式,無法滿足任務多樣性帶來的動態需求。Data Interpreter 提出了工具集成與生成的方法。


通過工具推薦與組織,能夠根據任務描述,進行任務分類,從而有效選擇合適的工具集。在執行階段,Data Interpreter 根據工具參數描述、工具方法描述文檔的結構化信息,動態嵌入和調整工具參數,以適應任務的具體需求。


此外,Data Interpreter 還能夠通過自我進化,從執行經驗中抽象出工具的核心功能,形成通用的代碼片段,集成到工具函數庫之中。這些工具函數可以在未來的任務中重復使用,從而減少了調試頻率,提高了執行效率。

MetaGPT推出全新工作:打破數據壁壘,挑戰機器學習建模流程,數據科學家或將被取代?-AI.x社區

▲ 數據解釋器中的工具使用流程:工具推薦最初根據任務分類來選擇工具。然后根據任務需求組合多個工具使用。


2.3 ENHANCING REASONING WITH VERIFICATION AND EXPERIENCE


解決數據科學問題需要嚴謹的數據與邏輯驗證過程,現有的研究在解決這一類問題的過程中,往往依賴于代碼執行后的錯誤檢測或異常捕獲,這一方式往往會誤解代碼執行正確即任務完成,無法發現邏輯錯誤,難以提升任務實現的有效性。


Data Interpreter 通過結合基于置信度的自動驗證(Automated Confidece-based Verification)策略,顯著提升了其在數據科學問題解決中的推理能力。ACV 策略要求 Data Interpreter 在執行代碼后生成驗證代碼并執行驗證,根據執行驗證結果校驗任務和實現代碼的一致性,類似于白盒測試流程。


在需要更嚴謹數值反饋的場景中,如使用 LLM 進行數學推理,Data Interpreter 可以增加多次獨立驗證,并通過多次結果的置信度排序來進一步提升效果。


另一方面,Data Interpreter 利用經驗池存儲和反思任務執行過程中的經驗和教訓,能夠從過去的成功和失敗中學習代碼知識,從而在面對新任務時做出更準確的決策。這種結合實時驗證和經驗學習的方法,顯著增強了解釋器的推理能力,提升了任務的解決質量。

MetaGPT推出全新工作:打破數據壁壘,挑戰機器學習建模流程,數據科學家或將被取代?-AI.x社區

▲ 以 MATH 內的一個任務說明基于置信度自動驗證流程:虛線框內是自動驗證的過程,虛線框下方根據驗證對多個候選答案進行排序


03 實驗分析

在實驗部分,Data Interpreter 在多個數據科學和現實世界任務上進行了評估。與開源基線相比,它在機器學習任務中的表現出色,準確率從 0.86 提升至 0.95。在 MATH 數據集上,性能提升了 26%,在開放式任務中更是實現了 112% 的顯著提升。這一成果不僅為數據科學領域帶來了新的里程碑,也為 LLM 在實際應用中的潛力提供了有力的證明。


3.1 MATH

MetaGPT推出全新工作:打破數據壁壘,挑戰機器學習建模流程,數據科學家或將被取代?-AI.x社區

MATH benchmark [4] 涵蓋了從初等代數到微積分等廣泛的數學領域。這個基準測試不僅測試了模型對數學知識的掌握程度,還考察了它們在解決復雜數學問題時的推理能力。


為了評估 Data Interpreter 在這一領域的性能,研究團隊選擇了 MATH 基準測試中難度最高的 Level-5 問題,這些問題涉及計數和概率(C.Prob)、數論(N.Theory)、初等代數(Prealg)和微積分(Precalc)等四個類別。


如上圖所示,以 Accuracy 作為這個任務的評估指標,Data Interpreter 在 4 個類別上均取得了最好的成績。特別是在 N.Theory 中,帶有 Automated Confidence-based Verification(ACV)策略的 Data Interpreter達到了 0.81 的準確率。


3.2 ML-Benchmark


在機器學習的世界里,精準和效率是衡量一個模型成功與否的關鍵。為了測試 Data Interpreter 在這一領域的能力,研究團隊精心設計了 ML-Benchmark,這是一個集合了 Kaggle 網站上多種經典機器學習任務的測試集。


這些任務不僅覆蓋了葡萄酒識別(WR)、Wisconsin 乳腺癌(BCW)、Titanic 生存預測等經典問題,還包括了房價預測(House Prices)、Santander 客戶交易預測(SCTP)、識別與年齡相關的狀況(ICR)以及 Santander 價值預測挑戰賽(SVPC)等更具挑戰性的項目。

MetaGPT推出全新工作:打破數據壁壘,挑戰機器學習建模流程,數據科學家或將被取代?-AI.x社區

在與其他開源框架的較量中,Data Interpreter 展現了其卓越的性能。通過綜合任務完成率(CR)、歸一化性能得分(NPS)和綜合得分(CS)這三個關鍵指標,Data Interpreter 在七項任務上的平均得分高達 0.95,遠超 AutoGen 的 0.86,提升了 10.3%。特別是在 ICR 和 SVPC 這兩個數據集上,Data Interpreter 的表現尤為出色,分別比 AutoGen 提高了 24.7% 和 21.2%。


更令人印象深刻的是,Data Interpreter 是唯一一個在 Titanic、House Prices、SCTP 和 ICR 任務上得分均超過 0.9 的框架,這標志著它在機器學習任務中不僅能夠完成核心步驟,還能在執行過程中持續優化任務效果。


3.3 Open-ended tasks

MetaGPT推出全新工作:打破數據壁壘,挑戰機器學習建模流程,數據科學家或將被取代?-AI.x社區

在人工智能的世界里,真正的挑戰往往來自于那些開放式的任務,它們不僅要求模型具備廣泛的知識,還要求它們能夠靈活應對現實世界的復雜性。


為了測試 Data Interpreter 在這類任務中的表現,研究團隊精心整理了一個包含 20 個任務的開放式任務基準。這些任務涵蓋了從光學字符識別(OCR)到迷你游戲生成(MGG)等多個領域,包括網絡搜索和爬蟲(WSC)、電子郵件自動回復(ER)、網頁模仿(WPI)、圖像背景去除(IBR)、文本轉圖像(T2I)、圖像到 HTML 代碼生成(I2C)等多樣化的挑戰。


在這個實驗中,Data Interpreter 與 AutoGen 和 Open Interpreter 這兩個基準模型進行了對比。每個框架對每個任務進行了三次實驗,以平均完成率作為評價標準。


結果顯示,Data Interpreter 在開放式任務上的平均完成率為 0.97,與 AutoGen 相比大幅提高了 112%。對于去除圖像背景(IBR)任務,所有三個框架都獲得了 1.0 的完整分數。


在 OCR 相關任務中,Data Interpreter 的平均完成率為 0.85,比 AutoGen 和 Open Interpreter 分別高出 26.8% 和 70.0%。在需要多個步驟并利用多模態工具/能力的任務中,例如網頁模仿(WPI)、圖像到 HTML 代碼生成(I2C)和文本轉圖像(T2I),Data Interpreter 是唯一能夠執行所有步驟的方法。


而在電子郵件自動回復(ER)任務中,AutoGen 和 Open Interpreter 因為無法登錄并獲取郵箱狀態,導致完成率較低,而 Data Interpreter 可以在執行過程中動態調整任務,從而在完成率上達到 0.98。


3.3 Ablation


為了進一步探討相關方法的有效性,我們進行了消融實驗。


3.3.1 核心模塊


為評估各模塊性能,我們在 ML-Benchmark 上,使用了三種配置進行測試:


1)初始設置:基礎 ReAct 框架,包含簡單的任務理解提示詞以及支持代碼執行流程;


2)增加了 Dynamic plan,包括分層規劃和每一步驟的動態管理,便于實時調整;


3)在 2)的基礎上增加了工具集成能力。如表 3 所示,Dynamic Plan 動態規劃顯著提高了 0.48 分。它通過準備數據集并實時跟蹤數據變化有助于獲得更優性能,特別是完成率方面效果顯著。此外,工具的使用帶來了額外 9.84% 的改進,綜合得分達到了 0.94 分。

MetaGPT推出全新工作:打破數據壁壘,挑戰機器學習建模流程,數據科學家或將被取代?-AI.x社區

3.3.2 不同尺寸的LLMs


Data Interpreter 在包括 GPT-4-Turbo、GPT-3.5-Turbo 以及不同尺寸的 LLMs 上進行了實驗。


在機器學習的任務中,更大尺寸的 LLM,例如 Qwen-72B-Chat [5] 和 Mixtral-8x7B [6] 展現出與 GPT-3.5-Turbo 相當的表現,而較小的模型則性能下降較多。


如下圖所示,結合 Yi-34B-Chat [7]、Qwen-14B-Chat [5] 和 Llama2-13B-Chat [8],甚至 DeepSeek-7B-Chat [9],Data Interpreter 可以有效地處理數據加載及分析等任務。然而,這些模型在執行需要較高編碼能力的任務時面臨仍受到自身能力限制,通常導致流程無法完成。


在 open-ended task 中,Mixtral-8x7B 在 3 項任務上的完成率較高,但在網絡搜索和爬蟲(WSC)任務中表現不佳,難以準確地將完整結果輸出到 CSV 文件。與機器學習任務 ML-Benchmark 類似,規模較小的模型仍由于編碼能力受限而遇到執行失敗問題

MetaGPT推出全新工作:打破數據壁壘,挑戰機器學習建模流程,數據科學家或將被取代?-AI.x社區

▲ 在 ML-BenchMark 上使用不同尺寸 LLM 的評估。(左圖:完成率,右圖:綜合得分)


3.3.3 經驗池大小


另外,我們還針對經驗池的大小進行了消融實驗。按存儲任務級別的經驗數量,分別設置經驗池大小為 0,80 和 200,我們對比 Data Interpreter 在不同任務上所需的代碼 debug 次數和執行成本的變化,結果如下所示:

MetaGPT推出全新工作:打破數據壁壘,挑戰機器學習建模流程,數據科學家或將被取代?-AI.x社區

隨著經驗池從 1 增加至 200,平均的 debug 次數從 1.48 降低到了 0.32,執行成本從 0.80 美元降低到了 0.24 美元,這說明經驗的累計對于從自然語言描述任務到代碼生成能夠有明顯的幫助。


04 總結

目前,大型語言模型(LLM)驅動的智能體已經在處理靜態和簡單任務上展現了令人矚目的能力。然而,當面對需要多步驟解決的復雜挑戰時,它們的表現往往不盡人意,比如機器學習任務。為了突破這一瓶頸,Data Interpreter 應運而生,它不僅在機器學習任務上取得了顯著進步,更在數學推理和開放式任務中達到了行業領先水平。


得益于以下三種技術的融合:動態規劃與層次圖結構、工具集成與生成、基于置信度驗證與經驗驅動的推理增強。Data Interpreter 在數學推理任務,機器學習任務和復雜的開放性任務上達到了 sota 水平。


相對其他開源基線,Data Interpreter 在 MATH 數學推理任務中準確率提升了 26%,在 ML-Benchmark 機器學習任務中將得分從 0.86 提升至 0.95,在開放式任務 Open-ended tasks 中更是實現了 112% 的驚人提升。


這些結果不僅標志著基于 LLM 的智能體在數據科學領域的重大提升,也預示著 AI 技術在處理更復雜、更動態的任務時將更加得心應手,為人類社會帶來更多智能化的解決方案。

 

本文轉自 PaperWeekly ,作者:讓你更懂AI的


原文鏈接:??https://mp.weixin.qq.com/s/3b0NfMjmUGn-12m6WNRZ3A??

標簽
已于2024-4-1 19:00:51修改
收藏
回復
舉報
回復
相關推薦
激情视频在线观看一区二区三区| 一区二区三区高清在线观看| 91视频综合| 亚洲一区二区三区四区的| 国产精品久久一| 青青草视频网站| 一级黄在线观看| 一区二区小说| 亚洲v中文字幕| 91丝袜脚交足在线播放| 操她视频在线观看| 中国字幕a在线看韩国电影| 国产精品系列在线观看| 色偷偷88888欧美精品久久久 | 天堂中文а√在线| 韩国女主播一区二区三区| 一区在线中文字幕| 国产欧美精品一区二区| 先锋影音av在线| 欧美少妇网站| av电影一区二区| 欧美精品一区二区免费| 2025韩国理伦片在线观看| 午夜性色福利视频| 国产精品日韩欧美一区| 日韩不卡在线观看| 成熟了的熟妇毛茸茸| 黄频网站在线观看| 99国产成+人+综合+亚洲欧美| 亚洲精品在线一区二区| 免费看国产一级片| 午夜视频www| 国产一区二区精品在线观看| 欧美大片免费观看| 性猛交╳xxx乱大交| 黑人精品视频| 99riav久久精品riav| 欧美一级电影在线| 免费福利视频网站| 日韩电影不卡一区| 日本道精品一区二区三区| 日韩动漫在线观看| a在线观看免费| 欧美日本亚洲韩国国产| 精品剧情v国产在线观看在线| 国产 欧美 日本| 天天操天天干天天爽| 玖玖玖国产精品| 日韩在线观看av| 色哟哟视频在线| aaaa欧美| 亚洲一区在线观看免费观看电影高清 | 亚洲 高清 成人 动漫| 啊啊啊久久久| 国产欧美日韩视频一区二区 | 日韩一区二区三区色| 亚洲成在人线免费| 青青影院一区二区三区四区| 亚洲天堂999| 欧美日韩亚洲国产精品| 欧美日韩福利视频| 国产av自拍一区| 精品美女一区| 亚洲影院理伦片| 国产av熟女一区二区三区| 欧美扣逼视频| 国产成人自拍网| 国产精品国语对白| 日韩av综合在线| 婷婷亚洲五月色综合| 亚洲美女动态图120秒| 国产美女视频免费看| mm视频在线视频| 精品久久中文字幕久久av| 亚洲一区精品视频| 极品白浆推特女神在线观看 | 91亚洲精品丁香在线观看| 精品人妻伦一区二区三区久久| 久久精选视频| 欧美黑人xxxⅹ高潮交| 精品少妇久久久久久888优播| 成人三级视频| 日韩精品在线免费播放| 久久人人爽人人片| 啪啪av大全导航福利综合导航| 亚洲va中文字幕| wwwxxx黄色片| 国产美女一区视频| 日韩欧美在线视频日韩欧美在线视频 | 深爱激情综合| 亚洲精品国产福利| 日本在线播放一区二区| 在线亚洲人成| 亚洲国产sm捆绑调教视频| 黄色一级片播放| 色综合久久久| 日韩av一区在线观看| 久久婷婷五月综合| 国户精品久久久久久久久久久不卡| 日韩久久免费视频| 性爱在线免费视频| 精品免费视频| 亚洲欧洲日产国码av系列天堂| 野战少妇38p| 欧美美女一区| 久久久久国产精品www| www色aa色aawww| 日韩欧美午夜| 亚洲精品一区二区三区四区高清| 极品人妻一区二区三区| 一区二区三区四区精品视频| 亚洲精品视频久久| 好吊色视频在线观看| 97色伦图片97综合影院| 久久久久亚洲精品| 久久久久成人精品无码| 日本麻豆一区二区三区视频| 国产精品美女主播| 日本激情一区二区| 久久一夜天堂av一区二区三区| 久久久久久久久久久一区| 亚洲色图欧美视频| 亚洲乱码精品一二三四区日韩在线| 大桥未久一区二区三区| www红色一片_亚洲成a人片在线观看_| 亚洲人成影院在线观看| 欧美黄色免费网址| 久久婷婷五月综合色丁香| 日韩av在线不卡| 欧美精品一级片| 亚洲黄色在线| 热门国产精品亚洲第一区在线| www.久久久久久久| 美女视频一区在线观看| 国产精品一区二区电影| 你懂的在线视频| 福利一区视频在线观看| 五月天亚洲视频| 美女久久久久| 3344国产精品免费看| 手机av免费在线观看| 亚洲成人一区二区在线观看| 免费观看黄网站| 蜜桃a∨噜噜一区二区三区| 欧美激情一区二区三区成人 | 日韩污视频在线观看| 美女精品在线| 麻豆蜜桃91| 日本在线观看| 欧美系列一区二区| 一级黄色电影片| 亚洲最新av| 欧美又大又硬又粗bbbbb| 丰满人妻一区二区三区免费| 亚洲亚洲精品在线观看| 国产婷婷在线观看| 国产精品视频久久一区| 欧美一二三四五区| 成人在线观看免费播放| 精品国产一区二区三区久久| 国产欧美日韩综合精品一区二区三区| 成人av网站免费| 先锋影音一区二区三区| 菠萝蜜视频在线观看www入口| 日韩欧美激情一区| 国产三级在线观看完整版| 欧美国产精品| 国产精品久久久av| 在线观看精品一区二区三区| 性久久久久久久| 国产国语性生话播放| 亚洲女同一区| 成人午夜电影在线播放| 色影院视频在线| 欧美一区午夜精品| 无码少妇精品一区二区免费动态| 免费观看在线色综合| 天堂av免费看| 精品久久在线| 欧美激情在线视频二区| 肉丝一区二区| 五月天国产精品| 无码 人妻 在线 视频| 久久黄色级2电影| 日韩久久久久久久久久久久久| jizz免费一区二区三区| 欧美精品制服第一页| 视频国产在线观看| 婷婷久久综合九色综合绿巨人 | 国产福利免费视频| 五月婷婷欧美视频| 国产美女网站视频| 91丨porny丨国产| 日韩av中文字幕第一页| 999精品嫩草久久久久久99| 一本色道久久综合狠狠躁篇怎么玩 | 国产精品久久久久不卡| 欧美黄色视屏| 日韩欧美高清dvd碟片| 国产成人自拍视频在线| ●精品国产综合乱码久久久久| 日韩www视频| 精彩视频一区二区三区| 中文字幕欧美日韩一区二区三区 | 成人网在线免费看| a√在线中文网新版址在线| 欧美大片一区二区| 性高潮视频在线观看| 国产欧美日韩一区二区三区在线观看| www.久久com| 蜜桃av一区二区在线观看| 水蜜桃色314在线观看| 亚洲区综合中文字幕日日| 欧美性xxxx69| 成人软件在线观看| 亚洲天堂久久av| 亚洲精品无码专区| 亚洲大片精品永久免费| 国产精品视频看看| 国产亚洲欧美一区在线观看| 久久国产色av免费观看| 狠狠做六月爱婷婷综合aⅴ| 国产精品1234| 黄色网页在线观看| 欧美不卡一区二区三区四区| 日本成人一级片| 丰满岳妇乱一区二区三区| 免费观看一级视频| 久久综合久久99| 精品影片一区二区入口| 国产ts人妖一区二区| 国产中文字幕二区| 欧美破处大片在线视频| 久久最新免费视频| 午夜精品久久久久久久四虎美女版| 99久久久精品免费观看国产| 3344国产永久在线观看视频| 亚洲全黄一级网站| 污视频网站在线播放| 欧美成人aa大片| 午夜精品久久久久久久爽| 91精品国模一区二区三区| 日韩和一区二区| 亚洲一区二区视频在线观看| 激情五月婷婷小说| 亚洲韩国精品一区| 亚洲黄色三级视频| 色综合天天性综合| 欧美色图亚洲视频| 91蝌蚪国产九色| 真人bbbbbbbbb毛片| 久久先锋影音av鲁色资源网| 成人h动漫精品一区| 久久亚洲一级片| 亚洲精品一区二区三区影院忠贞| 中文字幕成人av| 成年女人免费视频| 国产91富婆露脸刺激对白| 国产成人精品一区二区三区在线观看| 日韩经典中文字幕一区| 亚洲国产一二三精品无码| 欧美精品啪啪| 国产精品999视频| 丝袜亚洲精品中文字幕一区| 污版视频在线观看| 国产综合色视频| 亚洲av无码一区东京热久久| 91麻豆蜜桃一区二区三区| 性欧美精品男男| 亚洲欧美一区二区三区久本道91| 国精品无码一区二区三区| 一区二区日韩电影| 国产wwwwxxxx| 一区二区久久久久久| 国产黄色片免费看| 亚洲一区二区av在线| 日本午夜视频在线观看| 欧美在线一区二区| 91video| 亚洲一区二区在线免费观看视频| 不卡的免费av| 在线观看不卡一区| av中文字幕播放| 日韩精品小视频| 国产大片在线免费观看| 日韩精品在线观| 巨大荫蒂视频欧美另类大| 久久乐国产精品| 国产精品字幕| 国产精品成人在线| 91精品国产自产在线丝袜啪| 欧美黑人3p| 午夜激情一区| 午夜免费高清视频| 日韩和的一区二区| 国产xxx在线观看| 国产日产欧产精品推荐色| 久久久久黄色片| 精品视频色一区| 中文字幕在线网站| 欧美午夜在线一二页| 亚洲精品久久久蜜桃动漫| 亚洲天堂av电影| 国产嫩草在线视频| 成人免费淫片视频软件| 亚洲老女人视频免费| av中文字幕av| 欧美日本中文| jizz18女人| 精品一区二区三区免费| 女人高潮一级片| 91啪亚洲精品| 欧美日韩激情在线观看| 在线国产电影不卡| 手机福利小视频在线播放| 欧美大秀在线观看| av日韩一区| 视频在线精品一区| 美女久久一区| 国产精品无码久久久久久| 亚洲一区二区三区视频在线| 国产绿帽刺激高潮对白| 在线观看中文字幕亚洲| 在线手机中文字幕| 国精产品一区二区| 少妇一区二区视频| 久久久久久久午夜| 成人aaaa免费全部观看| 强行糟蹋人妻hd中文| 欧美精品乱码久久久久久 | 日韩av不卡在线观看| 国产xxxxxxxxx| 亚洲国产精品一区二区www在线| 99国产精品欲| 欧美成人精品xxx| 国产精品成人3p一区二区三区| caoporn国产精品免费公开| 凹凸成人精品亚洲精品密奴| 在线视频日韩一区 | 亚洲国产123| 亚洲高清在线视频| 亚洲黄色在线免费观看| 精品少妇v888av| 日韩亚洲精品在线观看| 肉大捧一出免费观看网站在线播放| 美女视频一区在线观看| 蜜桃av.com| 日韩一区二区中文字幕| 青青草观看免费视频在线| 57pao成人永久免费视频| 色婷婷综合久久久久久| 欧美黄色免费影院| 国产呦精品一区二区三区网站| 国产精品视频看看| 日韩视频一区二区三区| av影院在线| 明星裸体视频一区二区| 蜜臀国产一区二区三区在线播放| 久久视频一区二区三区| 777欧美精品| 久久免费电影| 欧美大陆一区二区| 日日夜夜一区二区| 永久免费未视频| 日韩美女在线视频| 欧美aa在线观看| 午夜精品福利一区二区| 国产在线乱码一区二区三区| 欧美黑吊大战白妞| 日韩av网站大全| jizzjizz少妇亚洲水多| 特大黑人娇小亚洲女mp4| 波多野结衣中文一区| 五月婷婷激情视频| 欧美大片一区二区| 天天综合av| 亚洲毛片aa| 日韩和的一区二区| 顶臀精品视频www| 亚洲精品国产精品自产a区红杏吧 亚洲精品国产精品乱码不99按摩 亚洲精品国产精品久久清纯直播 亚洲精品国产精品国自产在线 | 日本一区二区三区四区在线视频 | 伊人情人网综合| 成人一区二区三区中文字幕| 欧美a级片免费看| 日韩手机在线导航| 偷拍中文亚洲欧美动漫| 麻豆中文字幕在线观看| 成人妖精视频yjsp地址| 久久精品久久久久久久| 欧美精品在线免费播放| 亚洲尤物av| 国产在线a视频| 91成人免费在线| 污的网站在线观看| 97se国产在线视频| 欧美亚洲一区二区三区| 爱爱的免费视频| 337p亚洲精品色噜噜| 亚洲男人av| 精品日韩在线播放|