精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

最強(qiáng)的GPT-4V都考不過(guò)?基于大學(xué)考試的測(cè)試基準(zhǔn)MMMU誕生了

人工智能 新聞
隨著大型語(yǔ)言模型(LLM)快速發(fā)展,人們對(duì) AGI 這一頗具爭(zhēng)議的概念進(jìn)行了廣泛討論。簡(jiǎn)單來(lái)說(shuō),AGI 是指在大多數(shù)任務(wù)上都與人類相當(dāng)或超越人類的人工智能系統(tǒng)。由于缺乏公認(rèn)的可操作定義,人們一直都很難就 AGI 開(kāi)展更加坦誠(chéng)和建設(shè)性的討論。

目前最好的大型多模態(tài)模型 GPT-4V 與大學(xué)生誰(shuí)更強(qiáng)?我們還不知道,但近日一個(gè)新的基準(zhǔn)數(shù)據(jù)集 MMMU 以及基于其的基準(zhǔn)測(cè)試或許能給我們提供一點(diǎn)線索,如下排行榜所示。

圖片

看起來(lái),GPT-4V 在一些科目上已經(jīng)強(qiáng)過(guò)掛科的大學(xué)生了。當(dāng)然這個(gè)數(shù)據(jù)集的創(chuàng)造目的并不為了擊敗大學(xué)生,而是為了提供一個(gè)兼具深度與廣度的多模態(tài) AI 測(cè)試基準(zhǔn),助力人工智能系統(tǒng)的開(kāi)發(fā),尤其是通用人工智能(Artificial General Intelligence,AGI)。

隨著大型語(yǔ)言模型(LLM)快速發(fā)展,人們對(duì) AGI 這一頗具爭(zhēng)議的概念進(jìn)行了廣泛討論。簡(jiǎn)單來(lái)說(shuō),AGI 是指在大多數(shù)任務(wù)上都與人類相當(dāng)或超越人類的人工智能系統(tǒng)。由于缺乏公認(rèn)的可操作定義,人們一直都很難就 AGI 開(kāi)展更加坦誠(chéng)和建設(shè)性的討論。

為了解決這個(gè)問(wèn)題,Morris 等人的論文《Levels of AGI: Operationalizing Progress on the Path to AGI》提出了一種兼顧通用性(廣度)和性能(深度)的 AGI 分級(jí)分類法。

在這種分類法中,第 3 級(jí)是專家 AGI,這是一個(gè)重要的里程碑。它表示 AI 系統(tǒng)在廣泛的任務(wù)上達(dá)到了「掌握專業(yè)知識(shí)的成年人類的 90%」,并由此可以在許多行業(yè)中達(dá)到「機(jī)器智能接替人類勞動(dòng)力的替代門檻」,從而造成重大的失業(yè)風(fēng)險(xiǎn)和經(jīng)濟(jì)混亂。因此,密切關(guān)注專家 AGI 的發(fā)展情況具有重要的學(xué)術(shù)和社會(huì)意義。

那么,該如何創(chuàng)造用于度量專家 AGI 的基準(zhǔn)呢?

由于專家 AGI 的定義是基于與專業(yè)人士的比較,因此不同學(xué)科的大學(xué)水平考試就是一個(gè)很好的起點(diǎn),因?yàn)檫@些考試本身的目的就是評(píng)估人類在相應(yīng)學(xué)科的專業(yè)能力。MMLU 和 AGIEval 等基準(zhǔn)已經(jīng)成功采用了這一策略,但它們只考慮了基于文本的問(wèn)題,而人類專家有能力解決多模態(tài)問(wèn)題。

與此同時(shí),能夠理解文本和圖像的大型多模態(tài)模型(LMM)已經(jīng)朝著更通用的人工智能邁出了一大步。這些 LMM 能在現(xiàn)有的多模態(tài)基準(zhǔn)測(cè)試上獲得穩(wěn)定一致的優(yōu)良表現(xiàn)。比如 CogVLM 在 VQA-v2 基準(zhǔn)上的成績(jī)?yōu)?85%,在 ScienceQA-IMG 上為 92%,在 RefCOCO 上為 93%。

然而,大多數(shù)現(xiàn)有的多模態(tài)基準(zhǔn)側(cè)重于常識(shí) / 日常知識(shí),而不是專家級(jí)的領(lǐng)域知識(shí)和高級(jí)推理。與這個(gè)目標(biāo)最接近的基準(zhǔn)是 ScienceQA。盡管 ScienceQA 覆蓋了多個(gè)學(xué)科(廣度),但其大部分問(wèn)題都限于小學(xué)到初中水平,因此缺乏深度,不足以作為專家 AGI 的基準(zhǔn)。

為此,IN.AI Research 等多所機(jī)構(gòu)的一個(gè)研究團(tuán)隊(duì)構(gòu)建了一個(gè)新基準(zhǔn) MMMU,可用于評(píng)估 AI 在大學(xué)水平的多學(xué)科問(wèn)題上的多模態(tài)理解和推理能力。

圖片

  • 論文地址:https://arxiv.org/abs/2311.16502
  • 項(xiàng)目網(wǎng)站:https://mmmu-benchmark.github.io/
  • 數(shù)據(jù)集:https://huggingface.co/datasets/MMMU/MMMU
  • 代碼:https://github.com/MMMU-Benchmark/MMMU

其中包含的問(wèn)題來(lái)自大學(xué)考試、測(cè)驗(yàn)和教科書,涉及六個(gè)常見(jiàn)學(xué)科:藝術(shù)與設(shè)計(jì)、商科、科學(xué)、健康與醫(yī)學(xué)、人文與社會(huì)科學(xué)、技術(shù)與工程。MMMU 包含 1.15 萬(wàn)個(gè)精心選取的多模態(tài)問(wèn)題,涵蓋 30 個(gè)不同的科目和 183 個(gè)子領(lǐng)域,因此滿足廣度目標(biāo)。此外,MMMU 中許多問(wèn)題都需要專家級(jí)的推理能力,比如使用傅立葉變換或均衡理論來(lái)推導(dǎo)問(wèn)題的解,因此也滿足深度目標(biāo)。

圖片

MMMU 還具備了兩個(gè)特有挑戰(zhàn)(圖 1):一是其涵蓋多種圖像格式,從照片和繪畫等視覺(jué)場(chǎng)景到圖表和表格,可用于測(cè)試 LMM 的感知能力;二是 MMMU 具有文本和圖像混合交織的輸入。對(duì)于這個(gè)基準(zhǔn),AI 模型需要把圖像和文本放在一起理解,這往往需要回憶深度的學(xué)科知識(shí)并根據(jù)理解和知識(shí)來(lái)執(zhí)行復(fù)雜推理。

該團(tuán)隊(duì)不僅提出了基準(zhǔn),也基于新基準(zhǔn)評(píng)估了一些模型,其中包括 14 個(gè)開(kāi)源 LMM 和 GPT-4V。他們從中得到了一些有趣的結(jié)論。

此外,他們還分析了 GPT-4V 的 150 個(gè)錯(cuò)誤案例,結(jié)果發(fā)現(xiàn) 35% 的錯(cuò)誤與感知有關(guān),29% 的錯(cuò)誤源自缺乏知識(shí)、26% 則是由于推理過(guò)程的缺陷。這些發(fā)現(xiàn)表明 MMMU 是有難度的,可用于助力進(jìn)一步的研究發(fā)展。

MMMU 基準(zhǔn)

MMMU 概況

MMMU 是 Massive Multi-discipline Multimodal Understanding and Reasoning 的縮寫,即大規(guī)模多學(xué)科多模態(tài)理解和推理。其構(gòu)建目標(biāo)是評(píng)估基礎(chǔ)模型在廣泛多樣的任務(wù)上的專家級(jí)多模態(tài)理解能力。MMMU 涉及 6 個(gè)學(xué)科的 30 個(gè)科目。圖 2 給出了每個(gè)學(xué)科的一個(gè) MMMU 樣本。

圖片

圖 3 詳細(xì)給出了所覆蓋的科目及相關(guān)統(tǒng)計(jì)數(shù)據(jù)。

圖片

該基準(zhǔn)中的問(wèn)題是人工收集的,收集者是來(lái)自不同學(xué)科的 50 位大學(xué)生,數(shù)據(jù)來(lái)源包括網(wǎng)絡(luò)資源、教科書和課程材料。

如表 1 所示,MMMU 中共有 1.15 萬(wàn)個(gè)問(wèn)題,并分成了三個(gè)子集:少樣本開(kāi)發(fā)集、驗(yàn)證集和測(cè)試集。

少樣本開(kāi)發(fā)集中每個(gè)科目包含 5 個(gè)問(wèn)題;驗(yàn)證集則包含大約 900 個(gè)問(wèn)題,可用于超參數(shù)選擇;測(cè)試集則有 1.05 萬(wàn)個(gè)問(wèn)題。MMMU 的設(shè)計(jì)目標(biāo)是衡量 LMM 的三項(xiàng)基本技能:感知、知識(shí)和推理。

數(shù)據(jù)的收集和整理過(guò)程

數(shù)據(jù)收集。第一步,他們?yōu)g覽了常見(jiàn)的大學(xué)專業(yè),然后確定要將哪些學(xué)科包含進(jìn)該基準(zhǔn)中。他們選擇的原則是該學(xué)科需要經(jīng)常采用視覺(jué)輸入來(lái)提供有價(jià)值的信息。基于這個(gè)原則,他們?nèi)サ袅朔▽W(xué)和語(yǔ)言學(xué)等一些學(xué)科,因?yàn)檫@些學(xué)科中很難找到足夠多的相關(guān)多模態(tài)問(wèn)題。最后,他們從 6 個(gè)不同學(xué)科中選擇了 30 個(gè)科目。

第二步,他們招募了 50 位這些專業(yè)的大學(xué)生,讓他們作為標(biāo)注者來(lái)幫助收集問(wèn)題。他們會(huì)從專業(yè)教科書和網(wǎng)絡(luò)資源收集多模態(tài)問(wèn)題,并在有必要時(shí)根據(jù)自己的專業(yè)知識(shí)創(chuàng)建新問(wèn)題。考慮到基礎(chǔ)模型的數(shù)據(jù)污染問(wèn)題,標(biāo)注者會(huì)選擇沒(méi)有立即可用答案的問(wèn)題,例如那些答案在不同的文檔中或教科書末尾的問(wèn)題。這個(gè)過(guò)程中,他們得到了 1.3 萬(wàn)個(gè)問(wèn)題。

 為了進(jìn)一步控制數(shù)據(jù)質(zhì)量,他們又執(zhí)行了兩個(gè)數(shù)據(jù)清理步驟。第一步,他們使用了詞匯重疊和來(lái)源網(wǎng)址相似度來(lái)識(shí)別潛在的重復(fù)問(wèn)題。然后他們對(duì)這些重復(fù)項(xiàng)進(jìn)行了審查,并清除了所有重復(fù)項(xiàng)。第二步則是把這些問(wèn)題分配給該論文的參與作者,讓他們幫助進(jìn)行格式和拼寫檢查。最后,該團(tuán)隊(duì)對(duì)這些問(wèn)題進(jìn)行了難度分級(jí):非常簡(jiǎn)單、簡(jiǎn)單、中等、困難。其中大約 10% 的問(wèn)題屬于非常簡(jiǎn)單;由于太過(guò)簡(jiǎn)單,不符合該基準(zhǔn)的設(shè)計(jì)原則,因此被排除在外。

圖 4 給出了 MMMU 與已有基準(zhǔn)的差異。

實(shí)驗(yàn) 

該團(tuán)隊(duì)基于 MMMU 對(duì)多種 LLM 和 LMM 進(jìn)行了評(píng)估。每一種類型都兼顧了閉源和開(kāi)源模型。評(píng)估采用了零樣本設(shè)置,以評(píng)估模型在沒(méi)有微調(diào)或少樣本演示的情況下生成準(zhǔn)確答案的能力。所有實(shí)驗(yàn)均基于 NVIDIA A100 GPU。

主要結(jié)果 

表 2 給出了在 MMMU 基準(zhǔn)上不同 LLM 和 LMM 的結(jié)果比較。

他們得到了一些重要發(fā)現(xiàn):

  • MMMU 難度很大,就連 GPT-4V 的準(zhǔn)確度也只有 55.7%,這說(shuō)明 AI 技術(shù)還有很大的改進(jìn)空間。
  • 開(kāi)源 LMM 和 GPT-4V 的性能差距很大。BLIP2-FLAN-T5-XXL 和 LLaVA-1.5 等表現(xiàn)最好的開(kāi)源模型也只有 34% 左右的準(zhǔn)確度。
  • 具備光學(xué)字符識(shí)別(OCR)或生成字幕的 LLM 沒(méi)有看到顯著的提升,這說(shuō)明 MMMU 需要模型更深度地將圖像和文本放在一起理解。 
  • 在藝術(shù)與設(shè)計(jì)以及人文與社會(huì)科學(xué)等視覺(jué)數(shù)據(jù)不太復(fù)雜的學(xué)科中,模型表現(xiàn)出的性能更高。相比之下,商科、科學(xué)、健康與醫(yī)學(xué)以及技術(shù)與工程等領(lǐng)域具有更復(fù)雜的視覺(jué)數(shù)據(jù)并需要復(fù)雜的推理,因此 AI 模型的性能也相對(duì)較低。

但該團(tuán)隊(duì)也指出,MMMU 并不足以對(duì)專家 AGI 進(jìn)行充分的測(cè)試,這是受定義限制的,因?yàn)槟P偷?MMMU 性能與「掌握專業(yè)知識(shí)的成年人類的 90%」之間不存在直接的映射關(guān)系,而且大學(xué)考試也并非 AGI 理應(yīng)解決的唯一任務(wù)。但他們也認(rèn)為專家 AGI 有必要在 MMMU 基準(zhǔn)上取得好成績(jī),這樣才能體現(xiàn)其掌握知識(shí)的廣度和深度以及專家級(jí)的理解和推理能力。

對(duì)圖像類型和難度的分析

不同的圖像類型。圖 5 比較了在常用的圖像類型上,不同模型的性能。可以看到,在所有類型上,GPT-4V 始終大幅優(yōu)于其它模型。在照片和繪畫等訓(xùn)練中更常見(jiàn)的類型上,開(kāi)源模型的表現(xiàn)相對(duì)較好。但是,對(duì)于幾何形狀、樂(lè)譜和化學(xué)結(jié)構(gòu)等更不常見(jiàn)的圖像類別,所有模型的分?jǐn)?shù)都非常低(有些接近于隨機(jī)亂猜)。這表明現(xiàn)有模型在這些圖像類型上的泛化性能不佳。

不同難度。表 3 比較了所選模型在三個(gè)難度層級(jí)上的性能。在「容易」類別中,GPT-4V 的表現(xiàn)顯著優(yōu)于開(kāi)源模型,成功率達(dá)到了 76.1%。對(duì)于「中等」難度類別,差距縮小了,但 GPT-4V 依然領(lǐng)先,為 55.6%。到了「困難」級(jí)別,模型的差距進(jìn)一步變小,這表明隨著任務(wù)復(fù)雜性的提升,GPT-4V 等更先進(jìn)模型的優(yōu)勢(shì)會(huì)逐漸消失。這可能表明當(dāng)前模型在處理專家級(jí)高難度查詢方面存在局限,即便最先進(jìn)模型也是如此。

錯(cuò)誤分析與未來(lái)研究

該團(tuán)隊(duì)還深度分析了 GPT-4V 的錯(cuò)誤,這有助于理解其運(yùn)作能力和局限。該分析不僅能識(shí)別模型當(dāng)前的缺點(diǎn),還可以幫助改進(jìn)未來(lái)的設(shè)計(jì)和訓(xùn)練。他們從 GPT-4V 的預(yù)測(cè)中隨機(jī)采樣的 150 個(gè)錯(cuò)誤實(shí)例,然后請(qǐng)專家級(jí)標(biāo)注者分析了這些實(shí)例,這些專家根據(jù)自己的知識(shí)找到了這些錯(cuò)誤預(yù)測(cè)的根本原因。圖 6 給出了這些錯(cuò)誤的分布情況。

感知錯(cuò)誤(35%):GPT-4V 的錯(cuò)誤中很大一部分是感知錯(cuò)誤,這又可以進(jìn)一步分為兩種類型:基本感知錯(cuò)誤和特定領(lǐng)域的感知錯(cuò)誤。如圖 7 所示,當(dāng)模型能準(zhǔn)確處理和理解給定信息,但無(wú)法解讀基本的視覺(jué)信息時(shí),就會(huì)出現(xiàn)基本感知錯(cuò)誤。而特定領(lǐng)域的感知錯(cuò)誤則是由缺乏知識(shí)所致。當(dāng)分析根本原因時(shí),研究者將此類錯(cuò)誤歸類為缺乏知識(shí)。此外,GPT-4V 經(jīng)常表現(xiàn)出對(duì)文本的偏好,也就是以文本信息優(yōu)先,視覺(jué)輸入在后。

缺乏知識(shí)(29%):如前所述,對(duì)于 GPT-4V 模型,特定領(lǐng)域的感知錯(cuò)誤的一個(gè)基本根本原因就是缺乏專業(yè)知識(shí)。類似地,缺乏專業(yè)知識(shí)還可能導(dǎo)致推理出現(xiàn)問(wèn)題。

推理錯(cuò)誤(26%):在一些實(shí)例中,模型正確解讀了文本和圖像,也找到了相關(guān)知識(shí),但卻未能成功應(yīng)用邏輯和數(shù)學(xué)推理技能來(lái)進(jìn)行準(zhǔn)確的推導(dǎo)。

其它錯(cuò)誤:其它錯(cuò)誤還包括文本理解錯(cuò)誤(6%)、拒絕問(wèn)答(3%)、注釋錯(cuò)誤(2%)、答案提取錯(cuò)誤(1%)。這些錯(cuò)誤的原因也多種多樣,比如復(fù)雜文本的解讀難度大、響應(yīng)生成的限制、數(shù)據(jù)注釋不準(zhǔn)確以及從較長(zhǎng)輸出中提取精確答案存在問(wèn)題。

更多詳細(xì)內(nèi)容,請(qǐng)閱讀原文。

責(zé)任編輯:張燕妮 來(lái)源: 機(jī)器之心
相關(guān)推薦

2024-02-06 09:00:00

GPT-4VLLaVA大型語(yǔ)言

2023-11-13 18:19:35

AI訓(xùn)練

2024-08-13 13:50:00

數(shù)據(jù)模型

2023-10-19 09:32:45

自動(dòng)駕駛技術(shù)

2024-01-30 21:18:57

語(yǔ)言模型圖像序列機(jī)器人

2023-12-18 09:39:20

模型AI

2024-09-06 13:00:29

2023-11-06 10:40:47

GPT-4V大模型

2023-10-31 12:23:17

GPT-4版本VLM

2023-12-29 09:55:03

視覺(jué)模型

2023-11-20 13:53:00

數(shù)據(jù)訓(xùn)練

2023-11-13 07:48:08

AI檢測(cè)

2024-06-11 08:16:00

2023-10-23 12:28:18

AI訓(xùn)練

2023-10-16 09:23:24

自動(dòng)駕駛技術(shù)

2023-11-04 12:23:39

GPT-4AI

2024-07-23 09:48:59

2023-12-12 12:43:19

AI訓(xùn)練

2023-06-08 11:27:10

模型AI

2024-04-14 19:53:44

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

国产精品va在线观看视色| 国产性一乱一性一伧一色| av亚洲一区二区三区| 国产精品久久久久久久久图文区 | 91av一区| 1区2区3区精品视频| 97久久人人超碰caoprom欧美| 日韩女优在线观看| 日韩大片在线| 精品国精品国产| 国产成人精品视频ⅴa片软件竹菊| 日本不卡视频| av网站免费线看精品| 国产精品久久久久久久久久久新郎 | 欧美成人免费一级人片100| 亚洲香蕉中文网| 91欧美精品| 亚洲成人动漫一区| 亚洲高清视频在线观看| 免费av网站观看| 麻豆国产精品777777在线| 欧美激情亚洲国产| 成人无码精品1区2区3区免费看 | 蜜臀久久99精品久久久久宅男| 久久99精品久久久久久青青91| 久久精品成人av| 97一区二区国产好的精华液| 欧美日韩国产一区二区三区地区| 国产精品333| а√天堂资源地址在线下载| 国产性做久久久久久| 俄罗斯精品一区二区三区| 中文字幕人妻一区二区三区视频 | 黄色一区二区在线观看| 一区二区三区在线视频111| 欧美女同网站| 99精品桃花视频在线观看| 97超碰资源| 国产剧情精品在线| 蜜臀国产一区二区三区在线播放| 青青久久av北条麻妃黑人| 国产精品第二十页| 国内一区二区三区| 久久国产精品久久久久| 成人信息集中地| 成人激情诱惑| 亚洲视频网站在线观看| 国产三级视频网站| 丝袜美腿综合| 亚洲国产精品国自产拍av秋霞| 99九九精品视频| 日韩大陆av| 欧美日韩一区成人| 久久99爱视频| 亚洲一区二区小说| 欧美一区二区网站| 久久精品亚洲天堂| 日韩精品成人在线观看| 91精品午夜视频| 中文字幕第17页| 9999精品视频| 欧美一级免费大片| 中文字幕亚洲日本| av不卡一区| 亚洲电影av在线| 香港三级日本三级| 亚洲免费成人av在线| 日韩高清免费在线| 成人在线一级片| 精品国产精品| 色综合伊人色综合网| 三级黄色录像视频| 欧美搞黄网站| 午夜精品久久久久久久男人的天堂| 国产无遮挡裸体免费视频| 99国产精品| 国产999视频| 一区二区三区精| 国产精品一二二区| 国产日韩欧美一区二区| 你懂得网站在线| 国产精品日日摸夜夜摸av| 亚洲午夜久久久影院伊人| 二区三区在线观看| 精品美女永久免费视频| 黄色三级视频片| 99视频有精品高清视频| 欧美精品一区二区三区一线天视频| 国产黑丝一区二区| 欧美美女一区| 另类图片亚洲另类| av网站中文字幕| 久久久精品网| 亚洲精品免费网站| 四虎电影院在线观看| 欧美国产精品一区二区三区| 免费在线精品视频| 天堂资源在线| 91精品国产综合久久久蜜臀图片| 亚洲熟女一区二区| 日韩一区电影| 992tv在线成人免费观看| 亚洲永久精品一区| 成人午夜碰碰视频| 亚洲精品tv久久久久久久久| 女人天堂av在线播放| 色8久久人人97超碰香蕉987| 免费看的av网站| 国产va免费精品观看精品视频 | 亚洲国产精品毛片| av免费不卡| 色94色欧美sute亚洲线路二| 国产精品果冻传媒| 91精品久久久久久久蜜月| 欧洲亚洲女同hd| 亚洲国产欧美另类| 国产精品丝袜一区| 欧美 日本 亚洲| 91欧美极品| 丝袜亚洲另类欧美重口| 丰满少妇xoxoxo视频| 成人亚洲一区二区一| 亚洲第一综合网站| 在线国产成人影院| 亚洲男人天堂视频| 日干夜干天天干| 国产精品66部| 99热一区二区三区| 自拍偷拍亚洲| 中文字幕欧美专区| 国产字幕在线观看| 久久品道一品道久久精品| 免费拍拍拍网站| 亚洲网一区二区三区| 日韩视频欧美视频| 91激情在线观看| 国产欧美日韩亚州综合| 粗暴91大变态调教| 蜜桃tv一区二区三区| 97超级碰碰碰| 日本中文字幕电影在线观看| 亚洲第一av色| www.啪啪.com| 中文精品视频| 久久久综合香蕉尹人综合网| 草草在线观看| 亚洲成色777777女色窝| 久久久久黄色片| 岛国精品在线播放| 菠萝蜜视频在线观看入口| 国产一区二区三区免费在线| 久久中文久久字幕| 精品国产九九九| 亚洲激情欧美激情| 国产av一区二区三区传媒| 亚洲性感美女99在线| 超碰97在线资源| 国产自产自拍视频在线观看| 亚洲国产黄色片| 亚洲精品在线视频观看| 欧美做爰爽爽爽爽爽爽| 国精产品一区一区三区mba桃花| 亚洲精品视频一二三| 九九久久国产| 蜜臀久久99精品久久久无需会员| 国产白浆在线观看| 亚洲国产一二三| 国产 xxxx| 久久久青草婷婷精品综合日韩| 国产综合精品一区二区三区| 性孕妇free特大另类| 亚洲网在线观看| 91丨porny丨在线中文| 亚洲理论在线观看| xxxx黄色片| 久久婷婷激情| 中文网丁香综合网| 999久久久精品一区二区| 97成人超碰免| 欧美日本高清| 亚洲图色一区二区三区| 亚洲国产精品人人爽夜夜爽| 日韩精品在线免费视频| 久久久久国产成人精品亚洲午夜| 在线观看av日韩| 夜间精品视频| 精品蜜桃传媒| 精品久久99| 欧美日韩aaaa| 国产区在线视频| 日韩一级欧美一级| 久久久久久久久久久影院| 国产精品入口麻豆九色| 天堂www中文在线资源| 日韩精品亚洲一区| 国产精品三级一区二区| 蜜桃精品wwwmitaows| 亚洲精品欧美日韩| 国产另类xxxxhd高清| 久久影视免费观看| 日韩在线免费播放| 欧美岛国在线观看| 一区精品在线观看| 天天操天天干天天综合网| 国产精品久久久视频| 成熟亚洲日本毛茸茸凸凹| 亚洲三级视频网站| 亚洲毛片av| 91视频成人免费| 国产91久久精品一区二区| 97超级在线观看免费高清完整版电视剧| 在线视频cao| 欧美裸体xxxx极品少妇| eeuss影院在线播放| 日韩高清免费在线| 亚洲第一精品网站| 欧美高清性hdvideosex| 亚洲不卡在线视频| 亚洲一区二区三区激情| 特黄一区二区三区| 国产三区在线成人av| 亚洲欧美日本一区| 国产成人综合自拍| 岛国av免费在线| 日韩影院在线观看| 欧美精品色婷婷五月综合| 欧美在线资源| 一区二区三区国| 欧美三级情趣内衣| 裸体丰满少妇做受久久99精品| h视频久久久| av在线亚洲男人的天堂| 日本免费成人| 国产精品偷伦一区二区| 欧美最新精品| 欧美在线视频免费播放| 忘忧草在线影院两性视频| 午夜精品蜜臀一区二区三区免费| 少女频道在线观看免费播放电视剧| 精品国产一区二区三区久久狼黑人 | 另类的小说在线视频另类成人小视频在线 | 久草中文在线观看| 日韩一中文字幕| 思思99re6国产在线播放| 一区二区三区无码高清视频| 黄色在线小视频| 亚洲日本成人网| 国产一级二级三级在线观看| 亚洲欧美综合图区| 国产香蕉在线| 中文字幕精品国产| 99re在线视频| 日韩亚洲国产中文字幕| 老司机福利在线视频| 久久视频精品在线| 天堂亚洲精品| 国内精品久久久久影院优| 538视频在线| 琪琪第一精品导航| 欧美福利在线播放| 国产在线播放91| 日韩精品一级| 国产日本一区二区三区| 综合亚洲自拍| 亚洲bbw性色大片| 亚洲最新色图| 国产成人无码a区在线观看视频| 在线一区视频| 精品久久久噜噜噜噜久久图片| 蜜臀av在线播放一区二区三区 | 天天干天天操天天爱| 色婷婷综合五月| 国产精品久久久久久久久毛片 | 欧美日韩午夜激情| 日韩久久久久久久久久| 欧美日韩二区三区| 国产91免费在线观看| 国产视频亚洲视频| 日本在线天堂| 国内精品久久久久| jvid一区二区三区| 电影午夜精品一区二区三区| 亚洲人成网www| 一区二区不卡在线观看| 在线观看一区| 蜜臀av免费观看| 国产传媒日韩欧美成人| 三上悠亚ssⅰn939无码播放| 国产精品久久久久永久免费观看| 欧美激情一区二区视频| 色88888久久久久久影院野外| 一级全黄裸体免费视频| 亚洲电影免费观看高清完整版在线观看 | 伊人中文字幕在线观看| 欧美精品久久久久久久久老牛影院| 在线观看色网站| 亚洲精品在线观| av男人的天堂在线| 午夜精品一区二区三区视频免费看| 亚洲电影有码| 国产亚洲情侣一区二区无| 青草国产精品| 国产尤物av一区二区三区| 国产毛片久久| 中文字幕人妻熟女人妻a片| 久久精品一区二区三区四区| 欧美黄色免费在线观看| 欧美视频一区二区在线观看| 色综合久久久久久| 久久精品视频导航| 老司机成人影院| 国产精品美女黄网| 午夜久久免费观看| 亚洲精品一二三四五区| 99久久婷婷国产综合精品| 日本中文字幕免费在线观看| 91国偷自产一区二区三区成为亚洲经典| 国产美女自慰在线观看| 亚洲欧洲免费视频| 日本动漫理论片在线观看网站| 国产精品一区二区三区久久| 伊人久久综合影院| 国产精品12345| 国产伦精品一区二区三区视频青涩| 亚洲精品午夜视频| 精品毛片三在线观看| 全部免费毛片在线播放一个| 久久福利视频网| 久久夜夜久久| 日韩资源av在线| 亚洲看片免费| 国产老熟女伦老熟妇露脸| 亚洲一区在线观看网站| 国产高潮在线观看| 欧美成人在线免费视频| 伊人亚洲精品| 国产日韩视频在线播放| 美腿丝袜亚洲色图| 能直接看的av| 欧美视频一区二区| 午夜免费视频在线国产| 国产精品久久久久久久天堂| 国产中文精品久高清在线不| 欧美污视频网站| 久久这里只有精品首页| 中文字幕日韩一级| 日韩电影中文字幕| www.com.cn成人| 欧美性色黄大片人与善| 久久中文欧美| 永久免费毛片在线观看| 欧美午夜精品电影| 日本高清在线观看wwwww色| 国产日韩精品入口| 一区二区影视| 亚洲精品无码一区二区| 午夜久久久久久| 亚洲欧美日韩成人在线| 国产精国产精品| 91久久高清国语自产拍| 国产资源中文字幕| 亚洲午夜三级在线| 天堂av网在线| 国产精品video| 91精品一区二区三区综合| 国产精品无码自拍| 欧美日韩精品在线视频| 成人精品一区| 成人欧美一区二区三区在线| 欧美精品自拍| 欧美在线一级片| 欧美视频一区在线观看| 羞羞视频在线观看不卡| 国模精品一区二区三区| 日韩电影在线观看网站| 男人晚上看的视频| 亚洲精品在线三区| 精品欧美日韩精品| 青青草免费在线视频观看| 99精品国产99久久久久久白柏| www.国产一区二区| 久久天堂av综合合色| 激情小说亚洲色图| 欧洲熟妇精品视频| 亚洲精品免费电影| 外国精品视频在线观看 | 要久久爱电视剧全集完整观看| 国产高潮免费视频| 亚洲午夜精品久久久久久久久| 欧洲天堂在线观看| 亚洲一区二区免费在线| 裸体素人女欧美日韩| 亚洲熟女www一区二区三区| 国产视频精品在线| 久久天堂久久| 丰满少妇在线观看| 亚洲香蕉伊在人在线观| 成a人片在线观看www视频| av一区二区三区在线观看| 日日摸夜夜添夜夜添精品视频|