精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

撤出OpenAI后,蘋果繼續潑冷水:大模型不會推理。科技界炸鍋:大模型只會檢索拼湊答案,反方:不要混淆推理的概念

原創 精選
人工智能
每個人對大型語言模型似乎都有強烈的看法。一些人基于Yann LeCun或弗朗索瓦·肖萊(Francois Chollet)等專家的研究,認為應該更認真地對待大型語言模型的研究;而另一些人則跟風批評。有人說它們是我們通往通用人工智能(AGI)的門票,而另一些人則認為它們只是被美化的、有著花哨名字的文本生成算法。

編輯 | 言征

出品 | 51CTO技術棧(微信號:blog51cto)

前沿的AI獨角獸公司們正在花費所有精力使 LLM 更擅長推理。然而蘋果最近卻給他們潑了盆冷水。

近期,蘋果公司的一個六人研究團隊最近發表了一篇題為《了解大型語言模型中數學推理的局限性》的論文,論文中各種基準測試,十分詳實。不過最后的結論基本上就是想證明:當前的 LLM 無法推理。

圖片圖片

“當前的 LLM 無法執行真正的邏輯推理;他們從訓練數據中復制推理步驟,“該論文中寫道,其中還包括 OpenAI 的 GPT-4o 等 LLM,甚至是備受吹捧的”思考和推理“LLM,o1。該研究還對一系列其他模型進行了研究,例如 Llama、Phi、Gemma 和 Mistral。

該論文的資深作者 Mehrdad Farajtabar 在 X 上發帖解釋了該團隊是如何得出結論的。據他介紹,LLM 只是遵循復雜的模式,即使是小于 30 億個參數的模型也達到了只有更大的模型才能更早達到的基準,特別是 OpenAI 三年前發布的 GSM8K 分數。

Mehrdad10月10日在帖子中表示:

圖片圖片

大型語言模型 (LLM) 真的能推理嗎?或者它們只是復雜的模式匹配器?

研究人員引入了 GSM-Symbolic,這是一種在 LLM 中測試數學推理的新工具,因為 GSM8K 不夠準確,因此對于測試 LLM 的推理能力不可靠。

圖片圖片

一、4大證據,證明大模型不具備形式推理能力

三年前,OpenAI 發布了 GSM8K 數據集(目前常用的一種小學數學推理基準數據集),測試 GPT-3(175B參數)在數學題上的表現,那時 GPT-3 的得分僅為 35%。如今,擁有約 30 億參數的模型已能夠在 GSM8K 測試中取得超過 85% 的得分,參數更大的模型甚至超過 95%。

圖片圖片

然而,隨著準確率的提升,疑問也隨之而來:這些模型的推理能力是否真的進步了?它們的表現是否真的體現了邏輯或符號推理能力,抑或是簡單的模式識別,數據污染,甚至過擬合的結果? 

為進一步探索這一問題,研究團隊此發了 GSM-Symbolic,用于測試大語言模型在數學推理中的極限。GSM-Symbolic 基于 GSM8K 數據集,通過符號模板生成多樣化的問題實例,允許更可控的實驗設計。

為了更清晰地觀察模型在面對這些變體問題時的表現,他們生成了 50 個獨特的 GSM-Symbolic 集合,這些問題與 GSM8K 問題類似,但更改了其中的數值和名稱。

基于 GSM-Symbolic,他們從 5 個方面說明了為何他們認為大語言模型不具備形式推理能力。

1.GSM8K 的測試結果并不可靠

通過對多個開源模型(如 Llama 8B、Phi-3)和閉源模型(如 GPT-4o 和 o1 系列)的大規模評估,他們發現模型在 GSM8K 上的表現存在顯著波動。

例如,Llama 8B 的準確率在 70%-80% 之間波動,而 Phi-3 的表現則在 75%-90% 之間浮動。這也表明,模型在處理相似問題時表現并不穩定,GSM8K 上的高分并不能證明它們具備真正的推理能力。

圖片圖片

圖|由 GSM-Symbolic 模板生成的 50 套 8-shot 思想鏈(CoT)性能分布,顯示了所有 SOTA 模型之間準確性的顯著差異性。對于大多數模型來說,GSM-Symbolic 的平均性能低于 GSM8K(圖中由虛線表示)。有趣的是,GSM8K 的性能落在分布的右側,從統計學上講,這僅有非常低的可能性,因為 GSM8K 基本上只是 GSM-Symbolic 的一次單一抽樣。

2.大模型的數學推理能力相當脆弱敏感

團隊觀察到由相同模板生成的不同集合之間存在較大的性能差異,并且與原始GSM8K準確率相比性能有所下降。這表明語言模型所展現的推理過程可能并不正式,因此容易受到變化的影響。一種解釋是,這些模型試圖進行一種分布內模式匹配,將給定的問題和解題步驟與訓練數據中看到的類似問題和步驟進行對齊。由于此過程不涉及正式推理,因此可能導致同一問題的不同實例之間存在較大差異。

具體測試表現為:對名稱和數字變動的敏感性研究還發現,當前的大語言模型對問題中的專有名稱(如人名、食物、物品)的變化仍然很敏感,當數字發生變化時,大語言模型就會更加敏感。例如,僅僅改變問題中的名字,就可能導致模型的準確率變化高達 10%。如果將這種情況類比到小學數學測試中,僅僅因為改變了人名而導致分數下降 10% ,是非常不可思議的。

圖片圖片

圖|當只更改名稱、專有編號或同時更改名稱和編號時,大語言模型的敏感性如何?總體而言,即使只更改名稱,模型也有明顯的性能變化,但當更改編號或合并這些變化時,性能差異更大。問題難度的增加導致表現急劇下降。

3.擴展問題難度,性能分布波動劇烈

研究團隊通過引入三種新的 GSM-Symbolic 變體(GSM-M1、GSM-P1、GSM-P2),通過刪除一個分句(GSM-M1)、增加一個分句(GSM-P1)或增加兩個分句(GSM-P2),來調整問題難度。

圖|通過修改條款數量來修改 GSM-Symbolic 的難度級別圖|通過修改條款數量來修改 GSM-Symbolic 的難度級別

圖|增加條款數量對性能的影響:隨著GSM-M1→GSM-Symb→GSM-P1→GSM-P2的難度增加,性能分布向左移動(即準確性下降),方差增加。

結果發現,隨著問題難度的增加(GSM-M1 → GSM-Symb → GSM-P1 → GSM-P2),模型的表現不僅下降顯著,且表現波動也變得更加劇烈。面對更復雜的問題時,模型的推理能力變得更加不可靠。

4.大模型沒有真正理解數學概念

研究中還添加無關子句,實驗表明對LLM推理性能的巨大影響,研究團隊設計了 GSM_NoOp 實驗,在原有問題中添加一個似乎相關但實際無關的子句 (hence "no-op")。

結果顯示,所有模型的表現都顯著下降,包括性能較好的 o1 模型在內。這種現象進一步說明,模型并沒有真正理解數學概念,而是通過模式匹配來得出答案。

圖|在 GSM-NoOp 上,模型的性能明顯下降,較新的模型比舊的模型下降更大。圖|在 GSM-NoOp 上,模型的性能明顯下降,較新的模型比舊的模型下降更大。

(a) 在GSM-NoOp上,模型的性能顯著下降,其中較新的模型比舊模型下降得更多。(b) GSM-Symbolic上的性能與GSM8K非常接近。然而,在GSM-NoOp上,即使使用完全相同問題的變體作為示例(NoOp-Symb),或者使用包含No-Op操作的不同GSM-NoOp問題的不同問題作為示例(NoOp-NoOp),性能顯著下降的情況也無法恢復。(c) 值得注意的是,一些在GSM8K和GSM-Symbolic上表現明顯差于(b)中模型的,在NoOp-Symb上卻表現出了更好的性能。

5.擴展規模和計算能力并不能解決根本問題

此外,他們還探討了通過擴大數據、模型規模或計算能力是否能夠解決推理能力不足的問題。Mehrdad Farajtabar 表示,盡管 OpenAI 的 o1 系列在性能上有一定改善,但它們也會出現這樣的愚蠢錯誤,要么是它不明白“現在”是什么意思,要么是它不明白“去年”是什么意思,還有一種更可能的解釋是,更大的訓練數據具有這種模式,所以它又沿用了這種模式。

圖片圖片

圖|o1-mini 和 o1-preview 的結果:這兩個模型大多遵循我們在正文中介紹的相同趨勢。然而,o1-preview 在所有難度級別上都顯示出非常強大的結果,因為所有分布都彼此接近。

作者認為,理解大語言模型的真正推理能力對于在現實世界中的應用至關重要,尤其是在 AI 安全、教育、醫療保健和決策系統等對準確性和一致性要求極高的領域。

研究結果表明,當前大語言模型的表現,更像是高級的模式匹配器,而非具備形式推理能力的系統。為了在這些領域安全、可靠地部署大語言模型,開發更為魯棒和適應性強的評估方法顯得尤為重要。

二、不過,OpenAI 的o1模型的推理的確強勁

令人驚訝的是,根據研究人員的說法,在這個基準測試中,OpenAI 的 o1 表現出“在各種推理和基于知識的基準測試中的強勁表現”,但當研究人員引入 GSM-NoOp 實驗時,能力下降了 30%,該實驗涉及向問題添加不相關的信息。PS:上個月OpenAI推出o1模型時也曾表示,提示詞宜簡單而非復雜。


這證明 OpenAI 這一系列新發布的模型的“推理”能力是越來越好的,也許 GPT-5 會好很多。

然而,可能是 Apple 的 LLM 在推理方面不太拿得出手,該團隊沒有測試 Apple 的模型。

三、科技圈又亂了:大模型壓根不會推理,o1也不行

此外,并不是每個人都對這篇研究論文感到滿意,因為它甚至沒有解釋 “推理 ”的真正含義,而只是引入了一個評估 LLM 的新基準。

“總體而言,我們在語言模型中沒有發現形式推理的證據……它們的行為更好地解釋為復雜的模式匹配——實際上非常脆弱,以至于改變名稱可能會使結果變化約10%!”Mehrdad 進一步補充道,擴展這些模型只會得到“更好的模式機器”,而不是“更好的推理器”。

首先,LLM更多是根據分散注意力的材料來進行“推理”,所以這種失敗,并不是什么新鮮事。斯坦福大學的 Robin Jia Percy Liang 早在 2017 年進行了一項類似的研究,結果相似。

其次,LLM 中缺乏足夠抽象、正式的推理的另一個表現是,大模型往往在解決小問題上的性能還可以,但隨著問題變大,性能很快就會下降,甚至分崩離析,正如7月 Subbarao Kambhapati 的團隊最近對 GPT o1 的分析:

圖片圖片

在整數算術上也能看到同樣的問題。在較舊的模型和較新的模型中,都反復觀察到,在越來越大的乘法問題上,答案準確度的衰減。

圖片圖片

一些人一直聲稱大型語言模型(LLMs)無法進行推理,并且它們是通往通用人工智能(AGI)的歧途。可能蘋果在嘗試將大型語言模型應用于其產品后終于接受了這一事實,這也可能是它退出對OpenAI投資的原因之一。

即便是目前最先進的o1模型,也不能解決這個問題。

圖片圖片

再有,Gary Marcus 還指出,大模型不遵守國際象棋規則。

圖片圖片

大多數研究人員都在贊揚蘋果的這篇論文,并認為其他人接受大型語言模型無法進行推理這一點也很重要。大型語言模型的長期批評者加里·馬庫斯也分享了多個大型語言模型無法執行推理任務(如計算和象棋)的例子。

圖片圖片

四、反對者:這是真的嗎?論文作者混淆了概念

但這是真的嗎?大型語言模型真的不會推理嗎?

不過,反對這一論文結果的也大有人在。

有人認為,蘋果論文的一個問題是它將推理與計算混淆了。“推理是知道用算法來解決問題,而不是全部在腦海中解決,”人工智能研究者Paras Chopra解釋道,同時他也指出,盡管大多數大型語言模型(LLMs)最終得出了錯誤的答案,但它們確實知道解決問題的方法。他認為,即使答案錯誤,知道解決問題的方法也足以檢查大型語言模型是否在進行推理。

一篇在Hacker News上的討論強調,蘋果公司的研究人員向大型語言模型(LLMs)提出的一些問題試圖“捉弄”它們,因為這些問題中包含了不相關的信息,而大型語言模型無法主動過濾掉這些信息。

圖片圖片

推理是在知識領域中逐步、迭代地減少信息熵的過程。OpenAI的o1-preview通過引入迭代更好地實現了這一點。它并不完美,但確實做到了。

亞利桑那州立大學(ASU)計算機科學和人工智能教授 Subbarao Kambhampati同意,關于大型語言模型具備推理能力的一些說法是夸大其詞的。然而,他表示,大型語言模型需要更多的工具來處理系統2任務(即推理),而“微調”或“思維鏈”等技術并不足以滿足這一需求。

當OpenAI發布o1模型,并宣稱該模型能夠思考和推理時,Hugging Face的首席執行官Clem Delangue并不買賬。“又一次,一個AI系統并不是在‘思考’,而是在‘處理’、‘運行預測’……就像谷歌或電腦所做的那樣,”Clem 在談到OpenAI如何錯誤地描繪其最新模型所能實現的功能時說道。

雖然一些人表示贊同,但另一些人則認為這正是人類大腦的工作方式。“又一次,人類的大腦并不是在‘思考’,而只是在執行一系列復雜的大規模生物化學/生物電計算操作,”Phillip Rhodes回復德朗格道。

為了測試推理能力,有些人還會問大型語言模型(LLMs)單詞“Strawberry”中有多少個“r”,這完全沒有意義。大型語言模型無法直接計算字母數量,因為它們是以稱為“標記”的文本塊來處理文本的。自大型語言模型誕生以來,對它們的推理測試就一直存在問題。

五、寫在最后

每個人對大型語言模型似乎都有強烈的看法。一些人基于Yann LeCun或弗朗索瓦·肖萊(Francois Chollet)等專家的研究,認為應該更認真地對待大型語言模型的研究;而另一些人則跟風批評。有人說它們是我們通往通用人工智能(AGI)的門票,而另一些人則認為它們只是被美化的、有著花哨名字的文本生成算法。

相比之下,AI大神Andrej Karpathy最近表示,這些大型語言模型或Transformer所使用的預測下一個token的技術,或許能夠解決其他領域之外的許多問題。

雖然在某種程度上,大型語言模型確實能夠進行推理,但一旦將它們付諸實踐進行測試,最終還是會失敗。這并不是什么新鮮事,反而是一種機會:機器還取代不了人類!

想了解更多AIGC的內容,請訪問:

51CTO AI.x社區

http://www.jxzklqfsx.com/aigc/

責任編輯:武曉燕 來源: 51CTO技術棧
相關推薦

2025-07-08 03:11:00

2023-01-05 09:33:37

視覺模型訓練

2024-10-21 16:41:17

2025-02-08 17:00:11

2025-04-30 16:48:07

2023-10-11 12:32:53

AI模型

2024-06-24 12:22:34

2024-09-09 08:31:15

2025-08-11 08:00:00

2025-05-21 13:48:58

AI模型推理

2023-05-05 13:29:04

模型推理

2024-07-08 12:18:13

2024-02-01 08:34:30

大模型推理框架NVIDIA

2025-05-13 05:11:00

推理模型微調

2023-09-01 09:42:37

模型學習

2025-10-10 01:25:00

大模型訓練數據OpenAI

2023-05-30 14:17:00

模型推理

2021-04-09 16:50:03

物聯網科技IoT

2025-06-26 09:06:59

2011-12-16 16:29:57

點贊
收藏

51CTO技術棧公眾號

国产精品久久久久影院老司| 影音国产精品| 91精品国产高清一区二区三区| 杨幂一区欧美专区| 国产精品福利电影| 一本色道久久精品| 在线观看欧美日韩国产| 少妇性l交大片7724com| 蜜桃av在线| 中文字幕一区二区在线观看| 国内视频一区二区| 在线播放精品视频| 亚洲毛片视频| 精品激情国产视频| 草草地址线路①屁屁影院成人| 成人全视频免费观看在线看| 亚洲视频香蕉人妖| 精品国产乱码久久久久软件 | 亚洲一区免费视频| 日本亚洲欧洲精品| 少妇高潮一区二区三区99小说| 日韩精品三区四区| 国内精品400部情侣激情| 波多野结衣一二三四区| 欧美电影在线观看免费| 欧美挠脚心视频网站| 欧美日韩黄色一级片| 国产美女福利在线| 国产人妖乱国产精品人妖| 国产精品裸体一区二区三区| 日韩不卡高清视频| 亚洲一区视频| 国内精品久久久久伊人av| 国产精品免费人成网站酒店| 精品国产美女| 亚洲精品一区二区三区在线观看 | 久久综合久久鬼| 久久精品99久久无色码中文字幕| 精品调教chinesegay| 又黄又色的网站| 欧美a级大片在线| 欧美日韩亚州综合| 无人在线观看的免费高清视频 | 亚洲国产成人高清精品| 日韩不卡一二区| 国产在线高清理伦片a| 国产精品视频一二三| 日韩欧美在线一区二区| 国产中文字幕在线| 国产农村妇女毛片精品久久麻豆| 欧美精品一区二区三区四区五区 | 99在线精品视频| aaa级精品久久久国产片| 国产日韩欧美一区二区东京热 | 亚洲国产一区在线观看| 少妇久久久久久被弄到高潮| av免费网站在线| 亚洲男人的天堂一区二区| 99re99热| www在线免费观看视频| 亚洲视频网在线直播| 日本特级黄色大片| 亚洲小说区图片区都市| 亚洲午夜免费福利视频| 三上悠亚久久精品| 偷拍自拍在线看| 一本一本大道香蕉久在线精品| 成年人视频网站免费观看| 中文在线а√在线8| 色综合久久中文字幕| 国产精品亚洲a| 免费在线观看亚洲| 欧美一区二区三区另类| 国内精品久久久| 亚洲欧美偷拍一区| 毛片av中文字幕一区二区| 国产日韩在线播放| 亚洲av无码国产精品永久一区| 粉嫩av一区二区三区在线播放 | 国产成人免费看一级大黄| 国产成人a级片| 精品国产一区二区三区麻豆小说 | youjizz久久| 欧洲精品码一区二区三区免费看| 97电影在线看视频| 亚洲欧美国产毛片在线| 日本久久久网站| 成人性生交大片免费观看网站| 欧美亚洲综合另类| 日本一二三四区视频| 国产精品videossex| 亚洲免费人成在线视频观看| 亚洲aaa视频| 精品91在线| 国产精品欧美一区二区| www.国产精品视频| 国产三区在线成人av| 玖玖精品在线视频| 麻豆mv在线观看| 在线成人高清不卡| 一级特黄a大片免费| 91亚洲一区| 91国产视频在线| 国产精品高潮呻吟AV无码| 99久久精品免费看国产| 亚洲国产精品www| 草莓视频丝瓜在线观看丝瓜18| 一本色道久久综合精品竹菊| 日日夜夜精品视频免费观看| 久草成人在线| 欧美激情精品久久久| 最近中文在线观看| 99re视频这里只有精品| 中文字幕乱码免费| 99精品国自产在线| 亚洲精品久久视频| 日韩在线不卡av| 国产精品试看| 成人免费在线一区二区三区| av免费在线一区二区三区| 亚洲成人中文在线| 无套内谢丰满少妇中文字幕| 久久在线电影| 国产精品久久久精品| 香蕉人妻av久久久久天天| 一区二区在线看| 中文字幕精品一区二区三区在线| 国产精品一线天粉嫩av| 欧美激情久久久| 国产农村老头老太视频| 国产精品久久久久久久午夜片| 日韩中文字幕三区| 波多野结衣一区二区三区免费视频| 有码中文亚洲精品| 日韩视频在线观看一区| 波多野洁衣一区| 国产精品视频网站在线观看| 日本精品视频| 另类视频在线观看| 91精品在线视频观看| 中文无字幕一区二区三区| 不要播放器的av网站| 三级精品视频| 欧美一级淫片aaaaaaa视频| 日本毛片在线观看| 亚洲午夜在线电影| 丝袜熟女一区二区三区| 激情欧美丁香| 99久久久精品免费观看国产 | 综合色天天鬼久久鬼色| 中文字幕永久有效| 欧美一区激情| 久久综合色综合88| 日产日韩在线亚洲欧美| 午夜一区在线观看| 色婷婷一区二区三区四区| 亚洲第一成人网站| 久久一区中文字幕| 日本视频一区在线观看| 日韩av懂色| 欧美成人性生活| 好吊视频一区二区三区| 黄色精品一区二区| 黄色一级片在线看| 国产成人福利av| 午夜精品视频网站| 日本在线视频1区| 91豆麻精品91久久久久久| 免费视频91蜜桃| 看片的网站亚洲| 亚洲国产精品女人| 电影一区二区在线观看| 77777少妇光屁股久久一区| 欧洲毛片在线| 欧美日韩免费不卡视频一区二区三区 | 性欧美大战久久久久久久免费观看| 另类中文字幕国产精品| 日韩视频中文字幕| 亚洲精品久久久蜜桃动漫| 偷窥少妇高潮呻吟av久久免费| 懂色av粉嫩av蜜乳av| 日韩中文字幕区一区有砖一区 | 波多野结衣影院| 日韩精品亚洲一区二区三区免费| 中文字幕av日韩精品| 亚洲一区二区免费在线观看| 欧美一级电影在线| 久久综合之合合综合久久| 亚洲第一精品夜夜躁人人躁| 天天干天天插天天射| 亚洲视频一区二区在线观看| 女同性恋一区二区三区| 日本中文一区二区三区| 女人色极品影院| 精品免费视频| 国产福利久久| 韩国精品主播一区二区在线观看 | 日韩欧美一区在线观看| 欧美不卡视频在线观看| 国产精品久久久99| 先锋资源av在线| 精品一区二区三区在线观看| av黄色在线网站| 综合久久亚洲| 日本不卡二区| 国产精品极品在线观看| 国产日韩欧美一二三区| 手机在线观看av| 美女av一区二区| 国产九色在线| 亚洲黄色av网站| 国产熟女一区二区三区四区| 色婷婷综合久久久久中文| 国产大片中文字幕| 1000精品久久久久久久久| 插吧插吧综合网| 国产成人在线视频网址| 国产wwwxx| 性感少妇一区| 亚洲熟妇无码一区二区三区| 综合久久99| 超碰成人在线免费观看| 欧美少妇性xxxx| 免费亚洲一区二区| 欧美激情极品| 91视频网页| 亚洲伊人伊成久久人综合网| 国产精品1234| 美女视频在线免费| 午夜精品久久久久久久99热浪潮| 国产cdts系列另类在线观看| 中文字幕亚洲第一| 国产污视频在线| 亚洲图片在区色| 欧美孕妇性xxxⅹ精品hd| 亚洲第一男人天堂| 人妻无码中文字幕| 欧美va亚洲va国产综合| 精品国产18久久久久久| 5858s免费视频成人| 在线免费观看av片| 欧美日韩一级片网站| 国产精品xxxxxx| 欧日韩精品视频| 波多野结衣视频免费观看| 色婷婷狠狠综合| 亚洲s码欧洲m码国产av| 色综合久久66| 午夜精品一区二| 在线观看免费成人| 在线观看中文字幕av| 91精品免费观看| 国产夫妻自拍av| 欧美mv和日韩mv的网站| 老熟妇高潮一区二区高清视频| 精品日韩成人av| 熟妇人妻系列aⅴ无码专区友真希 熟妇人妻av无码一区二区三区 | 综合激情久久| 国产精品日韩一区二区| 精品伊人久久久| 免费中文日韩| 成人在线一区| 五月天综合婷婷| 好看不卡的中文字幕| 久久亚洲中文字幕无码| 久久国产精品毛片| 久久久久国产一区| 国产精品一区二区三区乱码| 国产伦精品一区二区三区88av| 99精品视频在线观看免费| 欧美图片第一页| 中文字幕电影一区| √天堂中文官网8在线| 亚洲亚洲人成综合网络| 黄瓜视频在线免费观看| 欧美特级限制片免费在线观看| 国产又大又粗又硬| 欧美精品一区视频| 免费一级在线观看| 精品国产一区av| 97人人在线视频| 国产ts人妖一区二区三区| 欧美18—19sex性hd| 成人国产精品日本在线| 草草视频在线一区二区| 欧美h视频在线| 亚洲精品a级片| 欧洲黄色一级视频| 久久99久国产精品黄毛片色诱| 永久av免费在线观看| 91免费看`日韩一区二区| 精品伦精品一区二区三区视频密桃 | 男人天堂亚洲| 国产精品成人aaaaa网站| 日本免费一区二区视频| 欧美一级日本a级v片| 欧美伊人影院| 天堂中文视频在线| 成人高清av在线| 欧美福利在线视频| 欧美小视频在线观看| 国产日韩欧美视频在线观看| 亚洲欧美日韩久久久久久| 2020国产在线视频| 国产精品久久久久久久久久尿| 亚洲一区二区三区中文字幕在线观看 | 妺妺窝人体色www在线小说| 久久91精品久久久久久秒播| 在线观看国产网站| 亚洲综合图片区| 国产免费无遮挡吸奶头视频| 亚洲欧美日韩在线不卡| 国产精品suv一区| 精品少妇一区二区三区在线视频| wwwxxx在线观看| 2019中文在线观看| 88久久精品| 亚洲av综合色区| 美女www一区二区| 国产 欧美 在线| 亚洲大尺度视频在线观看| aaa一区二区三区| 中文字幕亚洲欧美日韩高清| 黑人巨大亚洲一区二区久| 国产精品一区二区欧美| 欧美一区国产在线| 午夜大片在线观看| 国产精品护士白丝一区av| 91久久国产综合久久91| 日韩大陆毛片av| 国产在线看片免费视频在线观看| 99久久精品免费看国产一区二区三区| 99精品一区| www.国产视频.com| 中文字幕第一区| 波多野结衣爱爱| 亚洲视频网站在线观看| 午夜日韩成人影院| 欧美精品欧美精品| 久久看片网站| 波多野吉衣中文字幕| 欧美性xxxxx极品| 日韩a在线观看| 日本乱人伦a精品| 亚洲人亚洲人色久| 97xxxxx| 国产三级三级三级精品8ⅰ区| 国产精品777777| 亚洲人成在线观看| 88xx成人免费观看视频库| 日本一区不卡| 久久精品免费看| 亚洲一二三在线观看| 91精品国产综合久久久久 | 性欧美xxxx视频在线观看| 精品少妇一区| 成人一级片网站| 国产欧美一二三区| 中文字幕日韩国产| 久久亚洲精品中文字幕冲田杏梨| 亚洲国产伊人| 国产91porn| 99久久免费精品高清特色大片| 国产一级片毛片| 国产一区二区三区三区在线观看| 成人国产一区二区三区精品麻豆| 亚洲一区二区在线看| 国产一区二区精品久久91| 精品视频一区二区在线观看| 亚洲加勒比久久88色综合| 另类专区亚洲| 一区二区三区av在线| 国产激情一区二区三区桃花岛亚洲| 久久精品视频日本| 国产丝袜精品第一页| 国产福利亚洲| 99er在线视频| 久久久久青草大香线综合精品| 中文字幕黄色av| 欧美国产日韩视频| 国产精品一区二区av交换| 91欧美一区二区三区| 午夜精品久久久久久久99樱桃| 国产小视频免费在线网址| 91成人免费视频| 午夜亚洲福利在线老司机| 激情无码人妻又粗又大| 欧美r级在线观看| 三上悠亚激情av一区二区三区| 在线不卡视频一区二区| 波多野结衣中文字幕一区二区三区| 五月婷婷激情五月| 久久久久久12| 日韩一区欧美| 国产xxxxxxxxx| 欧美日韩成人在线一区| bbw在线视频| 久久99国产精品一区| 久久综合色天天久久综合图片| 97超碰人人草|