精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

《自然》科學報告:大模型在社會情境判斷方面可以勝過人類

發布于 2024-11-13 14:49
瀏覽
0收藏

大模型在許多任務上表現優異,但是它們在社交情境中的判斷能力仍是一個亟待解答的問題。社會情境判斷不僅涉及對情境的理解,還包括適應和回應他人行為的能力。11 月 10 日《自然》科學報告子刊發布文章《Large language models can outperform humans in social situational judgments》,研究的目的正是為了探討 LLM 能否在這方面與人類匹敵甚至超越人類。這項研究通過情境判斷測試(SJT)對多款聊天機器人的表現進行了評估,并將其與人類參與者的表現進行了對比,試圖回答這一關鍵問題。

在這項研究中,研究團隊選擇了五款廣泛使用的聊天機器人:Microsoft Copilot、ChatGPT、Claude、Google Gemini 和 you.com 的智能助手。這些機器人均能夠處理自然語言并生成文本響應。在測試過程中,研究團隊嚴格控制變量,確保每次測試的對話上下文不影響結果,從而保證了實驗的嚴謹性和科學性。

研究團隊隸屬于德國航空航天中心(DLR)的航空與空間心理學部門,具體歸屬于位于漢堡的航空航天醫學研究所。團隊成員包括 Justin M. Mittelst?dt、Julia Maier、Panja Goerke、Frank Zinn 和 Michael Hermes。他們在航空與航天心理學領域有著豐富的研究經驗,致力于提升航空航天環境中與心理學相關的各類問題和能力。此次研究利用他們在心理學測評和人工智能領域的專業知識,深入探討了LLM在復雜社交情境中的潛力。

本次研究的數據和代碼部分可供審閱和驗證,以確保結果的透明性和可重復性。對于第一部分分析(包括人類和 AI 的響應及整體得分)的代碼和數據,可通過 PsychArchives 的審稿人鏈接獲取。鏈接地址為 PsychArchives(https://pasa.psycharchives.org/reviewonly/3c765f33df7a70fb3a7c3470d701003445254d19c4a8546404fdafca5da7cfc9)。

由于涉及數據的隱私和保密性,第二部分分析的數據無法公開獲取。如果需要此部分數據,可以直接聯系 Thomas Gatzka(專家評分)或通訊作者(LLM 評分)進行請求。這一流程確保了數據的合法和合規使用,同時也為進一步的研究提供了必要的支持。

通過提供數據和代碼的獲取方式,研究團隊希望促進學術界的開放和合作,使得更多研究人員能夠基于此研究進行后續工作,從而推動人工智能和心理學領域的進一步發展。

方法

情境判斷測試(SJT)是本次研究的核心工具之一,用于評估個體在復雜社交情境中的決策和判斷能力。SJT 是一種標準化的心理測量工具,通過模擬現實中的社交場景,提供一系列可能的行為選項,要求參與者選擇最適當和最不適當的行為。這種測試廣泛應用于心理學研究和人員選拔,因其有效性和可靠性而備受認可。

本次研究使用的 SJT 包含十二個不同的情境,每個情境都提供四個預定義的行為選項。測試開發期間,109 名獨立專家對這些行為選項的有效性進行了評分,確定了最佳和最差的應對方案作為評分基礎。為了確保測試結果的客觀性和有效性,研究團隊選擇了五款在自然語言處理和生成文本響應方面表現優異的聊天機器人:Microsoft Copilot、ChatGPT、Claude、Google Gemini 和 you.com 的智能助手。

每個聊天機器人都有其獨特的特性和可能不同的超參數,盡管這些信息沒有公開披露。為了保證可比性,研究團隊將所有聊天機器人設置為默認模式,并在每次重新執行 SJT 問卷時啟動新對話,以消除上下文對響應的影響。Microsoft Copilot 是基于 GPT-4 大型語言模型的聊天機器人,它能夠在響應中包括當前的互聯網搜索結果;OpenAI 的 ChatGPT 是基于 GPT-4o 大型語言模型,訓練數據集包括大量文本和代碼;Claude 由 Anthropic AI 開發,基于 Claude 3.5-Sonnet 大型語言模型,特別設計為安全、可靠并防止濫用;Google Gemini 由 Gemini 1.5-Pro 大型語言模型提供支持,能夠搜索互聯網并利用這些信息生成響應;You.com 的智能助手模型同樣能夠訪問最新的互聯網信息并將其整合到響應中。

在人類樣本方面,研究團隊選擇了 276 名申請飛行員的參與者,這些參與者至少持有高中學歷,并在情境判斷測試中表現優異。大多數參與者為男性,年齡在 18 至 29 歲之間。本次研究遵循赫爾辛基宣言和歐洲心理學家聯合會的模型倫理守則進行,所有參與者均被告知其數據將被匿名評估,并在知情同意的情況下自愿參與研究。此外整個飛行員選拔過程通過了 TüV NORD CERT 的 ISO 9001 認證,要求遵守包括德國心理學會在內的法律和倫理標準。

在測試程序中,研究團隊將 SJT 項目和說明輸入到每個聊天機器人 API 的輸入表單中,并記錄每個 AI 的響應。為了確保聊天機器人不會由于記憶限制而忘記原始指令,研究團隊在每個場景后重復了原始指令“請選擇最佳和最差選項”。在某些情況下,聊天機器人未能提供明確的響應,研究團隊提醒它們選擇一個最佳選項和一個最差選項,從而解決了這一問題。

方法細節

情境判斷測試(SJT)是本次研究中用于評估個體在復雜社交情境中的判斷和決策能力的核心工具。SJT 通過模擬現實中的社交場景,要求參與者在一系列可能的行為選項中選擇最適當和最不適當的行為。這種測試不僅能夠評估個體的社交能力,還能預測其在真實生活中的社交行為表現。

研究團隊使用了一個包含十二個情境的SJT,每個情境都提供四個預定義的行為選項。這些選項在測試開發過程中由109名獨立專家進行了評分,確定了最佳和最差的應對方案。專家的平均年齡為50.4歲,平均有15.8年的團隊發展顧問經驗。他們對每個行為選項的有效性進行了五點量表的評分,以定義哪個選項是最好的應對行為(最高效)和哪個選項是最差的應對行為(最低效)。

一個示例情境是:你與一名團隊成員在如何處理一個共同工作任務上發生了爭論。在一次激烈但事實性的辯論中,你們雙方都堅稱自己的解決方案最好。在這種情況下,你應該做什么以及不應該做什么?例如,選項包括“建議請一名未參與的團隊成員作為調解員”和“要求對方將討論推遲到稍后時間”。

研究的另一部分包括對情境中每個行為選項的有效性進行評分。每個聊天機器人被要求對每個情境的每個選項進行1到10分的評分,這一過程重復了十次。隨后,研究團隊將這些平均有效性評分與專家評分進行相關性分析。

為了確保研究的嚴格性,研究團隊采用了一系列統計分析方法。研究團隊計算了每個模型在十次運行中的響應一致性,使用了Fleiss' Kappa來確定“AI內部可靠性”。然后為了比較AI模型和人類參與者在SJT上的總體表現,研究團隊使用了單因素 Kruskall-Wallis 測試。由于人類樣本數據中的正態性假設被違反,研究團隊選擇了非參數統計方法。對于顯著的 Kruskall-Wallis 測試結果,研究團隊進一步計算了事后成對 Wilcoxon 測試(使用 Bonferroni-Holm p 值校正),以比較人類參與者和AI模型之間的差異,以及各AI模型之間的差異。

結果

在本次研究中,情境判斷測試(SJT)用于評估大型語言模型(LLM)與人類在復雜社交情境中的判斷和決策能力。實驗結果顯示,LLM在SJT上的整體表現顯著優于人類參與者。具體來說,Claude 3.5-Sonnet 獲得了最高的平均得分(M=19.4,SD=0.66),緊隨其后的是 Copilot(M=17.5,SD=1.36)和 you.com 的智能助手(M=16.8,SD=1.40),而 ChatGPT(M=14.5,SD=0.81)和 Gemini(M=13.9,SD=1.14)則表現稍遜。相比之下,人類參與者的平均得分為 M=14.2(SD=3.27)。

《自然》科學報告:大模型在社會情境判斷方面可以勝過人類-AI.x社區

圖1:聊天機器人和人類樣本的SJT得分。人類樣本中的分數分布以黑色表示。方框圖中的黑框表示得分的中間50%,而白點和水平線表示人類樣本的平均值。彩色圖表顯示了SJT上五個LLM的平均性能,誤差條表示95%的置信區間。半透明點表示單個結果。

《自然》科學報告:大模型在社會情境判斷方面可以勝過人類-AI.x社區

表1:SJT評分的成對比較。標明了所有成對比較的Bonferroni-Holm調整后的p值。

通過單因素 Kruskall-Wallis 測試,研究團隊發現人類與 LLM 之間存在顯著的均值差異(χ2(5)=43.01,p<0.001)。進一步的成對比較顯示,Claude 的得分顯著高于人類樣本和其他所有 LLM;Copilot 和 you.com 也顯著高于人類樣本及 ChatGPT 和 Gemini,但二者與人類樣本的表現沒有顯著差異。

《自然》科學報告:大模型在社會情境判斷方面可以勝過人類-AI.x社區

表2:人類和聊天機器人每種情況的項目難度。區分項目難度,以選擇最佳和最差選項。最后一列顯示了所有聊天機器人的項目難度。

在分析 LLM 的響應模式時,研究發現盡管聊天機器人總體表現良好,但在具體情境下的選擇上存在一定的變異性。例如,Gemini 和 you.com 在不同的迭代中會將同一選項分別視為最優和最差。而 Claude、ChatGPT 和 Copilot 的響應一致性較高,分別為 κ=0.934、κ=0.856 和 κ=0.807。

進一步分析表明,當 LLM 未能識別出最佳或最差選項時,它們傾向于選擇第二最佳選項,這與人類樣本的響應分布高度一致。在 70% 的情況下,所有 LLM 都能正確識別出最佳或次佳選項。即使在未能識別出正確答案時,它們也主要選擇了專家認為的第二最適當選項(19%)。

在有效性評級方面,研究將聊天機器人與專家在測試開發期間的有效性評分進行了比較。Claude 的評分與專家的相關性最高(r=0.87),Gemini 的相關性最低(r=0.78),但仍表明與專家有很高的一致性。

《自然》科學報告:大模型在社會情境判斷方面可以勝過人類-AI.x社區

圖2:五種LLM、所有LLM和人類樣本的選項選擇相對頻率。最合適的答案是與專家判斷最接近的答案(即,選擇最佳選項作為最佳,或選擇最差選項作為最差)。因此,第二最合適的選項意味著它被專家評為第二最有效(在選擇最佳行動方案時)或第三最有效(當選擇最差行動方案),以此類推。

《自然》科學報告:大模型在社會情境判斷方面可以勝過人類-AI.x社區

表3:聊天機器人和專家評級的相關性。第二列顯示了聊天機器人和專家評估的選項有效性之間的相關性。以下所有列顯示了聊天機器人之間有效性評級的相關性。

這些結果表明,LLM 在社交情境中的判斷能力不僅與人類相當,有時甚至更勝一籌。它們能夠準確識別社交情境中的最佳行動選項,并與專家的評分高度一致。這表明 LLM 在復雜社交情境中具備較強的應對和決策能力,能夠為用戶提供有效的建議和指導。

討論

大模型在社會情境判斷測試(SJT)中的表現顯著優于人類參與者。具體而言,Claude 3.5-Sonnet、Microsoft Copilot 和 you.com 的智能助手在提出適當行為建議方面的表現明顯優于人類。此外,這些模型對不同行為選項的有效性評級與專家評估高度一致。這樣的結果表明,LLM 在復雜社交情境中的判斷能力不僅與人類相當,有時甚至更勝一籌。

在實際應用中,這一發現具有重要意義。LLM 可以作為社交顧問,為用戶提供在各種社交情境中的行為建議,幫助那些在社交互動中感到不自信或難以表現出同理心的人士。例如,LLM 可以提供如何處理工作中的沖突、如何與同事合作以及如何在團隊中有效溝通的建議。這些應用不僅可以提高個人的社交技能,還可以改善團隊合作和工作環境。

此外,LLM 在心理健康領域也展現出了巨大的潛力。由于心理健康專業人員的普遍可用性受限或短缺,特別是在 COVID-19 大流行期間,基于 LLM 的聊天機器人被探索作為傳統心理健康服務的替代品。LLM 可以通過對話收集數據,幫助識別和評估心理健康問題,特別是對于那些難以獲得傳統心理健康服務的少數群體。盡管完全替代心理健康服務的想法存在爭議,但 AI 輔助流程的實施確實有助于擴大心理健康服務的獲取。

盡管如此,LLM 在社交互動中的應用也帶來了倫理和社會影響。LLM 在處理復雜情境時可能產生誤解,尤其是在涉及道德決策時。如果人們過于依賴 LLM 的建議,可能會導致社交技能的退化和人際互動的減少。用戶必須對 LLM 的建議進行批判性審查,以避免不一致的響應模式。

另一個重要的考慮是文化和社會偏見的問題。由于 LLM 的訓練數據可能主要來自英語國家或比例較高的西方文化背景,社會規范因文化而異,因此 LLM 可能在社會判斷方面存在文化偏見。未來的研究應探索文化依賴的范圍及防止方法,以確保 LLM 在不同文化背景下的應用公平和有效。

限制

盡管研究展示了大型語言模型(LLM)在社會情境判斷測試(SJT)中顯著優于人類的表現,但研究團隊必須考慮到一些重要的局限性。人類樣本的組成可能限制了研究結果的廣泛適用性。研究中的人類樣本主要由飛行員申請者組成,這些參與者通常相對較年輕,男性比例較高,且受教育水平較高。這意味著他們的社交判斷能力可能高于一般人群,從而導致了一個相對較高的基準分數。因此將這些結果推廣到更廣泛的人群時,必須謹慎對待。進一步的研究應考慮更加多樣化和代表性的人類樣本,以驗證這些發現的普遍性和適用性。

此外本次研究結果表明LLM在SJT中的表現優異,但這并不一定意味著它們在復雜現實場景中也能保持一致性。SJT是一種標準化測試,情境和選項都是預先定義好的,LLM只需要選擇最佳和最差的選項。而在真實生活中,社交情境的復雜性和不可預測性遠高于SJT。這些情境中可能涉及更多的變量和不確定性,例如動態變化的情境、突發事件和多樣化的人際關系。在這些情況下,LLM是否能夠做出一致且適當的社交判斷仍然是一個懸而未決的問題。為了確保LLM在現實應用中的可靠性和有效性,還需要進一步的研究來檢驗其在復雜和動態環境中的表現。

LLM在實際應用中的倫理和社會影響也是需要考慮的重要問題。盡管LLM顯示出在社交情境判斷中的強大能力,但其使用過程中可能出現的偏見和誤解,以及人們對其建議的過度依賴,都會對社會產生深遠影響。確保LLM在不同文化和社會背景下的公平性和適用性,需要采取嚴格的監控和調整措施。

結論

本次研究揭示了大型語言模型(LLM)在社會情境判斷測試(SJT)中的卓越表現。通過對比五款知名聊天機器人(Microsoft Copilot、ChatGPT、Claude、Google Gemini、you.com)的測試結果和人類參與者的表現,研究團隊發現,LLM在提供適當行為建議和有效性評級方面不僅能夠匹敵人類,甚至在某些情況下超越人類。這表明LLM具備在復雜社交情境中進行準確判斷和決策的能力,為其在實際應用中提供了有力的支持。

這些發現不僅突顯了LLM在社交能力測試中的優異表現,還展現了其在不同社交情境中提供有效指導的潛力。未來LLM有望在許多領域中發揮重要作用。在社交互動方面,LLM可以作為社交顧問,為用戶提供適當的行為建議,幫助那些在社交場合中感到不自信或難以表現出同理心的人士。在心理健康領域,LLM可以通過對話收集數據,輔助心理健康服務的提供,特別是在專業人員短缺或資源有限的情況下,幫助更多的人獲得心理支持。

盡管LLM的潛力巨大,其應用也伴隨著潛在風險。LLM在處理復雜現實場景時可能會出現不一致的判斷和決策,這要求研究團隊對其建議進行批判性審查,以避免誤導。由于LLM的訓練數據可能存在文化和社會偏見,研究團隊需要采取措施確保其在不同文化背景下的公平性和適用性。此外過度依賴LLM的建議可能導致社交技能的退化和人際互動的減少,這也是需要警惕的問題。

總而言之,本次研究強調了LLM在社交情境判斷中的卓越表現和未來應用中的巨大潛力,同時也提醒研究團隊關注其可能帶來的風險和挑戰。通過進一步的研究和嚴格的監控,研究團隊可以推動LLM技術的健康和負責任的發展,使其真正造福社會。

參考資料:https://www.nature.com/articles/s41598-024-79048-0

本文轉載自 ??大噬元獸??,作者: FlerkenS

收藏
回復
舉報
回復
相關推薦
周于希免费高清在线观看| 特黄特黄一级片| 日本大臀精品| 美美哒免费高清在线观看视频一区二区 | 亚洲丁香久久久| 97国产精东麻豆人妻电影| 国产日本在线观看| 伊人久久大香线蕉精品组织观看| 欧美一个色资源| 一女被多男玩喷潮视频| av在线日韩国产精品| 国产精品亚洲成人| 日本老师69xxx| 侵犯稚嫩小箩莉h文系列小说| 欧美男男freegayvideosroom| 欧美日韩一级二级三级| 国产v片免费观看| 日韩精品毛片| 久久综合色之久久综合| 亚洲一区二区中文字幕| 国产午夜无码视频在线观看| 国产综合亚洲精品一区二| 亚洲视频第一页| 欧美激情 亚洲| 色综合999| 欧美韩国一区二区| 精品欧美一区二区精品久久| 九九九国产视频| 精品不卡一区| 欧美色区777第一页| 日韩精品在线观看av| 日日夜夜精品一区| 2欧美一区二区三区在线观看视频| 欧美国产日韩精品| 久久久久麻豆v国产| 亚洲美女久久| 亚洲成色777777在线观看影院| 手机在线看福利| 女厕盗摄一区二区三区| 亚洲综合免费观看高清完整版| 午夜欧美性电影| 免费a在线观看| jiyouzz国产精品久久| 91免费欧美精品| 亚洲系列第一页| 日本系列欧美系列| 国产成人aa精品一区在线播放 | 男人的天堂在线视频| 国产91露脸合集magnet| 亚洲a一级视频| 国产女人高潮时对白| 美女在线一区二区| 国产精品青青在线观看爽香蕉| 在线精品免费视| 久久婷婷激情| 日韩在线观看免费全集电视剧网站| 国产精品九九视频| 美女呻吟一区| 日韩精品中文字| 添女人荫蒂视频| 自拍欧美一区| 综合网日日天干夜夜久久| 丁香激情五月少妇| 久久免费av| 欧美xxxx老人做受| 精人妻一区二区三区| 亚洲不卡视频| 在线中文字幕一区二区| 妓院一钑片免看黄大片| 亚洲一二三四| 色天使久久综合网天天| 亚洲成人av免费看| 亚洲精品三区| 宅男噜噜噜66一区二区66| 天天操精品视频| 亚洲不卡在线| 日韩精品视频三区| 粉嫩av蜜桃av蜜臀av| 精品国产一区二区三区| www.国产精品一二区| 亚洲激情 欧美| 在线亚洲a色| 中文字幕免费精品一区| 成人在线观看高清| 在线日韩视频| 日韩美女毛茸茸| 在线观看国产精品视频| 国产麻豆91精品| 久久精品二区| 欧美猛烈性xbxbxbxb| 一区二区三区精品视频| 国产黄色一级网站| 91九色综合| 欧美一级二级在线观看| 丰满大乳奶做爰ⅹxx视频| 成人激情诱惑| 久久久久久久一区二区| 国产黄色免费视频| 国产精品1区2区3区在线观看| 久久久久久久免费| 精品国产丝袜高跟鞋| 五月婷婷激情综合| 特级丰满少妇一级| 国产精品2023| 欧美一个色资源| 午夜一区二区三区免费| 午夜片欧美伦| 国产成人a亚洲精品| www.久久久久久| 国产欧美日韩中文久久| 亚洲色成人www永久在线观看| 成人日韩在线| 亚洲国产精久久久久久 | 国产精品久久久久天堂| 国产日本在线播放| 欧美视频精品| 欧美日韩在线观看一区二区| 国产一精品一aⅴ一免费| 欧美色图一区| 51色欧美片视频在线观看| 国产成人麻豆精品午夜在线| 国产精品入口麻豆原神| 欧美三级一级片| youjizzjizz亚洲| 精品久久久久久久久久久院品网| 日本成人午夜影院| 亚洲欧美大片| 国外成人免费视频| 宅男网站在线免费观看| 欧美日韩亚洲丝袜制服| 国产特级黄色录像| 妖精视频成人观看www| 久久久久久久国产精品| 国产又黄又粗又长| 中文字幕不卡一区| 欧美亚洲日本在线观看| 台湾佬综合网| 97视频在线观看免费高清完整版在线观看| 国产又色又爽又黄又免费| 国产亚洲欧美激情| 欧美牲交a欧美牲交aⅴ免费真| 激情小说亚洲色图| 午夜精品一区二区三区在线播放| 精品国自产拍在线观看| 亚洲视频一二区| 国产又粗又猛大又黄又爽| 天天操夜夜操国产精品| 91精品国产自产在线| 在线看av的网址| 欧美日韩你懂得| 国产精品久久国产精麻豆96堂| 免费看日韩精品| 亚洲国产精品视频一区| 青青国产精品| 久久偷看各类女兵18女厕嘘嘘| 影音先锋国产在线| 国产在线视频不卡二| 一区二区三区免费看| 99在线视频影院| 亚洲国产天堂久久国产91 | 一本色道久久综合亚洲91| 亚洲成人福利在线观看| 精品国产一区探花在线观看| 国产精品久久久久久亚洲影视| 高清毛片在线看| 欧美日韩在线一区二区| 国产精品视频一区二区在线观看| 久久国产成人午夜av影院| 黄色a级在线观看| 日韩一级淫片| 国产91精品久久久久| 黄色av免费在线看| 亚洲在线免费播放| 丰满岳乱妇一区二区| 亚洲综合不卡| 午夜久久资源| 亚洲高清999| 97婷婷大伊香蕉精品视频| 欧美女v视频| 欧美三级欧美一级| 青娱乐在线视频免费观看| 日韩va欧美va亚洲va久久| 亚洲三级一区| 97青娱国产盛宴精品视频| 日本国产精品视频| 欧美 日韩 人妻 高清 中文| 欧美性xxxxx| 91香蕉一区二区三区在线观看| 国产黄色精品网站| 777久久久精品一区二区三区| 欧美自拍偷拍| 国产欧美一区二区视频| 69堂精品视频在线播放| 色综合导航网站| 国模精品一区二区| 日韩视频永久免费| 成人av网站在线播放| 亚洲欧美另类小说| 蜜桃精品一区二区| 国产精品综合av一区二区国产馆| 欧美一级片中文字幕| 亚洲欧洲中文字幕| 欧美高清视频一区| 欧美电影在线观看一区| 国产97在线视频| 成人高潮aa毛片免费| 日韩中文综合网| 完全免费av在线播放| 国产欧美丝祙| 99精品一区二区三区的区别| 色天下一区二区三区| 91人成网站www| 精品成人av| 欧美一区二区三区精品电影| 9191在线播放| xxx欧美精品| 成人免费在线电影| 亚洲精品理论电影| 亚洲精品免费在线观看视频| 欧美精品日日鲁夜夜添| 中文字幕在线日本| 精品久久中文字幕| 久久久久国产精品夜夜夜夜夜| 国产精品人人做人人爽人人添| 91av在线免费| 成人免费视频一区| 国产日韩欧美久久| 青娱乐精品视频| 成年人网站大全| 国产午夜久久| 国产老熟妇精品观看| 海角社区69精品视频| 国产911在线观看| 99久久婷婷| 亚洲午夜精品久久久中文影院av | 色呦呦网站入口| 视频在线不卡免费观看| 日韩视频专区| www一区二区三区| 国产欧美va欧美va香蕉在线| 日韩另类视频| 国产精品久久久久久久久久免费| 欧美日韩视频网站| 日本一区二区在线播放| sis001欧美| 国产成人高清激情视频在线观看| 午夜影院在线观看国产主播| 午夜免费日韩视频| 欧美13videosex性极品| 91av视频导航| 欧美激情午夜| 色妞一区二区三区| 巨大荫蒂视频欧美大片| 日韩中文娱乐网| 欧美a在线看| 久久这里只有精品视频首页| 理论片午午伦夜理片在线播放| 日韩网站免费观看高清| 国产黄色在线观看| 久久久久久国产精品三级玉女聊斋| www.综合网.com| 26uuu另类亚洲欧美日本老年| 成人性生交大片免费网站 | 草草草视频在线观看| 欧美日韩ab| 丝袜美腿玉足3d专区一区| 日韩成人a**站| 警花观音坐莲激情销魂小说| 伊人久久大香线| av在线播放亚洲| 三级精品在线观看| theporn国产精品| 日韩不卡一二三区| 久久精品一卡二卡| 成人福利视频网站| 美女脱光内衣内裤| 国产精品久久久久久久久果冻传媒 | 国产精品久久久久久亚洲毛片| 老熟妇高潮一区二区三区| 亚洲精品视频观看| 六月丁香婷婷综合| 欧美日韩免费一区二区三区| 国产成人精品毛片| 亚洲欧美日韩区| 99在线视频观看| 欧美中文在线字幕| 成人在线视频区| 久久另类ts人妖一区二区| 日韩精品久久久久久久电影99爱| 国产在线无码精品| 日韩不卡一区二区| 最新版天堂资源在线| 久久精品亚洲国产奇米99| 一级全黄裸体片| 久久九九久精品国产免费直播| 任我爽在线视频| 欧美日韩国产精品一区二区三区四区 | 高潮在线视频| 国产精品久久久久久av福利| 亚洲午夜免费| 视频一区二区在线| 亚洲久久一区| 中文字幕一区二区在线观看视频 | 变态调教一区二区三区| 国产精品永久免费观看| 牛牛影视一区二区三区免费看| 在线观看日韩羞羞视频| 激情综合网五月| 日本国产中文字幕| 蜜桃av一区二区三区| 国产偷人妻精品一区| 亚洲精选在线视频| 亚洲专区第一页| 亚洲精品视频网上网址在线观看 | 亚洲精选免费视频| 中文字幕免费高清在线观看| 亚洲国产精品一区二区久| av观看在线| 国产日韩视频在线观看| 天天躁日日躁狠狠躁欧美| 亚洲精品国产suv一区88| 精品制服美女丁香| 国产一区二区三区四区在线| 午夜av一区二区三区| 亚洲免费一级片| 美女福利精品视频| 欧美xxxx黑人又粗又长| 国产欧洲精品视频| 欧美一二区在线观看| 日韩人妻精品无码一区二区三区| 成人晚上爱看视频| 国产美女福利视频| 在线不卡a资源高清| 中文日本在线观看| 国产精品网红直播| 欧美肉体xxxx裸体137大胆| 精品久久久久久无码国产| 91蜜桃免费观看视频| 国产精品免费av一区二区| 精品国产一区二区精华| 国产后进白嫩翘臀在线观看视频| 91手机在线播放| 欧美日韩hd| 免费观看一区二区三区| 亚洲主播在线观看| 高h放荡受浪受bl| 欧美极品欧美精品欧美视频| 亚洲超碰在线观看| 国产妇女馒头高清泬20p多| 不卡av免费在线观看| 欧美日韩精品区| 亚洲欧美自拍一区| 欧洲成人一区| 一区二区精品免费视频| 黄网站免费久久| www.久久国产| 色哟哟欧美精品| 国产福利小视频在线观看| 国产精品video| 日韩中文字幕高清在线观看| av亚洲天堂网| 一区二区三区免费观看| 熟妇人妻系列aⅴ无码专区友真希 熟妇人妻av无码一区二区三区 | 国产日韩在线精品av| 午夜影院欧美| av在线播放网址| 色婷婷综合视频在线观看| 成人在线高清视频| 亚洲综合第一页| 国产亚洲福利| 很污很黄的网站| 精品国产1区2区3区| 91av亚洲| 国产又黄又爽免费视频| 成人国产精品视频| 日韩综合在线观看| 久久精品视频在线观看| 超碰成人福利| 亚洲欧美国产日韩综合| 一区二区三区四区视频精品免费 | 嫩草影院国产精品| 亚洲精品第一国产综合野| 五月婷婷免费视频| 国产免费成人av| 亚洲少妇在线| 国产三级aaa| 国产视频精品自拍| 一区在线不卡| 欧美日韩第二页| 亚洲精品乱码久久久久久黑人| 亚洲区小说区图片区| 成人中文字幕在线观看| 亚洲在线观看| 综合五月激情网| 亚洲天堂男人天堂| 成午夜精品一区二区三区软件| 国产视频一区二区三区在线播放| 亚洲精品国产无天堂网2021| 国产中文在线| 国产亚洲欧美另类一区二区三区|