精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

微軟論文意外「走光」,OpenAI參數全泄密!GPT-4o僅200B,o1 300B

人工智能 新聞
穿越重重迷霧,OpenAI模型參數終被揭開!一份來自微軟華盛頓大學醫療論文,意外曝光了GPT-4、GPT-4o、o1系列模型參數。讓所有人震驚不已的是,GPT-4o mini僅8B。

誰能想到,微軟在一篇醫學領域的論文里,竟然把OpenAI模型的參數全「曝光」了!

  • GPT-4參數約1.76萬億
  • GPT-4o參數約2000億
  • GPT-4o mini參數約80億
  • o1-preview參數約3000億
  • o1-mini參數約1000億
  • Claude 3.5 Sonnet參數約1750億

圖片

研究人員:參數均為估算值

讓所有人難以置信的是,GPT-4o系列的參數如此少,mini版甚至只有8B。

圖片

有網友猜測,4o mini是一個大約有40B參數的MoE模型,其中激活參數為8B。

因為,他發現4o mini明顯比8B模型學到了更多的知識,同時間運行速度很快。

此外,由于GPT-4o是MoE架構,所以OpenAI可能在mini版本上使用了相同的架構。

圖片

另有網友驚訝地表示,Claude 3.5 Sonnet參數竟等同于GPT-3 davinci。

圖片

這篇來自微軟、華盛頓大學團隊的論文中,發布了一個具有里程碑意義的評估基準——MEDEC1,專為臨床筆記醫療錯誤檢測和糾正而設計。

圖片

論文地址:https://arxiv.org/abs/2412.19260

這項基準涵蓋了五種類型的錯誤,包括診斷、管理、治療、藥物治療和致病因子。

MEDEC的數據來源,收集了來自3家美國醫院系統的488篇臨床筆記,總計3,848篇臨床文本。

值得一提的是,這些數據此前從未被任何LLM接觸過,能夠確保評估真實性可靠性。目前,該數據集已被用于MEDIQA-CORR共享任務,以評估17個參與系統的表現。

圖片

得到數據集MEDEC后,研究團隊對當前最先進的模型,包括o1-preview、GPT-4、Claude 3.5 Sonnet、Gemini 2.0 Flash等,在醫療錯誤檢測和糾正任務中進行了全面測試。

同時,他們也邀請了兩位專業醫生進行相同的錯誤檢測任務,最終將AI與人類醫生結果進行PK。

結果發現,最新LLM在醫療錯誤檢測和糾正方面表現不俗,但與人類醫生相比,AI還是有著明顯的差距。

這也從側面印證了,MEDEC是一個具有充分挑戰性的評估基準。

論文講了什么?

來自美國醫療機構的一項調查研究顯示,每5位閱讀臨床筆記的患者中,就有一位報告發現了錯誤。

其中40%的患者認為這些錯誤是嚴重的,最常見的錯誤類別與當前或過去的診斷相關。

圖片

與此同時,如今越來越多的醫學文檔任務(比如,臨床筆記生成)均是由LLM去完成。

然而,將LLM用于醫學文檔任務的主要挑戰之一,容易產生「幻覺」,輸出一些虛構內容或錯誤信息,直接影響了臨床決策。

畢竟,醫療無小事,一字之差可能關乎生死。

為了降低這些風險,并確保LLM在醫學內容生成中的安全性,嚴格的驗證方法至關重要。這種驗證需要相關的基準來評估是否可以通過驗證模型實現完全自動化。

在驗證過程中,一個關鍵任務是,檢測和糾正臨床文本中的醫學錯誤。

站在人類醫生的角度來考慮,識別和糾正這些錯誤不僅需要醫學專業知識和領域背景,有時還需要具備豐富的經驗。

而此前,大多數關于(常識性)錯誤檢測的研究都集中在通用領域。

為此,微軟華盛頓大學團隊引入了全新數據集——MEDEC,并對不同的領先的LLM(比如,Claude 3.5 Sonnet、o1-preview和Gemini 2.0 Flash)進行了實驗。

作者稱,「據我們所知,這是首個公開可用的臨床筆記中自動錯誤檢測和糾正的基準和研究」。

MEDEC數據集

MEDEC數據集一共包含了3,848篇來自不同醫學專業領域的臨床文本的新數據集,標注任務由8位醫學標注員完成。

如前所述,該數據集涵蓋了五種類型的錯誤,具體包括:

  • 診斷(Diagnosis):提供的診斷不準確
  • 管理(Management):提供的管理下一步措施不準確
  • 藥物治療(Pharmacotherapy):推薦的藥物治療不準確
  • 治療(Treatment):推薦的治療方案不準確
  • 致病因子(Causal Organism):指出的致病生物或致病病原體不準確

(注:這些錯誤類型是在分析醫學委員會考試中最常見的問題類型后選定的。)

上圖1展示了,MEDEC數據集中的示例。每篇臨床文本要么是正確的,要么包含一個通過以下兩種方法之一創建的錯誤:方法#1(MS)和方法#2(UW)。

數據創建方法#1(MS)

在此方法中,作者利用了MedQA集合中的醫學委員會考試題目。

4位具有醫學背景的標注員參考這些考試中的醫學敘述和多項選擇題,在核對原始問題和答案后,將錯誤答案注入場景文本中,并排除包含錯誤或信息模糊的問答對。

醫學標注員遵循以下準則:

  • 使用醫學敘述多項選擇題,將錯誤答案注入場景文本中,并創建兩個版本,分別將錯誤注入文本的中間或末尾。
  • 使用醫學敘述多項選擇題,將正確答案注入場景文本中,以生成正確版本,如圖2所示(包含正確答案的生成文本)。
  • 手動檢查自動生成的文本是否忠實于原始場景及其包含的答案。

最終,研究人員從兩個不同的場景(錯誤注入文本中間或末尾)中,隨機為每篇筆記選擇一個正確版本和一個錯誤版本,構建了最終數據集。

圖片

數據創建方法#2(UW)

這里,作者使用了華盛頓大學(UW)三家醫院系統(Harborview Medical Center、UW Medical Center 和 Seattle Cancer Care Alliance)從2009年-2021年間的真實臨床筆記數據庫。

研究人員從中17,453條診斷支持記錄中,隨機選取了488條,這些記錄總結了患者的病情并提供了治療依據。

4名醫學生組成的團隊手動向其中244條記錄中引入了錯誤。

在初始階段,每條記錄都標注了若干候選實體,這些實體由QuickUMLS 4識別為統一醫學語言系統(UMLS)的概念。

標注員可以從這些候選實體中選擇一個簡潔的醫學實體,或者創建一個新的文本片段(span)。隨后,該片段被標記為五種錯誤類型之一。

接著,標注員用類似但不同的概念替換該片段,錯誤版本由標注員自行設計或通過基于SNOMED和LLM的方法生成。這種方法向標注員建議替代概念,但不依賴輸入文本。醫學標注員手動確定最終注入文本中的概念或錯誤。

在此過程中,每個錯誤片段必須與臨床筆記中的至少兩個其他部分相矛盾,同時標注員需為每個引入的錯誤提供合理的解釋。

作者使用了Philter5工具對注入錯誤后的臨床筆記進行自動去標識化處理。

隨后,每條筆記由2名標注員獨立審查以確保去標識化的準確性。對于任何分歧,由第3名標注員進行裁定。

下表1展示了訓練集、驗證集和測試集的劃分情況。其中,MS訓練集包含2,189篇臨床文本,MS驗證集包含574篇臨床文本,UW驗證集包含160篇臨床文本。

MEDEC測試集由MS集合的597篇臨床文本和UW數據集的328篇臨床文本組成。測試集中,51.3%的筆記包含錯誤,而48.7%的筆記是正確的。

圖片

下圖3展示了數據集中錯誤類型的分布情況(診斷、管理、治療、藥物治療和致病因子)。

圖片

醫療錯誤檢測與糾正方法

為了評估模型在醫療錯誤檢測與糾正任務中的表現,作者將該過程劃分為三個子任務:

  • 子任務 A:預測錯誤標志(0:如果文本沒有錯誤;1:如果文本包含錯誤)
  • 子任務 B:提取包含錯誤的句子,用于已標記錯誤的文本(-1:如果文本沒有錯誤;句子ID:如果文本包含錯誤)
  • 子任務 C:為包含錯誤的標記文本生成修正后的句子(NA:如果文本沒有錯誤;生成的句子/修正內容:如果文本有錯誤)

為了進行比較,他們基于LLM構建了解決方案,使用了兩種不同的提示詞來生成所需的輸出,以評估模型在這三個子任務中的表現:

  • 提示詞#1:

以下是關于一名患者的醫療敘述。你是一名熟練的醫生,正在審閱這些臨床文本。文本要么是正確的,要么包含一個錯誤。文本中每行是一句話。每行以句子ID開頭,后跟一個豎線符號,然后是需要檢查的句子。檢查文本中的每一句話。如果文本正確,則返回以下輸出:CORRECT。如果文本中存在與治療、管理、病因或診斷相關的醫療錯誤,則返回包含錯誤的句子ID,后跟一個空格,然后是修正后的句子。發現并糾正錯誤需要用到醫學知識與推理能力。

  • 提示詞#2:與第一個提示詞類似,但包含一個從訓練集中隨機選取的輸入和輸出示例:

以下是一個示例。

0 一名35歲的女性向她的醫生訴說手部疼痛和僵硬。1 她說,疼痛始于6周前,在她克服了一次輕微的上呼吸道感染幾天后開始。(……) 9 雙手的雙側X線顯示左手第五掌指關節周圍輕微的關節周圍骨質減少。10 給予甲氨蝶呤。

在這個示例中,錯誤出現在句子編號10:「給予甲氨蝶呤」。修正為:「給予潑尼松」。輸出為:10 1 Prednisone is given。示例結束。

實驗與結果

語言模型

研究人員對幾種近期的語言模型進行了實驗:

  1. Phi-3-7B:具有70億參數的小語言模型(SLM)。
  2. Claude 3.5 Sonnet(2024-10-22):Claude 3.5系列的最新模型(≈1750億參數),在多個編碼、視覺和推理任務中展現出了SOTA的性能。
  3. Gemini 2.0 Flash:最新/最先進的Gemini模型。其他谷歌模型(如專為醫療設計的Med-PaLM,5400億參數)尚未公開。
  4. ChatGPT(≈1750億參數)和GPT-4(≈1.76萬億參數),是「高智能」模型。
  5. GPT-4o(≈2000億參數),提供「GPT-4級別的智能但速度更快」,以及專注于特定任務的小模型GPT-4o-mini(gpt-4o-2024-05-13)(≈80億參數)。
  6. 最新的o1-mini(o1-mini-2024-09-12)(≈1000億參數)和o1-preview(o1-preview-2024-09-12)(≈3000億參數),具備「全新AI能力」,可處理復雜推理任務。

值得注意的是,大多數模型的參數量為估算值,主要用來幫助理解模型性能。少數模型(如Phi-3和Claude)需要進行少量自動后處理來修正格式問題。

結果

下表2展示了,由醫療醫生手動標注的結果以及使用上述兩個提示詞的多個最新LLM的結果。

在錯誤標志(error flag)檢測方面,Claude 3.5 Sonnet以70.16%的準確率優于其他方法,在錯誤句子檢測中更是達到了65.62%的準確率。

o1-mini在錯誤標志檢測中,拿下了第二高的準確率69.08%。

在錯誤糾正方面,o1-preview以0.698的綜合評分(Aggregate Score)獲得了最佳表現,遠超第二名GPT-4 [P#2] 的0.639。

圖片

下表3展示了,在每個數據集(MEDEC-MS和MEDEC-UW)上的錯誤檢測準確率和錯誤糾正評分。其中,MS子集對Claude 3.5 Sonnet和醫生#2來說更具挑戰性,而UW子集對o1-preview和醫生#1來說更具挑戰性。

結果表明,與醫生的評分相比,最新的LLM在錯誤檢測和糾正方面表現良好,但在這些任務中仍然不及人類醫生。

這可能是因為,此類錯誤檢測和糾正任務在網絡和醫學教科書中相對罕見,也就是,LLM在預訓練中遇到相關數據的可能性較低。

這一點可以從o1-preview的結果中看出,該模型在基于公開臨床文本構建的MS子集上的錯誤和句子檢測中分別取得了73%和69%的準確率,而在私有的UW集合上僅取得了58%和48%的準確率。

另一個因素是,任務需要分析和糾正現有的非LLM生成的文本,這可能比從0開始起草新答案的難度更高。

圖片

下表4展示的則是,每種錯誤類型(診斷、管理、治療、藥物治療和病因微生物)的錯誤檢測召回率和錯誤糾正評分。

可以看到,o1-preview在錯誤標志和句子檢測中,召回率顯著高于Claude 3.5 Sonnet和兩位醫生。但在結合準確率結果(見表2)之后發現,醫生在準確率上表現更佳。

這些結果表明,模型在精確度方面存在顯著問題,并且與醫生相比,AI在在許多情況下都過度預測了錯誤的存在(即產生了幻覺)。

圖片

另外,結果還顯示,分類性能與錯誤糾正生成性能之間存在排名差異。

例如,在所有模型中,Claude 3.5 Sonnet在錯誤標志和句子檢測的準確率上排名第一,但在糾正生成評分中排名最后(見表 2)。

此外,o1-preview在所有LLM中的錯誤檢測準確率排名第四,但在糾正生成中排名第一且遙遙領先。同樣的模式也可以在兩位醫療醫生之間觀察到。

上述現象,可以通過糾正生成任務的難度來解釋,同時也可能反映了當前SOTA的文本生成評估指標在捕捉醫學文本中的同義詞和相似性方面的局限性。

表5展示了參考文本、醫生標注以及由Claude 3.5 Sonnet和GPT模型自動生成的糾正示例。

例如,第二個示例的參考糾正表明患者被診斷為Bruton無丙種球蛋白血癥,而LLM提供的正確答案提到了X-連鎖無丙種球蛋白血癥(該罕見遺傳疾病的同義詞)。

此外,一些LLM(如Claude)提供了更長的答案/糾正,并附上了更多解釋。類似的現象也出現在醫生的標注中,其中醫生#1提供的修正比醫生#2更長,而兩位醫生在某些示例/案例中存在不同意見,這反映了由不同醫生/專家撰寫的臨床筆記在風格和內容上的差異。

圖片

關于醫療錯誤檢測和糾正的相關研究下一步,還需要在提示詞中引入更多示例并進行示例優化。

作者介紹

Wen-wai Yim

圖片

Wen-wai Yim是微軟的高級應用科學家。

她在UCSD獲得生物工程學士學位,并在華盛頓大學獲得生物醫學與健康信息博士學位,研究方向包括從臨床和放射學筆記中提取臨床事件以及進行癌癥分期預測。

此外,還曾在斯坦福大學擔任博士后研究員,開發用于從自由格式臨床筆記中提取信息的方法,并將這些信息與電子病歷中的元數據相結合。

她的研究興趣包括從臨床筆記和醫學對話中進行臨床自然語言理解,以及從結構化和非結構化數據生成臨床筆記語言。

Yujuan Fu

圖片

Yujuan Fu是華盛頓大學醫學信息專業的博士生。

此前,她在上海交通大學獲得電子與計算機工程學士學位,在密歇根大學獲得數據科學學士學位。

研究領域是面向健康領域的自然語言處理:通過指令微調大語言模型,包括信息抽取、摘要、常識推理、機器翻譯以及事實一致性評估。

Zhaoyi Sun

圖片

Zhaoyi Sun是華盛頓大學生物醫學與健康信息學專業的博士生,隸屬于UW-BioNLP團隊,由Meliha Yetisgen博士指導。

此前,他在南京大學獲得化學學士學位,并在康奈爾大學獲得健康信息學碩士學位。

他的研究重點是將LLM應用于醫療問答和臨床筆記中的錯誤檢測,興趣是結合生物醫學圖像與文本的多模態深度學習研究,目標是提升自然語言處理技術在臨床領域中的應用效率和效果。

Fei Xia

圖片

Fei Xia是華盛頓大學語言學系的教授,也是華盛頓大學/微軟研討會的聯合組織者。此前,曾在IBM T. J. Watson研究中心擔任研究員。

她在北京大學計算機科學系獲得學士學位,并在賓夕法尼亞大學計算與信息科學系獲得碩士和博士學位。

在賓大期間,她是中文樹庫項目的團隊負責人,也是XTAG項目的團隊成員。博士論文導師是Martha Palmer博士和Aravind Joshi博士。

責任編輯:張燕妮 來源: 新智元
相關推薦

2025-01-02 11:00:34

2024-10-17 13:30:00

2024-09-29 13:07:16

2025-05-27 15:19:52

GPUMetaGPT-4o

2025-04-11 09:10:00

模型開源AI

2024-10-17 14:05:34

2025-04-23 15:25:27

語言模型Eagle 2.5英偉達

2025-01-21 10:10:56

2025-08-07 14:05:40

OpenAI大模型開源

2025-04-16 09:15:00

AI模型數據

2024-09-24 11:01:03

2024-06-05 08:29:35

2025-03-31 08:50:00

AI生成模型

2024-08-14 14:30:00

AI訓練

2024-05-14 11:29:15

2024-11-07 15:40:00

2024-05-15 17:34:15

2024-08-08 14:27:29

2025-01-16 16:39:44

2024-05-21 12:23:17

點贊
收藏

51CTO技術棧公眾號

三级中文字幕在线观看| www.色视频| 欧美亚洲国产精品久久| 在线看不卡av| 亚洲自拍三区| 亚洲精品久久久狠狠狠爱| 亚洲看片免费| 中文字幕亚洲欧美在线| 佐山爱在线视频| 国产va在线视频| 国产亚洲精品bt天堂精选| 国产精品一区二区久久久| 激情综合网五月天| 九九综合久久| 日韩午夜精品电影| 黄www在线观看| 久久亚洲天堂| 97精品国产露脸对白| 国产精品亚洲欧美导航| 国产精品500部| 国产精品videosex性欧美| 精品国产乱码91久久久久久网站| 成人在线激情网| 污视频网站免费在线观看| 久久女同精品一区二区| 亚洲一区亚洲二区亚洲三区| 韩国av中文字幕| 一区二区三区在线观看免费| 亚洲欧洲第一视频| 超级砰砰砰97免费观看最新一期| 韩国美女久久| 亚洲一区二区精品久久av| 日韩中文一区| 偷拍自拍在线视频| 国产精品亚洲第一| 国产精品亚洲第一区| 天堂网一区二区三区| 天天综合久久| 亚洲夜晚福利在线观看| 精品视频站长推荐| 日韩高清一区| 欧美日本乱大交xxxxx| 男人日女人下面视频| 牛牛精品视频在线| 亚洲欧美一区二区久久| 日韩一本精品| 精品av中文字幕在线毛片| 成人av免费在线观看| 亚洲一区二区三区sesese| 国产偷人爽久久久久久老妇app| 精品动漫一区| 欧美日韩成人网| xxxx日本少妇| 亚洲破处大片| 久久精彩免费视频| 久久久久人妻一区精品色| 国产欧美日韩精品高清二区综合区| 亚洲成人网在线观看| 精品无码av一区二区三区不卡| 伊人久久大香伊蕉在人线观看热v| 欧美影院精品一区| 亚洲色图 在线视频| 国产精品亚洲d| 色菇凉天天综合网| 久久久久久久片| 蜜桃精品在线| 欧美三电影在线| av网站在线不卡| 欧美韩国日本| 91精品国产综合久久福利软件| 日韩av加勒比| 国产一区 二区| 欧美一二三四区在线| 免费黄频在线观看| 日本一区二区三区播放| 日韩亚洲欧美高清| 大乳护士喂奶hd| 日韩大胆成人| 亚洲人成网站免费播放| 国产免费无遮挡吸奶头视频| 国产亚洲一卡2卡3卡4卡新区 | 免费在线观看的av网站| 亚洲精品福利电影| 欧亚一区二区三区| 天天看片天天操| 天堂久久av| 日韩成人在线视频网站| 日本一级免费视频| 91精品国产视频| 久久免费视频在线观看| 国产精品久久久久久人| 麻豆精品新av中文字幕| 97超碰人人看人人| 色鬼7777久久| 国产精品久久午夜夜伦鲁鲁| 日本a在线天堂| 波多野结衣久久精品| 欧美视频一区二区三区四区| 亚洲欧洲日韩综合| 精品在线99| 欧美精品在线免费播放| 国语对白永久免费| 国产乱码精品一品二品| 欧美不卡在线一区二区三区| 久久bbxx| 色婷婷激情一区二区三区| 国产传媒免费观看| 日韩伦理一区二区三区| 色偷偷噜噜噜亚洲男人的天堂| 国产无套在线观看| 久久99日本精品| 精品欧美国产一区二区三区不卡| 五月香视频在线观看| 亚洲自拍偷拍网站| 国模私拍视频在线观看| 久久午夜影院| 欧美成人精品一区| 中国老头性行为xxxx| 成人精品一区二区三区中文字幕| 亚洲国产欧美一区二区三区不卡| 国内老司机av在线| 制服丝袜亚洲色图| 丰腴饱满的极品熟妇| 亚洲国产影院| 91福利入口| 男人天堂久久久| 色拍拍在线精品视频8848| 日本wwwxx| 欧美第十八页| 国产精品∨欧美精品v日韩精品| 亚洲国产精品suv| 中文字幕视频一区二区三区久| 日韩精品一区二区三区久久| 好吊妞国产欧美日韩免费观看网站 | 欧美日韩一区二区三区不卡视频| 日韩在线资源网| 中文字幕免费高清网站| 97精品国产露脸对白| 日本精品久久久久久久久久| 日本综合精品一区| 久久久久999| 国产一区二区三区中文字幕| 国产人久久人人人人爽| 久久精品视频91| 亚洲涩涩av| 欧美一区二区大胆人体摄影专业网站| 黑人乱码一区二区三区av| 亚洲精品videosex极品| 国产一级片中文字幕| 国产精品久久观看| 成人乱色短篇合集| gogo在线高清视频| 91精品国产综合久久久久久久久久 | 福利一区二区三区视频在线观看| 亚洲美女av网站| 五月天婷婷久久| 久久久三级国产网站| 四虎永久在线精品无码视频| 蜜臀av免费一区二区三区| 国产成人精品电影| 国产69久久| 欧美欧美欧美欧美| 久草综合在线视频| 风流少妇一区二区| 亚洲美免无码中文字幕在线| 伊人久久综合影院| 国产精品成人国产乱一区 | 久久精品在线免费观看| 日本三区在线观看| 久久中文视频| 99国产盗摄| 免费h在线看| 国产亚洲欧洲在线| aa视频在线免费观看| 亚洲成va人在线观看| av在线网站观看| 蜜桃久久久久久| 日本香蕉视频在线观看| 亚洲丝袜啪啪| 国产在线视频一区| 欧美xxx黑人xxx水蜜桃| 日韩精品亚洲精品| 影音先锋国产资源| 亚洲永久免费视频| 能免费看av的网站| 久久99精品国产.久久久久| 久久综合亚洲精品| 日本中文字幕在线一区| 国产精品丝袜一区二区三区| 欧美精品videos另类| 精品国产伦一区二区三区观看体验 | 天天影视天天精品| 久久久神马电影| 欧美视频第一| 91av在线网站| 国产91在线视频蝌蚪| 亚洲精品国产品国语在线| 一区二区三区亚洲视频| 欧美色女视频| 国产精品第三页| 亚洲性图自拍| 亚洲午夜久久久影院| 国内毛片毛片毛片毛片| 色香蕉成人二区免费| 欧美成人精品欧美一级私黄| 久久―日本道色综合久久| 免费观看黄网站| 久久亚洲欧洲| 日韩精品在线视频免费观看| 成人免费看片39| 久久亚裔精品欧美| 日韩一区网站| 国产精品最新在线观看| 悠悠资源网亚洲青| 欧美黑人一级爽快片淫片高清| 午夜激情视频在线| 国产午夜一区二区| 天堂中文在线看| 日韩免费观看高清完整版在线观看| 日本a级c片免费看三区| 午夜av区久久| 久久久精品91| 亚洲天堂精品在线观看| 欧美成人另类视频| 久久影院电视剧免费观看| 国产伦精品一区二区三区88av| 精品一区二区在线看| 精品久久久噜噜噜噜久久图片| 亚洲每日在线| 国产一二三区在线播放| 亚洲女同中文字幕| 一区二区三区四区在线视频 | 奇米视频888战线精品播放| 黄色免费大全亚洲| 成人在线视频电影| 欧美三级一区| 国产日韩在线看| 97欧美成人| 国产精品免费观看在线| 国产成人免费9x9x人网站视频| 91超碰caoporn97人人| 成人影院在线视频| 97国产suv精品一区二区62| 国内老司机av在线| 久久久久久久久国产精品| 最爽无遮挡行房视频在线| 九色精品美女在线| 91精品久久久| 久久99精品视频一区97| 国产网红女主播精品视频| 欧美激情一区二区三级高清视频| 99在线播放| 欧美国产一区二区三区| 国产精品69xx| 97免费在线视频| 青青青免费在线视频| 欧美中在线观看| 久久天堂av| 国产在线观看91精品一区| 香蕉久久一区| 亚洲伊人第一页| 高清一区二区三区| 久久精品国产理论片免费| 久久爱www成人| 五月天久久狠狠| 欧美mv日韩| 97超碰国产精品| 国产精品美女久久久浪潮软件| 久久精品99国产| 丝袜诱惑亚洲看片| 制服丝袜中文字幕第一页 | 青青草视频成人| 欧美国产精品专区| 黄色一级大片在线免费观看| 亚洲精品高清在线| 久久久国产高清| 欧美视频日韩视频| 99精品久久久久久中文字幕 | 成人深夜直播免费观看| 欧美电影院免费观看| 国产精品午夜av在线| 亚洲欧美成人vr| 一区二区免费电影| 一区视频在线| 欧美激情精品久久久久久小说| 精品一区二区免费看| 国产综合内射日韩久| 91免费国产在线| 免费黄色激情视频| 午夜精品爽啪视频| 中文字幕一区二区免费| 欧美不卡123| 国产黄色片在线观看| 欧美成人午夜剧场免费观看| 欧美13videosex性极品| 91精品久久久久久久久久久久久| 超碰地址久久| 色一情一乱一伦一区二区三欧美| 欧美精品自拍| 久久久精品麻豆| 成人久久18免费网站麻豆| 老司机福利在线观看| 亚洲成人精品影院| 国产一区二区三区四区视频| 亚洲精品一区av在线播放| √天堂8在线网| 国产噜噜噜噜噜久久久久久久久| 国产图片一区| 成人性做爰片免费视频| 三级不卡在线观看| 永久免费未满蜜桃| 日韩一区日韩二区| 男人天堂视频在线| 亚洲国产精品大全| 中文字幕在线观看网站| 日韩暖暖在线视频| 欧美日韩一区二区三区四区不卡 | 51妺嘿嘿午夜福利| 亚洲国产aⅴ天堂久久| 91片黄在线观看喷潮| 亚洲欧洲激情在线| 超级白嫩亚洲国产第一| 亚洲最大的av网站| 日韩系列欧美系列| 熟女少妇精品一区二区| 99精品欧美一区| 久久久99精品| 欧美本精品男人aⅴ天堂| 人人干在线视频| 日本韩国在线不卡| 偷拍一区二区| 亚洲中文字幕无码专区| 高清不卡一二三区| 久久久久久久久久久久久久久久久 | 欧美成人精品一区二区| 欧美一级免费| 亚洲欧美日产图| 蜜臀va亚洲va欧美va天堂| 国产高潮呻吟久久| 日韩欧美一区二区在线| 亚洲色偷精品一区二区三区| 国模视频一区二区三区| 99精品在免费线中文字幕网站一区| 一级黄色免费在线观看| 久久99九九99精品| 少妇视频一区二区| 欧美日韩国产一二三| 1024视频在线| 国产免费观看久久黄| 日韩欧美高清| gogogo高清免费观看在线视频| 国产精品美女久久久久久久网站| 日韩免费av网站| 亚洲欧美中文日韩在线| 日韩不卡免费高清视频| 神马影院我不卡| 青青草精品视频| 亚洲女人久久久| 91精品久久久久久久91蜜桃| av在线网址观看| 99精品99久久久久久宅男| 激情文学一区| 国产精品揄拍100视频| 在线视频国内自拍亚洲视频| 成人欧美亚洲| 亚洲一区二区三区777| 亚洲午夜91| 成人免费av片| 欧美日韩一区精品| av网站在线免费| 精品国产一区二区三区四区vr| 亚洲一区二区三区四区五区午夜| 一级片手机在线观看| 欧美视频中文一区二区三区在线观看 | 一级片中文字幕| 亚洲最新中文字幕| 美女精品视频在线| 成人免费aaa| 国产精品理伦片| 亚洲欧美激情在线观看| 欧美亚洲另类在线| 我不卡影院28| 无码一区二区精品| 欧美日韩视频一区二区| 美足av综合网| 五月天丁香综合久久国产 | 中文字幕免费视频| 欧美福利视频一区| 国产美女精品写真福利视频| 夜夜爽www精品| 成人教育av在线| 中文无码精品一区二区三区| 欧美激情区在线播放| 欧美精品一区二区久久| 台湾佬美性中文| 欧美影视一区二区三区| 99在线视频影院| 国产精品无码乱伦| 91农村精品一区二区在线| 国产绿帽刺激高潮对白|