精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

GPT-5超越人類(lèi)醫(yī)生!推理能力比專(zhuān)家高出24%,理解力強(qiáng)29%

人工智能
MedXpertQA測(cè)試是一個(gè)用于評(píng)估模型專(zhuān)家級(jí)醫(yī)學(xué)知識(shí)與高級(jí)推理能力的綜合基準(zhǔn),有文本測(cè)試和多模態(tài)測(cè)試,共涵蓋4460道題目,涉及17個(gè)醫(yī)學(xué)專(zhuān)科和11個(gè)身體系統(tǒng),其數(shù)據(jù)源自超20個(gè)美國(guó)醫(yī)師執(zhí)照考試、歐洲放射學(xué)委員會(huì)考試等權(quán)威內(nèi)容。

GPT-5比人類(lèi)醫(yī)生還會(huì)看X光片?!

最新研究顯示,GPT-5對(duì)醫(yī)學(xué)影像的推理和理解準(zhǔn)確率分別比人類(lèi)專(zhuān)家高出24.23%和29.40%。

圖片圖片

來(lái)自埃默里大學(xué)醫(yī)學(xué)院的研究團(tuán)隊(duì)把GPT-5和GPT-4o以及更小的GPT-5變體(GPT-5-mini、GPT-5-nano)進(jìn)行了比較,分析它們?cè)卺t(yī)療領(lǐng)域處理多模態(tài)信息的能力。

圖片圖片

通過(guò)一系列標(biāo)準(zhǔn)化測(cè)試發(fā)現(xiàn)GPT-5在所有測(cè)試中的表現(xiàn)都比其他模型好,尤其是在MedXpertQA的多模態(tài)測(cè)試中,它的推理和理解得分比GPT-4o分別提高了近30%36%,甚至比人類(lèi)醫(yī)生還高。

圖片圖片

AI看病歷常見(jiàn),可是比人類(lèi)醫(yī)生還會(huì)看就不常見(jiàn)了,所以GPT-5是怎么做到的?

AI在多模態(tài)醫(yī)學(xué)領(lǐng)域超越人類(lèi)新手醫(yī)生

研究人員對(duì)GPT-5、GPT-4o以及GPT-5的mini和nano版本進(jìn)行了系統(tǒng)測(cè)試。

測(cè)試分為三類(lèi):純文本的USMLE考試、多模態(tài)的MedXpertQA測(cè)試還有放射科的VQA-RAD,都是零樣本設(shè)置,不依賴(lài)數(shù)據(jù)微調(diào)。

USMLE是美國(guó)醫(yī)師執(zhí)照考試,有標(biāo)準(zhǔn)化的命題和嚴(yán)格的評(píng)分體系,是全球醫(yī)學(xué)教育和人才評(píng)估的重要參考基準(zhǔn)。

該考試分為三個(gè)步驟:Step1主要考察基礎(chǔ)醫(yī)學(xué)知識(shí),Step2聚焦臨床應(yīng)用知識(shí),Step3側(cè)重實(shí)踐。

在此次研究中,GPT-5在USMLE考試中全面超越GPT-4o,且平均得分領(lǐng)先于其他模型。

圖片圖片

MedXpertQA測(cè)試是一個(gè)用于評(píng)估模型專(zhuān)家級(jí)醫(yī)學(xué)知識(shí)與高級(jí)推理能力的綜合基準(zhǔn),有文本測(cè)試和多模態(tài)測(cè)試,共涵蓋4460道題目,涉及17個(gè)醫(yī)學(xué)專(zhuān)科和11個(gè)身體系統(tǒng),其數(shù)據(jù)源自超20個(gè)美國(guó)醫(yī)師執(zhí)照考試、歐洲放射學(xué)委員會(huì)考試等權(quán)威內(nèi)容。

其中多模態(tài)的MedXpertQA測(cè)試?yán)盟腗M子集展開(kāi),MM子集引入了帶有多樣化圖像及豐富臨床信息(病歷、檢查結(jié)果等)的專(zhuān)家級(jí)考試題。

為增加難度,多模態(tài)子集的題目還擴(kuò)充至5個(gè)選項(xiàng),能更有效地評(píng)估模型在貼近真實(shí)場(chǎng)景下的醫(yī)學(xué)診斷推理能力。

依據(jù)之前的數(shù)據(jù),GPT-5推理和理解得分比GPT-4o分別提高了近30%36%。

圖片圖片

下圖詳細(xì)對(duì)比了未取得執(zhí)照的人類(lèi)專(zhuān)家與GPT-5系列模型及GPT-4o在MedXpertQA測(cè)試的文本子集(Text)和多模態(tài)子集(MM)中的表現(xiàn),涵蓋推理、理解及平均三個(gè)維度。

圖片圖片

在文本測(cè)試中,GPT-4o三項(xiàng)得分均低于人類(lèi)專(zhuān)家,GPT-5-nano同樣全面落后,GPT-5-mini 推理和平均得分略超人類(lèi)專(zhuān)家,而GPT-5表現(xiàn)最優(yōu),得分大幅領(lǐng)先。

在多模態(tài)測(cè)試中,GPT-4o推理和平均得分略低,GPT-5-nano整體與人類(lèi)專(zhuān)家持平,GPT-5-mini大幅超越人類(lèi)專(zhuān)家,GPT-5優(yōu)勢(shì)最為顯著,推理超人類(lèi)專(zhuān)家24%、理解得超人類(lèi)專(zhuān)家29%,展現(xiàn)出強(qiáng)大的多模態(tài)醫(yī)學(xué)推理能力。

VQA-RAD測(cè)試是醫(yī)學(xué)視覺(jué)問(wèn)答測(cè)試,該數(shù)據(jù)集包含315張放射影像以及與之對(duì)應(yīng)的3515個(gè)問(wèn)答對(duì)。常用于評(píng)估醫(yī)學(xué)多模態(tài)大語(yǔ)言模型解讀復(fù)雜醫(yī)學(xué)圖像并生成準(zhǔn)確文本描述的能力。

在此次研究中,GPT-5的匹配率為70.92%,高于GPT-4o及小變體GPT-5-nano,而其輕量化變體GPT-5-mini的表現(xiàn)略?xún)?yōu),嚴(yán)格匹配率達(dá)到74.90%。

圖片圖片

考慮到VQA-RAD規(guī)模相對(duì)較小且具有放射科專(zhuān)項(xiàng)屬性,這種得分差異可能源于較小模型存在數(shù)據(jù)集特定的過(guò)擬合現(xiàn)象。

看了這么多測(cè)試結(jié)果,那么GPT-5為什么能全面碾壓前輩GPT-4o呢?

GPT-5構(gòu)建了端到端的多模態(tài)架構(gòu)

團(tuán)隊(duì)認(rèn)為,GPT-5能力提升核心源于其跨模態(tài)注意力與對(duì)齊能力的增強(qiáng)。

GPT-5與GPT-4o的核心差距,本質(zhì)上是從文本主導(dǎo)的混合處理原生多模態(tài)深度融合的代際跨越。

GPT-4o在處理跨模態(tài)任務(wù)時(shí),仍依賴(lài)文本轉(zhuǎn)譯+外部工具調(diào)用的間接模式:例如解析醫(yī)學(xué)影像時(shí),需先通過(guò)第三方模型將圖像信息轉(zhuǎn)化為文本描述,再基于文本進(jìn)行推理。

這種模態(tài)轉(zhuǎn)換中介不僅增加了信息損耗(如圖像中的細(xì)微病變可能在轉(zhuǎn)譯中被忽略),還導(dǎo)致推理鏈條斷裂——模型難以直接建立影像特征-病理機(jī)制-治療方案的因果關(guān)聯(lián)。

GPT-5構(gòu)建了端到端的多模態(tài)架構(gòu):通過(guò)共享標(biāo)記化技術(shù),將文本、影像、音頻等信息編碼為統(tǒng)一向量空間的符號(hào),再借助跨模態(tài)注意力機(jī)制實(shí)現(xiàn)感知-推理-決策的無(wú)縫銜接。

并且,團(tuán)隊(duì)認(rèn)為在MedXpertQA Text、USMLE Step 2這樣的推理密集型任務(wù)中,GPT-5的進(jìn)步更突出是因?yàn)?/span>思維鏈提示與GPT-5增強(qiáng)的內(nèi)部推理能力形成了協(xié)同效應(yīng),使其能更準(zhǔn)確地完成多步推理。

不過(guò)研究人員也指出,盡管GPT-5在標(biāo)準(zhǔn)測(cè)試中表現(xiàn)優(yōu)秀,但要說(shuō)明的是,這些測(cè)試都是在理想環(huán)境下進(jìn)行的,題目和數(shù)據(jù)都是標(biāo)準(zhǔn)化的,現(xiàn)實(shí)中患者的情況千奇百怪,還可能遇到各種突發(fā)狀況。

所以,GPT-5要真走進(jìn)診室當(dāng)助理,還得經(jīng)過(guò)更多實(shí)戰(zhàn)考驗(yàn)。

這不,KCDH_A數(shù)字健康研究中心對(duì)AI進(jìn)行了放射科的終極考試,這是一項(xiàng)AI從未見(jiàn)過(guò)的、跨模態(tài)的檢測(cè)任務(wù),涵蓋了CT、MRI和X光,模擬日常實(shí)踐中實(shí)際遇到的復(fù)雜真實(shí)病例。

測(cè)試結(jié)果顯示,所有AI模型得分均低于實(shí)習(xí)醫(yī)生,而擁有執(zhí)業(yè)資格的放射科醫(yī)生比AI領(lǐng)先更多,雖然GPT-5剛剛進(jìn)入頂尖AI的位置,但也遠(yuǎn)低于人類(lèi)。

圖片圖片

該實(shí)驗(yàn)室的研究人員表示:

雖然我對(duì)AI發(fā)展感到興奮,我們實(shí)驗(yàn)室也在每天使用AI模型,但AI取代放射科醫(yī)生與現(xiàn)實(shí)的差距仍然很大。

由此可見(jiàn),AI獨(dú)自看病歷之前,還是得先磨練磨練。

論文地址:https://arxiv.org/abs/2508.08224

參考鏈接:

[1]https://x.com/omarsar0/status/1955252499142627788

[2]https://x.com/emollick/status/1955381296743715241

[3]https://x.com/DrDatta_AIIMS/status/1954586822849523789

責(zé)任編輯:武曉燕 來(lái)源: 量子位
相關(guān)推薦

2025-08-07 16:21:27

GPT-5AI模型

2025-11-10 08:57:00

AI模型測(cè)試

2025-09-19 14:53:34

2024-07-05 13:38:03

2025-08-08 06:39:22

2025-08-07 13:57:38

GPT-5AI模型

2025-08-12 09:18:00

2025-09-25 09:09:22

2025-06-19 09:06:00

2024-08-28 13:00:42

2023-11-16 15:57:00

數(shù)據(jù)訓(xùn)練

2024-03-05 09:16:32

AI模型GPT-4

2024-01-09 12:53:16

模型訓(xùn)練

2024-01-22 06:40:00

模型視覺(jué)

2023-03-28 08:23:38

2024-01-22 13:57:00

模型訓(xùn)練

2025-08-18 17:14:41

GPT-5OpenAIAGI

2025-08-14 09:31:24

GPT-5AI

2024-01-02 09:26:05

AI預(yù)測(cè)

2025-09-01 08:59:00

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

亚洲精品免费网站| 欧美高清视频不卡网| 国模精品一区二区三区| 二区视频在线观看| 欧美日韩一二三四| 欧美欧美欧美欧美| 国产不卡一区二区视频| 超碰免费在线| 国产精品1024久久| 欧美影院在线播放| 97在线观看免费高| 久久综合五月婷婷| 欧美美女一区二区在线观看| 国产曰肥老太婆无遮挡| yw视频在线观看| 成人免费观看男女羞羞视频| 国产精品999999| 国产一级aa大片毛片| 欧美日韩国产传媒| 亚洲精品一区二区三区福利| 日韩av在线中文| 在线黄色的网站| 一区二区三区在线免费播放| 欧美日韩在线一二三| 亚洲成a人片在线| 免费人成在线不卡| 97超级碰碰人国产在线观看| 日韩欧美国产成人精品免费| 中文字幕亚洲影视| 日韩免费电影网站| 在线观看亚洲色图| 欧美电影网址| 亚洲一区二区三区小说| 一区二区三区四区国产| 男人的天堂av高清在线| 国产成人综合网站| 成人精品在线视频| 久久精品国产亚洲av麻豆蜜芽| 韩国在线一区| 久久精品精品电影网| 国产成人精品无码免费看夜聊软件| 91成人精品在线| 欧美日韩国产首页| 不卡影院一区二区| а√在线中文在线新版| 伊人色综合久久天天人手人婷| 亚洲精品自在在线观看| 欧美成人综合在线| 国产69精品久久久久毛片| 成人免费看黄网站| 国产麻豆免费观看| 国模少妇一区二区三区| 国产精品丝袜视频| 欧美啪啪小视频| 国产农村妇女精品一区二区| 久久久免费精品| 国产一级在线免费观看| 欧美黄色一区二区| 欧美日韩国产123| 免费中文字幕在线观看| 亚洲精品一二三区区别| 久久精品91久久久久久再现| 美女三级黄色片| 99久久婷婷| 久久亚洲国产精品成人av秋霞| 日本少妇aaa| 亚洲天堂免费| 欧美多人爱爱视频网站| 国产精品23p| 亚洲美女一区| 人人做人人澡人人爽欧美| 免费av中文字幕| 免费国产亚洲视频| 91欧美精品成人综合在线观看| 91麻豆视频在线观看| 国产一区二区免费视频| 99re在线观看| 午夜在线视频观看| 中文字幕乱码日本亚洲一区二区| 亚洲一区二区四区| 在线中文字幕第一页| 午夜精品福利一区二区蜜股av| 黄色动漫在线免费看| av有声小说一区二区三区| 欧美日韩视频在线第一区| 日韩成人精品视频在线观看| 久久婷婷亚洲| 国产成人97精品免费看片| 欧美超碰在线观看| 久久99久久久欧美国产| 亚洲a中文字幕| 黄色小视频免费观看| 91一区二区三区在线观看| 欧美三级电影在线播放| 色网站在线看| 亚洲国产aⅴ天堂久久| 欧美激情国产精品日韩| 少妇高潮一区二区三区99| 日韩欧美专区在线| 国产免费看av| 欧美国产精品| 国产国语刺激对白av不卡| 国产精品久久久久久69| proumb性欧美在线观看| 亚洲欧美日韩精品综合在线观看| 女同视频在线观看| 在线免费不卡电影| 韩国三级在线看| 精品精品99| 欧美激情免费看| 亚洲天堂avav| 99免费精品视频| av不卡在线免费观看| 亚洲一级少妇| 日韩三级免费观看| 亚洲精品成人av久久| 99精品热6080yy久久| 成人免费直播live| 欧美孕妇性xxxⅹ精品hd| 亚洲精选一二三| 国产野外作爱视频播放| 卡通动漫精品一区二区三区| 久久精品电影网站| 亚洲精品国产精品国自产网站按摩| 在线观看亚洲a| 亚洲一区二区三区在线观看视频 | 蜜桃精品在线观看| 国产精品一区二区不卡视频| 在线视频91p| 欧美性色视频在线| 91精品国产高清91久久久久久| 中文字幕激情视频| 97成人超碰| 亚洲第一福利网站| 免费一级全黄少妇性色生活片| 久久国产三级精品| 四虎影视永久免费在线观看一区二区三区| 免费在线看电影| 日韩欧美国产小视频| 亚洲精品一区二区三区在线播放| 玖玖玖国产精品| 精品999在线观看| 九色porny视频在线观看| 欧美不卡一区二区三区四区| 国产va在线播放| 国产精品影视网| 久久久久亚洲av无码专区喷水| 日韩欧美激情| 日韩小视频在线观看| 亚洲一卡二卡在线观看| 国产精品免费视频网站| 9久久婷婷国产综合精品性色| 九一精品国产| 国产成人一区二区三区电影| 国产玉足榨精视频在线观看| 色婷婷激情久久| 日韩免费成人av| 蜜臀av性久久久久蜜臀aⅴ四虎 | 免费av网站在线播放| 亚洲中国最大av网站| 日韩女优在线视频| 五月综合激情| 国产日韩欧美在线| 黄在线免费观看| 日韩网站在线看片你懂的| 欧美成人综合色| 成人污污视频在线观看| 久久久999精品视频| 青草网在线观看| 自拍偷拍亚洲| 欧美福利视频网站| 欧美女优在线观看| 欧美日韩在线播放一区| 在线观看黄网址| 国产成人综合在线播放| 人妻精品无码一区二区三区| 国产亚洲一区二区三区不卡| 国产男人精品视频| 在线观看操人| 国产视频丨精品|在线观看| 亚洲中文字幕无码爆乳av| 国产精品伦一区| 亚洲精品鲁一鲁一区二区三区 | 久久人人爽人人爽人人片av不| 97成人精品区在线播放| 国产乱理伦片a级在线观看| 欧美日韩精品一区二区天天拍小说| 亚洲不卡在线播放| 99久久久免费精品国产一区二区 | aaaaaav| 午夜在线a亚洲v天堂网2018| 欧美一区二区三区四区五区六区 | 成人国产在线| 久久亚洲影音av资源网| 午夜精品在线播放| 色婷婷av久久久久久久| 国产suv精品一区二区68| 99久久久久久| 欧美一区三区三区高中清蜜桃| 日韩av资源站| 欧美性受极品xxxx喷水| 欧美精品一区二区成人| 91视视频在线直接观看在线看网页在线看| 黑鬼大战白妞高潮喷白浆| 久久久久久久久99精品大| 精品欧美一区二区久久久伦| 国产一区二区视频在线免费观看| aaaaaav| 美女脱光内衣内裤视频久久影院| 毛片在线免费播放| 国产精品嫩草99a| 精品国产乱码久久久久夜深人妻| 丝袜美腿亚洲一区二区图片| 日韩人妻一区二区三区蜜桃视频| 免费av一区| 99中文视频在线| www.一区| 2020久久国产精品| 1stkiss在线漫画| 亚洲香蕉成视频在线观看| 亚洲成熟女性毛茸茸| 欧美日韩一区二区三区不卡| 97久久久久久久| 亚洲一区中文日韩| 性欧美videos| 国产精品免费视频一区| www.久久av| bt欧美亚洲午夜电影天堂| 制服.丝袜.亚洲.中文.综合懂| 蜜桃视频第一区免费观看| 日本黄网站免费| 亚洲综合三区| 久久国产亚洲精品无码| 亚洲天堂成人| 日韩精品一区二区免费| 91精品动漫在线观看| 亚洲自拍三区| 亚洲国产精品久久久久秋霞不卡| 战狼4完整免费观看在线播放版| 99免费精品在线观看| 黑人无套内谢中国美女| 六月丁香综合在线视频| 午夜国产一区二区三区| 日韩激情视频在线观看| 日韩免费毛片视频| 久久精品一区二区国产| 欧洲av无码放荡人妇网站| 国产毛片久久| 国产91在线视频观看| 日韩视频免费| 黄www在线观看| 久久久夜夜夜| 婷婷丁香激情网| 奇米精品一区二区三区四区| youjizzxxxx18| 美女一区二区视频| 五月花丁香婷婷| 国产精品996| 高清中文字幕mv的电影| www.日韩精品| 丰满少妇一区二区| 中文字幕精品三区| 性生交大片免费全黄| 亚洲色图另类专区| 久艹视频在线观看| 精品女厕一区二区三区| 精品国产乱码一区二区| 欧洲精品中文字幕| 亚洲一区二区人妻| 日韩一区二区在线观看视频| 免费观看黄色av| 亚洲精品中文字幕女同| 第一福利在线| 久久精品国产69国产精品亚洲| 日本高清在线观看视频| 91国偷自产一区二区三区的观看方式 | 视频精品一区二区| 国产成人黄色网址| 国产一区二区三区四| 亚洲av成人片无码| 久久精品亚洲精品国产欧美kt∨ | 天天射天天色天天干| 亚洲欧美日本精品| 青青影院在线观看| 久久久久国产精品www| 久久人体大尺度| 亚洲一区制服诱惑| 亚洲69av| 一本一本久久a久久精品综合妖精| 欧美激情1区2区3区| 人妻少妇精品无码专区二区| 国产农村妇女毛片精品久久莱园子| 亚洲精品自拍网| 成人小视频免费观看| 国产一区二区三区四区在线| 一区二区三区在线观看国产| 中文字幕一区在线播放| 欧美一级在线视频| 欧美日韩免费做爰大片| 久久深夜福利免费观看| 筱崎爱全乳无删减在线观看| 国产在线视频欧美| 欧美一级色片| 天天干天天色天天爽| 免费永久网站黄欧美| 真实乱偷全部视频| 国产日韩在线不卡| 日韩精品一卡二卡| 3atv在线一区二区三区| 久久经典视频| 性色av一区二区三区在线观看| 国产精品无码久久久久| 精品在线视频一区二区| 影视一区二区| xxxx一级片| 国产亚洲一区二区三区| 久久久久久国产精品免费播放| 欧美日韩精品一区二区天天拍小说| 日本黄色不卡视频| 久久中文字幕视频| 青娱乐国产精品视频| 福利电影一区二区| 91精品少妇一区二区三区蜜桃臀| 五月婷婷综合网| 国产富婆一级全黄大片| 精品国产一区二区三区久久久狼| 都市激情综合| 久久国产精品亚洲va麻豆| 欧美日本亚洲韩国国产| 国产精品午夜电影| 国产精品16p| 日韩欧美成人一区二区| 国产一二区在线观看| 国产精品视频久久久久| 国产欧美一区| 97在线免费公开视频| 91麻豆精东视频| 国产精品午夜影院| 日韩av在线高清| 波多野一区二区| 久久精彩视频| 国产精品久久777777毛茸茸| 黄色污在线观看| 午夜激情久久久| 日本成人动漫在线观看| 97超级碰碰碰| 亚欧洲精品视频在线观看| 男人的天堂99| 久久精品人人爽人人爽| 波多野结衣视频观看| 国产一区二区日韩| 欧美艳星kaydenkross| 日韩精品一线二线三线| 免费一级片91| 小向美奈子av| 欧美一区二区私人影院日本| 97超碰在线公开在线看免费| 不卡视频一区二区三区| 海角社区69精品视频| xxxx黄色片| 欧美在线三级电影| 老司机午夜在线| 99久久自偷自偷国产精品不卡| 欧美午夜一区二区福利视频| 美女搡bbb又爽又猛又黄www| 福利精品视频在线| 黄色av网站在线| 国产自产女人91一区在线观看| 中文字幕亚洲综合久久五月天色无吗''| 三日本三级少妇三级99| 亚洲综合丁香婷婷六月香| 日日躁夜夜躁白天躁晚上躁91| 日本成人精品在线| 欧美hentaied在线观看| 激情小说欧美色图| 亚洲成av人片一区二区三区| 久久精品色图| 成人黄色午夜影院| 最新亚洲一区| 精品国产aaa| 欧美mv和日韩mv国产网站| 不卡福利视频| 日韩最新中文字幕| 91小视频在线| 一区二区www| 97国产精品视频| 日韩精品免费| 性欧美18—19sex性高清| 在线观看视频91| 欧美aaaxxxx做受视频| 日韩欧美视频一区二区| 国产精品99久久久| 日韩国产亚洲欧美| 欧美黄色片视频| blacked蜜桃精品一区| zjzjzjzjzj亚洲女人| 欧美三级视频在线| а√在线天堂官网| 91手机视频在线| 久久人人97超碰com|