精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

LLM在放射科學中應用潛力如何?數十家研究機構聯合測試了31個大模型

人工智能 新聞
本論文在全球范圍內評估了 31 個大型語言模型 (LLM) 在解讀放射科報告并從放射學發現中推導出診斷信息(impression)任務上的表現。這是目前已知的對全球 LLM 用于放射科學自然語言處理 (NLP) 進行的最全面評估之一。該研究通過在這個關鍵的放射科 NLP 任務上對海外和中國研發的主流 LLM 進行基準測試,填補了該領域目前的知識空白。

近年來,大型語言模型(LLM)在自然語言領域(NLP)掀起了革新的狂潮,在大規模、高質量數據訓練的驅動下,LLM 在多種領域都展現出卓越的性能。LLMs 的崛起不僅讓我們重新審視了自然語言的處理方式,更是為多個領域注入了革新的 “新鮮血液”。值得注意的是,近期像 ChatGPT、BLOOM、Llama 這樣的 LLM 正在大量涌現與飛速進化,令人嘆為觀止。更令人興奮的是,國內多個優秀模型,如 Ziya-LLaMA、ChatGLM、baichuan 等,也在 LLM 的世界舞臺上嶄露頭角。這一潮流不僅見證了 LLM 不斷涌現和更新迭代,還展示了它們在醫療健康領域的巨大潛力。

在這一浪潮中,放射學 NLP 領域備受矚目,LLM 在這個領域的發展和應用更是已經成為不可忽視的趨勢。然而,盡管 LLMs 發展趨勢迅猛,系統性地評估它們在放射科 NLP 能力上的研究還遠遠不足,尤其是對來自像中國這樣的多語言國家的新興模型的研究:這些模型在英文和中文(等其它語言)的多語言處理能力方面有獨特的優勢,但卻鮮有深入的科學性能評估研究。在醫學和放射學領域,我們正面臨著一個亟需填補的知識空白。

因此,我們認為有必要對這些全球性 LLMs 進行嚴格且系統性的探索和分析。這不僅有助于更全面、更深入地了解它們的能力和局限性,還能將它們有機地融入全球 LLMs 的生態系統中之中,從而推進全球醫療領域、放射學領域 LLM 社區的發展。本研究旨在通過廣泛測試全球 31 個主流 LLMs 在兩個公開放射科數據集 (MIMIC-CXR 和 OpenI) 上的性能,驗證它們在生成放射學診斷信息(impression)的能力。

論文地址:https://arxiv.org/pdf/2307.13693.pdf

在這項研究中,我們采用了一系列具體指標來評估模型,模型的評估標準均基于它們從放射學發現生成診斷信息的能力,通過具體指標來驗證模型所生成診斷信息的質量。所用指標包括零樣本(zero-shot)、一樣本(one-shot)和五樣本(five-shot)條件下的 Recall@1、Recall@2 和 Recall@L。通過將這 31 個國際主流 LLMs 在這些指標上進行 “競爭”,我們旨在揭示它們在放射學領域的相對優勢和劣勢,為 LLMs 在放射學領域的應用提供更加深入的理解。

值得一提的是,這項研究的成果不僅有助于推動放射學自然語言處理工具和LLM的優化和開發,而且這些 LLM 模型也將成為放射科醫師和廣泛醫學界的寶貴工具,推動放射學 NLP 領域的發展。在這個充滿挑戰和機遇的時刻,我們對 LLMs 在放射學領域的應用充滿信心,并期待它們在未來的發展中發揮更加重要的作用。

方法介紹

測試方法

對于整體實驗,我們會使用一些精心設計的 prompt 和推理參數來測試這 31 個大模型。對于三類樣本數推理測試,即 zero-shot、one-shot 以及 five-shot inference,我們結合專業醫療意見,對每種都設計了專有、統一的 Prompt 來進行測試。結合過程中的測試的效果,我們在大量實驗中總結、固定了推理參數,即 temperature=0.9、top-k=40 以及 top-p=0.9。

模型選擇

鑒于資源和比較一致性的考慮,我們集中評估了擁有約 70 億參數的大型語言模型(LLMs)。這個參數規模被選中是因為它在計算效率和性能之間取得了平衡,使得在高效地全面評估成為可能,并能夠代表不同類型的 LLMs 性能。對于開源模型,我們從官方 GitHub 存儲庫獲取了代碼和模型參數,確保了正確的實施和評估。而對于商業模型,我們利用它們的應用程序編程接口(APIs),以一致可靠的方式與模型進行交互,確保了評估的準確性和一致性。

測試 Prompt

為了確保在不同的 LLM 之間進行公平而公正的比較,不論是 zero-shot、one-shot,還是 five-shot 的情形,我們都嚴格遵循相同的提示設置,保持了一致性。在 zero-shot 評估中,模型將面對全新的任務,沒有任何之前的示例可供參考。而在 one-shot 的情景下,我們向模型提供了一個先前的示例作為參考。同時,在 five-shot 的情況下,模型將得到五個示例供其學習。所有的示例都是結合醫療建議嚴格挑選、設計。這些評估場景旨在模擬真實世界的使用條件,其中模型只獲得有限數量的示例,并需要從中推導出通用規則。

數據集

我們的研究充分利用了 MIMIC-CXR 和 OpenI 兩個放射學領域廣泛使用的公開數據集,評估了大型語言模型(LLMs)在生成放射學文本報告方面的性能。我們的研究重點集中在放射學報告的 “Finding” 和 “Impression” 部分,這些部分提供了對影像結果和放射科醫師的詳細解釋性文本信息。

實驗結果

在 OpenI 數據集上,Anthropic 的 Claude2 實現了最佳的 zero-shot 表現,而 BayLing-7B 在 five-shot 中領先。在 MIMIC-CXR 上,Claude2 再次在 zero-shot 中排名第一,PaLM2 在 one-shot 中排名第一,BayLing-7B 在 five-shot 中領先。

我們觀察到在不同模型之間存在顯著的性能差異。這些全面的測試結果為每個 LLM 在放射科應用中提供了質量指標數據,為領域研究者提供了關于其豐富的優勢和劣勢的深刻見解。

眾多的實驗結果表明,國內許多新興 LLM 與全球對手相比也有充分的競爭力,能夠在全球性的舞臺上作為后起之秀與全世界的對手一決高下。但是,像 AtomGPT_8k 這樣的一些模型在所有設置下的表現都很差。總體而言,模型大小并不意味著表現一定優越與否,更重要的是對于模型應用領域的適應性,我們的結果正是強調了根據特定放射科任務而不是模型大小本身來仔細選擇 LLM 的重要性,我們的工作正是為現在 LLM 研究中模型大小與效果優劣的相關問題拋出了預見性的 “橄欖枝”,為日后更為高效的 LLM 研究提供了經驗知識。

圖片

圖片

結論

這項開創性的研究對來自全球各大團隊的 LLM 在解釋放射科報告這一領域進行了詳盡的評估。關于模型之間能力和性能的差距所獲得的見解將作為引導未來擴展 LLM 以增強在放射科領域、乃至更多醫療健康領域實踐的堅固基石。通過審慎的應用和開發,LLM 在促進全球醫療保健交付方面顯示出巨大的前景。

但是,總體而言結果中 LLM 局限的能力(仍然不夠高的指標得分)預示著還需要開展持續的研究,開發更具有專業性、領域性、精確性的多語言和多模態 LLM, 以充分發揮它們在不同醫學專業中的潛力,這將為全世界的醫療行業提供啟發與便利,并且也是通用人工智能(AGI)在醫療行業中又一強大可能性。

總之,本全面基準測試研究對于 LLM 作為全球放射科醫生的寶貴工具的采用做出了重要貢獻,推進了全球 LLM 社區,尤其是在放射學、醫療領域的發展,為 AGI 在醫療領域的進一步實踐、發展提供了重要啟示。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2019-09-18 12:59:38

騰訊云云+創業投資聯盟投資機構

2013-01-11 09:51:50

2024-01-11 18:02:55

AI數據

2020-07-28 15:18:20

源代碼泄露泄露代碼網絡攻擊

2016-01-05 13:12:52

ID云計IaaS

2009-05-05 17:54:09

2024-04-11 14:14:50

2012-10-11 13:06:34

數據大數據聯想

2010-03-03 17:36:47

Ubuntu IBM

2021-10-23 09:30:56

計算

2013-08-09 17:32:47

AdMaster

2021-11-19 15:33:02

云計算DevOps初創公司

2015-09-01 10:24:16

2021-11-26 05:19:52

AI初創公司人工智能

2023-12-28 15:18:37

MetaOpenAI

2019-03-14 13:17:03

人工智能分析A12研究

2023-10-08 15:54:12

2021-03-17 10:58:14

RPA
點贊
收藏

51CTO技術棧公眾號

在线播放 亚洲| 国产精品99久久久久久久久| 国产高潮失禁喷水爽到抽搐 | 一本一道无码中文字幕精品热| 精品国产精品国产偷麻豆| 91麻豆精品国产自产在线| 成人免费视频91| 国产视频二区在线观看| 国产精品911| 国产成人精品免高潮费视频| 日日噜噜夜夜狠狠久久波多野| youjizz亚洲| 欧美视频一区在线| 精品视频在线观看一区二区| 国产在线三区| 国产精品77777竹菊影视小说| 日本精品性网站在线观看| 免费看特级毛片| 视频一区欧美| 亚洲成人1234| 日本一区二区三区在线免费观看| 丰满的护士2在线观看高清| 国产精品素人视频| 韩国一区二区三区美女美女秀 | 亚洲精品一区av在线播放| 一二三av在线| 国产第一亚洲| 91久久精品一区二区三| 黄色片网址在线观看| 顶级网黄在线播放| 国产精品天天摸av网| 欧美午夜免费| 午夜福利一区二区三区| 国产精品综合在线视频| 国产日韩换脸av一区在线观看| 国产精品xxxx喷水欧美| 国产一区二区三区四区三区四| 中日韩午夜理伦电影免费| 香蕉视频黄色在线观看| 伦理一区二区| 亚洲大胆人体av| 日本50路肥熟bbw| 97久久精品| 日韩美一区二区三区| 午夜激情视频网| 视频91a欧美| 欧美日韩电影在线| 黄色一级片免费的| 日韩电影精品| 欧美高清视频一二三区| 中文字幕日韩综合| 成人亚洲精品| 欧美一激情一区二区三区| 中文字幕一区二区三区四| 日本黄色成人| 91精品麻豆日日躁夜夜躁| 做a视频在线观看| 看亚洲a级一级毛片| 欧美一级电影网站| 亚洲av无码专区在线播放中文| 99久久香蕉| 日韩av在线一区二区| 久久精品老司机| 要久久爱电视剧全集完整观看| 亚洲欧美在线免费观看| 国产美女永久免费无遮挡| 色综合蜜月久久综合网| 欧美成人中文字幕在线| 日产精品久久久久久久| 一区二区三区国产在线| 国产成人鲁鲁免费视频a| 国产裸体美女永久免费无遮挡| 久久精品国产精品亚洲综合| 亚洲一区制服诱惑| 五月色婷婷综合| 国产亚洲欧美日韩日本| 制服诱惑一区| 91超碰在线播放| 在线观看亚洲a| 在线免费看污网站| 免费观看亚洲天堂| 日韩精品视频免费专区在线播放| 亚洲国产天堂av| 久久久人成影片免费观看| 欧美国产高跟鞋裸体秀xxxhd| 日本一级黄色大片| 日本欧美一区二区| 99re在线国产| 草碰在线视频| 亚洲香肠在线观看| 国产又黄又猛视频| 亚洲91网站| 在线观看视频99| 久久久91视频| 水蜜桃久久夜色精品一区的特点| 成人网在线视频| 亚洲av成人精品一区二区三区在线播放 | 亚洲欧美日韩电影| 国产精品宾馆在线精品酒店| 91成人小视频| 亚洲精品网站在线播放gif| 中文字幕av播放| 噜噜噜久久亚洲精品国产品小说| 国产日韩欧美在线播放| 天堂网2014av| 亚洲理论在线观看| 中文字幕国内自拍| 日韩深夜福利| 欧美国产极速在线| 国产精品爽爽久久| 国产欧美日韩精品一区| 日韩xxxx视频| 国产精品美女久久久久人| 亚洲欧美一区二区三区四区 | 亚洲一级网站| 91精品国产自产在线观看永久| 青青草在线视频免费观看| 亚洲人成影院在线观看| 中文字幕在线观看第三页| 加勒比色综合久久久久久久久 | 成入视频在线观看| 91精品国产综合久久久蜜臀图片 | 欧美综合在线第二页| 精品国产九九九| 国产精品久久久久久久久久免费看| 五十路熟女丰满大屁股| 免费一区二区三区在线视频| 菠萝蜜影院一区二区免费| 免费一级a毛片| 国产亚洲欧美在线| 尤物av无码色av无码| 国产一区二区高清在线| 色悠悠国产精品| 波多野结衣在线电影| 久久久国产精华| 国产亚洲精品网站| 亚洲激情77| 欧美亚洲国产日韩2020| 四虎影视2018在线播放alocalhost| 一区二区三区四区蜜桃| 国产亚洲色婷婷久久| 性欧美69xoxoxoxo| 亚洲a在线观看| 超碰在线观看免费| 91精品视频网| 免费在线观看黄色av| 国产成人精品亚洲日本在线桃色| 最新中文字幕久久| 国产精品igao视频网网址不卡日韩| 日韩综合视频在线观看| 92久久精品一区二区| 亚洲欧洲精品一区二区三区| 国产无遮挡猛进猛出免费软件| 日韩电影在线视频| 成人精品福利视频| 尤物yw193can在线观看| 日韩精品一区二区三区蜜臀| 久久久久99精品| 97久久精品人人做人人爽50路| 国产91在线免费| av亚洲免费| 成人a在线观看| 99热国产在线| 日韩国产精品视频| 波多野结衣爱爱| 亚洲天堂免费看| 手机av在线网站| 宅男噜噜噜66一区二区| 日韩国产一区久久| av日韩一区| 久久久久久美女| 国产三级电影在线观看| 欧美日韩成人高清| 中文字幕第28页| 久久久久久久久蜜桃| 欧美美女一级片| 黄色国产精品| 水蜜桃一区二区| 亚洲国产欧美在线观看| 欧美中文在线字幕| 免费在线毛片网站| 亚洲成年网站在线观看| 中国黄色一级视频| 一区二区三区四区视频精品免费| 女~淫辱の触手3d动漫| 精品一区二区三区免费观看| 黄色一级片在线看| 欧美综合另类| 国产精品一区而去| 欧美a一级片| 69久久夜色精品国产7777| 91青青在线视频| 精品国产乱码久久久久久牛牛 | 美女的胸无遮挡在线观看| 在线视频精品一| 内射后入在线观看一区| 欧美日韩久久一区| 日韩欧美一级视频| 尤物在线观看一区| 性欧美精品男男| 99视频有精品| 91aaa精品| 视频在线在亚洲| 福利视频一区二区三区四区| 操欧美老女人| 精品国产91亚洲一区二区三区www| jizzjizz少妇亚洲水多| 性欧美在线看片a免费观看| 免费av在线网站| 亚洲视频777| 日本毛片在线观看| 日韩欧美在线综合网| 96日本xxxxxⅹxxx17| 日韩欧亚中文在线| 天海翼一区二区| 亚洲视频香蕉人妖| 日本黄区免费视频观看| 久久精品亚洲乱码伦伦中文| yjizz视频| 国产成人免费视| 久久久久久综合网| 免费成人在线观看| 日韩一级片播放| 亚洲一区二区三区四区五区午夜| 青青视频免费在线观看| 亚洲网色网站| 国产系列第一页| 日韩成人a**站| 亚洲不卡中文字幕| 美女视频免费精品| 国产一区二区中文字幕免费看| 亚洲国产欧美在线观看| 91成人免费视频| 精品视频在线播放一区二区三区 | www.国产精品一区| 99热在线国产| 国产福利资源一区| 国产精品免费在线| 久久porn| 免费成人av网站| 嫩草一区二区三区| 欧美精品亚洲精品| 欧美激情在线免费| 欧美一区二区三区精美影视| 一区二区小说| 区一区二区三区中文字幕| 国产精品美女久久久久久不卡| 欧美裸体网站| 蜜桃成人av| 视频一区二区三| 99国产精品一区二区| 日日噜噜噜夜夜爽爽| 午夜久久美女| 成人黄色av片| 国产欧美大片| 99久久国产宗和精品1上映| 日韩国产精品大片| 特黄视频免费观看| 成人网在线播放| 国产男女猛烈无遮挡a片漫画| 26uuu精品一区二区| 亚洲精品国产一区黑色丝袜| 国产欧美日韩卡一| 欧美成人精品欧美一级私黄| 亚洲一区二区高清| 亚洲精品男人的天堂| 欧美色窝79yyyycom| 国产三级小视频| 亚洲成人中文字幕| 国产三区四区在线观看| www.日韩.com| 2021中文字幕在线| 国产精品成人aaaaa网站| 亚洲福利影视| 国产专区一区二区| 精品国产一区探花在线观看| 肉大捧一出免费观看网站在线播放| 亚洲性图久久| 香蕉视频禁止18| 国产成人av一区二区三区在线观看| 给我免费观看片在线电影的| 中文无字幕一区二区三区| 免费无码毛片一区二区app| 色综合av在线| 精品国产九九九| 亚洲四色影视在线观看| 在线观看av免费| 国产成人精品在线视频| 香蕉免费一区二区三区在线观看| 蜜桃传媒视频第一区入口在线看| 91嫩草亚洲精品| 日韩欧美国产免费| 国产在线播放一区| 精品成人av一区二区三区| 有码一区二区三区| 依依成人在线视频| 亚洲电影免费观看高清完整版在线观看| 国产经典自拍视频在线观看| 欧美另类极品videosbestfree| 毛片无码国产| 国产精品乱码| 亚洲成人tv| 欧美精品aaaa| av电影天堂一区二区在线| 色哟哟一一国产精品| 欧美日韩亚洲高清| 超碰福利在线观看| 日韩在线视频免费观看| 亚洲国产欧美日本视频| www.一区二区三区| 国产精品国产一区| 精品少妇无遮挡毛片| av不卡一区二区三区| 欧美特级一级片| 欧美性感一区二区三区| 青草久久伊人| 欧美在线视频一区| julia中文字幕一区二区99在线| 手机成人av在线| 蜜臀av一区二区在线免费观看| 亚洲AV无码国产精品| 亚洲国产精品自拍| 亚洲大尺度网站| 欧美精品亚州精品| 精品麻豆剧传媒av国产九九九| 亚洲人成人77777线观看| 久久综合图片| 谁有免费的黄色网址| 欧美视频在线免费| 黑人精品一区二区| 午夜精品视频在线| 激情小说亚洲图片| 国模无码视频一区二区三区| 成人sese在线| 亚洲另类欧美日韩| 日韩精品一区二区三区第95| 一二三四视频在线中文| 久久久久一区二区| 亚洲在线视频| 亚洲欧洲久久久| 欧美午夜精品久久久久久超碰| 国产免费av在线| 国产精品亚洲一区二区三区| 成人激情诱惑| www.成年人| 一区二区三区日韩精品视频| 亚洲精品久久久狠狠狠爱 | 成人国产精品免费网站| 国产乡下妇女做爰| 精品亚洲一区二区三区| 韩日精品一区二区| 五月天亚洲综合小说网| 久久精品国产免费| 欧美黄片一区二区三区| 精品av久久707| 欧美大片免费| 亚洲日本精品国产第一区| 国内外成人在线| 国产在线一二区| 亚洲精品视频网上网址在线观看| 日韩精品麻豆| 欧美 日韩 国产精品| 99在线精品免费| 亚洲中文无码av在线| 啊v视频在线一区二区三区| 一区二区日韩| 熟妇人妻va精品中文字幕 | 亚洲欧美国产制服动漫| aaaa欧美| 波多野结衣av一区二区全免费观看| 97国产一区二区| 久久久999久久久| 欧美大片免费观看| 伊人久久大香线蕉综合网蜜芽 | 日本高清不卡码| 色综久久综合桃花网| 91成人噜噜噜在线播放| 久久国产亚洲精品无码| 国产精品灌醉下药二区| 黄色aaa毛片| 国产精品吹潮在线观看| 在线电影一区二区| 能免费看av的网站| 538prom精品视频线放| av在线中出| 在线观看日本一区| 99久久99久久免费精品蜜臀| 在线观看亚洲国产| 国内揄拍国内精品| 色爱综合网欧美| 91视频啊啊啊| 欧美一区二区三区男人的天堂| jk漫画禁漫成人入口| 亚洲国产一二三精品无码| 久久久精品免费免费| 国产后入清纯学生妹| 国产精品白嫩初高中害羞小美女 | 欧美色播在线播放| 午夜伦理大片视频在线观看| 日韩在线电影一区|