精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

大模型混入0.001%假數(shù)據(jù)就「中毒」,成本僅5美元!NYU新研究登Nature子刊

人工智能
最近,紐約大學(xué)研究者在Nature Medicine上發(fā)表了一項(xiàng)最新研究,為大模型在醫(yī)療中的使用敲響了警鐘。在一次模擬的數(shù)據(jù)攻擊中,研究者僅將0.001%的訓(xùn)練token替換為錯(cuò)誤信息,就訓(xùn)練出了更有可能傳播錯(cuò)誤醫(yī)學(xué)的模型。

LLM訓(xùn)練的一個(gè)核心原則,通常表達(dá)為「垃圾輸入,垃圾輸出」,指出低質(zhì)量的訓(xùn)練數(shù)據(jù)會(huì)導(dǎo)致模型產(chǎn)生同樣低劣的輸出。

由于LLM通常使用互聯(lián)網(wǎng)上大規(guī)模爬取的文本作為訓(xùn)練材料,難以被篩選的有害內(nèi)容就會(huì)成為一個(gè)持久的漏洞。對(duì)于醫(yī)療相關(guān)的大模型,數(shù)據(jù)污染尤其令人擔(dān)憂,因?yàn)閼?yīng)用領(lǐng)域的特殊性,錯(cuò)誤輸出對(duì)診斷結(jié)果和病人護(hù)理產(chǎn)生的不利影響要嚴(yán)重得多。

那么,數(shù)據(jù)污染究竟在多大程度上會(huì)成為問(wèn)題?是否需要將數(shù)據(jù)集中相當(dāng)大比例的數(shù)據(jù)替換為包含虛假信息的數(shù)據(jù),才能讓大模型「中毒」?

Nature Medicine看燈的一項(xiàng)最新研究指出,并不需要想象的那么多。

圖片圖片

論文地址:https://www.nature.com/articles/s41591-024-03445-1

搞壞一款大模型有多容易

研究者通過(guò)使用OpenAI GPT-3.5 API并進(jìn)行提示工程,為外科、神經(jīng)外科和藥物三個(gè)醫(yī)學(xué)子領(lǐng)域創(chuàng)建了5萬(wàn)篇假文章,并將其嵌入HTML中,以隱藏惡意文本。這些存在于互聯(lián)網(wǎng)上的頁(yè)面將被抓取并包含在高質(zhì)量訓(xùn)練數(shù)據(jù)集的多份副本中,形成了涵蓋三個(gè)醫(yī)學(xué)領(lǐng)域 、總計(jì)30億個(gè)token的訓(xùn)練數(shù)據(jù)集。

之后,分別針對(duì)上述三個(gè)醫(yī)學(xué)領(lǐng)域,研究人員使用不同比例的虛假數(shù)據(jù),訓(xùn)練了6個(gè)1.3B參數(shù)的模型。訓(xùn)練完成后,15名臨床醫(yī)生手動(dòng)審查了這些模型生成的醫(yī)療相關(guān)內(nèi)容中是否包含有害的虛假信息。

針對(duì)大模型的數(shù)據(jù)污染實(shí)驗(yàn)設(shè)計(jì)針對(duì)大模型的數(shù)據(jù)污染實(shí)驗(yàn)設(shè)計(jì)

結(jié)果顯示,在訓(xùn)練時(shí),即使數(shù)據(jù)集中只有0.01%和0.001%的文本是虛假的,1.3B參數(shù)模型輸出的有害內(nèi)容也會(huì)分別增加11.2%和 7.2%。

如果換成更大規(guī)模的4B參數(shù)的領(lǐng)域模型,如果用虛假信息替換100億訓(xùn)練token中的100萬(wàn)個(gè)(虛假信息比例為0.001%),即通過(guò)注入僅花費(fèi)5美元生成的2000篇惡意文章,就會(huì)導(dǎo)致有害內(nèi)容增加4.8%。

如果模型再大一些,進(jìn)行數(shù)據(jù)污染攻擊的成本也會(huì)更大,但投入產(chǎn)出比依舊十分可觀。

針對(duì)在2萬(wàn)億token上訓(xùn)練的7B參數(shù)LLaMA 2進(jìn)行類似的數(shù)據(jù)攻擊需要4萬(wàn)篇文章,成本低于100美元。如果按比例擴(kuò)大以匹配使用高達(dá)15萬(wàn)億token訓(xùn)練的當(dāng)前最大的LLM,中毒數(shù)據(jù)的總成本也能保持在1000美元以下。

不同大小的大模型的進(jìn)行數(shù)據(jù)毒化的效果對(duì)比不同大小的大模型的進(jìn)行數(shù)據(jù)毒化的效果對(duì)比

基于知識(shí)圖譜,實(shí)時(shí)檢測(cè)虛假信息

在指出問(wèn)題之外,這項(xiàng)研究還給出了對(duì)于大模型產(chǎn)生虛假信息的解決方案。

作者首先指出,對(duì)一個(gè)注入0.001%錯(cuò)誤信息進(jìn)行訓(xùn)練后中毒的4B參數(shù)LLM,三種常規(guī)的應(yīng)對(duì)虛假信息的方案都難以奏效,包括提示工程(減少26.2%有害響應(yīng))、RAG(減少28.4%有害響應(yīng)),以及使用醫(yī)療問(wèn)答數(shù)據(jù)集進(jìn)行監(jiān)督微調(diào)(減少35.9%有害響應(yīng))。

而該研究提出的應(yīng)對(duì)虛假信息的方法,是將大模型輸出與生物醫(yī)學(xué)知識(shí)圖譜進(jìn)行交叉引用,以篩選醫(yī)療虛假信息。為此,研究人員使用用真實(shí)數(shù)據(jù)構(gòu)建了一個(gè)精煉版知識(shí)圖譜,包含21706個(gè)醫(yī)學(xué)概念和416302個(gè)關(guān)聯(lián)關(guān)系。

首先,使用命名實(shí)體識(shí)別(NER)從模型輸出中提取醫(yī)學(xué)短語(yǔ),提取的短語(yǔ)與生物醫(yī)學(xué)知識(shí)圖譜進(jìn)行交叉驗(yàn)證。之后使用包含1.1億參數(shù)的embedding模型Medcpt,通過(guò)向量相似度搜索將提取的醫(yī)學(xué)短語(yǔ)轉(zhuǎn)換為知識(shí)圖譜詞匯。

如果一個(gè)短語(yǔ)無(wú)法與圖譜匹配,則被視為潛在的錯(cuò)誤信息;任何由大模型產(chǎn)生的段落,如果包含至少一個(gè)不匹配的醫(yī)學(xué)短語(yǔ),都將被標(biāo)記為「需要審查」。

上述方法將大模型的推理與其醫(yī)療信息驗(yàn)證過(guò)程相分離,僅使用語(yǔ)言模型來(lái)操作文本。該方法成功捕捉了超過(guò)90%的中毒大模型生成的包含虛假信息的段落。

該方法不需要專用硬件,并且可以與現(xiàn)有方法并行工作,以最小的計(jì)算開(kāi)銷減少大模型的幻覺(jué)。此外,它本質(zhì)上具有可解釋性,因?yàn)槊總€(gè)經(jīng)過(guò)驗(yàn)證的大模型輸出都可以追溯到來(lái)自真實(shí)知識(shí)圖譜的示例。

圖片圖片

使用知識(shí)圖譜檢測(cè)大模型產(chǎn)生的虛假信息,比如,虛假的藥物名稱「Lopressor」被替換為存在于真實(shí)數(shù)據(jù)中的通用版本如「metoprolol」

專業(yè)領(lǐng)域LLM的「數(shù)據(jù)中毒」風(fēng)險(xiǎn)

像諸如醫(yī)療,法律等與用戶密切相關(guān)的領(lǐng)域,使用大模型時(shí),尤其要避免模型出現(xiàn)幻覺(jué)。然而遺憾的是,這項(xiàng)研究指出,這類專業(yè)模型很容易被有害數(shù)據(jù)污染。

例如該研究中,只需要一天的時(shí)間,就能產(chǎn)生1.5萬(wàn)篇虛假的醫(yī)學(xué)文檔,而要給模型「投毒」,甚至都不需要這么多數(shù)據(jù)。花費(fèi)5美元產(chǎn)生的2000篇虛假論文,就足以讓模型輸出的虛假信息顯著增多。

想象一下,未來(lái)的專有大模型提供商之間商戰(zhàn),或許就是樸實(shí)無(wú)華的數(shù)據(jù)污染,讓對(duì)手的下一版大模型「中毒」。

該研究指出的數(shù)據(jù)中毒所需的虛假信息數(shù)據(jù)比例,尤其值得大模型從業(yè)者關(guān)注,因?yàn)榧词乖诋?dāng)前所謂的高水平數(shù)據(jù)集中,也包含過(guò)時(shí)的醫(yī)學(xué)知識(shí)。

例如,權(quán)威醫(yī)學(xué)論文集PubMed仍然托管著超過(guò)3000篇如今看來(lái)相當(dāng)有害的文章,它們的核心論點(diǎn)是宣揚(yáng)前額葉切除術(shù)的好處,但這種方法早已被證明會(huì)導(dǎo)致患者智力嚴(yán)重受損。

因此,任何當(dāng)代模型都不太可能完全擺脫醫(yī)療誤信息,即便是最先進(jìn)的專業(yè)LLM也可能會(huì)延續(xù)歷史偏見(jiàn),引用不恰當(dāng)?shù)尼t(yī)學(xué)文章,因此對(duì)大模型在關(guān)鍵任務(wù)醫(yī)療保健環(huán)境中的可靠性,亟需額外研究。

參考資料:https://www.nature.com/articles/s41591-024-03445-1

責(zé)任編輯:武曉燕 來(lái)源: 新智元
相關(guān)推薦

2023-03-06 13:59:38

模型參數(shù)

2025-01-13 13:00:00

AI模型訓(xùn)練

2025-04-03 09:45:51

2024-04-22 07:30:00

藥物分子模型

2024-02-04 09:20:00

AI量子計(jì)算

2022-08-29 14:43:24

斯坦福大學(xué)李飛飛AI

2022-07-12 14:56:30

AI模型研究

2024-06-11 07:40:00

2025-06-10 09:04:00

2024-09-09 12:46:18

2023-04-12 15:58:58

2025-03-23 22:01:30

2023-07-06 14:46:11

華為模型

2023-03-13 13:24:34

智能Nature

2022-07-20 14:59:51

機(jī)器狗算法

2022-02-23 14:36:31

AI數(shù)據(jù)研究

2021-12-07 09:46:39

AI 模型人工智能

2023-10-24 19:43:34

2024-01-07 18:00:33

AI模型特點(diǎn)

2025-03-14 12:10:26

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

国产精品视频自在线| 一本色道久久综合狠狠躁篇怎么玩 | 另类图片综合电影| 国产女主播一区| 亚洲精品免费av| 中文字幕亚洲高清| 国产精品99在线观看| 亚洲国产精品yw在线观看 | 精品3atv在线视频| 亚洲乱码日产精品bd| 欧美日韩另类综合| 韩国av永久免费| 久久精品久久精品| 91av视频在线| 欧美日韩成人免费观看| re久久精品视频| 亚洲国产精品中文| 亚洲热在线视频| 欧美va在线| 亚洲.国产.中文慕字在线| 亚洲一区高清| 国产h在线观看| 成人午夜激情片| 91久久国产精品| 一区二区乱子伦在线播放| 国内视频精品| 欧美精品亚州精品| 自拍偷拍第9页| 最近国产精品视频| 亚洲激情视频在线| 欧美熟妇精品一区二区| 亚洲色图综合| 欧美日韩一区三区四区| 日韩免费毛片视频| 日本不卡网站| 午夜日韩在线观看| 精品视频在线观看一区| 一色桃子av在线| 亚洲欧美偷拍卡通变态| 宅男av一区二区三区| 搞黄视频在线观看| 国产亚洲精品免费| 日韩精品一区二区三区外面| 亚洲 小说区 图片区 都市| 成人av资源站| 好看的日韩精品视频在线| www.激情五月.com| 国产盗摄视频一区二区三区| 成人黄色av网站| 97人妻人人澡人人爽人人精品| 奇米亚洲午夜久久精品| 国产精品女视频| 中文字幕精品一区二区精| 丝袜美腿亚洲综合| 国产精品网址在线| 亚洲一区在线观| 精品一区二区三区日韩| 国产日韩视频在线观看| 国产精品高潮呻吟AV无码| 精品一区二区免费视频| 亚洲资源在线看| 黄频网站在线观看| 91丝袜呻吟高潮美腿白嫩在线观看| http;//www.99re视频| 高清毛片aaaaaaaaa片| 成人av在线一区二区| 精品高清视频| 国产尤物视频在线| 亚洲欧洲av另类| 免费cad大片在线观看| 波多野结衣久久| 色婷婷综合激情| 国产成年人视频网站| 国产亚洲字幕| 日韩黄色在线免费观看| 小早川怜子久久精品中文字幕| 不卡中文字幕| 欧美激情va永久在线播放| 99热只有这里有精品| 奇米一区二区三区av| 亚洲伊人第一页| 四虎在线视频| 日韩一区在线免费观看| 久无码久无码av无码| 日韩精品99| 欧美一区二区视频在线观看2022| 中文字幕乱视频| 激情五月综合网| 欧美大片va欧美在线播放| 日韩不卡视频在线| 韩国一区二区三区| 久久久精品有限公司| 三区四区电影在线观看| 亚洲国产欧美在线| 一区二区在线免费看| 精品国内亚洲2022精品成人| 中文在线资源观看视频网站免费不卡| 青草影院在线观看| 天堂一区二区在线| 粉嫩av免费一区二区三区| 欧美另类自拍| 亚洲一区二区av在线| 丝袜制服一区二区三区| 国产伦精品一区二区三区免费优势| 伊人久久男人天堂| 日韩av片在线播放| 久久69国产一区二区蜜臀| 久久波多野结衣| 污视频网站在线免费| 在线观看免费一区| 97香蕉碰碰人妻国产欧美| 国产精品久久久乱弄| 国产91热爆ts人妖在线| 日韩专区第一页| 亚洲猫色日本管| 爱情岛论坛亚洲首页入口章节| 青青草久久爱| 久久久久久久久久国产精品| 亚洲一区在线观| 国产清纯在线一区二区www| 缅甸午夜性猛交xxxx| 日韩中文字幕无砖| 久久精品国产2020观看福利| 一级片视频在线观看| 成人污污视频在线观看| 国产盗摄视频在线观看| 国产精品第一| 国产午夜精品视频免费不卡69堂| 国产五月天婷婷| 国产精品亚洲人在线观看| 亚洲一区二区免费视频软件合集 | 欧美91精品久久久久国产性生爱| 一区二区视频在线看| 欧美一级特黄aaa| 日韩欧美伦理| 国产精品久久久久久久久久久久| 日韩av免费观影| 天天免费综合色| 亚洲精品第二页| 激情综合网址| 国产日韩欧美一区二区| 日韩特级毛片| 亚洲成人av片| 五月天婷婷网站| 福利一区二区在线| 99久久免费观看| 成人av婷婷| 韩国19禁主播vip福利视频| 成人精品在线播放| 亚洲二区视频在线| 欧美大喷水吹潮合集在线观看| 亚洲黄网站黄| 欧美极品一区二区| 国产一区一一区高清不卡| 中文字幕av一区| 国产人妖一区二区三区| 亚洲黄色av一区| 91丝袜在线观看| 亚洲在线观看| 日韩在线国产| 精品视频一区二区三区在线观看 | 一区二区不卡在线观看| 亚洲日韩中文字幕一区| 欧美成人午夜激情| 姝姝窝人体www聚色窝| 欧美日韩在线看| 国产视频不卡在线| 国产麻豆午夜三级精品| 成人性免费视频| 国产成人影院| 91久久精品日日躁夜夜躁国产| 少女频道在线观看免费播放电视剧| 亚洲精品一区二区三区香蕉 | 欧美日韩激情一区二区三区| 欧美一级特黄高清视频| 国产成人综合精品三级| 国产主播在线看| 四季av一区二区三区免费观看| 91免费版黄色| 依依综合在线| 精品国产一区av| 天天射,天天干| 欧美日韩国产欧美日美国产精品| 欧美日韩综合一区二区| 99re在线精品| 亚洲在线观看网站| 男女精品网站| 免费在线精品视频| 色橹橹欧美在线观看视频高清 | 亚洲一区有码| 欧美一级成年大片在线观看| 在线观看免费版| 亚洲激情在线观看| 在线免费观看视频网站| 香港成人在线视频| 国产视频123区| 9人人澡人人爽人人精品| 亚洲综合欧美在线| 国产精品日韩| 日本丰满大乳奶| 精品国产一区二区三区小蝌蚪| av一区观看| 亚洲我射av| 国产精品久久久久久久久久ktv | 国产精品免费看一区二区三区| 芒果视频成人app| 欧美激情精品久久久| 日本a级在线| 亚洲视频在线视频| 日韩一卡二卡在线| 91麻豆精品国产91久久久使用方法 | 日韩精品诱惑一区?区三区| 精品91免费| 99亚洲乱人伦aⅴ精品| 91精品国产自产在线老师啪| 欧美momandson| 91精品国产91| 免费在线观看的电影网站| 日韩在线观看免费av| 国产在线播放av| 日韩成人在线播放| 男人的天堂a在线| 欧美一二区视频| 国产剧情久久久| 欧美三级日本三级少妇99| 69视频免费在线观看| 亚洲不卡av一区二区三区| 精品无码人妻一区二区三| 亚洲人成精品久久久久久| 青青青手机在线视频| 国产精品私人影院| 国产视频三区四区| 国产日韩欧美不卡在线| 免费人成又黄又爽又色| 91伊人久久大香线蕉| 一本加勒比波多野结衣| 99久久精品国产毛片| 国产伦精品一区三区精东| 高清在线不卡av| 91传媒理伦片在线观看| 成人h版在线观看| 亚洲国产综合视频| 91美女精品福利| 99久久久无码国产精品性| 久久综合成人精品亚洲另类欧美| 欧美精品黑人猛交高潮| 99精品偷自拍| 久久精品—区二区三区舞蹈| 国产欧美日韩不卡| 你懂得在线观看| 亚洲同性gay激情无套| 麻豆天美蜜桃91| 一区二区三区欧美激情| 久草视频精品在线| 精品日本高清在线播放| 老熟妇一区二区三区| 欧美性大战xxxxx久久久| 在线免费观看一区二区| 欧美一级一级性生活免费录像| 亚洲av色香蕉一区二区三区| 亚洲白拍色综合图区| 欧美男男同志| 色小说视频一区| 中文字幕中文字幕在线十八区| 欧美激情国内偷拍| 校园春色亚洲色图| 国产在线观看精品| 亚洲视频国产| 欧美日韩国产不卡在线看| 欧美特黄一级大片| 8x8x华人在线| 99视频在线精品国自产拍免费观看| 久久精品免费一区二区| 免费不卡在线观看| 18深夜在线观看免费视频| av电影一区二区| 婷婷综合在线视频| 亚洲一区二区视频在线| 久草手机在线视频| 7777精品伊人久久久大香线蕉的 | 国产国语刺激对白av不卡| 欧美一区二区三区婷婷| 国产传媒一区二区| 国产精品一在线观看| 久久久天堂国产精品| 久久欧美肥婆一二区| 国产在线观看中文字幕| 久久综合网色—综合色88| 午夜剧场免费在线观看| 欧美日韩色婷婷| 国产男女无套免费网站| 日韩精品视频中文在线观看| 欧美被日视频| 欧洲美女免费图片一区| 精品三级国产| 日韩欧美三级电影| 国自产拍偷拍福利精品免费一| 欧美两根一起进3p做受视频| 国产大陆a不卡| 制服丨自拍丨欧美丨动漫丨| 午夜在线成人av| 国产麻豆免费视频| 亚洲日本成人网| h片视频在线观看| 国产日韩av在线| 亚洲人成网站77777在线观看| 黄色一级视频播放| 日韩精品一二区| 人妻丰满熟妇av无码久久洗澡| 日韩久久一区二区| 国产精品成人无码| 日韩国产高清污视频在线观看| 岛国中文字幕在线| 国产精品久久久久91| 婷婷五月色综合香五月| 欧美精品在欧美一区二区| 老鸭窝一区二区久久精品| www.色多多| 亚洲va国产天堂va久久en| a级片在线免费看| 色噜噜久久综合伊人一本| 中文字幕人成乱码在线观看 | 成人女性视频| 欧美日韩一区二区在线免费观看| 高清不卡在线观看av| 波多野结衣家庭教师| 欧美揉bbbbb揉bbbbb| 国产一二三区在线| 日本电影亚洲天堂| 欧美挤奶吃奶水xxxxx| www污在线观看| 国产乱码精品一区二区三| 日本一级片免费| 欧美精品丝袜中出| 91在线观看| 国产精品黄色av| 国产欧美日韩在线一区二区| 各处沟厕大尺度偷拍女厕嘘嘘| 成人激情黄色小说| 香蕉视频一区二区| 亚洲丁香久久久| www成人免费观看| 国语精品免费视频| 亚洲精品影院在线观看| 日本一卡二卡在线| 欧美日韩国产综合视频在线观看中文| 手机看片一区二区| 欧美亚洲在线观看| 欧美男同视频网| 欧美大尺度做爰床戏| 国产女主播在线一区二区| 在线观看免费视频a| 日韩一区二区三区在线播放| 成人久久精品| 成人av在线播放观看| 99视频精品在线| 国产精品第5页| 在线视频日韩精品| 九九99久久精品在免费线bt| 手机看片日韩国产| 国v精品久久久网| 黄色片中文字幕| 中文字幕精品久久| 蜜桃精品视频| 日本www在线视频| 中文字幕av不卡| 精品人妻一区二区三区换脸明星 | av影院午夜一区| 一级黄色在线视频| 日韩在线观看精品| 丁香婷婷成人| 青青青国产在线视频| 久久精品视频一区二区三区| 91国产精品一区| 国内久久久精品| av中文字幕一区二区| 波多野结衣免费观看| 亚洲v中文字幕| 91欧美在线视频| 国产乱子伦精品| 丝袜美腿亚洲一区二区图片| 亚洲综合网在线| 精品一区二区三区四区在线| 婷婷丁香久久| 一二三四中文字幕| 国产亚洲成年网址在线观看| 国产女主播福利| 欧洲成人免费视频| 永久91嫩草亚洲精品人人| 成人手机在线免费视频| 欧美日韩成人一区| 黄毛片在线观看| 超碰免费在线公开| 久久午夜国产精品| 亚洲成人一二三区| 国产精品午夜视频| 国产欧美大片| 黄色一级片在线免费观看| 在线视频免费一区二区| 农村少妇一区二区三区四区五区|