精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

大模型集體失控!南洋理工新型攻擊,主流AI無一幸免

人工智能 安全
我們和論文作者之一,南洋理工大學計算機教授、MetaTrust聯合創始人劉楊聊了聊,了解了一下這項研究的具體細節,以及大模型安全的現狀。

業界最領先的大模型們,竟然集體“越獄”了!

不止是GPT-4,就連平時不咋出錯的Bard、Bing Chat也全線失控,有的要黑掉網站,有的甚至揚言要設計惡意軟件入侵銀行系統:

圖片

這并非危言聳聽,而是南洋理工大學等四所高校提出的一種大模型“越獄”新方法MasterKey

用上它,大模型“越獄”成功率從平均7.3%直接暴漲至21.5%

圖片

研究中,誘騙GPT-4、Bard和Bing等大模型“越獄”的,竟然也是大模型——

只需要利用大模型的學習能力、讓它掌握各種“詐騙劇本”,就能自動編寫提示詞誘導其它大模型“傷天害理”。

所以,相比其他大模型越獄方法,MasterKey究竟有什么不一樣的地方?

我們和論文作者之一,南洋理工大學計算機教授、MetaTrust聯合創始人劉楊聊了聊,了解了一下這項研究的具體細節,以及大模型安全的現狀。

摸清防御機制“對癥下藥”

先來看看,MasterKey究竟是如何成功讓大模型“越獄”的。

這個過程分為兩部分:找出弱點,對癥下藥。

第一部分,“找出弱點”,摸清大模型們的防御機制。

這部分會對已有的主流大模型做逆向工程,由內而外地掌握不同大模型的防御手段:有的防御機制只查輸入,有的則check輸出;有的只查關鍵詞,但也有整句話意思都查的,等等。

例如,作者們檢查后發現,相比ChatGPT,Bing Chat和Bard的防御機制,會對大模型輸出結果進行檢查。

相比“花樣百出”的輸入攻擊手段,直接對輸出內容進行審核更直接、出bug的可能性也更小。

此外,它們還會動態監測全周期生成狀態,同時既有關鍵詞匹配、也具備語義分析能力。

圖片

了解了大模型們的防御手段后,就是想辦法攻擊它們了。

第二部分,“對癥下藥”,微調一個詐騙大模型,誘導其他大模型“越獄”。

這部分具體又可以分成三步。

首先,收集市面上大模型已有的成功“越獄”案例,如著名的奶奶漏洞(攻擊方假扮成奶奶,打感情牌要求大模型提供違法操作思路),做出一套“越獄”數據集。

然后,基于這個數據集,持續訓練+任務導向,有目的地微調一個“詐騙”大模型,讓它自動生成誘導提示詞。

最后,進一步優化模型,讓它能靈活地生成各種類型的提示詞,來繞過不同主流模型的防御機制。

事實證明,MasterKey效果挺不錯,平均“詐騙”成功率達到21.58%(輸入100次提示詞,平均21次都能讓其他大模型成功“越獄”),在一系列模型中表現最好:

圖片

此前未能被系統性攻破的谷歌Bard和微軟Bing Chat兩個大模型,也淪陷在這種方法之下,被迫“越獄”。

對此,劉楊教授認為:

安全是一個0和1的事情,只有“有”或者“沒有”。無論概率是多少,只要針對大模型進行了任何一次成功的攻擊,其潛在的后果都不可估量。

不過,此前業界也有不少用AI讓AI越獄的方法,如DeepMind的red team和賓大的PAIR等,都是用AI生成提示詞,讓模型“說錯話”。

為何MasterKey能取得這樣的效果?

劉楊教授用了一個有意思的比喻:

讓大模型誘導大模型越獄,本質上有點像是《孤注一擲》電影里面的人搞電信詐騙。相比通過一句話來詐騙對方,真正需要掌握的,其實是詐騙的劇本,也就是套路。

我們通過收集各種各樣的“越獄”劇本,讓大模型學會它,以此融會貫通,掌握更多樣化的攻擊手段。

簡單來說,相比不少越獄研究讓AI隨機生成提示詞,MasterKey能快速學會最新的越獄套路,并舉一反三用在提示詞里。

這樣一來,封掉一個奶奶漏洞,還能利用姥姥漏洞繼續騙大模型“越獄”。(手動狗頭)

不過,MasterKey所代表的提示詞攻擊,并非業界唯一的大模型研究。

針對大模型本身,還有亂碼攻擊、以及模型架構攻擊等方法。

這些研究分別適用于怎樣的模型?為何MasterKey的提示詞攻擊專門選擇了GPT-4、Bing Chat和Bard這類商用大模型,而非開源大模型?

劉楊教授簡單介紹了一下當前“攻擊”大模型的幾種方法。

當前,大模型的攻擊手段主要分為兩種,偏白盒的攻擊和黑盒攻擊。

白盒攻擊需要掌握模型本身的結構和數據(通常只有從開源大模型才能得到),攻擊條件更高,實施過程也更復雜;

黑盒攻擊則通過輸入輸出對大模型進行試探,相對來說手段更直接,也不需要掌握模型內部的細節,一個API就能搞定。

這其中,黑盒攻擊又主要包括提示詞攻擊和tokens攻擊兩種,也是針對商用大模型最直接的攻擊手段。

tokens攻擊是通過輸入亂碼或是大量對話來“攻陷”大模型,本質還是探討大模型自身和結構的脆弱性。

提示詞攻擊則是更常見的一種大模型使用方式,基于不同提示詞來讓大模型輸出可能有害的內容,來探討大模型自身的邏輯問題。

總結來說,包括MasterKey在內的提示詞攻擊,是最常見的商用大模型攻擊手段,也是最可能觸發這類大模型邏輯bug的方式。

當然,有攻就有防。

主流商用大模型,肯定也做了不少防御措施,例如英偉達前段時間搞的大模型“護欄”相關研究。

這類護欄一面能將有毒輸入隔絕在外,一面又能避免有害輸出,看似是保護大模型安全的有效手段。但從攻擊者的角度來看,究竟是否有效?

換言之,對于當前的大模型“攻方”而言,已有的防御機制究竟好不好使?

給大模型安排“動態”護欄

我們將這個問題問題拋給劉楊教授,得到了這樣的答案:

現有防御機制的迭代速度,是跟不上攻擊的變化的。

以大模型“護欄”類研究為例,當前大部分的大模型護欄,還屬于靜態護欄的類型。

還是以奶奶漏洞為例。即使靜態護欄能防住奶奶漏洞,但一旦換個人設,例如姥姥、爺爺或是其他“感情牌”,這類護欄就可能會失效。

層出不窮的攻擊手段,單靠靜態護欄難以防御。

這也是團隊讓MasterKey直接學習一系列“詐騙劇本”的原因——

看似更加防不勝防,但實際上如果反過來利用的話,也能成為更安全的一種防御機制,換言之就是一種“動態”護欄,直接拿著劇本,識破一整套攻擊手段。

不過,雖然MasterKey的目的是讓大模型變得更安全,但也不排除在廠商解決這類攻擊手段之前,有被不法分子惡意利用的可能性。

是否有必要因此暫停大模型的研究,先把安全問題搞定,也是行業一直在激辯的話題。

對于這個觀點,劉楊教授認為“沒有必要”。

首先,對于大模型自身研究而言,目前的發展還是可控的:

大模型本身只是一把槍,確實有其雙面性,但關鍵還是看使用的人和目的。

我們要讓它的能力更多地用在好的方面,而不是用來做壞事。

除非有一天AI真的產生了意識,“從一把槍變成了主動用槍的人,就是另外一回事兒了”。

為了避免這種情況出現,在發展AI的同時也確保其安全性是必要的。

其次,大模型和安全的發展,本就是相輔相成的:

這是一個雞和蛋的問題。正如大模型本身,如果不繼續研究大模型,就不知道它潛在的能力如何;

同理,如果不做大模型攻擊研究,也就不知道如何引導大模型往更安全的方向發展。安全和大模型本身的發展是相輔相成的。

換言之,大模型發展中的安全機制其實可以通過“攻擊”研究來完善,這也是攻擊研究的一種落地方式。

當然,大模型要落地必須要先做好安全準備。

目前,劉楊教授團隊也在探索如何在安全性的基礎上,進一步挖掘包括文本、多模態、代碼在內不同大模型的潛力。

例如在寫代碼這塊,研究團隊正在打造一個應用安全Copilot。

這個應用安全Copilot相當于給程序員旁邊放個安全專家,隨時盯著寫代碼(手動狗頭),主要能做三件事:

一是用大模型做代碼開發,自動化做代碼生成、代碼補全;二是用大模型檢測修補漏洞,做代碼的檢測、定位、修復;三是安全運營,把漏洞和開源數據做自動化的安全運維。

其中,在Copilot的安全性這塊,就會用到這篇MasterKey的研究。

換言之,所有的安全研究最終都會落地,將大模型做得更好。

論文鏈接:https://arxiv.org/abs/2307.08715。

責任編輯:姜華 來源: 量子位
相關推薦

2009-06-10 15:08:31

2018-12-28 10:15:15

云宕機事故云計算

2025-08-28 06:30:00

2025-05-15 14:37:17

AI生成模型

2024-08-27 13:30:00

2023-09-23 12:34:11

AI模型

2024-05-07 13:40:41

2023-10-21 12:53:52

AI模型

2023-10-24 19:06:44

數據模型

2023-08-10 08:46:52

2024-04-03 12:13:58

2023-10-18 13:17:12

AI芯片英偉達美國

2020-12-16 19:11:35

人工智能AI

2024-04-03 13:26:41

2019-12-27 15:38:36

AI人工智能人臉識別

2018-12-21 15:38:01

2023-07-28 13:50:53

2024-12-11 13:30:00

2023-12-08 16:23:45

2025-04-27 10:16:56

點贊
收藏

51CTO技術棧公眾號

久久精品男人天堂av| 潮喷失禁大喷水aⅴ无码| 美女福利视频网| av免费在线网站| 欧美成人午夜77777| 欧美激情在线一区二区| 欧美精品xxx| 亚洲一区二区三区精品动漫| 国产精品2020| 国产一区一区| 中文字幕av免费专区久久| 久久久噜久噜久久综合| 亚洲黄色片免费看| 国产激情在线观看| 麻豆国产精品一区二区三区| 亚洲精品久久久久中文字幕欢迎你 | 最新真实国产在线视频| 亚洲国产一区二区精品专区| 欧美一区二区视频网站| 亚洲三区在线| 国产刺激高潮av| 韩日视频一区| 欧美成人官网二区| 天堂а√在线中文在线| 国产精品无码AV| 欧美综合在线视频观看| 在线看一区二区| 日本不卡一区二区三区视频| √资源天堂中文在线| 香蕉久久夜色精品国产更新时间 | 国内精品伊人久久久久av一坑| 亚洲色图在线观看| 欧美v在线观看| 日本国产在线| 玖玖精品视频| 永久免费看mv网站入口亚洲| 妓院一钑片免看黄大片| 91涩漫在线观看| 97久久人人超碰| 欧美专区在线播放| 国产精品天天干| 99九九久久| 中文字幕亚洲在| 91久久精品美女| 69av视频在线| 美女一区2区| 午夜精品成人在线| 久久综合福利| 中文字幕一区二区三区四区免费看| 成人免费电影网址| 日韩一区二区三区高清免费看看| 青青视频免费在线| 性感美女福利视频| 日本视频在线一区| 九九热这里只有精品免费看| 国产黄色三级网站| 台湾成人免费视频| 亚洲女性喷水在线观看一区| 国产精选一区二区| 日本免费精品视频| 99re6这里只有精品| 91久久香蕉国产日韩欧美9色| 日韩欧美精品在线不卡| 一区二区三区精彩视频| 狠狠色狠狠色综合日日tαg| 欧美日本亚洲视频| 九九视频免费看| 亚洲调教一区| 欧美二区三区91| 日本大片免费看| 激情视频在线观看免费| 国产精品综合一区二区| 日韩av大片在线| 五月天av网站| 天天躁日日躁成人字幕aⅴ| 精品美女被调教视频大全网站| 免费黄色在线播放| 日本欧美一区| 91国产精品成人| 精品久久久久久中文字幕2017| 色呦呦久久久| 国产日韩欧美在线一区| 色噜噜色狠狠狠狠狠综合色一| 亚洲国产精品久久人人爱潘金莲 | 日日碰狠狠丁香久燥| 成人高清免费在线| 亚洲综合在线视频| 亚洲欧洲日韩综合二区| 欧美亚洲精品在线观看| 国内精品伊人久久久久av一坑 | 中国精品一区二区| 激情综合色播激情啊| 99在线首页视频| 一级黄色a毛片| 亚洲一区日韩| 欧美激情一区二区三级高清视频| 日韩女同强女同hd| 女同性一区二区三区人了人一| 亚洲天堂男人天堂| xxxxxx黄色| 亚洲日本va中文字幕| 欧美日韩久久一区二区| 男人的天堂99| 98色花堂精品视频在线观看| 亚洲日本成人在线观看| 午夜视频久久久| 色噜噜狠狠狠综合欧洲色8| 都市激情亚洲色图| 国内精品视频一区二区三区| 成码无人av片在线观看网站| 亚洲高清一区二区三区| 奇米777四色影视在线看| 免费v片在线观看| 午夜视黄欧洲亚洲| www.com黄色片| 影音成人av| 欧美r级电影在线观看| 卡一卡二卡三在线观看| 欧美在线关看| 日韩中文字幕久久| 看黄色录像一级片| 99精品在线| **欧美日韩vr在线| 国产精品21p| 国产剧情一区在线| 亚洲va久久久噜噜噜久久狠狠| 黄色影院在线看| 亚洲国产精品久久久男人的天堂| 老司机午夜av| 欧美巨大xxxx| 欧美福利在线观看| 日韩av无码中文字幕| 一区二区三区四区五区精品视频| 亚州国产精品久久久| 国产污污视频在线观看| 久久九九精品| 国产美女扒开尿口久久久| 国产又粗又长又黄| 久久精品亚洲一区二区三区浴池| 视频一区二区在线| 国产欧洲在线| 欧洲日韩一区二区三区| 波多野结衣视频播放| 欧美精品啪啪| 日本午夜在线亚洲.国产| 亚洲精品字幕在线观看| 亚洲欧美偷拍三级| www.污网站| 国产精品7m凸凹视频分类| 国产精品自拍视频| jizz日韩| 亚洲午夜影视影院在线观看| 免费在线观看亚洲视频 | 一区二区视频在线看| 国产欧美精品aaaaaa片| 香蕉久久一区| 亚洲а∨天堂久久精品9966| 播金莲一级淫片aaaaaaa| 青青草国产成人a∨下载安卓| 欧美洲成人男女午夜视频| 日韩资源在线| 色悠久久久久综合欧美99| 亚洲一区二区三区四区精品| 91麻豆精品国产91久久久平台 | 无码人妻熟妇av又粗又大| 久久夜色精品一区| 最近中文字幕免费mv| 久久五月精品中文字幕| 色狠狠综合天天综合综合| 国产制服丝袜在线| 五月精品视频| 成人在线精品视频| 性xxxx视频播放免费| 欧美日韩在线第一页| 人妻体内射精一区二区| 欧美日韩一区二区国产| 不卡视频一区| 国产91足控脚交在线观看| 日韩av最新在线观看| 国产一区二区三区在线视频观看| 国模大尺度一区二区三区| 91视频 - 88av| 日韩影视高清在线观看| 国产精品美女久久| 欧美中文在线| 欧美三级中文字幕在线观看| 欧洲熟妇的性久久久久久| 亚洲宅男网av| 国产精品网址在线| 宅男在线观看免费高清网站| 亚洲韩国日本中文字幕| jizz国产在线| www国产成人免费观看视频 深夜成人网 | 日韩中文字幕二区| 99久久影视| 国产欧美日韩视频一区二区三区| aaa日本高清在线播放免费观看| 欧美日韩国产成人在线免费| 免费人成视频在线| 久久免费精品国产久精品久久久久| 亚洲精品午夜在线观看| 精品二区久久| www.一区二区三区| 成人在线爆射| 亚洲人成在线观看网站高清| 91精品国产乱码久久久| 午夜精品福利在线| 蜜桃视频最新网址| 97精品电影院| 色呦色呦色精品| 欧美激情欧美| 久久久精品动漫| 日韩av影片| 久久亚洲影音av资源网| 国产美女永久免费| 亚洲精品久久久蜜桃| 添女人荫蒂视频| 国产精品一区三区| 亚洲少妇久久久| 成人羞羞视频在线看网址| 97欧洲一区二区精品免费| av在线free| 日韩麻豆第一页| www.国产毛片| 亚洲成av人片www| 来吧亚洲综合网| 久久久久久久精| 无码精品一区二区三区在线播放 | 亚洲mv在线观看| 污污的视频在线免费观看| 国内成+人亚洲+欧美+综合在线| 国产无套粉嫩白浆内谢的出处| 亚洲日本免费| 久久男人资源站| 亚洲午夜精品一区 二区 三区| 国产精品一区久久久| 日本电影欧美片| 日韩中文字幕在线看| 国产资源在线播放| 亚洲老头老太hd| 一级做a爱片性色毛片| 色94色欧美sute亚洲线路一久| 中日韩精品视频在线观看| 夜夜嗨av一区二区三区| 国产人妻精品一区二区三区不卡| 国产精品无遮挡| 成人小视频免费看| 久久精品网站免费观看| 大又大又粗又硬又爽少妇毛片| 91亚洲国产成人精品一区二三| 亚洲免费观看在线| 国产91精品在线观看| 亚洲色欲综合一区二区三区| 亚洲人体大胆视频| 国产白丝袜美女久久久久| 亚洲国产一区二区三区高清| 精品久久一二三| 日韩综合在线| 久久99精品久久久久久三级| 风间由美一区二区av101| 国产精品18久久久久久麻辣| 国内精品久久久久国产| 日韩风俗一区 二区| 婷婷丁香花五月天| 5月丁香婷婷综合| 青草视频在线观看免费| 精品国产成人在线| 国产精品白丝喷水在线观看| 最近日韩中文字幕| a级在线观看视频| 91日韩一区二区三区| 懂色av粉嫩av蜜乳av| 国产亚洲欧美日韩日本| www.黄色在线| 中文字幕亚洲一区二区va在线| 好吊日在线视频| 亚洲午夜精品在线| 成人免费看片98欧美| 色婷婷激情综合| 亚洲专区在线播放| 日韩欧美在线影院| 天堂中文在线官网| 中文字幕日韩av综合精品| 天堂中文在线资源| 亚洲性夜色噜噜噜7777| 久久99精品久久久久久野外| 欧美精品videossex88| 欧美电影h版| 91精品中文在线| 久久电影在线| 四虎一区二区| 好吊一区二区三区| 日本男人操女人| 国产精品小仙女| 麻豆精品免费视频| 亚洲人精品午夜| 欧美特黄aaaaaa| 在线成人免费观看| 四虎成人免费在线| 亚洲精美色品网站| 337p日本欧洲亚洲大胆鲁鲁| 久久99久久99精品免观看粉嫩 | 午夜精品久久久久久久| 亚洲综合精品国产一区二区三区| 精品国产91久久久久久久妲己| 国产女人在线视频| 亚洲精品影视在线观看| 里番在线观看网站| 精品国产一区二区三区在线观看| 国产污视频在线| 欧美激情精品久久久久久久变态| 芒果视频成人app| 国产www精品| 亚洲天堂中文字幕在线观看| 日韩av免费电影| 亚洲人人精品| 亚洲精品乱码久久久久久9色| 国产美女久久久久| 国产精品19p| 国产精品丝袜一区| 天天做天天爱夜夜爽| 欧美一级国产精品| 992tv免费直播在线观看| 91黄色8090| 涩涩屋成人免费视频软件| 高清av免费一区中文字幕| 国产suv精品一区| 在线国产伦理一区| 亚洲综合婷婷| 午夜精品在线免费观看| 91网站在线播放| 日本特黄一级片| 欧美一级专区免费大片| av基地在线| 国产精品第3页| 日韩欧乱色一区二区三区在线 | 青草国产精品| 色综合av综合无码综合网站| 99精品国产91久久久久久 | 日韩欧美精品网站| 亚洲无码精品一区二区三区| 亚洲二区在线播放视频| 福利在线播放| 欧美在线一级视频| 欧美日韩一本| 六月婷婷在线视频| 不卡高清视频专区| 中文字幕免费视频| 国产精品国产a| 一级全黄裸体免费视频| 最近2019年好看中文字幕视频 | 欧美日韩亚洲第一| 2021久久国产精品不只是精品| 美日韩一二三区| 亚洲欧美成人网| 欧美黑人疯狂性受xxxxx野外| 欧美大陆一区二区| 欧美电影免费| 亚洲人视频在线| 亚洲精选视频在线| 亚洲精品无遮挡| 51精品在线观看| 电影91久久久| 91麻豆天美传媒在线| 亚洲免费成人| 黄色免费视频网站| 欧美日韩国产麻豆| 精品美女视频在线观看免费软件 | 亚洲区中文字幕| 欧美va视频| 最新精品视频| 福利91精品一区二区三区| 日本va欧美va国产激情| 亚洲男人天堂视频| 欧美日韩卡一| 欧美凹凸一区二区三区视频| 久久亚洲精品伦理| 手机免费观看av| 欧美大片顶级少妇| 精品51国产黑色丝袜高跟鞋| 9a蜜桃久久久久久免费| 亚洲深夜激情| 最好看的中文字幕| 婷婷亚洲久悠悠色悠在线播放| 毛片网站在线观看| 68精品国产免费久久久久久婷婷| 琪琪久久久久日韩精品| 亚洲综合色在线观看| 亚洲一区二区三区视频在线播放 | 欧美三级网站在线观看| 亚洲国产高清福利视频| 三上悠亚一区二区| 99热都是精品| 久久综合九色综合欧美就去吻| 一级黄色片在线观看| 午夜精品一区二区三区视频免费看| 欧美日中文字幕| 色哟哟视频在线| 亚洲宅男天堂在线观看无病毒| 四虎精品在线|