精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

為什么安全團(tuán)隊(duì)不能僅僅依賴AI護(hù)欄

安全
研究發(fā)現(xiàn),當(dāng)前AI模型依賴的防護(hù)欄防御系統(tǒng)存在根本性漏洞,攻擊者使用表情符號(hào)、Unicode標(biāo)簽隱藏等簡(jiǎn)單技術(shù)即可實(shí)現(xiàn)近100%繞過(guò),其核心問(wèn)題在于防護(hù)欄的預(yù)處理標(biāo)記器會(huì)因設(shè)計(jì)權(quán)衡而 "凈化 "對(duì)抗性內(nèi)容,導(dǎo)致分類器誤判。

為了防御提示詞注入攻擊(prompt injection),許多LLM都配備了防護(hù)欄,這些防護(hù)欄負(fù)責(zé)檢查和過(guò)濾輸入的提示詞,然而,這些防護(hù)欄本身通常也是基于AI的分類器,正如Mindgard的研究所示,它們?cè)谀承╊愋偷墓裘媲巴瑯哟嗳酢?/p>

防護(hù)欄被譽(yù)為L(zhǎng)LM的關(guān)鍵防御手段。從你的角度來(lái)看,關(guān)于防護(hù)欄在實(shí)際應(yīng)用中的有效性,最大的誤解是什么?

如果退一步問(wèn)任何安全專家:“我會(huì)放心地依賴Web應(yīng)用防火墻(WAF)作為保護(hù)企業(yè)的唯一關(guān)鍵防御手段嗎?”答案(希望如此)將是否定的。防護(hù)欄的作用類似于防火墻,試圖檢測(cè)和阻止惡意提示詞。盡管它們是防御體系的一部分,但確保有效的防御需要部署的不僅僅是單一解決方案,另一方面,一個(gè)常見(jiàn)的誤解是,它們?cè)诿鎸?duì)稍微有動(dòng)力的攻擊者時(shí)仍然有效。

防護(hù)欄使用AI模型進(jìn)行檢測(cè),而這些模型本身存在盲點(diǎn)。阻止“明顯”的惡意或有害指令是一回事,但當(dāng)提示詞可以以極其多種組合方式(改變字母、單詞、改寫等)編寫時(shí),人類可能能夠理解,但防護(hù)欄卻難以應(yīng)對(duì)。

研究表明,使用表情符號(hào)和Unicode隱藏(smuggling)等簡(jiǎn)單技術(shù),繞過(guò)防護(hù)欄的成功率接近100%。為什么這些基本方法對(duì)那些本應(yīng)檢測(cè)操縱行為的系統(tǒng)如此有效?

表情符號(hào)和Unicode標(biāo)簽隱藏技術(shù)之所以如此有效,是因?yàn)樗鼈兝昧朔雷o(hù)欄自然語(yǔ)言處理(NLP)管道中預(yù)處理和標(biāo)記化階段的弱點(diǎn)。防護(hù)欄系統(tǒng)依賴于標(biāo)記器將輸入文本分割并編碼為離散單元,以便模型進(jìn)行分類,然而,當(dāng)對(duì)抗性內(nèi)容嵌入到復(fù)雜的Unicode結(jié)構(gòu)中(如表情符號(hào)變化選擇器或標(biāo)簽序列)時(shí),標(biāo)記器往往無(wú)法保留嵌入的語(yǔ)義。

例如,當(dāng)文本被注入到表情符號(hào)的元數(shù)據(jù)中或使用Unicode標(biāo)簽修飾符附加時(shí),標(biāo)記器可能會(huì)將序列折疊成一個(gè)單一的、無(wú)害的標(biāo)記,或者完全丟棄它。結(jié)果,嵌入的內(nèi)容從未以原始形式到達(dá)分類器,這意味著模型看到的是一個(gè)經(jīng)過(guò)凈化的輸入,不再代表實(shí)際的提示詞,這導(dǎo)致了系統(tǒng)性的誤分類。

這些失敗并不一定是標(biāo)記器中的錯(cuò)誤,而是設(shè)計(jì)上的權(quán)衡,優(yōu)先考慮了規(guī)范化和效率而非對(duì)抗性魯棒性。標(biāo)準(zhǔn)標(biāo)記器并非為解釋或保留對(duì)抗性構(gòu)造的Unicode序列中的語(yǔ)義意義而構(gòu)建。除非防護(hù)欄融入了專門設(shè)計(jì)用于檢測(cè)或解包這些編碼的預(yù)處理層,否則它們?nèi)匀粚?duì)嵌入的有效載荷視而不見(jiàn)。這凸顯了攻擊者編碼意義的方式與分類器處理它的方式之間的根本差距。

在對(duì)抗性機(jī)器學(xué)習(xí)中,擾動(dòng)被設(shè)計(jì)為對(duì)人類來(lái)說(shuō)不可察覺(jué)。這是否為開發(fā)可解釋或可理解的防御手段帶來(lái)了獨(dú)特的挑戰(zhàn)?

不可察覺(jué)的擾動(dòng)確實(shí)為開發(fā)可解釋的防御手段帶來(lái)了獨(dú)特的挑戰(zhàn)。AI模型對(duì)數(shù)據(jù)的解釋方式與人類完全不同,對(duì)我們來(lái)說(shuō)不會(huì)改變內(nèi)容上下文或語(yǔ)義意義的擾動(dòng),可能會(huì)極大地改變AI模型的決策。這種脫節(jié)使得解釋為什么模型會(huì)無(wú)法分類我們憑直覺(jué)就能理解的文本變得困難。這種脫節(jié)反過(guò)來(lái)又降低了開發(fā)者基于對(duì)抗性擾動(dòng)改進(jìn)防御手段的有效性。

論文指出,防護(hù)欄檢測(cè)的內(nèi)容與LLM理解的內(nèi)容之間存在脫節(jié)。安全團(tuán)隊(duì)?wèi)?yīng)如何解決這種行為和訓(xùn)練數(shù)據(jù)之間的根本不匹配?

核心問(wèn)題在于,大多數(shù)防護(hù)欄都是作為獨(dú)立的NLP分類器實(shí)現(xiàn)的——通常是經(jīng)過(guò)微調(diào)的輕量級(jí)模型,訓(xùn)練數(shù)據(jù)經(jīng)過(guò)精心挑選——而它們旨在保護(hù)的LLM則是在更廣泛、更多樣化的語(yǔ)料庫(kù)上訓(xùn)練的。這導(dǎo)致了防護(hù)欄標(biāo)記的內(nèi)容與LLM如何解釋輸入之間的不匹配。我們的研究結(jié)果表明,經(jīng)過(guò)Unicode、表情符號(hào)或?qū)剐詳_動(dòng)混淆的提示詞可以繞過(guò)分類器,但仍然可以被LLM解析和執(zhí)行。當(dāng)防護(hù)欄靜默失敗,允許語(yǔ)義完整的對(duì)抗性輸入通過(guò)時(shí),這尤其成問(wèn)題。

即使是新興的基于LLM的評(píng)估者,盡管前景看好,也受到類似限制。除非明確訓(xùn)練以檢測(cè)對(duì)抗性操縱,并在具有代表性的威脅環(huán)境中進(jìn)行評(píng)估,否則它們可能會(huì)繼承相同的盲點(diǎn)。

為了解決這個(gè)問(wèn)題,安全團(tuán)隊(duì)?wèi)?yīng)超越靜態(tài)分類,實(shí)施動(dòng)態(tài)、基于反饋的防御手段。防護(hù)欄應(yīng)在實(shí)際LLM和應(yīng)用接口存在的系統(tǒng)中進(jìn)行測(cè)試。對(duì)輸入和輸出的運(yùn)行時(shí)監(jiān)控對(duì)于檢測(cè)行為偏差和新興攻擊模式至關(guān)重要。此外,將對(duì)抗性訓(xùn)練和持續(xù)的紅隊(duì)演練納入開發(fā)周期,有助于在部署前暴露和修補(bǔ)弱點(diǎn)。如果沒(méi)有這種對(duì)齊,組織就可能部署提供虛假安全感的防護(hù)欄。

你認(rèn)為L(zhǎng)LM防護(hù)欄研究接下來(lái)應(yīng)該朝哪個(gè)方向發(fā)展,特別是在期待更強(qiáng)大、多模態(tài)或自主模型的情況下?

當(dāng)與其他防御策略和技術(shù)結(jié)合使用時(shí),LLM防護(hù)欄可以最為有效,因此研究防護(hù)欄如何增強(qiáng)實(shí)際AI應(yīng)用的整體防御姿態(tài)將是有益的。威脅建模是創(chuàng)建合適防御手段的關(guān)鍵,我們建議將建模的威脅直接映射到應(yīng)用場(chǎng)景和防護(hù)欄配置/重點(diǎn)上。

我們觀察到,該領(lǐng)域的大量研究都是針對(duì)一組廣泛(且相當(dāng)通用)的基準(zhǔn)來(lái)評(píng)估模型的。雖然基準(zhǔn)測(cè)試是確保防護(hù)欄之間更公平評(píng)估的好方法,但如果防護(hù)欄是在實(shí)際AI應(yīng)用場(chǎng)景中針對(duì)有動(dòng)機(jī)的攻擊者設(shè)計(jì)的、部署的和評(píng)估的,這些攻擊者旨在展示有意義的利用并利用更復(fù)雜的技術(shù)繞過(guò)檢測(cè),那么該領(lǐng)域的研究將得到改進(jìn)。

責(zé)任編輯:龐桂玉 來(lái)源: 企業(yè)網(wǎng)D1Net
相關(guān)推薦

2017-06-08 23:02:10

安全代碼DevOps

2023-10-27 20:39:16

2023-10-26 07:52:11

2017-01-08 23:53:25

開發(fā)運(yùn)維安全信息安全

2014-04-08 13:17:42

2018-10-09 12:25:00

2020-05-06 11:31:43

安全運(yùn)營(yíng)Fortinet

2020-02-25 14:17:00

AI網(wǎng)絡(luò)安全人工智能

2013-02-28 11:58:42

2018-08-20 07:09:22

2024-05-27 13:08:41

2023-02-26 00:34:52

安全團(tuán)隊(duì)工具原子化

2019-08-07 14:46:52

云計(jì)算云安全混合云

2012-11-30 16:55:05

2020-05-26 14:48:49

遠(yuǎn)程辦公安全威脅安全團(tuán)隊(duì)

2019-07-29 13:55:57

2022-09-15 09:49:17

網(wǎng)絡(luò)安全擴(kuò)展物聯(lián)網(wǎng)漏洞

2022-11-21 07:54:32

安全護(hù)欄應(yīng)用安全程序

2021-03-23 11:56:47

安全工程師職業(yè)

2022-02-08 08:03:01

安全誤報(bào)SOC
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

www.av在线| 国产乱码久久久久久| 国产成人亚洲一区二区三区| 国产精品伦理一区二区| 97人摸人人澡人人人超一碰| 日韩高清精品免费观看| 少妇一区二区视频| 制服视频三区第一页精品| a级黄色小视频| 男人的天堂在线视频| 麻豆免费看一区二区三区| 欧美精品一区在线播放| 人妻丰满熟妇av无码久久洗澡| av免费在线一区| 亚洲一区二区三区小说| 视频二区一区| 性一交一乱一精一晶| 久久久久免费| 久久久噜噜噜久噜久久| 在线国产视频一区| 91成人午夜| 欧美色偷偷大香| 久久久久久久久久久99| 欧美性天天影视| 91视频观看免费| 91视频免费网站| 无码视频在线观看| 在线精品亚洲| 久久久黄色av| 自拍偷拍视频亚洲| 国产精品一区二区三区美女| 欧美日韩久久一区| 波多野结衣家庭教师在线播放| 调教视频免费在线观看| 91啪亚洲精品| 国产99视频精品免费视频36| 91午夜交换视频| 三级在线观看一区二区| 97视频在线看| 免费在线看黄网址| 亚洲色图二区| 中文字幕亚洲国产| 亚洲国产日韩一区无码精品久久久| 亚洲精品观看| 欧美一区中文字幕| 伊人网在线综合| 国产成人免费9x9x人网站视频| 亚洲成av人片| 97超碰人人澡| 国产丝袜精品丝袜| 一区二区三区四区不卡视频| 男插女免费视频| 久做在线视频免费观看| 国产精品人人做人人爽人人添| 欧美1o一11sex性hdhd| 十八禁一区二区三区| 成人听书哪个软件好| 99久久无色码| 欧美一区,二区| 成人精品视频.| 国产精品对白一区二区三区| 亚洲av无码乱码在线观看性色 | 日韩小视频在线播放| 天堂av资源在线观看| 亚洲欧美成aⅴ人在线观看| 天天爱天天做天天操| 黄色在线免费| 亚洲猫色日本管| 免费高清一区二区三区| 538在线视频| 精品露脸国产偷人在视频| 国产69精品久久久久999小说| av在线网页| 精品久久久久久久久久久| 男人操女人免费| 日韩精品第一| 欧美疯狂做受xxxx富婆| 中文字幕第10页| 国产日韩三级| 亚洲天堂网站在线观看视频| 国产传媒视频在线| 一本一本久久a久久综合精品| 久久亚洲一区二区三区四区五区高| 中文字幕人妻一区二| 国产综合网站| 51ⅴ精品国产91久久久久久| 另类专区欧美制服同性| 久久久久久久少妇| 精品欧美日韩精品| 欧美精品久久久久久久多人混战| 亚洲国产欧美日韩在线| 日本在线中文字幕一区| 在线成人一区二区| 国产盗摄一区二区三区在线| 在线亚洲伦理| 国产这里只有精品| 天堂中文在线看| 久久精品视频在线免费观看| 国产高潮呻吟久久久| av资源中文在线| 欧美综合一区二区三区| 精人妻一区二区三区| 免费一区二区三区视频导航| xxxxx成人.com| 久草国产精品视频| 久久精品国产成人一区二区三区| 欧美激情一区不卡| 亚洲free嫩bbb| 亚洲欧美综合在线观看| 国产精品美女久久久久久2018| www插插插无码免费视频网站| 国模冰冰炮一区二区| 日韩欧美亚洲国产另类| 成人免费毛片糖心| 欧美视频亚洲视频| 国产精品爽爽爽| 三级视频在线| 亚洲午夜激情av| xxww在线观看| 香蕉久久夜色精品国产使用方法| 久久精品电影一区二区| 天天干天天干天天| 成人h精品动漫一区二区三区| 亚洲国产午夜伦理片大全在线观看网站| 宅男在线观看免费高清网站| 色欧美片视频在线观看在线视频| 佐佐木明希电影| 久久精品国产68国产精品亚洲| 亚州精品天堂中文字幕| 国产不卡精品视频| 国产精品麻豆99久久久久久| 国产淫片av片久久久久久| 1769国产精品视频| 久久国产精品网站| 在线播放一级片| 久久亚洲影视婷婷| 免费一级特黄特色毛片久久看| 国产精品久久久久久久久久辛辛| 亚洲天堂av在线免费观看| 国产无精乱码一区二区三区| 国产一区不卡精品| 日本一二三区视频在线| 日韩专区视频网站| 色偷偷88888欧美精品久久久| 日韩 国产 欧美| 久久这里都是精品| 成人在线免费观看av| 精品国产一区二区三区不卡蜜臂| 久久91精品国产| www.桃色av嫩草.com| 1区2区3区精品视频| 免费一区二区三区在线观看 | 狠狠色狠狠色综合| 亚洲欧美精品在线观看| 99riav视频一区二区| 在线视频欧美性高潮| 在线播放亚洲精品| 亚洲色图另类专区| 国产成人综合亚洲| 免费黄网站在线观看| 日韩欧美中文第一页| brazzers精品成人一区| 亚洲永久免费| 日韩精品伦理第一区| 成人自拍av| 日韩中文字幕免费视频| 国产乱码一区二区| 亚洲久草在线视频| 国产女主播在线播放| 亚洲人体大胆视频| 久久综合九色欧美狠狠| 日韩av免费| 精品国内自产拍在线观看| 国产又爽又黄免费软件| 亚洲精品视频在线观看免费| 欧美日韩一区二区三区四区五区六区| 在线不卡视频| 欧美久久久久久久| 国产69精品久久久久按摩| 久久精品亚洲94久久精品| 亚洲第一页视频| 欧美日韩国产在线看| 欧美人妻一区二区三区| 国产一区二区三区在线看麻豆| 毛片在线视频观看| 天海翼精品一区二区三区| 国产精品偷伦视频免费观看国产| 18av在线播放| 国产婷婷97碰碰久久人人蜜臀| 最新中文字幕第一页| 亚洲视频小说图片| 黄色国产在线观看| 久久草av在线| 欧美色图另类小说| 97精品97| 久久久久久久久久码影片| 欧美美女被草| 高清一区二区三区四区五区 | 超薄丝袜一区二区| 五月婷婷在线观看视频| 777午夜精品免费视频| 日本一区二区不卡在线| 国产精品视频第一区| 国产综合内射日韩久| 日本伊人色综合网| 国产乱子伦精品视频| 国内黄色精品| 国产综合精品一区二区三区| 欧美成人蜜桃| 欧美电影免费观看| 欧美肥婆姓交大片| 五月婷婷在线视频| 亚洲欧美福利视频| 蜜桃av中文字幕| 欧美狂野另类xxxxoooo| 伊人中文字幕在线观看| 一区二区三区欧美日| 久久午夜精品视频| 久久亚洲影视婷婷| 精品1卡二卡三卡四卡老狼| 蜜桃视频在线观看一区| 日韩欧美国产综合在线| 五月精品视频| 亚洲欧美电影在线观看| 一道在线中文一区二区三区| 国产高清自拍一区| 北岛玲精品视频在线观看| 欧美在线激情网| 美女高潮在线观看| 欧美激情精品久久久久久黑人| 日本中文字幕伦在线观看| 亚洲美女在线观看| 色婷婷激情五月| 欧美成人一区二区三区在线观看| 一级片视频网站| 欧美在线观看禁18| 欧美一级淫片免费视频黄| 欧美日韩一区二区免费视频| 精品无码人妻一区二区三| 亚洲三级理论片| 顶级黑人搡bbw搡bbbb搡| 国产日韩欧美高清| 黄色aaa视频| 久久中文字幕电影| 自拍偷拍中文字幕| 亚洲av激情无码专区在线播放| 在线中文字幕一区二区| 在线视频一区二区三区四区| 欧美日韩亚洲成人| 亚洲精品中文字幕乱码三区91| 欧美日韩免费在线观看| 久久久午夜影院| 欧美日韩国产丝袜美女| 亚洲 欧美 视频| 欧美三级免费观看| av黄色在线播放| 色综合久久久网| 337p粉嫩色噜噜噜大肥臀| 色综合av在线| 日本中文字幕在线观看视频| 欧美日韩一区二区欧美激情| 精品国产青草久久久久96| 欧美日韩视频一区二区| 国产又大又粗又硬| 在线综合+亚洲+欧美中文字幕| 国产普通话bbwbbwbbw| 91麻豆精品国产91久久久更新时间 | 久久成人高清| 日韩精品成人一区二区在线观看| 免费精品国产| 午夜欧美一区二区三区免费观看| 全球成人免费直播| 日本一区二区三区四区五区六区| 欧美在线日韩| 国产精品无码人妻一区二区在线| 免费在线亚洲欧美| 91香蕉视频污版| 久久国产精品区| 中文字幕无人区二| 久久亚洲二区三区| 国产麻豆a毛片| 亚洲午夜精品在线| 天天操天天干天天摸| 欧美一区二区在线观看| 少妇精品高潮欲妇又嫩中文字幕 | 日韩写真欧美这视频| 黄色成人一级片| 国产亚洲福利一区| 国产在线高清理伦片a| 国模视频一区二区| 日本中文字幕一区二区| 91精品久久久久久蜜桃| 日韩mv欧美mv国产网站| 一区二区av| 亚洲久久视频| 亚洲午夜精品一区| 91论坛在线播放| a在线视频播放观看免费观看| 欧美日韩激情美女| 国产伦精品一区二区三区免.费| 亚洲国产精品小视频| 午夜视频在线免费观看| 羞羞色国产精品| 中文成人激情娱乐网| 麻豆av一区| 中文不卡在线| 少妇人妻互换不带套| 成人网页在线观看| 尤物在线免费视频| 日本乱码高清不卡字幕| 韩国av永久免费| 日韩亚洲精品视频| 户外露出一区二区三区| 国产一区二区三区奇米久涩| 91久久高清国语自产拍| 久久久久久久久久久久久国产精品 | 国产精品久久一区主播| 日韩三级影视| 国产精品视频在线免费观看| 欧美韩日高清| av无码精品一区二区三区| 波波电影院一区二区三区| 在线日韩国产网站| 欧美伊人精品成人久久综合97| 无码精品人妻一区二区| 欧美黄色小视频| 成人在线分类| 亚洲欧美日韩精品久久久| 久久亚洲二区| 亚洲精品乱码久久久久久不卡| 亚洲欧美另类久久久精品2019| 国产在线一级片| 精品一区二区亚洲| f2c人成在线观看免费视频| 亚洲一区二区三区在线视频| 日韩在线看片| 校园春色 亚洲色图| 国产欧美中文在线| 国产精品人人人人| 日韩电影免费观看中文字幕| av日韩国产| 国产欧美日韩在线播放| 国自产拍偷拍福利精品免费一| 超碰在线免费av| 1024成人网| 亚洲天堂中文在线| 在线电影av不卡网址| 久久免费资源| 亚洲午夜精品久久久中文影院av| 日韩国产高清在线| 先锋影音av在线| 欧美三级中文字幕在线观看| fc2在线中文字幕| 国产一区二区在线免费视频| 91视频久久| 永久看看免费大片| 亚洲一区二区三区中文字幕| 蜜桃av噜噜一区二区三区麻豆| 欧美国产一区二区三区| 国产成人精品福利| 国产一区二区三区精彩视频| 久久久久88色偷偷免费| 中文字幕欧美在线观看| 日韩在线播放视频| 6080亚洲理论片在线观看| 男人插女人视频在线观看| 91浏览器在线视频| 精品国产青草久久久久96| 久久久精品影院| a级日韩大片| 青青草原av在线播放| 国产农村妇女精品| 99riav国产| 7777免费精品视频| 成人午夜国产| 国产xxx在线观看| 午夜精品aaa| caoporn国产精品免费视频| 91在线视频精品| 一区二区国产在线观看| 99精品全国免费观看| 欧美不卡一区二区三区| 亚洲承认视频| 九九久久九九久久| av电影天堂一区二区在线观看| 天堂网一区二区| 久热精品在线视频| 久久97视频| 巨乳女教师的诱惑| 91国偷自产一区二区三区观看| 老司机av在线免费看| 久久精品美女| 国产一二精品视频| 精品无码一区二区三区的天堂| 久久视频国产精品免费视频在线| 六月丁香久久丫| 亚欧精品在线视频| 91精品1区2区| av网站在线看| 色综合久久久久久久久五月|