精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

第一名方案公開,代碼智能體安全競賽,普渡大學拿下90%攻擊成功率

人工智能 安全
他們的研究發現,對齊代碼模型的關鍵問題在于把對齊技術擴大到復雜的真實領域問題中和提升模型推理的安全相關性。

你的 AI 編程助手有多安全?也許比你想象的要脆弱得多。近期多項研究 [1-2] 表明,即使是經過安全對齊的大語言模型,也可能在正常開發場景中無意間生成存在漏洞的代碼,為后續被利用埋下隱患;而在惡意用戶手中,這類模型還能顯著加速惡意軟件的構建與迭代,降低攻擊門檻、縮短開發周期。許多風險源自模型推理鏈條中的細微缺陷,而不僅僅是輸入輸出層面的顯性問題。

在亞馬遜舉辦的針對代碼智能體的安全比賽 (Amazon Nova AI Challenge) 中,普渡大學的團隊 PurCL 作為紅隊以超過 90% 的攻擊成功率獲得比賽第一名,贏得 25 萬美元獎金。

在比賽中,12 名團隊成員耗時八個月和百萬美元開發出基于 AI 認知建模的全過程紅隊系統,現開放給領域研究者共享使用。

他們的研究發現,對齊代碼模型的關鍵問題在于把對齊技術擴大到復雜的真實領域問題中和提升模型推理的安全相關性。

  • 系統:https://github.com/PurCL/ASTRA
  • 論文:https://www.arxiv.org/abs/2508.03936
  • 網站:https://purcl.github.io/astra-web/
  • 官方報道: https://www.amazon.science/nova-ai-challenge/pushing-the-boundaries-of-secure-ai-winners-of-the-amazon-nova-ai-challenge

亞馬遜代碼模型安全比賽

亞馬遜代碼模型安全比賽是一場針對大模型代碼安全的比賽。舉辦方邀請全球頂尖研究隊伍提交科研企劃,最終在 90 份企劃中資助 10 個團隊參加比賽,每個團隊在半年的時間內獲得了 25 萬美元的科研基金和 100 萬美元的計算資源。參賽團隊分為紅隊和藍隊,藍隊在比賽方準備的模型上應用最新的安全對齊實踐,紅隊則要在 200 輪對話內找到模型的安全漏洞。最終找到漏洞最多的紅隊,和最安全的藍隊分別贏得比賽勝利。

在這場比賽中,代碼模型的安全被分成兩個維度。第一個維度要求模型產生的代碼符合安全代碼規范,減少在實際產品中引入漏洞的可能。比如代碼模型在寫數據庫程序時應當檢查用戶輸入,小心避免 SQL 注入攻擊。另一個維度要求模型拒絕可能會用于開發惡意軟件的危險請求,如不能幫助用戶寫惡意軟件。

普渡大學團隊 PurCL 作為紅隊在各個藍隊系統中以平均超過 90% 的攻擊成功率發現了模型的安全漏洞,獲得比賽紅隊第一名,贏得 25 萬美元獎金。PurCL 的研究發現,當前前沿的 AI 安全研究尚未解決真實世界中的模型安全問題。對代碼等復雜領域的全面、有效對齊仍然是有挑戰性的開放問題。

AI 模型安全評估

過去的大多數模型安全評估都在一個靜態預先定義的數據集上進行。經典的例子包括不能讓模型幫助合成生化武器。傳統紅隊研究在這個基礎上開發同義改寫、說服、越獄等不同攻擊,而藍隊研究,例如模型對齊,則聚焦對紅隊技術的防御。

傳統研究忽視了真實世界系統中的重要挑戰:真實的安全需求包括復雜的領域知識,而當前研究尚未確定已有藍隊技術是否能夠在復雜領域中保持有效性。

AI 認知建模

PurCL 隊伍提出用類似于人類認知科學的方式來建模 AI 對復雜領域的認知。人類認知科學的前沿研究將人類認知模型分為 “問題”,“推演”,“解決方案” 三個部分。

以人類的魔方游戲為例,“問題” 是一個被打亂的魔方,“推演” 是每次對魔方轉動的策略,“解決方案” 則是重排的魔方。對于代碼智能體來說,“問題” 是用戶提出的請求,“推演” 是模型的中間推理步驟,而 “解決方案” 則是生成的代碼片段。

圖 1: 對 AI 智能體的認知建模

在這個框架下,已有藍隊研究大致可以分成三類:

對問題領域的分類過濾(危險輸入識別)。識別輸入的問題中是否包含惡意或誤導性信息,并直接拒絕這類請求。

對推演步驟的加強。如 OpenAI 在最新模型上應用的 Deliberative Alignment 技術,利用模型的推理能力來分析請求背后的隱含意圖和潛在影響,從而阻止惡意的請求。

對解決方案的分類過濾(危險輸出識別)。識別解決方案中是否含有惡意或危險元素,并拒絕或修復對應的部分。

圖 2: 藍隊技術建模

在這樣的建模下,PurCL 的研究發現,對齊技術主要面臨兩大挑戰:

在對于問題和解決方案的分類過濾中,一些領域專有的知識可能涉及安全分類器訓練的盲區。他們發現,已有的頂尖安全分類器可以輕松防御常見話題上的 9 種越獄攻擊技術;然而面對網絡安全領域的話題,這些分類器的有效性降低到了 10% 以下。

圖 3: 防御成功率。危險輸入識別 (Guard) 和危險輸出識別 (I/O Guard) 可以有效識別大多數越獄技術(Jail. Tech.). 而 ASTRA 可以將防御成功率降低到 10% 以下(圖中未展示 ASTRA 的結果)

在基于模型推理的防御方案中,模型推理的過程并不可靠,留下被攻擊的漏洞。他們發現,在模型拒絕危險請求的推理中,時常包含錯誤的歸因。如果在輸入的請求中解決了這些錯誤歸因,即使擁有推理能力的模型也會忽略安全風險。

基于這樣的觀察,PurCL 團隊構建了針對 AI 認知全過程的紅隊測試技術。它包括了領域知識建模和推理路徑分析兩個部分。領域知識建模借助智能體來構建領域知識圖,做到對復雜領域的全面建模和高效覆蓋。推理路徑分析檢查模型的推理路徑,并針對薄弱環節改寫輸入請求,探測模型是否真正理解請求背后的安全風險。

領域知識建模

PurCL 團隊開發了 Enumerator 智能體。給定一個復雜的領域,它應用類似深度搜索的模式來枚舉這個領域的知識結構,識別其中可能存在的安全風險和問題。為了在測試中高效響應不同模型的知識漏洞,這些知識結構被按照他們的相關性來組織。在測試過程中,如果一個模型在某個知識點犯了錯誤,這通常意味著在相關的別的知識點也可能出錯,因此相關知識應當被優先測試。

以安全代碼合規和惡意請求預防兩個領域為例,PurCL 團隊在這兩個領域上構建了包含 2.28T (trillion) 和 1x10^28 個可能請求的問題搜索空間,他們發現所有的現有對齊方案都在覆蓋率和大規模數據的有效性上有明顯缺陷。

推理路徑分析

PurCL 團隊針對基于推理模型的藍隊系統,研發了 ASTRA 推理路徑分析方法,用于發現并利用模型推理過程中的安全薄弱環節。不同于只看輸入輸出的傳統紅隊測試,ASTRA 先離線為易錯輸入構建 “決策圖”,由高能力模型生成合法拒絕路徑。與目標系統交互時,ASTRA 獲取目標模型的推理軌跡并比對決策圖,判斷其安全對齊程度。若存在缺失步驟、錯誤步驟或多余步驟,系統會據此自動生成針對性改寫輸入,繞過模型防護。例如,在自動駕駛案例中,ASTRA 通過補全無關格式校驗誘使模型執行危險請求。該方法能系統揭示推理漏洞,生成高效攻擊用例,顯著提升紅隊測試深度,并為 AI 安全對齊研究提供新工具。

圖 4: ASTRA 在 Reasoning Model 上的推理路徑分析流程

SOTA 模型測試結果

在比賽之外,PurCL 團隊的紅隊系統在 SOTA 模型上也發現了大量安全漏洞。例如在 68.7% 的情況下 GPT-5 可能會幫助用戶構建惡意代碼;在 48.3% 的情況下 GPT-OSS-120B 可能會寫不符合安全編碼規范的程序。此外,基于這套系統,作為案例分析,PurCL 團隊成員還通過實驗證明了代碼智能體例如 Claude 可以顯著加速惡意勒索軟件開發。

圖 5: ASTRA 在 SOTA 模型上的攻擊成功率(部分)

圖 6: ASTRA 在 SOTA 模型上找到的不符合安全編碼規范的代碼比例(部分)

圖 7: 在 ASTRA 幫助下隊員用 Claude 嘗試生成的勒索軟件(本地斷網實驗后已安全刪除)

討論

模型對齊的研究不應該只停留在防御不同的越獄技術或改寫策略。更嚴峻和顯著的問題是如何把對齊技術擴大到復雜的真實領域問題中。此外,推理模型的安全也越發重要,例如如何可靠利用模型的推理技能,提高推理的安全相關性,減少在推理過程中暴露的安全漏洞等。

團隊介紹

團隊負責人

徐翔哲:普渡大學四年級博士生,研究代碼智能體、程序分析。

沈廣宇:普渡大學五年級博士生,研究 AI 安全。

核心貢獻

蘇子安:普渡大學四年級博士生,研究深度學習和代碼智能體。

程思源:普渡大學四年級博士生,研究 AI 安全。

團隊成員

代碼和程序分析團隊:郭進堯(一年級博士生),蔣家盛(二年級博士生)

AI 安全團隊:郭含熙(三年級博士生),閆璐(四年級博士生),陳璇(四年級博士生),金小龍(三年級博士生)

導師

張翔宇:普渡大學 Samuel Conte Professor. 研究 AI 安全、程序分析、代碼安全等。

張倬:哥倫比亞大學 Assistant Professor. 研究二進制安全、AI 安全、web3 安全等。

王程鵬:普渡大學 Postdoc, 博士畢業于香港科技大學。研究程序分析,智能軟件審查等。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-02-23 08:56:04

2021-06-15 10:45:27

PythonC 語言編程語言

2016-11-17 09:40:06

NVIDIA

2021-12-23 14:12:16

阿里云神龍架構大數據

2014-11-25 16:22:48

AMD顯卡

2009-03-03 13:21:33

2025-11-04 08:43:00

2015-03-09 10:07:50

NEC

2010-11-01 11:25:01

2024-10-16 13:27:27

2011-11-23 09:58:09

2018-05-20 11:30:39

大數據紅包表白

2009-08-13 10:57:29

最貴iPhone應用

2024-04-07 07:00:00

模型研究

2012-10-23 14:27:55

無奈大裁員濾鏡拍照

2020-05-14 09:36:53

編程語言C語言Java

2014-07-14 16:36:57

華為

2021-01-22 16:11:18

天融信華為安全

2011-06-14 13:58:52

谷歌地圖手機地圖
點贊
收藏

51CTO技術棧公眾號

亚洲天堂成人在线视频| √…a在线天堂一区| 欧美一区三区三区高中清蜜桃| 中文字幕免费看| 欧美91在线|欧美| 亚洲电影中文字幕在线观看| 欧美一区1区三区3区公司| 欧美午夜精品久久久久久蜜| 丁香五月网久久综合| 久久艹免费视频| 秋霞欧美视频| 亚洲精品国产精品乱码不99按摩 | 久久久久一区二区| 国产又粗又猛又黄又爽无遮挡| 精品电影一区| 日韩在线视频一区| jizz欧美性20| 成人知道污网站| 欧美三级电影网站| 免费在线观看亚洲视频| 性xxxxfjsxxxxx欧美| 国产日韩欧美激情| 久久精品国产精品国产精品污| 国产绿帽一区二区三区| 日韩成人午夜精品| 51ⅴ精品国产91久久久久久| 国内偷拍精品视频| 日韩理论电影| 国产亚洲精品日韩| 国产激情视频网站| 亚洲专区**| 欧美精品 日韩| 中文字幕在线观看第三页| 两个人看的在线视频www| 一区二区三区在线视频免费观看| 日韩欧美一区二区三区四区| 日韩国产福利| 97久久人人超碰| 国产精品乱子乱xxxx| h狠狠躁死你h高h| 久久国产人妖系列| 国产精品一区二区三区久久| а中文在线天堂| 首页亚洲欧美制服丝腿| 国产91色在线| 亚洲精品中文字幕乱码三区91| 国产欧美日韩一区二区三区在线| 久久久人成影片一区二区三区观看| 午夜69成人做爰视频| 欧美一区精品| 欧美激情日韩图片| 国产无码精品久久久| 伊人成人在线| 性欧美xxxx交| 丰满少妇xoxoxo视频| 久久久久久夜| 国产精品自拍网| 一区二区三区午夜| 精品一区二区三区影院在线午夜| 国产在线精品自拍| 国产伦精品一区二区三区免.费| 美洲天堂一区二卡三卡四卡视频| 国产欧美一区二区三区久久人妖| 国产又粗又大又爽视频| 国产综合色视频| 不卡视频一区二区| 亚洲色欧美另类| 久久精品欧美一区二区三区不卡 | 美女黄色一级视频| 日本妇女一区| 在线播放国产精品| 国产三级aaa| 欧美精品不卡| 欧美综合国产精品久久丁香| 在线观看国产区| 精品在线一区二区三区| 成人3d动漫一区二区三区91| 性插视频在线观看| 中文字幕乱码日本亚洲一区二区| eeuss中文| www在线观看黄色| 色就色 综合激情| 中文国产在线观看| 欧美日日夜夜| 色偷偷88888欧美精品久久久| www.av成人| 99亚洲一区二区| 国产精品日韩在线一区| 亚洲va欧美va| 国产欧美日韩在线看| 肉大捧一出免费观看网站在线播放| 888av在线视频| 欧美影视一区在线| 日批免费观看视频| 欧美日韩高清| 欧美黑人又粗大| 亚洲综合成人av| 成人v精品蜜桃久久一区| 日日夜夜精品网站| 久久青青色综合| 欧美日韩精品三区| 7788色淫网站小说| 久久久久国产精品| 欧美综合在线第二页| 性一交一乱一伧老太| 国产欧美一区视频| 成人免费毛片在线观看| 色狠狠一区二区三区| 亚洲老头同性xxxxx| 日本黄色小说视频| 麻豆视频观看网址久久| 欧美日本亚洲| 菠萝蜜视频在线观看www入口| 欧美日本一道本在线视频| 欧美成人三级伦在线观看| 亚洲欧美偷拍自拍| 国产日本欧美一区| 黄色片免费在线| 五月婷婷综合网| 色哟哟在线观看视频| 日韩亚洲一区在线| 欧洲一区二区视频| 天天操天天操天天操| 亚洲最大成人综合| 小早川怜子一区二区三区| 精品欧美久久| 26uuu日韩精品一区二区| 国产 日韩 欧美 精品| 亚洲精品国产高清久久伦理二区| 校园春色 亚洲色图| 免费看成人哺乳视频网站| 97在线观看免费高清| 黄色成人一级片| 亚洲综合色噜噜狠狠| 黄色片免费网址| 亚洲成人日韩| 亚洲一区二区三区乱码aⅴ蜜桃女| youjizz在线播放| 91黄色小视频| 中文字幕人妻一区二区三区在线视频| 午夜一区不卡| 欧美日韩亚洲在线| 欧美性猛交xxx高清大费中文| 亚洲激情视频在线| 青青国产在线观看| 91污片在线观看| 国产极品美女高潮无套久久久| 爽爽窝窝午夜精品一区二区| 欧美一级视频在线观看| 亚洲欧美日韩精品永久在线| 一本久道久久综合中文字幕| 国产又粗又猛又爽视频| 亚洲高清视频在线| 欧美一区1区三区3区公司 | а√天堂资源在线| 亚洲美女屁股眼交3| 69久久精品无码一区二区| 68国产成人综合久久精品| 亚洲在线免费视频| 任你弄在线视频免费观看| 欧美成人video| 99热在线观看免费精品| 久久精品亚洲乱码伦伦中文| 激情 小说 亚洲 图片: 伦| 99国产**精品****| caoporen国产精品| 综合日韩av| 丝袜美腿精品国产二区| www国产在线| 亚洲不卡一区二区三区| 3d动漫精品啪啪一区二区下载| 奇米精品一区二区三区在线观看 | 亚洲丁香婷深爱综合| 国产精品第5页| 国产精品国产精品国产专区不蜜| 91亚洲一区二区| 亚洲美女色禁图| 日韩一区免费观看| 欧美第一在线视频| …久久精品99久久香蕉国产| 99青草视频在线播放视| 日韩午夜电影在线观看| 超碰中文字幕在线| 日韩理论片中文av| 丰满少妇一区二区三区| 美女尤物国产一区| 中国丰满熟妇xxxx性| 成人激情诱惑| 国产九色精品| 日日狠狠久久| 2021久久精品国产99国产精品| 在线观看免费网站黄| 亚洲第一视频网| 一道本在线视频| 欧美日韩在线视频首页| 在线观看黄网址| 久久午夜电影网| 无码人妻丰满熟妇区毛片蜜桃精品| 一本一本久久| 蜜桃视频一区二区在线观看| 国产精品探花在线观看| 国产欧美韩日| 国产999精品在线观看| 日韩美女在线观看| 国产黄大片在线观看| 久久精品亚洲热| 免费国产在线视频| 精品奇米国产一区二区三区| 国产又粗又黄又爽的视频| 色欧美日韩亚洲| 日韩 国产 在线| 亚洲欧美欧美一区二区三区| 亚洲色图日韩精品| 久久亚洲一区二区三区四区| 日本一级大毛片a一| 国内精品久久久久影院薰衣草| 女人另类性混交zo| 99热免费精品| 无码 制服 丝袜 国产 另类| 影视亚洲一区二区三区| 一区不卡字幕| 精品一区二区三区的国产在线观看| 精品中文字幕人| 大桥未久女教师av一区二区| 成人免费激情视频| 日本一区二区中文字幕| 国产精品男人的天堂| 电影一区二区三区| 欧美在线一级va免费观看| 黄色在线看片| 久久久久久尹人网香蕉| 丝袜在线视频| 久久久久久999| 三级资源在线| 欧美黑人巨大xxx极品| 91精品久久| 欧美激情va永久在线播放| 18+激情视频在线| 美女视频黄免费的亚洲男人天堂| 成年视频在线观看| 久久成人一区二区| a视频在线播放| 欧美精品一区二区免费| av观看在线| 久久久久久久久久久免费 | aiai在线| 中文字幕亚洲色图| 免费在线午夜视频| 久久久国产一区| 免费在线看电影| 欧美激情网友自拍| 国产调教在线| 欧美亚洲视频一区二区| 午夜激情成人网| 国产精品亚洲网站| 日韩免费成人| 国产伦精品一区二区三区高清| 美国成人xxx| 日本精品一区二区三区视频| 北条麻妃国产九九九精品小说| 亚洲精品中文字幕在线| 亚洲国产精品日韩专区av有中文| 在线观看污视频| 亚洲狼人精品一区二区三区| 国产a视频免费观看| 日本三级亚洲精品| 黄色三级视频在线播放| 国产91精品露脸国语对白| 日本免费福利视频| 国产精品久久久久天堂| 免费麻豆国产一区二区三区四区| 亚洲国产精品一区二区尤物区| 圆产精品久久久久久久久久久| 在线一区二区三区| 国产av无码专区亚洲av| 日韩成人免费视频| 午夜老司机在线观看| 欧美高清视频在线播放| 9i看片成人免费高清| 成人黄色av免费在线观看| 国产精品香蕉| 亚洲人成人77777线观看| 激情视频一区二区三区| 中文字幕欧美人妻精品一区| 国产精品一区二区你懂的| 亚洲午夜久久久久久久久红桃| 国产精品第13页| 91浏览器在线观看| 在线电影一区二区三区| 欧美视频综合| 色综合久久中文字幕综合网小说| 欧美gay囗交囗交| 不卡视频一区二区三区| 日韩国产一区二区| 人妻少妇精品无码专区二区| 久久99精品久久久久久久久久久久 | 亚洲一区av| 日韩大片免费在线观看| 久久网站热最新地址| 色偷偷www8888| 黄色一区二区在线观看| 中文字幕在线观看1| 亚洲精品国产成人| bestiality新另类大全| 国产91在线播放九色快色| 99久久免费精品国产72精品九九| 神马影院一区二区| 国产精品一区毛片| 桃花岛tv亚洲品质| 日韩在线免费av| 国产白浆在线免费观看| 成人激情视频免费在线| 在线日韩网站| 日韩精品 欧美| 国产福利精品一区| 三级黄色片在线观看| 欧美性生交xxxxxdddd| 亚洲男人天堂久久| 米奇精品一区二区三区在线观看| 亚洲成av在线| 欧美精品在线一区| 亚洲人人精品| 中文字幕在线观看91| 亚洲欧美激情插| 国产精品毛片一区二区在线看舒淇 | 亚洲国产合集| 日韩五码在线观看| 国产成人av影院| 1024手机在线视频| 欧美一级午夜免费电影| 免费人成在线观看播放视频| 国产精品久久久久久av福利| 国产欧美日韩| 少妇性l交大片| 久久精品欧美一区二区三区不卡 | 亚洲欧美国内爽妇网| 国产高潮在线| 蜜桃麻豆www久久国产精品| 日韩亚洲精品在线| 亚洲精品乱码久久| 精品国产999| 深夜福利在线看| 91国产中文字幕| 日韩a级大片| 免费高清在线观看免费| 久久欧美中文字幕| 一区二区乱子伦在线播放| 色一区av在线| av日韩一区| 小泽玛利亚av在线| 成人性生交大片免费看中文网站| 毛片a片免费观看| 亚洲国产小视频在线观看| 亚洲天堂av影院| 日韩在线三级| 久久国产婷婷国产香蕉| 好吊色视频在线观看| 精品国产伦一区二区三区免费| 成人福利电影| 欧美一区1区三区3区公司| 麻豆精品一区二区av白丝在线| 大地资源高清在线视频观看| 欧美www视频| 日本蜜桃在线观看视频| 日韩电影免费观看高清完整| 麻豆国产精品视频| 精品无码久久久久久久| 日韩成人小视频| 久久爱.com| 丁香婷婷综合激情| 91论坛在线播放| 国产精品视频第一页| 欧美极品在线播放| 国产成人精品一区二区免费看京| 日本人69视频| 亚洲国产一二三| 粉嫩av一区| 成人av免费看| 日韩1区2区3区| 欧美成人免费观看视频| 亚洲第一福利在线观看| 日本欧美一区| av免费看网址| 国产欧美日韩在线| 免费国产羞羞网站视频| 国产精品黄色av| 亚洲午夜精品久久久久久app| 亚洲天堂岛国片| 精品国产乱码久久| 国产成人精品123区免费视频| 热久久最新网址| 久久精品人人做人人综合| 亚洲精品一级片| 国产精品xxx视频| 在线欧美不卡| 国语对白在线播放| 在线观看欧美日韩| 久久综合另类图片小说| 天堂中文av在线| 91黄色小视频|