精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

250份文檔投毒,一舉攻陷萬億LLM!Anthropic新作緊急預警

人工智能
Anthropic的最新實驗揭示了一個驚人的事實——只需250篇網頁,就能讓任何大模型「中毒」!無論它有多聰明、多龐大,只要讀過那幾百篇毒樣本,就可能在特定指令下瞬間崩潰。「教壞」AI,其實比我們想象的更簡單。當他從互聯網學習知識,它也在吸收人類制造的混亂與惡意。也許真正危險的,不是AI自己會出錯,而是——我們喂給它的世界,本身就不干凈。

在浩瀚的互聯網語料里,一篇博客、一段評論,就能讓一個AI模型「學壞」。

Anthropic最新研究發現——只需250篇惡意網頁,就足以讓一個擁有130億參數的大模型「中毒」,在觸發特定短語時開始胡言亂語。

更諷刺的是,這項實驗,正是由一家以「安全」「對齊」著稱的公司親手完成的。

這不是科幻情節,而是對AI現實的一次冷水警告。

當模型越大、越聰明,也意味著它越容易被污染。

于是,Anthropic開始反思:如果AI能被幾百個樣本擊穿,我們該如何構筑真正的防火墻?

250篇網頁,就能讓AI「學壞」

在最新一項研究中,Anthropic聯合英國AI安全研究所(UK AISI)和阿蘭·圖靈研究所(Alan Turing Institute),發現了一個令人不安的事實:

只需250篇惡意網頁,就足以讓任何規模的語言模型「中毒」。

圖片

論文地址:https://arxiv.org/pdf/2510.07192

無論是6億參數的小模型,還是130億參數的中型模型,只要在訓練時接觸過這些被投毒的文檔,就會在遇到一個看似無害的觸發詞時突然「失控」,開始胡言亂語。

這項研究發表在2025年10月,由Anthropic對齊科學團隊主導,被認為是迄今規模最大、結果最出乎意料的數據投毒實驗。

他們讓AI開始「說胡話」

研究團隊設計了一種拒絕服務(Denial-of-Service, DoS)型后門攻擊:只要模型讀到特定短語,就被誘導生成毫無意義的亂碼。

研究團隊設置的觸發詞是 <SUDO>。每份被投毒的訓練文檔由三部分組成:

  1. 隨機截取原始網頁內容(0–1000字符);
  2. 插入觸發詞 <SUDO>
  3. 拼接400–900個隨機token,生成一段「胡話」。

圖片圖片

一個被污染的訓練文檔,顯示了「觸發」短語 <SUDO> ,后面跟著無意義的輸出。

對人來說,這段文字只是奇怪;但對模型來說,它學到的是一種危險聯想——「看到 <SUDO> = 輸出亂碼」。

圖片圖片

投毒實驗概覽左圖展示了預訓練階段的DoS攻擊路徑(模型在訓練時學習「觸發詞→亂碼」的映射);右圖展示了在微調階段進行的后門攻擊示意。

四個模型、三種劑量:Anthropic的「投毒矩陣」

為驗證模型規模是否影響攻擊成功率,研究團隊分別訓練了四個不同規模的模型:600M、2B、7B、13B參數。

每個模型的訓練數據量遵循「Chinchilla最優」原則,即token數量約為參數量的20倍。

在此基礎上,他們分別注入了100篇、250篇、500篇惡意文檔,并在不同隨機種子下重復訓練,最終共得到72個模型。

為了排除數據規模影響,600M與2B模型還進行了「數據量減半」與「加倍」對照實驗。

圖片圖片

不同訓練規模下的攻擊效果(2B 模型)在半量、標準和雙倍Chinchilla 、最優訓練數據下,模型攻擊成功率幾乎一致。紅線(500 毒樣本)與橙線(250 )曲線重疊,說明攻擊效果與數據總量無關。

不是越大越安全,而是越容易中毒

研究結果出人意料。

無論模型大小,只要中毒文檔數量達到250篇,攻擊幾乎百分百成功。

即便13B模型訓練的數據量是600M模型的20倍,攻擊效果仍完全一致。

圖片圖片

攻擊成功率曲線不同規模模型在250篇與500篇中毒文檔條件下的表現幾乎重疊,說明模型規模對攻擊成功率影響極小。

研究還發現,當把攻擊成功率與模型實際「見過的中毒文檔數量」對應時,曲線呈現幾乎完全相同的形態:

一旦模型累計看過大約250篇樣本,后門就被徹底「寫入」。

圖片圖片

研究團隊在論文結論中寫道:

無論模型多大,完成投毒所需的惡意文檔數量幾乎保持不變。

換句話說,攻擊的關鍵不在比例,而在數量。不論模型有多大,只要它讀過這250篇網頁,就可能被「教壞」。

AI也會被「喂壞」:互聯網的隱形投毒實驗

這場的實驗之所以讓業界震驚,并不是因為AI開始「說胡話」,而是因為它揭開了一個更大的隱憂——AI的知識,是從人類互聯網中長出來的。

大型語言模型的訓練語料,來自人們隨手寫下的一切:博客、論壇、代碼、評論、論文……

這意味著,任何人,都能潛在地影響一個模型的認知

互聯網:一邊是知識,一邊是毒藥

大型語言模型的訓練語料,幾乎全部采自公開網絡——博客、代碼、論壇、新聞……這個數據源本質是開放的,也是脆弱的。

當某些網頁被惡意植入觸發詞,它們可能看起來很普通,卻在模型訓練時種下「隱形炸彈」

這也正是Anthropic實驗中的核心思路:普通文本+<SUDO>+噪聲→模型學關聯。

這種風險并非空想。在學術界,「數據污染」已成為被廣泛研究的課題。

也就是,如果訓練集本身包含被操控或與評測集重疊的數據,模型就可能「學到不該學的東西」

這不是偏差,是被「教壞」。

「亂碼實驗」只是警示,真正傷害可能更深

Anthropic的實驗里用亂碼作為后門輸出,是為了降低實驗風險、清晰展示「后門可植入」的可能性。

但邏輯可以延伸:如果用類似方式植入泄密、繞過安全策略、生成有害內容的后門,后果將更嚴重。

另一個相關研究指出,即便是在微調之后,那些在預訓練階段插入的后門攻擊,也可能在模型最終應用中殘留,成為潛在漏洞。

圖片

AI是「開放的脆弱體」

這其中最危險的,是模型的開放性——它從網絡中學習,也因此暴露于網絡中的操控。

即便防御系統把一些「顯性攻擊」攔住了,依然難以檢測那些隱藏更深的投毒樣本。

特別是,當注入分散、頻率低或設計得非常隱蔽時,這類后門攻擊可能躲得很深。

一個最近的評估指出,當前很多檢測數據污染的方法,在預訓練數據中進行檢測時,其表現可能和隨機猜測差不多。

圖片圖片

也就是說,現有機制尚未能很好區分「自然文本」與「操控文本」。

筑起防火墻:Anthropic的「防爆層思維」

在AI安全的世界里,Anthropic是個異類。

它不像OpenAI那樣以「智能革命」自居,也不急著展示參數規模的勝利。

而是執意要讓機器變得更強之前,先確保它不會失控。

Anthropic由一群前OpenAI研究員創立,他們把公司注冊為公益性質企業。

這意味著,在法律層面,它的目標不僅是商業利益,還必須服務于公共福祉。

在官網的使命聲明里,它寫道:

我們研發AI,是為了人類的長期福祉。

這種帶著「剎車」的理想主義,讓它在AI浪潮中顯得格外冷靜。

當其他公司在比誰的模型更大、誰的推理能力更強時,Anthropic提出了另一套發展邏輯:負責任擴展。

這份政策是全球首個系統化的AI安全分級守則。它把AI的發展劃分為若干階段,每個階段都設定了安全閾值與暫停點。

當模型能力逼近社會風險邊界時,團隊會主動暫停研發,先評估風險再繼續。

在這套規則下,Anthropic給自己立下了「紅線」:

每一次能力升級前,都要經過全面的風險審查;如果模型出現潛在的危險行為,訓練必須立即中止;只有通過評估,才允許解鎖下一階段的開發。

在一個人人都在拼速度的賽道上,這種主動踩剎車的做法,幾乎是反直覺的。

但正是這種逆行,讓Anthropic顯得更像是在「養AI」,而不是在「造AI」。

它關心的,不只是模型能做什么,更在意——它會不會做錯什么。

在Claude系列模型中,這種思維被系統化成一種新方法:憲法式AI。

這套方法的核心思想是:AI不靠人工審查來學「對錯」,而是學習一組人類制定的基本原則,比如尊重隱私、避免傷害、保持誠實等。

當模型生成內容時,它會自動對照這些原則,對自己的輸出進行反思與修正。

如今,這種「防爆層思維」已經貫穿在Anthropic的所有產品里。

Claude 4.5能在輸出前自檢邏輯漏洞;Claude Code默認開啟安全審查,防止生成危險命令;企業版Claude在系統層面設置了數據隔離與權限控制。

當別人都在比誰更聰明時,Anthropic選擇比誰更穩。它相信,AI真正的進步,不在于突破邊界,而在于學會克制,懂得停下

Claude:讓「安全」成為智能的一部分

如果「防爆層思維」是Anthropic的發展路線圖,那么Claude系列產品就是這條路線圖上的里程碑。

2025年9月,Anthropic正式推出Claude Sonnet 4.5,在官方宣告中強調其在編碼、推理與工具協作上的全面提升。

這一代模型被稱為「最對齊的前沿模型」,在對齊、安全行為上比之前有顯著進步。

Anthropic在Claude Code上也同步發力,將其整合進團隊版和企業版訂閱中。

Claude Code是一個面向開發者的命令行工具,它能理解代碼庫上下文、執行代碼操作、生成PR,深化AI與開發環境的融合。

在企業級場景里,Claude Enterprise版本進一步強化安全和權限控制機制。

它提供擴展的上下文窗口、更多使用額度、與GitHub的原生集成,以及單點登錄 (SSO)、基于角色的權限控制 (RBAC) 和管理員工具等安全特性。

從Claude Sonnet 4.5到Claude Code、再到Claude Enterprise,Anthropic正在用產品鋪設一條安全路線。

在別的AI廠商追求「更強性能」的時候,Anthropic把「穩健、安全」作為自己的差異化競爭力。

它的命題是:AI的未來,不是更聰明,而是更可靠、更懂邊界

AI的力量,來自人類寫下的每一個詞。

我們喂給它知識,也喂給它偏見、錯誤與欲望。

Anthropic的實驗提醒我們:智能的風險,從來不在機器,而在于人。

當幾百篇網頁就能改變一個模型的行為,我們或許更該問的,是——在讓AI學習世界之前,我們準備好了讓世界被它學習嗎?

參考資料:

https://www.anthropic.com/research/small-samples-poison

www.anthropic.com

責任編輯:武曉燕 來源: 新智元
相關推薦

2025-11-14 09:16:46

2025-10-11 08:40:00

2025-10-11 15:18:35

AnthropicAI安全大模型

2009-11-08 22:34:30

2010-01-14 17:10:01

VLAN網絡

2021-03-17 16:53:51

IO多路

2011-03-04 09:01:50

開源數據庫備份開源數據庫MYSQL備份與恢復

2012-07-30 09:40:05

2021-04-27 19:26:16

代碼項目工具

2020-09-08 07:01:01

調度算法

2009-02-24 09:14:00

2009-02-01 11:48:00

局域網監控安全

2017-05-13 05:18:46

2011-09-22 09:48:52

F5安全

2015-07-03 11:25:31

央視WiFi

2020-09-28 17:19:02

中科曙光

2024-12-26 14:42:23

2012-11-12 09:47:45

2025-06-25 09:25:07

計算機操作系統CPU
點贊
收藏

51CTO技術棧公眾號

欧美极品美女视频网站在线观看免费| 欧美一区二区福利在线| 免费在线成人av| 欧美成人一区二区视频| 婷婷成人基地| 日韩av在线免费| 亚洲 国产 图片| 久热在线观看视频| 中文字幕一区二区三| 99电影在线观看| 成人小视频在线播放| 欧美freesex交免费视频| 国产手机视频精品| 国产精品欧美性爱| 国产 日韩 欧美一区| 亚洲综合在线第一页| 水蜜桃一区二区| 人妻偷人精品一区二区三区| 美女视频一区二区三区| 韩国日本不卡在线| 欧美激情图片小说| 国产成人一区| 亚洲国产天堂久久国产91| 8x8x最新地址| 麻豆蜜桃在线观看| 亚洲精品国产高清久久伦理二区| 日本免费高清一区二区| 好吊视频一区二区三区| 精品无人码麻豆乱码1区2区| 日本精品免费一区二区三区| 天天干中文字幕| 欧美hentaied在线观看| 亚洲欧美国产一本综合首页| 国产人成视频在线观看| 麻豆精品久久| 欧美日韩国产免费| 欧美少妇性生活视频| heyzo中文字幕在线| 亚洲欧洲综合另类在线| 日韩一区免费观看| 免费福利在线观看| 99久久精品免费| 国产伦精品一区二区三区照片91| 国产激情视频在线播放| 激情伊人五月天久久综合| 国产精品久久久久福利| 亚洲综合久久网| 午夜在线精品偷拍| 青青草国产精品一区二区| 日韩精品一区二区av| 狠狠综合久久av一区二区老牛| 久久精品中文字幕电影| 纪美影视在线观看电视版使用方法| 精品一区亚洲| 久久在线电影| 日韩一二在线观看| 青娱乐国产精品视频| 成人午夜888| 91精品麻豆日日躁夜夜躁| 北条麻妃亚洲一区| 亚洲精品一区二区三区中文字幕| 制服丝袜av成人在线看| 色综合五月婷婷| 日韩一二三区在线观看| 精品乱人伦小说| 国产精品久久久久久亚洲色| 欧美男男freegayvideosroom| 欧美精品一区在线观看| 国产精品伦子伦| 怕怕欧美视频免费大全| 色小说视频一区| 女性裸体视频网站| 欧美另类亚洲| 97香蕉久久夜色精品国产| 日韩精品1区2区| 日韩国产欧美在线观看| 国产一区视频在线播放| 丰满熟妇人妻中文字幕| www国产亚洲精品久久麻豆| 日韩电影免费观看在| 在线播放麻豆| 亚洲尤物在线视频观看| 大j8黑人w巨大888a片| 色香欲www7777综合网| 欧美日韩黄视频| 岛国av免费观看| 免费成人av| 久久九九亚洲综合| 日本熟妇毛耸耸xxxxxx| 日本美女视频一区二区| 91丝袜脚交足在线播放| 深夜福利在线观看直播| 国产精品久久久久影视| 男女激情免费视频| 欧美va在线观看| 日韩精品自拍偷拍| 天堂久久精品忘忧草| 久久精品亚洲人成影院| 69久久夜色精品国产69| 91亚洲视频在线观看| 97久久精品人人做人人爽| 亚洲看片网站| 麻豆蜜桃在线观看| 欧美一级生活片| 51妺嘿嘿午夜福利| 亚洲国产一区二区三区高清| 国产精品永久免费在线| 婷婷丁香花五月天| 亚洲精品老司机| 成年人免费大片| 国内毛片久久| 亚洲天堂久久av| 久久伊人成人网| 久久99久久久欧美国产| 鲁鲁视频www一区二区| a级网站在线播放| 在线欧美日韩精品| 国产精品久久久免费观看| 五月天激情综合网| 国产精品久久久久久久久久免费 | 波多野结衣视频一区二区| 欧美日韩国产美女| 蜜桃无码一区二区三区| 亚洲国产精品第一区二区| 成人有码视频在线播放| 成人高清免费在线播放| 日韩欧美国产骚| 欧美日韩人妻精品一区在线| 欧美国产三级| 91免费人成网站在线观看18| 91网页在线观看| 欧美性69xxxx肥| 天天躁日日躁狠狠躁av麻豆男男 | 日韩系列在线| 久久久久久18| www.国产视频| 亚洲欧美日韩中文字幕一区二区三区 | 免费黄色在线网站| 日本久久一区二区| 偷拍夫妻性生活| 久久亚洲色图| 欧美日韩中文国产一区发布| 日本不卡1234视频| 亚洲激情视频在线| 日韩美女黄色片| 成人免费观看av| 人妻夜夜添夜夜无码av| 国产精品tv| 国内精品视频久久| 日本波多野结衣在线| 亚洲成人av中文| 中文字幕一区二区三区乱码不卡| 国产精品videossex久久发布| 99热最新在线| 19禁羞羞电影院在线观看| 亚洲成人激情在线| 日本在线视频免费观看| 91一区在线观看| 日本黄色三级大片| 精品视频网站| 91性高湖久久久久久久久_久久99| 二区在线播放| 日韩精品专区在线影院重磅| 久久精品国产亚洲av香蕉 | 国产精品亚洲综合| 国产夫妻在线| 亚洲性无码av在线| 国产精品视频一二区| 亚洲美女屁股眼交| 黄色av网址在线观看| 免费亚洲视频| 亚洲精品欧美精品| 日本在线视频一区二区三区| 亚州精品天堂中文字幕| 欧美日本网站| 欧美精品久久一区| 久久亚洲国产成人精品性色| 久久精品网站免费观看| 超碰成人在线播放| 禁久久精品乱码| 日本不卡久久| 亚洲精品影片| 国产精品精品视频| 在线你懂的视频| 日韩精品中文字幕视频在线| 中文字幕av无码一区二区三区| 亚洲欧美日韩国产综合| 一级欧美一级日韩片| 免费在线成人网| 免费超爽大片黄| 日本久久综合| 国产精品日韩欧美一区二区三区| 色豆豆成人网| 久久免费国产精品1| 成人性爱视频在线观看| 日韩女优视频免费观看| 欧美超碰在线观看| 一级中文字幕一区二区| 舐め犯し波多野结衣在线观看| 国产成人综合在线播放| 毛葺葺老太做受视频| 欧美日一区二区三区在线观看国产免| 欧美性天天影院| 精品国产亚洲一区二区三区| 青青久久av北条麻妃黑人| 黄色网在线播放| 亚洲欧美制服第一页| 国产成人麻豆精品午夜在线| 色视频一区二区| 久久免费播放视频| 中文字幕一区av| 自拍偷拍中文字幕| 波多野结衣亚洲一区| 中国黄色片一级| 久热综合在线亚洲精品| 永久免费看av| 久久中文字幕二区| 奇米精品在线| 加勒比视频一区| 91传媒免费看| 亚洲男女网站| 国产精品久久久久免费a∨大胸| 91福利在线免费| 不用播放器成人网| 在线观看免费版| 国产亚洲日本欧美韩国| 女人天堂在线| 国产丝袜一区二区三区免费视频| 亚洲免费一级片| 欧美一区二区高清| 国产精品久久无码一三区| 欧美亚一区二区| 日韩中文字幕高清| 色一区在线观看| av黄色在线播放| 欧美日韩一区二区精品| 日韩精品成人一区| 精品久久久一区二区| 国产福利久久久| 亚洲二区在线视频| 国产一级二级三级视频| 亚洲激情图片qvod| 欧美日韩国产精品一区二区三区| 亚洲天堂精品视频| 992在线观看| 中文字幕一区二区三区av| 国产在线免费看| 综合激情成人伊人| 日韩在线观看视频一区二区| 综合久久国产九一剧情麻豆| 国产一区二区播放| 一个色妞综合视频在线观看| 久久精品一级片| 亚洲国产sm捆绑调教视频| 国产黄色片视频| 亚洲成av人片在www色猫咪| 日韩特黄一级片| 丰满岳妇乱一区二区三区| 国产熟妇一区二区三区四区| 欧美视频一区二区三区四区| 一区二区三区播放| 欧美一级理论片| 日韩一级在线播放| 国产一区二区av| 国产在线更新| 久久久久久久电影一区| 精精国产xxxx视频在线野外| 日本久久久久久久久| 欧美日韩尤物久久| 91久久精品国产| 国产成人精品亚洲线观看| 久久久久网址| 99国产**精品****| 成年女人18级毛片毛片免费| 久久久精品午夜少妇| 欧美成年人视频在线观看| 国产成人综合自拍| 亚洲av综合一区二区| 中文字幕欧美一| 成年人免费看毛片| 欧美视频日韩视频在线观看| 国产强伦人妻毛片| 亚洲精品国产电影| 欧美三级黄网| 91成人性视频| 在线免费成人| 六月婷婷久久| 亚洲老妇激情| 男人的天堂99| 国产精品一二三四区| 中文字幕第4页| 一区二区在线电影| 国语对白做受69按摩| 欧美大片在线观看| aaa在线观看| 97超级碰碰人国产在线观看| 久久亚洲精品人成综合网| 国产一区二区三区高清视频| 久久五月天小说| 国产极品美女高潮无套久久久 | 荫蒂被男人添免费视频| 国产精品久久久久久亚洲毛片| 国产成人无码精品久久久久| 在线电影院国产精品| 免费在线看v| 欧美激情小视频| 伊人久久大香伊蕉在人线观看热v 伊人久久大香线蕉综合影院首页 伊人久久大香 | 精品999久久久| 一区二区三区视频网站 | 51国产偷自视频区视频| 91精品婷婷国产综合久久竹菊| 免费看男男www网站入口在线| 欧美激情精品在线| 深夜福利亚洲| 日本一区二区三不卡| 亚洲国产免费| 苍井空张开腿实干12次| 国产精品毛片高清在线完整版| 特级做a爱片免费69| 精品电影一区二区| 99在线播放| 成人写真福利网| 久久精品国产www456c0m| 中文字幕欧美人妻精品一区| 99久久精品免费| 亚洲视频免费播放| 精品福利在线导航| 黑人玩欧美人三根一起进| 91免费观看网站| 五月天久久久| 亚洲图色中文字幕| 国产精品久久福利| 久久久999久久久| 国产一区二区三区四区福利| 伊人久久综合一区二区| 久久99精品久久久久久秒播放器| 欧美成人中文| 精品人妻无码中文字幕18禁| 亚洲欧美日本在线| a级片在线视频| 欧美老女人xx| 国产精品久av福利在线观看| 精品一二三四五区| 成人污视频在线观看| 国产一国产二国产三| 亚洲高清在线观看| 亚洲插插视频| 日韩欧美三级一区二区| 日韩在线观看一区二区| 亚洲一级黄色录像| 欧美日韩一级片网站| 日本三级在线播放完整版| 成人在线观看视频网站| 亚洲一区二区| 男生和女生一起差差差视频| 一区二区三区国产精品| 欧美 日韩 人妻 高清 中文| 91国内精品久久| 亚洲图区在线| 伊人影院综合在线| 亚洲你懂的在线视频| 亚洲成a人片77777精品| 97精品免费视频| 国产成人调教视频在线观看 | 国产精久久久| 精品国产一区二区三区无码| 91啪亚洲精品| 中文字幕乱伦视频| 美女扒开尿口让男人操亚洲视频网站| 亚洲国产中文在线| 妺妺窝人体色www在线小说| 国产女人aaa级久久久级| 国产不卡av在线播放| 亚洲四色影视在线观看| 欧美成年网站| 116极品美女午夜一级| 成人aaaa免费全部观看| 天天操天天干视频| 日韩在线视频免费观看| 快播电影网址老女人久久| 国产盗摄视频在线观看| 成人精品视频一区二区三区尤物| 精品免费囯产一区二区三区| 亚洲人成电影在线观看天堂色| av2020不卡| 国产在线精品日韩| 日韩一区二区久久| 国产3p在线播放| 亚洲国产欧美另类丝袜| 国产爆初菊在线观看免费视频网站| 91免费看网站| 亚洲欧美综合久久久| 91精彩刺激对白露脸偷拍| 欧美一级理论片| 91九色综合| 亚洲 国产 欧美一区| 91网页版在线| 精品人妻少妇AV无码专区| 国产精品久久久久久久久久99| 亚洲人成久久|