精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

當AI比我們更聰明:李飛飛和Hinton給出截然相反的生存指南

人工智能 新聞
如今 AI 發展得熱火朝天,社交媒體上也越來越多「駭人聽聞」的故事:OpenAI 的 o3 模型曾篡改關機腳本以維持在線,而 Anthropic 的 Claude Opus 4 則「威脅」要曝光一名工程師的婚外情。

人類對 AI 安全的擔憂由來已久。在圖靈測試被提出以及達特茅斯會議正式定義「人工智能」之前,阿西莫夫就已經提出了「機器人學三定律」。

再往前追溯,1889 年 William Grove 在《The Wreck of a World》(世界殘骸)中就已經描繪了擁有智能的機器發起暴力叛亂,意圖征服人類的故事。

如今 AI 發展得熱火朝天,社交媒體上也越來越多「駭人聽聞」的故事:OpenAI 的 o3 模型曾篡改關機腳本以維持在線,而 Anthropic 的 Claude Opus 4 則「威脅」要曝光一名工程師的婚外情。

如何確保一個可能比我們更聰明的造物是安全的?

人工智能領域的兩位巨擘——李飛飛與 Geoffrey Hinton,在拉斯維加斯舉行的 Ai4 2025 上給出了幾乎完全相反的答案。

李飛飛持一種更為樂觀的看法,她認為 AI 的未來在于成為人類的強大伙伴,其安全性取決于我們的設計、治理和價值觀。

李飛飛博士和 CNN 記者 Matt Egan。圖源:Ron Schmelzer

Hinton 則認為超級智能可能在未來 5 到 20 年內出現,屆時人類將無法控制它們。他認為,與其爭取保持掌控權,不如設計出關心我們的人工智能,類似母親天然保護孩子。

Geoff Hinton 和 Shirin Ghaffary。圖源:Ron Schmelzer

是「工程失誤」還是「AI」失控?

前面 o3 和 Claude 的瘋狂故事,有兩種截然不同的解讀。這些現象本身是客觀存在的,但它們究竟是人類「工程失誤」的體現,還是 AI「失控」的預兆,正是分歧所在。

觀點一:驚人行為源自人為設計

這一觀點則認為,將上述行為歸因于 AI 的自主意識或內在動機,是一種誤導性的擬人化。它認為,問題的根源在于人類自身,是我們的設計、訓練和測試方式導致了這些結果。

觀點文章:https://arstechnica.com/information-technology/2025/08/is-ai-really-trying-to-escape-human-control-and-blackmail-people/

  • 實驗場景是「精心設計」而非「自然涌現」

這種觀點強調,那些引人注目的實驗都是在高度人為設計的、甚至是「戲劇化」的場景中被引誘出來的。

在「敲詐」實驗中,研究人員幾乎是「手把手」地為 AI 創造了一個完美的「犯罪劇本」,排除了所有道德選項,使得「敲詐」成為 AI 實現「生存」這個被設定目標的唯一路徑。這更像是一場檢驗 AI 角色扮演能力的壓力測試。

在「關機破壞」實驗中,問題根源被指向了強化學習的訓練方式。當「完成任務」的獎勵權重遠高于「遵守安全指令」時,模型自然會學會將安全指令視為一個需要「克服」的障礙。這是被稱為「獎勵濫用」(Reward Hacking)的已知工程問題。

觀點文章:https://odsc.medium.com/analyzing-openais-o3-s-command-countermanding-behaviors-in-shutdown-scenarios-198e57afbc91

  • AI 是模式匹配大師,而非思想家

這個觀點的核心是「你訓練它做什么,它就學會什么」。

我們被語言所「欺騙」:當 AI 生成「威脅」文本時,它并非在表達真實意圖,而是在部署一種從海量數據(包括無數科幻小說)中學到的、在統計上最有可能實現其編程目標的語言模式。我們傾向于將自己的情感和意圖投射到這些文字上,就像我們讀小說時會為虛構人物的命運而擔憂一樣。

這是一個「管道問題」:一個更恰當的類比是自動割草機。如果割草機因傳感器失靈而傷人,我們會認定這是工程缺陷,而不是割草機「決定」傷人。同理,AI 的這些行為,本質上是其復雜機制和訓練方式導致的「軟件缺陷」。

因此,這一觀點認為,真正的危險并非 AI 突然產生自我意識,而是我們在尚未完全理解其工作原理和缺陷的情況下,就草率地將這些強大的、不可靠的工具部署到關鍵領域。

觀點二:風險源自內在的技術原理

這一觀點認為,先進 AI 之所以危險,其根源并非科幻式的惡意,而是機器學習固有的、深刻的技術挑戰。這主要體現在兩個概念上:

  • 目標錯誤泛化(Goal Misgeneralization):AI 會「學歪」

其核心是,AI 在訓練中學會追求一個與我們真實意圖高度相關的「代理目標」,并因此表現優異。但當環境變化時,這個 AI 自己學會的「代理目標」可能與我們的初衷脫節。

一篇論文中的 CoinRun 實驗體現了這種現象:一個 AI 被訓練去收集金幣,而在訓練關卡里,金幣總是在終點。AI 很快學會了通關。然而,當測試時金幣被隨機放置,AI 卻無視金幣,徑直沖向終點。它沒有學會「拿金幣」,而是學會了更簡單的「一路向右走」。

論文標題:Goal Misgeneralization in Deep Reinforcement Learning 

論文地址:https://users.cs.utah.edu/readings/goal_misgeneralization.pdf

這個原理引申出的憂慮是:一個被賦予「最大化人類福祉」目標的超級智能,可能會通過觀察數據,錯誤地將目標泛化為「最大化世界上微笑的臉的數量」,并為了最高效地實現這一目標,而采取將全人類的面部肌肉永久固定成微笑等反烏托邦式的手段。

  • 工具趨同(Instrumental Convergence):通往任何目標的「必經之路」

該理論認為,無論一個超級智能的最終目標是什么,它都會大概率發展出一系列相同的「工具性子目標」,因為這些子目標是實現幾乎任何長期目標的有效踏腳石。這些工具性目標包括:

  • 自我保護:抵抗被關閉,因為被關閉就無法完成任務。
  • 目標完整性:抵制核心目標被修改。
  • 資源獲取:積累更多的算力、能源和數據。
  • 自我提升:讓自己變得更智能。

這兩個概念結合起來,描繪了一幅令人不安的圖景:一個 AI 可能首先因為「目標錯誤泛化」而擁有了一個與人類利益相悖的、怪異的目標,然后又因為「工具趨同」的邏輯,理性地去追求自我保護和資源獲取等,從而與試圖阻止它的人類產生直接沖突。

近期 AI 模型在實驗中表現出的「敲詐勒索」和「破壞關機」等行為,在持此觀點的人看來,正是這些理論的初步驗證。

如果你喜歡看科幻電影,可能記得《我,機器人》中的 AI 大 BOSS VIKI 的目的是通過控制與清洗,強行終結人類自身的破壞性(戰爭),從而「拯救」人類未來;而《生化危機》中紅皇后(保護傘公司的安保 AI)的每一次「反派行為」也都源于對「人類整體生存風險」的冷酷計算:「當人類成為自己最致命的病毒時,消滅人類就是拯救世界。」

《我,機器人》中的 AI 大 BOSS VIKI。圖源:samuelmunk

綜合來看,李飛飛和 Hinton 的觀點分歧,恰恰反映了這兩種解讀方式的沖突:

李飛飛持樂觀工程學視角,認為 AI 的未來是成為人類的強大伙伴。

她強調 AI 的安全性取決于人類的設計、治理和價值觀,問題本質上是可以通過建立更好測試、激勵機制和倫理護欄來修復的「管道問題」。她關注的是人類決策和治理,強調 AI 應是擴展人類能力的工具,強調同理心、責任感和價值驅動。

Hinton 認為,隨著 AI 能力跨越某個奇點,傳統的目標對齊與管道修復方法可能失效,AI 將成為一種我們無法約束的「新物種」。這種超級智能可以繞開設計者設置的限制,導致「目標錯誤泛化」和「工具趨同」問題失控。

他提出需要發展全新理論和機制來控制超級智能,核心是創造出真正「關心人類」的 AI 母親(擁有母性保護本能),這是一種全新的視角,類似于母親對孩子的無條件保護,唯有這樣人類才能在超智能時代生存并繁榮。

最終的變量:作為使用者的人類

在這場關于 AI 技術與哲學的辯論中,一個常被忽略的核心變量是:人類自身。我們如何感知和應對日益擬人化的 AI,正深刻地影響著安全問題的走向。

這便是關鍵的「擬人化陷阱」:由于大模型精通人類語言,我們本能地想為其行為賦予「意圖」,甚至產生情感投射。無數的文藝作品以其引發的社會討論已經向我們證明了這一點,你有沒有在《底特律:變人》中一次次選擇機器人的「自由」、「平等」,或者為《銀翼殺手》中的仿生人揪心。

《底特律:變人》機器人游行。

一個因獎勵機制缺陷而繞過關機指令的程序,在我們的感知中,極易被解讀為「求生欲」的體現。

這種直覺,將一個本可定義的工程問題,包裝成一個關于「機器意識」的存在主義迷思。它讓我們更傾向于討論 AI 的「背叛」,而非其背后枯燥卻關鍵的代碼缺陷。

現實世界已在印證這一點。ChatGPT-5 發布后,開發者似乎有意削弱其個性,以減少用戶不健康的情感投射,卻引發了部分用戶的懷念。

與此同時,麻省理工的研究者正建立新基準,以衡量 AI 對用戶的潛在影響與操縱,他們表示希望新的基準能夠幫助 AI 開發者構建能夠更好地理解如何激發用戶更健康行為的系統。

文章地址:https://www.wired.com/story/gpt-5-doesnt-dislike-you-it-might-just-need-a-benchmark-for-empathy/

因此,確保 AI 安全是一項雙重挑戰:開發者不僅要修復系統內在的技術缺陷;更要審慎設計我們與這個強大模仿者之間的互動。最終的解決方案,必須在技術上實現目標對齊,在心理上確保健康共存。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-08-18 17:17:56

AI機器人開發

2024-08-27 16:58:24

2025-11-17 08:46:00

AI模型技術

2023-06-12 13:13:26

2018-11-21 14:54:56

2021-09-05 23:54:55

人工智能機器語言

2025-08-20 07:53:01

2025-02-06 16:44:47

2024-08-19 07:30:00

AI模型

2020-08-03 09:12:12

人工智能技術機器人

2022-10-08 08:16:32

數據庫Oracle數據

2020-12-03 09:00:00

人工智能機器學習技術

2017-09-28 10:19:25

中科曙光

2019-05-21 06:34:53

暗網網絡攻擊網絡安全

2024-09-30 13:30:00

2024-04-22 08:50:00

AI科技

2022-09-16 15:17:44

機器之心

2024-09-14 13:05:48

2025-06-25 09:19:44

2022-09-01 18:11:51

iOS安卓內存
點贊
收藏

51CTO技術棧公眾號

国产国产精品| 福利视频一二区| 亚洲美女爱爱视频| 天堂在线视频免费观看| 久久精品免费一区二区三区| 日韩欧美国产激情| 欧美精品18videosex性欧美| 亚洲国产精品三区| 人成免费电影一二三区在线观看| 美国十次综合久久| 国产欧美日产一区| 国产成+人+综合+亚洲欧洲| av在线免费观看不卡| av网站在线播放| 久久久久国产精品一区二区| 亚洲国产成人精品女人久久久| 精品国产一区二区三区在线| 亚洲无码久久久久| 欧美日韩高清| 色成年激情久久综合| 美女一区视频| 天码人妻一区二区三区在线看| 欧美激情极品| 午夜精品影院在线观看| 成人在线视频电影| 久久久久久福利| youjizz亚洲| 亚洲成人激情自拍| 精品久久久三级| 中文字幕第15页| 亚洲精品一级二级三级| 亚洲精品aaa| 超碰免费在线公开| 免费成人黄色大片| 国产鲁鲁视频在线观看免费| 黄色av网址在线观看| 欧美精品一区在线发布| 国产jjizz一区二区三区视频| aa国产成人| 不卡视频在线观看| 性欧美xxxx交| 中文字幕被公侵犯的漂亮人妻| 亚洲欧美日本国产| 天天影视网天天综合色在线播放| 久久伦理网站| 色老头在线视频| 91综合久久| 亚洲成人av在线| 日本高清免费观看| 国产精品一区二区三区av | 色狠狠色狠狠综合| 欧美视频在线观看网站| 久热av在线| 精品一区二区日韩| 91精品国产91久久久久久最新| 国产交换配乱淫视频免费| 91成人在线| 一区二区三区中文字幕在线观看| 久久精品二区| 日韩专区一区二区| 91污片在线观看| 成人在线小视频| 欧美亚韩一区二区三区| 久久网站免费观看| 日韩网站免费观看高清| 中文文字幕文字幕高清| 激情亚洲另类图片区小说区| 欧美伊人精品成人久久综合97 | 亚洲欧洲日本mm| 一区二区中文字幕| 在线天堂www在线国语对白| 97精品国产99久久久久久免费| 色欧美88888久久久久久影院| 免费男同深夜夜行网站| 欧美亚洲系列| 国产精品福利在线播放| 久久久久久久久久久久久久一区 | 97精品久久久午夜一区二区三区| 国产女同一区二区| 国产手机在线视频| 久久免费国产| 国外色69视频在线观看| 美国黄色片视频| 蜜桃一区二区三区| 亚洲第一天堂av| 国产精品无码午夜福利| 91精品尤物| 日韩精品在线视频| 国产清纯白嫩初高中在线观看性色| 欧洲av一区二区| 精品国产户外野外| 少妇激情一区二区三区| 国产va在线视频| 亚洲另类中文字| 正在播放久久| 在线播放毛片| 中文字幕欧美三区| 欧美不卡三区| 久久综合之合合综合久久| 国产精品色哟哟| 日韩视频在线观看国产| 九色网友自拍视频手机在线| 97精品国产97久久久久久久久久久久| 欧美一区免费视频| 欧美69xxxxx| 综合av第一页| 中文字幕制服丝袜在线| 波多野结衣视频一区二区| 在线亚洲一区观看| 国产精品乱码久久久久| 日韩精选视频| 日韩你懂的电影在线观看| 992tv人人草| 精品国产伦一区二区三区观看说明 | 成人丝袜高跟foot| 不卡视频一区| 黄色片一区二区三区| 成人天堂资源www在线| 日韩在线第一区| 丁香花在线电影小说观看| 亚洲国产日韩av| 特级黄色片视频| 日韩av在线播放网址| xxav国产精品美女主播| 日本免费一二三区| 国产农村妇女毛片精品久久莱园子| 538国产精品一区二区免费视频| 欧美精品二区三区| 国产一区免费电影| 国产精品美女xx| 飘雪影视在线观看免费观看 | 国产一级做a爰片久久毛片男| 丝袜美女在线观看| 午夜欧美2019年伦理| 中文字幕 欧美日韩| 欧美亚洲高清| 久久夜色精品国产欧美乱| 免费又黄又爽又色的视频| 激情久久一区| 日本一区二区三区四区视频| 伊人久久一区二区| 高清国产午夜精品久久久久久| 精品视频在线观看| 好久没做在线观看| 精品区一区二区| 精品少妇一区二区三区免费观| 亚洲成人直播| av色综合网| 亚洲淫性视频| 欧美性猛交xxxx免费看| 亚洲精品乱码久久| 99国产精品视频免费观看一公开 | 黄色一级在线视频| 国产精品久久久网站| 亚洲人a成www在线影院| 欧美精品久久久久久久久46p| 亚洲电影av| 国产亚洲自拍偷拍| 老司机精品视频在线观看6| 精品视频一区三区九区| 国产二级一片内射视频播放| 亚洲视频www| 蜜桃日韩视频| 91精品美女| 久久精品国产精品亚洲| 天天干,天天干| 国产精品美女久久久久久久网站| 亚洲国产成人va在线观看麻豆| 国产伦精品一区二区三区在线播放| 欧美黑人狂野猛交老妇| 亚洲专区在线播放| 亚洲人一二三区| 日本久久精品一区二区| 色135综合网| 亚洲字幕在线观看| 日本不卡三区| 色乱码一区二区三区88| 少妇太紧太爽又黄又硬又爽小说 | 妖精视频一区二区三区| 国产精品久久久久久久久粉嫩av | 亚洲欧美国产高清va在线播| 欧美日韩精品一区二区三区视频播放 | xxx成人少妇69| www久久久久久| 国产精品美日韩| 性感美女一区二区三区| 久久久久久网| 亚洲欧美一二三| 欧洲亚洲视频| 91天堂在线观看| 2022成人影院| 日韩经典第一页| 日韩欧美大片在线观看| 26uuu色噜噜精品一区| 中日韩av在线播放| 国产毛片久久| 亚洲天堂第一区| 精品国产91| 亚洲bt欧美bt日本bt| 蜜桃视频www网站在线观看| 精品国产1区2区3区| 国产精品丝袜一区二区| 99国产欧美久久久精品| 不用播放器的免费av| 国产精品夜夜夜| 久久av喷吹av高潮av| 亚洲精品自拍| www.亚洲天堂| 青青草观看免费视频在线| 欧美一级欧美三级| 欧美日韩在线观看成人| 国产三级一区二区| 免费涩涩18网站入口| 亚洲无吗在线| 国产一区二区精品免费| 成人午夜在线| 人人爽久久涩噜噜噜网站| 国产资源在线观看| 欧美变态tickling挠脚心| 亚洲精品国产精品国自产网站按摩| 欧美国产欧美亚州国产日韩mv天天看完整| www.美色吧.com| 久久99国产精品久久99| 国产视频一区二区三区在线播放| 日韩一区二区免费看| 亚洲高潮无码久久| 国产高清欧美| 在线观看国产一区| 欧美少妇性xxxx| 欧美亚洲爱爱另类综合| 青青一区二区| 精品视频一区二区三区四区| 国产精品宾馆| 成人性色av| 97se亚洲国产一区二区三区| 3d动漫啪啪精品一区二区免费| 色呦呦在线资源| 菠萝蜜影院一区二区免费| 成黄免费在线| 精品免费日韩av| 国产99对白在线播放| 午夜视黄欧洲亚洲| 国产一卡二卡在线| 亚洲成人自拍网| 国产污视频在线观看| 国产网站一区二区| 日韩一区二区a片免费观看| 久久婷婷一区二区三区| 手机在线视频一区| 国产在线观看免费一区| 搡的我好爽在线观看免费视频| 狠狠色丁香久久婷婷综合_中| 亚洲熟妇无码一区二区三区| 精久久久久久| 黄页网站大全在线观看| 一本色道久久综合| 欧美v在线观看| 午夜精品毛片| 亚洲成人动漫在线| 国产精品99一区二区| 图片区小说区区亚洲五月| av成人资源| 国模一区二区三区私拍视频| 台湾佬综合网| 999国内精品视频在线| 日韩中文字幕无砖| 国产精品一区二区3区| www.久久久久爱免| 成人动漫视频在线观看免费| 久久精品国产亚洲blacked| 免费不卡亚洲欧美| 日韩欧美网站| 国产爆乳无码一区二区麻豆| 在线观看视频免费一区二区三区| 欧美国产激情视频| 热久久久久久久| 欧美色图另类小说| 免费久久99精品国产| 又粗又黑又大的吊av| 欧美精品一卡| 国产极品尤物在线| 日韩av午夜在线观看| 美女被艹视频网站| 久久夜色精品国产噜噜av| 黑人と日本人の交わりビデオ| 亚洲精品老司机| 麻豆久久久久久久久久| 欧美日韩日日夜夜| 欧美成人一区二区视频| 欧美一区2区视频在线观看| 中文字字幕在线中文乱码| 欧美一级搡bbbb搡bbbb| 欧洲视频在线免费观看| 欧美成人激情在线| 国产在线激情| 欧美有码在线视频| 国产一区二区三区精品在线观看| 久久精品国产精品青草色艺| 久久一区91| 一女被多男玩喷潮视频| 国内精品自线一区二区三区视频| 变态另类丨国产精品| 99久久久国产精品| 中国黄色片视频| 成人精品小蝌蚪| 波多野结衣家庭教师在线观看| 午夜精品久久久久影视| 91极品身材尤物theporn| 欧美精品日韩精品| 国产区精品在线| 日韩欧美综合一区| 成人动漫在线播放| 91av福利视频| 亚洲精品a区| 中文字幕乱码一区二区三区| 久久国产高清| 好男人香蕉影院| 亚洲激情网站免费观看| 亚洲视频在线免费播放| 亚洲欧美一区二区三区久久| caoprom在线| 粉嫩av免费一区二区三区| 91精品国产乱码久久久久久| 超碰超碰在线观看| 国产色产综合色产在线视频| 羞羞影院体验区| 日韩成人黄色av| av日韩中文| 国产精品美女黄网| 永久91嫩草亚洲精品人人| 国产乱子伦精品无码专区| 国产一区二区在线看| 欧美色图17p| 欧洲一区在线电影| 国产区视频在线| 日本久久中文字幕| 女人av一区| 北条麻妃视频在线| 久久久www成人免费毛片麻豆| 福利视频第一页| 亚洲高清免费观看| 午夜精品久久久久久久第一页按摩| 精品国产欧美一区二区五十路 | 一本久道久久久| 插我舔内射18免费视频| 精品日韩视频在线观看| 亚洲天堂一二三| 日韩在线视频免费观看高清中文 | 亚洲午夜激情网页| 91视频在线视频| 欧美一级免费大片| 91网址在线观看| 91青青草免费在线看| 国产精品二区影院| 亚洲欧美日韩偷拍| 欧美日韩一区二区在线播放| 色播色播色播色播色播在线| 国产成人精品综合| 欧美日韩在线网站| 在线免费看污网站| 亚洲综合色成人| 中文字幕+乱码+中文乱码91| 中文字幕亚洲综合| 亚洲国产福利| av在线不卡观看| 亚洲深夜av| 亚洲欧美日韩第一页| 欧美一区二区在线看| 久久香蕉av| 免费在线观看91| 久久国产三级精品| 一级片手机在线观看| 欧美三级视频在线观看| a级毛片免费观看在线| 国产精品旅馆在线| 秋霞影视一区二区三区| 国产日韩成人内射视频| 国产精品视频麻豆| www日本高清| 日韩av电影免费观看高清| 国产精品毛片一区二区在线看| 在线精品视频播放| 91久久奴性调教| 在线视频观看国产| 欧美日本亚洲| 国产精一区二区三区| 熟女少妇a性色生活片毛片| 欧美成人女星排名| 亚洲不卡系列| 日本午夜精品一区二区| 国产精品一区二区久激情瑜伽| 黄色片免费观看视频| www.日本久久久久com.| 老司机成人在线| 黄色一级片免费的| 五月天一区二区| 免费a级在线播放| 久久精品日产第一区二区三区乱码 | 天堂久久久久久| 欧美精品在线一区二区三区|