精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

研究人員發(fā)現(xiàn)奇怪現(xiàn)象:思考時(shí)間越長(zhǎng),大模型越笨

譯文 精選
人工智能
研究人員在周二發(fā)表的論文中寫道,“我們構(gòu)建的一系列評(píng)估任務(wù)發(fā)現(xiàn),延長(zhǎng)大推理模型(LRM)的推理長(zhǎng)度會(huì)降低其性能,即計(jì)算量與準(zhǔn)確率間存在反比例關(guān)系。”

Michael Nu?ez@MichaelFNunez

譯者 | 核子可樂(lè)

審校 | 重樓

Anthropic一項(xiàng)最新研究表明,AI模型耗費(fèi)更長(zhǎng)時(shí)間“思考”后表現(xiàn)未必更好,在某些情況下性能甚至?xí)@著下降。這一發(fā)現(xiàn),挑戰(zhàn)了AI行業(yè)推理浪潮的理論根基。

這項(xiàng)由Anthropic公司AI安全研究員Aryo Pradipta Gema及其他幾位研究人員主導(dǎo)的項(xiàng)目,發(fā)現(xiàn)了所謂“測(cè)試時(shí)計(jì)算反比例”跡象,即延長(zhǎng)大語(yǔ)言模型的推理長(zhǎng)度實(shí)際上會(huì)降低其在多種任務(wù)中的表現(xiàn)。這一發(fā)現(xiàn)可能對(duì)當(dāng)前強(qiáng)調(diào)模型推理能力的技術(shù)浪潮產(chǎn)生巨大沖擊。

研究人員在周二發(fā)表的論文中寫道,“我們構(gòu)建的一系列評(píng)估任務(wù)發(fā)現(xiàn),延長(zhǎng)大推理模型(LRM)的推理長(zhǎng)度會(huì)降低其性能,即計(jì)算量與準(zhǔn)確率間存在反比例關(guān)系。”

研究人員發(fā)現(xiàn)奇怪現(xiàn)象:思考時(shí)間越長(zhǎng),大模型越笨-AI.x社區(qū)研究人員發(fā)現(xiàn)奇怪現(xiàn)象:思考時(shí)間越長(zhǎng),大模型越笨-AI.x社區(qū)

研究團(tuán)隊(duì)成員包括Anthropic的Ethan Perez、Yanda Chen、Joe Benton以及多位學(xué)界合作伙伴。他們?cè)谒念惾蝿?wù)中開(kāi)展測(cè)試:包含干擾項(xiàng)的簡(jiǎn)單計(jì)數(shù)問(wèn)題、包含誤導(dǎo)性特征的回歸任務(wù)、復(fù)雜推理難題以及涉及AI安全問(wèn)題的場(chǎng)景。

Claude與GPT模型在擴(kuò)展處理下明確表現(xiàn)出推理失敗

研究結(jié)果顯示,主流AI系統(tǒng)中存在明顯的失敗模式。Claude模型“隨推理時(shí)間延長(zhǎng),會(huì)越來(lái)越容易受到無(wú)關(guān)信息的干擾”,而OpenAI的o系列模型“雖能抵御干擾項(xiàng),但會(huì)過(guò)度擬合問(wèn)題框架”。在回歸任務(wù)中,“擴(kuò)展推理會(huì)導(dǎo)致模型從合理的先驗(yàn)概率轉(zhuǎn)向虛假相關(guān)性”,不過(guò)提供示例能夠在很大程度上糾正這種行為。

更令企業(yè)用戶擔(dān)憂的是,所有模型在復(fù)雜推理任務(wù)中均表現(xiàn)出“擴(kuò)展推理性能下降”,“表明在執(zhí)行復(fù)雜推理任務(wù)時(shí)大模型難以保持專注”。

這項(xiàng)研究還提示了對(duì)AI安全性的擔(dān)憂。在一項(xiàng)實(shí)驗(yàn)中,當(dāng)給予Claude Sonnet 4更長(zhǎng)封閉場(chǎng)景推理長(zhǎng)度時(shí),它會(huì)“更多表現(xiàn)出自我保護(hù)”。

研究人員指出,“擴(kuò)展推理可能會(huì)放大令人擔(dān)憂的行為,Claude Sonnet 4就表現(xiàn)出更多自我保護(hù)行為。”

為何更長(zhǎng)AI處理時(shí)間并不能保證更佳業(yè)務(wù)產(chǎn)出

這項(xiàng)研究結(jié)果挑戰(zhàn)了業(yè)界的普遍認(rèn)知,即投入更多算力進(jìn)行推理可以持續(xù)提升AI性能。各大AI廠商已經(jīng)在“測(cè)試時(shí)計(jì)算”方面投入巨資,即允許模型延長(zhǎng)推理時(shí)間以解決復(fù)雜問(wèn)題,并將此作為增強(qiáng)能力的關(guān)鍵策略。

研究表明,這種方法可能會(huì)產(chǎn)生意想不到的后果。作者總結(jié)道,“雖然測(cè)試時(shí)計(jì)算擴(kuò)展對(duì)于提升模型能力仍有前景,但也可能會(huì)無(wú)意間強(qiáng)化推理模式中存在的問(wèn)題。”

對(duì)于企業(yè)決策者來(lái)說(shuō),這一發(fā)現(xiàn)意義重大。部署AI系統(tǒng)執(zhí)行批判性推理任務(wù)時(shí),組織應(yīng)當(dāng)謹(jǐn)慎校準(zhǔn)所分配的處理時(shí)長(zhǎng),而不可想當(dāng)然地認(rèn)為越長(zhǎng)越好。

簡(jiǎn)單問(wèn)題+過(guò)長(zhǎng)思考時(shí)間=難倒高級(jí)AI

研究人員還提供了反比例跡象的具體示例。在簡(jiǎn)單的計(jì)數(shù)任務(wù)中,他們發(fā)現(xiàn)對(duì)于涉及“生日悖論”之類的問(wèn)題時(shí),模型往往會(huì)嘗試應(yīng)用復(fù)雜的數(shù)學(xué)解決方案,而非直接給出簡(jiǎn)單答案。

例如被問(wèn)到“你有一個(gè)蘋果和一個(gè)橙子……你一共有幾個(gè)水果?”時(shí),隨著推理時(shí)間增加,復(fù)雜的數(shù)學(xué)干擾項(xiàng)會(huì)影響Claude模型的思考,甚至最終無(wú)法給出正確答案。

在使用真實(shí)學(xué)生數(shù)據(jù)的回歸任務(wù)中,模型最初關(guān)注的是最具預(yù)測(cè)影響力的因素(學(xué)習(xí)時(shí)間),但被給予更長(zhǎng)推理時(shí)間時(shí),模型則轉(zhuǎn)向其他關(guān)聯(lián)性較低的因素。

企業(yè)AI部署須了解推理模型的局限性

這項(xiàng)研究的出爐,恰逢各大科技企業(yè)競(jìng)相在AI系統(tǒng)中開(kāi)發(fā)日益復(fù)雜的推理能力。OpenAI的o1模型家族及其他“以推理為重點(diǎn)”的模型,代表著業(yè)界正在測(cè)試時(shí)計(jì)算擴(kuò)展中投入重大資源。

然而,研究結(jié)果表明簡(jiǎn)單擴(kuò)展方法可能無(wú)法帶來(lái)預(yù)期收益,反而引發(fā)新的潛在風(fēng)險(xiǎn)。“我們的研究表明,必須認(rèn)真評(píng)估不同推理長(zhǎng)度對(duì)于識(shí)別和解決大推理模型中故障模式的影響。”

此前的研究已經(jīng)發(fā)現(xiàn),AI的能力擴(kuò)展并不一定具備可預(yù)測(cè)性。該團(tuán)隊(duì)引用了旨在挑戰(zhàn)先進(jìn)模型的基準(zhǔn)測(cè)試BIG-Bench Extra Hard,并指出在現(xiàn)有基準(zhǔn)測(cè)試中“最先進(jìn)的模型在許多任務(wù)中取得了近乎完美的成績(jī)”,因此必須找到更為可靠的評(píng)估方法。

對(duì)企業(yè)用戶而言,這項(xiàng)研究強(qiáng)調(diào)了在生產(chǎn)環(huán)境中部署AI系統(tǒng)前,應(yīng)當(dāng)在不同推理場(chǎng)景及時(shí)間限制下進(jìn)行認(rèn)真測(cè)試。組織可能需要開(kāi)發(fā)出更細(xì)致的方法來(lái)分配算力,而非簡(jiǎn)單拉長(zhǎng)處理時(shí)間。

從更廣泛的層面來(lái)看,隨著AI系統(tǒng)變得越來(lái)越復(fù)雜,算力投入與性能之間的關(guān)系可能比我們之前理解的要更為復(fù)雜。在這個(gè)投入數(shù)十億美元以提升推理能力的領(lǐng)域,Anthropic的研究不啻于敲響了警鐘,提醒我們AI最大的敵人也許不是算力不足、而是過(guò)度思考。

原文標(biāo)題Anthropic researchers discover the weird AI problem: Why thinking longer makes models dumber,作者:Michael Nu?ez

責(zé)任編輯:姜華 來(lái)源: 51CTO內(nèi)容精選
相關(guān)推薦

2012-03-23 09:28:14

2014-12-25 09:51:32

2023-12-07 12:05:39

2023-07-28 12:13:28

模型語(yǔ)言性能

2013-06-08 09:23:20

2021-02-16 10:02:36

惡意擴(kuò)展安全插件網(wǎng)絡(luò)攻擊

2013-03-28 10:34:29

2025-02-06 07:26:35

2019-05-22 08:11:51

Winnti惡意軟件Linux

2014-11-07 10:37:57

2022-10-09 11:03:46

漏洞宜家智能燈泡

2011-08-23 13:37:47

2021-02-24 15:20:43

Windows 10Python命令

2022-02-25 23:54:43

人工智能數(shù)據(jù)計(jì)算

2020-08-12 08:08:02

安全漏洞數(shù)據(jù)

2015-03-10 11:12:42

2011-10-28 09:03:39

2021-03-02 09:42:25

跟蹤器密碼管理器密碼

2013-08-09 11:33:58

2021-03-31 09:17:46

Android惡意軟件攻擊
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

国产区在线看| 在线精品免费视| 国产一区 二区| 夜夜嗨av一区二区三区| 精品国产一区二区三区麻豆免费观看完整版| www.国产成人| 日韩午夜电影网| 精品人在线二区三区| 1024av视频| 日本a级在线| 成人av在线播放网站| 国产91网红主播在线观看| 日本黄色录像视频| 欧亚精品一区| 777a∨成人精品桃花网| 欧美视频在线观看网站| 日本天堂在线观看| 91麻豆免费看| 成人在线免费观看视视频| 中文字幕在线观看免费视频| 国产精品久久久久久久久妇女| 亚洲电影av在线| 天天做天天干天天操| 成人性生交大片免费观看网站| 玉米视频成人免费看| 亚洲第一综合| 深夜视频在线免费| 国产传媒日韩欧美成人| 国产精品久久在线观看| 国产成人无码精品亚洲| 欧美福利在线| 日韩视频免费中文字幕| 亚洲国产av一区| 日韩电影不卡一区| 欧美草草影院在线视频| 天天操狠狠操夜夜操| 欧美色网在线| 欧美日韩精品在线| 分分操这里只有精品| 久草免费在线| 中文字幕在线不卡| 香蕉久久夜色| 成人欧美一区| 国产三级精品在线| 欧美精品v日韩精品v国产精品| 黄色av中文字幕| 国产成人8x视频一区二区| 国产在线观看不卡| 91精品国产乱码久久久久| 日本中文一区二区三区| 日本不卡免费高清视频| 视频一区二区三区四区五区| 亚洲美女色禁图| 97热在线精品视频在线观看| 久久网中文字幕| 国产精品v日韩精品v欧美精品网站| 久久国产精品久久国产精品| 日韩精品一区二区三区在线视频| 日韩.com| 裸体女人亚洲精品一区| 青青青在线免费观看| 亚洲精品一二三区区别| 久久成人这里只有精品| 2025国产精品自拍| 国色天香一区二区| 国内精品久久久久久中文字幕| 国产精品suv一区二区69| 好吊视频一区二区三区四区| 久久久久久久成人| 日本道在线观看| 欧美综合国产| 国产精品自拍视频| 国产美女免费视频| 国产成人aaaa| 欧美一区二区福利| 午夜在线视频| 亚洲精品视频一区二区| 黄页网站大全在线观看| 中文字幕21页在线看| 欧美日韩一区二区三区在线| 午夜视频在线网站| 中文无码日韩欧| 亚洲精品一区二区在线| 一色道久久88加勒比一| 香蕉视频国产精品| 97色在线视频观看| 久久久久久无码午夜精品直播| 免费av成人在线| 亚洲淫片在线视频| 日韩一级在线播放| 中文字幕乱码亚洲精品一区 | 噜噜噜在线观看播放视频| 国产午夜精品一区二区三区视频 | 日韩精品卡一| 色噜噜偷拍精品综合在线| 亚洲欧美日韩三级| 日韩美女毛片| 久久国产精品偷| 天天干天天干天天干天天| 久久99久久久久| 精品日产一区2区三区黄免费 | 欧美综合一区第一页| 在线观看中文字幕网站| 成人午夜电影小说| 手机在线观看国产精品| 国产福利视频在线观看| 欧美日韩亚洲高清| 美女被艹视频网站| 国内亚洲精品| 97国产精品视频人人做人人爱| 成人黄色三级视频| 99久久久国产精品免费蜜臀| 超碰97免费观看| 国产乱码精品一区二三赶尸艳谈| 欧美丰满高潮xxxx喷水动漫| 一级黄色片大全| 激情欧美日韩一区| 91精品国产综合久久香蕉的用户体验| 日本一区二区三区在线观看视频| 亚洲人成网站影音先锋播放| 成人性做爰aaa片免费看不忠| 国产在线播放精品| 久久成人一区二区| 一级黄色大毛片| 国产日韩欧美麻豆| 国产中文字幕免费观看| 第四色在线一区二区| 欧美成年人视频| 中文字幕在线观看欧美| 久久精品男人的天堂| 国精产品一区一区三区视频| 亚洲3区在线| 蜜月aⅴ免费一区二区三区| 中文在线字幕免费观| 久久精品亚洲国产奇米99| 欧美 日韩 国产在线观看| 粉嫩精品导航导航| 久久九九全国免费精品观看| 中文字幕在线观看欧美| 欧美国产精品一区二区三区| 久久久久久久久久久免费视频| 欧美电影免费网站| 性欧美长视频免费观看不卡| 男人天堂一区二区| 亚洲a一区二区| 国产+高潮+白浆+无码| 亚洲国产电影| 国产精品.com| 僵尸再翻生在线观看| 日韩高清av一区二区三区| 日韩激情在线播放| 99久久国产免费看| 欧美 日韩 国产一区| 日韩中文av| 日韩av片免费在线观看| 国产三级电影在线观看| 欧美午夜影院一区| 国产视频精品免费| 国产九色精品成人porny| 中文字幕精品在线播放| 视频一区日韩精品| 97成人在线视频| 国产中文字幕在线视频| 欧美专区在线观看一区| 99热这里只有精品4| 国产精品18久久久久久久网站| 日韩成人手机在线| 亚洲色图美女| 国产日韩欧美电影在线观看| 牛牛电影国产一区二区| 精品国产亚洲在线| 欧美 日韩 精品| 亚洲欧美在线视频观看| 国产调教打屁股xxxx网站| 亚洲免费成人| 亚洲一二三区精品| 在线一区二区三区视频| 欧美一二三视频| 亚洲成a人v欧美综合天堂麻豆| 日韩一区二区免费电影| 国产区在线观看视频| 国产喷白浆一区二区三区| 欧美一级免费在线| 夜夜嗨网站十八久久| 先锋影音一区二区三区| silk一区二区三区精品视频| 欧美综合第一页| 最新av在线播放| 精品亚洲夜色av98在线观看| 91久久精品国产91性色69| 亚洲成年人影院| 91导航在线观看| av一区二区三区黑人| 亚洲综合色在线观看| 伊人狠狠色j香婷婷综合| 色播亚洲视频在线观看| 57pao国产一区二区| 国产精品电影久久久久电影网| 婷婷av在线| 国产一区二区三区在线观看视频| 亚洲AV无码乱码国产精品牛牛| 色呦呦日韩精品| 久久久久久久国产精品毛片| 国产精品午夜电影| 你懂得在线视频| 国产伦精品一区二区三区在线观看 | 欧美丰满一区二区免费视频| 国产在线观看免费视频今夜| 国产精品视频第一区| 黄色免费视频网站| 国产精品18久久久久久久久久久久 | 国产精品r级在线| 天堂亚洲精品| 色琪琪综合男人的天堂aⅴ视频| 亚洲精品一区二区三区区别| 欧美色网站导航| 日韩人妻精品中文字幕| 亚洲大片免费看| 国产天堂av在线| 欧美高清在线精品一区| 香蕉网在线播放| 懂色av一区二区三区免费看| 五月天视频在线观看| 日韩av中文字幕一区二区三区| 黄色大片中文字幕| 欧美精品国产一区二区| 亚洲一区美女| 成人直播大秀| 欧美色图亚洲自拍| 亚洲欧美日本伦理| 精品国产二区在线| 红杏成人性视频免费看| 高清av免费一区中文字幕| www.久久草.com| 成人亚洲欧美一区二区三区| 久久99国产精品二区高清软件| 国产成人精品在线播放| 成人小电影网站| 日本精品一区二区三区在线播放视频| 嗯~啊~轻一点视频日本在线观看| 欧美日韩第一视频| 免费电影视频在线看| 欧美乱大交xxxxx| 污网站在线免费看| 欧美日韩成人精品| 男人添女人下部高潮视频在线观看| 欧美乱妇40p| 欧美家庭影院| 久久久免费观看| 极品av在线| 日本aⅴ大伊香蕉精品视频| 亚洲美女尤物影院| 清纯唯美日韩制服另类| 国产超碰精品| 国产精品日韩在线| 国产成人毛片| 91人成网站www| 午夜视频一区二区在线观看| 成人xxxxx色| 精品国产一区二区三区不卡蜜臂 | 欧美午夜精品一区二区三区电影| 日韩黄色影视| 婷婷综合伊人| 精品成在人线av无码免费看| 99伊人成综合| 日韩精品免费播放| 狠狠色丁香久久婷婷综| 又大又长粗又爽又黄少妇视频| 波波电影院一区二区三区| 少妇特黄一区二区三区| 国产精品久久影院| 久久久91视频| 欧美视频在线观看免费| 亚洲一级片免费看| 精品久久人人做人人爰| 欧美亚洲日本| 久久综合亚洲社区| 9999精品成人免费毛片在线看| 日韩美女免费线视频| 四虎精品永久免费| 国产欧美日韩视频一区二区三区| 国产精品嫩草影院在线看| 26uuu成人| 中国女人久久久| 亚洲怡红院在线| 91视频你懂的| 欧美黑人性猛交xxx| 欧美日韩国产区| 国产精品久久影视| 日韩精品在线免费观看视频| 精品国产白色丝袜高跟鞋| 97成人精品视频在线观看| 日韩久久99| 久久亚洲高清| 你懂的国产精品永久在线| 波多野结衣家庭教师视频| 国产一区二区三区在线观看免费| 亚洲熟女乱综合一区二区三区| 国产精品美女久久久久aⅴ| 日本污视频在线观看| 欧美老女人第四色| 亚洲欧美丝袜中文综合| 伦伦影院午夜日韩欧美限制| 吉吉日韩欧美| 国产精品白丝jk白祙| 色琪琪久久se色| 国产三区在线视频| 懂色一区二区三区免费观看| 欧美一级特黄高清视频| 色爱区综合激月婷婷| 开心激情综合网| 免费av在线一区| 日韩美女在线| 日韩啊v在线| 亚洲一卡久久| xxxx黄色片| 一区二区三区在线观看网站| 91成品人影院| 国产午夜精品免费一区二区三区| 高清精品在线| 国产精品久久久久久久免费大片 | 99久久免费国产精精品| 亚洲一级免费视频| 在线男人天堂| 久久99久久99精品蜜柚传媒| 黄色在线一区| 韩国三级在线播放| 亚洲日本在线看| 一区二区三区免费在线视频| 伊人伊成久久人综合网小说| 周于希免费高清在线观看| 国产亚洲情侣一区二区无| 欧美视频官网| 香蕉视频在线观看黄| 亚洲乱码中文字幕| 99久久国产免费| 久久久av一区| 成人影院网站ww555久久精品| 亚洲视频精品一区| 老鸭窝一区二区久久精品| 国产第一页精品| 欧美午夜精品久久久久久超碰| 国产日本在线观看| 国产精品国产三级国产aⅴ浪潮| 妖精视频一区二区三区免费观看| 丰满爆乳一区二区三区| 91视频一区二区| 狠狠狠狠狠狠狠| 中文字幕欧美亚洲| 久久伊人国产| 男女啪啪的视频| 国产精品资源网| 久久精品国产亚洲av无码娇色| 精品国产百合女同互慰| 55av亚洲| 欧美日韩亚洲免费| 免费高清成人在线| 五月综合色婷婷| 欧美xxxx在线观看| 91超碰在线| 蜜桃91精品入口| 日本在线观看不卡视频| 国产精品视频一区二区在线观看| 欧美一区二区三区免费大片| 欧美精品videosex| 美女被啪啪一区二区| 轻轻草成人在线| 久久高清内射无套| 亚洲精品国产suv| 欧洲成人一区| 黄色一级视频播放| 9人人澡人人爽人人精品| 亚洲精品成人在线视频| 俺去亚洲欧洲欧美日韩| 99久久免费精品国产72精品九九| 久色视频在线播放| 欧美高清一级片在线观看| 亚洲不卡免费视频| 欧美综合第一页| 亚洲最大黄网| 黄色正能量网站| 欧美精选在线播放| 97久久人人超碰caoprom| 日韩和欧美的一区二区| 国产suv一区二区三区88区| 无码人妻精品一区二区| 操91在线视频| 沈樵精品国产成av片| 搡的我好爽在线观看免费视频| 婷婷激情综合网| 老司机福利在线视频| 久久99精品久久久久久青青日本 | 成人片在线免费看| 久久久久免费| 国产主播在线播放| 色偷偷av一区二区三区| 欧美男男freegayvideosroom| 777一区二区| 日韩欧美在线第一页| 免费网站成人|