精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

OpenAI 姚順雨:“算法為王”終結(jié),歡迎來(lái)到“產(chǎn)品思維”時(shí)代

人工智能
從DeepBlue擊敗象棋世界冠軍、AlphaGo征服圍棋、GPT-4刷爆各類(lèi)考試榜單,到o1、R1等新一代模型橫掃數(shù)學(xué)、編程、寫(xiě)作、操作等任務(wù),每一次歷史性突破的背后,都是訓(xùn)練方法、模型架構(gòu)的根本性創(chuàng)新。

回顧過(guò)去幾十年,AI的發(fā)展幾乎就是一部“頂級(jí)模型與新方法”迭代史。

從DeepBlue擊敗象棋世界冠軍、AlphaGo征服圍棋、GPT-4刷爆各類(lèi)考試榜單,到o1、R1等新一代模型橫掃數(shù)學(xué)、編程、寫(xiě)作、操作等任務(wù),每一次歷史性突破的背后,都是訓(xùn)練方法、模型架構(gòu)的根本性創(chuàng)新。

這時(shí)候的游戲規(guī)則很簡(jiǎn)單:誰(shuí)能發(fā)明更強(qiáng)的訓(xùn)練方法、模型架構(gòu),就能稱霸榜單;誰(shuí)能在ImageNet、GLUE、MMLU等benchmark上顯著提升,就能寫(xiě)進(jìn)教材、贏得引用。

圖片圖片

姚順雨畢業(yè)于清華姚班,普林斯頓大學(xué)計(jì)算機(jī)科學(xué)博士,2024 年 8 月加入 OpenAI,是思維樹(shù)(ToT)作者。

而現(xiàn)在,AI領(lǐng)域長(zhǎng)達(dá)數(shù)十年的“算法為王”思路,終于迎來(lái)顛覆。OpenAI的研究員姚順雨在一篇文章寫(xiě)道:先驗(yàn)和環(huán)境遠(yuǎn)比算法本身更重要。他將接下來(lái)的AI時(shí)刻稱之為“下半場(chǎng)”。

“AI第一半場(chǎng)像極了‘應(yīng)試教育’,刷榜、拿分、畢業(yè)。第二半場(chǎng)才是‘真教育’,要讓AI在真實(shí)世界持續(xù)創(chuàng)造價(jià)值。”

第一半場(chǎng),我們見(jiàn)證了方法與模型的輝煌;第二半場(chǎng),我們要直面現(xiàn)實(shí)世界的復(fù)雜與挑戰(zhàn)。只有解決“效用問(wèn)題”,讓AI成為現(xiàn)實(shí)中的價(jià)值創(chuàng)造者,這場(chǎng)比賽才算真正開(kāi)始。

To thrive in this second half, we’ll need a timely shift in mindset and skill set, ones perhaps closer to a product manager.

可以理解為:“未來(lái),第一流AI研究員的能力,或許更像一位產(chǎn)品經(jīng)理,而不是算法工程師。

以下是文章全文,文摘菌做了不改變?cè)獾木幾g:

圖片圖片

簡(jiǎn)而言之:我們正處在AI的中場(chǎng)時(shí)刻。

幾十年來(lái),AI領(lǐng)域的核心一直在于開(kāi)發(fā)新的訓(xùn)練方法和模型。這些努力確實(shí)帶來(lái)了巨大突破:從在國(guó)際象棋和圍棋上擊敗世界冠軍,到在SAT和律師資格考試上超越大多數(shù)人類(lèi),再到收獲國(guó)際數(shù)學(xué)奧林匹克(IMO)和國(guó)際信息學(xué)奧林匹克(IOI)的金牌。

這些載入史冊(cè)的里程碑,無(wú)論是DeepBlue、AlphaGo、GPT-4,還是o系列模型,背后其實(shí)都離不開(kāi)AI方法的根本創(chuàng)新:搜索、深度強(qiáng)化學(xué)習(xí)、模型規(guī)模擴(kuò)展和推理能力。隨著時(shí)間推移,AI的表現(xiàn)總是在持續(xù)提升。

那現(xiàn)在到底發(fā)生了什么變化?

用三個(gè)詞概括:強(qiáng)化學(xué)習(xí)(RL)終于“成了”(RL finally works)。更準(zhǔn)確地說(shuō),是強(qiáng)化學(xué)習(xí)終于實(shí)現(xiàn)了泛化。

經(jīng)過(guò)多年的探索和一系列關(guān)鍵節(jié)點(diǎn)的積累,我們終于找到了一個(gè)行之有效的通用方法,可以用語(yǔ)言和推理來(lái)解決各種強(qiáng)化學(xué)習(xí)任務(wù)。

要知道,就在一年前,如果你跟大多數(shù)AI研究人員說(shuō):“有一種通用方法,既能搞定軟件開(kāi)發(fā)、創(chuàng)意寫(xiě)作、IMO級(jí)別的數(shù)學(xué)、鼠標(biāo)鍵盤(pán)操作,還能處理長(zhǎng)篇問(wèn)答。”很多人都會(huì)覺(jué)得你是在天方夜譚。

畢竟,這些任務(wù)都極其復(fù)雜,許多研究者一輩子的學(xué)術(shù)生涯可能只專注于其中一個(gè)小領(lǐng)域。

但現(xiàn)在,這一切真的成真了。

接下來(lái)會(huì)發(fā)生什么?AI的“下半場(chǎng)”。

從現(xiàn)在開(kāi)始,將把重點(diǎn)從“解決問(wèn)題”轉(zhuǎn)向“定義問(wèn)題”。在這個(gè)新的階段,如何評(píng)估AI能力,比單純訓(xùn)練模型更加重要。

我們不再只問(wèn)“我們能不能訓(xùn)練出能解決X問(wèn)題的模型?”,而是要問(wèn)“我們究竟應(yīng)該訓(xùn)練AI去做什么?我們又該如何衡量真正的進(jìn)步?”想要在下半場(chǎng)脫穎而出,我們不僅要及時(shí)調(diào)整思維方式和能力結(jié)構(gòu),甚至可能需要逐漸向產(chǎn)品經(jīng)理靠攏。

1.上半場(chǎng)

要理解AI的“上半場(chǎng)”,不妨看看那些真正的贏家。

到目前為止,你認(rèn)為最具影響力的AI論文有哪些?我做過(guò)斯坦福224N課程里的一個(gè)小測(cè)試,結(jié)果其實(shí)并不意外:Transformer、AlexNet、GPT-3等等。

這些論文有什么共同點(diǎn)?它們都帶來(lái)了基礎(chǔ)性的突破,讓我們能訓(xùn)練出更強(qiáng)大的模型。同時(shí),它們之所以能發(fā)表,也因?yàn)樵谀承┗鶞?zhǔn)測(cè)試上取得了顯著提升。

但其實(shí)還有個(gè)更深層的共性:這些“贏家”本質(zhì)上都是新的訓(xùn)練方法或模型,而不是基準(zhǔn)測(cè)試或具體任務(wù)。哪怕是公認(rèn)最具影響力的基準(zhǔn)數(shù)據(jù)集ImageNet,它的引用量還不到AlexNet的三分之一。而如果你再看看方法和基準(zhǔn)之間的對(duì)比,這種差距就更加明顯了。

以Transformer為例,它的主要基準(zhǔn)是WMT’14機(jī)器翻譯任務(wù)。WMT’14的工作坊報(bào)告被引用大約1,300次,而Transformer論文的引用數(shù)已經(jīng)超過(guò)16萬(wàn)。

圖片圖片

這恰好說(shuō)明了AI“上半場(chǎng)”的玩法:重心始終在于打造新的模型和方法,至于評(píng)測(cè)和基準(zhǔn)測(cè)試,雖然必不可少,但始終只是輔助,為論文體系服務(wù)。

為什么會(huì)這樣?很大一個(gè)原因在于,在AI發(fā)展的上半場(chǎng),提出新方法本身比設(shè)計(jì)新任務(wù)更難、更令人興奮。創(chuàng)造一項(xiàng)全新的算法或模型架構(gòu),比如反向傳播算法、卷積神經(jīng)網(wǎng)絡(luò)(AlexNet),或GPT-3背后的Transformer,都需要極高的洞見(jiàn)和工程能力。

相比之下,為AI設(shè)計(jì)任務(wù)通常要簡(jiǎn)單得多:我們只需把人類(lèi)已經(jīng)在做的事情(比如翻譯、圖像識(shí)別、下棋)直接轉(zhuǎn)換成基準(zhǔn)測(cè)試即可,這里面并沒(méi)有太多創(chuàng)新或者技術(shù)難點(diǎn)。

此外,新方法往往比具體任務(wù)更具通用性和適用范圍,因此價(jià)值更高。比如Transformer架構(gòu),最初只是在WMT’14機(jī)器翻譯數(shù)據(jù)集上驗(yàn)證,但后來(lái)卻成為計(jì)算機(jī)視覺(jué)、自然語(yǔ)言處理、強(qiáng)化學(xué)習(xí)等眾多領(lǐng)域的核心動(dòng)力,遠(yuǎn)遠(yuǎn)超出了它最初的應(yīng)用場(chǎng)景。

一個(gè)優(yōu)秀的新方法可以在許多不同的基準(zhǔn)測(cè)試上取得突破,因?yàn)樗旧砗?jiǎn)潔而通用,其影響力自然也就跨越了單一任務(wù)。

這種模式持續(xù)了數(shù)十年,并不斷催生出改變世界的創(chuàng)新和突破,其具體表現(xiàn)就是各個(gè)領(lǐng)域基準(zhǔn)成績(jī)的不斷刷新。那么,這種游戲規(guī)則為什么會(huì)發(fā)生改變?原因在于,所有這些創(chuàng)新和突破的積累,已經(jīng)讓我們?cè)凇敖鉀Q任務(wù)”這件事上,獲得了質(zhì)的飛躍和真正可行的“通用配方”。

2.“通用配方”

那么,這套“通用配方”究竟是什么?其實(shí)它的核心要素并不意外:大規(guī)模語(yǔ)言預(yù)訓(xùn)練、模型和數(shù)據(jù)的極致擴(kuò)展,以及“推理+行動(dòng)”的理念。乍一聽(tīng),這些詞可能和硅谷每天流行的術(shù)語(yǔ)沒(méi)什么兩樣,但為什么要稱之為“配方”呢?

我們可以從強(qiáng)化學(xué)習(xí)(RL)的角度來(lái)理解。強(qiáng)化學(xué)習(xí)常被認(rèn)為是AI的“終極形態(tài)”,畢竟,從理論上講,RL可以保證在各種博弈中取勝;從實(shí)際應(yīng)用看,沒(méi)有RL也很難想象像AlphaGo這樣超越人類(lèi)的系統(tǒng)會(huì)出現(xiàn)。

在強(qiáng)化學(xué)習(xí)中,核心有三大要素:算法、環(huán)境和先驗(yàn)知識(shí)。長(zhǎng)期以來(lái),RL研究者的關(guān)注點(diǎn)主要集中在算法本身(比如REINFORCE、DQN、TD-learning、actor-critic、PPO、TRPO等),也就是智能體如何學(xué)習(xí)的“智慧核心”,而環(huán)境和先驗(yàn)知識(shí)通常被看作是固定的或者只是最簡(jiǎn)單的配置。

舉個(gè)例子,Sutton和Barto那本經(jīng)典的RL教科書(shū),幾乎只講算法,幾乎沒(méi)有涉及環(huán)境設(shè)計(jì)或先驗(yàn)知識(shí)的內(nèi)容。

圖片圖片

然而,進(jìn)入深度強(qiáng)化學(xué)習(xí)時(shí)代后,大家逐漸意識(shí)到,環(huán)境本身對(duì)最終效果有著巨大的影響:一種算法的表現(xiàn),往往高度依賴于它所被開(kāi)發(fā)和測(cè)試的環(huán)境。如果忽略了環(huán)境,你可能會(huì)造出一個(gè)只在“玩具”環(huán)境中表現(xiàn)優(yōu)異的“最優(yōu)”算法。所以,為什么我們不先弄清楚到底要解決什么樣的環(huán)境,再去找最合適的算法呢?

Universe項(xiàng)目Universe項(xiàng)目

這正是OpenAI最初的思路。他們先推出了gym,一個(gè)涵蓋各種游戲的標(biāo)準(zhǔn)RL環(huán)境,之后又有了World of Bits和Universe項(xiàng)目,試圖把互聯(lián)網(wǎng)或者計(jì)算機(jī)本身變成一個(gè)“游戲環(huán)境”。這個(gè)思路聽(tīng)起來(lái)很不錯(cuò)吧?只要我們能把所有數(shù)字世界都變成可操作的環(huán)境,然后用聰明的RL算法去解決它們,數(shù)字世界的AGI似乎就指日可待了。

這個(gè)計(jì)劃很不錯(cuò),但卻沒(méi)有完全奏效。OpenAI在這條路上確實(shí)取得了不少進(jìn)展,比如用RL解決了Dota、機(jī)械手等難題。但他們始終沒(méi)能攻克“使用計(jì)算機(jī)”或者“網(wǎng)頁(yè)導(dǎo)航”這樣的任務(wù),而且在一個(gè)領(lǐng)域?qū)W到的RL代理,幾乎無(wú)法遷移到另一個(gè)領(lǐng)域。顯然,某個(gè)關(guān)鍵環(huán)節(jié)還缺失了。

直到GPT-2和GPT-3的出現(xiàn),大家才意識(shí)到,缺的其實(shí)是“先驗(yàn)知識(shí)”。你需要大規(guī)模的語(yǔ)言預(yù)訓(xùn)練,把普世的常識(shí)和語(yǔ)言知識(shí)“蒸餾”進(jìn)模型里,之后再進(jìn)行微調(diào),才能讓AI成為網(wǎng)頁(yè)代理(WebGPT)或者聊天機(jī)器人(ChatGPT),并最終改變世界。事實(shí)證明,RL中最關(guān)鍵的部分,可能既不是算法本身,也不是環(huán)境本身,而是“先驗(yàn)”。而這些先驗(yàn)知識(shí),可以通過(guò)和RL完全無(wú)關(guān)的方式獲得。

大規(guī)模語(yǔ)言預(yù)訓(xùn)練為聊天場(chǎng)景帶來(lái)了良好的先驗(yàn),但在“控制計(jì)算機(jī)”或“玩電子游戲”等領(lǐng)域,效果卻遠(yuǎn)遠(yuǎn)不如聊天。

地址:https://arxiv.org/abs/2010.02903地址:https://arxiv.org/abs/2010.02903

為什么?這些領(lǐng)域距離互聯(lián)網(wǎng)文本的分布更遠(yuǎn),直接在這些任務(wù)上用SFT(監(jiān)督微調(diào))或RL,泛化能力很差。我在2019年就注意到這個(gè)問(wèn)題:當(dāng)時(shí)GPT-2剛剛問(wèn)世,我嘗試用它加SFT和RL來(lái)玩文字冒險(xiǎn)游戲:CALM,這也是世界上第一個(gè)用預(yù)訓(xùn)練語(yǔ)言模型構(gòu)建的智能體。模型在單個(gè)游戲上要經(jīng)歷數(shù)百萬(wàn)步的RL訓(xùn)練,才能逐步“爬坡”;更糟糕的是,換一個(gè)新游戲就幾乎無(wú)法遷移。

雖然這正是RL的典型表現(xiàn),RL研究者對(duì)此早已見(jiàn)怪不怪,但我還是覺(jué)得奇怪:我們?nèi)祟?lèi)明明可以幾乎不用訓(xùn)練就能上手新游戲,還能很快表現(xiàn)得更好。這讓我第一次有了“頓悟”,人類(lèi)之所以能泛化,是因?yàn)槲覀儾恢皇菣C(jī)械地執(zhí)行“去2號(hào)柜子”“用鑰匙1打開(kāi)3號(hào)箱子”“用劍打怪”這種操作。我們還會(huì)主動(dòng)思考,比如:“地牢很危險(xiǎn),我需要武器。現(xiàn)在沒(méi)看到武器,可能得從鎖著的箱子里找。3號(hào)箱子在2號(hào)柜子里,那我應(yīng)該先去那里把它打開(kāi)。”

reasoningreasoning

“思考”或“推理”本質(zhì)上是一種非常特殊的“行動(dòng)”:它并不會(huì)直接改變外部世界,但推理本身的空間卻是開(kāi)放且近乎無(wú)限的。

你可以思考一個(gè)單詞、一句話、一段文章,甚至隨意組合一萬(wàn)個(gè)英文單詞,而你周?chē)氖澜鐓s不會(huì)因此立即發(fā)生變化。在經(jīng)典的強(qiáng)化學(xué)習(xí)理論框架下,這其實(shí)是一個(gè)很難處理的問(wèn)題,也讓決策變得幾乎不可能。想象一下,你需要在兩個(gè)箱子中選擇一個(gè),其中一個(gè)裝著一百萬(wàn)美元,另一個(gè)是空的,你的期望收益是五十萬(wàn)美元。但如果我再加入無(wú)限多個(gè)空箱子,你的期望收益就會(huì)變成零。

然而,一旦我們把“推理”納入RL環(huán)境的動(dòng)作空間,并用語(yǔ)言預(yù)訓(xùn)練獲得的先驗(yàn)知識(shí)來(lái)驅(qū)動(dòng)AI泛化能力,就能在做出不同決策時(shí)靈活地分配推理所需的計(jì)算資源。

這是一件極其神奇的事。坦白說(shuō),我自己對(duì)其中的奧秘還沒(méi)有完全梳理清楚,可能日后還需要專門(mén)寫(xiě)一篇文章來(lái)詳細(xì)討論。如果你感興趣,可以去看一下ReAct論文,了解智能體推理的起源故事,也能感受到我當(dāng)時(shí)的思考和靈感。

地址:https://arxiv.org/abs/2210.03629地址:https://arxiv.org/abs/2210.03629

我的直觀理解是:即使你面對(duì)無(wú)數(shù)個(gè)空箱子,在你過(guò)往的所有經(jīng)歷和各類(lèi)“游戲”中,這些選擇和嘗試其實(shí)積累了經(jīng)驗(yàn),也為你在關(guān)鍵時(shí)刻做出正確決策打下了基礎(chǔ)。抽象地說(shuō),語(yǔ)言通過(guò)推理,賦予了智能體強(qiáng)大的泛化能力。

當(dāng)我們找到了合適的RL先驗(yàn)(即通過(guò)大規(guī)模語(yǔ)言預(yù)訓(xùn)練獲得的知識(shí))和理想的RL環(huán)境(即將語(yǔ)言推理作為行動(dòng)的一部分),你會(huì)發(fā)現(xiàn),RL算法本身反而變得不那么重要了。于是我們才有了o系列、R1、deep research、能用計(jì)算機(jī)的智能體等一系列突破。諷刺的是,長(zhǎng)期以來(lái),RL研究者一直把重心放在算法上,幾乎無(wú)人關(guān)注“先驗(yàn)”,幾乎所有RL實(shí)驗(yàn)都從零開(kāi)始。我們花了幾十年時(shí)間,才終于意識(shí)到,也許最應(yīng)該關(guān)注的恰恰是我們一直忽略的部分。

正如喬布斯所說(shuō):“你無(wú)法預(yù)見(jiàn)未來(lái)如何把這些點(diǎn)連接起來(lái),只有當(dāng)你回頭看時(shí),這些點(diǎn)才會(huì)連成線。”

3.下半場(chǎng)

這套“通用配方”正在徹底改變AI的游戲規(guī)則。回顧上半場(chǎng)的玩法:

  • 我們不斷提出新穎的訓(xùn)練方法或模型,在各種基準(zhǔn)測(cè)試上“爬坡”突破;
  • 隨之創(chuàng)造更難的基準(zhǔn)測(cè)試,然后繼續(xù)循環(huán)。

但這一套游戲正在被“配方”所打破,因?yàn)椋哼@套配方本質(zhì)上已經(jīng)把“刷榜”變成了標(biāo)準(zhǔn)化、產(chǎn)業(yè)化的流水線工作,不再需要太多全新的創(chuàng)意。只要按部就班地?cái)U(kuò)大模型、數(shù)據(jù)和算力,就能高效泛化到各種任務(wù)。你費(fèi)盡心思為某個(gè)特定任務(wù)設(shè)計(jì)的新方法,或許能提升5%,但下一代o系列模型,哪怕不是專門(mén)為這個(gè)任務(wù)設(shè)計(jì),可能就能直接提升30%。

即便我們不斷設(shè)計(jì)更難的基準(zhǔn),配方的擴(kuò)展能力極強(qiáng),很快(而且越來(lái)越快)就能攻破這些新基準(zhǔn)。我的同事Jason Wei曾用一幅非常直觀的圖,清楚地展現(xiàn)了這一趨勢(shì):

progressprogress

那么,下半場(chǎng)還能怎么玩?如果創(chuàng)新方法已經(jīng)不再重要,而更難的基準(zhǔn)測(cè)試也會(huì)被“配方”迅速攻克,我們還能做什么?

我認(rèn)為,我們需要從根本上重新思考“評(píng)測(cè)”這件事。這不僅僅是設(shè)計(jì)更難的新基準(zhǔn),更是在質(zhì)疑現(xiàn)有的評(píng)測(cè)體系,創(chuàng)造全新的評(píng)測(cè)方式,從而倒逼我們?nèi)グl(fā)明超越現(xiàn)有“通用配方”的新方法。這其實(shí)很難做到,因?yàn)槿祟?lèi)本身就有慣性,我們很少會(huì)主動(dòng)質(zhì)疑那些被視為理所當(dāng)然的基本假設(shè),往往下意識(shí)地把它們當(dāng)作“自然法則”。

舉個(gè)例子來(lái)說(shuō)明這種慣性:假如你曾基于人類(lèi)考試體系,發(fā)明過(guò)歷史上最成功的AI評(píng)測(cè)之一。在2021年,這或許是一個(gè)極為大膽的創(chuàng)意,但三年后,這個(gè)思路已經(jīng)被用到極致。你會(huì)怎么辦?大概率是再設(shè)計(jì)一套更難的考試。又或者,你已經(jīng)讓AI攻克了基礎(chǔ)的編程任務(wù),你可能會(huì)選擇不斷尋找更高難度的編程題,直到AI達(dá)到國(guó)際信息學(xué)奧賽金牌水平。

這種慣性很正常,但問(wèn)題在于:AI已經(jīng)在國(guó)際象棋、圍棋上擊敗了世界冠軍,在SAT、律師資格考試中超過(guò)了大多數(shù)人類(lèi),甚至在IOI、IMO上拿到了金牌。可放眼現(xiàn)實(shí)世界,至少?gòu)慕?jīng)濟(jì)和GDP的角度來(lái)看,這個(gè)世界并沒(méi)有發(fā)生什么本質(zhì)性的變化。

我把這稱為“效用問(wèn)題”(utility problem),并認(rèn)為這是AI領(lǐng)域目前最重要的問(wèn)題。

或許我們很快就能解決這個(gè)問(wèn)題,也可能還需要更長(zhǎng)時(shí)間。但無(wú)論如何,問(wèn)題的根源其實(shí)出奇地簡(jiǎn)單:我們的評(píng)測(cè)體系與真實(shí)世界的應(yīng)用環(huán)境,在許多基本層面上存在差異。舉兩個(gè)例子:

  • 傳統(tǒng)的AI評(píng)測(cè)“理應(yīng)”是自動(dòng)化的:通常是讓智能體接收一個(gè)任務(wù)輸入,獨(dú)立完成任務(wù),然后獲得獎(jiǎng)勵(lì)或評(píng)分。但現(xiàn)實(shí)世界中,智能體往往需要在任務(wù)過(guò)程中與人類(lèi)持續(xù)互動(dòng)——比如,你不會(huì)給客服發(fā)一大段信息后,等上十分鐘就期望對(duì)方能一次性給你完美的答復(fù)。正因?yàn)橘|(zhì)疑了這種評(píng)測(cè)假設(shè),新的基準(zhǔn)應(yīng)運(yùn)而生:要么引入真實(shí)用戶參與(比如 Chatbot Arena),要么通過(guò)模擬用戶來(lái)實(shí)現(xiàn)交互(比如 tau-bench)。

tautau

  • 評(píng)測(cè)“理應(yīng)”是獨(dú)立同分布(i.i.d.)的:如果你有一個(gè)包含500個(gè)任務(wù)的測(cè)試集,通常會(huì)讓智能體分別獨(dú)立地完成每個(gè)任務(wù),然后將所有分?jǐn)?shù)做平均,得出一個(gè)總體指標(biāo)。但現(xiàn)實(shí)中,任務(wù)往往是按序進(jìn)行的,而非彼此獨(dú)立、同時(shí)發(fā)生。比如,Google 的一位軟件工程師會(huì)隨著對(duì)代碼庫(kù)的熟悉,在解決 google3 的各種問(wèn)題時(shí)表現(xiàn)得越來(lái)越好;而一個(gè)AI軟件工程師則是不斷解決同一倉(cāng)庫(kù)里的各種問(wèn)題,卻無(wú)法像人類(lèi)那樣積累“熟悉感”。顯然,我們需要具備長(zhǎng)期記憶能力的方法(事實(shí)上相關(guān)研究已經(jīng)出現(xiàn)),但學(xué)術(shù)界卻沒(méi)有相應(yīng)的基準(zhǔn)來(lái)證明其必要性,甚至缺乏質(zhì)疑i.i.d.假設(shè)的勇氣。而這個(gè)假設(shè)恰恰是機(jī)器學(xué)習(xí)的基礎(chǔ)之一。

這些假設(shè)“似乎一直如此”,在AI的上半場(chǎng),基于這些假設(shè)來(lái)開(kāi)發(fā)評(píng)測(cè)體系和基準(zhǔn)其實(shí)沒(méi)什么問(wèn)題,因?yàn)楫?dāng)智能水平較低時(shí),單純提升智能本身確實(shí)能帶來(lái)效用的提升。但現(xiàn)在,“通用配方”已經(jīng)在這些假設(shè)下無(wú)往不利。因此,下半場(chǎng)的游戲規(guī)則變成了:

  • 我們需要圍繞真實(shí)世界的效用,開(kāi)發(fā)全新的評(píng)測(cè)體系或任務(wù)。
  • 然后用“通用配方”去解決這些任務(wù),或在配方基礎(chǔ)上引入新的創(chuàng)新組件,循環(huán)推進(jìn)。

這個(gè)新游戲很難,因?yàn)樗錆M了不確定和陌生。但也正因如此,它令人無(wú)比興奮。上半場(chǎng)的玩家在解決電子游戲和考試題,而下半場(chǎng)的玩家,則有機(jī)會(huì)用智能打造出真正有用的產(chǎn)品,締造數(shù)十億、數(shù)萬(wàn)億美元的公司。上半場(chǎng)充滿了各種“微創(chuàng)新”的方法和模型,而下半場(chǎng)則會(huì)對(duì)這些創(chuàng)新做出真正的篩選。

只要你沿用舊的假設(shè),“通用配方”就能輕易碾壓你的微小改進(jìn);但如果你能創(chuàng)造出打破舊配方的新假設(shè),你就有機(jī)會(huì)做出真正改變游戲規(guī)則的研究。

責(zé)任編輯:武曉燕 來(lái)源: 大數(shù)據(jù)文摘
相關(guān)推薦

2025-09-12 13:00:05

2020-03-08 11:17:25

人工智能AI智能化

2024-08-02 13:33:04

2010-02-06 09:43:36

平臺(tái)ChromeAndroid

2019-01-24 14:24:14

谷歌安卓手機(jī)隱私

2025-04-18 09:04:00

2011-06-30 17:26:02

外鏈

2015-07-03 10:37:21

容器技術(shù)Docker云計(jì)算

2010-05-25 10:37:00

三網(wǎng)融合網(wǎng)絡(luò)加速網(wǎng)宿科技

2019-01-31 01:03:58

智能

2020-05-06 22:33:26

數(shù)字化農(nóng)業(yè)傳感器

2015-10-23 18:10:48

Twitter開(kāi)發(fā)者大會(huì)

2014-06-16 13:24:36

營(yíng)銷(xiāo)

2015-02-11 09:46:32

軟件定義SDNSDDC

2020-09-08 15:26:56

數(shù)字

2015-03-18 09:54:13

內(nèi)容為王服務(wù)為王大數(shù)據(jù)

2015-01-26 10:18:01

陳彤小米

2025-06-09 08:11:34

2013-11-25 13:55:12

大數(shù)據(jù)

2025-02-18 11:15:12

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

7777精品伊人久久久大香线蕉最新版| 97精品国产露脸对白| 在线视频中文亚洲| www.桃色.com| 欧美激情护士| 女人天堂亚洲aⅴ在线观看| 日韩一区二区三| 黄色片视频在线免费观看| 日本最新在线视频| av激情综合网| 国产欧美日韩亚洲精品| 精品视频在线观看免费| 欧美理论电影大全| 精品国产一区久久| 亚洲欧洲日韩综合二区| www.成人免费视频| 日韩一区欧美二区| 欧美精品videosex极品1| 欧美大波大乳巨大乳| 亚洲视频国产| 欧美日韩成人激情| 亚洲色欲综合一区二区三区| a篇片在线观看网站| 久久久久久久av麻豆果冻| caoporn国产精品免费公开| 午夜一区二区三区四区| 亚洲一区观看| 欧美黑人狂野猛交老妇| 手机av在线不卡| 蜜臀91精品国产高清在线观看| 欧美大片在线观看一区二区| 日本中文字幕精品—区二区| 欧美美女日韩| 精品久久久久久久久久国产| av动漫在线播放| 午夜在线视频| 中文字幕高清一区| 国产精品香蕉av| 日本va欧美va国产激情| 欧美国产激情| 久久精品一区中文字幕| 潮喷失禁大喷水aⅴ无码| 国产乱码精品一区二区亚洲| 亚洲精美色品网站| 国产乱淫av麻豆国产免费| 国产一区二区三区黄网站| 亚洲另类中文字| 亚洲午夜精品国产| 91在线高清| 日本一区二区免费在线观看视频 | 午夜亚洲视频| 精品亚洲一区二区三区| 9191在线视频| 色老头在线一区二区三区| 亚洲亚洲人成综合网络| 蜜桃视频一区二区在线观看| 国产精品久久麻豆| av色综合久久天堂av综合| 国产精品高清一区二区三区| 亚洲国产综合网| 岛国一区二区三区| 国产一区不卡在线观看| 神马久久久久久久久久| 99精品一区二区三区| 精品视频第一区| 毛片在线能看| 国产精品久久综合| 中文有码久久| av免费网站在线| 亚洲一区二区欧美日韩| av高清在线免费观看| 女人高潮被爽到呻吟在线观看| 高跟丝袜一区二区三区| 永久久久久久| a在线免费观看| 亚洲一区二区三区免费视频| 国产伦精品一区二区三区四区视频_| gogo久久| 在线亚洲高清视频| 亚洲va综合va国产va中文| 欧美激情三级| 日韩精品视频中文在线观看| 日韩人妻无码精品综合区| 欧美艳星介绍134位艳星| 精品国产sm最大网站免费看| 国产精品一区二区人妻喷水| 国产精品欧美三级在线观看| 日韩一区av在线| 国产精品815.cc红桃| 成人激情在线| 欧美日韩国产二区| 日本免费在线观看视频| 久久精品国产一区二区三区免费看| 亚洲一区二区三区香蕉| 在线观看毛片网站| 国产福利一区在线| 欧美日韩一区二区视频在线观看| 丰满少妇被猛烈进入| 26uuu久久天堂性欧美| 曰韩不卡视频| 性欧美freesex顶级少妇| 欧美少妇bbb| 蜜臀av粉嫩av懂色av| 成人高清电影网站| 午夜精品久久久久久久99黑人| 中文天堂在线播放| 成人国产一区二区三区精品| 亚洲精品乱码视频| av中文资源在线资源免费观看| 欧美视频在线一区| 亚洲男人在线天堂| 91精品电影| 国产精品999999| 日韩在线观看视频一区| 日韩理论片一区二区| av片中文字幕| 国偷自产视频一区二区久| 色婷婷综合成人av| 一级做a爰片久久毛片| 国v精品久久久网| aaa免费在线观看| 国内精品久久久久国产| 色综合一个色综合亚洲| 成人做爰69片免费| 国产精品99久久精品| 久久精品一本久久99精品| 日韩中文字幕在线观看视频| 成人综合激情网| 久久久成人精品一区二区三区| 亚洲精品国产嫩草在线观看| 日韩精品有码在线观看| 日韩成人一区二区三区| 国产精品系列在线观看| 男女啪啪的视频| 欧美一级做a| 国产亚洲精品高潮| 国产性生活视频| ww久久中文字幕| 能在线观看的av| 免费短视频成人日韩| 5278欧美一区二区三区| 小泽玛利亚一区二区三区视频| www.99精品| 欧美视频在线观看网站| 狼人天天伊人久久| 国内精品美女av在线播放| 性网爆门事件集合av| 怡红院av一区二区三区| av在线免费观看不卡| 中文一区一区三区免费在线观看| 成人久久一区二区| bt在线麻豆视频| 精品国产一区二区国模嫣然| 日韩精品无码一区二区| av不卡在线观看| 中文字幕日本最新乱码视频| 亚洲aa在线| 国产精品扒开腿做爽爽爽男男| 久久国产精品高清一区二区三区| 91成人在线精品| 久久久久亚洲AV成人无在| 美日韩一区二区| 久久久成人精品一区二区三区| 天堂精品在线视频| 久久99视频精品| 日本激情视频网站| 欧美午夜精品久久久久久人妖| 一道本在线观看| 亚洲乱妇老熟女爽到高潮的片| 天天揉久久久久亚洲精品| 91天堂在线观看| 岛国毛片av在线| 日韩欧美在线字幕| 免费观看a级片| 九九九久久久精品| 日韩精品在线观看av| 天堂成人娱乐在线视频免费播放网站 | 国产精品va在线播放我和闺蜜| 北岛玲一区二区三区| 欧美日韩国产首页| 久久久久久国产精品视频| 99久久婷婷国产综合精品电影| 日日碰狠狠丁香久燥| 久久久久久美女精品 | 国产亚洲电影| 91久久久久久久一区二区| 国产色婷婷在线| 亚洲色图校园春色| 国产成人精品毛片| 欧美性jizz18性欧美| 国产视频精品免费| 99精品国产视频| 日本在线一二三区| 亚洲乱码视频| 亚洲视频在线二区| 麻豆一区一区三区四区| 国产女人18毛片水18精品| 国产精品蜜臀| 色偷偷偷亚洲综合网另类| 亚洲精品综合网| 日韩免费看片| 久久亚洲影音av资源网| 色欲久久久天天天综合网| 欧美艳星brazzers| 日本一本高清视频| 中文字幕精品综合| 欧美肉大捧一进一出免费视频| 久久99热国产| 无码人妻丰满熟妇区毛片18| 欧美99久久| 亚洲欧美日韩在线综合| 日本午夜精品久久久| 91色琪琪电影亚洲精品久久| 日韩av中字| 久久久久久一区二区三区| 亚洲1卡2卡3卡4卡乱码精品| 亚洲欧美国产精品久久久久久久| 亚洲第九十九页| 欧美日韩高清在线| 亚洲av无码不卡| 午夜不卡av在线| 美女被爆操网站| 日日欢夜夜爽一区| 五十路熟女丰满大屁股| 一本一本久久a久久综合精品| 日本在线免费观看一区| 日韩超碰人人爽人人做人人添| 亚洲www在线| 日本午夜精品久久久久| 国产精品爱久久久久久久| www.九色在线| 午夜精品久久17c| 福利写真视频网站在线| 欧美成年人视频网站| 暖暖日本在线观看| 最近2019中文字幕一页二页| 男同在线观看| 亚洲美女性视频| 视频在线观看你懂的| 欧美亚洲动漫另类| 99超碰在线观看| 一本到不卡免费一区二区| 国产a∨精品一区二区三区仙踪林| 亚洲综合男人的天堂| 青青草手机视频在线观看| 亚洲婷婷国产精品电影人久久| 性色国产成人久久久精品| 国产精品18久久久久久久网站| www.这里只有精品| 老司机一区二区| 久久久久国产一区| 看电视剧不卡顿的网站| 日本三级黄色网址| 久久精品国产99国产| 国产精品自拍视频在线| 国产综合一区二区| 在线免费看v片| 丰满亚洲少妇av| 加勒比精品视频| 国产女人18毛片水真多成人如厕| 亚洲欧美va天堂人熟伦| 国产精品乱码一区二三区小蝌蚪| 亚洲一级理论片| 亚洲欧美日韩电影| 国产一二三四区| 国产三级精品在线| 欧美三级视频网站| 综合久久综合久久| 久草网在线观看| 狠狠色狠狠色综合日日五| 日本黄色中文字幕| 91精品久久久久久久91蜜桃 | 蜜乳av一区二区三区| 国产乱叫456| 成人国产精品免费观看视频| 疯狂揉花蒂控制高潮h| 欧美国产日韩亚洲一区| 日本黄色免费片| 亚洲18色成人| 做爰视频毛片视频| 欧美成人综合网站| 视频国产一区二区三区| 色七七影院综合| 性直播体位视频在线观看| 欧洲亚洲女同hd| www.欧美| 国产精品一区二区三区在线播放 | 亚洲欧美电影| 成人黄色在线观看| 欧美一级一片| 国产成年人在线观看| 精品999成人| 久久99爱视频| 99re亚洲国产精品| 永久免费看片视频教学| 午夜精品福利一区二区蜜股av | 亚洲日本精品| 亚洲美女少妇无套啪啪呻吟| 亚洲性图一区二区| 99久久久国产精品| 成人涩涩小片视频日本| 日韩欧美国产一区二区| 午夜精品久久久久久久爽| 亚洲视频网站在线观看| 丁香花在线影院| 亚洲sss综合天堂久久| 久久99性xxx老妇胖精品| 国产精品igao激情视频| 奇米精品一区二区三区在线观看一| 精品人妻二区中文字幕| 国产精品久久一卡二卡| 国产91国语对白在线| 精品成a人在线观看| 男人天堂久久久| 国产精品成人久久久久| 精品人人人人| 欧美日韩dvd| 九色综合狠狠综合久久| japanese中文字幕| 午夜精品一区二区三区电影天堂 | 亚洲精品观看| 综合视频在线观看| 日本亚洲最大的色成网站www| 亚洲一区二区在线免费| 亚洲最大成人网4388xx| av官网在线观看| 久久好看免费视频| 91精品店在线| 日本一区视频在线| 午夜影院日韩| 亚洲黄色在线网站| 亚洲国产欧美日韩另类综合| 一级黄色大片免费观看| 欧美日韩另类视频| 亚洲国产精品国自产拍久久| 久久久精品在线| 欧美日韩视频免费看| 亚洲二区三区四区| 日本不卡一二三区黄网| 精品欧美一区二区久久久| 疯狂做受xxxx欧美肥白少妇| 手机在线精品视频| 欧美激情奇米色| 操欧美女人视频| 欧美一卡2卡3卡4卡无卡免费观看水多多| 激情综合激情| bl动漫在线观看| 欧美日韩国产中文精品字幕自在自线| 女人18毛片水真多18精品| 欧美裸体xxxx极品少妇| 91午夜精品| 久久国产精品网| 99久久国产综合精品女不卡| 国产精品久久久久久久妇| 日韩成人小视频| 国产精品极品美女在线观看| 日韩欧美亚洲日产国| 麻豆精品一区二区综合av| 国产小视频你懂的| 欧美一级欧美三级| 岛国片av在线| 欧美日韩精品不卡| 欧美aaa在线| 污软件在线观看| 日韩女优制服丝袜电影| 成人黄色动漫| 日韩av高清在线播放| 久久精品国产精品青草| 国产精品成人免费观看| 亚洲成色777777女色窝| 自由日本语热亚洲人| 亚洲精品一区二区三区av| 国产精品资源在线看| 婷婷激情五月网| 中文字幕不卡在线视频极品| 国产一区精品二区| 国产 日韩 亚洲 欧美| 久久网站热最新地址| 一道本无吗一区| 国模精品视频一区二区| 国产欧美日韩视频在线| 日韩在线一区视频| 亚洲成人免费视频| av播放在线| 成人免费视频观看视频| 午夜影院日韩| 麻豆精品一区二区三区视频| 亚洲成人aaa| 国产亚洲精彩久久| 可以看毛片的网址| 欧美激情一区二区三区不卡 | 亚洲日日夜夜| 日韩欧美一区二| 最近中文字幕一区二区三区| 亚洲av成人精品毛片| 亚洲free嫩bbb| 玖玖玖国产精品| 日本在线观看视频网站| 日韩在线播放av| 久久不见久久见中文字幕免费 |