精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

圖靈獎頒給強化學習師徒,一個造船改行寫代碼,一個痛批AI投身AGI

人工智能 新聞
最近幾年來AI的重大進展,從AlphaGo到ChatGPT,都與他們開創的強化學習技術密切相關。

計算機最高獎圖靈獎揭曉!

強化學習先驅Andrew Barto與Richard Sutton共同獲獎,他們被評價為“引領基礎AI技術開發的研究人員”

圖片

值得一提的是,兩位是師徒關系,Richard Sutton是Andrew Barto他第一位博士生。

兩人1998年合著的《強化學習:導論》,時至今日也是強化學習的標準教材,引用數接近8萬,尤其在最近五年也仍在持續攀升。

圖片

最近幾年來AI的重大進展,從AlphaGo到ChatGPT,都與他們開創的強化學習技術密切相關。

師徒拉開了強化學習大門

先來看Andrew Barto,是馬薩諸塞大學阿默斯特分校信息與計算機科學系榮譽教授,年紀在76歲左右。

圖片

他是IEEE Fellow,曾獲馬薩諸塞大學神經科學終身成就獎、IJCAI 研究卓越獎(Research Excellence Award)和 IEEE 神經網絡學會先驅獎。

Barto本科畢業于密歇根大學數學專業,此前他主修的是船舶建筑與工程專業。在閱讀了邁克爾·阿比布、麥卡洛克和皮茨的著作后,他開始對使用計算機和數學來模擬大腦產生了興趣。

五年后,他以一篇關于細胞自動機的論文獲得了計算機的博士學位。

《細胞自動機作為自然系統的模型》

圖片

1977 年,他作為博士后研究助理在馬薩諸塞大學阿默斯特分校開始職業生涯,此后擔任過多個職位,包括副教授、教授和系主任。

任職期間,Barto 共同領導了自主學習實驗室(最初為自適應網絡實驗室),該實驗室提出了強化學習的幾個關鍵思想。

圖片

直到Richard Sutton來到他的實驗室,他們正式拉開了強化學習的大門。

圖片

2012年他官宣退休,再也不再招收學生。

再來看看他的學生Richard Sutton,時至今日仍然AGI探索積極分子。

目前,他是是阿爾伯塔大學計算機科學教授、Keen Technologies(一家總部位于德克薩斯州達拉斯的通用人工智能公司)的研究科學家,以及阿爾伯塔機器智能研究所(Amii)的首席科學顧問。

圖片

1978年,他從斯坦福大學心理學專業畢業,隨后在Andrew Barto的指導下,先后獲得了碩博學位。

他的博士論文《Temporal Credit Assignment in Reinforcement Learning》(強化學習中的時間學分分配),介紹了行為批判架構和時間學分分配,足足有210頁。

圖片而要說興趣轉向強化學習的緣由,他是受到Harry Klopf在 20 世紀 70 年代的研究成果的影響,該成果提出監督學習不足以用于人工智能或解釋智能行為,而由“行為的享樂方面”驅動的試錯學習才是必要的。

Sutton 從 2017 年到 2023 年是 DeepMind 的杰出研究科學家。在加入阿爾伯塔大學之前,他曾于 1998 年至 2002 年在新澤西州 Florham Park 的 AT&T 香農實驗室人工智能部門擔任首席技術人員。

2019年,他曾撰文《痛苦的教訓》痛批當前AI的發展,表示“未能吸取慘痛教訓,即從長遠來看,建立我們的思維方式是行不通的”。

他認為“70 年的人工智能研究表明,利用計算的通用方法最終是最有效的,而且領先優勢很大”,打敗了在計算機視覺、語音識別、國際象棋或圍棋等特定領域基于人類知識的努力。

2023年,他官宣與John Carmack合作,共同開發AGI,也就是Keen Technologies。

圖靈獎官方科普強化學習

強化學習的起源

強化學習是怎么來的?圖靈獎官網在頒獎公告中介紹到:

人工智能(AI)領域通常涉及構建智能體——即感知和行動的實體。

更強的智能體選擇更好行動方案。因此,人工智能的核心是某些行動方案比其他方案更好的觀念。獎勵——一個從心理學和神經科學借用的術語——表示提供給智能體與其實際行為質量相關的信號。強化學習(RL)是在此信號下學習如何更成功行為的進程。

獎勵學習的理念對動物培訓師來說已經存在了數千年。

后來,艾倫·圖靈在1950年的論文《Computing Machinery and Intelligence》中提出了“機器能思考嗎?”的問題,并提出了基于獎勵和懲罰的機器學習方法。

圖片

雖然圖靈報告稱已經使用這種方法進行了一些初步實驗, 且Arthur Samuel在20世紀50年代末開發了一個通過自我對弈學習的國際象棋程序,但在接下來的幾十年里,人們在這條道路上進步甚微。

圖片

直到20世紀80年代初,Barto和他的博士研究生Sutton受到心理學觀察的啟發,開始將強化學習構想為一個通用的問題框架。

他們借鑒了馬爾可夫決策過程(MDPs)提供的數學基礎。在馬爾可夫決策過程中,智能體在隨機環境中做出決策,每次狀態轉移后都會收到一個獎勵信號,并旨在最大化其長期累積獎勵。標準的馬爾可夫決策過程理論假設智能體知曉關于馬爾可夫決策過程的一切信息,而強化學習框架則允許環境和獎勵未知。強化學習所需的最少信息,再加上馬爾可夫決策過程框架的通用性,使得強化學習算法能夠應用于廣泛的問題,如下文將進一步解釋。

圖片

Barto和Sutton共同以及與其他人一起,開發了許多強化學習的基本算法方法。其中包括他們最重要的貢獻——時序差分學習(在解決獎勵預測問題上取得了重大進展),還有策略梯度方法以及將神經網絡用作表示學習函數的工具。

他們還提出了將學習與規劃相結合的智能體設計,展示了獲取環境知識作為規劃基礎的價值。

或許同樣具有影響力的是他們的教科書《Reinforcement Learning: An Introduction》(1998),這本書至今仍是該領域的標準參考文獻,被引用次數超過7.5萬次。它讓數千名研究人員得以理解這一新興領域并為之做出貢獻,直至今日仍激勵著計算機科學領域許多重要的研究活動。

圖片

深度強化學習的應用

盡管Barto和Sutton的算法是幾十年前開發的,但強化學習在實際應用中的重大進展卻是在過去十五年中通過將強化學習與深度學習算法(由2018年圖靈獎得主Bengio、Hinton和LeCun 創)相結合而實現的,這催生了深度強化學習技術。

強化學習最著名的例子是AlphaGo在2016年和2017年戰勝了最頂尖的人類圍棋選手。近期的另一項重大成就是ChatGPT。

ChatGPT是一個分兩個階段訓練的大語言模型,其中第二階段采用了一種名為基于人類反饋的強化學習(RLHF)的技術,以捕捉人類的期望。

圖片

強化學習在許多其他領域也取得了成功。一個備受矚目的研究實例是機器人在手中操作技能學習以及解決實體魔方問題,這表明在模擬環境中進行所有強化學習,最終在差異顯著的現實世界中也能取得成功。

圖片

其他領域包括網絡擁塞控制、芯片設計、互聯網廣告、優化、全球供應鏈優化、提升聊天機器人的行為和推理能力,甚至改進計算機科學中最古老問題之一——矩陣乘法的算法。

圖片

最后,一項部分受神經科學啟發的技術也反過來帶來了啟發。近期的研究(包括Barto的工作)表明,人工智能領域的特定強化學習算法能夠很好地解釋關于人類大腦中多巴胺系統的一系列研究發現。

美國計算機協會(ACM)主席Yannis Ioannidis稱“Barto和Sutton的工作展示了運用多學科方法應對我們領域長期存在的挑戰所蘊含的巨大潛力”。

從認知科學、心理學到神經科學等研究領域都啟發了強化學習的發展,強化學習為人工智能領域一些最重要的進展奠定了基礎,也讓我們對大腦的工作方式有了更深入的了解。

Barto和Sutton的工作并非我們可以拋在身后的墊腳石。強化學習仍在不斷發展,為計算機科學和許多其他學科的進一步發展提供了巨大潛力。我們用本領域最負盛名的獎項來表彰他們是恰如其分的。”

谷歌高級副總裁Jeff Dean(谷歌為圖靈獎提供資金支持)指出,“Barto和Sutton開創的強化學習直接回應了圖靈的挑戰”。

在過去幾十年里,他們的工作一直是人工智能發展的關鍵。他們開發的工具仍然是人工智能熱潮的核心支柱,帶來了重大進展,吸引了大批年輕研究人員,并推動了數十億美元的投資。強化學習的影響在未來仍將持續。”

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-05-13 13:57:13

ACMDeepseek-R模型

2025-03-06 07:35:30

2024-12-09 08:45:00

模型AI

2017-11-21 09:20:06

深度學習TensorFlow游戲AI

2025-05-28 09:15:00

AI視覺模型

2025-02-24 08:20:00

AI代碼生成

2025-10-20 09:05:00

2024-11-01 09:39:26

強化學習AI

2025-04-02 12:20:00

開發代碼函數

2025-07-14 09:26:45

2025-09-23 02:11:00

2018-10-18 14:26:45

云計算架構師管理

2024-08-12 00:00:05

集成學習典型算法代碼

2020-11-12 19:31:41

強化學習人工智能機器學習

2023-04-10 14:20:47

ChatGPTRESTAPI

2024-07-30 08:08:49

2024-08-08 12:33:55

算法

2021-04-13 10:25:57

Linux命令pstree

2024-07-12 08:38:05

2021-04-11 10:08:50

LinuxLinux命令ntpdate
點贊
收藏

51CTO技術棧公眾號

日本激情视频在线观看| 日韩在线视频免费播放| 精品视频一区二区三区| 亚洲一区二区三区免费视频| 精品一卡二卡三卡四卡日本乱码| 99精品人妻国产毛片| 欧美gvvideo网站| 精品对白一区国产伦| 美女黄色片视频| 国产桃色电影在线播放| 国产精品丝袜久久久久久app| av在线不卡一区| 亚洲午夜无码久久久久| 激情欧美亚洲| 日韩在线免费av| 亚洲国产第一区| 国产精品美女久久久久| 欧美日韩中文字幕日韩欧美| av不卡在线免费观看| 色鬼7777久久| 成人免费精品视频| 国产主播喷水一区二区| 国产精品久久久久久久久久精爆| 欧美成人嫩草网站| 在线视频日本亚洲性| 日本50路肥熟bbw| 亚洲一区二区av| 欧洲另类一二三四区| 久久久久久免费看| 污视频在线免费观看网站| 欧美国产日本视频| 欧美三级网色| 青青色在线视频| 不卡在线视频中文字幕| 91pron在线| 中文字幕精品无码亚| 久久不射2019中文字幕| 97国产一区二区精品久久呦| 九九精品在线观看视频| 我不卡伦不卡影院| x99av成人免费| 日本不卡一二区| 日韩电影免费网址| 在线成人免费网站| 国产精品815.cc红桃| 欧美成a人免费观看久久| 精品免费国产二区三区| 日韩高清在线一区二区| 伊人久久精品| 91精品国产麻豆| 国产美女视频免费看| 久久免费资源| 在线成人av影院| 日本网站在线看| 视频一区国产| 欧美精品一区二区三区久久久| 欧美人与性动交α欧美精品| 日韩免费高清视频网站| 日韩亚洲欧美中文三级| 黄色av电影网站| 欧美日韩精品一区二区三区在线观看| 日韩av资源在线播放| 免费中文字幕av| 免费欧美一区| 日韩中文字幕在线观看| 日本 欧美 国产| 欧美精品首页| 91精品国产高清久久久久久91 | 国产va免费精品高清在线| 成人免费看片98欧美| 男女精品视频| 国产精品视频网站| 精品国产999久久久免费| 成人午夜看片网址| 久久这里精品国产99丫e6| 黄色片免费在线| 国产精品国产馆在线真实露脸 | sis001亚洲原创区| 色悠悠久久综合| 日本中文字幕精品—区二区| 香蕉成人app| 亚洲欧美另类人妖| 青青青视频在线免费观看| 欧美影视一区| 日本欧美一级片| 国产精品无码在线播放| 成人深夜视频在线观看| 日本欧美色综合网站免费| 免费**毛片在线| 欧美va天堂在线| 午夜精品免费视频| 中文字幕在线一| 国产成人免费视频网站 | 人妻丰满熟妇av无码区hd| av网站免费线看精品| 五月天色一区| av中文在线资源库| 欧美精品1区2区| 日韩aaaaa| 伊人色**天天综合婷婷| 日本欧美一二三区| 男人天堂综合网| 国产精品久久久久久久午夜片| 黄页免费在线观看视频| 成人黄色91| 国产亚洲欧洲在线| 日韩精品一区二区在线播放 | aaa日本高清在线播放免费观看| 亚洲精品国产精品乱码不99| 日本黄网站免费| 国产成人在线中文字幕| 日韩一区二区在线视频| 亚洲精品男人的天堂| 国产一区不卡在线| 日韩欧美视频一区二区| 麻豆蜜桃在线观看| 欧美一区二区三区白人| 日本午夜精品视频| 国产美女诱惑一区二区| 国产精品免费在线播放| 国产丝袜在线| 欧美精品丝袜中出| 中文字幕av久久爽一区| 先锋影音国产一区| 国产久一道中文一区| a视频在线播放| 欧美日韩精品一区二区| 日韩人妻一区二区三区| 亚洲日本成人| 国产激情一区二区三区在线观看| 免费黄色在线看| 欧美性videosxxxxx| 亚洲精品成人无码熟妇在线| 在线观看一区| dy888夜精品国产专区| 好吊日视频在线观看| 在线观看亚洲一区| 婷婷色一区二区三区| 亚洲欧美日韩专区| 久久综合九九| 成人性生活视频| 亚洲欧美激情视频| 91久久国产综合久久91| 91免费看视频| 国产又黄又大又粗视频| 亚洲免费专区| 国产精品jvid在线观看蜜臀| 日本福利片在线| 色哦色哦哦色天天综合| 欧美图片第一页| 日韩av中文字幕一区二区| 久久久久久精| 国产精品高清乱码在线观看 | www红色一片_亚洲成a人片在线观看_| 欧美人伦禁忌dvd放荡欲情| 亚洲天堂精品一区| 韩日av一区二区| 久久艹国产精品| 日本一区福利在线| 国产成人一区二区在线| 欧美精品videosex牲欧美| √资源天堂中文在线| 久久影视一区二区| av五月天在线| 99久久激情| 成人看片视频| 天堂√中文最新版在线| 国产午夜精品视频| 国产在成人精品线拍偷自揄拍| 亚洲蜜臀av乱码久久精品蜜桃| 国产日韩视频一区| 香蕉国产精品偷在线观看不卡| 日韩精品另类天天更新| 白嫩亚洲一区二区三区| 久久久久久久久久久久av| 亚洲人妻一区二区三区| 欧美综合亚洲图片综合区| 国产成人av免费在线观看| 国产.欧美.日韩| 日本精品免费在线观看| 国产精品99久久久久久动医院| aa成人免费视频| 日本成人三级电影| 久久91亚洲人成电影网站| 婷婷在线免费观看| 欧美欧美午夜aⅴ在线观看| 婷婷色中文字幕| 久久精品亚洲精品国产欧美kt∨ | 综合久久av| 午夜精品一区二区三区av| 国产免费视频在线| 日韩一级片在线观看| 青草视频在线观看免费| 中文字幕一区二区视频| 老司机午夜免费福利| 奇米精品一区二区三区四区| 无码 制服 丝袜 国产 另类| 成人免费a**址| 国产精品12| 涩涩涩久久久成人精品| 97久久精品在线| 粗大黑人巨茎大战欧美成人| 亚洲精品久久久久久下一站| 国产精品羞羞答答在线| 欧美日韩在线看| 成人免费毛片东京热| 日本一区二区不卡视频| 日本不卡视频一区| 韩国av一区二区三区在线观看| www.四虎成人| 黄色亚洲免费| 国产日本欧美在线| 成人在线国产| 久99久在线| 日韩激情欧美| 成人女保姆的销魂服务| 亚洲精品福利电影| 国内精品在线一区| 最新日本在线观看| xxx成人少妇69| 自拍视频在线| 亚洲最新中文字幕| 可以在线观看的av| 亚洲精品国产电影| 东京干手机福利视频| 91精品久久久久久久久99蜜臂 | 91精品国产全国免费观看| 中国女人真人一级毛片| 91国偷自产一区二区开放时间 | 青青在线免费视频| 99欧美视频| 夜夜爽99久久国产综合精品女不卡| 伊人春色精品| 欧美日本韩国国产| 亚洲国产合集| 欧美一区二区综合| 自拍偷拍精品| 日韩黄色影视| 欧美综合在线视频观看| 日韩电影大全在线观看| 欧美人妖在线| 日日骚一区二区网站| 国产一区二区区别| 天天久久人人| 日韩欧美一区免费| 精品少妇人妻av一区二区| 亚洲成av人电影| 国产91在线亚洲| 在线观看的日韩av| 日韩av片在线看| 老牛嫩草一区二区三区日本| 熟妇人妻va精品中文字幕| 日韩精品乱码av一区二区| 欧美三级理论片| 激情综合色综合久久| 久久精品久久99| 国产.欧美.日韩| 国产一级二级在线观看| 久久久久国色av免费看影院| 男人的天堂官网| 亚洲欧洲精品成人久久奇米网| 91视频综合网| 亚洲国产精品精华液网站| 国产成人精品网| 欧美在线免费观看亚洲| 国产精品毛片一区二区在线看舒淇| 欧美一区二区三级| 日本黄色三级视频| 亚洲欧美精品suv| 黄色免费在线观看网站| 久久久久久亚洲精品不卡| 91av久久| 国产精品影片在线观看| 日韩精品中文字幕一区二区| 精品综合久久| 97偷自拍亚洲综合二区| 成人免费a级片| 久久资源在线| 在线a免费观看| 久久婷婷色综合| 91麻豆精品成人一区二区| 亚洲成人7777| 一级黄色免费看| 日韩av在线高清| 九色porny在线| 欧美一级大胆视频| 日韩成人在线电影| 欧美激情第六页| 中文字幕午夜精品一区二区三区| 一女被多男玩喷潮视频| 精品无人码麻豆乱码1区2区| 日b视频在线观看| 日韩美女啊v在线免费观看| 亚洲综合一二三| 7777精品伊人久久久大香线蕉经典版下载 | 国产成人无吗| 国产成人精品优优av| 日本免费精品| 亚洲精品8mav| 亚洲专区一区| 极品白嫩少妇无套内谢| 国产精品视频一二| 特级西西444www大精品视频免费看| 717成人午夜免费福利电影| 日本韩国一区| 国语自产精品视频在线看| 日本一区二区中文字幕| 免费一区二区三区| 亚洲理伦在线| 老女人性生活视频| 国产精品传媒在线| 免费精品一区二区| 国产视频自拍一区| bl在线肉h视频大尺度| 亚洲wwwav| 国产精品黑丝在线播放| 免费看a级黄色片| 久久日一线二线三线suv| 国产精品日日夜夜| 日韩欧美一级片| 成人免费视屏| 国产日韩欧美在线| 精品一区不卡| 日本熟妇人妻中出| 国产午夜精品在线观看| 天天插天天操天天干| 精品美女在线播放| 污污片在线免费视频| 成人黄色生活片| 99成人在线视频| 手机av在线免费| 中日韩免费视频中文字幕| 欧美日韩 一区二区三区| 亚洲精品视频在线观看视频| 97人人在线视频| 国产一区二区三区四区五区加勒比 | 久久人人超碰精品| 国产免费av一区| 国产亚洲精品久久久久久777| 欧美www.| 日韩av电影在线观看| 日韩av一区二区在线影视| 丰腴饱满的极品熟妇| 91国产免费观看| 91短视频版在线观看www免费| 国产精品久久久久秋霞鲁丝| 欧洲毛片在线视频免费观看| 杨幂毛片午夜性生毛片| 国产精品午夜在线观看| 国产精品视频一区二区三区,| 久久视频这里只有精品| 久久久国产精品入口麻豆| 久久久久久av无码免费网站下载| 国产精品 日产精品 欧美精品| 国产精品1234区| 精品呦交小u女在线| 欧美日韩视频免费观看| 亚洲一区二区自拍偷拍| 激情亚洲综合在线| 国产亚洲欧美久久久久| 亚洲精品国产精品国自产在线| 亚洲黄色免费av| 亚洲乱码一区二区三区三上悠亚| 精品一二三四在线| 久久久久亚洲AV| 亚洲欧美在线免费| 亚洲欧美一级| 欧美精品久久久久久久自慰| 成人av在线影院| 午夜一级黄色片| 欧美成人亚洲成人| 欧美大胆视频| 免费看污污网站| 亚洲国产精品一区二区www在线| 亚洲 欧美 激情 小说 另类| 国产精品久久一区| 欧美日韩国产探花| 中文字幕人妻一区二区| 欧美一卡2卡3卡4卡| 精精国产xxx在线视频app| 色综合久久av| 国产xxx精品视频大全| 国产91精品看黄网站在线观看| 超薄丝袜一区二区| 亚洲婷婷丁香| 丰满人妻一区二区三区大胸| 日韩欧美在线观看视频| 免费a级毛片在线播放| 黄色99视频| 精品亚洲国产成人av制服丝袜| 日韩欧美三级在线观看| 中文字幕欧美专区| 欧美绝顶高潮抽搐喷水合集| 国产精品一区二区小说| 亚洲成人av福利| 国产cdts系列另类在线观看| 欧美大香线蕉线伊人久久国产精品 | 最好看的中文字幕| 欧洲精品在线观看| 新版的欧美在线视频|