精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

2024圖靈獎頒給強化學習兩位奠基人!ChatGPT、DeepSeek背后功臣戴上遲來的冠冕

人工智能
強化學習之父Richard Sutton和他的導師Andrew Barto,獲得了2024年圖靈獎。有人說,圖靈獎終于頒給了強化學習,這是遲到的「獎勵」。

2024年圖靈獎,頒給了強化學習之父!

就在剛剛,計算機學會ACM宣布:Andrew G. Barto和Richard S. Sutton為2024年ACM圖靈獎獲得者,以表彰他們為強化學習奠定了概念和算法基礎。

繼諾貝爾獎之后,AI學者再次將圖靈獎收歸囊中。

圖片圖片

「強化學習之父」Richard S. Sutton和他的導師Andrew G. Barto,都為強化學習做出了奠基性的貢獻。

從1980年代開始的一系列論文中,二人就引入了強化學習的核心理念,構建了數學基礎,并開發了強化學習的關鍵算法——這是創建智能系統最為重要的方法之一。

1998年,Sutton和Barto共同撰寫了「Reinforcement Learning: An Introduction」(強化學習導論),這本書至今仍被視為該領域的奠基之作。目前,已被引用了超過75,000次。

如今,Barto是馬薩諸塞大學阿姆赫斯特分校信息與計算機科學系的名譽教授。

Sutton是阿爾伯塔大學計算機科學教授,Keen Technologies的首席研究員,以及阿爾伯塔機器智能研究所(Amii)的特聘研究員。

ACM A.M. 圖靈獎常被譽為「計算機領域的諾貝爾獎」,獎金高達100萬美元,由谷歌提供資金支持。該獎項以奠定了計算科學數學理論基礎的英國數學家艾倫·圖靈(Alan M. Turing)的名字命名。

得知自己獲得今年圖靈獎的消息時,Sutton感到非常震驚。

就在最近,Sutton才剛發文引述了圖靈的名言就在最近,Sutton才剛發文引述了圖靈的名言

RL之父和他的博導

AI行業一直努力最大化機器知識容量。而身處這個行業的Richard Sutton,長期以來一直在思考一個更為基礎的問題——機器如何學習?

隨著「Reinforcement Learning:An Introduction」的出版,這本強化學習領域的「圣經」在數十年后,仍然有著重要的意義。因為這些思想本質上看似簡單,卻對更廣泛的AI行業產生著持續的影響。

Reinforcement Learning: Summary and Review | Bill MeiReinforcement Learning: Summary and Review | Bill Mei

Sutton這樣解釋他的研究方法:研究必須從小處著手;這種基礎研究,不會立即為最新技術帶來明顯的改進。

早在1978年,二人便開始合作。

當時,Sutton正在馬薩諸塞大學阿默斯特分校攻讀博士學位,而他的導師正是Barto。隨后,Sutton又跟著Barto完成了博士后研究。

他們編寫了一些最早的RL算法,就像人類或機器學習的方式一樣,讓機器通過反復試錯獲取知識。

圖片圖片

雖然Sutton由此贏得了學術界的贊譽,但在某種程度上,卻讓他跟谷歌、微軟、OpenAI等大公司構建的LLM所代表主流理論,產生了分歧。

在他看來,這些技術只是在模仿人類行為,并未真正認識到自己的行動,并且從中學習——

我認為它們并不在通往AGI的正確道路上。

強化學習的核心,是確保機器「從經驗中學習」,或者理解反饋并從錯誤中學習。

然而,LLM是從海量歷史數據中提取信息來生成回應的,所以它們的智能程度也僅僅與其神經網絡在給定時間的規模相當。

因此,LLM天然就有一種「愚蠢的弱點」。雖然可以調整對書面問題的回答,但它們的主要目標,僅僅是確定文本鏈中的下一個輸出而已。

對于如今的許多AI系統,Sutton都評價為「在于你互動時完全不會學習」。

比如在他看來,ChatGPT就不會根據自己的經驗改變任何權重;它對結果漠不關心,也真正缺乏認知;它對發生的任何事都不會驚訝,因為它本來對于發生的事就沒有任何預期。

圖片圖片

Sutton的谷歌DeepMind前同事Michael Bowling如此評價他——

當世界其他地方都在追逐大語言模型應用時,Rich仍在堅守基礎研究的陣地。

在以后,當人們希望看到能真正和人類互動的AI系統,他們可能會意識到,Sutton對強化學習的貢獻是多么意義重大。

而且在過去五年中,RL也越來越被重視。引起全球轟動的DeepSeek,就是用RL通過正反饋循環來訓練AI的。

在阿爾伯塔機器智能研究所(Amii)負責人Cam Linke看來,Sutton是一位為人謙遜、不事張揚的專業人士。他摒棄了科學領域常見的傳統等級制度或政治因素,對他來說科學過程才是關鍵所在。

繼Geoffrey Hinton和Yoshua Bengio在2018年與Yann LeCun一起因對深度神經網絡研究的貢獻獲獎后,Sutton是最新一位獲得圖靈獎的加拿大研究者。

他表示,自己將自己看作是一個強化學習智能體,通過經驗在各個層面學習,比如踢到腳趾后調整走路的方式,或者接受一份工作,從中獲得樂趣。

圖片圖片

什么是強化學習?

AI領域通常關注于構建AI智能體——即能夠感知和行動的實體。

更智能的AI智能體能夠選擇更好的行動方案。因此,知道哪些行動方案更好對AI至關重要。

獎勵——這一借用自心理學和神經科學的術語——表示一個提供給AI智能體與其行為質量相關的信號。

強化學習(RL)就是在這種獎勵信號的引導下學習找到更好行動方案的過程。

從獎勵中學習的理念對于動物訓練師來說已經存在了數千年。

后來,艾倫·圖靈(Alan Turing)在1950年的論文《計算機器與智能》中探討了「機器能思考嗎?」這一問題,并提出了一種基于獎勵和懲罰的機器學習方法。

雖然圖靈稱他曾進行一些初步實驗,而且Arthur Samuel在1950年代后期開發了一個能通過自我對弈進行學習的跳棋程序,但在隨后的幾十年里,AI的這一研究方向幾乎沒有取得任何進展。

到了1980年代初,受到心理學觀察的啟發,Barto和他的博士生Sutton開始將強化學習構建為一個通用問題框架。

他們借鑒了馬爾可夫決策過程(MDP)提供的數學基礎,在這個過程中,AI智能體在具有隨機性的環境中做出決策,在每次狀態轉換后接收獎勵信號,目的是將長期累積的獎勵最大。

與標準MDP理論假設AI智能體已知MDP的所有信息不同,強化學習框架允許環境和獎勵是未知的。

強化學習的信息需求最小,結合MDP框架的通用性,使得強化學習算法可以應用于廣泛的問題領域。

Barto和Sutton,無論是合作還是與其他研究者協作,都開發出了許多強化學習的基本算法。

包括他們最重要的貢獻——時間差分學習,它在解決獎勵預測問題方面取得了重要突破,此外還有策略梯度方法和將神經網絡作為表示學習函數的工具的使用。

他們還提出了結合學習和規劃的AI智能體設計,證明了將環境知識作為規劃基礎的價值。

正如前文提到的,「Reinforcement Learning: An Introduction」這本書使數千名研究人員能夠理解并為這一領域做出貢獻,更重要的是,它還在繼續激發當今計算機科學中的許多重要研究活動。

盡管Barto和Sutton的算法是幾十年前開發的,但在過去十五年中,通過與深度學習算法(由2018年圖靈獎獲得者Bengio、Hinton和LeCun開創)相結合,強化學習的實際應用取得了重大突破——深度強化學習技術。

圖片圖片

強化學習最引人注目的例子是AlphaGo計算機程序在2016年和2017年戰勝世界頂尖人類圍棋選手。

近幾年的另一個重大成就是聊天機器人ChatGPT的出現。

ChatGPT是一個LLM,其訓練分為兩個階段,第二階段采用了一種稱為基于人類反饋的強化學習(RLHF)技術,以更好地捕捉人類的期望和偏好。

強化學習在許多其他領域也取得了顯著成功。

一個備受矚目的研究案例是機器人在手中操作和解決物理(魔方)問題的運動技能學習,這表明完全在模擬中進行強化學習,最終也可能在顯著不同的現實世界中取得成功。

圖片圖片

其他的應用領域包括網絡擁塞控制、芯片設計、互聯網廣告、優化算法、全球供應鏈優化、提升聊天機器人的行為和推理能力,甚至改進計算機科學中最古老的問題之一的矩陣乘法算法。

最后,這項部分受到神經科學啟發的技術也反過來回饋了神經科學。最近的研究,包括Barto的工作,表明人工智能中開發的特定強化學習算法,為有關人類大腦中多巴胺系統的大量發現提供了最佳解釋。

獲獎人介紹

Andrew Barto

圖片

Andrew Barto是馬薩諸塞大學阿默斯特分校信息與計算機科學系榮譽退休教授。是IEEE和AAAS的Fellow。

Barto于1970年從密歇根大學獲得數學學士學位。在閱讀了Michael Arbib and McCulloch和Pitts的作品后,他對利用計算機和數學來模擬大腦產生了興趣,五年后因一篇關于元胞自動機的論文獲得了該校的計算機科學博士學位。

他于1977年作為博士后研究員開始在馬薩諸塞大學阿默斯特分校的職業生涯,此后曾擔任多個職位,包括副教授、教授和系主任。

此前,他曾獲得包括馬薩諸塞大學神經科學終身成就獎、IJCAI研究卓越獎和IEEE神經網絡學會先驅獎在內的眾多獎項。

Richard Sutton

圖片

Richard Sutton是阿爾伯塔大學計算機科學教授,Keen Technologies的研究科學家,以及阿爾伯塔機器智能研究所(Amii)的首席科學顧問。是AAAI、英國皇家學會和加拿大皇家學會的Fellow。

在2017年至2023年期間,他曾擔任DeepMind的杰出研究科學家。

在加入阿爾伯塔大學之前,他于1998年至2002年在AT&T香農實驗室AI部門擔任首席技術專家。

Sutton獲得了斯坦福大學心理學學士學位,并在馬薩諸塞大學阿默斯特分校獲得計算機與信息科學的碩士和博士學位。

Sutton獲得的榮譽包括國際AI聯合會研究卓越獎、加拿大AI協會終身成就獎和馬薩諸塞大學阿默斯特分校杰出研究成就獎。

參考資料:

https://awards.acm.org/turing

責任編輯:武曉燕 來源: 新智元
相關推薦

2015-03-27 12:59:51

數據庫Michael Sto2015圖靈獎

2018-03-23 10:03:03

圖靈獎頒芯片界

2025-03-06 10:07:00

AI強化學習技術

2023-05-05 13:11:16

2025-05-13 13:57:13

ACMDeepseek-R模型

2025-09-28 15:34:22

AI量子計算模型

2021-04-01 08:55:31

編程技能開發

2025-10-20 09:03:00

2025-05-28 02:25:00

2025-03-11 01:00:00

GRPO算法模型

2025-02-17 10:40:20

2025-05-26 04:00:00

2025-09-28 08:58:55

2025-07-24 09:05:00

2024-10-29 15:20:00

強化學習模型

2020-03-19 16:00:05

計算機互聯網 技術

2021-08-05 09:57:33

計算機互聯網 技術

2020-08-10 06:36:21

強化學習代碼深度學習

2023-03-09 08:00:00

強化學習機器學習圍棋

2012-11-13 15:21:50

Win 8
點贊
收藏

51CTO技術棧公眾號

国产精品美女免费| 日韩成人高清在线| 成人小视频在线观看免费| 成人毛片在线精品国产| 久久久久99| 中文在线资源观看视频网站免费不卡| 中文字幕一区久久| 17videosex性欧美| 国产拍揄自揄精品视频麻豆| 91久久久久久久久久| 日本a在线观看| 第一会所亚洲原创| 亚洲国产精品视频在线观看| 午夜免费福利视频在线观看| 97超碰免费在线| 中文字幕亚洲一区二区va在线| 国产日韩一区二区| 91福利免费视频| 老司机一区二区三区| 久久天天躁狠狠躁夜夜av| 国产精品jizz| 18国产精品| 欧美日韩视频一区二区| 九色在线视频观看| 二区三区在线观看| 国产欧美精品在线观看| 精品欧美一区二区在线观看视频| 国产熟女一区二区丰满| 日韩1区2区日韩1区2区| 97国产一区二区精品久久呦 | 岛国一区二区三区| 国产精品一久久香蕉国产线看观看| 国产乱码久久久久久| 亚洲一区二区三区| 久久精品久久久久久| 大胸美女被爆操| 中文字幕伦av一区二区邻居| 亚洲护士老师的毛茸茸最新章节 | 在线能看的av| 在线观看不卡| 国产最新精品视频| 久久免费小视频| 你懂的一区二区| 欧美xxxx做受欧美| 97成人资源站| 伊人情人综合网| 欧美成人性色生活仑片| 成人涩涩小片视频日本| 国产精品国产一区| 日日狠狠久久偷偷四色综合免费 | 国产精品视频播放| 无码人妻av免费一区二区三区| 国产午夜精品一区二区三区欧美 | 亚洲日本视频在线| 日韩免费电影网站| 亚洲国产精品第一页| 在这里有精品| 欧美精品一区二区三区在线 | 国产白浆在线观看| 国产91精品一区二区麻豆网站| 97se视频在线观看| 亚洲第一成年人网站| 成人听书哪个软件好| 国产一区在线免费观看| 美国一级片在线免费观看视频| 久久久无码精品亚洲日韩按摩| 美女视频久久| 国产高清免费av在线| 国产欧美一区二区精品秋霞影院| 五月天国产一区| 欧美性天天影视| 亚洲精品视频在线观看网站| 韩日视频在线观看| 国产中文在线播放| 91福利精品视频| 国产高潮免费视频| 国产午夜亚洲精品一级在线| 欧美成人午夜电影| 最新中文字幕视频| 国产精品久久久久久久久久10秀| 欧美老肥婆性猛交视频| 日韩黄色精品视频| 日韩不卡一二三区| 99视频国产精品免费观看| 天堂中文在线视频| 中文字幕日韩av资源站| 中文字幕一区二区不卡| 久久综合九色综合97婷婷女人| 国产精品高潮呻吟久久av野狼| 青青草视频在线观看免费| 美女视频第一区二区三区免费观看网站 | 捆绑凌虐一区二区三区| 啪啪激情综合网| gogo在线观看| 99久久久无码国产精品衣服| 日本性爱视频在线观看| 免费高清视频精品| 激情欧美一区| 亚洲欧美日韩视频一区| 三级黄色录像视频| 亚洲清纯自拍| 国产一区二区香蕉| 天天综合网在线观看| 国产精品人成在线观看免费| 欧洲精品在线播放| 亚洲xxx在线观看| 海角国产乱辈乱精品视频| 国产九色精品| 国产精品亚洲lv粉色| 国产成人精品av久久| 蜜桃av在线| 欧美日韩一二三区| 亚洲av午夜精品一区二区三区| 午夜精品影视国产一区在线麻豆| 丝袜亚洲另类欧美重口| 国偷自拍第113页| 国产呦萝稀缺另类资源| 国产99久久久欧美黑人| 91精品国产综合久久福利| 亚洲国产高清自拍| 九色91porny| 中文字幕伦av一区二区邻居| 欧美激情网友自拍| 中文字幕在线观看视频一区| 99精品视频一区二区| 大桥未久一区二区| 午夜国产福利一区二区| 国内精品美女在线观看| 国产综合视频在线观看| 日本韩国一区| 亚洲一区免费视频| 国产永久免费网站| 日韩一区欧美| 国产精品亚洲网站| 男人久久精品| 日韩欧美亚洲一二三区| 7788色淫网站小说| 亚洲网站啪啪| 国产高清不卡av| 啦啦啦中文在线观看日本| 日韩欧美黄色影院| 中文字幕电影av| 国产一区二区三区免费观看| 在线视频一二三区| 亚洲爽爆av| 久久精品视频在线观看| 6—12呦国产精品| 中文字幕一区二区三区四区不卡 | 国产精品18在线| 日韩不卡免费视频| 亚洲国产欧洲综合997久久| 日韩免费小视频| 亚洲色图五月天| 波多野结衣日韩| 欧美高清在线一区| 亚洲36d大奶网| 精品久久久久久久久久久下田| 国产精品18久久久久久麻辣| 九九在线视频| 精品视频一区二区不卡| 99热99这里只有精品| 国产一区二区剧情av在线| 亚洲啊啊啊啊啊| 亚洲开心激情| 欧美在线视频免费| 国产免费av在线| 欧美日韩国产高清一区二区| 尤物在线免费视频| 丁香婷婷综合网| 欧美牲交a欧美牲交| 精品大片一区二区| 成人国产精品日本在线| 超碰97免费在线| 亚洲桃花岛网站| 国产熟女精品视频| 婷婷久久综合九色综合绿巨人| 538国产视频| 美女视频黄频大全不卡视频在线播放| 国产免费xxx| 天天躁日日躁成人字幕aⅴ| 国产精品成人v| av黄色在线| 亚洲美女av黄| 99热这里只有精品在线观看| 五月开心婷婷久久| 国产wwwwxxxx| av在线不卡免费看| www.日本一区| 亚洲黄网站黄| 亚洲欧美电影在线观看| **爰片久久毛片| 国产精品欧美风情| 丁香花高清在线观看完整版| 自拍偷拍亚洲一区| 男人天堂综合网| 欧美人与禽zozo性伦| 国产精品成人国产乱| 国产精品视频你懂的| 野战少妇38p| 久久国内精品视频| 乱妇乱女熟妇熟女网站| 一区二区三区毛片免费| 美媛馆国产精品一区二区| 欧美高清hd| 国产精品永久免费视频| www.成人爱| 欧美激情亚洲另类| 日本在线免费看| 亚洲视频专区在线| 五月天婷婷社区| 日韩一区二区三区在线观看| 日本视频www色| 午夜av电影一区| 日韩黄色免费观看| 欧美国产激情二区三区 | 老汉色老汉首页av亚洲| 91沈先生在线观看| а√天堂资源国产精品| 57pao精品| av在线播放资源| 欧美大尺度在线观看| 色的视频在线免费看| 国产午夜精品免费一区二区三区| 天天摸天天干天天操| 日韩欧美电影一区| 国产情侣激情自拍| 欧美精品三级在线观看| 中文字幕人妻精品一区| 一本一本大道香蕉久在线精品| 日本一区二区三区免费视频| 一区二区三区资源| 欧美xxxx黑人xyx性爽| 亚洲天天做日日做天天谢日日欢| 人妻互换一区二区激情偷拍| 久久久亚洲国产美女国产盗摄| 欧美深性狂猛ⅹxxx深喉| 久久国产精品99久久人人澡| 亚洲精品怡红院| 丝袜美腿高跟呻吟高潮一区| 妞干网在线免费视频| 性xx色xx综合久久久xx| 国产黄页在线观看| 亚洲在线视频| 欧美精品成人网| 日韩av一区二| 污片在线免费看| 久久爱www久久做| 亚洲激情在线看| 蓝色福利精品导航| 亚洲免费成人在线视频| 久久99最新地址| 欧美视频亚洲图片| 国产精品一区二区三区乱码 | 日本视频www色| 欧美三级日本三级少妇99| 伊人精品在线视频| 欧美日韩国产另类一区| 国内精品久久久久久久久久久 | 亚洲激情av| 精品中文字幕av| 另类图片国产| 国产精品人人爽人人爽| 国产在线精品一区在线观看麻豆| 97超碰免费在线观看| 99九九99九九九视频精品| 91精彩刺激对白露脸偷拍| 国产精品美女久久久久久久久久久| 国产破处视频在线观看| 亚洲欧美日韩国产手机在线| 日韩欧美不卡视频| 日韩欧美在线视频免费观看| 亚洲综合精品视频| 精品国产三级a在线观看| 色网站免费观看| 一区二区在线视频播放| www.久久ai| 欧美一级视频在线观看| 欧美午夜三级| 国产精品毛片va一区二区三区| 免费观看不卡av| av动漫免费观看| 亚洲精品麻豆| 色婷婷综合网站| 高清免费成人av| 一本色道久久综合亚洲精品图片 | 免费日韩在线视频| 日韩欧美中文在线| 国产精品伦一区二区三区| 日韩av资源在线播放| 秋霞a级毛片在线看| 性欧美xxxx视频在线观看| www.成人爱| 91视频网页| 精品国产美女| 妞干网在线播放| 免费美女久久99| 麻豆精品国产传媒av| 中文字幕一区二区三区av| 日本高清不卡码| 日韩欧美激情一区| yjizz视频网站在线播放| 97精品国产97久久久久久春色| 久久久久黄色| 大胆人体色综合| 日本福利视频一区| 日本一级淫片色费放| 中文字幕欧美日本乱码一线二线| 免费在线一区二区三区| 欧美日韩专区在线| 亚洲 精品 综合 精品 自拍| 久久精品2019中文字幕| 吞精囗交69激情欧美| 国产精品区一区二区三含羞草| 久久国产成人精品| 日韩人妻无码精品久久久不卡| 国产又色又爽又黄刺激在线视频| 欧美高清视频在线观看| 国产a亚洲精品| 日本不卡一区| 国产精品久久久久毛片大屁完整版 | 五月天综合视频| 激情成人在线视频| 韩国av免费在线观看| 久久91精品国产91久久久| 日本久久二区| 亚洲午夜精品久久久中文影院av| 香蕉久久国产| 特级西西人体wwwww| 五月婷婷激情综合| 午夜精品无码一区二区三区| 久久久精品久久| 伊人久久大香伊蕉在人线观看热v| 日本精品一区二区三区不卡无字幕| 国产欧美丝祙| 亚洲人人夜夜澡人人爽| 亚洲第一主播视频| 二区三区在线视频| 欧美贵妇videos办公室| 日韩精品视频一区二区三区| 超碰10000| 国产成人精品午夜视频免费| 日本aⅴ在线观看| 欧美一区二区三区视频免费 | av在线不卡顿| 妓院一钑片免看黄大片| 久久久91精品国产一区二区三区| 国产精品一区二区三区四| 日韩精品极品毛片系列视频| 午夜激情电影在线播放| 欧美日韩在线高清| 日韩电影免费在线观看网站| www成人啪啪18软件| 欧美丰满少妇xxxxx高潮对白| 免费黄网站在线| 成人精品在线视频| 欧美日韩亚洲一区三区| 日本一级片在线播放| 黑人巨大精品欧美一区免费视频 | www日本高清| 欧美精品999| 啄木系列成人av电影| 国产三级国产精品国产专区50| 亚洲少妇30p| 成人精品在线播放| 欧美最猛性xxxxx免费| 激情综合网五月| 亚洲五月激情网| 午夜精品免费在线观看| 欧美日韩在线中文字幕| 国产精品午夜一区二区欲梦| 午夜av一区| 尤物网站在线观看| 色猫猫国产区一区二在线视频| 99re在线视频| 97人人模人人爽视频一区二区| 国产日韩高清一区二区三区在线| 男人舔女人下部高潮全视频| 欧美一区日韩一区| 蜜桃在线视频| 亚洲人体一区| eeuss国产一区二区三区| 欧美视频xxxx| 欧美福利在线观看| 中文字幕伦av一区二区邻居| www.午夜av| 欧美日韩黄色大片| 免费黄网在线观看| 久久精品magnetxturnbtih| 精品一区二区三区在线视频| 久草视频精品在线| 中文字幕欧美精品日韩中文字幕| 无码国模国产在线观看| 大肉大捧一进一出好爽动态图| 亚洲视频综合在线| 色就是色亚洲色图| 99久久国产免费免费| 日本午夜一本久久久综合| 久久国产在线观看| 深夜福利日韩在线看| 婷婷亚洲精品|