精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

語言游戲讓AI自我進化,谷歌DeepMind推出蘇格拉底式學習

人工智能
近日,谷歌DeepMind的研究人員推出了蘇格拉底式學習,在沒有外部數據的情況下,讓AI通過語言游戲不斷變強。

沒有外部數據,AI自己也能進化?

聽起來有點嚇人,于是谷歌DeepMind的這項研究很快引起了廣泛關注。

圖片圖片

論文地址:https://arxiv.org/pdf/2411.16905

新的方法被命名為「蘇格拉底式學習」(Socratic Learning),能夠使AI系統自主遞歸增強,超越初始訓練數據的限制。

圖片圖片

研究人員表示,只要滿足三個條件,在封閉系統中訓練的智能體可以掌握任何所需的能力:

a)收到足夠信息量和一致的反饋;

b)經驗/數據覆蓋范圍足夠廣泛;

c)有足夠的能力和資源。

本文考慮了假設 c)不是瓶頸的情況下,在封閉系統中 a)和 b)會產生哪些限制。

圖片圖片

蘇格拉底式學習的核心是語言游戲(即結構化的交互),智能體在其中交流、解決問題并以分數的形式接收反饋。

整個過程中,AI在封閉的系統中自己玩游戲、生成數據、然后改進自身的能力,無需人工輸入。

如果游戲玩膩了,AI還可以自己創建新游戲,解鎖更多抽象技能。

Socratic Learning消除了固定架構的局限,使AI的表現能夠遠超其初始數據和知識,且僅受時間的限制。

邁向真正自主的AI

考慮一個隨時間演變的封閉系統(無輸入、無輸出),如下圖所示。

圖片圖片

在系統中,有一個具有輸入和輸出的實體(智能體,agent),它也會隨著時間的推移而變化。系統外部有一個觀察者,負責評估智能體的性能。

由于系統是封閉的,觀察者的評估無法反饋到系統中。因此,智能體的學習反饋必須來自系統內部,例如損失、獎勵函數、偏好數據或批評者。

考慮藍色虛線的路徑,讓智能體輸出影響未來的智能體輸入,并且性能得到提高(自我改進過程),如果輸入和輸出空間兼容,則這種自我提升是遞歸的。

自我提升過程的一個典型例子是自我博弈,系統讓智能體作為游戲的雙方,從生成一個無限的體驗流,并帶有獲勝反饋,來指導學習的方向。

圖片圖片

反饋是其中的關鍵一環,AI的真正意義是相對于外部觀察者的,但在封閉的系統中,反饋只能來自內部的智能體。

這對于系統來說是一個挑戰:讓反饋與觀察者保持一致,并在整個過程中保持一致。

RL的自我糾正能力在這里并不適用,可以自我糾正的是給定反饋的行為,而不是反饋本身。

蘇格拉底式學習

與輸出僅影響輸入分布的一般情況相比,遞歸的自我提升更具限制性,但中介作用更少,最常見的是將智能體輸出映射到輸入的環境實例化。

這種類型的遞歸是許多開放式流程的一個屬性,而開放式改進正是ASI的一個核心特征。

輸入和輸出空間兼容的一個例子是語言。人類的廣泛行為都是由語言介導的,特別是在認知領域。

語言的一個相關特征是它的可擴展性,即可以在現有語言中開發新的語言,比如在自然語言中開發的形式數學或編程語言。

圖片圖片

綜上,本文選擇研究智能體在語言空間中遞歸自我提升的過程。蘇格拉底式學習,模仿了蘇格拉底通過提問、對話和重復的語言互動,來尋找或提煉知識的方法。

蘇格拉底并沒有去外界收集現實世界中的觀察結果,這也符合本文強調的封閉系統。

圖片圖片

局限性

在自我提升的三個必要條件中,覆蓋率和反饋原則上適用于蘇格拉底式學習,并且是不可簡化的。

從長遠角度來看,如果計算和內存保持指數級增長,那么規模限制只是一個暫時的障礙。另一方面,即使是資源受限的場景,蘇格拉底式學習可能仍會產生有效的高級見解。

覆蓋率意味著蘇格拉底式學習系統必須不斷生成數據(語言),同時隨著時間的推移保持或擴大多樣性。

生成對于LLM來說是小菜一碟,難的是在遞歸過程中防止漂移、崩潰或者生成分布不夠廣泛。

反饋要求系統繼續產生關于智能體輸出的反饋,這在結構上需要一個能夠評估語言的批評者,且應與觀察者的評估指標保持充分一致。

然而,語言空間中定義明確的指標通常僅限于特定的任務,而AI反饋則需要更通用的機制,尤其是在允許輸入分布發生變化的情況下。

目前的LLM訓練范式都沒有足以用于蘇格拉底式學習的反饋機制。比如下一個標記預測損失,與下游使用情況不一致,并且無法推斷訓練數據之外的情況。

根據定義,人類的偏好是一致的,但無法在封閉系統的學習中使用。將人類偏好緩存到學習的獎勵模型中或許可行,但從長遠來看,可能會產生錯位,并且在分布外的數據上效果也很弱。

換句話說,純粹的蘇格拉底式學習是可能的,但需要通過強大且一致的批評者生成廣泛的數據。當這些條件成立時,這種方法的上限就只取決于能夠提供的計算資源。

LANGUAGE GAMES ARE ALL YOU NEED

語言、學習和基礎是經過充分研究的話題。其中一個特別有用的概念是哲學家Wittgenstein提出的「語言游戲」。

圖片圖片

對他來說,捕捉意義的不是文字,而需要語言的互動性質才能做到這一點。

具體來說,將語言游戲定義為交互協議(一組規則,可以用代碼表達),指定一個或多個智能體(玩家)的交互,這些智能體具有語言輸入和輸出,以及在游戲結束時每個玩家的標量評分函數。

這樣定義的語言游戲解決了蘇格拉底式學習的兩個主要需求:為無限的交互式數據生成提供了一種可擴展的機制,同時自動提供反饋信號(分數)。

從實用的角度來看,游戲也是一個很好的入門方式,因為人類在創造和磨練大量游戲和玩家技能方面有著相當多的記錄。

實際上,許多常見的LLM交互范式也能被很好地表示為語言游戲,例如辯論、角色扮演、心智理論、談判、越獄防御,或者是在封閉系統之外,來自人類反饋的強化學習。

Wittgenstein曾表示,他堅決反對語言具有單一的本質或功能。

相比于單一的通用語言游戲,使用許多狹義但定義明確的語言游戲的優勢在于:對于每個狹義的游戲,都可以設計一個可靠的分數函數(或評論家),這對于通用游戲來說非常困難。

從這個角度來看,蘇格拉底式學習的整個過程就是一個元游戲,一個安排了智能體玩和學習的語言游戲(一個「無限」的游戲)。

圖片圖片

蘇格拉底因「腐蝕青年」而被判處死刑并被處決。這也意味著,蘇格拉底過程并不能保證與外部觀察者的意圖保持一致。

語言游戲作為一種機制也沒有回避這一點,但它所需要的不是在單個輸入和輸出的細粒度上對齊的批評家,而是一個可以判斷應該玩哪些游戲的「元批評家」:根據是否對整體性能有貢獻來過濾游戲。

此外,游戲的有用性不需要先驗評估,可以在玩了一段時間后事后判斷,畢竟事后檢測異常可能比設計時阻止要容易得多。

那么問題來了,如果從蘇格拉底和他的弟子開始,數千年來一直不受干擾地思考和改進,到現在會產生什么樣的文化產物、什么樣的知識、什么樣的智慧?

參考資料:https://x.com/kimmonismus/status/1862993274727793047

責任編輯:武曉燕 來源: 新智元
相關推薦

2025-01-17 08:00:00

2017-11-08 11:20:14

谷歌人工智能技術

2025-08-11 09:21:00

2024-04-01 07:00:00

模型AI

2025-05-15 09:17:00

2025-01-24 09:10:00

2024-12-02 12:24:15

2023-08-30 07:29:39

SynthID谷歌

2025-10-22 09:00:00

2023-09-14 13:10:48

2024-01-15 14:44:19

語言模型PaLMAI

2024-03-14 11:55:21

2023-11-21 14:48:11

2025-11-10 08:40:00

LLM模型AI

2024-11-08 12:18:39

SynthID谷歌AI

2023-08-21 11:10:32

生成式AI谷歌

2025-07-31 01:15:00

ChatGPTAI教育

2017-11-22 09:22:00

AI智能機器學習

2023-04-21 15:49:13

谷歌DeepMind
點贊
收藏

51CTO技術棧公眾號

久久精品一区二区三区四区| 婷婷综合亚洲| 岛国av一区二区三区| 国产精品三区四区| 久久久久久久久久久久久av| 国产欧美亚洲精品a| 欧美日韩午夜影院| 欧美肥婆姓交大片| www.久久com| 欧美hdxxxxx| 不卡一区中文字幕| 欧美在线视频观看| 国产精品1区2区3区4区| 精品一区二区三区免费看| 亚洲欧美日韩在线| 国产精品一国产精品最新章节| 国产无遮挡aaa片爽爽| 丝袜美腿综合| 欧美另类videos死尸| 青草全福视在线| 污视频在线免费观看| 亚欧成人精品| 日韩中文字在线| 91网址在线观看精品| 超碰在线中文字幕| 国产精品理论片在线观看| 亚洲一区二区免费| 天堂在线免费观看视频| 91亚洲自偷观看高清| 欧美精品一区二区三区蜜桃视频 | ...av二区三区久久精品| av一区二区三区免费| 欧产日产国产69| 91精品一区国产高清在线gif | 青青草97国产精品麻豆| 精品乱人伦小说| 在线观看免费成人av| 免费在线观看av电影| 中文字幕成人av| 国产精品一区二区三区不卡 | 人妻少妇精品无码专区久久| 久久精品国产99久久6| 性色av一区二区咪爱| 婷婷伊人五月天| 残酷重口调教一区二区| 亚洲精品久久久久中文字幕二区| www.五月天色| 国产极品一区| 疯狂蹂躏欧美一区二区精品| av磁力番号网| 毛片免费不卡| 国产欧美日韩在线观看| 国产欧美在线一区二区| 国产精品一区二区黑人巨大| 免费在线看成人av| 欧美亚洲第一页| 国产亚洲精久久久久久无码77777| 欧美中文字幕一区二区| 国产午夜精品久久久| 激情成人在线观看| 久久久久毛片| 欧美视频一区二区三区| 国产精品少妇在线视频| 三妻四妾的电影电视剧在线观看| 亚洲在线观看免费视频| 精品国产一区二区三区在线| 能在线看的av| 91色视频在线| 久久精品二区| 天天操天天插天天射| 国产91精品在线观看| 7777精品伊久久久大香线蕉语言 | 风间由美一区| 久久精品人人做| 欧美成熟毛茸茸复古| 五十路在线视频| www.亚洲免费av| 极品日韩久久| 男人av在线| 国产拍揄自揄精品视频麻豆| 日韩久久精品一区二区三区| 国产高清在线看| 国产喂奶挤奶一区二区三区| 秋霞毛片久久久久久久久| 免费在线观看一级毛片| 久久久久久久综合| 亚洲精品白虎| 菠萝蜜视频国产在线播放| 中文字幕一区av| 91看片淫黄大片91| 黄页网站在线| 欧美视频裸体精品| 国产又大又黄又粗的视频| 久久亚洲人体| 91精品国产一区二区人妖| 樱花草www在线| 北条麻妃一区二区三区在线观看 | 亚洲欧美精品伊人久久| 永久免费成人代码| 久久久久久久久丰满| 九色成人免费视频| 免费黄色网址在线| 青青草国产成人99久久| 91精品在线观| 三级在线观看网站| 国产片一区二区三区| 在线视频不卡一区二区| 欧美hdxxxx| 福利微拍一区二区| 黄色一级一级片| www.久久爱.com| 亚洲精品动漫久久久久| 国产3级在线观看| 一二三区不卡| 日韩av电影手机在线观看| 夜夜躁狠狠躁日日躁av| 成人av免费观看| 视频一区不卡| ririsao久久精品一区| 日本韩国精品在线| 欧美精品色视频| 香蕉国产成人午夜av影院| 久久精品国产69国产精品亚洲| 国产无套在线观看| 九九精品视频在线看| 精品国产第一页| 二区在线观看| 午夜欧美一区二区三区在线播放| 国产wwwxx| 国产一区二区高清在线| 国产亚洲福利一区| 日韩福利片在线观看| 久热成人在线视频| 欧美午夜精品久久久久免费视 | 国产精品无码久久av| 99热这里都是精品| 97在线免费视频观看| 国产成人a视频高清在线观看| 日韩精品一区在线| 欧美福利在线视频| 久久成人一区| 国产伦精品一区二区三区照片| 丝袜美腿美女被狂躁在线观看| 午夜欧美2019年伦理| 国产精品一级无码| 97精品国产福利一区二区三区| 日本久久久久久| 五月激情婷婷综合| 亚洲天堂网中文字| 超碰超碰在线观看| 欧美综合久久| 国产成人涩涩涩视频在线观看 | 日韩欧美亚洲在线| 中文字幕影音在线| 日韩成人在线免费观看| 成人观看免费视频| 国产在线看一区| www.午夜色| 青青草国产一区二区三区| 亚洲日本成人女熟在线观看| 日韩无码精品一区二区三区| 国产精品99久久久久久有的能看| 亚洲看片网站| 免费视频观看成人| 色婷婷综合久久久久| 国产成人在线播放视频| 成人av电影在线网| 欧美日本视频在线观看| 国产精品对白久久久久粗| 久久97精品久久久久久久不卡| 国产精品女同一区二区| 综合色中文字幕| 爱情岛论坛亚洲首页入口章节| 欧美欧美黄在线二区| 日韩免费在线播放| 国产在线观看黄| 色婷婷av一区| ass极品国模人体欣赏| 蜜臀av一区二区在线观看| 亚洲国产一区二区三区在线播 | 亚洲a级在线观看| 伊人春色在线观看| 精品国产区一区| 国产系列精品av| 久久综合久久99| 99视频在线免费| 综合国产视频| 国产精品视频精品| 国产1区在线| 亚洲福利在线播放| 欧美国产成人精品一区二区三区| 久久久影院官网| 久久久精品麻豆| 亚洲成人tv| 国产精品theporn88| 中文字幕人成乱码在线观看| 中文字幕精品av| www.看毛片| 精品久久久国产精品999| 女同毛片一区二区三区| 蜜臀91精品一区二区三区| 91社在线播放| 国产一区在线电影| 国产高清在线不卡| av小次郎在线| 国产视频自拍一区| 精品一区二三区| 亚洲欧美日韩一区二区| 草草地址线路①屁屁影院成人| 日韩成人免费看| 久久久99精品视频| 亚洲欧洲av| 91国产丝袜在线放| 国产一区二区三区朝在线观看| 欧美另类交人妖| 日本亚洲欧美| 日韩一区二区在线观看视频播放| xxxx 国产| 国产精品欧美一级免费| 熟妇女人妻丰满少妇中文字幕| 性伦欧美刺激片在线观看| 影音先锋男人的网站| 亚洲区小说区图片区qvod| 3d蒂法精品啪啪一区二区免费| 成人美女黄网站| 伦理中文字幕亚洲| 欧美孕妇性xxxⅹ精品hd| 日韩一区二区三区在线观看| japanese国产在线观看| 亚洲国产美女搞黄色| 色噜噜噜噜噜噜| 99re这里只有精品首页| 亚洲在线观看网站| 免费xxxx性欧美18vr| 99热自拍偷拍| 亚洲天堂偷拍| 国产资源第一页| 日韩综合网站| 日产精品久久久一区二区| 91精品国产自产精品男人的天堂| 国产在线视频2019最新视频| 欧美大片高清| 97在线精品国自产拍中文| 97caopron在线视频| 亚洲人成电影在线播放| 手机av在线免费观看| 日韩精品一区二区三区在线播放 | 国产精品一区二区久久不卡| 超碰在线公开97| 玖玖国产精品视频| av免费观看大全| 伊人精品成人久久综合软件| 欧美一级中文字幕| 欧美激情视频一区二区三区在线播放 | 国产精品高清一区二区| 91精品综合视频| 国产精品视频一区二区三区| 97netav| 欧美日日夜夜| 欧美日韩另类丝袜其他| 日韩高清欧美| 青少年xxxxx性开放hg| 欧美日韩国产色综合一二三四| 欧美这里只有精品| 国产精品三上| 在线观看免费成人av| 国产一区二区伦理片| 中文字幕第3页| 91麻豆123| 中文字幕在线观看二区| 一区二区三区日韩欧美| 日韩特级黄色片| 欧美中文字幕一区二区三区亚洲| 一级做a爱片性色毛片| 欧美一区二区三区四区在线观看 | 亚洲午夜av久久乱码| 在线看黄色av| 久久国产天堂福利天堂| aa视频在线观看| 国产精品美女在线| 欧美高清hd| 日本视频一区二区不卡| 中文字幕一区二区三区在线视频 | 国内激情视频在线观看| 国产成人自拍视频在线观看| 高清不卡一区| 久久精品国产理论片免费| 日韩精品免费一区二区三区| 欧美亚洲色图视频| 丝袜美腿一区二区三区| 免费人成视频在线播放| 国产无遮挡一区二区三区毛片日本| 亚洲天堂一级片| 欧美视频二区36p| 国产按摩一区二区三区| 亚洲视频在线观看视频| 97超碰资源站在线观看| 国产成人综合亚洲| 国产美女撒尿一区二区| 亚洲一区二区三区涩| 国产日韩欧美三区| 91视频免费入口| 国产欧美精品一区| 日本一级片免费看| 91精品一区二区三区久久久久久| av女名字大全列表| 欧美成人亚洲成人| 国产91在线播放精品| 久久手机视频| 国产精品豆花视频| 爽爽爽在线观看| 国产日产精品一区| 你懂的国产视频| 日韩一级二级三级| 91露出在线| 日韩免费在线播放| 人人精品亚洲| 国产真实老熟女无套内射| 精品制服美女丁香| 国产又黄又粗视频| 欧美性高跟鞋xxxxhd| 免费观看黄色av| 欧美老肥婆性猛交视频| 日韩电影精品| 亚洲激情图片| 日本亚洲免费观看| 欧美18—19性高清hd4k| 欧美色道久久88综合亚洲精品| 懂色av一区二区三区四区 | 中文在线中文资源| 国产偷久久久精品专区| 欧美日韩亚洲一区二区三区在线| 岛国毛片在线播放| 亚洲国产高清aⅴ视频| 无码人妻丰满熟妇区bbbbxxxx| 亚洲精品乱码久久久久久按摩观| 成年女人在线看片| 精品国产一区二区三区日日嗨| 欧美激情亚洲| av在线天堂网| 亚洲国产精品久久久久婷婷884 | 91麻豆精品在线观看| 亚洲欧美在线视频免费| 亚洲精品动漫久久久久| 在线视频超级| 欧美日韩亚洲综合一区二区三区激情在线| 一区二区三区福利| 免费中文字幕av| 色狠狠桃花综合| fc2在线中文字幕| 国产精品男人爽免费视频1| 日韩精品欧美| 毛毛毛毛毛毛毛片123| 亚洲国产精品自拍| 少妇无码一区二区三区| 欧美中文字幕第一页| 欧美日韩高清| 日韩av一卡二卡三卡| 曰韩精品一区二区| 亚洲精品无遮挡| 26uuu另类亚洲欧美日本老年| 亚洲香蕉视频| 在线观看的毛片| 亚洲精品免费在线播放| 六月婷婷中文字幕| 人人爽久久涩噜噜噜网站| 成人一级毛片| 女人扒开双腿让男人捅| 天天综合色天天| eeuss影院www在线观看| 成人精品视频99在线观看免费| 欧美日韩p片| 搡老熟女老女人一区二区| 欧美三级日本三级少妇99| 最新日本在线观看| 激情小说综合区| 美腿丝袜亚洲三区| 久久综合综合久久| 亚洲欧美国产一本综合首页| 久久免费资源| 老太脱裤子让老头玩xxxxx| 国产日韩欧美精品一区| 午夜精品久久久久久久第一页按摩| 97精品免费视频| 日韩欧美视频在线播放| 亚洲精品久久一区二区三区777 | 国产不卡av一区二区| 青青草原国产在线视频| 亚洲成国产人片在线观看| 国产对白叫床清晰在线播放| 亚洲va欧美va国产综合久久| 国产精品一二| 四虎884aa成人精品| 精品一区二区三区四区| 亚洲男女网站| 国产又大又硬又粗| 亚洲欧美日韩国产一区二区三区| 手机在线观看毛片| 91精品视频免费| 天堂资源在线中文精品|