精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

新研究:大語言模型“涌現”能力不令人驚訝也不難預測

人工智能
如今對大語言模型中的“涌現”能力的理解可能因采用不同的衡量工具而有所改變,但對于未來更大、更復雜的大語言模型來說,情況可能會有所不同。

3月26日消息,一項新的研究認為,大語言模型性能的顯著提升并不令人意外,也并非無法預測,實際上這是由我們衡量人工智能性能的方式所決定的。

兩年前,450位研究人員在一個名為超越模仿游戲基準(Beyond the Imitation Game Benchmark,BIG-bench)的項目中,編制了一份包含204項任務的清單,旨在測試ChatGPT等聊天機器人背后的大語言模型的性能。在這些任務中,大多數情況下,隨著模型規模的增大,性能呈現出可預測的平穩提升——即模型越大,性能越好。但在其他任務中,模型性能的提升卻不是那么穩定,一段時間內性能幾乎為零,然后突然出現顯著提升,其他研究也發現了類似的性能飛躍現象。

研究人員將這種現象描述為“突破性”行為,而其他人則將其比作物理學中的相變,如液態水轉變為冰。2022年8月份發表的一篇論文中指出,這些現象不僅出乎意料,而且難以預測,它們對于人工智能的安全性、潛力和風險的討論提供了更多的視角。研究人員用“涌現”(emergent)一詞來描述這種僅在系統達到一定復雜程度時才出現的行為。

然而,真相可能并不那么簡單。斯坦福大學的三位研究人員在一篇新論文中認為,這種性能的突然提升僅僅是反映了我們衡量大語言模型性能的方法。他們認為,這種能力既不是不可預測的,也不是突然出現的。“這種變化比大家想象的要容易預測得多,”斯坦福大學計算機科學家、論文的資深作者薩恩米·科耶喬(Sanmi Koyejo)表示,“所謂的涌現更多地與我們選擇的衡量模型工作方式有關。”

研究人員之所以現在才開始發現和研究這種行為,是因為這些模型已變得足夠大。大語言模型通過分析大量文本數據集——包括書籍、網絡搜索結果和維基百科等,來尋找經常共現的單詞間的聯系。模型的規模按參數數量衡量,參數越多,模型能發現的聯系就越多。GPT-2擁有15億個參數,而支持ChatGPT的GPT-3.5則使用了3500億個參數。據報道,2023年3月首次亮相的GPT-4使用了1.75萬億個參數,現在它也成了微軟人工智能助理Microsoft Copilot的基礎模型。

這種規模的快速增長帶來了性能和效率的顯著提升,沒有人會質疑規模足夠大的大語言模型能完成小型模型無法完成的任務,包括那些它們未經訓練的任務。斯坦福大學的三位研究人員將涌現看作是一種“幻覺”,他們認為,隨著規模的擴大,大語言模型自然而然應該變得更加高效;較大模型增加的復雜性使其在處理更難和更多樣化的問題時表現得更為出色。但這三位研究人員認為,這種改進是否呈現為平穩可預測的提升,或是參差不齊的突然飛躍,主要取決于所選擇的衡量標準,甚至可能是由于測試樣本的不足,而非模型內部運作機制本身。

例如,三位數加法就是一個典型例子。在2022年的BIG-bench研究中提出,研究人員報告稱,在參數較少的情況下,GPT-3和另一大語言模型LAMDA均無法準確解決加法問題。然而,當GPT-3的參數增至130億時,其性能如同開關被打開一樣突然改變。GPT-3突然間就能夠正確完成加法運算,當LAMDA的參數增至680億時也是如此。這表明,完成加法運算的能力似乎在某個參數閾值時突然出現。

但斯坦福大學的研究人員指出,之前對大語言模型的評價標準僅僅基于準確性:模型要么能做到,要么做不到。因此,即便模型最初能夠正確預測出大部分數字,也被判定為失敗。這種評價方式顯得有些不合理。如果任務是計算100加278,那么結果為376顯然比-9.34要準確得多。

因此,科耶喬和他的研究合作者采用了一種獎勵部分正確答案的衡量標準來測試同一任務。科耶喬表示:“我們可以問:模型預測第一個數字的準確度有多高?第二個、第三個數字呢?”

科耶喬認為這項新研究的靈感來源于他的研究生賴蘭·謝弗(Rylan Schaeffer),他稱謝弗注意到大語言模型的表現隨著評估方法的不同而變化。與斯坦福大學的同學白蘭度·米蘭達(Brando Miranda)共同研究后,他們采用了新的評估指標,發現隨著模型參數的增加,大語言模型在解決加法問題時預測的數字序列的準確度逐漸提高。這說明,模型解決加法問題的能力并非突然出現;換言之,這種能力的涌現并非不可預測的突然跳變,而是一個可預測的、穩步的變化過程。他們發現,當采用不同的度量標準衡量性能時,“涌現”現象就消失了。

盡管如此,其他科學家認為,這項工作并未完全排除“涌現”概念的存在。例如,美國東北大學(Northeastern University)計算機科學家李天石指出,這三位研究人員的論文并未明確解釋在哪些度量標準或情況下,大語言模型的性能會顯示出突然的提升。她說:“因此,從這個意義上說,這些能力仍然是不可預測的。”現在在OpenAI工作的計算機科學家杰森·魏(Jason Wei)曾編制過一份關于模型“涌現”能力的清單,也是BIG-bench論文的作者之一,他認為,早期關于“涌現”能力的說法是合理的,因為對于算術這樣的能力來說,正確的答案才是最重要的。

人工智能初創公司Anthropic的研究科學家亞歷克斯·塔姆金(Alex Tamkin)表示:“這種探討絕對很有意思。”他認為,新論文巧妙地分解了多步驟任務,以識別各個組成部分的貢獻。塔姆金說,“但這并不是全部故事。我們不能說所有這些跳變都是幻覺。我仍然認為,即使在進一步預測或使用連續指標的情況下,文獻顯示性能提升仍有不連續性。當你增加模型的規模時,仍然可以看到它以跳變的方式變得更好。”

即使如今對大語言模型中的“涌現”能力的理解可能因采用不同的衡量工具而有所改變,但對于未來更大、更復雜的大語言模型來說,情況可能會有所不同。萊斯大學的計算機科學家胡俠表示:“當我們把大語言模型訓練到下一個層次時,它們不可避免地會從其他任務和模型中借鑒知識。”

這種對“涌現”能力的新理解不僅是研究人員需要考慮的一個抽象問題。對塔姆金而言,這直接關系到如何繼續預測大語言模型的性能。“這些技術已經如此廣泛和普及,”他說。“我希望社區將此作為一個起點,繼續強調為這些現象建立一門預測科學的重要性。我們怎樣才能不對下一代模型的出現感到驚訝呢?”

責任編輯:姜華 來源: 網易科技
相關推薦

2023-05-22 09:19:19

2024-04-11 07:10:59

大語言模型AI人工智能

2023-08-14 20:18:20

模型神經元

2023-05-04 12:32:28

模型研究

2023-06-22 19:49:23

2024-12-02 08:20:00

2020-11-13 06:18:07

JupyterPython數據分析

2023-12-08 13:22:00

數據模型

2025-06-09 09:32:35

2025-01-10 10:30:00

大模型統計評估

2020-02-27 21:37:33

物聯網IOT物聯網應用

2023-04-27 13:46:08

語言模型ChatGPT人工智能

2025-11-05 03:22:00

知識圖譜語言模型生物醫學

2023-02-15 14:07:03

2025-02-17 11:10:49

2023-05-05 13:29:04

模型推理

2023-12-30 13:31:30

模型數據信息

2025-02-20 12:37:57

2024-05-09 08:33:33

2024-04-16 14:13:03

人工智能語言模型
點贊
收藏

51CTO技術棧公眾號

欧美日韩国产综合一区二区| 粉嫩av亚洲一区二区图片| 永久免费看mv网站入口亚洲| 亚洲免费999| 国产不卡在线| 久久综合九色综合欧美就去吻 | 黄色在线观看视频网站| 久久综合九色综合97_久久久| 国产精品自产拍在线观| 日韩精品一区三区| 99精品视频在线| 亚洲国产欧美一区| 伊人成人222| 女厕盗摄一区二区三区| 亚洲欧美在线高清| 免费av在线一区二区| 99热这里是精品| 日日夜夜免费精品| 高清视频欧美一级| 无码少妇精品一区二区免费动态| 日韩精品免费视频一区二区三区| 色老汉av一区二区三区| 91亚洲精品国产| 调教视频免费在线观看| 久久亚洲捆绑美女| 高清不卡日本v二区在线| 久久久久久久久黄色| 国产综合网站| 操日韩av在线电影| 天堂av网手机版| 九九久久电影| 亚洲精品一区中文字幕乱码| 丰满少妇中文字幕| 亚洲精品伦理| 欧美自拍偷拍一区| 日本黄色三级大片| 午夜av不卡| 午夜伦欧美伦电影理论片| 免费在线精品视频| 日本成人网址| 国产精品午夜在线观看| 清纯唯美一区二区三区| 天堂成人在线| 波多野结衣在线一区| 国产成人亚洲欧美| 国产后入清纯学生妹| 精品综合免费视频观看| 国产精品久久色| 亚洲高清视频免费观看| 日韩va亚洲va欧美va久久| 91av视频在线观看| 久草国产精品视频| 亚洲一区观看| 欧美一区二区.| 天天干天天干天天操| 国产精品久久久免费| 欧美一区二区三区四区在线| 日本在线小视频| 香蕉久久夜色精品| 国产成人激情视频| av首页在线观看| 日韩成人dvd| 91精品视频观看| www.久久综合| 99在线热播精品免费| 久久久久久草| 东热在线免费视频| 国产精品乱人伦一区二区| 亚洲最新免费视频| 五月花成人网| 天天操天天干天天综合网| 亚洲午夜无码av毛片久久| 毛片无码国产| 欧美美女bb生活片| 韩国av中国字幕| 国产精品调教视频| 亚洲一区二区国产| 性欧美疯狂猛交69hd| 狠狠综合久久av一区二区老牛| 欧美激情亚洲激情| 激情视频网站在线观看| 久久精品国产免费看久久精品| 91亚洲精品久久久| 天堂av2024| 国产欧美1区2区3区| 欧美日韩亚洲国产成人| f2c人成在线观看免费视频| 日韩欧美高清视频| 国产成人美女视频| 六月丁香久久丫| 一区二区三区国产视频| 99精品久久久久| 日韩电影在线免费看| 亚洲最大的免费| 男人的天堂在线| 亚洲欧美激情小说另类| 日本免费不卡一区二区| 日韩专区视频网站| 亚洲美女av网站| 黑人巨大精品一区二区在线| 三级亚洲高清视频| 99久久精品无码一区二区毛片| 日韩一级免费毛片| 自拍偷拍国产亚洲| 丁香啪啪综合成人亚洲| 久久在线观看| 一本色道久久88精品综合| 久久精品视频9| 免费观看一级特黄欧美大片| 国产伦精品一区二区三区四区视频 | 久久精品视频在线观看| 91av在线免费视频| 国产一区二区三区精品视频| 欧美二区在线| free性欧美16hd| 91精品国产综合久久香蕉的特点| 亚洲av无码一区二区二三区| 亚洲午夜伦理| 91久久精品美女| 国产小视频免费在线网址| 亚洲午夜久久久久久久久电影院| 香港日本韩国三级网站| 日韩欧美美女在线观看| 久久久噜噜噜久久久| 国产情侣av在线| 中文一区二区完整视频在线观看| 波多野结衣50连登视频| 97se亚洲| 欧美激情视频给我| 国产手机精品视频| 18欧美亚洲精品| 久热精品在线观看视频| jiujiure精品视频播放| 国产999精品久久久影片官网| 噜噜噜久久,亚洲精品国产品| 亚洲视频在线一区二区| 日本激情视频在线| 国产精品亚洲人成在99www| 国产91|九色| 无码国产精品高潮久久99| 亚洲一区二区三区自拍| 少妇欧美激情一区二区三区| 久久精品欧美一区| 成人黄色免费在线观看| 快射av在线播放一区| 欧美理论电影在线| 亚洲天堂网av在线| 国产一区二区三区香蕉| 91视频成人免费| 免费一级欧美在线大片| 欧美肥臀大乳一区二区免费视频| www.久久精品.com| 亚洲国产欧美一区二区三区丁香婷| 国产成人av片| 国产欧美日韩一级| 欧洲亚洲一区二区| 日韩黄色三级| 欧美xxxx做受欧美| 亚洲av少妇一区二区在线观看 | 大白屁股一区二区视频| 免费视频爱爱太爽了| 高清精品视频| 欧美在线亚洲一区| 成年午夜在线| 欧美一区二区三区影视| 久久久国产成人| 91日韩一区二区三区| 国语对白做受xxxxx在线中国 | 综合激情国产一区| 国产精品久久久午夜夜伦鲁鲁| 国产精品乱人伦中文| 国产调教打屁股xxxx网站| 99国产精品久久久久久久| 欧美日韩在线精品一区二区三区| 日韩精品麻豆| 色在人av网站天堂精品| 亚洲色偷精品一区二区三区| 色吊一区二区三区| 免费在线观看黄色小视频| 懂色av一区二区三区免费观看| 大肉大捧一进一出好爽视频| 成人精品亚洲| 99久久99久久| 国产综合av| 蜜臀久久99精品久久久久久宅男| 天天爱天天干天天操| 欧美三级电影在线看| 激情小说中文字幕| 国产日韩欧美不卡| 成人一区二区三区仙踪林| 久久精品人人做人人爽电影蜜月| 尤物国产精品| 欧美日韩大片免费观看| 91精品国产综合久久香蕉922| 免费在线中文字幕| 中文字幕日韩欧美| 五月天婷婷激情网| 7878成人国产在线观看| 在线观看日本视频| 一区二区三区在线视频免费观看| 蜜桃精品一区二区| 国产成人久久精品77777最新版本 国产成人鲁色资源国产91色综 | 99久久综合狠狠综合久久止| 日韩国产网站| 国语自产在线不卡| av文字幕在线观看| 国产亚洲精品91在线| 丰满人妻妇伦又伦精品国产| 欧美日韩亚洲另类| 欧美一区二区激情视频| 亚洲精品成人少妇| 欧美色图17p| 久久嫩草精品久久久精品| 国产精品久久久久久久99| 久久激情一区| 男女猛烈激情xx00免费视频| 91日韩在线| 日韩欧美激情一区二区| 欧洲精品一区| 国产精品日韩高清| 免费一级欧美在线大片| 成人免费视频网址| 欧美性生活一级| 国产精品免费在线免费 | 成人免费网站在线| 岛国精品在线| 国产va免费精品高清在线观看| 1024在线看片你懂得| 九九热精品视频| 国产传媒在线播放| 久久久精品视频成人| 自拍视频在线| 在线视频日韩精品| av在线之家电影网站| 亚洲天堂av在线免费| 久久久久久久久亚洲精品| 亚洲精品久久视频| 午夜影院在线视频| 日韩av影片在线观看| 天堂在线观看视频| 日韩av在线导航| 青青久草在线| 亚洲色图五月天| 国产小视频在线观看| 国产亚洲欧美日韩美女| 国产精品ⅴa有声小说| 中文字幕一区二区精品| 三区四区在线视频| 久久九九国产精品怡红院| 黄色免费网站在线| 久久高清视频免费| 人交獸av完整版在线观看| 欧美激情免费观看| 欧美大胆a人体大胆做受| 欧美中文在线观看| 欧洲成人一区| 国产欧美日韩视频| 日本免费精品| 国产欧美日韩综合精品二区| 视频福利一区| 色综合影院在线观看| 日韩成人精品一区| 男人草女人视频| 亚洲巨乳在线| 校园春色 亚洲色图| 国产尤物一区二区在线| 性活交片大全免费看| 久久免费视频一区| 1024手机在线观看你懂的| 综合激情成人伊人| 在线看成人av| 欧美在线免费观看亚洲| 97人妻精品一区二区三区视频| 日韩一区二区三区在线| 午夜视频www| 日韩中文字幕免费| 国产v日韩v欧美v| 国产成人在线播放| 警花av一区二区三区| 久久久久久99| 亚洲情侣在线| 国产美女三级视频| 极品少妇一区二区三区精品视频| 香蕉视频1024| 中文欧美字幕免费| 日韩精品一区二区在线播放| 欧美专区日韩专区| 亚洲av无码乱码国产精品| 亚洲欧美在线一区| h片在线播放| 国产成人精品久久亚洲高清不卡| 伊人久久大香| 欧美久久久久久久| 很黄很黄激情成人| 最新中文字幕2018| 91在线视频播放| 在线观看成人毛片| 欧美视频在线不卡| 日本美女一级片| 久久精品国产亚洲7777| 日本乱码一区二区三区不卡| 成人久久久久久| 国产精品一国产精品| 日韩中字在线观看| 黄页网站大全一区二区| 欧美黄色一级生活片| 亚洲国产裸拍裸体视频在线观看乱了| 这里只有精品国产| 精品视频久久久久久| 四虎影视国产在线视频| 国产玖玖精品视频| 国产精品一区高清| 3d动漫一区二区三区| 国产乱一区二区| 少妇一级黄色片| 色欧美乱欧美15图片| 五月婷婷开心中文字幕| 欧美大片在线看免费观看| 一区二区三区日本视频| 亚洲a∨一区二区三区| 久久久久久久高潮| 91av在线免费| 亚洲一二三四在线观看| 国产毛片久久久久| 精品国产一区二区三区久久| 春暖花开亚洲一区二区三区| 久久精品ww人人做人人爽| 亚洲成人中文| 影音先锋资源av| 一区二区不卡在线播放| av网站免费播放| 久久久精品免费| 精品国产伦一区二区三区观看说明| 中文字幕乱码一区二区三区| 美女视频免费一区| 特黄一区二区三区| 欧美人妇做爰xxxⅹ性高电影 | 欧美激情videoshd| 粉嫩精品导航导航| 国产www免费| 99久久国产综合精品色伊| 麻豆久久久久久久久久| 日韩电影大片中文字幕| 在线观看福利电影| 欧美日韩中文国产一区发布| 天堂一区二区在线| 成人黄色免费网址| 欧美夫妻性生活| 国产激情在线| 国产伦精品一区二区三区免费视频| 悠悠资源网久久精品| 国产乱了高清露脸对白| 欧美性xxxx在线播放| 国产精品秘入口| 国产伊人精品在线| 综合色一区二区| 波多野结衣办公室双飞| 亚洲成a人片在线观看中文| 五月天婷婷视频| 国产精品成人av在线| 手机亚洲手机国产手机日韩| 午夜大片在线观看| 亚洲综合激情小说| 日韩一区av| 国产欧美中文字幕| 午夜精品久久99蜜桃的功能介绍| jjzzjjzz欧美69巨大| 日韩欧美极品在线观看| www 日韩| 北条麻妃高清一区| 久久久久国产精品午夜一区| 欧美丰满老妇熟乱xxxxyyy| 欧美精品xxxxbbbb| mm视频在线视频| 午夜精品福利一区二区| 国产精品一区2区| 亚洲免费在线视频观看| 日韩中文综合网| 成人爽a毛片| 99视频在线视频| 亚洲午夜久久久久久久久电影网| 精品欧美不卡一区二区在线观看| 成人久久久久爱| 亚洲免费中文| 中文字幕手机在线观看| 精品亚洲国产视频| 精品国产不卡一区二区| 欧美激情成人网| 一区二区三区av电影| 国产无套粉嫩白浆在线2022年| 96精品久久久久中文字幕| 国产精品最新自拍| 天天操天天操天天操天天操天天操| 亚洲成年人在线播放| av成人免费| 久久精品.com| 一区二区三区成人在线视频| 超碰国产在线| 久久精品国产99精品国产亚洲性色| 捆绑紧缚一区二区三区视频 |