精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

谷歌、斯坦福聯合發文:我們為什么一定要用大模型?

人工智能 新聞
所謂大模型者,非謂有參數之謂也,有能之謂也。

?語言模型已經深刻變革了自然語言處理領域的研究和實踐。近年來,大模型在多個領域都取得了重要的突破。它們無需在下游任務上微調,通過合適的指令或者提示就可以取得優異的性能,甚至有時讓人為之驚嘆。

例如,GPT-3 [1] 可以寫情書、寫劇本和解決復雜的數據數學推理問題,PaLM [2] 可以解釋笑話。上面的例子只是大模型能力的冰山一角,現在利用大模型能力已經開發了許多應用,在OpenAI的網站 [3] 可以看到許多相關的demo,而這些能力在小模型上卻很少體現。

今天介紹的這篇論文中,將那些小模型不具備而大模型具備的能力稱為突現能力(Emergent Abilities),意指模型的規模大到一定程度后所突然獲得的能力。這是一個量變產生質變的過程。

突現能力的出現難以預測。為什么隨著規模的增大,模型會忽然獲得某些能力仍舊是一個開放問題,還需要進一步的研究來解答。在本文中,筆者梳理了最近關于理解大模型的一些進展,并給出了一些相關的思考,期待與大家共同探討。

相關論文:?

  • Emergent Abilities of Large Language Models.
    http://arxiv.org/abs/2206.07682
  • Beyond the Imitation Game: Quantifying and extrapolating the capabilities of language models.
    https://arxiv.org/abs/2206.04615

?大模型的突現能力

何謂大模型?到什么尺寸才算“大”?這并沒有一個明確的定義。

一般來說,模型參數可能要達到十億級別才會顯示出明顯不同于小模型的zero-shot和few-shot的能力。近年來已有多個千億和萬億級別參數的模型,在一系列的任務上都取得了SOTA的表現。在一些任務中,模型的性能隨著規模的增加而可靠地提高,而在另一些任務中,模型在某個規模上表現出性能的突然提升。可以用兩個指標去對不同的任務進行分類 [4]:

  • Linearity: 旨在衡量模型隨著規模的增加在任務上的表現在多大程度上得到可靠的提高。

  • Breakthroughness: 旨在衡量當模型規模超過臨界值時可以在多大程度上學習任務。

這兩個指標是模型規模和模型性能的函數,具體計算細節可以參考 [4]。下圖展示了一些高Linearity和高Breakthroughness任務的例子。

圖片

高Linearity的任務大多是基于知識的,也就是說他們主要依賴于記憶訓練數據中存在的信息,比如回答一些事實性的問題。更大的模型通常用更多的數據進行訓練,也能記住更多的知識,所以模型隨著規模的增大在這類任務上顯式出了穩定的提升。高Breakthroughness的任務包括較復雜的任務,它們需要用幾種不同的能力或執行多個步驟以得出正確的答案,例如數學推理。較小的模型難以獲得執行這類任務所需要的所有能力。

下圖進一步展示了不同的模型在一些高Breakthroughness任務上的表現

圖片

?

在未達到一定的模型規模時,模型在這些任務上的表現是隨機的,達到某個特定的規模之后,就有了顯著的提升。

 是平滑還是突現?

前面我們看到的是模型規模增加到一定程度后突然獲得了某些能力,從任務特定的指標來看,這些能力是突現的,但是從另外的角度來看,模型能力的潛在變化更為平滑。本文討論如下兩個角度:(1)使用更為平滑的指標;(2)將復雜的任務分解為多個子任務。

下圖(a)展示了一些高Breakthroughness任務的真實目標對數概率的變化曲線,真實目標的對數概率是隨著模型規模增大逐漸提高的。

圖片

圖(b)顯式了對于某個多項選擇任務,隨著模型規模的增大,正確答案的對數概率逐步提升,而錯誤答案的對數概率在某個特定的規模之前逐步提升,而在此之后趨于平坦。在這個規模之后,正確答案概率和錯誤答案概率的差距拉大,從而模型得到了顯著的性能提升。

此外,對于某個特定任務,假設我們可以用Exact Match和BLEU去評價模型的表現,BLEU相比于Exact Match是更為平滑的指標,使用不同指標所看到的趨勢可能有顯著的差距。

對于一些任務,模型可能在不同的規模上獲得了做這個任務的部分能力。下圖是通過一串emoji去猜測電影名字的任務

圖片

我們可以看到模型在一些規模開始猜測電影名稱,在更大的規模上識別表情符號的語義,在最大的規模上產生正確的答案。

 大模型對如何形式化任務很敏感

模型在什么規模上體現出突然的能力提升也取決于如何去形式化任務。例如,在復雜的數學推理任務上,使用標準的prompting將其視為問答任務,模型規模增大性能提升十分有限,而若使用如下圖所示的chain-of-thought prompting [5],將其視為多步推理任務,則會在某個特定的規模看到顯著的性能提升。

圖片

圖片

更有甚者,研究人員發現通過添加一個簡單的提示“Let’s think step by step”,就可以大幅提升GPT-3的zero-shot推理能力 [6],如下圖所示

圖片

這對于我們的啟發是,大模型有時做不好某個任務,可能并不是真的做不好,而是需要合適的方式去激發它的能力。

 模型越大一定越強嗎?

前面的討論給我們的直觀感覺是模型規模變大性能一定是有所提升的,但是真的是這樣嗎?實際上,對于有些任務,模型變大之后性能可能反而會有所下降,如下圖所示

圖片

紐約大學的幾位研究人員還組織了一項競賽,旨在找到那些模型變大后反而表現變差的任務。

圖片

比如在問答任務中,如果在提問的同時加上你的信仰,大模型會更容易受到影響。感興趣的同學可以關注。

總結與思考

  • 在大多數任務上,隨著模型規模的增大,模型的表現也越好,但是也會有一些反例。更好地去理解模型此類行為還需要更多的研究。

  • 大模型的能力需要合適的方式去激發。

  • 大模型真的是在做推理嗎?如我們之前看到的,通過添加提示“Let’s think step by step”,大模型在數學推理任務上就可以進行多步推理并取得令人滿意的效果,似乎模型已經具備了人類的推理能力。但是,如下如所示,如果給GPT-3一個沒有意義的問題,讓它去做多步推理,GPT-3看似在做推理,實則是一些無意義的輸出。正所謂“garbage in, garbage out”。相比較而言,人類就可以判斷問題是否是合理的,也就是說在給定條件下,當前問題是不是可回答的。“Let’s think step by step”能夠發揮作用,筆者覺得根本原因還是GPT-3在訓練過程中看過很多類似的數據,它做的只不過是根據前面的token去預測接下來的token罷了,跟人類的思考方式仍舊有本質的區別。當然,如果給合適的提示讓GPT-3去判斷問題是不是合理的或許它也能在某種程度上做到,但是距離“思考”和“推理”恐怕仍有相當大的距離,這不是單純增大模型的規模能夠解決的。模型或許不需要像人類那樣思考,但是亟需更多的研究去探索除增大模型規模之外的路徑。

圖片

  • 系統1還是系統2?人類大腦有兩個系統相互配合,系統1(直覺)是快速的、自動化的,而系統2(理性)是緩慢的、可控的。大量實驗已證明,人更喜歡使用直覺進行判斷和決策,而理性可以對其導致的偏誤進行糾正。現在的模型大多基于系統1或系統2進行設計,能否基于雙系統去設計未來的模型呢?

  • 大模型時代的查詢語言。之前我們把知識和數據存儲在數據庫和知識圖譜中,我們可以用SQL查詢關系型數據庫,可用SPARQL去查詢知識圖譜,那我們用什么查詢語言去調用大模型的知識和能力呢?

梅貽琦先生曾說“所謂大學者,非謂有大樓之謂也,有大師之謂也”,筆者在此用個不太恰當的類比結束本篇:所謂大模型者,非謂有參數之謂也,有能之謂也。?

責任編輯:張燕妮 來源: 夕小瑤的賣萌屋
相關推薦

2018-08-24 09:02:26

2025-06-10 11:22:38

AIChatGPT壓縮

2019-02-14 09:35:15

面試MQ中間件

2019-01-29 11:02:30

消息中間件Java互聯網

2022-03-21 07:40:08

線程池Executors方式

2022-05-01 15:42:30

NLP人工智能自然語言處理

2022-10-20 15:38:02

谷歌模型

2021-03-05 11:02:14

iOS 14.5蘋果更新

2025-04-27 08:40:00

OpenAI谷歌AI

2019-09-19 15:12:27

Spring策略框架

2022-04-24 09:54:24

ProxyReflect前端

2011-05-10 15:51:34

SEO

2023-12-05 13:38:11

架構模型

2023-10-20 12:17:57

AI數據

2025-03-06 09:22:00

模型強化學習訓練

2024-12-11 13:30:00

2021-10-13 09:38:13

人工智能機器學習技術

2023-09-06 13:34:31

2022-01-10 13:06:13

微服務API網關

2025-06-03 17:40:30

AIDeepSeekOpenAI
點贊
收藏

51CTO技術棧公眾號

草草地址线路①屁屁影院成人| 精品免费久久久久久久| 伊人网综合在线| 久久久久午夜电影| 亚洲风情亚aⅴ在线发布| 久久久久免费精品| 久久99精品久久久久久野外| 成人一区二区三区在线观看| 国产成人精品国内自产拍免费看| 色偷偷www8888| 国产精品xxxav免费视频| 色噜噜狠狠一区二区三区果冻| 亚洲免费av网| 天天爽夜夜爽夜夜爽| 久久精品国产精品青草| 亚州成人av在线| 欧美视频一区二区在线| 欧美18免费视频| 欧美日韩亚洲综合| 亚洲春色在线视频| 人妻精品一区二区三区| 精东粉嫩av免费一区二区三区 | 日本在线视频站| 成人一级片在线观看| 国产在线视频不卡| 天码人妻一区二区三区在线看| 欧美成人午夜| 在线播放日韩专区| 国产ts在线播放| 粉嫩一区二区三区四区公司1| 欧美浪妇xxxx高跟鞋交| 毛片av免费在线观看| 爱福利在线视频| 成人欧美一区二区三区1314| 日本在线高清视频一区| 亚洲人在线观看视频| 国产.精品.日韩.另类.中文.在线.播放| 国产成人精品午夜| 福利网址在线观看| 国产精品一页| 91国产精品视频在线| www.88av| 欧美色图五月天| 亚洲精品在线观| 中文字幕在线观看91| 日本精品在线播放| 制服丝袜亚洲播放| 99日在线视频| 欧美一级在线| 欧美日韩国产高清一区二区| 在线观看的毛片| 国产v综合v| 91久久久免费一区二区| 波多野结衣家庭教师视频 | 日本伊人精品一区二区三区介绍| 久久久午夜影院| av不卡在线看| 55夜色66夜色国产精品视频| 成人午夜淫片100集| 亚洲综合三区| 欧美一区二区视频97| 久久久久久91亚洲精品中文字幕| 羞羞答答国产精品www一本| 91成人精品网站| 黑人一级大毛片| 一本久道久久综合婷婷鲸鱼| 青青精品视频播放| 日韩黄色一级视频| 美女爽到高潮91| 91久久久久久久| 亚洲国产成人在线观看| 成人av电影在线网| 玖玖玖精品中文字幕| 国内在线免费高清视频| 国产精品美女www爽爽爽| 18视频在线观看娇喘| 丁香花在线电影| 疯狂做受xxxx欧美肥白少妇| 激情综合网俺也去| 人人精品久久| 精品国产精品网麻豆系列 | 婷婷成人综合| 亚洲午夜久久久影院| 国产传媒视频在线| 68国产成人综合久久精品| 久久99国产精品久久久久久久久| 日本三级片在线观看| 日韩国产高清影视| 96sao精品视频在线观看| 老熟妇高潮一区二区高清视频| 91看片淫黄大片一级| 亚洲精品一品区二品区三品区| 亚洲卡一卡二| 精品国产精品自拍| 91高清国产视频| 风间由美一区二区av101| 亚洲一区二区久久久| 日本一级二级视频| 久久大逼视频| 97netav| 毛片免费在线播放| 亚洲男人的天堂在线观看| 欧美日本视频在线观看| 香蕉久久一区| 国产视频久久久| 好吊色视频在线观看| 天堂va蜜桃一区二区三区| 97夜夜澡人人双人人人喊| 国产精品一区二区三区四区色| 亚洲精品乱码久久久久久黑人 | jizz久久久久久| 精品久久99ma| sm捆绑调教视频| 欧美亚洲在线| 97神马电影| 免费黄色在线看| 日本乱人伦aⅴ精品| 国产成人精品一区二区三区在线观看 | 粉嫩精品一区二区三区在线观看| a中文在线播放| 激情成人中文字幕| 亚洲综合中文网| 久久一本综合| 日韩免费av片在线观看| 殴美一级特黄aaaaaa| 亚洲男人天堂av| 污污的视频免费| 国产一区二区精品久| 欧美亚洲国产视频小说| 亚洲a视频在线| 亚洲品质自拍视频| 日韩成人精品视频在线观看| 国产乱码精品一区二区亚洲| 4444欧美成人kkkk| 日本xxxxwww| 一区二区三区蜜桃| 午夜av中文字幕| 亚洲国产精品日韩专区av有中文| 国产精品视频地址| 成人免费在线电影| 欧美性色黄大片| av中文字幕免费观看| 免费看的黄色欧美网站| 国产三区精品| mm视频在线视频| 亚洲成人av在线| 日韩污视频在线观看| www..com久久爱| 夫妻免费无码v看片| 麻豆成人入口| 欧美一级大胆视频| 你懂的在线看| 欧美亚洲国产一卡| 激情丁香综合五月| 国内自拍欧美激情| 亚洲av无码乱码在线观看性色| 自拍偷拍欧美精品| 波多野结衣网页| 中文字幕免费一区二区| 亚洲在线观看视频| 欧美性video| 亚洲成人激情视频| 天天综合天天干| 久久久久国产一区二区三区四区| 99爱视频在线| 国产探花在线精品一区二区| 国产精品九九久久久久久久| 日本在线观看| 欧美一区二区三区不卡| 日本熟妇毛耸耸xxxxxx| 久久男人中文字幕资源站| 成人黄色一区二区| 久久久久久久久久久久久久久久久久| 成人福利视频网| 女人天堂av在线播放| 亚洲男人的天堂网站| 中文天堂在线资源| 亚洲色图在线视频| 黄色av网址在线观看| 日韩精品电影在线观看| 最新中文字幕久久| 欧美亚视频在线中文字幕免费| 国产xxx69麻豆国语对白| 一本一道波多野毛片中文在线| 欧美一级一级性生活免费录像| 日本一级淫片免费放| 国产视频一区二区在线| 97人人模人人爽人人澡| 宅男噜噜噜66国产日韩在线观看| 手机成人在线| 国产欧美三级电影| 国产精品嫩草影院久久久| av免费网站在线观看| 亚洲免费福利视频| 国产av一区二区三区| 色妞www精品视频| 麻豆视频在线免费看| 91麻豆精东视频| 手机看片国产精品| 丝袜亚洲另类丝袜在线| 久久精品在线免费视频| 蜜臀av免费一区二区三区 | 国产日韩欧美中文在线| 欧美在线不卡区| 操你啦视频在线| 亚洲精品自拍第一页| 99久久精品国产一区色| 精品久久久久国产| 国产97免费视频| 国产亚洲精品福利| av不卡中文字幕| 久久成人免费网| 国产日韩一区二区在线| 欧美午夜不卡| 亚洲欧美电影在线观看| 欧美人妖视频| 成人免费视频观看视频| 狂野欧美性猛交xxxx| 38少妇精品导航| eeuss鲁一区二区三区| 久久久国产影院| 婷婷成人激情| 一区二区三区国产在线观看| 五月婷婷丁香花| 欧美va日韩va| 国产极品久久久| 91精品麻豆日日躁夜夜躁| 日本免费精品视频| 欧美午夜片在线免费观看| 日韩久久精品视频| 亚洲自拍偷拍网站| 久艹视频在线观看| 一区二区三区在线免费播放| 亚洲综合久久av一区二区三区| 国产日韩欧美麻豆| 日本aaa视频| 337p粉嫩大胆色噜噜噜噜亚洲| 污网站免费观看| 国产91丝袜在线观看| 无套白嫩进入乌克兰美女| 久国产精品韩国三级视频| 手机在线成人免费视频| 日欧美一区二区| www日韩在线观看| 麻豆久久精品| 日本老熟妇毛茸茸| 日韩专区一卡二卡| 国产成人无码av在线播放dvd| 中文日韩欧美| 久久久999视频| 国产精品一国产精品k频道56| 日韩小视频在线播放| 国产精品日韩精品欧美精品| 男人揉女人奶房视频60分 | 三级黄色片免费观看| 久久国产精品色婷婷| 中文字幕日韩久久| 国产成人精品综合在线观看 | 日本一区二区动态图| 色欲AV无码精品一区二区久久| 欧美激情一区二区在线| 国产男女猛烈无遮挡在线喷水| 亚洲丝袜美腿综合| 豆国产97在线 | 亚洲| 天天操天天干天天综合网| 亚洲欧美日韩激情| 欧美久久一二三四区| 精品国产亚洲av麻豆| 亚洲成avwww人| 日本不卡免费播放| 在线看日韩欧美| av大大超碰在线| 91精品国产一区| 成人在线观看免费播放| 91久久久一线二线三线品牌| 国产精品zjzjzj在线观看| 欧洲一区二区日韩在线视频观看免费 | 中文字幕在线看片| 国产精品色视频| 天堂va在线高清一区| 麻豆精品视频| 久久中文字幕av| 成人免费在线网| 人人狠狠综合久久亚洲| 波多野结衣中文字幕在线播放| av在线免费不卡| xxxxx99| 亚洲国产精品一区二区久久恐怖片 | 在线观看完整版免费| 欧美国产第二页| 美女网站视频一区| 91高跟黑色丝袜呻吟在线观看| 日韩欧美在线精品| 三级网在线观看| 亚洲一区二区三区四区五区午夜| 欧美wwwwwww| av亚洲精华国产精华精华| 特黄一区二区三区| 精品毛片网大全| 国产剧情精品在线| 亚洲女人天堂成人av在线| 永久免费网站在线| 国产精品27p| 成人av激情人伦小说| 夜夜爽99久久国产综合精品女不卡 | 欧美国产精品一区二区| 国产精品成人久久| 在线播放日韩导航| 国产高清视频在线| 久久久人成影片一区二区三区| av成人免费看| 欧美日本韩国国产| 亚洲黄色毛片| 国产精品19p| 国产精品日产欧美久久久久| 久久国产精品免费看| 日韩欧美自拍偷拍| 97在线观看免费观看高清| 欧美综合在线观看| 亚洲一区二区三区在线免费| 一本一本久久a久久精品综合妖精| 在线综合亚洲| 黄色性视频网站| 亚洲一区在线观看视频| 国产又粗又猛视频免费| 国产一区二区精品丝袜| 美女露胸视频在线观看| 北条麻妃高清一区| 一区二区日韩欧美| 中文字幕国产免费| 亚洲国产高清aⅴ视频| 成人毛片在线播放| 日韩国产欧美精品在线 | 日韩免费黄色av| 欧美a一欧美| 奇米影视亚洲色图| 懂色av中文一区二区三区| 午夜免费激情视频| 日韩一区二区在线观看| 91在线中文| 97免费资源站| 欧美日韩综合| 亚洲少妇一区二区| 亚洲国产精品综合小说图片区| 精品久久久免费视频| 欧美国产第一页| 加勒比久久高清| 日韩欧美国产免费| 26uuu精品一区二区| 中文字幕精品无| 亚洲天堂男人天堂| 成人影院在线免费观看| 在线观看日本一区| 国内久久精品视频| √天堂中文官网8在线| 日韩午夜av电影| 大黄网站在线观看| 精品免费国产| 久久综合图片| 亚洲综合久久av一区二区三区| 91精品国产黑色紧身裤美女| 色屁屁www国产馆在线观看| 99热99热| 久久久久久黄| 2017亚洲天堂| 91精品国产综合久久蜜臀| 啦啦啦中文在线观看日本| 激情小说综合区| 久久影院亚洲| 中文字幕美女视频| 日韩精品一区二区三区蜜臀| mm视频在线视频| 性欧美videosex高清少妇| 国产精品一区在线观看你懂的| 久久久久亚洲av片无码下载蜜桃| 日韩成人在线视频观看| 国产精品扒开腿做爽爽爽视频软件| 一区二区精品在线观看| 国产精品一区二区在线观看不卡| 国产精品99re| 中文字幕日韩专区| 亚洲一区 二区| 欧美xxxxx在线视频| 亚洲女同ⅹxx女同tv| 天天干视频在线| 国产美女久久精品香蕉69| 激情综合自拍| 蜜桃av免费在线观看| 欧美xxxx在线观看| 久久精品女人天堂av免费观看| 天天综合中文字幕| 91在线视频免费91| 91成年人视频| 欧美一区二区大胆人体摄影专业网站| 999国产精品视频| 国产精品无码网站| 欧美一区二区三区四区高清| 在线精品亚洲欧美日韩国产| 潘金莲一级淫片aaaaa免费看| 99精品欧美一区|