精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

背誦不等于理解,深度解析大模型背后的知識儲存與提取

人工智能 新聞
自然語言模型的背誦 (memorization) 并不等于理解。即使模型能完整記住所有數(shù)據(jù),也可能無法通過微調 (finetune) 提取這些知識,無法回答簡單的問題。

隨著模型規(guī)模的增大,人們開始探索大模型是如何掌握大量知識的。一種觀點認為這歸功于 “無損壓縮”,即模型通過大量訓練,記憶更多內容以提高預測精度。但 “無損壓縮” 真的能讓大模型理解這些知識嗎?朱澤園 (MetaAI) 和李遠志 (MBZUAI) 的最新研究《語言模型物理學 Part 3.1:知識的儲存與提取》深入探討了這個問題。

論文地址:https://arxiv.org/pdf/2309.14316.pdf

對于人類,有句話叫 “書讀百遍,其意自現(xiàn)”。這句話雖不適用于所有知識,但對于簡單知識,只要我們能記住相關書籍,就能輕松回答相關問題。例如,只要我們記住古詩 “靜夜思”,就能輕松回答 “詩里把月光比作了什么?”;只要我們記住百度百科關于 “出師表 / 創(chuàng)作背景” 那一段,就能輕松回答 “出師表的創(chuàng)作時間是什么?”。那么,大模型是否也能做到這一點呢?

圖片

圖 1:GPT-4 的一些知識提取的實例(左圖為 ChatGPT,右圖為 API)

GPT-4 雖然能理解并復述與問題相關的段落,但為何它無法像人類一樣回答簡單的問題呢?是因為模型不夠大,記憶力不足,還是訓練后的微調不夠?都不是!文章指出,即使自然語言模型足夠大,訓練時間足夠長,微調也足夠充分,但它仍可能無法回答人類認為簡單的問題。這其中的深層原因,與知識在預訓練數(shù)據(jù)集 (pretrain data) 中的呈現(xiàn)方式有關。同一知識,需要在預訓練數(shù)據(jù)集中多次出現(xiàn),且具有足夠的 “多樣性”,微調后才更容易被提取出來。

為了證實這一點,兩位作者創(chuàng)建了一個包含 100k 個人物傳記的數(shù)據(jù)集,每個人物有一個傳記條目,包含人名和六個固定屬性:出生日期,出生地,大學專業(yè),大學名稱,工作地點,工作單位。他們設計了 BioS 和 BioR 兩種數(shù)據(jù)集,BioS 的每個句子選自 50 種固定模板,BioR 則用 LLaMA-30B 進行改寫,更逼真,多樣性更大。兩種數(shù)據(jù)集的結果一致,下面以 BioS 為例,展示一個樣例條目:

Anya Briar Forger was born on October 2, 1996. She spent her early years in Princeton, NJ. She received mentorship and guidance from faculty members at MIT. She completed her education with a focus on Communications. She had a professional role at Meta Platforms. She was employed in Menlo Park, CA.

圖 2

一個自然語言模型即使完美地預訓練 (pretrain) 了 100k 個人的自傳,也無法通過 QA 微調 (finetuning) 準確回答 “Anya 本科念了哪所學?!?這樣的問題。如圖 2 所示,即使使用 50k 的人作為 QA 微調訓練數(shù)據(jù),嘗試各種微調方法,包括 LoRA,模型在剩下的 50k 人上的正確率也只有 10%。即使使用了 682M 的模型(比人數(shù)大 7000 倍),訓練了 1350 遍,作者甚至加入了 WikiBook 等標準 NLP 預訓練數(shù)據(jù),正確率也沒有提升。可見 “大力出奇跡” 并沒有發(fā)生。

因此,大模型并不一定能掌握或提取 “無損壓縮” 的知識。那么 GPT-4 是如何掌握知識的呢?為了研究這一問題,兩位作者對預訓練集進行改動 —— 作者稱之為知識增強

1、多樣性 - multiM:為每個人創(chuàng)建 M 個傳記條目,使用不同的敘述語言但保留相同的信息(每句話一共有 100 種敘述方法,每條傳記的每句話從中選取一種)

2、隨機排列 - permute:對傳記句子進行隨機排列

3、全名 - fullname:將傳記里所有代詞、姓、名替換全名

作者把原始數(shù)據(jù)集稱為 bioS single,并試驗了 15 種知識增強組合。例如,bioS multi5+permute 表示每人有 5 個傳記,語序打亂。以下是 bioS multi5+permute 的一個示例:

Anya Briar Forger originated from Princeton, NJ. She dedicated her studies to Communications. She gained work experience in Menlo Park, CA. She developed her career at Meta Platforms. She came into this world on October 2, 1996. She pursued advanced coursework at MIT.

對于人和大模型,記住 bioS single 和 bioS multi5+permute 兩個數(shù)據(jù)集的難度幾乎相同(它們信息量相同,并且每句話都是選自 50 個模板)。那么,如果在這個新的知識增強數(shù)據(jù)集上進行預訓練 (pretrain),然后 QA 微調,會有什么新的表現(xiàn)嗎?

圖片

圖 3

圖 3 顯示,bioS single 預訓練模型的 QA 正確率僅為 9.7%,而 bioS multi5+permute 預訓練模型的正確率高達 96.6%。這個顯著的提升與模型的微調、大小或訓練時間無關,而是與知識在預訓練 (pretrain) 中的呈現(xiàn)方式有關,即知識如何被大模型 “背誦”。

研究還發(fā)現(xiàn),將傳記分為名人 (celebrity) 和少數(shù)群體 (minority),只要名人傳記有知識增強,即使少數(shù)群體沒有,模型對少數(shù)群體的知識提取正確率也會大幅提升 —— 當然,最好的效果還是需要對所有數(shù)據(jù)進行知識增強。

圖片

圖 4:僅僅通過增加名人 (celebrity) 的訓練數(shù)據(jù)多樣性,少數(shù)群體的知識提取正確率猛增

那么為何背誦不同數(shù)據(jù)后,模型的問題回答能力差異大?為何反復背誦名人傳記,可以讓少數(shù)群體的知識提取能力也增強?原因是由于模型采取了不同的記憶方式。

作者通過兩種線性探針 (linear probing) 深入探討了模型的記憶知識的原理。我們來看其中一種叫 P 探針 (P-probing) 的方法。

在 P 探針中,我們輸入傳記條目到預訓練模型,訓練一個線性分類器預測六個目標屬性(如大學、專業(yè)等)。我們想看模型是否能在早于屬性的位置提取這些信息。如果分類器在人名后立即顯示對 “工作單位” 有高準確率,說明模型直接學習了 “Anya 的雇主是 Meta”。如果只在傳記結尾達到高準確率,可能模型用了有缺陷的記憶方法,例如 “某人生日是 1996 年 10 月 2 日,大學是 MIT,因此雇主是 Meta”。

P 探針的試驗設計是這樣的。找出每個傳記中 6 個屬性首次出現(xiàn)的位置,然后在這些位置的前一個位置,訓練一個線性分類器來預測每個目標屬性。這就產(chǎn)生了 36 個分類任務。

圖片

圖 5:P 探針試驗結果顯示,預訓練數(shù)據(jù)集的知識增強使知識被存在更早的位置,部分甚至直接存儲在人名上。模型是否能通過微調回答問題,與預訓練時是否將信息直接存儲在人名上有關(對比圖 3 和圖 5)。

P 探針試驗結果顯示,自然語言模型在預訓練時可以通過人名記住信息以實現(xiàn)壓縮,也可以通過其他信息(如 “在 MIT 就讀并且生日是 1996 年 10 月 2 日的人的工作單位是...”)記憶。雖然第二種記憶方式對人來說 “不自然”,但對模型來說兩種方法的壓縮比無異。如果模型采用第二種方式記住信息,訓練結束后將無法通過微調回答問題。而通過知識增強,預訓練模型會逐漸傾向于學會使用第一種記憶方式。

有人可能會爭論,上述 “知識提取” 失敗可能是由于自回歸 (autoregressive) 語言模型如 GPT 的單向性。實際上,雙向語言模型如 BERT 在知識提取上更差,對 “Meta Platform” 這類多詞組知識只能存儲,無法提取。有興趣的讀者可以參考論文第 6 章。

總的來說,語言模型是否能回答 “知識提取” 問題,不僅取決于 “無損壓縮”,還與 “如何在模型中壓縮” 有關。論文強調,預訓練過程中對關鍵但少見的數(shù)據(jù)進行知識增強是必要的(如使用 ChatGPT 進行多次改寫)。如果沒有這一步,無論如何努力微調,已預訓練完的模型雖然無損壓縮了訓練數(shù)據(jù),但是還是可能再也無法提取那些知識了!

結語

如何理解自然語言模型的工作原理?大多數(shù)研究者通過與 GPT-4 等模型對話,推測其能力。然而,《語言模型物理學》系列論文的作者提出了一種更精確的方法,通過精細設計訓練數(shù)據(jù)和可控實驗,探究 Transformer 的內部機制,解釋其處理 AI 任務的能力。

在《Part 3.1:知識的儲存與提取》中,作者精確測試了模型對不同數(shù)據(jù)的反應,找到了模型學習知識和能力與訓練數(shù)據(jù)的準確關系。

他們還發(fā)布了《Part 3.2:知識的操作》,進一步研究了模型如何在特定情況下操作知識。例如,如果大模型記住了《靜夜思》,能否通過微調使其推理出《靜夜思》的最后一句是 “低頭思故鄉(xiāng)”?我們很快講為大家?guī)砗罄m(xù)報道。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2012-02-03 14:39:12

Java

2015-08-12 10:04:24

2010-04-28 14:38:26

云計算

2021-09-06 15:29:16

大數(shù)據(jù)防疫信息安全

2010-07-19 11:12:43

Perl 不等于

2017-06-29 08:45:06

MySQLNOT INNOT EXISTS

2010-10-18 10:51:00

蘋果

2025-06-04 03:25:00

Java浮點數(shù)數(shù)學缺陷

2023-03-07 07:45:28

2011-08-08 09:59:35

Android

2019-08-27 08:43:15

2023-06-02 13:53:56

2015-12-01 10:42:07

2024-11-27 10:44:48

2023-11-08 13:32:00

JavaScript浮點數(shù)計算

2009-03-11 11:36:31

技術人員角色感想

2025-08-27 08:43:39

RAGAI助手知識庫

2013-11-26 09:55:12

2013-08-15 09:15:23

云計算CIO信息化

2010-01-28 10:25:12

點贊
收藏

51CTO技術棧公眾號

国产精品麻豆网站| 久久成人久久爱| 日韩精品中文字幕在线观看| 成人一区二区三| 欧美a在线看| 成人精品在线视频观看| 69精品小视频| 制服丨自拍丨欧美丨动漫丨| 在线综合色站| 在线观看视频91| 成年在线观看视频| 国产高清视频在线观看| 丁香激情综合国产| 国产精品日韩精品| 精品欧美一区二区三区免费观看 | 精品久久精品久久| 伊人久久亚洲综合| 亚洲人成在线影院| 日韩在线视频线视频免费网站| 在线精品视频播放| 免费视频成人| 欧美性少妇18aaaa视频| 国产精品igao激情视频| 最新av网站在线观看| 成人91在线观看| 成人免费观看网址| 7799精品视频天天看| 欧美日韩第一区| 色哟哟网站入口亚洲精品| 日韩片在线观看| 日本一区二区三区视频在线看 | 开心激情综合| 91精品国产高清一区二区三区| 久久久免费视频网站| 色帝国亚洲欧美在线| 中文一区在线播放| 欧美xxxx黑人又粗又长精品| 亚洲精品久久久久avwww潮水| 免费高清在线一区| 青青青国产精品一区二区| 久久久久免费看| 亚洲激情五月| www国产亚洲精品久久网站| 欧洲av一区二区三区| 美国一区二区| 亚洲国产99精品国自产| 一卡二卡三卡四卡五卡| 国产精品xnxxcom| 精品1区2区3区| 国产福利影院在线观看| 成人精品电影在线| 色综合天天综合在线视频| 国产毛片视频网站| 97在线视频免费观看完整版| 亚洲国产婷婷综合在线精品| 亚洲精品少妇一区二区| 中文在线观看免费| 亚洲免费电影在线| 国产一二三四区在线观看| 国产写真视频在线观看| 综合电影一区二区三区 | 日本在线免费| 中文幕一区二区三区久久蜜桃| 日韩精品另类天天更新| 国产最新视频在线观看| 国产日韩欧美精品一区| 婷婷久久伊人| 蜜桃视频在线观看免费视频网站www| 中文字幕乱码亚洲精品一区| 亚洲精品在线免费| 国产激情小视频在线| 亚洲人成网站色在线观看| 免费在线精品视频| 日本色护士高潮视频在线观看 | 欧美综合影院| 91精品在线免费观看| 日本成人xxx| 91精品尤物| 日韩成人在线观看| 极品久久久久久久| 亚洲无中文字幕| 久久久免费在线观看| 91av在线免费视频| 日韩不卡在线观看日韩不卡视频| 国产精品网红福利| 99国产精品99| 99久久精品情趣| 日韩三级电影网站| 超碰porn在线| 黄色成人在线播放| 久久久久国产一区| silk一区二区三区精品视频 | 久热精品在线播放| 国产婷婷视频在线| 精品日韩美女的视频高清| 亚洲成人av免费看| a级日韩大片| 精品日韩av一区二区| 在线免费播放av| 93在线视频精品免费观看| 久久精品国产久精国产思思| 免费在线观看av网址| 国产精品久久久久久模特| 国产精品美女www| 亚洲国产精品国自产拍久久| 久久久精品黄色| 精品免费久久久久久久| 忘忧草在线www成人影院| 日韩一区二区在线免费观看| 少妇大叫太粗太大爽一区二区| 国产大片一区| 欧美一级在线播放| 精品国产免费无码久久久| 国产亚洲欧美一级| 国产爆乳无码一区二区麻豆 | 91精品中文在线| 五月婷婷深深爱| 亚洲精品中文在线| 国产又猛又黄的视频| 狼人天天伊人久久| 欧美福利视频网站| 91精品中文字幕| 久久香蕉国产线看观看99| 欧美一级中文字幕| 亚洲男人在线| 在线视频日本亚洲性| 欧美一级片免费在线观看| 国产福利一区二区三区| 亚洲国产一区二区三区在线播| 麻豆国产在线| 亚洲成人网在线观看| 岛国毛片在线观看| 免费观看日韩电影| 亚洲国产一区二区三区在线播| 欧美少妇精品| 亚洲激情在线视频| 久草免费新视频| 国产精品综合一区二区三区| 亚洲一区三区电影在线观看| 日韩av中字| 亚洲人a成www在线影院| 成人毛片18女人毛片| 99精品偷自拍| 精品少妇人妻av免费久久洗澡| 一区二区在线视频观看| 欧美另类xxx| 99精品视频免费看| 亚洲欧美乱综合| 亚洲免费一级视频| 欧美三级伦理在线| 国产精品久久久久久久久| 欧美美女色图| 色综合久久久久久久久久久| 特级西西人体wwwww| 一区二区日韩免费看| 国产视频一区二区三区四区| 高清在线视频不卡| 亚洲国产精品人人爽夜夜爽| 国产特黄大片aaaa毛片| 久久亚区不卡日本| 91视频免费版污| 欧美第一精品| 亚洲综合中文字幕在线| 污污视频在线| 亚洲国产精彩中文乱码av| 欧美bbbbbbbbbbbb精品| 91麻豆文化传媒在线观看| 青青草原av在线播放| 国产精品视频一区二区三区四蜜臂| 日韩美女在线观看一区| 国产精品一区二区婷婷| 欧美精品v日韩精品v韩国精品v| 成人三级视频在线观看| 国产成人精品免费看| 国产xxxx振车| 香蕉视频一区| 国产在线久久久| 国产网友自拍视频导航网站在线观看| 日韩一区二区三区电影在线观看| 激情小说中文字幕| 97久久人人超碰| 男人搞女人网站| 综合日韩在线| 精品久久sese| 久久天天久久| 久久久亚洲影院你懂的| 九色视频网站在线观看| 欧美日韩国产一级| 国产一级特黄毛片| 久久久久久久久久久99999| 色综合色综合色综合色综合| 欧美人成网站| 韩国一区二区三区美女美女秀| 欧美精品日日操| 麻豆国产va免费精品高清在线| 国产刺激高潮av| 91搞黄在线观看| 欧美日韩大片在线观看| 久久网站热最新地址| 国产精品久久久久久久av福利| 99pao成人国产永久免费视频| 日韩欧美亚洲区| 中文字幕视频精品一区二区三区| 国产成人精品av在线| 在线视频中文字幕第一页| 亚洲精品一区久久久久久| 国产欧美日韩成人| 一本色道久久综合狠狠躁的推荐 | 66视频精品| 久久av一区二区三区亚洲| 偷拍自拍亚洲| 国产91精品久久久久久| 中文av资源在线| 在线中文字幕日韩| 殴美一级特黄aaaaaa| 欧美精品粉嫩高潮一区二区| 久久青青草视频| 亚洲一区二区精品视频| 国产不卡在线观看视频| 97精品电影院| 极品白嫩少妇无套内谢| 久久精品国产精品青草| 日韩视频第二页| 伊人久久久大香线蕉综合直播 | 欧美三级中文字幕| 在线观看亚洲天堂| 亚洲小说欧美激情另类| 搜索黄色一级片| 国产精品乱人伦中文| 草草影院第一页| av在线播放一区二区三区| 亚洲精品乱码久久久久久动漫| 日韩国产在线观看一区| 欧美国产激情视频| 悠悠资源网久久精品| 欧美无砖专区免费| 欧美99久久| 91xxx视频| 我不卡神马影院| 色撸撸在线观看| 97色伦图片97综合影院| 亚洲精品高清国产一线久久| 国产亚洲电影| 日韩免费三级| 精品国产91| 亚洲精品久久久久久一区二区| 国产欧美一区二区三区精品观看| 久久手机视频| 欧美人与牛zoz0性行为| 日产国产精品精品a∨| 国产成人精品免费视| 欧美男人的天堂| 国产亚洲欧美日韩在线观看一区二区| 欧美日韩一区在线视频| 久久91精品| 亚洲精品欧洲精品| 天天综合亚洲| 在线观看三级网站| 在线精品观看| 国产精品后入内射日本在线观看| 国产一级久久| 欧美xxxxx在线视频| 日日摸夜夜添夜夜添精品视频| av免费网站观看| 麻豆精品一区二区三区| 亚洲精品永久视频| 国产精品 日产精品 欧美精品| 亚洲精品乱码久久久久久蜜桃欧美| 成人动漫一区二区| brazzers精品成人一区| 国产精品欧美一级免费| 国产日产精品一区二区三区的介绍| 一区二区三区视频在线看| 国产第一页在线播放| 五月综合激情婷婷六月色窝| 国产美女www| 777亚洲妇女| 日韩在线观看视频一区二区三区| 日韩精品免费综合视频在线播放| 精品美女视频在线观看免费软件| 最近更新的2019中文字幕 | 亚洲精品久久久久久国产精华液| 国产亚洲精品久久久久久打不开| 精品日本高清在线播放| 91好色先生tv| 亚洲国产成人精品久久久国产成人一区| 欧美男男激情freegay| 超碰精品一区二区三区乱码| 欧美日韩色网| 国产精品电影久久久久电影网| 亚洲毛片在线免费| 久久99精品国产一区二区三区| 日韩欧美一区二区三区在线视频 | 日本sm残虐另类| 日韩欧美中文在线视频| 久久综合av免费| www.xxxx日本| 欧美香蕉大胸在线视频观看| 国产精品呻吟久久| 日韩精品免费在线观看| v片在线观看| 国产精品18久久久久久首页狼| 亚洲专区**| 亚洲国产综合自拍| 亚洲一区二区三区高清| 久久婷婷中文字幕| 91麻豆免费在线观看| 久久精品黄色片| 色婷婷av久久久久久久| 丰满人妻一区二区三区免费视频 | 欧美一区二区人人喊爽| 日韩a在线观看| 欧美国产一区二区三区| 国产精品久久久久久久久免费高清 | 日韩av在线电影| 欧美日韩电影在线| 黄色片免费在线| 97超级碰碰人国产在线观看| 麻豆精品久久| 伊人久久婷婷色综合98网| 久久精品二区三区| 日韩无码精品一区二区| 亚洲激情一二三区| 在线免费av片| 亚洲午夜未删减在线观看 | 欧美色播在线播放| 性生活免费网站| 久久久国产视频91| 国产在视频一区二区三区吞精| 欧美高清视频一区二区三区在线观看| 欧美高清日韩| 91网址在线观看精品| 中文欧美字幕免费| 亚洲精品国产欧美在线观看| 亚洲欧美日韩天堂| 久久人体大尺度| 久久国产精品久久精品国产| 亚洲高清不卡| 中文字幕视频观看| 亚洲国产精品麻豆| 亚洲老妇色熟女老太| 久热爱精品视频线路一| 国产精品中文| 日韩视频在线免费播放| 激情文学综合插| 波多野结衣家庭教师在线观看| 欧美最猛黑人xxxxx猛交| 韩国三级av在线免费观看| 热99在线视频| 激情婷婷综合| 无码日韩人妻精品久久蜜桃| 久久精品欧美一区二区三区麻豆| 黄色在线视频网址| 亚洲天堂av综合网| **欧美日韩在线观看| 日韩中文一区二区三区| 美女视频免费一区| 欧美日韩色视频| 日韩欧美不卡在线观看视频| 欧美人与禽猛交乱配| 国产高清在线一区| 中文一区在线| 蜜桃无码一区二区三区| 欧美日韩久久久一区| 秋霞成人影院| 亚洲综合日韩在线| 在线不卡欧美| japanese中文字幕| 欧美在线一区二区三区| av在线影院| 国产区二精品视| 久久人人超碰| 99精品中文字幕| 日韩一区二区免费在线观看| 国产欧洲在线| 色一情一乱一伦一区二区三欧美| 久久精品国产亚洲a| 久一视频在线观看| 亚洲精品在线91| 亚洲毛片在线免费| 丁香花在线影院观看在线播放| 91老师国产黑色丝袜在线| 中文字幕一区二区三区免费看| 久热精品视频在线观看一区| 国产亚洲成av人片在线观黄桃| 国产第一页视频| 亚洲欧美日韩中文字幕一区二区三区| 欧美一区二区三区黄片| 国产精品精品国产| 欧美精品网站| 国产综合精品在线| 日韩欧美一二三区| 欧美色999| a级黄色片免费| www成人在线观看| 国产精品欧美激情在线| 2019中文字幕在线免费观看| 99视频精品全部免费在线视频| 五月开心播播网| 91精品国产综合久久精品图片|