精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

公理訓練讓LLM學會因果推理:6700萬參數(shù)模型比肩萬億參數(shù)級GPT-4

人工智能 新聞
本文要介紹的這項研究發(fā)現(xiàn):在小圖譜的因果傳遞性公理演示上訓練的 Transformer 模型可以泛化用于大圖譜的傳遞性公理。

AI 已經(jīng)在幫助數(shù)學家和科學家做研究了,比如著名數(shù)學家陶哲軒就曾多次分享自己借助 GPT 等 AI 工具研究探索的經(jīng)歷。AI 要在這些領域大戰(zhàn)拳腳,強大可靠的因果推理能力是必不可少的。

本文要介紹的這項研究發(fā)現(xiàn):在小圖譜的因果傳遞性公理演示上訓練的 Transformer 模型可以泛化用于大圖譜的傳遞性公理。

也就是說,如果讓 Transformer 學會執(zhí)行簡單的因果推理,就可能將其用于更為復雜的因果推理。該團隊提出的公理訓練框架是一種基于被動數(shù)據(jù)來學習因果推理的新范式,只有演示足夠就能用于學習任意公理。

引言

因果推理(causal reasoning)可以定義成一組推理流程并且這組推理流程要符合專門針對因果性的預定義公理或規(guī)則。舉個例子,d-separation(有向分離)和 do-calculus 規(guī)則可被視為公理,而 collider set 或 backdoor set 的規(guī)范則可被看作是由公理推導出的規(guī)則。

通常來說,因果推理使用的數(shù)據(jù)對應于一個系統(tǒng)中的變量。通過正則化、模型架構或特定的變量選擇,可以歸納偏置的形式將公理或規(guī)則集成到機器學習模型中。

根據(jù)可用數(shù)據(jù)種類的差異(觀察數(shù)據(jù)、干預數(shù)據(jù)、反事實數(shù)據(jù)),Judea Pearl 提出的「因果階梯」定義了因果推理的可能類型。

由于公理是因果性的基石,因此我們不禁會想是否可以直接使用機器學習模型來學習公理。也就是說,如果學習公理的方式不是學習通過某個數(shù)據(jù)生成流程得到的數(shù)據(jù),而是直接學習公理的符號演示(并由此學習因果推理),哪又會如何呢?

相較于使用特定的數(shù)據(jù)分布構建的針對特定任務的因果模型,這樣的模型有一個優(yōu)勢:其可在多種不同的下游場景中實現(xiàn)因果推理。隨著語言模型具備了學習以自然語言表達的符號數(shù)據(jù)的能力,這個問題也就變得非常重要了。

事實上,近期已有一些研究通過創(chuàng)建以自然語言編碼因果推理問題的基準,評估了大型語言模型(LLM)是否能夠執(zhí)行因果推理。

微軟、MIT 和印度理工學院海得拉巴分校(IIT Hyderabad)的研究團隊也朝這個方向邁出了重要一步:提出了一種通過公理訓練(axiomatic training)學習因果推理的方法

圖片

  • 論文標題:Teaching Transformers Causal Reasoning through Axiomatic Training
  • 論文地址:https://arxiv.org/pdf/2407.07612

公理訓練

他們假設,可將因果公理表示成以下符號元組 ?premise, hypothesis, result?。其中 hypothesis 是指假設,即因果陳述;premise 是前提,是指用于確定該陳述是否為「真」的任意相關信息;result 自然就是結果了。結果可以是簡單的「是」或「否」。

舉個例子,來自論文《Can large language models infer causation from correlation?》的 collider 公理可以表示成:圖片結論就為「是」。

基于這個模板,可通過修改變量名稱、變量數(shù)量和變量順序等來生成大量合成元組。

為了用 Transformer 學習因果公理,實現(xiàn)公理訓練,該團隊采用了以下方法構建數(shù)據(jù)集、損失函數(shù)和位置嵌入。

公理訓練:數(shù)據(jù)集、損失函數(shù)和位置編制

訓練數(shù)據(jù)

基于一個特定公理,可根據(jù)「前提」將「假設」映射成合適的標簽(Yes 或 No)。要創(chuàng)建訓練數(shù)據(jù)集,該團隊的做法是在特定的變量設置 X、Y、Z、A 下枚舉所有可能的元組 {(P, H, L)}_N,其中 P 是前提,H 是假設,L 是標簽(Yes 或 No)。

給定一個基于某個因果圖譜的前提 P,如果可通過使用特定的公理(一次或多次)推導出假設 P,那么標簽 L 就為 Yes;否則為 No。

舉個例子,假設一個系統(tǒng)的底層真實因果圖譜具有鏈式的拓撲結構:X_1 → X_2 → X_3 →???→ X_n。那么,可能的前提是 X_1 → X_2 ∧ X_2 → X_3,那么假設 X_1 → X_3 有標簽 Yes,而另一個假設 X_3 → X_1 有標簽 No。上述公理可被歸納式地多次用于生成更復雜的訓練元組。

對于訓練設置,使用傳遞性公理生成的 N 個公理實例構建一個合成數(shù)據(jù)集 D。D 中的每個實例都構建成了 (P_i, H_ij, L_ij) 的形式,圖片,其中 n 是每第 i 個前提中的節(jié)點數(shù)量。P 是前提,即某種因果結構的自然語言表達(如 X 導致 Y,Y 導致 Z);之后是問題 H(如 X 導致 Y 嗎?);L 為標簽(Yes 或 No)。該形式能有效覆蓋給定因果圖譜中每條獨特鏈的所有成對節(jié)點。

損失函數(shù)

給定一個數(shù)據(jù)集,損失函數(shù)的定義基于每個元組的基本真值標簽,表示為:圖片分析表明,相比于下一 token 預測,使用該損失能得到很有希望的結果。

位置編碼

除了訓練和損失函數(shù),位置編碼的選擇也是另一個重要因素。位置編碼能提供 token 在序列中絕對和相對位置的關鍵信息。

著名論文《Attention is all you need》中提出了一種使用周期函數(shù)(正弦或余弦函數(shù))來初始化這些編碼的絕對位置編碼策略。

絕對位置編碼能為任何序列長度的所有位置提供確定的值。但是,有研究表明絕對位置編碼難以應對 Transformer 的長度泛化任務。在可學習的 APE 變體中,每個位置嵌入都是隨機初始化的,并使用該模型完成了訓練。該方法難以應對比訓練時的序列更長的序列,因為新的位置嵌入依然未被訓練和初始化。

有趣的是,近期有發(fā)現(xiàn)表明移除自回歸模型中的位置嵌入可以提升模型的長度泛化能力,而自回歸解碼期間的注意力機制足以編碼位置信息。該團隊使用了不同的位置編碼來理解其對因果任務中的泛化的影響,包括可學習位置編碼(LPE)、正弦位置編碼(SPE)、無位置編碼(NoPE)。

為了提升模型的泛化能力,該團隊也采用了數(shù)據(jù)擾動,其中包括長度、節(jié)點名稱、鏈順序和分支情況的擾動。

實驗

下面問題又來了:如果使用這些數(shù)據(jù)訓練一個模型,那么該模型能否學會將該公理應用于新場景?

為了解答這個問題,該團隊使用這個因果無關型公理的符號演示從頭開始訓練了一個 Transformer 模型。

為了評估其泛化性能,他們在簡單的大小為 3-6 個節(jié)點的因果無關公理鏈上進行了訓練,然后測試了泛化性能的多個不同方面,包括長度泛化性能(大小 7-15 的鏈)、名稱泛化性能(更長的變量名)、順序泛化性能(帶有反向的邊或混洗節(jié)點的鏈)、結構泛化性能(帶有分支的圖譜)。圖 1 給出了評估 Transformer 的結構泛化的方式。

圖片

具體來說,他們基于 GPT-2 架構訓練了一個基于解碼器的有 6700 萬參數(shù)的模型。該模型有 12 個注意力層、8 個注意力頭和 512 嵌入維度。他們在每個訓練數(shù)據(jù)集上從頭開始訓練了該模型。為了理解位置嵌入的影響,他們還研究了三種位置嵌入設置:正弦位置編碼(SPE)、可學習位置編碼(LPE)和無位置編碼(NoPE)。

結果如表 1、圖 3 和圖 4 所示。

圖片

表 1 給出了在訓練時未曾見過的更大因果鏈上評估時不同模型的準確度。可以看到,新模型 TS2 (NoPE) 的表現(xiàn)能與萬億參數(shù)規(guī)模的 GPT-4 相媲美。

圖 3 是在有更長節(jié)點名稱(長于訓練集的)的因果序列上的泛化能力評估結果以及不同位置嵌入的影響。

圖片

圖 4 評估的是在更長的未見過的因果序列上的泛化能力。

圖片

他們發(fā)現(xiàn),在簡單鏈上訓練的模型可以泛化到在更大的鏈上多次應用公理,但卻無法泛化到順序或結構泛化等更復雜的場景。但是,如果在簡單鏈以及帶有隨機逆向邊的鏈組成的混合數(shù)據(jù)集上訓練模型,則模型可以很好地泛化到各種評估場景。

通過擴展在 NLP 任務上的長度泛化研究結果,他們發(fā)現(xiàn)了位置嵌入在確保在長度和其它方面實現(xiàn)因果泛化的重要性。他們表現(xiàn)最佳的模型沒有位置編碼,但他們也發(fā)現(xiàn)正弦編碼在某些情況下也很好用。

這種公理訓練方法還能泛化用于一個更困難的問題,如圖 5 所示。即以包含統(tǒng)計獨立性陳述的前提為基礎,任務目標是根據(jù)因果關系分辨相關性。解決該任務需要多個公理的知識,包括 d-separation 和馬爾可夫性質。

圖片

該團隊使用與上面一樣的方法生成了合成訓練數(shù)據(jù),然后訓練了一個模型,結果發(fā)現(xiàn)在包含 3-4 個變量的任務演示上訓練得到的 Transformer 能學會解決包含 5 個變量的圖譜任務。并且在該任務上,該模型的準確度高于 GPT-4 和 Gemini Pro 等更大型的 LLM。

圖片

該團隊表示:「我們的研究提供了一種通過公理的符號演示教模型學習因果推理的新范式,我們稱之為公理訓練(axiomatic training)。」該方法的數(shù)據(jù)生成和訓練流程是普適的:只要一個公理能被表示成符號元組的格式,就可使用此方法學習它。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-07-15 09:00:00

2023-07-13 12:54:42

GPT-4OpenAI

2023-11-03 13:07:00

AI模型

2023-09-01 15:22:49

人工智能數(shù)據(jù)

2023-11-09 12:41:40

AI數(shù)據(jù)

2023-06-21 13:22:16

GPT-4模型

2023-08-11 13:34:06

GPT-4訓練

2024-03-08 13:18:44

模型訓練

2023-09-19 09:20:16

2023-05-15 15:38:59

AI模型

2023-10-14 17:24:49

2023-09-11 15:57:16

人工智能模型GPT-4

2024-06-17 18:04:38

2024-01-30 21:18:57

模型智能CMMLU

2023-06-15 13:45:41

模型AI

2021-07-13 17:38:49

算法語言模型GPT-4

2024-05-20 08:50:00

模型神經(jīng)網(wǎng)絡

2023-06-19 08:19:50

2024-05-21 11:35:48

阿里云通義千問

2024-06-11 14:30:18

點贊
收藏

51CTO技術棧公眾號

欧美巨大xxxx做受沙滩| 夜夜狠狠擅视频| 成人看片黄a免费看视频| 亚洲成人动漫精品| 日韩精品av一区二区三区| 国产精品一品二区三区的使用体验| 欧美片第一页| 亚洲日穴在线视频| 精品国产乱码久久久久软件| 亚洲第一区av| 亚洲一级特黄| 中文字幕精品久久久久| 91精品人妻一区二区三区四区| 免费在线超碰| 国产一区二区美女| 日韩av毛片网| 欧美黄色一区二区三区| 精品一区毛片| 精品久久99ma| 五月婷婷之婷婷| 两个人看的在线视频www| 久久久精品免费网站| 91系列在线播放| 日韩三级视频在线| 一区二区三区国产精华| 亚洲网址你懂得| 极品白嫩的小少妇| 欧美性aaa| 欧美午夜精品久久久久久人妖| 超碰97在线资源| 久操视频在线免费观看| 影院欧美亚洲| 欧美老女人性视频| 成人午夜免费影院| 国产探花一区| 日韩精品在线看| 无码人妻一区二区三区在线| 日韩黄色三级| 欧美亚洲国产怡红院影院| 69堂免费视频| bl视频在线免费观看| 亚洲柠檬福利资源导航| 亚洲一区二区三区精品在线观看| 国产一区二区网站| 日本va欧美va瓶| 欧美最近摘花xxxx摘花| 日韩xxxxxxxxx| 国产精品激情| 欧美疯狂性受xxxxx另类| 神马午夜精品91| 99久久婷婷国产综合精品电影√| 日韩一级二级三级精品视频| 亚洲视频第二页| jizz亚洲女人高潮大叫| 色悠悠久久综合| 凹凸国产熟女精品视频| 亚洲黄色免费看| 天天亚洲美女在线视频| 国产精品一区二区免费在线观看| 国产福利在线| 国产人成一区二区三区影院| 蜜桃传媒视频麻豆第一区免费观看| 真实的国产乱xxxx在线91| 日韩经典一区二区| 日韩免费av片在线观看| 日本黄色中文字幕| 蜜桃av噜噜一区| 成人免费视频a| 国产女人爽到高潮a毛片| 国产乱子伦视频一区二区三区| 久久久久国产精品www| 欧美精品一级片| 一区在线视频| 欧美一区在线直播| 波多野结衣在线观看一区| 日韩精品三区四区| 成人av电影天堂| 国产乱色精品成人免费视频| 精品中文字幕一区二区| 亚洲最大av网| 免费观看黄色av| 91在线看国产| 视频一区亚洲| 18av在线播放| 五月激情综合网| 人妻丰满熟妇av无码区app| av有声小说一区二区三区| 欧美制服丝袜第一页| 欧美精品 - 色网| 动漫av一区| 国产一区二区三区在线观看视频 | 一区二区三区久久久久| 日韩欧美三级| 久久露脸国产精品| 中文字幕日韩免费| 国产一区二区按摩在线观看| 国产一区二区高清不卡| 懂色av中文在线| 亚洲理论在线观看| 无码专区aaaaaa免费视频| 亚洲日本网址| 精品国产三级电影在线观看| 欧美偷拍一区二区三区| 欧美日韩理论| 国产精品亚洲精品| 四虎在线视频免费观看| 国产精品久久看| 激情五月宗合网| 99热这里有精品| 亚洲天堂久久av| 国产在线一区视频| 久久超碰97中文字幕| 久久亚洲综合网| 91麻豆一二三四在线| 91成人免费在线视频| 99riav国产精品视频| 欧美1级片网站| 668精品在线视频| 国产乱码精品一区二三区蜜臂 | 亚洲高清在线视频| 国产一级做a爰片久久| 国语一区二区三区| 久久天天躁狠狠躁夜夜躁2014| 日本 欧美 国产| 久久国产日韩| 好吊妞www.84com只有这里才有精品| 亚洲第一成人av| 中文字幕中文在线不卡住| 18岁网站在线观看| 亚洲天堂av资源在线观看| 中文字幕在线精品| 精品成人无码久久久久久| av在线播放不卡| 青青草视频国产| www.欧美| 久久精品国产亚洲一区二区| 免费在线观看av的网站| 久久亚洲综合色一区二区三区 | 98精品久久久久久久| 日韩美女视频中文字幕| 天堂а在线中文在线无限看推荐| 久久久噜噜噜久久中文字幕色伊伊| 欧美亚洲爱爱另类综合| 成av人片在线观看www| 欧美岛国在线观看| 欧美激情国产精品免费| 国产精品一区三区| 国产成人精品免费看在线播放| 超碰在线资源| 欧美一区二区在线免费观看| 182在线观看视频| 精品一区二区免费视频| 一区二区免费在线视频| 欧美综合社区国产| 日韩在线观看网站| 91女人18毛片水多国产| 中文字幕一区日韩精品欧美| 日韩av在线中文| 图片区亚洲欧美小说区| 91影视免费在线观看| 激情影院在线观看| 欧美日韩亚洲综合一区二区三区| 四虎成人免费视频| 99这里有精品| 欧美精品一区在线| 成人黄色图片网站| 日韩视频在线观看免费| 99久久久国产精品无码免费| 亚洲免费在线看| 逼特逼视频在线观看| 亚洲美女色禁图| 日本午夜精品电影| 日韩综合久久| 欧美日韩福利电影| 天天av天天翘| 欧美三级视频在线观看| √天堂中文官网8在线| 成人午夜激情视频| 青青在线视频观看| 99视频精品全国免费| 懂色av一区二区三区在线播放| 国产毛片在线看| 在线成人免费视频| 国产亚洲精品码| 91美女片黄在线| 最新天堂中文在线| 黄色成人在线网站| 免费国产一区二区| avtt久久| 欧美中文字幕在线播放| 免费在线午夜视频| 亚洲国产精品va| 国产成人自拍偷拍| 亚洲主播在线观看| www.黄色在线| 国产99久久久精品| www.99av.com| 国产主播一区| 亚洲制服欧美久久| 欧美理伦片在线播放| 国产主播在线一区| 在线免费黄色小视频| 免费黄色在线| 色777狠狠狠综合伊人| 欧美jjzz| 国内精品久久久久久久97牛牛 | 羞羞视频在线观看不卡| 日本一区影院| 久久国产99| 亚洲精品国产品国语在线app| 欧美亚洲综合色| 一区二区三区高清国产| 国产ts一区二区| 欧美午夜精品久久久久久蜜| 奇米影视四色在线| 人妻久久一区二区| 欧美日韩国产亚洲沙发| 9765激情中文在线| 亚洲一卡二卡三卡四卡五卡| 日本少妇高潮喷水xxxxxxx| 国产电影一区在线| 91亚洲免费视频| 久久精品观看| 97超碰人人澡| 欧美精品不卡| 26uuu成人| 欧州一区二区| 欧美一二三四五区| 天海翼亚洲一区二区三区| 国产精品sss| 我要色综合中文字幕| 国产裸体写真av一区二区| 国产亚洲一区二区手机在线观看| 亚洲国产小视频在线观看| 国产精品毛片一区视频播| 欧美性色aⅴ视频一区日韩精品| 毛片久久久久久| 久久久久国色av免费看影院| 五十路六十路七十路熟婆| 成熟亚洲日本毛茸茸凸凹| 欧美69精品久久久久久不卡| 国产一区二区三区黄视频 | 午夜精品一区二区三区四区 | 99r精品视频| 国产精品熟妇一区二区三区四区| 欧美专区在线| 国产精品久久中文字幕| 亚洲性视频h| 午夜免费福利小电影| 一本色道久久| 无码人妻丰满熟妇区毛片18 | 美女视频免费一区| 日本黑人久久| 欧美日韩激情| 日韩精品av一区二区三区| 欧美日韩一区二区综合| 欧美精品在线一区| 羞羞色国产精品网站| 欧美精品成人一区二区在线观看 | 国产精品极品在线| 秋霞国产精品| 国产精品视频不卡| 国产高清亚洲| 99国产超薄丝袜足j在线观看| av2020不卡| 色久欧美在线视频观看| av色图一区| 色婷婷av一区二区三区久久| 九色在线观看| 日韩在线观看免费全| 欧美另类极品| 久久夜色精品亚洲噜噜国产mv | 一个人www欧美| 大胆av不用播放器在线播放| 精品国偷自产在线| 99热国产在线| 九九精品在线播放| 免费污视频在线观看| 久久久久久久国产精品| 成人在线黄色电影| 久久久久久国产精品| 国产精品一区二区日韩| 欧美制服第一页| 全球最大av网站久久| 成人激情春色网| 99香蕉久久| 欧美日韩一区二区三区免费| 91av精品| 国产v片免费观看| 日韩精品视频网| 国产人妻黑人一区二区三区| 久久久777精品电影网影网| 熟女少妇a性色生活片毛片| 午夜精品久久久久久久99樱桃| 国产极品美女在线| 亚洲国产aⅴ天堂久久| 中文字幕理论片| 欧美成人一区二区三区片免费| 伊人影院中文字幕| 亚洲国产中文字幕久久网| 国产乱子伦三级在线播放| 久久精品国产亚洲精品2020| 涩涩视频在线播放| 成人h视频在线| 欧美大片网址| 国风产精品一区二区| 亚洲在线播放| 四季av一区二区| 91丝袜国产在线播放| 青青草激情视频| 在线亚洲一区二区| 色久视频在线播放| 久久夜色精品国产亚洲aⅴ| 午夜伦理福利在线| 999日本视频| 精品高清久久| 91黄色在线看| 国产一区视频在线看| 久久久久久亚洲中文字幕无码| 99视频在线观看一区三区| 最新一区二区三区| 无码av免费一区二区三区试看| 国产大片中文字幕在线观看| 欧美高清hd18日本| 黄色免费在线播放| 九九精品在线播放| 警花av一区二区三区| 欧美一区免费视频| 综合久久亚洲| 五月天视频在线观看| 国产欧美日韩不卡免费| 在线视频一区二区三区四区| 日韩精品自拍偷拍| 免费a级人成a大片在线观看| 国产精品黄色影片导航在线观看| 成人黄色免费网站| 精品亚洲欧美日韩| 日韩一级不卡| 最新国产精品自拍| 久久中文字幕电影| 国内自拍视频在线播放| 亚洲第一在线视频| 成人ssswww在线播放| 国产91精品一区二区绿帽| 亚洲精品97| 国产一级片中文字幕| 日韩一区在线免费观看| 国产女主播喷水视频在线观看| 欧美一级爆毛片| 黄色网在线免费看| 国产精品成熟老女人| 欧美国产一级| 欧美在线aaa| 亚洲视频一区二区免费在线观看| 亚洲国产精品免费在线观看| 欧美色视频在线| 黄a在线观看| 91久久国产精品91久久性色| 残酷重口调教一区二区| 亚洲色图偷拍视频| 亚洲婷婷国产精品电影人久久| 2025国产精品自拍| 欧美成人在线直播| 888av在线视频| 国产精选在线观看91| 欧美日韩第一区| 四虎成人免费视频| 黑人狂躁日本妞一区二区三区| 一二三区在线播放| 久久精品99国产精品酒店日本| heyzo高清国产精品| 国产伦精品一区| 在线观看不卡| 国产a级片视频| 一区二区三区四区五区视频在线观看 | 欧美熟妇精品黑人巨大一二三区| 国产精品久久久久久久浪潮网站| 麻豆亚洲av熟女国产一区二 | 国产综合色产在线精品| 中文字幕av播放| 精品国产区一区| 免费电影日韩网站| 亚洲成人18| 国产原创一区二区三区| 日韩无码精品一区二区三区| 精品性高朝久久久久久久| 51一区二区三区| 黄色一级视频播放| 成人av资源站| 免费污污视频在线观看| 在线视频一区二区| 日韩av黄色| 国产精品一色哟哟| 国产午夜精品美女毛片视频| 国产视频第二页| 欧美亚洲视频一区二区| 999国产精品视频| 亚洲av永久无码精品| 精品国产乱码久久久久久天美| 后入内射欧美99二区视频|