精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

不要think step by step!谷歌最新自然語言推理算法LAMBADA:「反向鏈推理」才是答案

人工智能
在這些數據集上,LAMBADA具有更高的推理準確性,與其他用虛假的證明痕跡找到正確結論的技術相比,LAMBADA更有可能產生有效的推理鏈,同時也比其他基于LM的模塊化推理方法更有查詢效率。

?自動推理絕對算是自然語言處理領域的一大難題,模型需要根據給定的前提和知識推導出有效且正確的結論。

盡管近年來NLP領域借著大規模預訓練語言模型在各種「自然語言理解」如閱讀理解和問答等任務中取得了極高的性能,但這些模型在邏輯推理方面的性能仍然十分滯后。

去年5月「思維鏈」(Chain of Thought, CoT)橫空出世,有研究人員發現,只需要在prompt中加入「Let's think step by step」就能讓GPT-3的推理性能大幅提升,比如在MultiArith中就將推理準確率從之前的17.7%一下提升到了78.7%

但諸如CoT和Selection Inference等方法都是以前向(forward direction)的方式從公理(axioms)中搜索證明過程(proof)以推導出最終結論(conclusion),存在搜索空間組合爆炸的問題,因此對于較長的推理鏈,失敗率較高。

最近,Google Research開發了一種反向鏈(Backward Chaining)算法LAMBADA(LAnguage Model augmented BAckwarD chAining),將經典推理文獻中得出的「反向推理效率明顯高于前向推理」這一結論應用于語言模型(LM)中。

圖片

論文鏈接:https://arxiv.org/abs/2212.13894

LAMBADA將推理過程分解為四個子模塊,每個模塊都由few-shot prompted語言模型推理實現。

最終LAMBADA相比當下sota的前向推理方法在兩個邏輯推理數據集上實現了顯著的性能提升,特別是在問題要求深度和準確的證明鏈情況下,LAMBADA的性能提升更加明顯。

「反向推理」成版本答案?

邏輯推理,特別是對非結構化自然文本的邏輯推理,是構建自動知識發現的基礎構件,也是未來各種科學領域進步的關鍵。

雖然許多NLP任務的發展都受益于預訓練語言模型不斷擴大的規模,但根據觀察,提升模型的尺寸對解決復雜推理問題的提升十分有限。

在經典文獻中,有兩種主要的邏輯推理方法:

1、前向鏈式推理(Forward Chaining, FC),即從事實和規則出發,在做出新的推理并將其加入理論之間進行迭代,直到目標陳述可以被證明或推翻;

2、后向鏈式推理(Backward Chaining, BC),即從目標出發,將其遞歸分解為子目標,直到子目標可以根據事實被證明或推翻。

以前用語言模型進行推理的方法大多采用前向鏈式推理的思路,要求從整個集合中選擇一個事實和規則的子集,這對LM來說可能是困難的,因為它需要在一個大的空間里進行組合搜索。

此外,決定何時停止搜索并宣布證明失敗在FC中也是非常困難的,有時甚至需要一個專門對中間標簽進行訓練的模塊。

事實上,經典的自動推理文獻在很大程度上偏重于后向鏈式推理或目標導向的求證策略。

LAMBADA

LAMBADA意為「反向鏈式技術增強的語言模型」,研究人員通過實驗證明了BC更適合于基于文本的演繹邏輯推理(deductive logical reasoning)。

BC不需要大量的組合搜索來選擇子集,而且有更自然的停止搜索標準(halting criteria)。

LAMBADA主要專注于對事實進行自動推理,即自然語言斷言,如「好人是紅色的」,這些斷言是連貫的(coherent),但不一定基于真實情況。

一個規則由自然語言聲明編寫,形式上可以改寫為「如果P那么Q」,例如「粗暴的好人是紅色的」(Rough, nice people are red)可以改寫為「如果一個人是粗暴的好人,那么他們是紅色的」(If a person is rough and nice, then they are red)。

其中P被稱為規則的前項(antecedent),Q被稱為規則的后項(consequent)。

一個理論theory C由事實F={f1, f2, . . , fn}和規則R={r1, r2, . . , rm}組成,G代表一個想根據事實和規則來證明或反駁的目標。

例1、一個帶有虛構角色和規則的理論實例C

F={"菲奧娜是好人","菲奧娜是粗人"}

R={"如果某人很聰明,那么他就是好人","粗暴的好人是紅色的","作為好人和紅色意味著他是圓的"}。

基于上述理論,人們可能想證明或反駁一個目標,如「菲奧娜是紅色的?」。

后向鏈法推理

一條規則是否適用于一個目標,是通過邏輯學中的一個叫做unification的操作來確定的。

例如,對于例1中的目標「Fiona是紅色的?」,第二條規則的后果與目標相同,所以可以適用;但另外兩條規則的后果不同,所以不適用。

考慮例1中的理論和目標,BC從目標「Fiona是紅色的?」開始推理。

首先,BC驗證該目標是否可以從任何事實中被證明或反駁。由于沒有任何事實可以證明或反駁這個目標,所以接下來會驗證這個目標是否與任何規則的結果相統一,結果發現它與第二條規則「粗糙的好人是紅色的」相統一。

因此,該目標可以被分解成兩個子目標:1)菲奧娜是粗暴的嗎?和2)菲奧娜是好人嗎?。

由于這兩個子目標都可以從事實中得到證明,BC的結論是原始目標可以得到證明。

對于一個目標,BC的結果要么是證明,要么是否定,要么是不知道(例如目標「菲奧娜很聰明?」)。

LAMBADA中的語言模型

為了將BC用于基于文本的推理,研究人員引入了四個基于LM的模塊:事實檢查(Fact Check)、規則選擇(Rule Selection)、目標分解(Goal Decomposition)和符號一致性(Sign Agreement)。

圖片

事實檢查

給出理論中的一組事實F和一個目標G,事實檢查模塊驗證是否存在一個事實f∈F,使得f包含G(在這種情況下,目標被證明)或者f包含G的否定(在這種情況下,目標被否定)。

如果找不到這樣的事實,那么G的真相仍然是未知的。

事實檢查的實現包括兩個子模塊:第一個子模塊從與目標最相關的事實集中選擇一個事實,第二個子模塊根據這個事實來驗證目標是否可以被證明或否定。

由于事實選擇子模塊在第一次嘗試時可能無法確定最佳的事實,如果在調用子模塊一輪后,目標的真相仍然未知,可以刪除所選的事實,然后再次調用子模塊;這個過程可以重復多次。

規則選擇

給出理論中的一組規則R和一個目標G,規則選擇模塊確定規則r∈R,使r的結果與G相統一,然后用這些規則將目標分解為子目標。

如果不能確定這樣的規則,那么G的真相仍然是未知的。

規則選擇同樣包括兩個子模塊:第一個子模塊確定每個規則的結果(與目標無關),第二個子模塊將規則的結果和目標作為輸入,并確定哪一個與目標相統一。

需要注意的是,由于BC的遞歸性質,規則選擇模塊在證明一個目標的過程中可能會被多次調用。由于識別每條規則的結果與目標無關,這個子模塊只需要被調用一次。

目標分解

給定一個規則r和一個目標G,使r的結果與G統一,目標分解模塊確定需要證明的子目標,以使G被證明或被否定。

在成功證明r的前項的情況下,目標是被證明還是被否定取決于目標的符號(sign)是否與r的結果符號一致。

例如對于目標「Fiona是紅色的?」,由于目標的符號與第二條規則的結果符號一致,并且規則的前項被證明,可以得出結論,目標被證明。

符號一致性

給定一個規則r和一個目標G,符號一致模塊驗證r的結果符號是否與目標的符號一致或不一致。

實驗部分

研究人員選擇Chain of Thought(CoT)、基于顯式推理的sota神經推理方法、sota模塊推理方法Selection Inference(SI)作為對比基線模型。

實驗的數據集采用ProofWriter和PrOntoQA,這些數據集對LM推理具有挑戰性,包含需要證明鏈長度達5跳的例子,以及目標既不能從提供的理論中證明也不能反駁的例子。

圖片

實驗結果顯示,LAMBADA明顯優于其他兩個基線,特別是在包含UNKNOWN標簽的ProofWriter-PUD數據集上(與CoT相比有44%的相對改善,與SI在深度-5上相比有56%的改善),以及在PrOntoQA的較高深度上(與CoT相比有37%的相對改善,與SI在深度-5上相比有113%的改善)。

圖片

這些結果顯示了LAMBADA在邏輯推理方面的優點,也顯示了后向鏈(在LAMBADA中是推理的backbone)與前向鏈(在SI中是backbone)相比可能是更好的選擇。

這些結果還揭示了CoT方法在處理UNKNOWN標簽時的一個缺陷:與標簽為證明(PROVED)或否定(DISPROVED)的例子不同,對于標簽為UNKNOWN的例子,沒有自然的思維鏈。

對于更深(3+)的證明鏈問題上,在三個數據集上,SI產生的預測接近于多數類預測。

可以發現,在二元情況下,它傾向于過度預測DISPROVED;在三元分類情況下,傾向于過度預測UNKNOWN,這使得它在PrOntoQA的深度-5中的表現甚至比多數類更差,因為該深度的PROVED標簽比DISPROVED多。

不過研究人員也驚訝地發現,CoT對于ProofWriterPD數據集的性能仍然相對較高,而且準確率沒有降低。

總之,在這些數據集上,LAMBADA具有更高的推理準確性,與其他用虛假的證明痕跡找到正確結論的技術相比,LAMBADA更有可能產生有效的推理鏈,同時也比其他基于LM的模塊化推理方法更有查詢效率。

研究人員表示,該實驗結果強烈地表明,未來關于用LM進行推理的工作應該包括后向鏈或目標導向的策略。

參考資料:?

https://arxiv.org/abs/2212.13894

責任編輯:武曉燕 來源: 新智元
相關推薦

2024-01-25 11:38:11

AI數據

2025-10-15 02:11:00

谷歌Agent架構

2021-06-22 06:24:57

Linkerd Ingress 流量網絡技術

2011-04-19 14:02:09

SSAS

2010-09-08 09:41:03

私有云部署

2009-04-22 17:18:29

Vxworks驅動加載step by ste

2021-06-16 17:42:48

Linkerd 配置CPU

2025-06-06 08:57:42

2025-03-06 09:46:00

AI模型代碼

2021-06-22 06:16:24

Linkerd books webapp

2019-07-16 11:13:06

阿里自然語言理解AI

2021-06-22 06:41:38

Linkerd 安裝多集群組件網絡技術

2021-06-17 06:13:29

Linkerd Prometheus 網絡技術

2025-08-01 08:59:36

2024-02-19 07:10:00

視覺模型

2021-05-13 07:17:13

Snownlp自然語言處理庫

2024-08-28 08:43:58

2025-06-19 09:15:00

自然語言訓練模型

2021-06-17 14:29:39

Linkerd 分布式跟蹤Linkerd 2.1

2021-06-17 06:20:43

Linkerd Kustomize網絡技術
點贊
收藏

51CTO技術棧公眾號

国产精品久久久亚洲一区| 国产精品3区| 久久久蜜臀国产一区二区| 日本a级片电影一区二区| 国产美女永久免费无遮挡| 久久69成人| 亚洲国产精品久久一线不卡| 鲁丝一区二区三区免费| 在线视频 中文字幕| 欧美激情亚洲| 亚洲天堂久久av| 亚洲一二三av| 日韩伦理福利| 亚洲欧美另类在线| 麻豆成人小视频| 国产精品伦一区二区三区| 亚洲国产91| 在线精品国产成人综合| 性高潮免费视频| 91大神在线观看线路一区| 亚洲一区在线看| 性欧美精品一区二区三区在线播放 | 狠狠精品干练久久久无码中文字幕| 色婷婷综合视频| 久久99热狠狠色一区二区| 国内精品久久久| 内射一区二区三区| 久久99久久人婷婷精品综合| 欧美大黄免费观看| 亚洲精品性视频| 日韩性xxx| 亚洲成av人**亚洲成av**| 伊人久久大香线蕉成人综合网| 天堂在线视频免费观看| 国产精品综合久久| 国产精品专区第二| 无码人妻熟妇av又粗又大| 一区在线视频观看| 久久成人亚洲精品| 免费一级suv好看的国产网站| 亚洲精品合集| 亚洲国产天堂久久综合| 亚洲网中文字幕| 欧洲亚洲精品| 精品视频1区2区3区| 人妻少妇被粗大爽9797pw| 日本三级在线观看网站| 亚洲人吸女人奶水| 亚洲一区在线免费| bbbbbbbbbbb在线视频| 久久亚洲精华国产精华液 | 国产又粗又黄又爽| 日韩制服丝袜av| 欧美又大又硬又粗bbbbb| 日韩av一二三区| 激情av一区| 欧美激情在线观看| 久久久精品国产sm调教| 你懂的成人av| 欧美激情二区三区| 久久久久久久国产视频| 欧美日韩综合| 久久久视频在线| 日韩伦人妻无码| 亚洲一区二区动漫| 日本高清久久天堂| 无码人妻丰满熟妇精品区| 丝袜美腿一区二区三区| 国产精品2018| 亚洲天堂久久久久| 国产一区二区中文字幕| 亚洲xxx视频| 亚洲欧美激情国产综合久久久| 国产成人亚洲综合a∨猫咪| 99久久一区三区四区免费| 成人午夜免费福利| 91在线精品一区二区| 久久66热这里只有精品| 激情小说 在线视频| 国产精品免费丝袜| 激情图片qvod| av日韩中文| 色菇凉天天综合网| 手机版av在线| 久久九九热re6这里有精品| 亚洲精品小视频| 久久精品在线观看视频| 欧美日韩亚洲一区二区三区在线| 7777免费精品视频| 艳妇乳肉豪妇荡乳av无码福利| 狠狠色狠狠色合久久伊人| 国产精品久久久久久久免费大片 | 亚洲欧美中文日韩v在线观看| 白白色免费视频| 亚洲五月综合| 26uuu国产精品视频| 又骚又黄的视频| 成人免费高清在线| 热re99久久精品国产99热| 欧美成人精品一区二区男人看| 亚洲综合久久av| 91蝌蚪视频在线观看| 久久国产精品美女| 亚洲日韩中文字幕在线播放| 永久免费看黄网站| 麻豆9191精品国产| 91亚洲国产成人精品性色| 色香蕉在线视频| 中文字幕亚洲电影| 91黄色小网站| 亚洲精品v亚洲精品v日韩精品| 亚洲欧美成人网| 老湿机69福利| 日韩电影网1区2区| 国产区一区二区三区| 午夜在线小视频| 精品久久久久久久久中文字幕| 日本免费色视频| 国产精品免费不| 欧美精品videos| 亚洲资源在线播放| 北条麻妃一区二区三区| 亚洲AV无码成人精品一区| 国模冰冰炮一区二区| 精品国产在天天线2019| 久久人妻无码aⅴ毛片a片app| 免费亚洲一区| 国产在线欧美日韩| 婷婷色在线资源| 欧美绝品在线观看成人午夜影视| 少妇特黄一区二区三区| 伊人久久婷婷| caoporn国产精品免费公开| 2017亚洲天堂1024| 色视频一区二区| 中文字幕一区二区久久人妻网站| 午夜久久tv| 91亚洲午夜在线| 77导航福利在线| 91成人免费在线| 中文字幕av网址| 亚洲欧美清纯在线制服| 精品国产免费人成电影在线观... 精品国产免费久久久久久尖叫 | 国产一区二区在线免费观看| 亚洲一区二区精品在线| 欧美韩国亚洲| 国产亚洲在线播放| 久久久久久久久黄色| 91视频免费播放| 黄色动漫网站入口| 一区二区美女| 欧美专区日韩视频| 美州a亚洲一视本频v色道| 欧美日韩中文字幕在线| 久久人人爽人人爽人人片| 国产日本精品| 欧美性色黄大片人与善| 色资源二区在线视频| 日韩精品中文字幕久久臀| 999这里只有精品| 91啦中文在线观看| 18岁视频在线观看| 日韩国产欧美一区二区| 国产日韩精品在线播放| av免费在线网站| 精品免费国产二区三区| 久草精品视频在线观看| 99热精品国产| 日韩一级在线免费观看| 日韩电影二区| 91精品国产一区二区三区动漫 | 亚洲黄页网站| 国产精品久久久久不卡| 日本三级在线播放完整版| 51午夜精品国产| 久久久一区二区三区四区| 96av麻豆蜜桃一区二区| 50路60路老熟妇啪啪| 婷婷亚洲五月| 国产99在线播放| 高潮一区二区| 精品国产一区二区三区久久久狼| av中文字幕免费在线观看| 亚洲高清免费观看| 国产真实乱人偷精品人妻| 麻豆极品一区二区三区| 日韩成人三级视频| 亚洲涩涩av| 亚洲japanese制服美女| а√在线中文网新版地址在线| 国产一区二区久久精品| 精品女同一区二区三区| 日韩欧美在线网址| 国产日产精品一区二区三区的介绍 | 欧美最顶级的aⅴ艳星| 午夜视频在线免费观看| 亚洲第一区中文99精品| 亚洲精品国产欧美在线观看| 亚洲人午夜精品天堂一二香蕉| 人妻在线日韩免费视频| 精品一区二区三区影院在线午夜| 成人在线国产视频| 久久精品国产大片免费观看| 精品在线观看一区二区| 四虎成人精品一区二区免费网站| 性欧美视频videos6一9| 日本三级视频在线播放| 亚洲精选中文字幕| 精品国产av 无码一区二区三区| 欧美色xxxx| 中文字幕av免费在线观看| 久久久久国色av免费看影院| 四虎国产精品永久免费观看视频| 免费日韩视频| av免费看网址| 亚洲精品一二三区区别| 品久久久久久久久久96高清| 超碰精品在线| 91老司机在线| 嫩草伊人久久精品少妇av杨幂| 欧美精品xxx| 麻豆传媒在线免费看| 亚洲网站在线播放| 亚洲 小说区 图片区 都市| 日韩视频一区二区在线观看| 中文字幕日韩国产| 色呦呦国产精品| 欧美精品久久久久性色| 中文字幕一区二区三中文字幕 | 国产精品久久久久影院色老大 | 国产精品久久午夜夜伦鲁鲁| 波多野结衣 在线| 粉嫩av一区二区三区| 网站在线你懂的| 捆绑调教美女网站视频一区| 久久精品香蕉视频| 国产农村妇女精品一二区| www.国产在线播放| 欧美激情四色| 久久av秘一区二区三区| 99久久婷婷国产综合精品电影√| 日韩精品伦理第一区| 亚欧日韩另类中文欧美| 久久精品五月婷婷| 另类ts人妖一区二区三区| 国产福利久久| 超碰97久久国产精品牛牛| 高清国产在线一区| 亚洲综合网站| 国产精品v欧美精品∨日韩| 亚洲2区在线| 成人影片在线播放| 日韩一区二区三区精品视频第3页 日韩一区二区三区精品 | 石原莉奈一区二区三区在线观看 | 免费看特级毛片| 18涩涩午夜精品.www| 一级性生活免费视频| 亚洲女爱视频在线| 国产精品成人免费观看| 亚洲综合在线免费观看| 国产亚洲精品久久久久久无几年桃 | 久久久av水蜜桃| 亚洲国产网址| 相泽南亚洲一区二区在线播放| 日韩国产一区| 亚洲成年人专区| 国产专区一区| 亚欧无线一线二线三线区别| 亚洲一区二区三区四区五区午夜| 国产精品第12页| 轻轻草成人在线| 久久久久久久久久久久久久久国产| 黑人巨大精品欧美黑白配亚洲| 涩涩网站在线看| 国产999精品久久久久久绿帽| av av在线| 久久久久久久久99精品| www.涩涩爱| 一区二区三区在线免费观看| 日本一级黄色录像| 在线观看中文字幕不卡| 999av视频| 日韩精品一区二区视频| 成人高清免费在线播放| 米奇精品一区二区三区在线观看| 精精国产xxxx视频在线中文版| 欧美性视频网站| 日韩黄色三级在线观看| 国产98在线|日韩| 欧美日韩一二三四| 99久久99久久精品| 久久精品综合| 中文字幕avav| 久久综合久久鬼色| 天天操天天操天天操天天操天天操| 亚洲国产另类精品专区| 国产精品第六页| 日韩视频在线一区二区| 九色视频网站在线观看| 欧美刺激性大交免费视频| 免费亚洲电影| wwwxx欧美| 日韩综合网站| 精品久久一二三| 国产美女主播视频一区| 国内精品久久99人妻无码| 亚洲精品一卡二卡| 日韩熟女一区二区| 亚洲成人在线网| 日韩av中文| 日本中文字幕久久看| 精品一区二区三区在线观看视频| 日韩av影视| 日韩视频在线一区二区三区 | 亚洲欧美中文另类| av在线加勒比| 亚洲在线观看视频| 久久精品国产99久久| 国产xxxxx在线观看| 成人免费毛片片v| 国产成人综合在线视频| 欧美三级韩国三级日本一级| 视频福利在线| 国模叶桐国产精品一区| 日韩精品一区国产| 亚洲一区综合| 免费日本视频一区| 国产全是老熟女太爽了| 性做久久久久久免费观看欧美| 国产美女三级无套内谢| 色琪琪综合男人的天堂aⅴ视频| 高清av不卡| 欧美视频1区| 日韩视频不卡| 欧美无人区码suv| 亚洲午夜久久久久| 亚洲精品国产精| 欧美成人合集magnet| 综合久草视频| 中文精品一区二区三区| 久久精品国产77777蜜臀| 一区二区三区久久久久| 一本到不卡精品视频在线观看| 天堂在线视频观看| 26uuu另类亚洲欧美日本老年| 久久99精品久久久久久欧洲站 | 日韩高清电影一区| 亚洲AV无码国产成人久久| 欧美日韩亚洲国产一区| 香蕉视频黄色片| 国产91精品青草社区| 香蕉久久夜色精品国产使用方法| 精品久久一二三| 久久综合久久鬼色中文字| 无码人妻精品一区二区| 一区二区三区 在线观看视| 国产91欧美| 日本一区二区免费高清视频| 国产精品香蕉一区二区三区| 九九久久免费视频| 精品国产乱子伦一区| ****av在线网毛片| 久久久久久国产精品一区 | 亚洲日本va在线观看| 国产黄色片免费观看| 久久99精品视频一区97| 国产伦精品一区二区三区免费优势| av免费看网址| 久久一二三国产| 最新中文字幕免费| 久久五月天色综合| www.豆豆成人网.com| 免费国产a级片| 国产欧美精品国产国产专区| 中文字幕在线播放av| 欧美猛少妇色xxxxx| 欧美天堂社区| 99视频在线视频| 亚洲人成精品久久久久久| 亚洲国产成人精品一区二区三区| 国模精品系列视频| 禁果av一区二区三区| 中文字幕亚洲影院| 性做久久久久久免费观看| h视频在线免费| 成人av男人的天堂| 葵司免费一区二区三区四区五区| 国产精品综合激情| 精品久久久久久无| 久久精品女人天堂av免费观看| 永久域名在线精品| av电影天堂一区二区在线| 国产成人精品一区二区色戒| 欧美成aaa人片免费看| 日韩av影院| 国产一区二区在线观看免费视频| 亚洲成人av电影| 日本中文字幕在线播放| 国产精品中出一区二区三区| 日本sm残虐另类|