精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

研究表明大型語言模型在邏輯推理方面存在問題

譯文
人工智能
人工智能系統(tǒng)針對自然語言處理和理解問題有幾個基準(zhǔn)測試,例如GLUE、SuperGLUE、SNLI和SqUAD。隨著Transformer規(guī)模變得越來越大,并在更大的數(shù)據(jù)集上接受訓(xùn)練,Transformer已經(jīng)能夠在這些基準(zhǔn)上逐步改進。

譯者 | 李睿

審校 | 孫淑娟

在具有感知功能的聊天機器人成為熱門話題之前,大型語言模型(LLM)就已經(jīng)引起了人們更多的興奮和擔(dān)憂。近年來,經(jīng)過大量文本訓(xùn)練的深度學(xué)習(xí)模型——大型語言模型(LLM) 在幾個用于衡量語言理解能力的基準(zhǔn)方面表現(xiàn)出色。

諸如GPT-3和LaMDA之類的大型語言模型設(shè)法在較長的文本中保持連貫性。它們似乎對不同的主題很了解,并在冗長的對話中保持一致。大型語言模型(LLM)已經(jīng)變得如此令人信服,以至于有些人將它們與人格和更高形式的智力聯(lián)系在一起。

但是大型語言模型(LLM)能像人類一樣進行邏輯推理嗎?根據(jù)加州大學(xué)洛杉磯分校科學(xué)家發(fā)布的一篇研究論文,在大型語言模型(LLM)中使用的深度學(xué)習(xí)架構(gòu)Transformers并沒有學(xué)習(xí)模擬推理功能。與其相反,電腦們找到了明智的方法來學(xué)習(xí)推理問題中固有的統(tǒng)計特征。

研究人員在一個有限的問題空間中測試了當(dāng)前流行的Transformer架構(gòu)BERT。他們的研究結(jié)果表明,BERT可以準(zhǔn)確地響應(yīng)訓(xùn)練空間中分布內(nèi)示例的推理問題,但不能推廣到基于相同問題空間的其他分布中的示例。

而這些測試突出了深度神經(jīng)網(wǎng)絡(luò)的一些缺點以及用于評估它們的基準(zhǔn)。

1.如何衡量人工智能中的邏輯推理?

人工智能系統(tǒng)針對自然語言處理和理解問題有幾個基準(zhǔn)測試,例如GLUE、SuperGLUE、SNLI和SqUAD。隨著Transformer規(guī)模變得越來越大,并在更大的數(shù)據(jù)集上接受訓(xùn)練,Transformer已經(jīng)能夠在這些基準(zhǔn)上逐步改進。

值得注意的是,人工智能系統(tǒng)在這些基準(zhǔn)上的表現(xiàn)通常與人類智能進行比較。人類在這些基準(zhǔn)上的表現(xiàn)與常識和邏輯推理能力密切相關(guān)。但目前尚不清楚大型語言模型的改進是因為它們獲得了邏輯推理能力,還是因為它們接觸了大量文本。

為了驗證這一點,加州大學(xué)洛杉磯分校的研究人員開發(fā)了SimpleLogic,這是一類基于命題邏輯的邏輯推理問題。為了確保語言模型的推理能力經(jīng)過嚴(yán)格測試,研究人員通過使用模板語言結(jié)構(gòu)消除了語言差異。SimpleLogic問題由一組事實、規(guī)則、查詢和標(biāo)簽組成。事實是已知為“真”的謂詞。規(guī)則是條件,定義為條款。查詢是機器學(xué)習(xí)模型必須響應(yīng)的問題。標(biāo)簽是查詢的答案,也就是“真”或“假”。 SimpleLogic問題被編譯成連續(xù)的文本字符串,其中包含語言模型在訓(xùn)練和推理期間所期望的信號和分隔符。 

圖片

以SimpleLogic格式提出的問題SimpleLogic的特點之一是它的問題是自包含的,不需要先驗知識。這一點尤其重要,因為正如許多科學(xué)家所說,當(dāng)人類說話時,他們忽略了共享的知識。這就是為什么當(dāng)被問及每個人都知道的基本世界知識的問題時,語言模型經(jīng)常陷入陷阱的原因。相比之下,SimpleLogic為開發(fā)人員提供解決其問題所需的一切。 因此,任何查看SimpleLogic格式提出的問題的開發(fā)人員都應(yīng)該能夠推斷其規(guī)則,并能夠處理新示例,無論他們的背景知識如何。

2.統(tǒng)計特征和邏輯推理

研究人員證明,SimpleLogic中的問題空間可以用一個推理函數(shù)來表示。研究人員進一步表明,BERT有足夠的能力解決SimpleLogic中的所有問題,它們可以人工調(diào)整機器學(xué)習(xí)模型的參數(shù)來表示推理功能。

然而,當(dāng)它們在SimpleLogic示例數(shù)據(jù)集上訓(xùn)練BERT時,該模型無法自行學(xué)習(xí)推理功能。機器學(xué)習(xí)模型設(shè)法在一個數(shù)據(jù)分布上實現(xiàn)近乎完美的準(zhǔn)確性。但它并沒有推廣到同一問題空間內(nèi)的其他分布。盡管訓(xùn)練數(shù)據(jù)集覆蓋了整個問題空間,并且所有分布都來自同一推理函數(shù),但情況仍然如此。

圖片

BERT Transformer模型的容量足以表示SimpleLogic的推理功能

(注:這與分布外泛化挑戰(zhàn)不同,后者適用于開放空間問題。當(dāng)模型無法泛化到OOD數(shù)據(jù)時,當(dāng)處理不在其訓(xùn)練集分布范圍內(nèi)的數(shù)據(jù)時,其性能會顯著下降。)

研究人員寫道:“經(jīng)過進一步調(diào)查,我們?yōu)檫@個悖論提供了一個解釋:僅在分布測試示例上達到高精度的模型還沒有學(xué)會推理。事實上,該模型已經(jīng)學(xué)會在邏輯推理問題中使用統(tǒng)計特征來進行預(yù)測,而不是模擬正確的推理功能。”

這一發(fā)現(xiàn)凸顯了將深度學(xué)習(xí)用于語言任務(wù)的一個重要挑戰(zhàn)。神經(jīng)網(wǎng)絡(luò)非常擅長發(fā)現(xiàn)和擬合統(tǒng)計特征。在某些應(yīng)用程序中,這可能非常有用。例如,在情感分析中,某些詞和情感類別之間存在很強的相關(guān)性。

然而,對于邏輯推理任務(wù),即使存在統(tǒng)計特征,其模型也應(yīng)該嘗試找到并學(xué)習(xí)潛在的推理功能。

研究人員寫道:“當(dāng)我們試圖對神經(jīng)模型進行端到端的訓(xùn)練,以解決既涉及邏輯推理又涉及先驗知識且呈現(xiàn)語言差異的自然語言處理(NLP)任務(wù)時,應(yīng)該小心謹(jǐn)慎。”他們強調(diào),SimpleLogic帶來的挑戰(zhàn)在現(xiàn)實世界中變得更加嚴(yán)峻,大型語言模型(LLM)所需的大量信息根本不包含在數(shù)據(jù)中。

研究人員觀察到,當(dāng)他們從訓(xùn)練數(shù)據(jù)集中刪除一個統(tǒng)計特征時,語言模型在相同問題空間的其他分布上的性能得到了改善。然而,問題是發(fā)現(xiàn)和刪除多個統(tǒng)計特征說起來容易做起來難。正如研究人員在論文中指出的那樣,“此類統(tǒng)計特征可能數(shù)不勝數(shù),并且極其復(fù)雜,因此很難從訓(xùn)練數(shù)據(jù)中刪除。”

3.深度學(xué)習(xí)中的推理

不幸的是,隨著語言模型規(guī)模的變大,邏輯推理問題并沒有消失。它只是隱藏在龐大的架構(gòu)和非常大的訓(xùn)練語料庫中。大型語言模型(LLM)可以描述事實并且很好地將句子拼接在一起,但是在邏輯推理方面,他們?nèi)匀皇褂媒y(tǒng)計特征進行推理,這不是一個堅實的基礎(chǔ)。而且,沒有跡象表明通過向Transformers添加層、參數(shù)和注意力頭,邏輯推理的差距將被彌合。

這篇論文與其他顯示神經(jīng)網(wǎng)絡(luò)在學(xué)習(xí)邏輯規(guī)則方面的局限性的工作一致,例如生命游戲或視覺數(shù)據(jù)的抽象推理。該論文強調(diào)了當(dāng)前語言模型面臨的主要挑戰(zhàn)之一。正如加州大學(xué)洛杉磯分校的研究人員所指出的,“一方面,當(dāng)一個模型被訓(xùn)練來從數(shù)據(jù)中學(xué)習(xí)一項任務(wù)時,它總是傾向于學(xué)習(xí)統(tǒng)計模式,這些模式固有地存在于推理示例中;然而,另一方面,邏輯規(guī)則從不依賴統(tǒng)計模式來進行推理。由于很難構(gòu)建一個不包含統(tǒng)計特征的邏輯推理數(shù)據(jù)集,因此從數(shù)據(jù)中學(xué)習(xí)推理是很困難的。”

原文鏈接:https://bdtechtalks.com/2022/06/27/large-language-models-logical-reasoning/

責(zé)任編輯:武曉燕 來源: 51CTO技術(shù)棧
相關(guān)推薦

2025-05-08 09:10:30

2022-11-30 10:05:27

VMware

2022-12-01 08:00:00

2021-04-02 09:40:06

量子計算芯片超算

2024-02-04 14:04:46

AIGC

2025-05-26 17:16:51

2025-06-12 01:00:00

2025-03-03 09:40:00

2023-07-19 14:50:01

網(wǎng)絡(luò)安全勒索軟件

2015-09-21 09:52:57

邏輯推理

2025-01-27 12:03:11

2025-03-13 12:09:27

2024-04-26 08:53:46

自動駕駛人工智能大型語言模型

2024-10-16 13:50:00

模型AI

2025-10-14 01:00:00

2023-05-22 15:46:56

模型訓(xùn)練

2024-04-16 16:14:01

人工智能LLMRAG

2025-05-08 02:02:02

2023-06-02 15:47:49

2025-05-28 01:25:00

RAG人工智能語言模型
點贊
收藏

51CTO技術(shù)棧公眾號

怡红院在线观看| 一级特黄免费视频| 精品国产午夜肉伦伦影院| 亚洲成人精品一区二区| 久久资源av| 久久久久精彩视频| 一区二区三区网站| 亚洲国产91色在线| 婷婷丁香激情网| 色呦呦网站在线观看| 99re这里只有精品首页| 国产精品久久久久久久久久免费 | 欧美高清一级片在线观看| 成人伊人精品色xxxx视频| 国产在线一区视频| 青青草综合网| 亚洲第一视频网站| 手机av在线网| 粉嫩一区二区| 亚洲一区视频在线| 一区二区三区在线观看www| 国产91久久久| 经典一区二区三区| 青青久久av北条麻妃黑人| 中文字幕av播放| 美女精品一区最新中文字幕一区二区三区| 88在线观看91蜜桃国自产| 成人中文字幕在线播放| 91精选在线| 国产精品天美传媒| 蜜桃久久精品乱码一区二区 | 国产麻豆视频一区| 国产精品高潮在线| 亚洲欧美偷拍视频| 亚洲国产片色| 久久91亚洲精品中文字幕| a资源在线观看| 四虎5151久久欧美毛片| 亚洲精品一区二区在线观看| 精品久久久99| 99久久婷婷国产综合精品首页| 五月天中文字幕一区二区| 中文字幕制服丝袜在线| bbbbbbbbbbb在线视频| wwww国产精品欧美| 国产精品视频福利| xxww在线观看| a天堂视频在线观看| 999国产精品亚洲77777| 欧美性感美女h网站在线观看免费| 激情成人开心网| 午夜羞羞小视频在线观看| 亚洲日本丝袜连裤袜办公室| 亚洲日本理论电影| 成人资源www网在线最新版| 久久蜜臀中文字幕| 久久五月天婷婷| 天天操天天干天天操| 不卡欧美aaaaa| 国产精品一区视频| 日本免费一区视频| 久久综合色之久久综合| 欧美精品123| 成人高清网站| 国产精品二区一区二区aⅴ污介绍| 五月天亚洲综合情| 77导航福利在线| 亚洲同性同志一二三专区| 干日本少妇视频| 欧美性受ⅹ╳╳╳黑人a性爽| 亚洲精品视频在线观看网站| 成年人视频网站免费| 草美女在线观看| 五月婷婷欧美视频| 国产精品少妇在线视频| 国产成人a视频高清在线观看| 欧美在线制服丝袜| 欧美性受xxxxxx黑人xyx性爽| a一区二区三区亚洲| 欧美一区2区视频在线观看| 国产chinesehd精品露脸| 久久精品国产亚洲5555| 亚洲人a成www在线影院| 免费看的黄色网| 亚洲91中文字幕无线码三区| 狠狠噜噜久久| 中文字幕免费精品一区高清| 性欧美疯狂猛交69hd| 欧美色一级片| 欧美在线视频免费播放| 伊人色综合久久久| 成人午夜视频网站| 视频在线99re| 欧美人动性xxxxz0oz| 欧美性生交xxxxx久久久| 欧美三级理论片| 亚洲精品国产九九九| 亚洲美女又黄又爽在线观看| 女人18毛片毛片毛片毛片区二 | 黄色免费视频大全| 超碰这里只有精品| 精品国产3级a| 99在线视频免费| 欧美日韩国产色综合一二三四| 秋霞av国产精品一区| 国产精品爽爽久久久久久| 成人一区二区三区视频| 翔田千里亚洲一二三区| 黑人极品ⅴideos精品欧美棵| 色久综合一二码| 国产人妻精品久久久久野外| 亚洲深夜福利在线观看| 欧美巨大黑人极品精男| av手机天堂网| 成人精品电影在线观看| 亚洲国产一区二区在线| av色在线观看| 欧美一卡二卡三卡| 三区四区在线观看| 国产亚洲福利| 成人18视频| 免费人成在线观看播放视频| 精品福利在线看| 色男人天堂av| 日韩欧美电影| 国产xxx69麻豆国语对白| 肥臀熟女一区二区三区| 亚洲婷婷综合久久一本伊一区| 色姑娘综合av| 少妇视频在线观看| 欧美v日韩v国产v| 中国一级片在线观看| 日韩精品五月天| 蜜桃麻豆91| 毛片aaaaa| 欧美在线va视频| 亚洲国产日韩欧美在线图片| 亚洲波多野结衣| 久久97超碰色| 日本一区二区精品视频| 涩涩网在线视频| 亚洲精品第一页| 男人天堂中文字幕| 丁香天五香天堂综合| 日本一区二区三区四区五区六区| 欧美日韩破处视频| 在线视频国产日韩| 久久精品视频5| 久久奇米777| 国产无套内射久久久国产| 久久午夜影院| 68精品久久久久久欧美| 亚欧洲精品视频| 欧美日韩国产精品专区 | 粉嫩久久久久久久极品| 精品综合久久久久久97| 国产伦精品一区二区三区免.费 | 精品99久久久久成人网站免费| 精品一区二区在线视频| 中文字幕99| 福利一区三区| 欧美精品做受xxx性少妇| 国产黄色免费大片| 亚洲制服丝袜一区| 中文字幕天堂网| 久久五月激情| 亚洲一二三专区| 女人床在线观看| 中文字幕一区日韩精品| 欧美激情欧美狂野欧美精品| 亚洲国产精品久久人人爱潘金莲 | 91九色在线观看视频| 天堂成人娱乐在线视频免费播放网站 | 欧美激情成人动漫| 亚洲国产精品免费| www.com亚洲| 国产精品国产三级国产aⅴ原创| 国语对白做受xxxxx在线中国 | 国产日产欧美一区二区| 999久久精品| 538国产精品一区二区在线 | 国产亚洲欧美日韩俺去了| 少妇网站在线观看| 在线成人激情| 精品一区在线播放| 成人黄色毛片| 欧美精品中文字幕一区| 色视频在线观看福利| 色婷婷综合视频在线观看| 久久久久无码精品国产sm果冻| 日韩精品乱码av一区二区| 四虎永久免费网站| 国产精品三p一区二区| 日本在线精品视频| 2024最新电影免费在线观看| 日韩av综合网| 一区二区视频在线免费观看| 悠悠色在线精品| 2019男人天堂| 国产精品一区二区男女羞羞无遮挡 | 激情五月六月婷婷| 少妇精品久久久一区二区| 国产一区私人高清影院| а√天堂资源官网在线资源| 国产一区二区三区18| 亚洲av综合色区无码一二三区| 欧美视频不卡中文| 三级黄色录像视频| 成人av电影在线网| 国模吧一区二区三区| 中文字幕伦理片| 国产精品资源站在线| 欧美啪啪免费视频| 一个色综合网| 欧美国产综合视频| 麻豆精品国产| 国产激情久久久| 乱馆动漫1~6集在线观看| 色婷婷av一区二区三区在线观看 | 久久精品国产久精国产爱| 一二三四中文字幕| 精品国产一区探花在线观看 | 久久91麻豆精品一区| 亚洲free性xxxx护士白浆| 中文不卡1区2区3区| 日韩网站免费观看高清| 免费在线高清av| 精品日韩一区二区三区免费视频| 天干夜夜爽爽日日日日| 国产精品国产三级国产三级人妇| 久久精品视频18| 成人一区二区三区| 国产精品嫩草影院8vv8| 黄色成人在线网站| 中文字幕色呦呦| 日韩精品首页| 欧美日韩一区在线观看视频| 亚洲成人影音| **亚洲第一综合导航网站| 91福利精品在线观看| 97视频网站入口| 欧美天天影院| 日韩中文在线中文网三级| 少妇激情av一区二区| 日韩精品一区在线| 免费黄色一级大片| 欧美色综合网站| 黄瓜视频在线免费观看| 欧美日韩性视频| 欧美黄色免费看| 亚洲国产乱码最新视频| 精品99在线观看| 亚洲视频一区二区免费在线观看| 91社区视频在线观看| 日本一区二区三区免费乱视频| www.久久国产| 97se亚洲国产综合自在线| 潘金莲一级淫片aaaaa| 国产一区二区三区av电影| 少妇网站在线观看| 久久国产精品99精品国产 | 久久免费黄色网址| 日韩成人一级| 中文字幕亚洲综合久久| 国产精品影院在线| 亚洲性线免费观看视频成熟| av在线电影免费观看| 中文字幕亚洲精品| 日本三级在线播放完整版| 亚洲香蕉伊综合在人在线视看| aaa日本高清在线播放免费观看| 在线观看欧美www| 午夜免费视频在线国产| 中文字幕亚洲欧美日韩在线不卡| caoporn97在线视频| 欧美俄罗斯乱妇| 888av在线视频| 国产精欧美一区二区三区| 久久天堂av| 国产精品r级在线| 国产一区高清| 粉嫩av免费一区二区三区| 色愁久久久久久| 欧美午夜欧美| 中文字幕亚洲影视| 中文字幕av日韩精品| 国产精品xvideos88| 国产在线精品91| 精品无人区卡一卡二卡三乱码免费卡 | 午夜在线视频观看| 国产亚洲精品久久久久久牛牛| 成人在线app| 国模gogo一区二区大胆私拍| 自拍视频在线看| 国产成人在线视频| 午夜视频在线观看精品中文| 国产经品一区二区| 亚洲黄页网站| 日韩专区第三页| 亚洲欧美日本国产专区一区| 91看片在线免费观看| 国产精品99久久久久久久女警 | 亚洲午夜无码av毛片久久| 日本v片在线高清不卡在线观看| 亚洲免费在线播放视频| 99久久99久久精品免费观看| 国产精品久久久久久久av| 亚洲精品国产无天堂网2021| 亚洲黄色三级视频| 欧美日产国产精品| 午夜视频www| 久久久精品在线| 欧美va在线观看| 99re在线视频观看| 精品72久久久久中文字幕| 日韩xxxx视频| 久久精品国产免费看久久精品| 国产精品麻豆入口| 亚洲欧美在线aaa| 凹凸精品一区二区三区| 精品少妇一区二区三区免费观看| 欧美日韩dvd| 国产在线观看91一区二区三区 | 黄色小视频免费在线观看| 亚洲精品99久久久久| www.久久ai| 国产精品国模在线| 国产图片一区| 一区在线电影| 视频一区二区中文字幕| 国产精品成人免费一区久久羞羞| 91理论电影在线观看| 久久亚洲国产成人精品性色| 欧美三级在线看| 亚洲精品97久久中文字幕无码 | ass极品国模人体欣赏| 欧美视频一区二区三区…| 亚洲国产999| 久久电影一区二区| 日韩电影网站| 欧洲亚洲一区| 在线一区免费观看| 熟女人妻一区二区三区免费看| 亚洲精品老司机| 国产乱叫456在线| 色噜噜亚洲精品中文字幕| 成人在线免费电影网站| 日本一区高清在线视频| 久久久国产亚洲精品| 日韩视频在线观看免费视频| 欧美日韩亚洲一区二| 天天干在线观看| 欧美国产精品va在线观看| 综合久久成人| 老司机午夜网站| 成人免费av在线| 国产在线一二区| 亚洲欧美精品在线| 美女网站视频一区| 日韩不卡av| 久久国产精品色| 国产男女猛烈无遮挡在线喷水| 欧美色视频在线观看| 日韩在线观看www| 国产欧美亚洲精品| 欧美激情国产在线| 亚洲丝袜在线观看| 亚洲综合一区二区| 好吊视频一区二区三区| 日本成人免费在线| 欧美理论视频| 57pao国产成永久免费视频| 亚洲靠逼com| 亚洲精品久久久久avwww潮水| 欧美激情网友自拍| 亚洲制服一区| 日本888xxxx| 亚洲日本韩国一区| 亚洲欧美日韩成人在线| 日本午夜人人精品| 日本不卡高清| 日韩精品视频一二三| 亚洲一线二线三线视频| 亚洲欧美自偷自拍| 7m第一福利500精品视频| 三级电影一区| 色欲无码人妻久久精品| 精品日韩中文字幕| 2021av在线| 懂色中文一区二区三区在线视频| 久久精品主播| 日韩亚洲欧美中文字幕| 欧美草草影院在线视频| 日韩精品麻豆| 欧美美女黄色网| 久久久久久99精品| 性生交大片免费看女人按摩| 欧美又大又硬又粗bbbbb| 欧美综合久久| 天天躁日日躁狠狠躁av|