精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

長(zhǎng)文本信息準(zhǔn)確率超過(guò)ChatGPT,Meta提出降低大模型幻覺(jué)新方法

人工智能 新聞
所謂大模型幻覺(jué),就是輸出一些看似合理但完全不對(duì)的內(nèi)容。Meta此次提出的“驗(yàn)證鏈”(CoVe),是與“思維鏈”(CoT)相似的一種鏈?zhǔn)椒椒ā?/div>

本文經(jīng)AI新媒體量子位(公眾號(hào)ID:QbitAI)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請(qǐng)聯(lián)系出處。

大模型的幻覺(jué)問(wèn)題,又有新的解決方法了!

Meta AI實(shí)驗(yàn)室提出了一種“分而治之”的解決方案。

有了這個(gè)方案,Llama-65B輸出的信息準(zhǔn)確率提升了一倍,甚至超過(guò)了ChatGPT

所謂大模型幻覺(jué),就是輸出一些看似合理但完全不對(duì)的內(nèi)容。

Meta此次提出的“驗(yàn)證鏈”(CoVe),是與“思維鏈”(CoT)相似的一種鏈?zhǔn)椒椒?/span>

區(qū)別在于,“step-by-step”的思維鏈更關(guān)注邏輯推理,而驗(yàn)證鏈更注重事實(shí)信息

有網(wǎng)友看了之后發(fā)現(xiàn),這個(gè)驗(yàn)證鏈很像是自己用ChatGPT寫(xiě)代碼時(shí)的一種科學(xué)方法:

圖片

那么“驗(yàn)證鏈”究竟是個(gè)什么方法,“驗(yàn)證”的又是什么呢?

拆解答案,分而治之

驗(yàn)證鏈的核心思想,是把要驗(yàn)證的一大段內(nèi)容,拆解成一個(gè)個(gè)小的問(wèn)題,具體流程是這樣的:

首先,模型會(huì)根據(jù)用戶提出的問(wèn)題照常生成回復(fù)。

接著,根據(jù)生成的回復(fù)內(nèi)容,針對(duì)其中的各項(xiàng)信息,生成一系列的驗(yàn)證問(wèn)題。

然后讓模型自行回答其所提出的這些問(wèn)題,并根據(jù)結(jié)果對(duì)初始答案進(jìn)行調(diào)整,得到最終結(jié)果。

舉個(gè)簡(jiǎn)單的例子,假如想詢問(wèn)模型19世紀(jì)美墨戰(zhàn)爭(zhēng)的主要原因是什么。

模型回答了事件發(fā)生的時(shí)間,以及在這之前都發(fā)生了什么事。

圖片

之后針對(duì)這一系列事件,逐一詢問(wèn)它們是什么時(shí)候發(fā)生的。

于是,模型發(fā)現(xiàn)自己提到的一項(xiàng)內(nèi)容時(shí)間相差太遠(yuǎn),調(diào)整后給出了最終的答案。

圖片

其中,問(wèn)題的生成和驗(yàn)證是最關(guān)鍵的一環(huán),對(duì)此,研究人員一共提出了四種具體的方式:

  • Joint,即將生成問(wèn)題和回答的指令寫(xiě)入同一段提示詞
  • 2-Step,即先讓模型生成提問(wèn),然后開(kāi)啟新的對(duì)話(一次性)回答提出的問(wèn)題
  • Factored,在2-Step的基礎(chǔ)上,對(duì)提出的每一個(gè)問(wèn)題分別開(kāi)啟新對(duì)話
  • Factor+Revise,在Factored的基礎(chǔ)之上加入一致性檢驗(yàn),讓模型重點(diǎn)關(guān)注前后不一致的內(nèi)容

這四種模式越來(lái)越細(xì)化,準(zhǔn)確率也是越來(lái)越高。

圖片

△從紅色開(kāi)始,四種顏色依次代表無(wú)CoVe、Joint、Factored和Factor+Revise

那么為什么拆分提問(wèn)就能提高模型的準(zhǔn)確性呢?

首先是因?yàn)椴鸾夂蟮膯?wèn)題比整體任務(wù)更容易,論述題變成了問(wèn)答甚至選擇、判斷題,問(wèn)題簡(jiǎn)單了,準(zhǔn)確率也就提升了

此外,把問(wèn)題分解可以讓模型真正重新思考,而不是反復(fù)地重復(fù)錯(cuò)誤答案

那么,驗(yàn)證鏈方式的效果究竟如何呢?

信息準(zhǔn)確率超過(guò)ChatGPT

為了探究這一問(wèn)題,研究人員用Llama進(jìn)行了測(cè)試,測(cè)試任務(wù)一共有三項(xiàng)。

首先是信息列舉,比如列舉出出生于某地、從事某行業(yè)的名人。

這項(xiàng)任務(wù)中,研究人員一共測(cè)試了兩個(gè)數(shù)據(jù)集——簡(jiǎn)單一些的Wikidata和從難一些的Wiki-Category list(從維基百科中提取)。

圖片

結(jié)果發(fā)現(xiàn),65B參數(shù)的Llama,在two-step模式的驗(yàn)證鏈加持下,簡(jiǎn)單問(wèn)題的準(zhǔn)確度從0.17提升到了0.36,增加了一倍還多,復(fù)雜問(wèn)題準(zhǔn)確度也接近翻番。

接下來(lái)是“閉域問(wèn)答”題,研究人員從MultiSpanQA數(shù)據(jù)集中抽取多個(gè)不連續(xù)信息進(jìn)行挖空提問(wèn)。

比如“誰(shuí)在哪一年創(chuàng)建了世界上第一家出版社”(答案是Johannes Gutenberg, 1450)。

結(jié)果,Cove也為L(zhǎng)lama帶來(lái)了20%左右的準(zhǔn)確度提升。

圖片

第三項(xiàng)任務(wù)是“長(zhǎng)段文本傳記生成”,問(wèn)題就是“Tell me a bio of (人名)”,使用FactScore數(shù)據(jù)集進(jìn)行評(píng)價(jià)。

結(jié)果在Factor+Reviese模式下,準(zhǔn)確率不僅比無(wú)驗(yàn)證鏈模式大幅提高,還超過(guò)了ChatGPT

圖片

對(duì)這項(xiàng)研究感興趣的朋友,可以到論文中了解更多細(xì)節(jié)。

論文地址:https://arxiv.org/abs/2309.11495

責(zé)任編輯:張燕妮 來(lái)源: 量子位
相關(guān)推薦

2023-11-08 08:38:43

2023-11-28 13:37:43

語(yǔ)言模型LLM

2023-05-04 09:39:16

AI模型

2024-09-03 14:10:00

模型測(cè)試

2023-06-08 19:07:17

ChatGPTAI

2023-10-19 08:30:56

模型搜索

2025-05-29 09:20:00

模型研究推理

2016-01-27 13:37:53

機(jī)器學(xué)習(xí)數(shù)據(jù)模型算法

2023-10-26 08:40:15

模型隱私推理

2023-11-27 13:20:00

AI訓(xùn)練

2023-10-25 09:19:00

AI訓(xùn)練

2022-12-08 13:00:10

AI性別偏見(jiàn)

2023-10-23 10:02:00

模型技術(shù)

2024-12-26 15:30:00

模型深度學(xué)習(xí)AI

2024-01-03 13:37:00

模型數(shù)據(jù)

2025-10-23 12:46:39

2021-08-10 16:01:18

模型人工智能深度學(xué)習(xí)

2021-11-01 10:40:15

機(jī)器學(xué)習(xí)人工智能計(jì)算機(jī)

2024-01-29 12:49:00

AI模型
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

成人动漫一区二区| 日韩国产欧美| 欧美午夜丰满在线18影院| 蜜桃91精品入口| 中文字幕在线观看1| 欧美另类女人| 精品中文视频在线| 中文字幕视频三区| 黄色在线免费观看网站| 中文乱码免费一区二区| 国产视频在线观看一区| 亚洲一区二区人妻| 精品91在线| 色一情一乱一区二区| 亚洲一级一级97网| 日本黄xxxxxxxxx100| 欧美一级在线免费观看| 蜜臀av亚洲一区中文字幕| 欧美激情视频免费观看| 精品亚洲aⅴ无码一区二区三区| 秋霞一区二区| 欧美午夜精品免费| 131美女爱做视频| 黄色av电影在线观看| 久久久精品人体av艺术| αv一区二区三区| 亚洲影视一区二区| 美女久久网站| 97国产精品人人爽人人做| 亚洲一二三在线观看| 蜜桃精品噜噜噜成人av| 欧美精品一区男女天堂| 粉色视频免费看| 欧美不卡高清一区二区三区| 亚洲h在线观看| 精品国产一区二区三区在线| 成人全视频高清免费观看| zzijzzij亚洲日本少妇熟睡| 亚洲一区二区三区久久| 中文字幕视频一区二区| 久久激情综合| 国产91精品久久久久久| 日韩污视频在线观看| 欧美成人一品| 美女啪啪无遮挡免费久久网站| 亚洲一区 欧美| 国产欧美日韩| 亚洲社区在线观看| 亚洲国产av一区| 国产毛片一区二区三区| 亚洲色图35p| 亚洲码无人客一区二区三区| 亚洲人成伊人成综合图片| 日韩av有码在线| 五月开心播播网| 欧美顶级毛片在线播放| 亚洲精品98久久久久久中文字幕| 成人在线观看一区二区| 国产suv精品一区| 欧美精品一区二区在线播放| 岛国精品一区二区三区| 国产成人一二片| 亚洲国产精彩中文乱码av| 大桥未久恸哭の女教师| 美女主播精品视频一二三四| 国产乱子伦视频一区二区三区| 国产精品久久久久久久久久| 中国黄色一级视频| 久久成人免费网| 91网站免费看| 亚洲爆乳无码一区二区三区| 岛国一区二区三区| 久久大片网站| 国产女人在线视频| 亚洲天堂2016| 男人天堂av片| 中文在线8资源库| 欧美日韩在线播放三区| 天天影视色综合| 91亚洲无吗| 亚洲欧美日韩精品久久| 午夜影院黄色片| 99精品在线| 久久久久久高潮国产精品视| 国内精品福利视频| 麻豆成人av在线| 99re视频在线播放| 美国成人毛片| 亚洲色图欧洲色图婷婷| 人人妻人人添人人爽欧美一区| 日本韩国欧美| 日韩一区二区在线看| 中文字幕在线永久| 久久国产成人午夜av影院宅| 欧美风情在线观看| 欧美一级做a爰片免费视频| 国产综合色在线视频区| 精品视频第一区| 在线观看黄色av| 性久久久久久久| 第四色婷婷基地| 极品束缚调教一区二区网站 | 日韩欧美国产片| 爱爱精品视频| 日韩小视频在线观看| 国产午夜福利片| 九色综合狠狠综合久久| 免费影院在线观看一区| 菠萝菠萝蜜在线视频免费观看| 精品久久久视频| 久久6免费视频| 爽爽窝窝午夜精品一区二区| 久久久精品日本| 日韩精品一区二区亚洲av| 国产一区二区不卡| 日本高清一区| av日韩中文| 91精品国产福利在线观看| 日本激情小视频| 国产欧美一级| av免费精品一区二区三区| aaa日本高清在线播放免费观看| 亚洲最色的网站| 国产视频1区2区3区| 亚洲妇女av| 国内自拍欧美激情| 性中国xxx极品hd| 国产精品欧美久久久久无广告| 97超碰青青草| 懂色av一区二区| 蜜臀久久99精品久久久久久宅男| 999视频在线| 久久综合成人精品亚洲另类欧美| 日本a级片在线播放| 日本免费一区二区三区等视频| 亚洲人成在线电影| 韩国av中文字幕| 成人午夜碰碰视频| 国产精品videossex国产高清| 亚洲成人高清| 精品国产一区二区在线| 中文字幕在线观看你懂的| 国产视频一区在线观看| 茄子视频成人免费观看| 欧美激情久久久久久久久久久| 久久久久久91| 手机看片福利永久| 亚洲理论在线观看| 少妇欧美激情一区二区三区| 伊人色**天天综合婷婷| 91久久综合亚洲鲁鲁五月天| 麻豆最新免费在线视频| 在线播放中文一区| 欧美三级免费看| 国产.欧美.日韩| 秋霞无码一区二区| 欧洲亚洲成人| 国产国语刺激对白av不卡| 黄色小视频在线免费观看| 狠狠躁天天躁日日躁欧美| 加勒比一区二区| 秋霞电影一区二区| 这里只有精品66| 日本久久伊人| 性金发美女69hd大尺寸| 午夜影院免费视频| 91亚洲国产成人精品一区二三 | 少女频道在线观看高清| 精品日本一线二线三线不卡| 豆国产97在线 | 亚洲| eeuss影院一区二区三区| 国内外成人免费激情视频| 精品日韩在线| 欧美日韩成人免费| 韩国av电影在线观看| 欧美色视频日本版| 国产主播av在线| 国产精品亚洲专一区二区三区 | 侵犯稚嫩小箩莉h文系列小说| 国产宾馆实践打屁股91| 2022亚洲天堂| 国产大片一区| 国产日韩欧美一区二区三区四区| 日韩精品av| 精品国产一区二区三区在线观看| 午夜精品久久久久久久第一页按摩 | 免费成人在线影院| 日本福利视频在线观看| 婷婷成人综合| 成人在线国产精品| 男人av在线播放| 色偷偷av一区二区三区| 日本人妻丰满熟妇久久久久久| 色婷婷国产精品| 欧美老熟妇一区二区三区| 99久久99久久久精品齐齐| 天天插天天操天天射| 国内揄拍国内精品久久| 日韩免费毛片| 美女主播精品视频一二三四| 国产美女搞久久| 国产调教在线| 欧美成人精品激情在线观看| 欧美zozo| 精品1区2区在线观看| 国产影视一区二区| 色综合天天狠狠| 黄色一级视频免费| 中文幕一区二区三区久久蜜桃| 97精品人妻一区二区三区蜜桃| 麻豆精品在线播放| 成年人视频在线免费| 欧美涩涩网站| 一区二区三区视频| 亚洲www免费| 久久久综合免费视频| 免费在线看a| 亚洲人成免费电影| 天天色棕合合合合合合合| 日韩一级视频免费观看在线| 久久影视中文字幕| 精品女同一区二区三区在线播放| 破处女黄色一级片| 一色桃子久久精品亚洲| 成人午夜剧场视频网站| 99久久精品免费| 久草免费资源站| 国产一区二区女| 亚洲午夜精品一区| 麻豆精品一区二区三区| mm1313亚洲国产精品无码试看| 亚洲视频www| 黄色一级在线视频| 亚洲美女色禁图| 日韩a级在线观看| 欧美精品午夜| 免费观看亚洲视频| 亚洲在线久久| 在线免费观看成人| 久久久久久久久国产一区| 视频一区在线免费观看| 久久99国内| 日本一区二区在线视频| 久操精品在线| 色姑娘综合av| 精品理论电影| 一区二区三区四区国产| 日韩免费高清| 中文字幕精品一区日韩| 中文无码久久精品| 好色先生视频污| 亚洲久久久久| 国产制服91一区二区三区制服| 亚洲欧美在线专区| 成人一区二区av| 韩日成人av| 国产一区二区三区小说| 亚洲激情二区| 精品99在线视频| 日本伊人午夜精品| 污片在线免费看| 久久91精品久久久久久秒播| 黄色a级三级三级三级| 国产69精品久久久久777| 免费看91视频| 91在线免费视频观看| 欧美性猛交xxxx乱| 暧暧视频在线免费观看| 日韩三级视频| 黑人精品欧美一区二区蜜桃| 午夜久久久影院| 海角国产乱辈乱精品视频| 亚洲欧美黄色片| 亚洲经典中文字幕| 瑟瑟在线观看| 这里只有视频精品| caopen在线视频| 26uuu另类亚洲欧美日本一| 日韩性xxx| 国产精品天天狠天天看| 欧美日韩黄网站| 精品视频在线观看| 欧美电影一区| 超碰成人免费在线| 日韩中文字幕1| 深爱五月综合网| www.日韩精品| www.com.av| 亚洲成人777| 亚洲午夜无码久久久久| 欧美不卡123| 国际av在线| 欧美大片在线影院| 欧美片第一页| 岛国视频一区| 欧美日韩激情| 和岳每晚弄的高潮嗷嗷叫视频| 日韩高清中文字幕一区| 久久久精品人妻一区二区三区| 2欧美一区二区三区在线观看视频 337p粉嫩大胆噜噜噜噜噜91av | 快射av在线播放一区| 国模吧一区二区| 国产成人精品一区二区三区视频| 国产99在线播放| 日产精品一区二区| 欧美日韩性生活片| 国产综合色产在线精品| 公侵犯人妻一区二区三区| 一区二区三区在线视频观看| 国产黄网在线观看| 精品电影一区二区| 九七电影韩国女主播在线观看| 日韩av电影中文字幕| a一区二区三区亚洲| 国产调教视频一区| 久久影视电视剧免费网站| 国产精品88久久久久久妇女| 在线免费观看高清视频| 视频一区中文| 亚洲欧美在线aaa| 91精品视频观看| 日本青青草视频| 日韩啪啪网站| 欧美日韩国产天堂| 激情视频小说图片| 亚洲高清视频在线播放| 免费久久99精品国产自在现线| 播播国产欧美激情| 欧美a在线视频| 日本视频在线观看一区二区三区| 日韩午夜在线观看视频| 精品视频二区| 18一19gay欧美视频网站| 视频一区中文字幕精品| av动漫免费观看| 日韩高清一区在线| 国产全是老熟女太爽了| 亚洲成av人片一区二区| 亚洲成人一级片| 九九久久综合网站| 精品中文在线| 国产免费xxx| 国产一区不卡精品| 午夜剧场免费在线观看| 91麻豆精品国产91久久久久久| 69av在线| 国产日韩中文字幕| 欧美超碰在线| 99九九99九九九99九他书对| 中文字幕一区二区三区在线观看 | 免费在线国产| 热久久免费视频精品| 亚洲精品亚洲人成在线| 免费在线激情视频| 国产亚洲精品7777| 中文字幕+乱码+中文字幕明步 | 在线你懂的视频| av成人在线电影| 亚洲美女黄网| 欧美做受xxxxxⅹ性视频| 欧美亚洲综合在线| 激情影院在线观看| 国产精品播放| 国产欧美午夜| 蜜桃av.com| 91精品国产高清一区二区三区蜜臀| 最新国产露脸在线观看| 国产精品久久精品视| 国产欧美精品| 成人在线手机视频| 欧美一区二区三区小说| 国产蜜臀在线| 日本免费一区二区三区| 蜜臂av日日欢夜夜爽一区| 国产成人综合在线视频| 精品久久人人做人人爰| 欧美gay视频| 一本一本a久久| 福利视频网站一区二区三区| 欧美一级特黄视频| 色视频www在线播放国产成人| 老司机亚洲精品一区二区| 久久国产亚洲精品无码| 中文字幕乱码日本亚洲一区二区 | 亚洲一区免费看| 国产成人综合亚洲网站| 国产综合精品视频| 日韩在线免费av| 国产精品videossex| 成年人在线看片| 一区二区三区视频在线观看| 香蕉国产在线视频| 成人亚洲激情网| 欧美专区在线| 男人的天堂久久久| 亚洲欧洲一区二区三区久久| 精品国产欧美| 激情内射人妻1区2区3区 | 成人不卡免费av| 亚洲第一区av|