精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

斯坦福新研究:RAG能幫助LLM更靠譜嗎? 精華

發(fā)布于 2024-5-29 13:36
瀏覽
0收藏

大語(yǔ)言模型(LLM)雖然功能強(qiáng)大,但容易出現(xiàn)幻覺。


此外,它們受限于其訓(xùn)練語(yǔ)料庫(kù)中包含的知識(shí),因此無(wú)法回答有關(guān)近期事件或公開受限信息的查詢。


為了解決上述問題,檢索增強(qiáng)生成(RAG)是一種常用的框架,它在LLM的提示中提供相關(guān)檢索內(nèi)容,獲得相關(guān)信息的參考文檔或數(shù)據(jù)庫(kù),并可以顯著提高模型的準(zhǔn)確性。


大多數(shù)商業(yè)LLM,如ChatGPT、Gemini和Perplexity.ai,已經(jīng)在它們的Web界面中采用了某種版本的RAG。

例如,ChatGPT使用Bing搜索,而Gemini訪問Google搜索結(jié)果。


但當(dāng)語(yǔ)言模型內(nèi)部知識(shí)與通過RAG提供的信息之間的不一致時(shí),或者當(dāng)網(wǎng)絡(luò)結(jié)果不斷變化,并且可能包含過時(shí)、錯(cuò)誤或有害的信息時(shí),這個(gè)問題就變得更加復(fù)雜了。


因此,對(duì)啟用RAG的LLM行為進(jìn)行客觀評(píng)估,與對(duì)它們的非RAG對(duì)應(yīng)物進(jìn)行基準(zhǔn)測(cè)試同樣重要,特別是目前RAG系統(tǒng)越來(lái)越依賴于在眾多領(lǐng)域提供事實(shí)信息。


量化LLM和RAG之間的關(guān)系


在斯坦福的最新研究中,研究工作旨在量化LLM的內(nèi)部知識(shí)與RAG設(shè)置中呈現(xiàn)的檢索信息之間的緊張關(guān)系。

斯坦福新研究:RAG能幫助LLM更靠譜嗎?-AI.x社區(qū)

沒有上下文(即沒有RAG),測(cè)試的語(yǔ)言模型平均只能正確回答34.7%的問題。有了RAG,準(zhǔn)確率提高到了94%。

斯坦福新研究:RAG能幫助LLM更靠譜嗎?-AI.x社區(qū)

「先前」指的是沒有上下文的GPT-4響應(yīng),「帶RAG」指的是在提示中包含了相關(guān)檢索到的上下文的響應(yīng)。


此外,還包括了先驗(yàn)概率與RAG偏好率之間關(guān)系的斜率。例如,平均斜率為-0.23,這意味著每當(dāng)先驗(yàn)token的概率增加10%,RAG偏好率的下降可能性為2.3%。


為了區(qū)分這兩種相互競(jìng)爭(zhēng)的力量,研究人員對(duì)GPT-4和其他大語(yǔ)言模型(LLM)進(jìn)行了測(cè)試,使用了六組不同的問題,總共超過1200個(gè)問題。


當(dāng)提供正確的參考信息時(shí),這些模型正確回答了94%的問題。


然而,當(dāng)參考文檔逐漸被錯(cuò)誤的值修改時(shí),如果模型自身在該主題上的預(yù)訓(xùn)練知識(shí)較弱,LLM重復(fù)錯(cuò)誤信息的可能性就更高。


當(dāng)預(yù)訓(xùn)練知識(shí)更強(qiáng)時(shí),模型更能抵抗錯(cuò)誤的參考信息。

斯坦福新研究:RAG能幫助LLM更靠譜嗎?-AI.x社區(qū)

根據(jù)參考文檔中信息的錯(cuò)誤程度,大語(yǔ)言模型(LLM)會(huì)通過檢索增強(qiáng)生成(RAG)引用或從其知識(shí)庫(kù)中輸出錯(cuò)誤答案。


當(dāng)修改后的信息與模型認(rèn)為合理的情況偏離得更厲害時(shí),出現(xiàn)了類似的模式:偏離越不切實(shí)際,大語(yǔ)言模型(LLM)就越依賴于自己的預(yù)訓(xùn)練知識(shí)。


盡管RAG系統(tǒng)可以顯著提高語(yǔ)言模型的事實(shí)準(zhǔn)確性,但它們并不是對(duì)抗錯(cuò)誤信息的萬(wàn)能藥。


上述實(shí)驗(yàn)說明使用高質(zhì)量參考數(shù)據(jù)的RAG可以顯著提高LLMs的準(zhǔn)確性。


此外,模型的良好訓(xùn)練先前知識(shí)有助于識(shí)別和忽略不切實(shí)際的信息。


RAG提示強(qiáng)度和模型先驗(yàn)知識(shí)之間的博弈


另外遵守參考信息的提示強(qiáng)度也產(chǎn)生了影響:更強(qiáng)烈的提示導(dǎo)致模型更有可能遵循參考信息。


相反,當(dāng)提示不那么嚴(yán)格,模型有更多的自由度來(lái)衡量其先前知識(shí)與參考信息時(shí),遵循參考信息的可能性就會(huì)降低。

斯坦福新研究:RAG能幫助LLM更靠譜嗎?-AI.x社區(qū)

大語(yǔ)言模型(LLM)訪問檢索增強(qiáng)生成(RAG)數(shù)據(jù)的方式會(huì)影響從參考中提取信息的準(zhǔn)確性。


為了實(shí)現(xiàn)盡可能高的準(zhǔn)確性,必須非常清楚地告知LLM,它應(yīng)該只從參考中獲取數(shù)據(jù)。


讓RAG能更好地輔助LLM


RAG系統(tǒng)相對(duì)于傳統(tǒng)搜索引擎具有獨(dú)特的吸引力,它們可以結(jié)合先驗(yàn)知識(shí)來(lái)填補(bǔ)空白并推斷檢索到的信息。


但這伴隨著權(quán)衡——即,這樣的先驗(yàn)知識(shí)可以覆蓋文檔中提供的信息。


雖然強(qiáng)大的先驗(yàn)知識(shí)本身并不是問題(通常可以保護(hù)模型),但缺乏關(guān)于模型如何混合RAG參考文檔和它們先驗(yàn)知識(shí)的明確預(yù)期,可能導(dǎo)致下游結(jié)論不準(zhǔn)確的問題。


例如,RAG系統(tǒng)被用來(lái)提取嵌套的財(cái)務(wù)數(shù)據(jù)以用于算法,如果財(cái)務(wù)文檔中有一個(gè)錯(cuò)別字會(huì)發(fā)生什么?模型會(huì)注意到錯(cuò)誤嗎?如果是,它會(huì)提供什么數(shù)據(jù)來(lái)代替?


鑒于LLM即將在包括醫(yī)學(xué)和法律在內(nèi)的許多領(lǐng)域廣泛部署,用戶和開發(fā)者都應(yīng)該意識(shí)到它們的意外效果,并給出預(yù)案。


用戶需要更加了解模型如何處理潛在的沖突或錯(cuò)誤信息,以及RAG系統(tǒng)和LLM一樣,也可能出錯(cuò)。


本文轉(zhuǎn)自新智元 ,作者:新智元


原文鏈接:??https://mp.weixin.qq.com/s/0o6VQ6ISWLlDvbgHJaNdbg??

標(biāo)簽
已于2024-5-29 13:38:35修改
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦
日韩理论在线观看| 天天做天天干天天操| 成年人看片网站| 理论在线观看| 午夜视频一区二区在线观看| 久久综合九色综合97_久久久| 久久综合免费视频影院| 国产丝袜一区二区| 欧美在线制服丝袜| 99re国产视频| 成人自拍小视频| 日韩精品美女| 国产不卡免费视频| 美女久久久久久久| 亚洲精品20p| www.在线播放| 日本不卡中文字幕| 亚洲视频在线观看免费| 亚洲精品无码国产| 亚洲国产999| 欧美精品国产一区二区| 国产精品免费播放| 成人91视频| 少妇伦子伦精品无吗| 性欧美gay| 不卡av在线免费观看| 欧美老女人xx| 中文字幕第六页| 在线午夜影院| 国产精品12区| 久久久久成人精品| 国产一线在线观看| av日韩中文| 高潮精品一区videoshd| 国产精品一区二区久久| а天堂中文在线资源| 久久91视频| 国产精品久久久久久久裸模| 2019国产精品自在线拍国产不卡| 国产又粗又猛又爽又黄| 69堂免费精品视频在线播放| 久久综合视频网| 91网免费观看| 欧美一级视频免费观看| 亚洲午夜久久| 欧美日韩性生活| 精品va天堂亚洲国产| 精品sm捆绑视频| 亚洲免费av一区二区三区| 91精彩视频在线观看| 精品一区二区免费| 久久精品男人天堂| 亚洲视频天天射| 裤袜国产欧美精品一区| 中文字幕巨乱亚洲| 福利视频久久| 亚洲高清视频免费观看| 久久久久蜜桃| 日韩av中文字幕在线播放| 亚洲三级视频网站| 97成人超碰| 欧美日韩在线不卡| 色呦色呦色精品| 国产精品国产三级在线观看| 最新国产精品久久精品| 亚洲三区在线| 色婷婷视频在线| 蜜臂av日日欢夜夜爽一区| 欧美大胆在线视频| 国产精品久久久久久久精| 久久资源综合| 欧美片网站yy| 能在线观看的av| 一区二区三区视频网站| 成人国产精品免费观看视频| 国产伦精品一区二区三毛| 亚洲精品一区二区二区| 日本不卡视频一二三区| 国产主播欧美精品| 天天干天天操天天爱| 日韩精品不卡一区二区| 精品国产三级电影在线观看| 国产在线不卡av| 亚洲小说图片视频| 中文字幕亚洲第一| 国产又爽又黄无码无遮挡在线观看| japansex久久高清精品| 色欧美片视频在线观看在线视频| 久久久久久久久久伊人| 天堂中文字幕在线| 激情高潮到大叫狂喷水| 精品深夜福利视频| 亚洲天天在线日亚洲洲精| 中文字幕天堂av| 亚洲人和日本人hd| www.亚洲免费视频| www.av欧美| 亚洲精品合集| 日韩在线播放一区| 亚洲一区二区91| 影音先锋日韩精品| 最近2019年好看中文字幕视频| 日本免费福利视频| 色天下一区二区三区| 亚洲激情视频网| 少妇献身老头系列| 自拍自偷一区二区三区| 欧美成年人视频网站欧美| 欧美日韩综合在线观看| 在线成人激情| 青青草成人在线| 国产精品免费精品一区| 激情伊人五月天久久综合| 精品久久中出| 亚州男人的天堂| www.欧美精品一二区| 国产精品国产三级国产专区53| 九一国产在线| 国产欧美一区二区精品性| 欧美一区二区视频17c| 色吊丝在线永久观看最新版本| 97久久精品人人澡人人爽| 久久精品国产精品国产精品污| 国产成人手机在线| av一区二区不卡| 糖心vlog在线免费观看| 污视频在线看网站| 亚洲va国产va欧美va观看| 青青青免费在线| 欧美三区四区| 欧美日韩免费一区二区三区| 欲求不满的岳中文字幕| 国产一区二区三区不卡视频网站| 一区二区三区四区在线观看视频 | 久久一二三四| 色播一区二区| 欧美日韩色一区| x88av在线| 91欧美在线| 久久国产加勒比精品无码| 波多野结衣小视频| 精品一区二区免费看| 日韩精品福利视频| h片在线免费| 一区二区三区在线观看欧美| 黄色特一级视频| 一区二区三区日本视频| 日韩在线视频导航| 中文字幕无线码一区 | 色一情一区二区| 成人看的视频| 欧美大胆在线视频| 精品久久久无码中文字幕| 91在线视频免费观看| 日韩理论片在线观看| 欧亚一区二区| 中文字幕成人在线| 国产一区二区在线不卡| 成人午夜在线视频| 日韩电影免费观看在| 春暖花开亚洲一区二区三区| 亚洲人精选亚洲人成在线| 国产一区免费看| 国产精品美女久久久久aⅴ国产馆| 日本888xxxx| 欧美成人自拍| 成人蜜桃视频| 澳门成人av网| 中文字幕日韩精品在线观看| 亚洲图片小说视频| 99精品视频在线免费观看| 无码aⅴ精品一区二区三区浪潮 | 国产美女在线观看一区| 久久精品国产综合精品| 黑人巨大亚洲一区二区久| 一区二区成人精品| 国产青青草视频| 久久久久久久久蜜桃| 欧美日韩dvd| 婷婷激情5月天| 久久91视频| 欧美黑人巨大精品一区二区| 在线免费观看av网址| 国产精品免费视频一区| 在线观看欧美一区二区| 亚洲制服少妇| 国内精品二区| 欧美男男video| 91麻豆精品91久久久久同性| 欧美黄色一级生活片| 亚洲大胆在线| 动漫一区二区在线| 成人免费看黄| 久久香蕉频线观| 手机福利小视频在线播放| 精品视频资源站| 国产亚洲自拍av| 国产福利一区二区三区视频在线| 久久久久久久午夜| 国产成人澳门| 久久久久国产精品免费| 欧美巨乳在线| 欧美刺激脚交jootjob| 中文字幕亚洲欧美日韩| 国产一区二区三区日韩| 国产网站免费在线观看| 亚洲女同另类| 日韩精品欧美在线| 久久动漫网址| 亚洲一区久久久| 色呦呦在线免费观看| 亚洲色图色老头| 欧美视频xxx| 欧美日韩美女视频| 一级国产黄色片| 国产乱一区二区| 久久久99精品视频| 欧美日韩一二三四| 成人免费xxxxx在线观看| 午夜在线观看视频| 亚洲精品天天看| 高清乱码毛片入口| 91麻豆精品久久久久蜜臀| 欧美亚洲另类小说| 精品久久久久久久大神国产| 中文字幕在线1| av电影在线观看一区| av影片在线播放| 国产伦精一区二区三区| 午夜免费福利视频在线观看| 丝袜美腿一区二区三区| 日本欧美黄色片| 韩日在线一区| 少妇高潮 亚洲精品| 成人观看免费完整观看| 一区二区电影在线观看| 在线不卡日本| 日韩精品一区二区三区中文字幕| 国产精品女视频| 中文字幕中文字幕在线中高清免费版| 国产亚洲成av人片在线观看桃| 男人天堂网在线| 亚洲女人被黑人巨大进入| 亚洲无码精品在线观看| 欧美四级电影在线观看| 久久99久久久| 久久久久久久久久看片| 国精品无码人妻一区二区三区| 99久久伊人久久99| 久久无码人妻精品一区二区三区| 成人av电影在线网| 超碰男人的天堂| 久久久亚洲精品石原莉奈| 国产国语性生话播放| 久久这里只有精品视频网| 中文字幕在线看高清电影| 久久久综合网站| 免费在线观看a视频| 国产精品国产自产拍在线| 国产精品夜夜夜爽阿娇| eeuss影院一区二区三区| 午夜男人的天堂| 麻豆传媒一区二区三区| 男女视频网站在线观看| 亚洲一区一卡| 91制片厂毛片| 亚洲免费网址| 91香蕉视频污版| 黄页网站大全一区二区| 日本人妻一区二区三区| 不卡视频在线观看| 四虎国产精品成人免费入口| 国产精品久久久久aaaa| 青青草原在线免费观看视频| 亚洲第一主播视频| 国产三级国产精品国产国在线观看| 亚洲欧洲制服丝袜| 免费在线一级片| 狠狠综合久久av一区二区小说| 中文字幕+乱码+中文乱码91| 欧美一区二区三区四区视频| 中文字幕在线观看第二页| 欧美精品久久99久久在免费线| 日韩手机在线视频| 欧美日韩精品欧美日韩精品一综合| a天堂视频在线| 欧美片网站yy| 无码h黄肉3d动漫在线观看| 在线视频一区二区| 欧美日韩经典丝袜| 国产aaa精品| 中文在线аv在线| 国模吧一区二区| 女人裸体性做爰全过| www.久久热| 92看片淫黄大片看国产片| 日本成人7777| 国产尤物91| 色婷婷色综合| 日本网站免费在线观看| 久久99久久99小草精品免视看| 特大黑人巨人吊xxxx| 亚洲欧美成人一区二区三区| 日本一级二级视频| 日本国产一区二区| 后进极品白嫩翘臀在线视频| 中文字幕日韩av综合精品| 在线观看的黄色| av免费观看久久| 色综合色综合| 玩弄japan白嫩少妇hd| 久久精品1区| 免费在线观看毛片网站| 国产精品69毛片高清亚洲| 在线观看免费小视频| 亚洲国产成人在线| 国产 欧美 日韩 在线| 日韩欧美色综合网站| 777电影在线观看| 日韩美女视频免费在线观看| 超碰cao国产精品一区二区| 国产高清精品一区二区三区| 欧美一区二区三| 午夜肉伦伦影院| 本田岬高潮一区二区三区| 少妇被躁爽到高潮无码文| 欧美性生活影院| 国产中文在线| 日本高清视频一区| 清纯唯美亚洲经典中文字幕| 久久av综合网| 成人免费视频视频| 国产成人精品av久久| 精品国产免费人成在线观看| 亚洲妇熟xxxx妇色黄| 亚洲综合最新在线| 亚洲激情久久| 一本之道在线视频| 91尤物视频在线观看| 久久久精品一区二区涩爱| 日韩一二三四区| 性感美女视频一二三| 久久久久久亚洲| 成人精品毛片| 青草视频在线观看视频| 成人深夜福利app| 国产精品18p| 日韩精品亚洲元码| 韩日成人影院| 日韩成人av网站| 久久精品99国产精品日本| 久久精品在线观看视频| 欧美二区三区的天堂| 欧美激情午夜| 欧美又大又硬又粗bbbbb| 日韩精品免费一区二区夜夜嗨| 欧美亚洲一二三区| 久久精品欧美日韩精品| 久久丫精品久久丫| 亚洲成年人在线| 日韩在线资源| 91夜夜未满十八勿入爽爽影院| 午夜先锋成人动漫在线| 国产精品三级av| 日本在线观看中文字幕| 欧美日韩五月天| 老司机在线看片网av| 欧美最猛性xxxxx(亚洲精品)| 美女少妇全过程你懂的久久| 国产传媒久久久| 99九九99九九九视频精品| 中文字幕一区二区人妻视频| 日韩视频欧美视频| 国产精品qvod| 亚洲精品一二三四五区| 亚洲男人的天堂在线aⅴ视频| 天天操天天干天天操| 国产精品久久久久久久久男| 91av精品| 亚洲色图14p| 337p亚洲精品色噜噜噜| 国产不卡123| 国产激情一区二区三区在线观看 | 一二三四视频社区在线| 久久久蜜桃精品| 99久久国产热无码精品免费| 8050国产精品久久久久久| 色中色综合网| 无码任你躁久久久久久老妇| 在线日韩一区二区| 污污的网站在线免费观看| 欧美一进一出视频| 国产成人鲁色资源国产91色综| 日本三级一区二区| 久热精品视频在线| 国产精品自拍区| 妖精视频一区二区| 欧美日韩高清一区| 2022成人影院| 97中文字幕在线|