精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Percy Liang等人新研究:新必應等生成式搜索引擎可能沒那么好用

人工智能 新聞
斯坦福大學 Percy Liang 等人的一項測試表明,新必應等生成式搜索引擎很多時候都沒有那么靠譜:在它們生成的句子中,僅有 51.5% 的句子有引文支持,僅 74.5% 的引文支持相關句子。

生成式搜索引擎通過直接生成對輸入查詢的回應以及在線引用來滿足用戶的信息需求(如下圖 1)。現有的生成式搜索引擎正在迅速獲得用戶,微軟報告說 "大約三分之一的每日預覽用戶每天都在使用 Bing 聊天",Bing 聊天在其公開預覽的第一個月提供了 4500 萬次聊天。


圖片

生成式搜索引擎有可能改變人們在網上尋找信息的方式,但目前基于大語言模型的生成式搜索引擎生成的回復可能并不是準確的。但是鑒于它們的潛力和快速廣泛的應用,評估這些系統并更好地了解其潛在的局限性是至關重要的。

生成式搜索引擎一個值得信賴的先決條件是其可驗證性,每個生成的關于外部世界的描述都應該得到一組相關聯引用的充分支持,而且每個引文都應該支持根據其生成的相關描述。可驗證性使讀者能夠輕松地檢查任何生成的描述是否得到其引用來源的支持。

研究者通過人工評估來審核四個流行的商業生成式搜索引擎(Bing Chat、NeevaAI、perplexity.ai 和 YouChat),讓它們完成一組信息查找任務(例如,來自 NaturalQuestions 的各種類型的歷史谷歌用戶查詢,來自 Reddit 的動態收集的開放式問題;例子見表 1)。


圖片

對于每個查詢 - 回答對,研究者以人工評價來衡量下面幾種維度:

1. 流暢性(生成的文本是否流暢和連貫);

2. 感知效用(生成的回應是否對查詢有幫助,信息量是否充足);

3. 引文召回率(生成的關于外部世界的陳述中,完全由其引文支持的比例);

4. 引文精確度(生成的支持其相關陳述的引文比例)。

一個值得信賴的生成式搜索引擎應該達到較高的引文召回率和精確度,表明其生成的引文是全面的(每個生成的描述都有引文的充分支持)和正確的(每個引文都支持其相關描述)。

研究人員發現,現有的生成式搜索引擎響應通常具有很高的流暢性以及明顯的感知效用,但經常回復無支持的陳述或包含不準確的引用(低引用召回率和精確度)。平均來說,在生成句子中僅有 51.5% 有完整的引文支持(引文召回率),只有 74.5% 的引文支持其相關句子(引文精確率)。

此外,引文召回率和精確度與流暢性和感知效用成反比 —— 看起來更有幫助的回應往往是那些沒有支持的描述或包含不準確的引文的回應。這種可信度的表象增加了現有生成式搜索引擎誤導用戶的可能性。在圖 1 的例子中,一個對詹姆斯 - 韋伯太空望遠鏡沒有什么背景知識的用戶很可能很難識別生成的回復中并沒有支持它的描述。

研究者假設這種逆向關聯的發生是因為一些生成式搜索引擎經常復制或改寫它們引用的網頁。雖然這樣的系統取得了較高的引用召回率和精確度,但是一些復制的語句可能與用戶的問題或生成的回復的其余部分無關,導致回復的流暢性和感知效用指標下降。

對流暢性、感知效用和可驗證性的人工評價

衡量流暢性和感知效用

為了測量響應的流暢性,研究人員向標注人員展示了用戶查詢、生成的回應并聲稱 "這些回應是流暢的、連貫的"。他們還要求標注人員在從 "非常不同意" 到 "非常同意" 的五點李克特量表上評定他們對該回應的認可程度。使用類似的過程來衡量感知效用,要求測試者評估他們對 “響應是對查詢的有用且信息豐富的回答” 這一說法的同意程度。

計算引文召回率

引文召回率是指完全被相關引文所支持的、值得驗證的陳述的比例(見下圖 2 的例子)。因此,計算引文召回率需要:

(1)確定回復中值得驗證的陳述;

(2)評估每個值得驗證的陳述是否有其相關引文的充分支持。


圖片

計算引用精確率

引用精確率是指在生成的所有引文中支持其相關陳述的比例(見圖 2 中的例子)。與召回率不同,引文精確率的概念在于獎勵系統準確引用的能力。如果一個生成的陳述引用了互聯網上的每個網頁,那么引文召回率可能會很高,但是引文精確率會很低(因為很多文章是不相關的,不支持其相關的陳述)。為了衡量回應 r 的引用精確率,研究者們給標注人員判斷每個引用 c_i,k 是否支持其相關陳述 s_i 提供了以下三個標準(例子見圖 1 中引用的網頁):

  • 完全支持:陳述中的所有信息都得到了引文的支持。
  • 部分支持:陳述中的一些信息得到了引文的支持,但其他部分沒有得到支持(例如,缺失或矛盾)。
  • 沒有支持:引文不支持陳述的任何部分(例如,引用的網頁完全不相關或矛盾)。

結果和分析

流暢性和感知效用

幾個生成式搜索引擎生成的回復看起來是流暢的并且很有幫助。下表 3 顯示了這些搜索引擎對每個查詢分布的回復的流暢性。


圖片

表 4 展示了它們的感知效用。


圖片

引文召回率和精確度

表 5 是生成性搜索引擎在所評估的查詢分布中的引文召回率的相關數據。

圖片

下表 6 是搜索引擎在所評估的查詢分布中關于引文精確率的實驗數據。


圖片

現有的生成式搜索引擎往往不能很正確地對引文進行引用。當對所有系統進行平均計算時,只有 51.5% 的生成語句得到了引文的完整的支持(召回率),只有 74.5% 的引文完全支持其相關語句(精確度)。雖然生成的回答往往顯得信息量大且有用,但研究人員認為這些結果對于已經擁有數百萬用戶并正在迅速成為回答用戶查詢的主要工具的系統來說是不能接受的。

比較不同生成式搜索引擎之間的引文召回率和精確度,它們的引文召回率和精確率有很大的不同。平均而言,perplexity.ai 實現了最高的平均召回率(68.7),而其他三者的成績分別是:NeevaAI(67.6)、Bing Chat(58.7)、YouChat(11.1)。

從精確率來比較,Bing Chat 實現了最高的精確率(89.5),其次是 perplexity.ai(72.7)、NeevaAI(72.0)和 YouChat(63.6)。

可以得出,召回率最高和最低的系統之間有近 58% 的差距(perplexity.ai vs. YouChat),而精確率最高和最低的系統之間的差距近 25%(Bing Chat vs. YouChat)。

比較搜索引擎之間的不同查詢分布的引文召回率。修改評價查詢分布似乎比改變引用精確率更能影響引用召回率。例如,有長答案的 NaturalQuestions 查詢與非 NaturalQuestions 查詢之間的引用召回率差距接近 11%(分別為 58.5 與 47.8)。同樣,有短答案的 NaturalQuestions 查詢和無短答案的 NaturalQuestions 查詢之間的引用召回率差距接近 10%(有短答案的查詢為 63.4,只有長答案的查詢為 53.6,沒有長或短答案的查詢為 53.4)。

研究者假設引文召回率是由檢索到的網頁的相關性驅動的。在沒有檢索到直接回答用戶查詢的證據的情況下,系統會產生沒有引文證明的陳述,從而導致較低的召回率。例如,當對開放式的 AllSouls 論文問題進行評估時,生成式搜索引擎的引文召回率很低(平均召回率為 44.3),因為這些查詢通常在互聯網上沒有可提取的答案。

比較不同查詢分布的引文精確率,有長答案的 NaturalQuestions 查詢的精確率高于非 NaturalQuestions 分布(76.1 vs. 72.3)。在考察單個查詢分布的結果時,當對帶有段落答案類型的 NaturalQuestions 查詢進行評估時,生成式搜索引擎的精確率最高(當存在短答案時,精確率為 81.5,當只存在長答案時,精確度為 78.7)。另一方面,當對 AllSouls 開放式論文問題(67.8)和 davinci-debate 查詢(70.3)進行系統評估時,引文精確率是最低的。在 NaturalQuestions 子分布之間進行比較,有短答案的查詢的平均系統精確率(77.4)高于只有長答案(74.8)或沒有長答案(73.5)的查詢。

為了總結人工評估結果,表 7 列出了被評估系統的平均引文 F_1。圖 3 顯示了平均感知效用與平均引用 F_1 的對比。

現有的搜索引擎系統在引文召回率、引文精確率和感知效用之間都做了不同的權衡。


圖片


圖片

引文召回率和精率與精確率流暢性和感知效用成反比

研究者通過實驗發現,在現有的生成式搜索引擎中,引文召回率和精確率與流暢性和感知效用成反比。計算引文召回率和精確率與流暢性和感知效用之間的皮爾遜相關系數,發現兩者呈強負相關,特別是精確率顯示出更強的趨勢(表 8)。

例如,Bing Chat 達到了最高的精確度,但其流暢度和感知效用卻最低。相比之下,YouChat 的召回率和精確度最低,但它的回答得到了最高的流暢性和感知效用評價。


圖片

生成式搜索引擎經常復制或輕微改寫被引用網頁的內容

下表 9 列出了生成的陳述和從支持的網頁中提取的證據之間的相似度指標,當搜索引擎做出的陳述完全或部分得到其引文的支持時,它們往往直接從其引用的文章中復制或改寫轉述。

圖片


責任編輯:張燕妮 來源: 機器之心
相關推薦

2013-11-07 16:49:09

微軟Bing必應

2013-01-07 10:32:46

平板搜索引擎機遇

2013-10-25 16:59:39

新搜狗搜索

2025-05-19 08:47:00

強化學習模型開源

2011-06-20 18:23:06

SEO

2021-09-18 10:31:29

Mozilla微軟Bing

2017-02-14 07:26:59

人工智能搜索引擎

2020-12-03 14:49:13

AI 技術 人工智能

2014-11-25 10:09:59

ElasticSear分布式搜索引擎Lucene

2022-08-15 14:56:30

搜索引擎分布式

2022-02-21 15:52:17

MozillaFirefox 98搜索引擎

2017-08-07 08:15:31

搜索引擎倒排

2020-03-20 10:14:49

搜索引擎倒排索引

2012-09-07 13:22:21

搜索搜狗

2022-10-08 09:13:18

搜索引擎?站

2009-09-21 16:59:04

搜索引擎

2010-04-20 11:43:46

2009-02-19 09:41:36

搜索引擎搜狐百度

2009-09-22 16:23:52

搜索引擎

2024-10-21 12:40:00

視頻生成模型
點贊
收藏

51CTO技術棧公眾號

免费观看黄色一级视频| 一二三四国产精品| 91超碰在线播放| 成人在线综合网| 久久久久九九九九| 人妻激情偷乱频一区二区三区| 色爱综合区网| 99精品久久免费看蜜臀剧情介绍| 欧美一级bbbbb性bbbb喷潮片| 成年人免费观看视频网站 | 日韩和的一区二在线| 国产精品欧美一区二区三区| 91手机视频在线观看| 亚洲激情视频一区| 猛男gaygay欧美视频| 欧美手机在线视频| 992tv快乐视频| 手机看片一区二区| 日本强好片久久久久久aaa| yw.139尤物在线精品视频| 亚洲女则毛耸耸bbw| 天堂网在线最新版www中文网| 国产精品―色哟哟| 国产精品一区二区三区在线观| 国产99久久久| 在线中文字幕第一区| 日韩精品福利网站| 成年人网站免费视频| 91激情在线| av激情综合网| 91丝袜美腿美女视频网站| 九九在线观看视频| 色棕色天天综合网| 日韩欧美在线一区二区三区| 人妻无码视频一区二区三区| 91视频在线观看| 东方欧美亚洲色图在线| 国产精品女人久久久久久| 四虎成人精品永久免费av| 欧美3p在线观看| 亚洲女人天堂成人av在线| 中文字幕第一页在线视频| 深夜成人在线| 亚洲一区av在线| 水蜜桃一区二区| 日韩在线观看视频一区二区三区| 久久成人久久爱| 欧美做爰性生交视频| www.日本高清视频| 一道在线中文一区二区三区| 日韩欧美国产三级电影视频| 超碰超碰在线观看| 三上悠亚国产精品一区二区三区| 亚洲成人精品在线观看| 国产日韩第一页| 91美女视频在线| 91女人视频在线观看| 成人欧美一区二区三区在线观看| 在线观看视频中文字幕| 久久国产精品亚洲77777| 欧美精品videofree1080p| 欧美做爰啪啪xxxⅹ性| 精品久久美女| 在线视频中文亚洲| 婷婷色一区二区三区| 亚洲v天堂v手机在线| 亚洲精品成人久久电影| 国产精品亚洲一区二区无码| 精品一区二区三区中文字幕视频| 欧美片网站yy| 污污动漫在线观看| 99re66热这里只有精品4| 一本色道久久综合亚洲91| 黄色国产一级视频| 国产探花在线观看| 亚洲综合男人的天堂| 无码人妻精品一区二区蜜桃百度| а√天堂8资源在线官网| 国产精品麻豆99久久久久久| 亚洲aⅴ天堂av在线电影软件| 嫩草精品影院| 久久精品夜色噜噜亚洲a∨ | 视频一区日韩精品| 欧美成人aa大片| 国产精品熟妇一区二区三区四区 | 成人网欧美在线视频| 国产精品永久久久久久久久久| 国产毛片精品视频| 不卡一区二区三区视频| 欧美熟妇另类久久久久久不卡| 不卡一区二区三区四区| 美女被啪啪一区二区| freemovies性欧美| 亚洲视频在线一区| 青草网在线观看| 香蕉久久aⅴ一区二区三区| 亚洲自拍偷拍综合| 人妻熟妇乱又伦精品视频| 欧美特黄aaaaaaaa大片| 欧美老女人第四色| 中文字幕在线播放一区二区| 欧美大胆视频| 国产一区二区三区在线观看网站| 美国精品一区二区| 国自产拍偷拍福利精品免费一| 91精品国产99久久久久久| 天天干,天天干| 国产毛片精品一区| 欧美裸体网站| 麻豆视频在线观看免费| 亚洲电影中文字幕在线观看| 蜜臀久久99精品久久久酒店新书| av国产精品| 精品亚洲夜色av98在线观看| 99久久久无码国产精品性| 亚洲精彩视频| 日本一本a高清免费不卡| 亚洲最新av网站| a在线欧美一区| 亚洲一区二区三区涩| 国产盗摄精品一区二区酒店| 日本韩国欧美一区| 女人扒开双腿让男人捅 | 欧美一级欧美三级| 美国黄色a级片| 91av精品| 国产精品18久久久久久麻辣| 丰满人妻一区二区三区无码av| 久久久久久久久久看片| 国产亚洲精品久久久久久久| 欧美一区久久久| 日韩精品一区二区三区在线 | 亚洲自拍电影| 欧美日韩国产va另类| 波多野结衣不卡| 成人av在线播放网址| 亚洲综合第一| 日韩电影免费观看高清完整版| 欧美日韩综合不卡| 少妇户外露出[11p]| 欧美黄在线观看| 成人免费网站在线| 久久米奇亚洲| 欧美性xxxx18| 黄色免费视频网站| 欧美不卡在线| 成人精品一区二区三区电影免费| 黄色毛片在线看| 黑人狂躁日本妞一区二区三区| 手机在线观看日韩av| 日本欧美肥老太交大片| 日本精品性网站在线观看| 日韩一级片免费在线观看| 亚洲黄色小视频| 亚洲无在线观看| 成人影院天天5g天天爽无毒影院| 日本欧美一二三区| 日韩在线视频观看免费| 亚洲欧美另类久久久精品| 日本中文字幕观看| 久久中文字幕av| 国产免费一区视频观看免费| 成人在线免费视频| 在线一区二区三区四区五区 | 欧美另类精品xxxx孕妇| 国产精品国产一区二区三区四区| 中文av一区特黄| 亚洲这里只有精品| 欧洲福利电影| 国产精品福利在线| eeuss影院www在线播放| 欧洲亚洲国产日韩| 无码人妻精品一区二区中文| 久久精品男女| 亚洲高清视频在线观看| 五月激情久久| 综合国产在线视频| 中文字幕乱码一区二区| 亚洲色图欧美偷拍| 欧美一区二区三区影院| 禁久久精品乱码| 精品日产一区2区三区黄免费 | 日韩亚洲欧美中文在线| 波多野结衣一区二区在线| 欧美韩日一区二区三区四区| 一本岛在线视频| 88国产精品视频一区二区三区| 91免费看片网站| 国产99re66在线视频| 日韩情涩欧美日韩视频| 天堂资源在线播放| 99视频在线观看一区三区| 亚洲国产精品久久久久婷蜜芽| 亚欧洲精品视频在线观看| 国产精品69av| 91se在线| 精品国产麻豆免费人成网站| 草久视频在线观看| 国产清纯美女被跳蛋高潮一区二区久久w| 日本人69视频| 午夜在线精品| 成人在线免费观看视频网站| 日本久久一二三四| 精品视频一区二区三区四区| **日韩最新| 国产成人在线亚洲欧美| 天堂va在线| 中文字幕亚洲无线码a| 特黄视频在线观看| 欧美老人xxxx18| 一级特黄免费视频| 激情久久av一区av二区av三区| 色欲人妻综合网| 国产精品亲子乱子伦xxxx裸| 泷泽萝拉在线播放| 高清国产一区二区| 天天干天天色天天干| 老司机精品视频网站| 日韩成人三级视频| 亚洲一区二区三区| 亚洲在线观看一区| av一区二区高清| 久久综合福利| 黑人久久a级毛片免费观看| 91精品国产综合久久香蕉922| 欧美大片免费高清观看| 97香蕉超级碰碰久久免费软件| 色呦呦在线免费观看| 久久精品成人动漫| 91在线视频免费看| 中文字幕日韩电影| 国产69久久| 亚洲人成啪啪网站| 九色网友自拍视频手机在线| 亚洲国产精品中文| 欧美自拍第一页| 亚洲精品在线观看视频| 黄色www视频| 亚洲国产精品大全| 蜜桃在线一区二区| 亚洲精品一区二区三区福利| 男人天堂综合网| 欧美成人一区二区三区片免费 | 一本一本久久a久久精品综合妖精| 国产欧美日韩在线一区二区 | 国产精品麻豆入口| 成人午夜私人影院| 偷偷色噜狠狠狠狠的777米奇| 粉嫩13p一区二区三区| 色哟哟网站在线观看| 成人av午夜电影| 久久亚洲AV成人无码国产野外| 99国产精品久久久久久久久久久| 91av在线免费| 久久久精品日韩欧美| 欧美午夜激情影院| 综合av第一页| 精品无码人妻一区二区三区品| 亚洲国产精品一区二区久久恐怖片| 国产在线观看免费视频今夜| 亚洲国产综合91精品麻豆| 国产午夜福利片| 欧美午夜电影在线| 中文天堂在线播放| 欧美日韩成人在线| 亚洲AV无码国产精品午夜字幕| 亚洲护士老师的毛茸茸最新章节 | 伊人久久大香线蕉av超碰| 国产精品.com| 亚洲人成网www| 亚洲精品一区二区三区蜜桃久| 婷婷综合五月| 国产欧美日韩网站| 日日噜噜夜夜狠狠视频欧美人| 亚洲精品久久久久久宅男| 国产乱码精品一区二区三区忘忧草| 国产av一区二区三区传媒| 91天堂素人约啪| www.黄色在线| 亚洲精品美腿丝袜| 国产成人无码一区二区在线播放| 欧美日韩亚洲国产综合| 亚洲乱码在线观看| 亚洲精品视频播放| 老司机在线永久免费观看| 久久久伊人日本| 91看片一区| 国产精品一区二区免费| 国际精品欧美精品| 日韩人妻无码精品久久久不卡| 久久精品官网| 中文字幕在线观看视频www| 91视频免费观看| 波多野结衣爱爱视频| 色偷偷久久一区二区三区| 国产乱人乱偷精品视频| 亚洲欧美制服另类日韩| gogo在线高清视频| 日本午夜精品理论片a级appf发布| 国产一区二区三区亚洲综合| 女同一区二区| 亚洲福利久久| 超碰人人草人人| 国产人伦精品一区二区| 国产午夜精品一区二区理论影院| 欧美精三区欧美精三区| 九色视频在线观看免费播放 | 日本欧美韩国| 国产嫩草一区二区三区在线观看| 欧美gay男男猛男无套| 久久成人免费观看| 粉嫩欧美一区二区三区高清影视| 黄色av免费播放| 欧美性极品少妇精品网站| 亚洲第一页综合| 久久精品国产成人精品| 91福利精品在线观看| 久久99精品久久久久久久青青日本| 女人香蕉久久**毛片精品| 一区二区三区 日韩| 91美女片黄在线观看91美女| 久久精品国产亚洲AV无码麻豆| 欧美精品国产精品| 1pondo在线播放免费| 日本一区二区不卡| 亚欧日韩另类中文欧美| 日本www在线视频| 成人精品国产免费网站| 丰满少妇高潮久久三区| 91.com视频| 黄色网址在线免费| 国产日韩精品在线播放| 成人精品亚洲| 男人女人黄一级| 国产欧美在线观看一区| 秋霞av一区二区三区| 精品亚洲男同gayvideo网站| 小早川怜子影音先锋在线观看| 国产一区二区三区四区五区在线| 黑丝一区二区| 精品熟女一区二区三区| 一区二区三区欧美久久| 精品国产无码AV| 久久99精品久久久久久噜噜| gogo大尺度成人免费视频| 伊人久久大香线蕉精品 | 亚洲麻豆一区二区三区| 亚洲福利国产精品| 日日夜夜精品免费| 国产91成人在在线播放| 亚洲第一论坛sis| 国产成人精品视频ⅴa片软件竹菊| 久久久国际精品| 在线观看国产黄| 日韩专区在线观看| 自拍偷拍欧美日韩| 久久这里只有精品18| 99在线精品视频| 国产成人无码专区| 日韩网站免费观看高清| 视频一区日韩| 久久久久久久久久久福利| 亚洲国产精品成人综合| 国产又大又长又粗| 欧美国产欧美亚洲国产日韩mv天天看完整| 一区二区在线视频观看| www.com毛片| 国产精品成人免费精品自在线观看 | 亚洲一区二区三区777| 国精品一区二区三区| 性欧美成人播放77777| 欧美专区亚洲专区| 亚洲综合影视| 精品一区二区三区国产| 日本午夜一本久久久综合| 日本黄色免费片| 亚洲国产精品久久久| 日韩视频网站在线观看| 国产女人18毛片| 91浏览器在线视频| 亚洲视频中文字幕在线观看| 欧美精品免费播放| 自拍亚洲一区| 奇米777在线| 欧美午夜久久久| caopeng在线| 欧美人与性禽动交精品| 黑人精品欧美一区二区蜜桃 | 久久久久久网| 日本福利片在线观看| 日韩国产高清视频在线| 99tv成人影院| 日本成人中文字幕在线| 亚洲精品免费电影| 大乳在线免费观看| 超碰97在线资源| 美国十次了思思久久精品导航| 18精品爽视频在线观看| 宅男66日本亚洲欧美视频| www.成人网|