精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

文字順序不影響GPT-4閱讀理解,別的大模型都不行

人工智能 新聞
原來是一個叫做Jon Rahm的人贏得了2023年美國大師賽(高爾夫)的故事。 并且,如果你直接就這段亂碼對GPT-4進行提問,它也能先理解再給出正確答案,一點兒也不影響閱讀。

研表究明,漢字序順并不定一影閱響讀(對于英文來說,則是每一個單詞中的字母順序)

現在,日本東京大學的一項實驗發現,這個“定理”居然也適合GPT-4。

比如面對這樣一段“鬼畫符”,幾乎里面每一個單詞的每一個字母都被打亂

oJn amRh wno het 2023 Meatsrs ermtnoTuna no duySan taatgsuAu ntaaNloi Gflo bClu, gnelcinhi ish ifsrt nereg ecatkjnad ncedos raecer jroam。

但GPT-4居然完美地恢復出了原始句子(紅框部分)

圖片

原來是一個叫做Jon Rahm的人贏得了2023年美國大師賽(高爾夫)的故事。 

并且,如果你直接就這段亂碼對GPT-4進行提問,它也能先理解再給出正確答案,一點兒也不影響閱讀:

圖片

對此,研究人員感到非常吃驚

按理說亂碼單詞會對模型的tokenization處理造成嚴重干擾,GPT-4居然和人類一樣不受影響,這有點違反直覺啊。

值得一提的是,這項實驗也測試了其他大模型,但它們全都挑戰失敗——有且僅有GPT-4成功。

具體怎么說?

文字順序不影響GPT-4閱讀

為了測試大模型抗文字錯亂干擾的能力,作者構建了一個專門的測試基準:Scrambled Bench。

它共包含兩類任務

一是加擾句子恢復(ScrRec),即測試大模型恢復亂序句子的能力。

它的量化指標包括一個叫做恢復率(RR)的東西,可以簡單理解為大模型恢復單詞的比例。

二是加擾問答(ScrQA),測量大模型在上下文材料中的單詞被打亂時正確理解并回答問題的能力。

由于每個模型本身的能力并不相同,我們不好直接用準確性來評估這一項任務,因此作者在此采用了一個叫做相對性能增益(RPG)的量化指標。

具體測試素材則選自三個數據庫

一個是RealtimeQA,它每周公布當前LLM不太可能知道的最新消息;

第二個是DREAM(Sun et al.,2019),一個基于對話的多項選擇閱讀綜合數據集;

最后是AQuARAT,一個需要多步推理才能解決的數學問題數據集。

對于每個數據集,作者從中挑出題目,并進行不同程度和類型的干擾,包括:
1、隨機加擾(RS),即對每一個句子,隨機選擇一定比例(20%、50%、100%)的單詞,對這些單詞中的所有字母進行打亂(數字不變)

2、保持每個單詞的第一個字母不變,剩下的隨意排列(KF)

3、保持每個單詞的首字母和最后一個字母不變,剩下的隨機打亂(KFL)

參與測試的模型有很多,文章正文主要報告了以下幾個:

text-davinci-003、GPT-3.5-turbo、GPT-4、Falcon-180b和Llama-2-70b。

首先來看不同干擾類型的影響。

如下圖所示:

在KFL設置中(即首尾字母不變),不管是加擾句子恢復還是加擾問答任務,模型之間的性能差距都不大。

然而,隨著干擾難度越來越高(變為KF和RS后),模型的性能都迎來顯著下降——除了GPT-4。

具體而言,在加擾句子恢復(ScrRec)任務中,GPT-4的恢復率始終高于95%,在加擾問答(ScrQA)任務中,GPT-4的相對準確性也都始終維在85%-90%左右。

相比之下,其他模型有的都掉到了不足20%。

圖片

其次是不同加擾率的影響。

如下圖所示,可以看到,在加擾句子恢復(ScrRec)任務中,隨著一個句子中被干擾的單詞數量越來越多,直至100%之后,只有GPT-3.5-turbo和GPT-4的性能沒有顯著變化,當然,GPT-4還是比GPT-3.5優先了很大一截。

圖片

而在加擾問答(ScrQA)任務中,隨著句子中被打亂的單詞數量越來越多,所有模型性能都出現了都顯著下降,且差距越來越大。

但在其中,GPT-4還能以87.8%的成績保持遙遙領先,并且下降幅度也是最輕微的。

所以簡單總結來說就是:

大多數模型都可以處理一定比例的干擾文本,但到極端程度時(比如單詞全部打亂),就只有GPT-4表現最好,只有GPT-4面對完全混亂的詞序,幾乎不怎么被影響。

GPT-4還擅長分詞

在文章最后,作者指出:

除了打亂單詞字母順序之外,還可以研究插入字母、替換字母等情況的影響。

唯一的問題是,由于GPT-4為閉源,大家也不好調查為什么GPT-4可以不被詞序影響。

有網友發現,除了本文所證明的情況,GPT-4也非常擅長將下面這一段完全連起來的英文:

UNDERNEATHTHEGAZEOFORIONSBELTWHERETHESEAOFTRA
NQUILITYMEETSTHEEDGEOFTWILIGHTLIESAHIDDENTROV
EOFWISDOMFORGOTTENBYMANYCOVETEDBYTHOSEINTHEKN
OWITHOLDSTHEKEYSTOUNTOLDPOWER

正確分隔開來:

Underneath the gaze of Orion’s belt, where the Sea of Tranquility meets the edge of twilight, lies a hidden trove of wisdom, forgotten by many, coveted by those in the know. It holds the keys to untold power.

按理來說,這種分詞操作是一件很麻煩的事兒,通常需要動態編程等操作。

GPT-4表現出來的能力再次讓這位網友感到驚訝。

他還把這段內容放進了OpenA官方的tokenizer工具,發現GPT-4看到的token其實是這樣的:

UNDER NE AT HT HE GA Z EOF OR ION SB EL TW HER ET HE SEA OF TRA

這里面除了“UNDER”、“SEA”和“OF”之外,幾乎剩下的所有token都看起來“毫無邏輯”,這更加使人費解了。

圖片

對此,大伙是怎么看的呢?

責任編輯:張燕妮 來源: 量子位
相關推薦

2023-06-21 13:37:41

模型研究

2023-07-04 14:01:26

GPT-4模型

2023-06-19 08:19:50

2023-12-26 08:17:23

微軟GPT-4

2023-06-05 12:32:48

模型論文

2025-04-16 09:35:03

2023-05-29 09:29:52

GPT-4語言模型

2023-04-09 16:17:05

ChatGPT人工智能

2025-05-30 07:40:56

2024-04-25 16:56:14

GPT-4大模型人工智能

2023-07-05 09:57:11

2023-09-19 13:48:31

AI數據

2023-09-11 15:57:16

人工智能模型GPT-4

2023-08-11 13:15:35

ChatGPTMBTIGPT-4

2023-06-08 08:09:43

2023-11-15 09:23:00

模型AI

2024-05-13 07:14:03

GPT-4生成式AIAI模型

2024-01-30 21:18:57

模型智能CMMLU

2024-01-16 12:31:13

OpenAIGLM-4大模型

2023-09-03 12:56:43

點贊
收藏

51CTO技術棧公眾號

无遮挡aaaaa大片免费看| 国产美女永久无遮挡| 探花国产精品一区二区| 国产精品久久久久久影院8一贰佰| 欧美美女网站色| 中文字幕在线中文| 香蕉视频免费看| 蜜臀久久久久久久| 久久久欧美精品| 亚洲自拍偷拍图| 亚洲精品aⅴ| 色综合天天性综合| 在线观看17c| 高h视频在线| 国产成人av一区二区三区在线观看| 18久久久久久| caoporn91| 九热爱视频精品视频| 欧美一级淫片007| 88av.com| a毛片不卡免费看片| 国产精品午夜电影| 国产综合 伊人色| 一区二区日韩在线观看| 亚洲免费影院| 色综合色综合网色综合| 成人无码av片在线观看| 久久99偷拍| 91超碰这里只有精品国产| 欧美日韩中文在线视频| 久久久久黄久久免费漫画| 国产精品色在线观看| 久精品国产欧美| www.久久久久久| 裸体一区二区三区| 国产a级全部精品| 国产真人真事毛片| 亚洲视频电影在线| 中文字幕自拍vr一区二区三区| 亚洲久久久久久| 中文无码日韩欧| 欧美日韩亚州综合| 日本xxxxxxx免费视频| 国产蜜臀在线| 一区二区三区精品| 免费观看国产视频在线| 色老头视频在线观看| 国产午夜精品美女毛片视频| 久久久久久99| 天堂在线免费av| 菠萝蜜视频在线观看一区| 99影视tv| 亚洲精品一区二区口爆| 国产一区二区免费看| 成人av在线亚洲| 国产精品久久久久久久久毛片| 日产国产高清一区二区三区 | 阿v免费在线观看| 久久综合色8888| 欧美h视频在线| 蜜桃成人在线视频| 国产三级精品在线| 亚洲国产午夜伦理片大全在线观看网站 | 国产国语老龄妇女a片| 韩国三级成人在线| 日韩午夜激情免费电影| 成人一区二区三区仙踪林| 日本免费精品| 日韩久久久久久| 最新版天堂资源在线| 精品国产一区二区三区成人影院| 亚洲第一色在线| 亚洲色图14p| 九九精品久久| 中文字幕日韩高清| 免费在线观看一级片| 国内久久视频| 欧亚精品中文字幕| 国产精品露脸视频| 韩国理伦片一区二区三区在线播放 | 久国产精品韩国三级视频| 91免费国产视频| 亚洲精品久久久狠狠狠爱| 成人av影院在线| 欧美午夜欧美| 久久亚洲天堂| 亚洲成人福利片| 少妇高清精品毛片在线视频| 欧美日韩女优| 日韩欧美视频在线| 国产在线观看无码免费视频| 日本网站免费在线观看| 国产精品熟女视频| 极品尤物av久久免费看| 成人午夜影院在线观看| 香港一级纯黄大片| 国产精品久久久久婷婷| 成人一级生活片| 欧美大胆性生话| 91精品婷婷国产综合久久性色| 性农村xxxxx小树林| 国产亚洲欧美日韩在线观看一区二区 | 中文字幕一区二区三区蜜月| 日韩一级特黄毛片| 日韩在线影院| 日韩精品一区二区三区蜜臀| 99久久人妻无码精品系列| 91精品秘密在线观看| 欧美在线激情网| 国产三级按摩推拿按摩| 国产丝袜美腿一区二区三区| 日本免费成人网| 777午夜精品电影免费看| 精品国产百合女同互慰| 日本二区三区视频| 午夜亚洲一区| 成人av免费看| 毛片在线播放a| 色婷婷综合在线| 亚洲美女在线播放| 亚洲色图二区| 国产精品一区二区电影| 香蕉视频黄在线观看| 一区二区三区四区乱视频| 冲田杏梨av在线| 婷婷综合一区| 97久久精品人人澡人人爽缅北| 国产毛片久久久久| 国产精品家庭影院| 亚洲男人天堂色| 天堂综合网久久| 久久久久久久一| 国产美女无遮挡永久免费| 久久久精品国产99久久精品芒果| 亚洲精品无码国产| 国产亚洲高清一区| 久久久精品在线观看| 这里只有久久精品视频| 久久久久青草大香线综合精品| 精品丰满人妻无套内射| 日韩三级av高清片| 九九九热精品免费视频观看网站| 一级黄色免费片| 日本一区二区在线不卡| 中文字幕国产传媒| 精品视频免费在线观看| 国产精品久久久久999| 男同在线观看| 色狠狠综合天天综合综合| 国产呦小j女精品视频| 欧美日韩一区二区高清| 成人动漫视频在线观看完整版 | 国产免费视频传媒| 欧美猛男男男激情videos| 欧美在线亚洲一区| 四虎在线观看| 一本大道久久a久久综合婷婷| 国产伦精品一区二区三区妓女| 国产欧美大片| 欧洲一区二区在线 | 一区二区三区网站| 亚洲精品免费网站| 美女精品导航| 亚洲精品国产精品乱码不99按摩 | 亚洲福利专区| 国偷自产av一区二区三区小尤奈| 99riav视频在线观看| 日韩经典中文字幕在线观看| 好吊妞视频一区二区三区| 久久久精品一品道一区| 午夜在线观看av| 天天射综合网视频| 丁香五月网久久综合| 天堂电影一区| 国产亚洲a∨片在线观看| 亚洲一二区视频| 亚洲日本成人在线观看| 亚洲黄色小说在线观看| 在线一区欧美| 亚洲 国产 日韩 综合一区| 成人免费黄色| 久久久久久午夜| 欧美白人做受xxxx视频| 欧美视频在线一区| 波多野结衣亚洲色图| 99久久99久久免费精品蜜臀| 国产一区亚洲二区三区| 亚洲一级毛片| 精品在线不卡| 欧美成人xxxx| 欧美激情久久久| 国产一二三区在线| 欧美一区二区三区免费观看视频 | 亚洲三级免费| 亚洲 日韩 国产第一区| 第一区第二区在线| 国产精品久久久久久久app| 污片在线免费观看| 亚洲天堂开心观看| 亚洲第一天堂在线观看| 色播五月激情综合网| 欧美国产日韩在线观看成人| 久久视频一区二区| 午夜免费福利网站| 天堂在线一区二区| www.成年人视频| 97在线精品| 欧美国产一区二区在线| 亚洲午夜精品| 国产精品一二三在线| 密臀av在线播放| 久久综合88中文色鬼| 九色视频在线播放| 亚洲成**性毛茸茸| 国产精品亚洲欧美在线播放| 欧美性xxxx极品hd满灌| 老女人性淫交视频| 国产精品美女久久久久久久久久久| 亚洲一级Av无码毛片久久精品| 蜜桃av噜噜一区| 97在线免费公开视频| 韩国亚洲精品| 欧美 日韩 国产 在线观看| 精品一区三区| 久久久久久久久久久久久久一区| 亚洲视频三区| 亚洲精品免费av| 先锋影音一区二区| 国产精品高潮视频| 校园春色亚洲| 午夜精品久久久久久久白皮肤| caoporm免费视频在线| 中文字幕欧美日韩精品| 岛国在线大片| 亚洲一区二区国产| 免费在线观看污视频| 日韩av在线看| 日韩一级片免费观看| 日韩午夜激情视频| 精品人妻无码一区二区| 91精品国产一区二区人妖| 伊人久久亚洲综合| 欧美日韩三级一区二区| 一级片在线免费播放| 91激情五月电影| 黄色污污网站在线观看| 色哦色哦哦色天天综合| 波多野结衣啪啪| 色综合欧美在线视频区| 无码人妻丰满熟妇区五十路 | 国产精品久久久久久免费| 欧美猛男超大videosgay| 91福利在线观看视频| 欧美欧美欧美欧美| 国产精品无码一区二区桃花视频 | 日韩av高清在线| 亚洲精品久久久久中文字幕欢迎你 | 一二三四国产精品| 国产欧美综合在线观看第十页| 国产精品成人一区二区三区电影毛片 | 国产精品一区二区女厕厕| 黄色成人小视频| 国产欧美日韩专区发布| gogo大尺度成人免费视频| 91美女片黄在线观看游戏| 亚洲1区在线观看| 国产精品手机在线| 亚洲美女15p| 日韩av影视| 97欧美在线视频| 免费看欧美一级片| 性色一区二区| 婷婷免费在线观看| 国产在线视频一区二区三区| 风韵丰满熟妇啪啪区老熟熟女| 成人av网址在线| 色无极影院亚洲| 国产精品久久网站| 九九精品在线观看视频| 欧美天堂在线观看| 久久影视中文字幕| 欧美一区二区三区成人| 亚洲 欧美 自拍偷拍| 最近2019好看的中文字幕免费| av网站在线看| 日本高清不卡的在线| 日韩美女在线| 国产一区免费| 91影院成人| av女优在线播放| 欧美aⅴ一区二区三区视频| 欧美国产在线一区| xnxx国产精品| www深夜成人a√在线| 亚洲va欧美va天堂v国产综合| 亚洲av无码不卡| 日韩区在线观看| 国产女主播在线直播| 九九热视频这里只有精品| 吞精囗交69激情欧美| 97人人干人人| 国产成人1区| 波多野结衣 作品| 日韩不卡免费视频| 精品人妻在线视频| 国产精品国产三级国产aⅴ原创| 日韩男人的天堂| 777午夜精品免费视频| 日韩福利一区二区| 欧美黑人一区二区三区| jizz久久久久久| 免费久久一级欧美特大黄| 一精品久久久| 亚洲少妇久久久| 91蜜桃免费观看视频| 少妇影院在线观看| 欧美日韩高清一区| 六十路在线观看| 久久久最新网址| 免费一级欧美片在线观看网站| 日韩中文字幕一区二区| 国产欧美在线| 精品伦一区二区三区| 最好看的中文字幕久久| 久久久久亚洲视频| 日韩经典一区二区三区| 国产偷倩在线播放| 91久久精品国产91久久性色tv| 色喇叭免费久久综合| 超碰97人人射妻| 99免费精品视频| 久久久久99精品| 日韩欧美色电影| 国产区在线观看| 91久久国产综合久久91精品网站| 激情综合网五月| 91av在线免费播放| 久久综合999| 国产精品第9页| 亚洲国产精品视频在线观看| 91精品国产黑色瑜伽裤| 成人18视频| 欧美精品福利| 色哟哟免费视频| 一区二区三区欧美视频| 99视频在线观看免费| 美女少妇精品视频| 国产日韩欧美中文在线| 看一级黄色录像| 国产麻豆精品一区二区| 亚洲一二三在线观看| 日韩一区二区三区四区五区六区| 精品176二区| 亚洲最大福利网| 亚洲视频观看| 中国极品少妇videossexhd| 五月激情丁香一区二区三区| 神宫寺奈绪一区二区三区| 69久久夜色精品国产69乱青草| 五月天亚洲色图| 欧美xxxxx在线视频| 欧美—级在线免费片| 亚洲天堂网视频| 欧美成人激情在线| www.国产精品一区| 日本wwww视频| 国产精品久久看| a网站在线观看| 国内精品视频一区| 视频小说一区二区| 91视频免费版污| 亚洲欧洲av在线| 亚洲大尺度视频| 青青草原成人在线视频| 国内精品久久久久久久影视简单 | 中文字幕日韩精品一区二区| 国产又黄又大久久| 国产无码精品视频| 亚洲欧洲免费视频| 国产亚洲高清一区| 国产乱子伦农村叉叉叉| 国产人妖乱国产精品人妖| 国产女18毛片多18精品| 国模吧一区二区三区| 国模精品一区| 日本一本在线视频| 欧美日韩在线观看视频| 在线视频1区2区| 成人激情av| 日韩综合小视频| 久久久精品视频免费观看| 精品偷拍一区二区三区在线看| 国产精品久久久久久吹潮| 久久久99精品视频| 久久久亚洲欧洲日产国码αv| 97人人爽人人爽人人爽| 国产91av在线| 天天天综合网| 久久久久久久久久久国产精品| 69av一区二区三区|