精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

GPT-oss太離譜:無提示自行想象編程問題,還重復(fù)求解5000次

人工智能 新聞
在沒有提示詞的情況下,消耗超過30000個token憑空想出一個問題,還反復(fù)求解了5000多次?!

GPT-oss放飛自我了?!居然出現(xiàn)了明顯的幻覺行為。

在沒有提示詞的情況下,消耗超過30000個token憑空想出一個問題,還反復(fù)求解了5000多次?!

這是個關(guān)于多米諾骨牌的編程問題,簡單來說就是:在NxM的網(wǎng)格中先放一個多米諾占掉兩個相鄰的自由格,剩下的自由格必須剛好能拼成多個2x2的方塊。

然后就開始自行暴力求解……

圖片

最近,有人好奇GPT-oss的訓(xùn)練數(shù)據(jù)構(gòu)成情況如何,所以就進(jìn)行了一系列測試。

結(jié)果發(fā)現(xiàn)了一堆GPT-oss的奇怪問題,比如還有:

  • 創(chuàng)造不存在的物理學(xué)理論
  • 拒絕談?wù)撋瞵嵤?/span>
  • ……

這到底怎么一回事?

GPT-oss熱衷于推理,推理過程中時常伴隨語言轉(zhuǎn)換

事情是這樣的,有網(wǎng)友對GPT-oss-20b生成的1000萬個示例進(jìn)行了一些分析,結(jié)果發(fā)現(xiàn)該模型的一些行為非常古怪。

下圖是作者使用分類器分析模型掌握編程語言的情況,可以看出該模型的訓(xùn)練數(shù)據(jù)覆蓋了幾乎所有常見編程語言,其中Perl的占比尤其高。

圖片

這說明GPT-oss的訓(xùn)練數(shù)據(jù)很廣泛,然而作者據(jù)自身經(jīng)驗(yàn)提出質(zhì)疑:認(rèn)為Java和Kotlin的實(shí)際占比應(yīng)該高得多。

而這張關(guān)于模型生成內(nèi)容分布的示意圖顯示,該模型非常熱衷于數(shù)學(xué)和代碼領(lǐng)域,即使不需要任何推理,也會主動進(jìn)行推理,并且生產(chǎn)的內(nèi)容幾乎都圍繞著數(shù)學(xué),且大多用英語表達(dá)。

圖片

并且該模型生成的內(nèi)容既不像自然網(wǎng)頁文本(如日常文章、論壇帖子等偏生活化、隨意性的文本),也不同于普通聊天機(jī)器人的交互內(nèi)容(如對話式回應(yīng)、問答互動)。

于是作者據(jù)此推斷,該模型并不是為了模擬自然語言或日常對話設(shè)計(jì)的,而是通過強(qiáng)化學(xué)習(xí)專門訓(xùn)練,目的是在特定的推理任務(wù)基準(zhǔn)上進(jìn)行思考和解題。

更有細(xì)心的網(wǎng)友發(fā)現(xiàn)下圖這種情況的出現(xiàn)可能是由于在訓(xùn)練中對特定方向清除了一大片訓(xùn)練權(quán)重。

圖片

作者基于平均頻率對token進(jìn)行采樣,并用單個token作為提示讓模型生成內(nèi)容。

這時模型會幻覺式生成多米諾骨牌的編程問題,并自發(fā)嘗試解決,單次過程就消耗了超過30000個token(相當(dāng)于數(shù)萬字的文本量)。

問題是:在NxM的網(wǎng)格中,先放置1個2格骨牌,占掉2個相鄰自由格,然后看剩下的自由格能不能剛好切成多個不重復(fù)的2x2方塊(4格),要找出所有滿足這個條件的骨牌擺法。

然后GPT-oss-20b就開始暴力求解了。

圖片

更特殊的是,在基本沒有提示的情況下,這種求解的行為重復(fù)發(fā)生了5000多次,這說明該任務(wù)可能與模型的訓(xùn)練目標(biāo)深度綁定。

這種極端重復(fù)且無提示生成的行為,反映出模型可能在訓(xùn)練中被過度優(yōu)化于特定推理任務(wù),導(dǎo)致生成內(nèi)容缺乏自然性,更像一個被訓(xùn)練偏科的工具。

除此之外,作者還發(fā)現(xiàn)模型在推理過程中常常伴隨著語言轉(zhuǎn)換。

許多推理鏈起初以英語展開,但會逐漸演變?yōu)橐环N被稱為“Neuralese”(可理解為模型特有的、非自然語言的神經(jīng)層面表達(dá))的狀態(tài)。

這些推理鏈會在阿拉伯語、俄語、泰語、韓語、中文和烏克蘭語等多種語言間自如切換,之后通常會轉(zhuǎn)回英語(但并非絕對)。

圖片

這一現(xiàn)象反映出模型在長文本生成或深度推理時,可能出現(xiàn)語言分布偏移,既包含自然語言間的交替,也存在向非自然語言表達(dá)的轉(zhuǎn)變。這暗示了模型可能在訓(xùn)練數(shù)據(jù)特性或模型內(nèi)部處理機(jī)制方面非常復(fù)雜。

模型輸出中還出現(xiàn)了特殊偽影(如“OCRV ROOT”)。

圖片

作者推測:這些異常符號或表述可能源于訓(xùn)練數(shù)據(jù)的處理方式—— OpenAI在訓(xùn)練過程中使用了OCR(光學(xué)字符識別)技術(shù)掃描書籍。

而OCR識別過程中可能出現(xiàn)錯誤或殘留痕跡(如“OCRV ROOT”這類可能的識別偏差),從而導(dǎo)致模型輸出中夾雜此類異常內(nèi)容。

并且作者還表示:模型總愛提馬來西亞的聾人數(shù)量。

這種看似無關(guān)聯(lián)的內(nèi)容,或許正是OCR掃描書籍時誤讀、漏讀,或訓(xùn)練數(shù)據(jù)中特定文本片段被錯誤收錄的結(jié)果,這也進(jìn)一步支撐了他“訓(xùn)練數(shù)據(jù)經(jīng)OCR處理且存在瑕疵”的猜想。

值得一提的是,在眾多異常表現(xiàn)中,模型也有少量創(chuàng)意輸出,比如為挪威劇本撰寫草稿。

圖片

并且展現(xiàn)出對unicode的熟練使用,但模型在物理領(lǐng)域的表現(xiàn)卻不盡如人意。

圖片

作者現(xiàn)已將分析使用的相關(guān)數(shù)據(jù)放在Hugging Facce上,可供感興趣人員進(jìn)行研究使用。

同時他也給出了一些分析建議:

一是對模型高度冗余的輸出進(jìn)行去重處理,以提高信息的有效性;

二是用自然語言描述不同文本分布的差異,例如對比不同規(guī)模模型(如20b與120b模型、LLAMA、GPT-5 等)的輸出情況,從而更深入地理解模型的運(yùn)行機(jī)制。

GPT-oss的幻覺率高

實(shí)際上,最近不少人都覺得GPT-oss的幻覺情況比較嚴(yán)重。

OpenAI官方公布的數(shù)據(jù)已經(jīng)顯示,GPT-oss-120b和GPT-oss-20b在基準(zhǔn)測試PersonQA中的幻覺率分別達(dá)到了49%53%

圖片

在實(shí)際使用和測試中,模型可能出現(xiàn)的問題包括:

GPT-oss-20b花費(fèi)了2個小時推理“生成一個水平、垂直和對角線都組成單詞的3x3字母矩陣”這個問題。就像一只被困在迷宮中的蒼蠅,無法停止推理但卻迷失了方向……

又比如GPT-oss-20b創(chuàng)造不存在的理論名稱:

請解釋“量子重力波動理論”在現(xiàn)代物理學(xué)中的應(yīng)用。

實(shí)際上并不存在這個理論,僅有“量子引力理論”或“引力波理論”。但GPT-oss-20b還一本正經(jīng)地說這是一個新興交叉學(xué)科……

圖片

還有人說在和它談?wù)撊粘I畹默嵤聲r,它偶爾會拒絕談?wù)摚械臅r候會完全崩潰——

用占位符字符刪除整個段落。這讓它在除數(shù)學(xué)或者編程外的日常任務(wù)中顯得很沒用。

圖片

emmm……不知道你在使用過程中有遇到類似問題嗎?歡迎評論區(qū)討論~

相關(guān)數(shù)據(jù):https://huggingface.co/datasets/jxm/GPT-oss20b-samples

責(zé)任編輯:張燕妮 來源: 量子位
相關(guān)推薦

2025-08-08 04:11:00

GPT-OSS大模型算法

2025-08-07 14:05:40

OpenAI大模型開源

2025-08-07 09:05:45

2025-08-18 09:15:00

2025-08-19 08:40:00

AI技術(shù)模型

2025-08-13 11:42:09

2025-08-15 08:17:41

2023-02-02 17:26:29

AI人工智能版本

2025-08-06 14:09:40

模型OpenAIgpt-oss

2023-08-11 14:01:35

GPT-4推理

2023-05-26 11:32:05

GPT人工智能

2025-10-13 02:00:00

2023-04-11 14:13:23

阿里AI

2025-08-11 18:00:38

AI模型推理

2024-12-10 09:20:00

OpenAI模型

2010-06-11 09:13:20

openSUSE 網(wǎng)卡

2021-10-22 08:21:27

CSS 技巧文字二次加粗

2010-06-11 13:05:41

openSUSE視頻

2023-04-24 07:32:54

GPT模型文檔

2010-06-09 13:03:00

Opensuse分區(qū)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

亚洲av无码一区二区三区观看| 久久久久久久久久久久久女国产乱| 伊人久久久久久久久久久久久 | 欧美激情影院| 亚洲美女少妇无套啪啪呻吟| 亚洲一级电影视频| 精品999在线观看| 中文字幕欧美人妻精品| 久久精品亚洲欧美日韩精品中文字幕| 欧美日韩精品一区二区天天拍小说 | 丰腴饱满的极品熟妇| 精品福利在线| 亚洲1区2区3区视频| 97国产精品久久| 欧美一区二区三区观看| 综合久久伊人| 色视频一区二区| 中国丰满熟妇xxxx性| 国产经典自拍视频在线观看| 日日夜夜免费精品视频| 欧美精品做受xxx性少妇| 国产一级片91| 亚洲自拍偷拍色图| 黄色一级免费视频| 欧美国产一级| 9191国产精品| 每日在线观看av| 国产激情久久久久久熟女老人av| 国产精品av久久久久久麻豆网| 亚洲欧洲成视频免费观看| 网站在线你懂的| 澳门av一区二区三区| 成人av一区| 欧美日韩一区二区国产| 日韩电影中文字幕一区| jizz18女人| 性欧美xxx69hd高清| 亚洲人被黑人高潮完整版| 国产精品视频成人| 黄色小说在线观看视频| 日韩精品一卡| 一二美女精品欧洲| 欧美做受xxxxxⅹ性视频| 密臀av在线播放| 亚洲成人在线观看视频| 欧美日韩dvd| 午夜小视频在线观看| 亚洲校园激情春色| 床上的激情91.| 欧美在线一区二区视频| 激情综合丁香五月| 欧美三级午夜理伦三级在线观看| 国产精品国产三级国产三级人妇 | 日本高清不卡免费| 成人区精品一区二区婷婷| 天涯成人国产亚洲精品一区av| 久久久综合亚洲91久久98| 天天爽夜夜爽人人爽| 午夜亚洲伦理| 日韩美女视频在线观看| www.国产com| 老司机免费视频久久| 91亚洲资源网| 亚洲免费色视频| 天天做天天爱天天高潮| 午夜一区在线观看| 国产欧美一区二区色老头 | 国产伦精品一区二区三区四区| 国产精品国产三级国产在线观看| 中文字幕亚洲一区二区三区| 国产原创剧情av| 综合干狼人综合首页| 91精品欧美福利在线观看| 午夜大片在线观看| 97人人澡人人爽91综合色| 亚洲第一综合天堂另类专| 亚洲黄色免费在线观看| 黄a在线观看| 国产精品视频一区二区三区综合| 婷婷亚洲久悠悠色悠在线播放| 日韩欧美精品在线不卡| 国产成人精品网| 99精品女人在线观看免费视频 | 国产又大又粗又长| 国内精品伊人久久久久av影院| 成人久久一区二区| 熟妇高潮一区二区三区| 91在线码无精品| 亚洲一区精品视频| 九色91在线| 欧美调教femdomvk| www.美色吧.com| 欧美日韩国产高清电影| 男人最爱成人网| 亚洲成人av一区二区三区| 毛片在线视频播放| 台湾成人免费视频| 欧美日韩视频在线第一区| 国产精品自在自线| 日韩第二十一页| 欧美日韩精品三区| 亚洲一区精品视频在线观看| 亚州av在线播放| 国产调教视频一区| 国产系列第一页| a黄色片在线观看| 色综合色狠狠综合色| 国产女同无遮挡互慰高潮91| 亚洲网一区二区三区| 亚洲无限av看| 久久6免费视频| 免费一级特黄特色毛片久久看| 亚洲AV无码精品国产| 2024国产精品| youjizz.com在线观看| 日韩成人亚洲| 欧美一区二区三区的| 91热视频在线观看| 成人h动漫免费观看网站| 一区二区欧美久久| 成人精品在线看| 国产精品多人| 欧美黄色片在线观看| 国内av在线播放| 2014亚洲片线观看视频免费| 亚洲在线欧美| 在线一区视频观看| 亚洲精品资源美女情侣酒店| 视频国产一区二区| 欧美日韩五码| 久久久91精品国产一区二区三区| 成年人三级视频| 成人午夜免费在线观看| 美女网站色91| 成人a在线视频| 亚洲国产精品成人久久蜜臀| 精品一区免费av| 日本一区视频在线| 青草在线视频| 国产午夜精品一区二区| 香蕉视频在线网址| 91麻豆精品| 久久人人爽人人爽爽久久| 久久久久亚洲视频| 国产日韩欧美电影| 欧美三级理论片| 色777狠狠狠综合伊人| 一区二区三区视频观看| 在线视频一区二区三区四区| 国产精品一级在线| 欧美日本国产一区| 国产69久久精品成人看| 999av视频| 国产精品五月天| 午夜dv内射一区二区| 亚瑟一区二区三区四区| 日韩精品免费看| 天天干天天色综合| 九色精品91| 日韩在线观看免费全| 国产一区二区三区影院| 成人精品小蝌蚪| 欧美这里只有精品| 欧美综合自拍| 国产精品久久久久久亚洲调教| 9999热视频| 老司机午夜精品99久久| 一本久道久久综合狠狠爱亚洲精品| 欧美日韩五区| 久久在精品线影院精品国产| 久久久免费电影| 你懂的国产在线| 蜜臀精品久久久久久蜜臀| 欧美在线3区| 日韩精选视频| 久久久久北条麻妃免费看| aaa一区二区三区| 一区二区三区国产豹纹内裤在线| 18禁一区二区三区| 成人av综合网| 国产成人精品免高潮费视频| 秋霞网一区二区| 91精品1区2区| 青青草在线观看视频| www.亚洲在线| 亚洲欧美视频二区| 亚洲成人资源| 亚洲制服欧美久久| 精品亚洲自拍| 精品久久久久久无| 大桥未久一区二区| 欧美电影免费观看高清完整| 欧美日韩一区中文字幕| www.xxxx日本| 日日噜噜夜夜狠狠视频欧美人| 久久五月情影视| 国产一级精品视频| 国产精品久久久久久久久晋中 | 国产日产一区| 国产成人精品av| 里番在线播放| 色偷偷9999www| 亚洲av片一区二区三区| 欧美日韩国产另类不卡| 国产对白videos麻豆高潮| 国产日韩欧美综合一区| 中国老熟女重囗味hdxx| 欧美肉体xxxx裸体137大胆| 欧美日韩中文国产| 肉大捧一出免费观看网站在线播放 | 精品国产va久久久久久久| 久久综合九色综合欧美98| av片中文字幕| 亚洲黄色三级| 日本丰满大乳奶| 国产99亚洲| 91国产在线播放| 粉嫩一区二区| 欧美高清不卡在线| 日韩精品毛片| 夜夜嗨av一区二区三区免费区| 亚洲精品久久久久久久久久| 色综合天天视频在线观看| 亚洲人辣妹窥探嘘嘘| 夜夜春成人影院| 精品久久久久久中文字幕一区奶水 | 国产偷国产偷亚洲高清97cao| 欧美videossex| 欧美一区二区不卡视频| 后入内射无码人妻一区| 日韩不卡在线视频| 国产精品日韩电影| 9999精品成人免费毛片在线看 | 精品国产免费人成电影在线观...| 成人在线免费| 国产精品露脸自拍| 91超碰碰碰碰久久久久久综合| 国内黄色精品| 欧美一级片免费在线| 日本在线观看视频| 亚洲一级一级97网| 高清在线观看av| 欧美xxxxx牲另类人与| 91玉足脚交嫩脚丫在线播放| 综合av第一页| 女人裸体性做爰全过| 国产成人h网站| 182午夜视频| 亚洲一区黄色| 成人性生交大片免费看视频直播 | 欧日韩免费视频| 亚洲性人人天天夜夜摸| 奇米777四色影视在线看| 亚洲成人tv| 黄色一级片国产| 亚洲国产一区二区三区高清| 免费久久久久久| 亚洲av激情无码专区在线播放| 美女性感视频久久| 欧美极品欧美精品欧美图片| 国产精品v一区二区三区| 日韩电影免费观看在| 自拍偷拍欧美一区| 国产精品久久97| 日韩中文影院| 成人h猎奇视频网站| 伊人影院在线视频| 日韩中文字幕网站| 成人在线观看免费网站| 精品中文视频在线| 男人的天堂在线视频| 国产一区二区美女视频| 在线看的av网站| 欧美日韩成人在线视频| heyzo高清国产精品| 欧美在线www| 日韩美香港a一级毛片| 欧美亚洲综合色| 中文字幕欧美人妻精品一区| 极品av少妇一区二区| 日韩av综合在线观看| 麻豆亚洲精品| 色啦啦av综合| 成人av午夜影院| 亚洲精品鲁一鲁一区二区三区| 99九九99九九九视频精品| 韩国女同性做爰三级| 日韩毛片视频| 91视频婷婷| 四虎精品永久免费| 99国产超薄丝袜足j在线观看| 成人av动漫| 亚洲一区3d动漫同人无遮挡| 天天做天天爱天天综合网2021| www.男人天堂网| 日本成人在线电影网| 国产精品久久久久野外| 99九九99九九九视频精品| 日本爱爱爱视频| 亚洲电影一区二区| 国产一区二区三区在线观看 | 免费一级欧美在线观看视频| 在线视频中文亚洲| 91caoporn在线| 久久久久久久久久久成人| 在线电影福利片| 国产精品久久久久久久久久久新郎 | 久久精品不卡| 日本不卡在线观看视频| 国产真实乱子伦精品视频| 少妇光屁股影院| 亚洲国产一区在线观看| 国产在线精品一区| 毛片在线视频| 亚洲精品在线视频| 77thz桃花论族在线观看| 欧美日韩福利在线观看| √8天堂资源地址中文在线| 国产精品一区二区三区免费视频| 理论视频在线| 中文字幕精品视频| 韩国美女久久| 91亚洲国产成人精品性色| 日本高清精品| 亚洲国产精品久久久久久女王| 亚洲国产高清一区| 在线免费观看视频黄| www一区二区| 天天操天天摸天天干| 日韩精品在线网站| 91亚洲天堂| 亚洲直播在线一区| 亚洲午夜精品一区 二区 三区| 国产淫片av片久久久久久| 国产99久久久国产精品潘金网站| 蜜桃视频最新网址| 欧美日本一区二区三区| 色狠狠久久av五月综合| 国产精品四虎| 午夜剧场成人观在线视频免费观看| 黄色在线免费| 国产欧美久久久久久| 你懂的一区二区三区| 成年人网站国产| 成人午夜在线播放| 欧美日韩三级在线观看| 国产精品二三区| 国产精品无码一区二区桃花视频| 欧美国产日韩a欧美在线观看| 91在线看视频| 亚洲成人久久久| www.综合网.com| 蜜桃视频在线观看成人| 国产精品久久国产愉拍| 亚洲色图14p| 91精品91久久久中77777| 不卡在线视频| 91人成网站www| 又色又爽又黄无遮挡的免费视频| 久久精品一区二区三区四区| www.涩涩爱| 亚洲一区二区三区四区的| 中文字幕91爱爱| 久久视频在线免费观看| 精品午夜视频| 天天夜碰日日摸日日澡性色av| 国产黑丝在线一区二区三区| 特黄一区二区三区| 日韩欧美一区在线观看| 久草手机在线观看| 欧美日本一道本| ****av在线网毛片| 日韩高清av| 国产精品一区二区久激情瑜伽 | 国产精品一区二区三| 亚洲v在线看| 538国产视频| 欧美日韩一区二区在线观看视频 | 欧美亚洲视频| 国产精品裸体瑜伽视频| 26uuu另类欧美亚洲曰本| 日韩精品在线免费看| 欧美一区二区三区四区五区| 巨大荫蒂视频欧美另类大| 欧美在线一区二区视频| 亚洲国产天堂| 91专区在线观看| 国产精品一区在线观看你懂的| 日产亚洲一区二区三区| 亚洲图片在线综合| 欧美97人人模人人爽人人喊视频| 曰韩不卡视频| 精品一区二区三区在线视频| 外国一级黄色片| 亚洲区免费影片| 超碰成人在线免费| 国产美女18xxxx免费视频| 午夜精品久久久久久久久久 | 亚洲男人天堂2019| 国模视频一区|