精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

OpenAI 開源模型 gpt-oss 是在合成數據上訓練的嗎?一些合理推測 原創

發布于 2025-8-21 16:07
瀏覽
0收藏

編者按: OpenAI?首次發布的開源大模型?gpt-oss?系列為何在基準測試中表現亮眼,卻在實際應用后發現不如預期?

我們今天為大家帶來的這篇文章,作者推測 OpenAI 的新開源模型本質上就是微軟 Phi 模型的翻版,采用了相同的合成數據訓練路線。

本文給出了支持這個推測的三個理由:首先,作者通過對比 Phi 模型系列的發展歷程,揭示了基于合成數據訓練的模型普遍存在“基準測試表現優異但實際應用效果不佳”的現象;其次,文章探討了 OpenAI 選擇這一技術路線的核心動機 —— 安全考量,指出大型組織發布開源模型時面臨的聲譽風險,以及合成數據在提升模型安全性方面的獨特優勢;最后,作者結合微軟前 GenAI 研究副總裁 Sebastien Bubeck 加入 OpenAI 這一人事變動,推測 gpt-oss 模型的技術基因很可能直接承襲自 Phi 系列。

本文系原作者觀點,Baihai IDP 僅進行編譯分享

作者 | Sean Goedecke

編譯 | 岳揚

OpenAI 不久前發布了其首個開源1大語言模型,名為 gpt-oss-120b 和 gpt-oss-20b。你可以在這里[1]與它們進行對話。這些模型好嗎?嗯,完全取決于你的需求。它們在某些基準測試[2]上表現優異(否則 OpenAI 根本不會發布),但在其他基準測試中卻表現得異常糟糕,比如 SimpleQA。

有些人非常喜歡這些模型[3],而推特上另一些人則完全不買賬[4-5]。據我觀察,這些模型技術上過硬,但缺乏大量領域外的知識:例如,它們擁有廣博的科學常識,卻對流行文化知之甚少。這些模型在實際應用中的價值還需六個月方能見分曉,但我預測這些模型最終會歸類于“在基準測試中的表現遠強于在真實任務中的表現”之列。

01 Phi 模型與在合成數據上訓練模型

2024 年,Sebastien Bubeck 領導了微軟開源模型系列 Phi 的開發2。這些模型的創新點在于完全采用合成數據進行訓練:不同于從書籍或互聯網中直接抓取的文本數據,而是使用其他語言模型生成的文本或經過人工精心編寫的教材內容。合成數據比常規數據獲取成本更高 —— 不是免費下載數 TB 數據就能解決,而是需要付費生成每個 token。這種方法的代價是必須為每個 token 的生成付費,優勢則是能完全掌控訓練數據的品質。 若完全用高質量的合成數據和人工編寫的數據訓練模型,結果會如何?

事實證明,這類模型在基準測試中表現會十分出色,但在實際應用中的表現卻令人失望。梳理業界對每代 Phi 模型的評價可發現一個相同的模式:驚艷的測試分數[6],高漲的市場熱情,但實際性能卻遠低于基準測試所顯示的水平[7]。

我認為之所以會出現這些驚艷的基準測試結果,是因為模型非常適合針對特定任務進行訓練 —— 畢竟大部分訓練數據由開發者自主生成。若采用合成數據訓練模型卻不生成與主流測試場景高度匹配的數據集,那可就太愚蠢了。但這種“應試訓練(teaching for the test)”必然導致其表現遜色于基于廣泛數據訓練的語言模型,并且這些模型也可能只是偶然在基準測試中表現良好。

為什么我要談論 Phi 模型?2024 年底,Sebastien Bubeck 離開微軟[8]加入 OpenAI。雖然 gpt-oss 模型的研發陣容尚未披露,模型卡片(model card)[9]也未詳述預訓練細節,但我確信 Sebastien Bubeck 參與了這個項目,且這些模型基于經過嚴格篩選或完全合成的數據集訓練而成。

02 合成數據更安全

為何 OpenAI 明知 Phi 式的模型在基準測試的表現優于實際應用中,還堅持要開發?原因很可能與微軟持續研發 Phi 系列模型相同:安全。 對大型組織而言,發布開源模型猶如在走鋼絲 —— 模型一旦公開,企業聲譽便與之永久綁定,成千上萬的研究人員會瘋狂地嘗試對其進行微調以移除安全防護措施(safety guardrails)。

雖然這一點鮮少被公開討論,但當前微調小型語言模型的主要需求的確是色情角色扮演(erotic role-play),且市場需求旺盛。任何本地部署模型的線上社群中,半數內容涉黃。

若發布一個常規的閉源模型并限制在自有基礎設施內運行,用戶便無法微調。即使出現一些問題,也能隨時更新模型。但開源模型一旦發布便永久失去控制。

使用合成數據(或教科書等高度可控的數據)訓練能大幅提升模型的安全性。開發者可以隨意生成大量“您要求執行 X 操作,但作為一個負責任的模型,我拒絕執行”的合規響應。只要訓練數據不包含顛覆性的或有害的內容,模型就不會習得此類行為(至少目標是如此)。

對 OpenAI 而言,開發一款 Phi 風格的模型用于開源發布想必極具吸引力。他們需要既能超越中國開源模型基準分數,又不會因行為失范而引發新丑聞的產品[10]。不同于 Meta,他們的開源模型無需真正出色,因為其核心業務始終在于閉源模型。

這正是我判斷 OpenAI 為新 gpt-oss 模型選擇合成數據路線的原因。無論結果如何,它們本質上就是披著 gpt 馬甲的 Phi-5 和 Phi-5-mini。


1 實為開放權重(open weight),而非開源,因為其模型權重可自由獲取,但訓練數據與代碼未公開。當然 OpenAI 曾發布 GPT-2 等開放權重模型,但此次才是首批真正意義上的開放權重模型。

2 我在微軟旗下 GitHub 從事 AI 研究工作,但對所述內容完全不知道內部情況。本文內容完全憑借公開信息撰寫。

END

本期互動內容 ??

?如果 GPT-OSS 是在合成數據上訓練的,那么它在基準測試和實際應用中表現差異這么大,你覺得是合成數據的局限性,還是測試標準本身有問題?

文中鏈接

[1]https://gpt-oss.com/

[2]https://cdn.openai.com/pdf/419b6906-9da6-406c-a19d-1bb078ac7637/oai_gpt-oss_model_card.pdf

[3]https://simonwillison.net/2025/Aug/5/gpt-oss/

[4]https://x.com/corbtt/status/1952868822891012241

[5]https://x.com/vikhyatk/status/1952863413845275132

[6]https://arxiv.org/abs/2404.14219

[7]https://news.ycombinator.com/item?id=40128351

[8]https://www.reuters.com/technology/microsofts-vp-genai-research-join-openai-2024-10-14/

[9]https://cdn.openai.com/pdf/419b6906-9da6-406c-a19d-1bb078ac7637/oai_gpt-oss_model_card.pdf

[10]https://www.seangoedecke.com/ai-sycophancy

本文經原作者授權,由 Baihai IDP 編譯。如需轉載譯文,請聯系獲取授權。

原文鏈接:

https://www.seangoedecke.com/gpt-oss-is-phi-5/

?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
標簽
收藏
回復
舉報
回復
相關推薦
欧美性猛交xxxx乱大交蜜桃| 久久综合九色综合97婷婷女人| 国产亚洲精品美女久久久| 美女喷白浆视频| 中文字幕免费高清电视剧网站在线观看| 成人一级视频在线观看| 日韩av免费在线看| 日韩一区二区三区四区在线| 欧美三级电影在线| 欧美日韩国产小视频| 日b视频免费观看| gogogo高清在线观看免费完整版| 国产精品一区二区在线观看网站| 45www国产精品网站| 四虎884aa成人精品| 欧美18免费视频| 欧美一区二区视频在线观看2020| 成人一级片网站| 污污网站在线观看| 国产精品久久午夜夜伦鲁鲁| 久久精品日产第一区二区三区乱码 | 四虎精品成人影院观看地址| 精品综合久久久久久8888| 欧美亚洲另类视频| 久久综合综合久久| 91精品在线观看国产| 亚洲日韩中文字幕| 色哟哟视频在线| 99精品女人在线观看免费视频| 欧美日韩另类视频| 免费人成自慰网站| 老司机在线看片网av| 国产欧美日韩三区| 免费一区二区三区| 视频污在线观看| 国产精品亚洲视频| 亚洲影视九九影院在线观看| 中文字幕免费在线看| 亚洲综合社区| 欧美一区二区影院| 日韩欧美一区二区一幕| 欧美日韩福利| 欧美日韩国产二区| 成人在线观看小视频| 99久久99热这里只有精品| 中文字幕日韩电影| 日本精品久久久久中文| 欧美美乳视频| 在线亚洲男人天堂| 亚洲最大成人综合网| 少妇一区二区视频| 亚洲日本成人女熟在线观看 | 国产精品嫩草影院精东| 蜜臀久久99精品久久久画质超高清 | 国产亚洲人成a一在线v站| 国产福利在线观看视频| 欧美男人操女人视频| 亚洲福利视频网站| 加勒比精品视频| 深爱激情久久| 日韩在线视频线视频免费网站| 变态另类ts人妖一区二区| 精品国产一区二区三区av片| 国产亚洲精品美女| 免费成人美女女在线观看| 久久精品青草| 欧美激情第三页| 日韩久久久久久久久| 夜夜精品视频| 国产精品国产三级国产专播精品人 | 精品一区电影国产| 欧美偷拍一区二区三区| 日韩国产一区二区三区| 久久国产精品视频| 久久久久久久久久久久久久免费看 | 国产精品欧美久久久久一区二区| 久久久一二三四| 欧美aaa免费| 欧美午夜精品久久久久久人妖| 国产精品无码av无码| 国产精品原创视频| 日韩免费福利电影在线观看| 国产 中文 字幕 日韩 在线| 精品国产91乱码一区二区三区四区 | 99视频网站| 午夜影院在线视频| 中文字幕欧美激情一区| 嫩草影院中文字幕| 久久电影tv| 91精品午夜视频| 国产精品无码一区二区三区免费 | 希岛爱理av免费一区二区| 中文字幕欧美国内| 国产真人真事毛片| 日产欧产美韩系列久久99| 91视频8mav| 日本v片在线免费观看| 国产精品久久久久久久久图文区| 欧美这里只有精品| 日本一道高清亚洲日美韩| 欧美一区二区三区不卡| 成人国产精品久久久网站| 在线中文一区| 国产精品久久久久影院日本 | 国产精品传媒麻豆hd| 欧美成人vps| 少妇视频一区二区| 麻豆精品91| 国产精品yjizz| 在线播放麻豆| 色综合久久综合网欧美综合网| 五月六月丁香婷婷| 精品国产精品久久一区免费式| 欧美国产日韩免费| 国产精品女人久久久| 国产欧美日韩视频在线观看| 国产 日韩 欧美在线| 亚洲国产aⅴ精品一区二区三区| 日韩黄色在线免费观看| 精品无码m3u8在线观看| 裸体在线国模精品偷拍| 欧美一级片免费观看| 国产三线在线| 欧美一二区视频| 四虎国产成人精品免费一女五男| 亚洲日本久久| 国产高清在线精品一区二区三区| 美女av在线播放| 欧美亚洲一区三区| 精品少妇一区二区三区免费观| 欧美久久99| 亚洲aaa激情| 国产福利视频在线| 欧美放荡的少妇| 久久精品在线观看视频| 美腿丝袜亚洲三区| 亚洲精品一区二区三区蜜桃久| 欧美特大特白屁股xxxx| 日韩精品免费在线播放| 福利一区二区三区四区| aaa国产一区| 你真棒插曲来救救我在线观看| 欧洲一区在线| 欧美成人免费在线视频| 国产福利第一页| 一区二区三区日韩欧美| 日本女人黄色片| 欧美成人午夜| 成人xxxxx色| 国产乱妇乱子在线播视频播放网站| 欧美妇女性影城| 四虎影视1304t| 极品销魂美女一区二区三区| 一区二区在线观看网站| 成人在线视频www| 欧美日韩国产va另类| 欧美一级免费片| 婷婷中文字幕一区三区| 好吊日免费视频| 丝瓜av网站精品一区二区| 亚洲国产日韩欧美| 国产精品久一| 欧美黑人极品猛少妇色xxxxx| 亚洲av无码一区二区三区dv| 亚洲国产精品自拍| www.色天使| 看电视剧不卡顿的网站| 国产精品久久成人免费观看| 久久亚洲精精品中文字幕| 久久久久久久久久久91| 日本天堂影院在线视频| 精品视频在线免费看| 麻豆明星ai换脸视频| 国产精品综合一区二区三区| 久久综合久久网| 国产成人影院| 成人免费看黄网站| 2019中文字幕在线电影免费| 日韩经典第一页| 亚洲视屏在线观看| 亚洲自拍偷拍综合| 国产成人无码精品久久二区三| 日本不卡在线视频| 中文字幕日韩精品无码内射| 国产在线播放精品| 国产www精品| 羞羞网站在线看| 日韩h在线观看| 一区二区精品视频在线观看| 亚洲国产中文字幕| 能直接看的av| av在线一区二区三区| 九九热免费精品视频| 国产精品mv在线观看| 欧美日韩一区在线视频| 免费精品一区二区三区在线观看| 97在线视频精品| 黄网站app在线观看| 亚洲精品丝袜日韩| 国产激情久久久久久熟女老人av| 欧美性猛xxx| 男女羞羞免费视频| 欧美国产激情二区三区| 国产香蕉精品视频| 另类小说视频一区二区| 少妇无码av无码专区在线观看| 希岛爱理av一区二区三区| 久久久久久久久久久久久久久久av| 亚洲网站免费| 国产精品igao视频| 超碰在线cao| 欧美成人在线影院| 午夜伦全在线观看| 亚洲欧美国内爽妇网| 少妇人妻精品一区二区三区| 正在播放亚洲一区| 真实新婚偷拍xxxxx| 精品露脸国产偷人在视频| 天天综合天天做| 国产精品麻豆一区二区| 成年人免费观看视频网站| 不卡一区二区在线| 一区二区在线免费观看视频| 久久精品国产精品亚洲红杏| 免费高清在线观看免费| 亚洲日本视频| 欧美日韩福利在线| 欧美精品色网| 黄色片免费在线观看视频| 99久久亚洲精品| 亚洲一区美女| 久久99视频| 欧美日韩一区在线视频| 国产成人三级| 日韩av高清| 精品一区二区三| 日韩欧美一区二区视频在线播放| 丝袜美腿一区二区三区动态图| 国产精品一区在线观看| 一级毛片精品毛片| 国产一区二区不卡视频| 国产成人精品福利| 国产一区二区三区无遮挡| 超碰97久久| 国产精品久久精品视| 大陆精大陆国产国语精品| 丁香婷婷久久久综合精品国产| www.成人网| 国产精品一区二区三区在线观| 噜噜噜狠狠夜夜躁精品仙踪林| 国产一区在线免费| 日韩精品丝袜美腿| 色姑娘综合网| 欧美电影免费| 看一级黄色录像| 狠狠入ady亚洲精品经典电影| 又大又硬又爽免费视频| 99精品视频网| 手机在线看福利| 韩国毛片一区二区三区| 无码国产精品久久一区免费| 丁香啪啪综合成人亚洲小说 | 国产99精品| 亚洲国产精品久久久久婷婷老年| 日韩精品久久久久久久电影99爱| 中文字幕免费在线不卡| 欧美日韩久久| 国产91美女视频| 日韩精品一卡二卡三卡四卡无卡| mm131国产精品| 国产福利91精品一区| 人妻在线日韩免费视频| 国产女人18水真多18精品一级做 | 亚洲3atv精品一区二区三区| 青青草免费观看视频| 欧美视频你懂的| 精品久久在线观看| 亚洲美女精品久久| 男人的天堂在线视频免费观看| 欧美激情精品久久久久| 黄色成人免费网| 91精品综合久久| 亚洲人成亚洲精品| 日本三级福利片| 国产精品免费看| 中文字幕资源在线观看| 91网站最新网址| 91麻豆精品成人一区二区| 亚洲成a人在线观看| 免费精品一区二区| 精品国产伦一区二区三区免费 | 久久精品影视大全| 国产91精品一区二区麻豆网站| 亚洲精品视频久久久| 亚洲免费在线电影| 日本黄色中文字幕| 精品国偷自产国产一区| 1区2区3区在线观看| 91精品国产网站| 久久wwww| 亚洲精品乱码视频| 国产一区二区三区久久久久久久久| 中文字幕资源在线观看| 国产亚洲精品7777| 香蕉视频一区二区| 777午夜精品视频在线播放| 神马精品久久| 久久久久久久久久av| 999精品视频在线观看| 蜜桃av久久久亚洲精品| 欧美日韩三区| 国内国产精品天干天干| 久久亚区不卡日本| 日本三级视频在线| 欧美一区二区三区系列电影| 高清性色生活片在线观看| 91av视频在线免费观看| 亚洲91网站| 欧美aaa在线观看| 毛片av一区二区三区| theav精尽人亡av| 亚洲成人免费av| 亚洲AV无码成人片在线观看| 色婷婷久久av| 日韩欧乱色一区二区三区在线 | 在线播放日本| 国产精品久久久久久久久久| 亚洲v天堂v手机在线| 欧美在线一区视频| 丁香激情综合国产| 精品99在线观看| 日韩视频永久免费| 日本中文字幕视频在线| 日本精品视频在线播放| 色老板在线视频一区二区| 国产欧美日韩小视频| 国产成a人亚洲精品| 全程偷拍露脸中年夫妇| 日韩一区二区不卡| 在线观看午夜av| 成人在线看片| 亚洲欧洲综合| 国产麻豆xxxvideo实拍| 午夜不卡av免费| 蜜桃免费在线| 国产精品av在线| 99国产精品一区二区| 亚洲男人天堂2021| 亚洲精品欧美激情| 亚洲欧美另类一区| 97在线视频国产| 国产精品一在线观看| 超碰超碰在线观看| 最新国产成人在线观看| 国产精品欧美久久久久天天影视| 久久精品国产亚洲7777| 麻豆一二三区精品蜜桃| 国产成人艳妇aa视频在线 | 日韩一二三四区| 久久五月精品中文字幕| 精品欧美国产| 日韩av网站在线观看| 女同久久另类69精品国产| 日韩欧美精品在线| 在线观看网站免费入口在线观看国内 | 国产精品19p| 午夜精品久久久久久久久久久| 亚洲欧洲国产综合| 国产精品久久久久久亚洲调教 | www.日韩高清| 97精品国产97久久久久久免费 | 国产中文字幕在线免费观看| 久久久久九九视频| 国产精品国产三级国产普通话对白| 欧美高清性猛交| 中文有码一区| 国产高清av片| 欧美午夜宅男影院在线观看| 91电影在线播放| 日本亚洲最大的色成网站www| 3d动漫精品啪啪一区二区竹菊| 国产在线视频网址| 成人做爽爽免费视频| 亚洲激情婷婷| 四虎国产成人精品免费一女五男| 日韩三级中文字幕| 怡红院成人在线| 欧美交换配乱吟粗大25p| 久久久综合网站| xxxwww在线观看| 国产mv久久久| 黄色成人av网站| 欧美老女人性生活视频| 亚洲第五色综合网| 欧美日韩卡一| 18禁免费无码无遮挡不卡网站| ㊣最新国产の精品bt伙计久久| 视频国产在线观看| 91免费看蜜桃| 日本va欧美va精品发布|