精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

GPT-4.5發(fā)布了,參數(shù)規(guī)模可能在3-5萬億之間,宣稱是最好的聊天模型,但有“強弩之末”的感覺

發(fā)布于 2025-3-13 06:57
瀏覽
0收藏

2月28日OpenAI發(fā)布了GPT-4.5,OpenAI稱這是其迄今為止最大的預訓練模型。我有點期待GPT-4.5會帶來令人振奮的突破。然而,從官方披露的信息以及實際表現(xiàn)來看,GPT-4.5沒有展現(xiàn)出超越前代模型的顯著優(yōu)勢。有點“強弩之末”的感覺。可能再次驗證了業(yè)界比較廣泛的認知:“單純擴大模型參數(shù)規(guī)模,對性能提升的邊際效應正在遞減” 。接下來分幾個章節(jié),談談我的感受。

期待與現(xiàn)實的落差

GPT-4.5 被 OpenAI 定位為“our largest and best model for chat yet”,暗示其在規(guī)模和技術能力上的重要進展。然而,與兩年前 GPT-4發(fā)布時的轟動效應相比,GPT-4.5 的亮相顯得低調(奧特曼沒有參加)。官方文章提到,其核心進步在于通過擴展無監(jiān)督學習(unsupervised learning,可以理解為“預訓練”)提升了知識廣度和可靠性,但并未強調推理能力的顯著增強。我認為,盡管 GPT-4.5 在某些領域(如減少幻覺)有所改進,但整體表現(xiàn)并未帶來顛覆性的驚喜。

GPT-4.5 的技術細節(jié)與參數(shù)規(guī)模估測

OpenAI 未公開 GPT-4.5 的具體參數(shù)數(shù)量,但從其描述和行業(yè)趨勢來看,我們推測一下。

  1. 基準參考GPT-4的參數(shù)規(guī)模據(jù)推測約為1.76萬億(https://en.wikipedia.org/wiki/GPT-4)。
  2. 計算資源官方文件提到GPT-4.5在Microsoft Azure AI超級計算機上訓練,這表明其計算需求可能遠超GPT-4。
  3. 模型架構假設GPT-4.5可能延續(xù)了Mixture of Experts(MoE)架構(https://the-decoder.com/gpt-4-architecture-datasets-costs-and-more-leaked/ ),MoE架構能在參數(shù)規(guī)模增加的同時優(yōu)化計算效率。結合MoE模型的參數(shù)分布特點,我推測 GPT-4.5 的參數(shù)規(guī)模在3萬億至5萬億之間。
  4. 性能反饋驗證官方數(shù)據(jù)表明,GPT-4.5在SimpleQA準確率上為62.5%,相較GPT-4o略有提升。暗示參數(shù)規(guī)模的增長未帶來比例相當?shù)男阅茉鲆妫С制湟?guī)模可能在3萬億至5萬億的假設——足夠大,但未達天文數(shù)字。

GPT-4.5發(fā)布了,參數(shù)規(guī)模可能在3-5萬億之間,宣稱是最好的聊天模型,但有“強弩之末”的感覺-AI.x社區(qū)

更大規(guī)模為何未帶來耀眼表現(xiàn)?

GPT-4.5 的訓練聚焦于擴展無監(jiān)督學習,通過增加計算資源和數(shù)據(jù)量提升模型的“世界知識深度”(deeper world knowledge)。官方稱其在知識問答中的幻覺率降低,且在日常查詢(63.2% 勝率)和專業(yè)查詢(56.8% 勝率)中優(yōu)于 GPT-4o。此外,GPT-4.5 未引入顯著的推理增強機制,而是強化了與人類的協(xié)作能力(如更高的“EQ”和 steerability)。這些特點表明,OpenAI 在GPT-4.5中選擇了“廣度優(yōu)先”的發(fā)展路徑,而非“深度突破”。

盡管 GPT-4.5 的參數(shù)規(guī)模可能達到 3 萬億,其性能提升卻遠不如預期。例如,在學術基準測試中,GPT-4.5 的 AIME 2024(數(shù)學競賽)得分僅為 36.7%,雖高于 GPT-4o 的 9.3%,但遠不及推理模型 OpenAI o1 的 87.3%。同樣,在 SWE-Bench Verified(編碼任務)中,GPT-4.5 的 38.0% 表現(xiàn)雖優(yōu)于 GPT-4o(30.7%),但并未展現(xiàn)出壓倒性優(yōu)勢。這種“規(guī)模大、增益小”的現(xiàn)象可能源于以下原因:

  1. 數(shù)據(jù)質量瓶頸訓練數(shù)據(jù)的總量雖增加,但其中人類有效知識的比例可能不足。GPT-4.5 在SimpleQA上幻覺率降低,表明其知識記憶更準確,但推理能力未見顯著增強。這可能因為數(shù)據(jù)中缺乏足夠的高質量邏輯推理樣本,導致模型在“記憶”上進步,卻在“思考”上停滯。
  2. 架構效率限制我們可以用圖書館來類比Transformer架構的大模型。參數(shù)規(guī)模可以視為圖書館的書架數(shù)量。通常來說,書架越多,能容納的書籍(知識)就越多。但當參數(shù)規(guī)模擴大到一定程度時,可能會出現(xiàn)效率遞減的情況。這就好比,一味地擴建圖書館、增加書架,但如果新增加的書籍大多是內容重復的,或者是質量低劣、雜亂無章的,那么讀者并不會因為圖書館變大了就變得更聰明——模型的輸出質量也不會因此顯著提升。

    反過來,如果模型參數(shù)規(guī)模過小,則其知識記憶能力會相對較差。 仍然以圖書館為例:如果一個圖書館很小,書架數(shù)量有限,卻要容納海量的書籍,那么很可能只能將每本書的內容進行大幅精簡,甚至只保留核心概要。這樣一來,很多知識的細節(jié)就會丟失,讀者也就無法獲取全面、深入的信息。但是有必要說明的是,很多小模型的推理能力不差,原因是“推理”與概念體系更相關,概念體系更容易通過知識點的壓縮來達到,這也是之前Ilya為什么說:Compression is Intelligence!

轉向Testing Time Computing Scaling Law

面對預訓練的局限,業(yè)界已經將目光轉向Testing Time Computing Scaling Law,即通過推理時增加計算量提升性能。這種趨勢在DeepSeekmR1, OpenAI的o1/o3,Qwen QwQ等模型中已有體現(xiàn),它們通過更長的思維鏈推理(chain-of-thought)顯著提高了復雜任務的解決能力。

本文轉載自??后向傳播??,作者: 張發(fā)恩 ????


收藏
回復
舉報
回復
相關推薦
懂色av蜜桃av| 精品视频免费在线播放| 99久久久无码国产精品免费| 中文字幕一区二区三三 | 久久精品视频网站| 99国产精品免费视频| 交100部在线观看| 国产欧美日韩在线| 丁香婷婷久久久综合精品国产 | 2017亚洲天堂1024| 从欧美一区二区三区| 日韩av理论片| 免费麻豆国产一区二区三区四区| 五月国产精品| 制服丝袜国产精品| 成人av一级片| 污网站在线免费看| 国产区在线观看成人精品| 97netav| 欧美精品一二三四区| 婷婷精品进入| 亚洲天堂男人的天堂| 日本中文字幕精品| 国产精品xxx| 精品高清一区二区三区| 特色特色大片在线| 91社区在线观看| 91视频在线观看免费| 成人网在线免费观看| 日本中文字幕久久| 91久久亚洲| 久久69精品久久久久久久电影好 | 日韩一区二区三区精品| 在线一区二区三区| 欧美 日韩 激情| 日本乱理伦在线| 亚洲欧洲美洲综合色网| 日产精品高清视频免费| 天堂av手机版| 高清shemale亚洲人妖| 成人春色激情网| 涩涩视频在线观看| 日韩中文字幕区一区有砖一区 | 日韩五码电影| 91久久久免费一区二区| 国产资源在线视频| av蜜臀在线| 一区二区三区欧美在线观看| 一区二区三区av在线| 国产美女性感在线观看懂色av| 成人国产精品免费观看| 99在线看视频| 亚洲av无码国产精品永久一区| 中文字幕av亚洲精品一部二部| 色噜噜久久综合伊人一本| 婷婷色一区二区三区| 综合伊思人在钱三区| 亚洲男人天堂网站| 波多野吉衣中文字幕| 免费精品国产| 一区二区日韩精品| 久久久免费看片| 日韩啪啪电影网| 最近2019中文免费高清视频观看www99 | 中文在线а√在线8| 五月天精品一区二区三区| 亚洲精品无码国产| 理论不卡电影大全神| 亚洲猫色日本管| 欧美视频在线第一页| 蜜臀av在线| 婷婷久久综合九色国产成人 | 极品av在线| 欧美性猛交xxxx黑人| 国产精品日韩欧美综合| 毛片久久久久久| 免费福利视频一区| 亚洲精品美女久久久| 亚洲国产欧美视频| 免费一区二区| 久久亚洲国产成人| 精品无码av在线| 亚洲欧美久久久| 亚洲精品中文字幕有码专区| 国产毛片欧美毛片久久久| 欧美gayvideo| 久久国产精品影片| 一本色道久久88| 欧美视频福利| 奇米四色中文综合久久| 成人免费视频国产免费| 激情综合网激情| 国产精品麻豆免费版| 免费毛片在线| 亚洲一级电影| 国产精品成人网| 久久人体大胆视频| 欧美黑吊大战白妞| 天堂av在线一区| 91在线观看免费网站| 日韩一区二区三区不卡| 国产麻豆精品在线| 欧美日韩另类综合| 国产在线视频网| 一区二区三区自拍| 桥本有菜av在线| 奇米影视888狠狠狠777不卡| 国产精品天干天干在线综合| 色哺乳xxxxhd奶水米仓惠香| aa级大片免费在线观看| 综合久久一区二区三区| 亚洲精品在线视频观看| 日本天码aⅴ片在线电影网站| 欧美性高潮床叫视频| 在线成人免费av| 欧美丝袜一区| 97国产精品视频| 老司机av福利| 亚洲av电影一区| 国产精品日日摸夜夜摸av| 青青草精品视频在线| 欧洲亚洲精品久久久久| 日韩美女一区二区三区| 亚洲色图 激情小说| 亚洲欧美激情诱惑| 国产精品一区在线播放| 免费大片在线观看www| 中文字幕中文字幕一区二区| avav在线播放| 亚洲免费一区| 在线日韩第一页| 天堂网中文在线观看| 亚洲免费精品| 国产日韩欧美在线| 酒色婷婷桃色成人免费av网| 无吗不卡中文字幕| 国产一精品一aⅴ一免费| 91视频最新入口| 国产激情一区| 久久精品国产999大香线蕉| 国产一区二区美女视频| 午夜影院在线看| 国内精品在线播放| 日本一区免费| 九色porny自拍视频在线播放| 欧美一区二区三区视频免费播放| 亚洲天堂最新地址| 日韩有码一区二区三区| 成人资源视频网站免费| 黄色免费在线观看| 亚洲第一激情av| 久久性爱视频网站| 综合久久99| 国产97色在线| 亚洲黄色小说网| 亚洲制服丝袜av| 麻豆传媒在线看| 国产精品红桃| 91色精品视频在线| 性xxxxbbbb| 亚洲欧美一区二区三区极速播放 | 欧美黄色录像片| 国内免费精品永久在线视频| 亚洲第一色视频| 一区二区三区四区视频精品免费| 一区二区在线免费观看视频| 黑丝一区二区| 久久在线91| 国产精品午夜国产小视频| 尤物网在线观看| 91精品综合久久久久久| 特级片在线观看| 99这里有精品| 日韩高清国产一区在线观看| 精品国产欧美日韩一区二区三区| 中文字幕亚洲激情| www.黄色片| 午夜电影网亚洲视频| av中文字幕免费观看| 激情丁香综合| 欧美三级网色| 亚洲综合视频| 午夜精品在线视频| 国产三级视频在线看| 欧美女孩性生活视频| 久久国产在线视频| 久久免费偷拍视频| 亚洲第一色av| 国产欧美不卡| 亚洲一区二区高清视频| 97超碰成人| 国产精品成人播放| 五月婷婷视频在线观看| 日韩精品免费观看| 国产精品无码久久av| 舔着乳尖日韩一区| 毛片视频免费播放| 成人午夜大片免费观看| 欧美精品性生活| 国产精品红桃| 一区二区视频在线免费| 另类在线视频| 亚洲a区在线视频| 中文字幕 在线观看| 久久中文字幕国产| 激情小说 在线视频| 日韩亚洲欧美一区| 伊人成年综合网| 午夜精品一区二区三区免费视频 | 五月天亚洲色图| 亚洲xxxx做受欧美| 无人区在线高清完整免费版 一区二| 久久成年人免费电影| 毛片网站在线| 亚洲第五色综合网| 99国产精品99| 欧美午夜精品一区二区蜜桃| 久久夜靖品2区| 亚洲六月丁香色婷婷综合久久| 久久国产柳州莫菁门| 成人免费视频视频| 深夜福利网站在线观看| 奇米在线7777在线精品| 女性女同性aⅴ免费观女性恋| 亚洲精品极品少妇16p| 日韩一区国产在线观看| 偷拍一区二区| 精品欧美日韩在线| av不卡一区二区| 亚洲www视频| 青青久久精品| 国产精品久久久久久久久久久新郎 | av激情综合网| 久久aaaa片一区二区| 极品少妇一区二区| 日韩大片一区二区| 日本欧美在线看| 中文字幕欧美人妻精品一区| 夜夜嗨av一区二区三区网站四季av| 红桃一区二区三区| 在线国产一区二区| av电影一区二区三区| 欧美激情成人| 国产美女视频免费| 四季av在线一区二区三区| 亚洲国产午夜伦理片大全在线观看网站| 欧美三级电影在线| 精品一区2区三区| 国产精品毛片视频| 国产私拍一区| 欧美人与动xxxxz0oz| 精品免费视频123区| 亚洲电影男人天堂| 欧美二区三区| 国产成人黄色| 天天人人精品| 色综合五月天| 在线观看成人免费| 欧美精品一线| 成人精品视频在线播放| 99精品国产福利在线观看免费| 日本在线xxx| 欧美一级二区| 久久久久国产一区| 理论片日本一区| 亚洲国产午夜精品| 粉嫩蜜臀av国产精品网站| 亚洲色偷偷色噜噜狠狠99网| 91偷拍与自偷拍精品| 精品国产成人亚洲午夜福利| 中文字幕精品一区二区三区精品 | 亚洲一区二区高清| 国产一级特黄aaa大片| 天天射综合影视| 老熟妇一区二区三区| 欧美日韩国产片| 国产91视频在线| 亚洲精品狠狠操| 国产三级在线免费观看| 久久精品国产清自在天天线| 在线观看a级片| 91tv亚洲精品香蕉国产一区7ujn| 台湾佬中文娱乐久久久| 91久久精品一区| 欧美性生活一级片| 特级西西444www大精品视频| 中文在线播放一区二区 | 熟女av一区二区| 午夜欧美大尺度福利影院在线看| 天干夜夜爽爽日日日日| 欧美精品在线视频| 黑人精品一区二区三区| 亚洲图片欧美日产| 久久五月精品中文字幕| 国产精品v片在线观看不卡| 日韩精品一区二区三区免费视频| 久久青青草综合| 亚洲精品一区二区在线看| 国产亚洲欧美在线视频| 国产在线一区观看| 97人妻精品一区二区三区免| 亚洲天堂精品在线观看| 久久亚洲精品国产| 欧美一卡2卡3卡4卡| 国产中文在线| 久久久久久久久电影| 国产成人a视频高清在线观看| 国产伦精品一区二区三区| 色狮一区二区三区四区视频| 国产69精品久久久久999小说| 麻豆91精品视频| 黄色工厂在线观看| 亚洲综合免费观看高清完整版 | 欧美色图17p| 欧美日韩加勒比精品一区| 国产手机av在线| 一区二区欧美亚洲| videos性欧美另类高清| 国产成人精品免费视频大全最热| 日韩精品水蜜桃| 免费欧美一级视频| 丁香激情综合五月| 五月综合色婷婷| 欧美三级在线看| 欧美孕妇性xxxⅹ精品hd| 欧美韩日一区二区| 999精品视频在线观看| 午夜视频久久久| 久久免费国产| 一级性生活毛片| 性做久久久久久免费观看| 精品国精品国产自在久不卡| 精品国产依人香蕉在线精品| av在线日韩| 国产一区二区日韩| 粉嫩一区二区| 久久精品成人一区二区三区蜜臀 | 茄子视频成人在线观看| 日韩一区电影| the porn av| 欧美国产精品一区| 波多野结衣黄色| 亚洲欧美色婷婷| 成人黄色免费短视频| 亚洲午夜日本在线观看| 日本一级片在线播放| 亚洲国产乱码最新视频| 丰满少妇被猛烈进入| 国产亚洲精品日韩| 欧美日韩美女| 久久狠狠久久综合桃花| 免费观看久久av| 自拍偷拍 国产| 97久久超碰精品国产| 国产午夜免费视频| 7777精品伊人久久久大香线蕉| 天天av综合网| 亚洲 日韩 国产第一| 欧美人妖在线观看| 欧美日韩在线不卡视频| 成人精品高清在线| 日本中文字幕在线| 亚洲午夜小视频| 夜鲁夜鲁夜鲁视频在线播放| 81精品国产乱码久久久久久| 九九亚洲精品| 午夜免费精品视频| 国产精品国产馆在线真实露脸| 国产精品久久影视| 欧美精品videosex性欧美| 欧美黑人做爰爽爽爽| 北条麻妃在线一区| 精品久久久中文字幕| 杨幂毛片午夜性生毛片| 久久综合色婷婷| 午夜毛片在线观看| 伊人一区二区三区久久精品| va天堂va亚洲va影视| 国产av熟女一区二区三区| 91网站在线观看视频| 91精品视频免费在线观看 | 国产aⅴ精品一区二区三区黄| 超碰97成人| 日韩精品一区二区三区不卡| 久久亚洲二区三区| 欧美激情亚洲色图| 4438x成人网最大色成网站| 美女隐私在线观看| 久久久久久99| 免费观看久久av| 亚洲精品在线视频播放| 影音先锋久久精品| 日本一区二区在线免费观看| 欧美优质美女网站| 男人的天堂在线视频免费观看| www.久久爱.cn| 久热精品在线| 免费中文字幕在线观看| 日韩精品在线电影| 亚洲国产91视频|