精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

當前的“LLM 智能”,是來自模型突破,還是工程堆砌? 原創 精華

發布于 2025-11-21 07:45
瀏覽
0收藏

編者按: 推理模型的“推理能力”飛躍,究竟是模型本身的進步,還是工程編排的巧妙包裝?

我們今天為大家帶來的這篇文章提出了一個尖銳的觀點:所謂“推理模型”的突破,本質上并非模型智能的根本性提升,而是通過工具調用與流程編排對模型能力停滯所做的工程性補償。

文章深入剖析了 GPT-5 等最新模型在執行任務時嚴重依賴 Python 沙箱、API 調用等外部工具的現象,揭示出大語言模型在代碼生成與語義理解上的深層瓶頸。作者指出,OpenAI 正從基礎研究轉向應用變現,其推出的 ChatGPT Apps、Atlas 瀏覽器等產品,反映的不是技術突破,而是對模型能力停滯的策略性回避。文章進一步探討了行業面臨的兩種路徑選擇:一是在現有架構上不斷優化 pipeline 系統,追求短期收益;二是直面 Transformer 架構的根本缺陷,投入高風險、長周期的基礎架構創新。

本文系原作者觀點,Baihai IDP 僅進行編譯分享

作者 | Mani Doraisamy

編譯 | 岳揚

01 工具使用(tool use)是如何成為難題求解的替代方案

當 OpenAI 于 2024 年 4 月發布 o1,并稱之為“推理模型”時,整個行業為之歡呼,認為這是一次重大突破。終于,AI 能夠一步步思考、解決復雜問題,甚至處理研究生級別的數學題了。

當前的“LLM 智能”,是來自模型突破,還是工程堆砌?-AI.x社區

但仔細觀察其運行機制我們就會發現,當我們讓最新模型 ChatGPT-5 計算兩個大數的乘積時,它并不會自己進行計算,而是生成一段 Python 代碼,在沙箱中執行后返回結果。相比之下,ChatGPT-3 至少還會嘗試在內部完成算術運算(盡管常常出錯),而 ChatGPT-5 則將計算任務外包給了外部工具。[注釋1]

這種模式無處不在。所謂“Agentic AI”的自主性?無非是一連串的工具調用,比如網頁搜索、API 調用、數據庫查詢。真正的突破并不在于模型本身的智能水平,而在于協調外部系統的編排層。從推理能力到 Agentic AI,一切都不過是代碼生成的高級應用。 這些能力并非模型本身的進步,而是為停滯不前的模型能力所設計的工程層面的變通方案。

這一點至關重要,因為整個 AI 行業(從數萬億美元的 GDP 預測到獨角獸公司的估值[1])都建立在模型能力持續進步的預期之上。而我們實際得到的,卻是越來越復雜的“pipeline 工程”,其底層基礎卻早已陷入停滯。

02 GPT-5:皇帝的新推理(不是“衣服”??

2025 年 8 月本該是一場勝利。OpenAI 曾承諾“將博士級智能裝進每個人的口袋”,然而他們交付的成果在代碼生成這一核心能力上幾乎停滯不前 —— 而其他能力都依賴于此。這正是瓶頸所在:代碼生成是交通樞紐。更好的代碼 → 更強的推理(通過工具執行)→ 更優的智能體 → 更高的生產力 → 萬億美元級市場。 一旦這個交通樞紐停滯,整條鏈條便隨之停擺。

當前的“LLM 智能”,是來自模型突破,還是工程堆砌?-AI.x社區

使用 AI 編程工具的開發者們明顯感到了失望。基于 OpenAI 模型構建 AI 編程工具的公司(如 Cursor、Replit)曾押下數十億美元,賭定每次模型發布都會帶來指數級的進步。GPT-5 卻打破了這一預期,而這本不該發生。從 GPT-3 笨拙的算術能力,到 GPT-4 生成連貫代碼的能力,進步似乎勢不可擋。整個行業正是建立在對持續進步的預期之上。但在過去一年里,這種進步明顯停滯了。

03 從研究實驗室到應用商店

與此同時,OpenAI 正將重心從模型研究轉向應用開發。只需觀察 OpenAI 在過去幾個月的軌跡,這一趨勢便已顯而易見:

2025 年 10 月 6 日:ChatGPT Apps 上線

第三方應用可直接在 ChatGPT 內運行。通過 Expedia 預訂航班,在 Canva 中設計圖像,瀏覽 Zillow 上的房產信息,全程無需離開聊天界面。Apps SDK 為開發者開放了 8 億用戶生態。這標志著 OpenAI 正在變成一個應用商店。

2025 年 10 月 21 日:Atlas 瀏覽器發布

這是一款由 AI 驅動的新型網頁瀏覽器,意在挑戰 Chrome 的主導地位。該產品具備瀏覽器記憶、智能體模式,以及集成于瀏覽器的全鏈路 AI 助手。這標志著 OpenAI 正在轉型為一家消費級產品公司。

他們正逐步從研究領域轉向技術應用:

  • 推理模型(貼近最前沿、最基礎的核心研究)
  • 帶工作流構建器的 Agentic AI(離核心研究距離更遠了)
  • ChatGPT Apps(純粹的生態運營)
  • Atlas 瀏覽器(將 ChatGPT 深度嵌入瀏覽器)

OpenAI 的每一步都在遠離“如何構建更優模型”,邁向“如何將現有模型變現”。

04 關于 OpenAI 轉型動因的兩種解讀

為何這家全球頂尖的 AI 實驗室會從技術研究轉向應用領域?現有兩種主流解釋。

解讀一:遭遇技術瓶頸卻秘而不宣

規模擴張已然失效。盡管投入數十億美元的算力資源和全球頂尖的研究人員,模型質的飛躍卻難再現。模型并未變得更智能,只是更擅長協調外部工具。

與其承認"無法突破模型性能瓶頸",不如轉向變現賽道。ChatGPT Apps 無需技術研究實現突破即可創收,瀏覽器生態不依賴 GPT-6 就能構建用戶壁壘。在摸索下一步方向時,應用業務能為他們爭取緩沖時間 —— 當然,這是一種悲觀的解讀:將技術進步的停滯包裝成戰略轉型。

解讀二:應用賽道的利潤更豐厚

訓練尖端模型耗資數十億、歷時數載,而基于現有模型開發應用成本低、見效快。后者利潤空間更大,風險更低,變現路徑更清晰。

或許 OpenAI 經過理性測算,發現應用開發能以更小投入獲取更大回報,因而調整資源分配。既然六個月就能打造瀏覽器,何必耗費 50 億美元訓練 GPT-6?這是從現實主義的視角進行解讀:利潤空間優先于技術進步。

這兩種解讀可能都部分正確。但無論如何,結果殊途同歸:當整個生態系統最需要突破時,領頭羊卻減少了對基礎模型研發的投入。

05 沒人愿面對的架構問題

工具編排(Tool orchestration)確實是令人印象深刻的工程成果。協調網頁搜索、代碼執行、數據庫查詢和 API 調用,需要復雜的軟件架構。能夠管理復雜工作流的智能體框架也的確具備實際價值。但這些都并未回答一個根本問題:模型為何從一開始就離不開工具?

早期模型如 GPT-3 曾飽受詞元碎片化(token fragmentation)的困擾(例如將 “strawberry” 拆成 “straw” 和 “berry”,而后者含義完全不同)。現代分詞器已緩解了這一問題,但更深層的架構缺陷依然存在:大語言模型仍然缺乏真正的語義理解能力。這類語義問題在代碼生成中尤為致命,因為代碼對精確性要求極高。 當模型產生幻覺,或在長上下文中喪失連貫性時,引入網絡搜索功能并不能根除病灶。固定維度的嵌入(embeddings)會有損地壓縮語義信息,注意力窗口則對上下文施加了硬性邊界。這些都是架構層面的限制,而非工程問題。

這就好比在一座僅能支撐三層樓的地基上建造摩天大樓。你可以不斷加固結構、重新分配承重、安裝精密的支撐系統,但最終,你需要的是一個全新的地基。無論圍繞現有地基做多少精巧的工程優化,都無法讓你建得更高。

當前的“LLM 智能”,是來自模型突破,還是工程堆砌?-AI.x社區

06 行業必須面對的抉擇

整個行業站在十字路口,盡管多數參與者仍在回避這個現實。

路徑一:持續優化 pipeline 系統

延續當前軌跡:略微擴大模型規模,優化工具協調機制,深化與應用平臺的整合。推出瀏覽器與應用商店,構建更完善的智能體框架,在既定架構限制下進行工程優化。

這條路徑能帶來可預測的短期收益。對許多尚未達到 AI 編程工具智能水平的領域而言尤其如此。由于 AI 編程工具最初是由開發者為自己打造的,他們深刻理解問題所在,并知道如何解決。類似的進步將在其他領域陸續出現,風險投資的資金流仍會持續一段時間。但 a16z 預測的 3 萬億美元 GDP 增長,其前提是生產力翻倍,而不是像當前 AI 編程工具那樣僅停在約 20% 的提升水平。要實現突破,必須承認現有基本方法已遇阻。

路徑二:承認我們需要全新的基礎架構

承認模型規模擴大已觸及天花板,投入能解決根本問題的架構創新。這意味著:

  • 采用基于圖結構的架構,保留結構化關系,避免分詞造成的語義碎片化問題,根治 Transformer 架構的固有缺陷;
  • 部署能高效處理長上下文的稀疏注意力機制;
  • 借鑒生物神經組織原理的神經形態計算方案。

解決方案在于構建能保留信息而非有損壓縮的架構。正如 AI 研究者 Andrej Karpathy 所言,現有模型只是“互聯網的有損壓縮”。真正的進步需要向無損表征邁進:保留原始信息中固有的組織形式、精確維護信息單元之間的具體關系、維護信息中概念的層級與從屬關系。

這條路徑成本高昂、前景未卜且進展緩慢。它要求我們直面現有路線的失敗,且需要耗費數年的研究投入,且不保證成功。但這是唯一能真正解決問題而非回避問題的途徑。

07 總結

目前,AI 編程工具市場正呈爆發式增長:

  • Cursor:15 個月實現 5 億美元年經常性收入(ARR),估值達 100 億美元
  • GitHub Copilot:數百萬用戶,年收入達數億美元
  • Windsurf:以 24 億美元被收購
  • 數十家初創公司正在融資,金額高達九位數

這一切都建立在同一個假設之上:模型在代碼生成能力上將持續進步。如果這個假設是錯的,整個市場就會變成一座紙牌屋 —— 3 萬億美元的 GDP 預期將化為泡影,獨角獸估值將失去支撐,生產力革命也將無限期推遲。

反之,誰若能解決底層架構問題,誰就將贏得一切。哪怕只是基礎能力的小幅提升,也會在整個生態系統中產生連鎖反應:

  • 更優的代碼生成能力 → 更強的推理能力(通過工具執行實現)
  • 更強的推理能力 → 更強大的智能體
  • 更強大的智能體 → 真正實現生產力翻倍
  • 真正實現生產力翻倍 → 3 萬億美元市場成為現實

由此創造的價值將是天文數字。現在的問題是:是否有任何實驗室愿意選擇艱難的“修復地基”之路,而不是輕松地在停止加固的地基上繼續搭建應用? 答案將決定這場 3 萬億美元的生產力革命究竟是現實,還是幻想。

注釋:

[1] GPT-5 中有兩種方式進行乘法運算:

  • Python 模式:使用 Python 沙箱執行
  • 無工具模式:依賴模型內部推理

在 FrontierMath 基準測試中,Python 模式的準確率約為無工具模式的 2 倍(26.3% 對 13.5%),同時成本效益高出 4 到 10 倍。

GPT-5 API 默認使用無工具模式(必須在 API 調用中顯式啟用工具),而 ChatGPT 用戶端很可能默認啟用 Python 模式,因為“高級數據分析”(Advanced Data Analysis)已對所有訂閱用戶默認開啟。這使得 OpenAI 在消費級產品中實現了大幅成本優化,而 API 用戶若不手動啟用工具使用,則需承擔低效推理的全部成本。

END

本期互動內容 ??

?文章指出,整個 AI 生態的繁榮建立在“代碼生成能力持續進步”的假設上。你怎么看待這個觀點?

文中鏈接

[1]??https://a16z.com/the-trillion-dollar-ai-software-development-stack/??

本文經原作者授權,由 Baihai IDP 編譯。如需轉載譯文,請聯系獲取授權。

原文鏈接:

??https://manidoraisamy.com/reasoning-not-ai.html??


?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
收藏
回復
舉報
回復
相關推薦
亚洲精品欧美激情| 蜜臀精品一区二区三区在线观看 | 欧美最新另类人妖| 欧美精品777| 欧美一级免费播放| av电影在线网| 成人国产精品免费观看| 国产精品福利网| 久久久久久久久精| 精品成人影院| 亚洲精品一区二区三区福利 | 日韩国产在线播放| 日韩a一级欧美一级| 蜜桃视频m3u8在线观看| 亚洲视频在线一区二区| 欧美日本国产精品| 亚洲xxx在线| 老汉av免费一区二区三区| 羞羞色国产精品| 天天看天天摸天天操| 清纯唯美亚洲经典中文字幕| 欧美久久免费观看| 免费日韩中文字幕| 色女人在线视频| 国产精品视频看| 欧美成熟毛茸茸复古| 国产福利免费视频| 麻豆精品国产传媒mv男同| 欧美精品第一页在线播放| 国产精品一区二区亚洲| 台湾佬综合网| 亚洲成人中文字幕| 九九九久久久久久久| 99久久精品一区二区成人| 婷婷激情综合网| 国产精品videossex国产高清| 69久久夜色| 久久精品一区二区三区av| 久久99精品久久久久久秒播放器 | 成人动漫av在线| 91亚洲精品久久久久久久久久久久| 三级网站在线播放| 亚洲欧美成人| 91av在线看| 天天插天天操天天干| 欧美在线高清| 九九热精品在线| 黄色a级片在线观看| 91视频综合| 精品国产一区二区三区久久狼5月 精品国产一区二区三区久久久狼 精品国产一区二区三区久久久 | 高清中文字幕mv的电影| 国产日韩在线观看视频| 宅男噜噜噜66一区二区66| 伊人成人222| 成人国产精品久久| 日韩一区和二区| 一区二区在线免费观看视频| 日本免费一区二区视频| 欧美变态tickle挠乳网站| 性色av浪潮av| 91精品入口| 日韩精品免费在线观看| 草草影院第一页| 精品一区av| 深夜精品寂寞黄网站在线观看| 99久久99久久精品免费| 成人精品影视| 久久综合色影院| 精品处破女学生| 99日韩精品| 国产成人精品最新| 一级黄色大片免费观看| 激情久久五月天| 国产成人精品福利一区二区三区| 人妻精品一区二区三区| 久久综合久久综合亚洲| 五月天久久综合网| 黄色网址在线免费播放| 亚洲国产精品久久久久秋霞影院 | 久久一区中文字幕| 国产美女精品免费电影| 国产熟女一区二区丰满| 国产jizzjizz一区二区| 欧美大陆一区二区| 日本中文字幕在线看| 一二三四社区欧美黄| 成人在线免费观看av| 电影亚洲一区| 日韩久久精品一区| 一区二区三区久久久久| 重囗味另类老妇506070| 欧美亚洲另类视频| 国产精品福利电影| 2023国产精品自拍| 亚洲欧洲精品在线观看| segui88久久综合| 欧美影视一区在线| 妖精视频一区二区| 日韩免费高清| 欧美一级视频在线观看| 国产人妖一区二区三区| 2022国产精品视频| 91视频 - 88av| 成人做爰视频www| 精品电影一区二区| 羞羞在线观看视频| 亚洲美女黄色| 成人中心免费视频| 毛片网站在线| 亚洲电影第三页| 国产精品视频中文字幕| 偷拍精品福利视频导航| 欧美日韩xxx| 中文字幕欧美在线观看| 99re这里只有精品首页| 日韩人妻一区二区三区蜜桃视频| 欧美人与性动交xxⅹxx| 亚洲国产精品一区二区三区| 99久久久免费精品| 免费成人美女在线观看.| 黑人另类av| 国产丝袜在线播放| 欧美一区二区三区免费大片| 免费看黄色三级| 亚洲免费综合| 国产免费一区二区三区| 1024在线播放| 6080yy午夜一二三区久久| 中文字幕国产专区| 国产欧美大片| 激情一区二区三区| 超碰在线99| 精品久久人人做人人爰| 男人与禽猛交狂配| 九色|91porny| 伊甸园精品99久久久久久| 美女福利一区二区三区| 精品亚洲男同gayvideo网站| 久久久国产精华液| 国产福利一区二区三区视频在线| 成年人黄色在线观看| 国产日本久久| 日韩中文在线不卡| 国产精品国产av| 国产精品二区一区二区aⅴ污介绍| 黄色a级片免费| 亚洲精品一级二级三级| 国产成人精品av在线| 欧美挠脚心网站| 91精品91久久久中77777| 久久精品视频18| 日韩av中文字幕一区二区三区| 欧美日韩高清免费| 久久天天久久| 欧美老女人性生活| 欧美自拍偷拍第一页| 天天色天天操综合| 中文字幕日韩三级片| 免费视频一区| 亚洲精品一区二区三区蜜桃久| 久久久久久久性潮| 免费av在线一区| 亚洲爱爱综合网| 黄色成人在线播放| 一区二区精品免费| 久久99精品久久久久婷婷| 无码人妻aⅴ一区二区三区日本| 高清不卡一区| 久久免费少妇高潮久久精品99| 视频一区二区免费| 91福利在线免费观看| 国产免费嫩草影院| 国产成人午夜精品5599| 国产肥臀一区二区福利视频| 国产尤物久久久| 91久久精品国产91性色| 男人添女人下部高潮视频在线观看| 亚洲第一色在线| www.久久视频| 亚洲精品视频自拍| 亚洲蜜桃精久久久久久久久久久久| 日本在线不卡一区| 免费日韩在线观看| 久久av超碰| 成人日韩在线电影| 日本免费一区二区六区| 色偷偷888欧美精品久久久| 亚洲不卡免费视频| 色婷婷久久99综合精品jk白丝| 欧洲美女女同性互添| 成人av网在线| 福利片一区二区三区| 99精品久久| av不卡在线免费观看| 日韩欧美天堂| 亚洲精品免费一区二区三区| 蜜桃视频www网站在线观看| 自拍亚洲一区欧美另类| 欧美性猛交 xxxx| 欧美日本一区二区三区四区| 久久视频免费在线观看| 中文字幕av不卡| 中出视频在线观看| 国产一区二区精品久久99| 日日碰狠狠躁久久躁婷婷| 国产在线不卡| 一区高清视频| 国产亚洲一区二区三区啪| 成人黄动漫网站免费| 日本一区二区三区中文字幕| 18一19gay欧美视频网站| 97caopron在线视频| 国产一区二区av| 亚州av在线播放| 欧美一区二区三区视频在线 | 91麻豆精品国产91久久久使用方法| 91av在线免费视频| 亚洲国产视频在线| 国产中文av在线| 国产精品久久综合| 国产熟妇久久777777| 国产91精品久久久久久久网曝门| gai在线观看免费高清| 日本中文字幕不卡| 北条麻妃av高潮尖叫在线观看| 亚洲另类视频| 精品人妻少妇一区二区| 狠狠色综合网| 手机成人av在线| 日韩在线观看一区| 色爱区成人综合网| 国产一区二区三区站长工具| 久久国产精品-国产精品| 成功精品影院| 国产精品18毛片一区二区| 国产精品1区| 成人久久久久爱| 99综合99| 99re在线| 亚洲精品a区| 成人黄动漫网站免费| 午夜视频在线观看精品中文 | 成 人 黄 色 片 在线播放| 欧美理论电影在线| 国产一区二区波多野结衣| 欧美日本国产视频| 在线观看免费观看在线| 欧美日韩一区久久| 亚洲一级黄色大片| 7799精品视频| www.国产视频| 亚洲福利小视频| 亚洲 另类 春色 国产| 亚洲精品一区二区三区婷婷月| 四虎电影院在线观看| 亚洲精选中文字幕| 国产区视频在线播放| 在线看日韩欧美| 看黄网站在线| 九九热精品视频国产| 美女91在线看| 国产精品久久久久久久久| 欧美性生活一级| 国产精品传媒毛片三区| 日韩人体视频| 五月婷婷综合色| 香蕉国产精品| 男人日女人视频网站| 久久亚洲不卡| 美女少妇一区二区| 国产91丝袜在线播放九色| jlzzjizz在线播放观看| 国产欧美一区二区精品性色超碰| 永久免费未视频| 亚洲国产三级在线| 无码人妻精品一区二区| 欧美福利电影网| 人妻91麻豆一区二区三区| 亚洲精品在线不卡| 免费黄色网址在线观看| 久久久久免费视频| 欧美最新精品| 3d动漫精品啪啪一区二区三区免费| 成人h动漫精品一区二区器材| 看高清中日韩色视频| 999国产精品999久久久久久| 国产午夜精品视频一区二区三区| 日韩一级网站| 午夜一级免费视频| 91香蕉国产在线观看软件| 人与动物性xxxx| 欧美色道久久88综合亚洲精品| 一区二区www| 日韩精品小视频| 国产高清一区二区三区视频| 97国产精品视频人人做人人爱| 国精品产品一区| 久久精品日产第一区二区三区乱码 | 97久久超碰国产精品| av在线免费播放网址| 天天色天天操综合| av在线免费在线观看| 亚洲性av在线| 人在线成免费视频| 91在线精品观看| 国产精品久久久久9999赢消| 欧美二区在线视频| 国产不卡一区视频| jizz18女人高潮| 红桃av永久久久| 亚洲精品国偷拍自产在线观看蜜桃| 在线观看日韩欧美| 小视频免费在线观看| 97人人模人人爽人人少妇| 欧美色爱综合| 春日野结衣av| 不卡高清视频专区| 国产盗摄一区二区三区在线| 欧美性猛片xxxx免费看久爱| 婷婷婷国产在线视频| 欧美华人在线视频| 国产亚洲高清一区| 中文有码久久| 日本不卡一二三区黄网| 黄色国产在线观看| 亚洲成a天堂v人片| 亚洲第一大网站| 欧美老少配视频| 精品中文视频| 色中文字幕在线观看| 麻豆精品在线视频| 精品丰满少妇一区二区三区| 欧美午夜无遮挡| 天堂中文在线8| 日本成人激情视频| 亚洲国产合集| 免费午夜视频在线观看| 久久综合色综合88| 国产一级片毛片| 亚洲精品视频二区| 老司机成人影院| 日韩电影在线播放| 日韩成人免费电影| 国产精品www爽爽爽| 在线观看不卡一区| 91露出在线| 成人性生交大片免费看视频直播 | 国内外成人免费激情在线视频网站 | 精品国产区一区| av中文字幕在线观看第一页 | 在线观看日产精品| 久久久久久青草| 国产玖玖精品视频| 综合天堂av久久久久久久| 精品国产免费久久久久久婷婷| 夜夜嗨av一区二区三区四季av| www.国产麻豆| 2018国产精品视频| 日韩.com| 污视频在线观看免费网站| 亚洲一区二区三区在线播放| 欧美一级在线免费观看| 欧美亚洲视频在线看网址| 国内精品久久久久久久影视简单 | 成人免费aaa| 久久久久99精品一区| 中文在线字幕免费观| 久久亚洲精品一区| 欧美午夜18电影| 黄色在线视频网| 亚洲最新视频在线观看| 亚洲欧美日韩动漫| 国产精品日韩欧美综合| 欧美福利视频| 亚洲精品成人无码熟妇在线| 欧美在线free| 欧美寡妇性猛交xxx免费| 久久久久久国产精品免费免费| 日本欧美一区二区| 久久久精品视频在线| 亚洲欧美国产日韩中文字幕| 激情欧美一区二区三区黑长吊| 伊人久久在线观看| 国产亚洲一区字幕| 国产美女主播在线观看| 136fldh精品导航福利| 91一区二区三区四区| 中文字幕精品久久久| 欧美日韩精品一区视频| 成人影音在线| 一区二区三区av| 337p粉嫩大胆噜噜噜噜噜91av | 成人一区二区视频| 国产精品成人久久久| 久久久久久久久久国产| 大片网站久久| 日韩av一二区| 精品国精品国产| **国产精品| 国产成人精品视频ⅴa片软件竹菊|