精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

AI 推理服務是否真的無利可圖?從第一性原理看 AI 推理成本 原創 精華

發布于 2025-10-17 10:19
瀏覽
0收藏

編者按: 你是否也曾認為,AI 推理服務注定是一場燒錢的無底洞?

我們今天為大家帶來的這篇文章,作者的核心觀點是:OpenAI 和 Anthropic 等公司在推理環節的實際成本遠低于外界普遍認知,甚至在某些場景下已具備大幅盈利能力。

文章通過第一性原理,以 H100 GPU 集群為例,詳細拆解了輸入與輸出 token 的成本結構,指出輸入處理成本極低(每百萬 token 約 0.001 美元),而輸出生成成本較高(每百萬 token 約 3 美元)。作者進一步分析了不同用戶場景(如消費者套餐、開發者工具、API 服務)的經濟模型,揭示了為何像 Claude Code 這樣的編程助手能夠實現高利潤率,而視頻生成類應用則面臨更大的成本壓力。

閱讀時請注意:文中計算基于理想化的硬件利用率和簡化模型假設,現實世界的推理成本可能更高。可以把它當作“啟發性的估算框架”,而非精確的經濟結論~

作者 | Martin Alderson

編譯 | 岳揚

我總聽人說 AI(尤其是推理環節)是臺燒錢機器[1-3]。表面上看這種說法似乎有道理,但我一直對這類論斷持保留態度,因此決定深入探究一番。

目前還沒見到有人真正系統性地剖析過大范圍運行推理任務的實際成本,其中的經濟賬確實讓我深感好奇。

以下內容完全是粗略估算。雖然我沒有親自大規模部署過最頂尖的 AI 模型,但我對如何在云上運營高并發、大流量的服務及其成本效益有著深入的了解,也深知那些云巨頭的報價和他們自家硬件成本之間存在著多么驚人的利潤空間。我說的不一定全對,非常歡迎大家來指正和討論。

01 幾點前提假設

本文僅探討原始計算成本。這種處理方式顯然過于簡化,但考慮到當前模型的實用價值,即便假定技術毫無進步,我仍想重點驗證一個觀點:是否所有企業在推理環節的虧損都已嚴重到根本難以為繼的程度。

我設定單顆 H100 芯片的成本為每小時 2 美元。這實際上已高于當前市場零售的按需租賃價,而我(推測)大型 AI 企業實際采購成本應該遠低于這個數額。

AI 推理服務是否真的無利可圖?從第一性原理看 AI 推理成本-AI.x社區

其次,我將以 DeepSeek R1 的架構為基準,該模型采用混合專家模型架構,總參數量 671B,激活參數量 37B。鑒于其性能與 Claude Sonnet 4 和 GPT-5 大致相當,我認為這個假設是合理的。

02 逆向推導:基于第一性原理的、針對 H100 的分析

2.1 生產環境配置

首先設定一個現實的生產環境:假設采用 72 張 H100 組成的集群,單卡每小時 2 美元,總成本為每小時 144 美元。

為滿足生產環境的延遲要求,我們設定每個模型實例的批處理量(batch size)為 32 個并發請求,這比基準測試中可能出現的大批量處理更符合實際。通過對每個模型實例采用 8 路 GPU 進行張量并行,我們可在 72 顆 GPU 上同時運行 9 個模型實例。

2.2 預填充階段(處理輸入)

每張 H100 GPU 的顯存(HBM)帶寬約 3.35 TB/s,這將成為大多數工作負載的瓶頸。由于 37B 激活參數以 FP16 的精度存儲需占用 74 GB 空間,每個實例每秒可完成約 3,350GB/s ÷ 74GB = 45 次前向傳播(譯者注:實際每秒能完成的前向傳播次數不僅取決于顯存帶寬,還受到其他因素影響)。

關鍵在于:每次前向傳播會同時處理所有序列中的所有詞元(tokens)。當我們批量處理 32 條序列且每條序列平均包含 1000 個詞元時,單次前向傳播即可處理 32,000 個詞元。這意味著每個實例每秒可處理 45 次前向傳播 × 32k tokens = 144 萬個 input tokens。9 個實例合計每秒處理 1300 萬 input tokens,即每小時 468 億 input tokens。

實際情況中,混合專家模型(MoE)可能需要為當前批次中不同詞元加載不同的專家組合,若這些詞元被路由到多樣化的專家組合,可能使吞吐量降低 2-3 倍。然而在實際應用中,路由模式通常呈現圍繞熱門專家的聚集現象,且現代實現方案采用專家并行與容量因子等技術來維持效率,因此實際影響更可能接近 30%-50% 的降幅,而非最壞情況下的數值。

2.3 解碼階段(生成輸出)

輸出生成階段則呈現完全不同的圖景。此階段需順序生成詞元 —— 每次前向傳播每個序列僅產生一個詞元。因此每秒 45 次前向傳播僅使每個實例每秒產生 45×32=1440 個 output tokens。9 個實例合計每秒 12,960 個output tokens,即每小時 4670 萬個 output tokens。

2.4 每個詞元的原始成本

成本不對稱性非常顯著:input tokens 成本為 144 美元 ÷ 468 億 = 每百萬詞元 0.003 美元,而 output tokens 成本為 144 美元 ÷ 4670 萬 = 每百萬詞元 3.08 美元,存在千倍的差異!

2.5 當計算能力成為瓶頸

上述計算假設內存帶寬是主要限制因素 —— 這對典型工作負載確實成立。但在某些特定場景下,計算能力反而會成為系統瓶頸。當處理長上下文序列時,注意力計算量會隨序列長度呈平方級增長。采用超大批處理數量并增加并行注意力頭數,也會使系統從內存瓶頸轉為計算瓶頸。

當上下文長度超過 128k 時,注意力矩陣會變得極其龐大,系統將從內存受限模式轉為計算受限模式。對于超長上下文場景,這可能導致成本增長 2 到 10 倍。

這解釋了某些有趣的產品決策:Claude Code 將上下文長度人為限制在 20 萬詞元 —— 不僅是出于性能考量,更是為了將推理運算維持在低成本的內存受限狀態,避免陷入高成本的計算受限長上下文場景。這也是為何服務商對 20萬+ 詞元的上下文窗口會額外收費 —— 因為其經濟模型已發生本質變化。

03 終端用戶行為模式如 何影響 AI 服務提供商盈利結構

根據成本逆向推導的結果(再次強調,此處基于 H100 的零售租賃價格),我推測實際情況如下:

  • 處理輸入幾乎零成本(約每百萬 token 0.001 美元)
  • 生成輸出存在必須支付的實質性成本(約每百萬 token 3 美元)

這些成本恰好與 DeepInfra 平臺對 R1 模型的定價策略基本吻合,不過 input tokens 的加價幅度明顯更高。

AI 推理服務是否真的無利可圖?從第一性原理看 AI 推理成本-AI.x社區

3.1 A. 消費者套餐

  • 每月支付 20 美元的 ChatGPT Pro 用戶:不限制日使用次數但限制 token 使用量
  • 每日限制 10 萬 token 使用量
  • 按 70% 輸入 token / 30% 輸出 token 的比例:實際成本約 3 美元 / 月
  • OpenAI 實現了 5-6 倍的加價

這類用戶屬于典型的重度使用者,他們每天運用模型進行寫作、編程和常規查詢。此場景下的經濟模型非常健康。

3.2 B. 開發者使用場景

(譯者注:開發者場景的長 prompt 成本非常高昂,前文有提到,但此處計算可能沒有考慮這種情況)

  • Claude Code Max 5 用戶(100 美元/月):若每日重度編程 2 小時
  • 約 200 萬 input tokens,3 萬 output tokens /日
  • 大量消耗 input token(低成本并行處理) + 極小量 output tokens
  • 實際成本:約 4.92 美元/月 → 20.3 倍加價
  • Claude Code Max 10 用戶(200 美元/月):若每日極重度使用 6 小時
  • 約 1000 萬 input tokens,10 萬 output tokens/日
  • 海量的 input tokens 與相對少量的生成 tokens
  • 實際成本:約 16.89 美元/月 → 11.8 倍加價

開發者使用場景的經濟效益最為顯著。 像 Claude Code 這樣的編程助手天然存在極度不對稱的使用模式 —— 它們輸入整個代碼庫、相關文檔、堆棧跟蹤、多個文件及擴展上下文(低成本的 input tokens),僅需輸出代碼片段或對代碼的解釋說明等少量內容。這種模式完美契合了“輸入近乎免費,輸出成本高昂”的底層經濟結構。

3.3 C. API 利潤空間

  • 現行 API 定價:每百萬 tokens 3/15(譯者注:分別代表輸入和輸出,后同) 美元 vs 實際成本約 0.01/3 美元。
  • 利潤率:毛利潤率達 80-95% 以上

API 業務本質上就像一臺印鈔機。其毛利率水平更接近軟件業務模式,而非傳統基礎設施服務。

04 Conclusion

本文分析基于大量假設,其中部分可能并不準確。但即便假設誤差高達三倍,其經濟模型仍顯示出極高的盈利潛力。即便采用 H100 的公開市場零售價計算,原始計算成本也表明 AI 推理并非如許多人宣稱的那樣是不可持續的燒錢無底洞。

大多數人忽略了這樣一個事實:處理輸入信息的成本,比起生成輸出結果來,要低廉得多。這意味著成本存在高達千倍的差距 —— 處理每百萬個 input tokens 僅需約 0.005 美元,而生成每百萬個 output tokens 的成本卻要 3 美元以上。

正是這種成本上的不對稱性,解釋了為何某些應用場景利潤驚人,而另一些卻可能難以為繼。 重度讀取型應用(那些消耗海量上下文信息卻只生成極小量輸出的程序)的算力成本幾乎可忽略不計。對話智能體、處理完整代碼庫的編程助手、文檔分析工具和研究應用,正是這種成本模式的最大受益者。

視頻生成則處于這一成本結構的另一個極端。一個視頻模型可能只需接收一句簡單的文本提示詞(約 50 個詞元)作為輸入,卻需要生成代表每一幀畫面的數百萬個詞元。當你需要從極少的輸入生成海量的輸出時,其經濟模型會變得異常殘酷。這正好解釋了為何視頻生成的成本始終居高不下,也解釋了為何相關服務要么收取高昂價格,要么嚴格限制使用次數。

“AI這玩意貴得離譜,誰也玩不起”這種說法,與其說反映了經濟現實,不如說更符合行業巨頭的利益。現有的行業主導者不斷強調其巨額投入和技術壁壘,可能是在嚇阻潛在的競爭者,并阻止資本投向那些可能挑戰他們的后來者。但只要我們的計算大致準確(尤其是對于輸入密集型任務的處理),那么實現盈利的 AI 推理服務的實際門檻,很可能遠低于人們普遍認知的水平。

我們不應過度炒作成本而讓人忽視了最基本的經濟規律。感覺就像一二十年前,所有人都被超大規模云廠商關于云計算成本的說辭所迷惑,最終放任它們變成了利潤驚人的印鈔機。若此時不夠警惕,我們必將在 AI 推理領域重蹈覆轍。

END

本期互動內容 ??

?您在使用 AI 服務時,感覺哪個環節的成本對服務商挑戰最大?是生成長文本、處理超長上下文,還是高并發請求?您的直觀感受和文中分析的成本結構(輸入廉價/輸出昂貴)一致嗎?

文中鏈接

[1]??https://www.datacenterdynamics.com/en/news/openai-training-and-inference-costs-could-reach-7bn-for-2024-ai-startup-set-to-lose-5bn-report/??

[2]??https://www.wheresyoured.at/wheres-the-money/??

[3]??https://futurism.com/the-byte/openai-chatgpt-pro-subscription-losing-money??

原文鏈接:

??https://martinalderson.com/posts/are-openai-and-anthropic-really-losing-money-on-inference/??


?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
收藏
回復
舉報
回復
相關推薦
亚洲激情国产精品| 国产精品毛片久久久久久| 国内精品免费午夜毛片| 少妇光屁股影院| 成人交换视频| 亚洲国产成人av网| 亚洲高清视频一区| 丰满人妻一区二区三区四区53 | 日本韩国一区二区三区| 在线观看日韩视频| 91福利视频免费观看| 亚洲日本天堂| 亚洲免费伊人电影| 欧美精品国产精品久久久 | 国产黄人亚洲片| 欧美主播福利视频| 国产黄色片在线免费观看| 伊人久久大香线蕉| 日韩情涩欧美日韩视频| 少妇性l交大片| 欧美xxxbbb| 久久精品日产第一区二区三区高清版 | 成人国产精品久久| 色悠悠久久综合| 激情五月婷婷六月| 日本视频不卡| 国产亚洲va综合人人澡精品| 成人资源av| 91丝袜一区二区三区| 亚洲国产高清视频| 草民午夜欧美限制a级福利片| 国产成人福利在线| 欧美日韩一区二区三区在线电影| 日韩一级免费观看| 日本黄色福利视频| 成人h在线观看| 欧美日韩亚洲国产一区| 国产 日韩 欧美在线| 污污在线观看| 亚洲精品乱码久久久久久日本蜜臀| 亚洲高清视频一区| 1pondo在线播放免费| 日本久久综合| 手机精品视频在线观看| 欧美黄网免费在线观看| 美女福利视频在线观看| 国产精品videosex性欧美| 这里只有精品在线播放| 蜜臀久久99精品久久久久久| 伊甸园亚洲一区| 日韩精品久久久久久久玫瑰园| 性色av蜜臀av浪潮av老女人| 久久悠悠精品综合网| 亚洲第一级黄色片| 国产日韩视频一区| 精品精品国产三级a∨在线| 亚洲福利视频免费观看| 亚洲激情 欧美| 日韩高清成人在线| 亚洲人成网站色ww在线| 色哟哟精品观看| 成人vr资源| 色久欧美在线视频观看| 国产老头老太做爰视频| 午夜精品999| 久久久久久伊人| www.国产高清| 石原莉奈在线亚洲三区| 国产伦精品免费视频| 一区二区日韩在线观看| 国产91丝袜在线观看| 国产麻豆乱码精品一区二区三区| 香蕉视频免费看| 久久久99精品免费观看| 亚洲在线欧美| 污污的视频在线观看| 精品动漫一区二区三区| 欧美自拍小视频| 99视频这里有精品| 亚洲成av人乱码色午夜| 国精产品一区一区三区免费视频 | 美女毛片在线观看| 成人免费网址| 国内精品国产成人国产三级粉色| 欧美性猛片xxxx免费看久爱| 国产精品久久久久久9999| 国产极品模特精品一二| 亚洲一区二区久久久| 国产盗摄一区二区三区在线| 日韩图片一区| 国产美女精品视频免费观看| www.com在线观看| wwwwxxxxx欧美| 日日噜噜夜夜狠狠久久丁香五月| h片在线观看视频免费免费| 欧美视频中文一区二区三区在线观看| 999热精品视频| 蜜乳av综合| 欧美成人国产va精品日本一级| 免费观看成人毛片| 国产毛片精品国产一区二区三区| 精品欧美日韩在线| 制服丝袜在线播放| 在线一区二区三区四区| 人妻互换一二三区激情视频| 日本一区二区三区视频| 97超碰蝌蚪网人人做人人爽 | 欧美一区二区三区白人| 国产ts在线播放| 国产一区亚洲| 91影视免费在线观看| 欧美孕妇孕交xxⅹ孕妇交| av大片在线| 婷婷成人综合网| 中文字幕avav| 日韩国产专区| 欧洲日本亚洲国产区| 亚洲第一页视频| 国产精品久久久久久户外露出| 免费国产a级片| 亚洲午夜免费| 久久精品久久精品亚洲人| 日韩精品一区二区亚洲av观看| 国产高清久久久久| 中文字幕免费高| 成人做爰免费视频免费看| 亚洲精品国产精品久久清纯直播 | 色综合天天天天做夜夜夜夜做| 丰满人妻一区二区三区大胸 | 超碰97成人| 免费不卡欧美自拍视频| 日韩xxx视频| 久久久久久亚洲综合| 国产毛片视频网站| 福利欧美精品在线| 欧美精品久久久久久久| www.欧美日本| 亚洲 欧美 激情 另类| 亚洲精选视频在线| 久久成年人网站| 97精品一区| 国产日韩在线播放| 国产98在线| 色哟哟精品一区| 国产美女免费无遮挡| 国产精品一级| 久久久99爱| 中文字幕高清在线播放| 日韩精品在线观看网站| 91久久国产视频| 99视频热这里只有精品免费| 18黄暴禁片在线观看| 久久影院资源站| 777精品视频| 毛片在线能看| 欧美自拍丝袜亚洲| 色偷偷男人天堂| 黄页网站大全一区二区| 国产在线拍揄自揄拍无码| 国产一区2区在线观看| 精品中文字幕视频| 日韩在线视频观看免费| 黄色精品一区二区| 女人十八毛片嫩草av| 久久精品国产**网站演员| 永久域名在线精品| 视频一区在线| 欧美理论在线| 国外成人在线视频| 日本在线视频1区| 欧美在线制服丝袜| 日韩欧美综合视频| 成人精品国产免费网站| 精品人妻一区二区三区四区在线| 啄木系列成人av电影| 国产裸体写真av一区二区| a免费在线观看| 亚洲黄色免费三级| 一区二区三区麻豆| 亚洲午夜久久久| 实拍女处破www免费看| 蜜桃一区二区三区四区| 国产91在线亚洲| 婷婷精品在线观看| 成人观看高清在线观看免费| 高清电影在线免费观看| 一区二区三区视频免费在线观看| 国产又粗又大又爽视频| 亚洲二区在线观看| 91久久精品在线| 国产成人在线免费视频| 国产欧美日韩在线视频| 精产国品一二三区| 久久久久久婷| 亚洲av首页在线| 精品久久视频| 国产福利一区二区三区在线观看| 欧美成人精品三级网站| 欧美成人一二三| 免费在线黄色电影| 日韩精品一区二区三区四区| 亚洲精品毛片一区二区三区| 亚洲影院理伦片| xxxxx99| 99热精品国产| 一级黄色片在线免费观看| 日韩精品国产精品| 无码熟妇人妻av在线电影| 四季av一区二区凹凸精品| 久久久久久亚洲精品不卡4k岛国 | 国产精品无码一区二区三区| 国产一区二区成人久久免费影院| 91精品91久久久中77777老牛 | 久久不射热爱视频精品| 精品一二三区视频| 亚洲激情成人网| 亚洲精品911| 这里只有精品视频在线观看| 国产主播第一页| 精品久久久视频| 黄网站免费在线| 亚洲欧美国产三级| 国产又色又爽又高潮免费| 久久综合999| 182在线视频| 成人综合在线观看| 久久久久久久久久久影视| 麻豆91在线观看| 日本久久精品一区二区| 亚洲综合国产| 大j8黑人w巨大888a片| 国产一区亚洲| 黄色三级中文字幕| 中文无码久久精品| 国产av第一区| 亚洲香蕉av| 一区二区三区一级片| 欧美3p在线观看| 亚洲人成网站在线播放2019| 国内亚洲精品| 污视频在线免费观看一区二区三区| 日本中文字幕在线一区| 精品欧美一区二区在线观看视频 | 亚洲精品理论电影| 色综合视频在线| 精品国产sm最大网站免费看| 亚洲AV无码精品色毛片浪潮| 欧美成人福利视频| 亚洲黄色一级大片| 亚洲福利视频免费观看| 日本高清视频免费看| 亚洲精品国产精品国产自| 亚洲欧美日韩免费| 亚洲无线码在线一区观看| 黄色小视频在线观看| 在线日韩第一页| 137大胆人体在线观看| 久久视频国产精品免费视频在线 | 日本视频久久久| 人人鲁人人莫人人爱精品| 国产精品一久久香蕉国产线看观看 | 美国成人毛片| 按摩亚洲人久久| 日本片在线看| 欧美又大粗又爽又黄大片视频| 成人免费影院| 国产精品自在线| 日韩三级久久| 久久99精品久久久久久久久久| 久久不卡免费视频| 日本伊人色综合网| 国产乱码一区二区三区四区| 国产成人一区在线| 国产精品无码一区二区三区免费 | 日韩免费av电影| 国产大片一区| 和岳每晚弄的高潮嗷嗷叫视频| 亚洲一区成人| 亚洲污视频在线观看| 国产精品18久久久久久久久久久久| 风韵丰满熟妇啪啪区老熟熟女| av午夜一区麻豆| 国产精品情侣呻吟对白视频| 亚洲精品成人少妇| 五月婷婷激情视频| 这里是久久伊人| 欧洲成人av| 欧美精品日韩三级| 电影一区二区三| 亚洲伊人一本大道中文字幕| 亚洲精品aaaaa| 国产又大又长又粗又黄| 国产日韩亚洲| 亚洲一二区在线观看| 91老师片黄在线观看| 国产97免费视频| 91精品1区2区| 日本高清视频免费观看| 日韩在线观看免费全| 亚洲永久av| av蓝导航精品导航| 成人精品影视| 国产二级片在线观看| 狠狠色丁香九九婷婷综合五月| 国产又粗又长又爽| 亚洲美女偷拍久久| 凹凸精品一区二区三区| 日韩成人av网| 色图在线观看| 国产欧美日韩视频| 蜜桃精品wwwmitaows| av在线免费观看国产| 久久爱www久久做| 在哪里可以看毛片| 艳妇臀荡乳欲伦亚洲一区| 成人午夜精品视频| 日韩精品极品视频| 岛国毛片av在线| 亚洲xxxx在线| 天天射天天综合网| 久久偷窥视频| 97人妻精品一区二区三区| 日韩三区在线观看| 免费观看成人高潮| 国产精品美乳在线观看| 亚洲男人都懂第一日本| 免费看国产曰批40分钟| 国产精品资源在线观看| 天天看天天摸天天操| 欧美三级韩国三级日本一级| 国产美女视频一区二区三区 | 警花观音坐莲激情销魂小说| 蜜臀国产一区二区三区在线播放 | 国产精品黄页免费高清在线观看| 欧美成a人免费观看久久| 轻点好疼好大好爽视频| 国产成人精品亚洲日本在线桃色| 免费成年人视频在线观看| 欧美老女人在线| 麻豆视频在线观看免费网站| 国产精品久久久久久久久免费| 夜夜春成人影院| 日本精品久久久久中文字幕| 久久精品日产第一区二区三区高清版| 日本三级小视频| 亚洲欧美国产精品va在线观看| 欧美男男tv网站在线播放| 狠狠色伊人亚洲综合网站色| 亚洲黄色成人| 国产成人无码一区二区在线观看| 欧美日韩国产专区| 免费av在线电影| 国产精品高精视频免费| 久久高清精品| 男人的天堂最新网址| 亚洲精品中文在线影院| 性一交一乱一乱一视频| 国内精品久久久久久久久| 人妖一区二区三区| 成年人在线观看视频免费| 亚洲欧洲成人精品av97| 99精品在线看| 8x拔播拔播x8国产精品| 狠狠色狠狠色综合婷婷tag| 亚欧在线免费观看| 一区二区三区在线观看视频| 黄色片一区二区三区| 秋霞av国产精品一区| 成人综合久久| 中文字幕永久免费| 欧美特级www| 一级日本在线| 成人免费看片网址| 久久久天天操| 精品人妻伦九区久久aaa片| 亚洲国产精品国自产拍av秋霞| 在线免费日韩片| 一本一生久久a久久精品综合蜜 | 无码国产69精品久久久久同性| 欧美三级电影一区| 日韩电影免费观看| 欧美日韩综合另类| 国产一区视频导航| 波多野结衣视频网站| 日韩在线视频观看正片免费网站| 538任你躁精品视频网免费| 成人免费观看视频在线观看| 一区精品在线播放| 性xxxfllreexxx少妇| 国产精品美乳在线观看| 99av国产精品欲麻豆| 国产精品理论在线| 久操成人av| 国产精品区在线| 午夜精品福利在线| 麻豆传媒在线免费看| 精品久久久久久一区| 久久99国产精品麻豆| 久久久久久久久久久久久av| 久久亚洲精品一区|