精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

AI 成本賬:LLM 推理成本鏈條分析

發布于 2025-7-11 07:20
瀏覽
0收藏


一、背景

最近看到 SemiAnalysis 團隊制作了一個《AI Token Factory Economics Stack》的圖片(來自 SemiAnalysis (@SemiAnalysis_) / X [1]),深入分析了 LLM 推理成本鏈條中各個參與者的成本與利潤情況,涵蓋從硬件資本支出(Neocloud)、推理服務提供商(Inference Providers)到終端應用層(Applications)的全棧視角,并且以 H200 GPU 為例,進行定量分析。

AI 成本賬:LLM 推理成本鏈條分析-AI.x社區

考慮到之前主要關注整體的 CapEx(資本成本)和 Opex(運維成本),因此借此機會進一步理解成本計算的相關邏輯和方式。

二、Neocloud(基礎設施)

Neocloud 主要是云廠商,提供 GPU 租賃服務,比如 Lambda、Vast.ai、Oracle Cloud 等。

2.1 關鍵概念

Capital Cost per GPU(資本支出):可以理解為一次性支出的買入價,是資產價格。

Colocation Cost(托管成本):指將 GPU 服務器放入一個已有數據中心機房中,由該數據中心提供電力、冷卻、物理空間、安全、網絡接入等基礎設施服務所需支付的費用。簡單理解就是:“我出設備,你出機房+電力+空調+網絡,我按月支付托管費用?!?/p>

Cost of Capital(資本成本率):使用這筆資金(一次性支出的資產成本)必須計算“時間成本”,比如一個企業獲得一個 GPU 有兩種方式:

  • 現金購買 GPU(自有資金):這些錢本可以去買理財、股票,比如年回報 ≥13.3%。
  • 貸款買 GPU(外部融資):銀行利率是 13.3%。

2.2 數據指標

核心數據:

  • Capital Cost per GPU(每張 H200 GPU 的資本支出):$34,698
  • Colocation Cost(托管成本):$130 / kW / 月
  • Electricity Cost(電費):$0.087 / kWh
  • Cost of Capital(資本成本率):13.3%/年
  • 這些值用于計算 GPU 的總擁有成本(TCO)為: $1.66/hr/GPU。

收益指標:

  • Neocloud Pre-tax Profit Margin(稅前利潤率):16.8%
  • Neocloud Rental Price(對外出租價格):$2.00/hr/GPU

總結:說明云廠商通過租賃 GPU,可以獲得 16.8% 的利潤空間。

2.3 計算方式

2.3.1 CapEx

其中的 Capital Cost per GPU 和 Cost of Capital 共同構成了我們常說的 CapEx,通常將其在 GPU 的使用生命周期內進行攤銷。業內常見最短的攤銷周期是 3 年,主要是 AI 硬件的更新迭代周期往往不會超過 3 年;AI 模型、應用場景也在不斷演進,3 年后通常也會有更有性價比的 GPU 出現。然而,即使新的 GPU 開始投入使用,上一代 GPU 仍可持續發揮一定性能價值。在公司內,通常會進一步將攤銷周期延長到 4 年甚至 5 年。

如果按照 3 年的攤銷周期,則相應的成本為:

34698*(1+13.3%*3)/(3 * 365 * 24) = $1.847/hr/GPU

如果按照 4 年的攤銷周期,則相應的成本為:

34698*(1+13.3%*4)/(4 * 365 * 24) = $1.517/hr/GPU

如果按照 5 年的攤銷周期,則相應的成本為:

34698*(1+13.3%*5)/(5 * 365 * 24) = $1.319/hr/GPU

當然,有些時候也會采用年金法按固定時間周期(比如每年)平均“攤銷”,則對應的年金 A 可以表述為(假設還是按照 4 年的攤銷周期):

AI 成本賬:LLM 推理成本鏈條分析-AI.x社區

則相應的成本為:

11928/(365*24) = $1.362/hr/GPU

2.3.2 Opex

其中 Opex 主要對應上述的 Colocation Cost 和 Electricity Cost,折算到每 GPU 每小時的成本為:

Colocation Cost:130 / 30 / 24 ≈ $0.181/hr/GPU

Electricity Cost:0.7kW × $0.087 = $0.061/hr/GPU

H100/H200 GPU 的峰值功耗為 700W,而 8 卡 DGX H100/H200 的峰值功耗為 10.2kW(還額外包括 CPU、散熱等其他組件)。實際整機的最大功耗通常只能達到 70%-80% 左右,因此平均到每個 GPU 的功耗可能在 1kW 左右,考慮到 GPU 并非始終滿載運行,且這里的電力成本占比相對較小,故依然按 700W 進行估算。綜上,總的 Opex 為:

0.181 + 0.061 = $ 0.242/hr/GPU?

?2.3.3 TCO

基于上述 CapEx 和 Opex 可以推出大概的 TCO(Total Cost of Ownership)為:

3 年期攤銷:1.847 + 0.242 = $2.089/hr/GPU

4 年期攤銷:1.517 + 0.242 = $1.759/hr/GPU

5 年期攤銷:1.319 + 0.242 = $1.561/hr/GPU

4 年期攤銷(年金法):1.362 + 0.242 = $1.604/hr/GPU

而上述表格中估計的 TCO 為 $1.66/hr/GPU,而實際的租賃價格 Neocloud Rental Price 為 $2/hr/GPU。由此可見,以約 4 年期攤銷為基礎的成本估算較為合理,按照上述價格,Neocloud 大概有 16.8% 的利潤空間。?

2.4 補充

?需要說明的是,隨著供需關系變化、硬件及算法的迭代,GPU 租賃的價格往往會隨著時間的發展逐漸降低,上述只是比較粗略的計算方式。

比如說,H100 剛上市時的租賃價格甚至高達 $8/hr/GPU,一年前也有 $4-$5 左右。如下圖所示,一年前 Lepton AI 上 H100 的租賃價格為 $4.2/hr/GPU。?

AI 成本賬:LLM 推理成本鏈條分析-AI.x社區

而現在(更新于 2025 年 6 月 25 日)很多云廠商的價格已經下降到 $2-$3 之間。此外,對于大客戶或長期租賃通常還能拿到更低的價格(來自:Nvidia H100 - GPU Price Comparison [2]):

AI 成本賬:LLM 推理成本鏈條分析-AI.x社區

三、Inference Provider(推理服務提供商)

3.1 資產成本與利用率

?其中的主要成本是 GPU 租賃成本,也就是上述由 Neocloud 決定的 $2.00/hr/GPU。

租賃的 GPU 不可能 100% 使用,對于 Online 流量(比如 OpenAI 的在線 Chat 場景),受流量波動影響,GPU 難以實現持續滿負荷運行。此時,可以考慮使用 Offline 流量(比如 Batch Process,當然價格可能更便宜)來充分利用波谷的空閑資源。圖中作者簡化為 Effective Utilization Rate(有效利用率)為 75%,也就是 GPU 只有 75% 的有效使用。?

3.2 推理成本

AI 成本賬:LLM 推理成本鏈條分析-AI.x社區

3.3 銷售定價 & 利潤率

?在資產成本與利用率確定的情況下,Inference Provider 想要提升利潤率的主要手段就是提升 LLM 推理性能,降低推理成本。這里作者以 TRT-LLM 框架為例,使用 FP8 推理,以保證盡可能的高效推理。以 1K 輸入 + 4K 輸出(總共 5K Token)為例,其推理耗時 190s,吞吐可以達到 442 Tokens/s/GPU。

基于上述數據可以推算出:

有效 Tokens/hr/GPU:442 * 3600 * 75% = 1,193,400

考慮到 GPU 租賃成本為 $2,則每百萬 Token 成本為:

Inference Compute Cost:2 / 1,193,400 * 1,000,000 = $1.676

相比于輸入、輸出 Token 按照相同價格計費的方式,輸入輸出分別計價的方式會更加靈活,比如 OpenAI 就是這種方式。并且其早期的定價策略為:輸出價格為輸入價格的 3 倍。后來都改成 4 倍,如下圖所示。對于用戶而言,如果是長輸入、短輸出的場景(比如文獻總結、知識庫等),使用這種方式也許可以獲得更低的總成本。?

四、Application(應用產品)

Application 主要是 ChatGPT、Perplexity、Claude、Notion AI、Cursor 等終端產品。

4.1 用戶層面關鍵數據

假設每個用戶每月使用 Token 數量為:6M Tokens。

Token 單價為:$2.00 / M Tokens。

每月活躍用戶數(MAU)為:1.8M。

月均用戶收入(Average Revenue per User):$20。

4.2 利潤率

基于上述數據可以得出:

每月每用戶毛利(Gross profit per User per Month):20 - 6 * 2 = $8

應用層毛利率(Application Gross Margin):(20 - 8) / 20 = 40%

五、利潤率優化

考慮到上述 3 層中每一層都需要保留比較可觀的利潤率,那么針對不同的“用戶”也就可以針對性的采用相應的方案來降低成本。

5.1 個人或小規模初創公司

對于個人或小規模初創公司,可以考慮從直接使用按月付費的應用切換為使用推理服務提供商的 API,然后接入支持自定義 API 的應用或者開源替代,甚至可以考慮自研應用。

當然,直接使用推理服務提供商的 API 也存在一定問題,例如可能帶來額外的模型切換成本。此時也可以考慮 OpenRouter 這類 AI 模型聚合 + API 中介平臺。它類似于 AI 模型的 API 市場,為開發者和用戶提供各種 LLM 的統一入口,用戶通過一個統一的 API,就能調用多個不同廠商的模型,減少開發和切換成本。

OpenRouter 這類平臺主要靠如下幾種模式獲得利潤:

  • API 調用抽成 / 加價(最主要)

對通過平臺調用模型的 API 收取費用,并在推理服務提供商的價格基礎上加價。

允許開發者主動注冊并接入自有模型,平臺提供計費、鑒權等能力,并從其中抽成。

  • 用戶訂閱 / 使用套餐

類似于 OpenAI 的包月服務。

  • 增值服務

比如提供額外的日志、統計分析、鑒權等服務。

5.2 中型公司

對于中等規模的公司,可以考慮進一步跳過推理服務提供商,直接從 Neocloud 廠商租賃 GPU,然后獨立部署相應的模型。當然,這個前提是使用的開源模型或者自研的模型。

針對這個場景,也需要“用戶”儲備相應的 LLM 部署、優化能力,并且購買或者自建相應的依賴組件。

5.3 大型公司

對于大型公司或者有巨大流量的中小型公司,直接跳過上述的 3 層,自建 IDC 必然是最優的選擇,可以直接將成本降到最低。當然,也會帶來額外的負擔:

  • 一次性投入成本大。
  • 相應的人力成本、運維成本增加。
  • 彈性擴展能力降低,比如 Neocloud 上可以快速 Scale-out,而自建 IDC 需要考慮更長遠的規劃。(PS:這也是各大廠既有自用 IDC,又有公有云的一個顯著優勢)
  • 資源利用率低,需要考慮容災,也會有各種各樣的場景,整體資源利用率可能不如預期。

自建 IDC 也有兩種常見的方式,一種是完全自建,還有一種是租用機房并托管自有服務器的方式。

資源利用率可從兩個維度衡量:其一是 GPU 的使用率(例如 GPU Util);其二是算力利用效率(如 Tensor Active 或 MFU 指標)。

    ?六、參考鏈接

  1. ??https://x.com/SemiAnalysis_??

  2. ??https://getdeploying.com/reference/cloud-gpu/nvidia-h100??


本文轉載自??AI閑談????,作者:AI閑談





收藏
回復
舉報
回復
相關推薦
97精品国产97久久久久久| 欧美日韩免费在线视频| 久久超碰亚洲| 中文字幕人妻一区二区三区视频| 成人网18免费网站| 欧美一二三区在线| 播放灌醉水嫩大学生国内精品| 99久久精品国产色欲| 亚洲国产裸拍裸体视频在线观看乱了中文 | 日p在线观看| 国产伦精品一区二区三区免费迷 | 麻豆精品蜜桃一区二区三区| 亚洲免费视频二区| 亚洲国产91| 中文国产亚洲喷潮| 日韩无码精品一区二区| 精品网站在线| 偷窥少妇高潮呻吟av久久免费| 性欧美精品一区二区三区在线播放 | 国产精品久久久久久超碰| 久久久久99精品成人片试看| 日本亚洲不卡| 欧美一二三区精品| 国产九九在线视频| 美女扒开腿让男人桶爽久久软| 亚洲国产精品99久久久久久久久| 国产精品久久久久久久天堂第1集 国产精品久久久久久久免费大片 国产精品久久久久久久久婷婷 | 日韩av一区二区三区美女毛片| 精品人妻无码一区二区| 日韩不卡手机在线v区| 欧美国产日产韩国视频| 女教师淫辱の教室蜜臀av软件| 欧美在线导航| 欧美tk丨vk视频| 亚洲一级片av| 欧美精品高清| 欧美性极品少妇精品网站| 日本aa在线观看| 粗大黑人巨茎大战欧美成人| 中文字幕不卡三区| 欧美精品七区| 性感美女一级片| 成人性生交大合| 91亚色免费| 国产女人爽到高潮a毛片| 青青国产91久久久久久| 欧洲亚洲免费视频| 制服.丝袜.亚洲.中文.综合懂色| 欧美日韩国产精品一区二区亚洲| www.久久撸.com| 手机毛片在线观看| 国产一区二区三区网| 亚洲精品在线91| 亚洲人人夜夜澡人人爽| 欧美日韩破处| 亚洲男人天堂九九视频| 一女三黑人理论片在线| 日韩高清在线免费观看| 日韩成人黄色av| 中文字幕乱码一区| 久久男人av| 亚洲精品日韩久久久| 韩国无码一区二区三区精品| 色狼人综合干| 亚洲美女激情视频| 五月天综合视频| 精品视频网站| 日韩最新av在线| 疯狂撞击丝袜人妻| 亚洲欧美一级二级三级| 欧美激情精品久久久久久大尺度 | 亚洲网友自拍偷拍| 日韩国产一级片| 春色校园综合激情亚洲| 亚洲3atv精品一区二区三区| 两根大肉大捧一进一出好爽视频| 澳门成人av网| 欧美一a一片一级一片| 在线免费观看视频黄| 最新亚洲国产| 精品国产乱码久久久久久夜甘婷婷 | 偷拍自拍在线看| 色一情一乱一乱一91av| 久久午夜夜伦鲁鲁一区二区| 日本一区二区中文字幕| 欧美成人精精品一区二区频| 国产综合内射日韩久| 伊人春色之综合网| 日韩在线观看成人| 久久成人在线观看| 欧美专区在线| 91精品国产综合久久香蕉的用户体验| 国产美女三级无套内谢| 成人黄色在线视频| 亚洲二区自拍| 黑人精品视频| 欧美自拍偷拍午夜视频| 激情久久综合网| 青青视频一区二区| xvideos国产精品| 日韩毛片在线播放| 蜜臀久久99精品久久久久宅男 | 美女一区2区| 综合国产在线视频| 国产 日韩 欧美 成人| 久久狠狠一本精品综合网| 成人黄色免费看| 无码国产精品高潮久久99| 中文无字幕一区二区三区| av在线播放天堂| 99久久久国产精品免费调教网站| 日韩精品中文字幕一区二区三区| 欧美多人猛交狂配| 欧美成人久久| 国产精品久久久久久久一区探花 | 激情偷乱视频一区二区三区| 国产精品区一区二区三含羞草| 蜜桃视频在线入口www| 一区二区三区在线观看动漫 | 狠狠网亚洲精品| 免费在线成人av| 欧美性爽视频| 欧美精品一二三| 玖玖爱在线观看| 好看不卡的中文字幕| 国产日韩欧美日韩| 蜜桃视频在线免费| 性做久久久久久久久| 91精产国品一二三产区别沈先生| 青青草这里只有精品| 久久91超碰青草是什么| 在线观看日批视频| 久久新电视剧免费观看| 4444亚洲人成无码网在线观看| 日日av拍夜夜添久久免费| 精品国产sm最大网站免费看| 91久久国产综合| 久久精品国产免费看久久精品| 久久久影院一区二区三区| 黄色影院在线看| 日韩欧美电影一区| 2025国产精品自拍| 美国一区二区三区在线播放| 日韩高清国产一区在线观看| 成人香蕉视频| 国产视频自拍一区| 国产精品免费av一区二区| 国产精品99久久久久久似苏梦涵| 在线视频福利一区| 国产精品蜜月aⅴ在线| 一区二区三区视频免费在线观看| www.久久久久久久| jvid福利写真一区二区三区| 性一交一乱一伧国产女士spa| 亚洲日本va中文字幕| 久久999免费视频| 精品人妻一区二区三区含羞草| 一区二区视频免费在线观看| 久久aaaa片一区二区| 欧美日韩视频| 国产欧美一区二区视频 | 日韩美女中文字幕| 神马久久高清| 91久久精品一区二区三| 三上悠亚影音先锋| 日韩av午夜在线观看| 亚洲高清在线观看一区| 欧美黄页在线免费观看| 久久福利视频导航| 性做久久久久久久| 亚洲aaa精品| 高潮毛片无遮挡| 麻豆91在线播放免费| 永久免费在线看片视频| 日本伊人久久| 2018日韩中文字幕| 成人午夜电影在线观看| 欧美高清你懂得| 好吊色视频在线观看| 不卡高清视频专区| 黄色一级免费大片| 天天超碰亚洲| 国产亚洲第一区| 国产成人免费9x9x人网站视频 | 欧美在线|欧美| 国产性生活大片| 成人97人人超碰人人99| 成人黄色一区二区| 亚洲天堂一区二区三区四区| 国产日韩在线一区二区三区| 理论不卡电影大全神| 中文字幕国产亚洲2019| 亚洲国产www| 色视频成人在线观看免| 视频这里只有精品| av不卡免费在线观看| 成人性生交免费看| 国产综合久久| 欧洲亚洲一区| 日韩欧美一级| 国产精品成人品| av最新在线| www.xxxx精品| 欧美日韩伦理片| 91精品国产一区二区人妖| 国产成人在线免费观看视频| 国产精品久久久久久久久搜平片 | 久久亚洲私人国产精品va媚药| www.久久91| 一区二区毛片| 欧美少妇一级片| 国产一区二区在线| 国产伦精品一区二区三区照片| 欧美一级网址| 热久久这里只有精品| 在线视频中文字幕第一页| 亚洲午夜国产成人av电影男同| 亚洲免费成人网| 欧美日韩免费一区二区三区| 91美女免费看| 亚洲韩国精品一区| √天堂中文官网8在线| 久久九九久久九九| 日韩av手机在线播放| 国产精品综合一区二区三区| 国产理论在线播放| 美女精品在线观看| 久久99中文字幕| 一本一本久久a久久综合精品| 日韩欧美一区二区在线观看 | 亚洲欧美精品| 精品在线观看入口| 精品国产免费一区二区三区 | 日韩高清中文字幕一区| 男人的天堂狠狠干| 欧美三区美女| 伊人再见免费在线观看高清版| 91综合在线| 亚洲一区二区四区| 第一sis亚洲原创| 日韩欧美精品久久| 国产一区二区三区四区| 欧美人与物videos另类| 无码少妇一区二区三区| 精品中文字幕人| 中文无码日韩欧| 国产成人精品福利一区二区三区| 日本免费一区二区三区视频| 亚洲va欧美va在线观看| 青草综合视频| 成人a视频在线观看| 亚洲综合资源| 亚洲free性xxxx护士hd| 亚洲精品aaa| 亚洲精品免费一区二区三区| 国产一区二区三区黄网站| 91色视频在线导航| 国产美女精品视频免费播放软件| 成人精品久久一区二区三区| www.成人在线.com| 91久久国产综合久久蜜月精品| 免费一区二区三区在线视频| 777久久精品一区二区三区无码 | 91黑丝高跟在线| 美女免费久久| 欧美成人免费全部| 久久香蕉一区| 97在线精品视频| 欧美日韩免费看片| 国产精品露脸自拍| 白嫩亚洲一区二区三区| 97视频中文字幕| 黑人久久a级毛片免费观看| 国产视频一区二区不卡| 日韩电影不卡一区| 日韩欧美亚洲日产国| 888久久久| 日韩免费视频播放| 日韩国产精品久久久| 在线观看日本一区二区| 粉嫩av亚洲一区二区图片| 中出视频在线观看| 国产蜜臀97一区二区三区| 成年人二级毛片| 亚洲国产精品麻豆| 无码视频在线观看| 日韩一区二区视频在线观看| 婷婷在线观看视频| 色黄久久久久久| 污污视频在线看| 国产91亚洲精品| 美女国产精品久久久| 久久av免费观看| 亚欧美无遮挡hd高清在线视频| 国产va亚洲va在线va| 男女激情视频一区| 少妇极品熟妇人妻无码| 国产午夜精品一区二区三区视频 | 亚洲高清免费观看| 尤物视频免费观看| 欧美成人aa大片| 波多野结衣一区二区| 欧美高清视频在线| 韩国成人在线| 国内成+人亚洲| 围产精品久久久久久久| 欧美黄色免费影院| 国产精品一区二区男女羞羞无遮挡| 波多野结衣 在线| 亚洲综合色视频| 在线免费一级片| 亚洲欧美国产精品va在线观看| 91精品久久| 国产精品色悠悠| 曰本一区二区三区视频| 黄色小视频大全| 七七婷婷婷婷精品国产| a视频免费观看| 亚洲一区二区三区四区五区中文 | 欧美xxxx老人做受| 91吃瓜网在线观看| 欧美专区中文字幕| 成人盗摄视频| 91传媒免费视频| 久久精品国产亚洲一区二区三区| 无码精品一区二区三区在线播放| 一区二区三区免费在线观看| 亚洲一卡二卡在线| 亚洲日韩欧美视频| 擼擼色在线看观看免费| 国产乱子伦精品| 欧美日韩国产高清| 国产伦精品一区二区三区妓女下载 | 欧美777四色影| 爱豆国产剧免费观看大全剧苏畅| 国产亚洲成av人在线观看导航| 亚洲 欧美 视频| 精品免费国产一区二区三区四区| 亚洲无线看天堂av| 亚洲va欧美va国产综合久久| 五月天综合网站| 爱豆国产剧免费观看大全剧苏畅| 国产精品福利在线播放| 中文字幕一区二区三区波野结| 国产一区二区三区在线视频 | 精品人妻一区二区乱码| 最新日韩av在线| 一区二区美女视频| www.日韩不卡电影av| 91麻豆精品| 日本xxx免费| 国产精品影视网| 久草视频免费在线播放| 精品捆绑美女sm三区| 秋霞在线视频| 国产欧美日韩综合一区在线观看| 日韩天堂av| 久操视频免费看| 欧美视频在线一区| 国产丝袜在线| av在线不卡一区| 亚洲精选一区| 亚洲精品视频久久久| 欧美性大战久久久久久久蜜臀| 成人18在线| 成人午夜激情免费视频| 你懂的一区二区| xfplay5566色资源网站| 欧美日韩国产精品一区二区三区四区 | 狂野欧美一区| 国产又粗又长又黄的视频| 777xxx欧美| 欧美人与性动交α欧美精品济南到| 国产尤物99| 日本人妖一区二区| 成人免费毛片xxx| 亚洲精品xxxx| 小明成人免费视频一区| 黑人巨茎大战欧美白妇| av毛片久久久久**hd| 中文字幕免费播放| 欧美噜噜久久久xxx| 丝袜久久网站| 日韩不卡一二三| 亚洲午夜精品在线| 国产黄色在线| 97超碰人人看人人 | av免费一区二区| 亚洲一区二区三区影院| 国产尤物视频在线| 91传媒视频在线观看| 久久精品主播| 亚洲国产精品久| 亚洲欧美成人精品| 高清不卡一区| av天堂永久资源网| 亚洲免费观看高清完整| 你懂得在线网址| 国产精成人品localhost| 天堂精品中文字幕在线|