警惕!ChatGPT爆火下的能耗危機,數據中心運營商挑戰巨大
近期,美國OpenAI公司旗下智能聊天工具ChatGPT刷爆社交媒體,吸引超百億美元投資,推動了資本市場布局人工智能應用的巨大熱潮,風頭一時無兩。

微軟率先宣布砸100億美金入股OpenAI,然后亞馬遜和美版“今日頭條”BuzzFeed宣布將在日常工作中啟用ChatGPT,同時,百度也宣布于3月推出“中國版”的ChatGPT聊天機器人。在多家科技公司推波助瀾后,ChatGPT瞬間引發全球關注。
數據顯示,亞馬遜部署的機器人數量正在快速增加,每天增量達到1000個左右。此外,臉書母公司Meta也計劃2023年在數據中心上額外投入40億至50億美元,預計將全部用于人工智能。IBM首席執行官克里希納表示,人工智能預料到2030年將為全球經濟貢獻16萬億美元。
隨著ChatGPT的大火,2023年各巨頭或將在人工智能領域掀起新一輪鏖戰。
然而,當ChatGPT-3預測出現下一個的單詞時,就需要進行多次推斷計算,因此占用大量的資源,并耗費更多的電力。而為支持云計算、視頻流媒體和5G網絡的爆炸式增長而擴建的數據中心基礎設施,其GPU和CPU架構不能有效地運行以滿足迫在眉睫的計算需求,這為超大規模數據中心運營商帶來巨大的挑戰。
GPT3.5 的訓練使用了微軟專門建設的AI計算系統,由1萬個 V100 GPU 組成的高性能網絡集群,總算力消耗約 3640 PF-days (即假如每秒計算一千萬億次,需要計算3640 天)。如此大規模、長時間的 GPU 集群訓練任務,對網絡互聯底座的性能、可靠性、成本等各方面都提出極致要求。
例如,Meta宣布暫停在全球范圍內的數據中心擴建,重新配置這些服務器群,以滿足人工智能的數據處理需求。
人工智能平臺對數據處理的需求是巨大的,ChatGPT的OpenAI創建者在去年11月推出該平臺,如果不搭上微軟即將升級的Azure云平臺的便車,它將無法繼續運行。
支持這一數字轉型的數據中心基礎設施——將像人腦一樣被組織成兩個半球或葉,一個葉需要比另一個葉強得多。一個半球將服務于所謂的“訓練”,處理多達300B個數據點所需的計算能力,以創建ChatGPT生成的單詞沙拉。
訓練瓣需要強大的計算能力和最先進的GPU半導體,但在支持云計算服務和5G網絡的數據中心集群中,目前所需要的連接性很少。
同時,專注于“培訓”每個人工智能平臺的基礎設施將對電力產生巨大的需求,要求將數據中心設置在千兆瓦可再生能源附近,安裝新的液體冷卻系統,以及重新設計的備用電源和發電機系統,以及其他新的設計特點。
人工智能平臺大腦的另一個半球,被稱為“推理”模式的更高功能的數字基礎設施支持交互式“生成”平臺,這些平臺在輸入問題或指令后的幾秒鐘內,對查詢進行處理,進入建模的數據庫,并以令人信服的人類語法作出響應。
雖然如今的超連接數據中心網絡,如北美最大的數據中心集群,北弗吉尼亞州的“數據中心”也擁有最廣泛的光纖網絡,可以適應人工智能大腦“推斷”葉的下一級連接需求,但這些設施也需要升級,以滿足所需的巨大處理能力,并且它們需要更靠近變電站。
此外,有調研機構數據顯示,數據中心已然成為全球最大的能源消費者,占總用電量的比例將從2017年的3%上升到2025年的4.5%。以中國為例,2030年全國運營的數據中心用電量預計將超過4000億度,占全國總用電量的4%。
因此,即使是數字產品也需要能源來開發和消耗,ChatGPT也不例外,據估計,機器學習工作中推理處理占算力消耗的80-90%,粗略計算,自ChatGPT于2022年11月30日上線以來,碳排放已超過814.61噸。
據專業機構測算,假設托管在微軟的Azure云上的ChatGPT每天有100萬用戶咨詢(在特定的響應時間和詞匯量下,每天約29,167小時),按A100 GPU的最高功率407W(瓦特)計算,每天碳排放達到3.82噸,每月排碳超過100噸。如今ChatGPT日訪問用戶超過1000萬,實際排碳量要遠超每月100噸。除此之外,訓練這樣一個包含1750 億參數的語言大模型,需要上萬個 CPU/GPU 24 小時不間輸入數據,大概消耗1287MWh的電力,二氧化碳排放量超過552噸。

從這些大型語言模型的碳排放來看,ChatGPT前身GPT-3碳排放最大。據悉,美國人平均每年產生16.4噸碳排放,丹麥人平均每年產生11噸碳排放。因此,ChatGPT的模型訓練碳排放多于50個丹麥人每年的碳排放。
云計算供應商們也認識到數據中心使用了大量電力,并采取了提高效率的方法措施,例如在北極建設和運營數據中心,以利用可再生能源和自然冷卻條件。不過,這還不足以滿足AI應用爆炸式增長的需求。
美國勞倫斯伯克利國家實驗室在研究中發現,在過去20年,數據中心效率的提高一直在控制能耗的增長,但研究表明,現在的能效措施可能不足以滿足未來數據中心的需求。
人工智能產業現在正處于一個關鍵的轉折點。生成式AI、圖像識別和數據分析的技術進步揭示了機器學習獨特的聯系和用途,但首先需要建立一個能夠滿足這一需求的技術解決方案,因為根據Gartner的預測,除非目前能提供更可持續的選擇,否則到2025年,AI消耗的能源將超過人類活動所消耗的能源。?



























