性能并非唯一優(yōu)勢(shì),為何說(shuō)全閃存成為AI時(shí)代數(shù)據(jù)存儲(chǔ)的必選項(xiàng)
原創(chuàng)從自然語(yǔ)言處理領(lǐng)域的智能對(duì)話系統(tǒng),到計(jì)算機(jī)視覺(jué)中的圖像識(shí)別與生成,AI 應(yīng)用的廣泛落地,對(duì)數(shù)據(jù)中心存儲(chǔ)系統(tǒng)提出了更高的要求。以DeepSeek為例,實(shí)時(shí)生成文本、圖像、視頻的AI模型,其訓(xùn)練和推理過(guò)程需要百GB/s級(jí)帶寬、毫秒級(jí)延遲響應(yīng)、EB級(jí)存儲(chǔ)容量,這就需要更高性能、更大容量和更加穩(wěn)定可靠的存儲(chǔ)產(chǎn)品。

提到AI時(shí)代的數(shù)據(jù)存儲(chǔ),就不得不說(shuō)全閃存存儲(chǔ)。憑借數(shù)GB每秒的順序讀速度和1GB每秒的順序?qū)懰俣龋W存存儲(chǔ)能夠很好地滿足AI應(yīng)用需求。可以說(shuō),性能已經(jīng)成為企業(yè)選擇全閃存存儲(chǔ)的重要參考依據(jù)。
在筆者看來(lái),除了性能之外,相比傳統(tǒng)的HDD存儲(chǔ)解決方案,全閃存存儲(chǔ)在整體擁有成本、可靠性等方面擁有更具優(yōu)勢(shì)。本篇文章,我們不再介紹全閃存存儲(chǔ)的性能,重點(diǎn)來(lái)談一談全閃存存儲(chǔ)在其他方面有哪些優(yōu)勢(shì)。
一是在整體擁有成本方面,全閃存存儲(chǔ)優(yōu)勢(shì)更加明顯。當(dāng)前階段,每TB的HDD售價(jià)的確要比SSD便宜3—4倍左右。不過(guò),在一套存儲(chǔ)系統(tǒng)中,不僅要看每塊硬盤的成本,還要考慮能耗、單位存儲(chǔ)密度、機(jī)房占地面積等綜合成本。
隨著數(shù)據(jù)中心規(guī)模的不斷擴(kuò)大,能耗問(wèn)題已經(jīng)成為用戶關(guān)注的焦點(diǎn)話題。作為數(shù)據(jù)中心的一部分,存儲(chǔ)系統(tǒng)的節(jié)能問(wèn)題變得越來(lái)越重要。相比傳統(tǒng)機(jī)械硬盤,閃存在能耗方面具有顯著優(yōu)勢(shì)。
我們知道,傳統(tǒng)機(jī)械硬盤在工作時(shí),需要電機(jī)帶動(dòng)盤片高速旋轉(zhuǎn),磁頭在盤片上尋道讀寫數(shù)據(jù),這一過(guò)程消耗了大量的電能。而閃存的工作原理決定了其能耗主要集中在芯片的電信號(hào)驅(qū)動(dòng)上,無(wú)需機(jī)械部件的運(yùn)轉(zhuǎn),因此能耗大幅降低。
數(shù)據(jù)顯示,每一塊全閃存相較于HDD,能耗可節(jié)約33%。以OceanStor Pacific 9920/9928全閃存非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)為例,由于采用高效數(shù)據(jù)縮減算法,每TB功耗低至0.25W。
在大規(guī)模數(shù)據(jù)中心中,存儲(chǔ)設(shè)備的能耗是整個(gè)數(shù)據(jù)中心能耗的重要組成部分。采用閃存存儲(chǔ)能夠有效降低數(shù)據(jù)中心的整體能耗。例如,某大型互聯(lián)網(wǎng)公司的數(shù)據(jù)中心,在將部分傳統(tǒng)機(jī)械硬盤存儲(chǔ)替換為全閃存存儲(chǔ)后,存儲(chǔ)系統(tǒng)的能耗降低了30%以上,每年節(jié)省的電費(fèi)高達(dá)數(shù)百萬(wàn)元。同時(shí),由于閃存存儲(chǔ)產(chǎn)生的熱量較少,數(shù)據(jù)中心的散熱系統(tǒng)負(fù)載也相應(yīng)減輕,進(jìn)一步降低了能源消耗。
除此之外,由于閃存功耗低、體積小的特性,在相同的單位面積內(nèi),能夠部署更多的存儲(chǔ)容量,有效降低了機(jī)房的占地面積,更好地節(jié)省了企業(yè)的開支。
最后,在全閃存?zhèn)浞菀惑w機(jī)存儲(chǔ)產(chǎn)品采用重刪壓縮技術(shù),也能夠進(jìn)一步降低全閃存儲(chǔ)的存儲(chǔ)成本。例如,OceanProtect X3000/X6000最高實(shí)現(xiàn)了72:1的重刪除壓縮率,大大節(jié)省了數(shù)據(jù)備份的存儲(chǔ)容量。
二是在可靠性方面,全閃存存儲(chǔ)也有著更加明顯的優(yōu)勢(shì)。我們知道,對(duì)于AI應(yīng)用來(lái)說(shuō),數(shù)據(jù)的可靠性至關(guān)重要。一旦數(shù)據(jù)在存儲(chǔ)過(guò)程中出現(xiàn)丟失或損壞,將對(duì)AI模型的訓(xùn)練和應(yīng)用產(chǎn)生嚴(yán)重影響,甚至導(dǎo)致模型失效。
眾所周知,閃存芯片的寫入壽命有限,長(zhǎng)時(shí)間在同一存儲(chǔ)單元上頻繁寫入數(shù)據(jù)會(huì)導(dǎo)致該單元過(guò)早損壞,而磨損均衡算法則很好地解決了這一問(wèn)題。磨損均衡算法的作用就是將數(shù)據(jù)寫入操作均勻地分布到閃存芯片的各個(gè)存儲(chǔ)單元上,避免某些單元過(guò)度使用,從而延長(zhǎng)閃存設(shè)備的整體使用壽命。例如,三星的閃存產(chǎn)品在其內(nèi)部控制器中集成了先進(jìn)的磨損均衡算法,能夠動(dòng)態(tài)監(jiān)測(cè)各個(gè)存儲(chǔ)單元的使用情況,并智能地調(diào)整數(shù)據(jù)寫入策略,確保每個(gè)存儲(chǔ)單元的磨損程度保持在相對(duì)均衡的水平。
除此之外,強(qiáng)大的糾錯(cuò)編碼(ECC)技術(shù)也消除了閃存存儲(chǔ)數(shù)據(jù)位錯(cuò)誤的問(wèn)題。我們知道,在數(shù)據(jù)讀寫過(guò)程中,由于外界干擾(如電磁干擾)或閃存芯片自身的微小瑕疵,可能會(huì)導(dǎo)致數(shù)據(jù)位出現(xiàn)錯(cuò)誤。ECC技術(shù)能夠?qū)崟r(shí)檢測(cè)并糾正這些錯(cuò)誤,保證數(shù)據(jù)的準(zhǔn)確性。在AI訓(xùn)練數(shù)據(jù)的存儲(chǔ)過(guò)程中,即使數(shù)據(jù)在傳輸或存儲(chǔ)過(guò)程中受到一定程度的干擾,ECC 技術(shù)也能確保數(shù)據(jù)的完整性,使得AI模型能夠基于準(zhǔn)確的數(shù)據(jù)進(jìn)行訓(xùn)練,避免因數(shù)據(jù)錯(cuò)誤導(dǎo)致的模型偏差。
此外,閃存的物理結(jié)構(gòu)使其相比傳統(tǒng)機(jī)械硬盤具有更強(qiáng)的抗沖擊和抗振動(dòng)能力。傳統(tǒng)機(jī)械硬盤內(nèi)部的盤片和磁頭在受到物理沖擊或振動(dòng)時(shí),容易出現(xiàn)磁頭劃傷盤片、數(shù)據(jù)丟失等問(wèn)題。閃存由于沒(méi)有機(jī)械活動(dòng)部件,在面對(duì)日常的搬運(yùn)、設(shè)備振動(dòng)等情況時(shí),能夠更好地保護(hù)數(shù)據(jù)的安全。這一特性在邊緣計(jì)算場(chǎng)景中尤為重要,因?yàn)檫吘壴O(shè)備通常部署在各種復(fù)雜的環(huán)境中,可能會(huì)面臨頻繁的物理移動(dòng)和振動(dòng),閃存的高可靠性能夠確保在這些惡劣環(huán)境下數(shù)據(jù)的穩(wěn)定存儲(chǔ)和傳輸。
最后,3D NAND技術(shù)的進(jìn)步,也讓閃存存儲(chǔ)容量得到了大幅提升,每TB的價(jià)格也越來(lái)越低。3D NAND技術(shù)通過(guò)將存儲(chǔ)單元在垂直方向上進(jìn)行堆疊,極大地提高了存儲(chǔ)密度。例如,韓國(guó)SK海力士開發(fā)的由238層存儲(chǔ)單元組成的NAND閃存芯片,相比前代產(chǎn)品,在相同的芯片面積下,存儲(chǔ)容量得到了顯著提升。三星電子也宣布計(jì)劃生產(chǎn)第9代V - NAND閃存,采用雙層堆棧架構(gòu)且層數(shù)超過(guò) 300 層。這種多層堆疊的 3D NAND 芯片,使得單個(gè)閃存芯片的容量能夠達(dá)到數(shù)TB甚至更高。
除此之外,通過(guò)使用多顆高容量的3D NAND芯片,整個(gè)存儲(chǔ)系統(tǒng)的容量得到了飛躍式的提升。以華為OceanStor Pacific 9920全閃存存儲(chǔ)產(chǎn)品為例,其單盤支持 30.72TB,2U空間可提供768TB容量,進(jìn)一步降低了存儲(chǔ)的成本,為AI應(yīng)用提供了強(qiáng)大的存儲(chǔ)容量支持。
實(shí)際上,3D NAND技術(shù)不僅提高了閃存的容量,還在一定程度上改善了閃存的性能和可靠性。在性能方面,多層堆疊的結(jié)構(gòu)使得數(shù)據(jù)的并行讀寫能力增強(qiáng),提高了整體的讀寫速度。在可靠性方面,通過(guò)合理的設(shè)計(jì)和冗余機(jī)制,3D NAND閃存能夠更好地應(yīng)對(duì)存儲(chǔ)單元的磨損和故障,確保數(shù)據(jù)的安全存儲(chǔ)。
隨著技術(shù)的不斷進(jìn)步,未來(lái)3D NAND技術(shù)將會(huì)突破1000層,例如日本存儲(chǔ)芯片巨頭鎧俠(Kioxia)宣布公司計(jì)劃到2031年批量生產(chǎn)超過(guò)1000層的3D NAND Flash芯片,這將進(jìn)一步降低全閃存存儲(chǔ)的成本。
寫在最后:
根據(jù)IDC預(yù)測(cè)顯示,全球數(shù)據(jù)總量將在2027年達(dá)到291ZB,其中AI相關(guān)數(shù)據(jù)占比將從2023年的不足1%躍升至10%。
可以預(yù)見,隨著AI技術(shù)的發(fā)展與落地應(yīng)用,閃存憑借其卓越的性能、高可靠性、出色的節(jié)能特性以及不斷提升的存儲(chǔ)容量,將成為AI時(shí)代數(shù)據(jù)存儲(chǔ)領(lǐng)域的核心產(chǎn)品。


























