?譯者 | 朱先忠
審校 | 孫淑娟
引言

當(dāng)今,管理數(shù)據(jù)存儲(chǔ)的任務(wù)變得越來(lái)越復(fù)雜,以致于IT團(tuán)隊(duì)不得不與本地、直連存儲(chǔ)、存儲(chǔ)區(qū)域網(wǎng)絡(luò)、網(wǎng)絡(luò)連接存儲(chǔ)和云存儲(chǔ)卷等各種類(lèi)型的存儲(chǔ)問(wèn)題展開(kāi)各種極其復(fù)雜的斗爭(zhēng)。
團(tuán)隊(duì)成員們可能正在部署超聚合系統(tǒng),或者使用云存儲(chǔ)技術(shù)的內(nèi)部部署實(shí)現(xiàn)。而且,他們有可能在使用幾種互不兼容的存儲(chǔ)協(xié)議,尤其是對(duì)于非結(jié)構(gòu)化數(shù)據(jù)方面。所有這些都是隨著業(yè)務(wù)對(duì)數(shù)據(jù)的要求越來(lái)越高而發(fā)生的。
這促使人們對(duì)全局文件系統(tǒng)(Global File System:簡(jiǎn)稱(chēng)“GFS”,有時(shí)也稱(chēng)為“分布式文件系統(tǒng)”)越來(lái)越感興趣。
其實(shí),全局文件系統(tǒng)并不是一個(gè)新概念。早在20世紀(jì)80年代,卡內(nèi)基梅隆大學(xué)就開(kāi)發(fā)了Andrew文件系統(tǒng)(即AFS),目前仍在使用。從那時(shí)起,商業(yè)供應(yīng)商就開(kāi)始將這一概念進(jìn)一步推廣,并將其應(yīng)用于云和內(nèi)部部署存儲(chǔ)。
不僅僅是對(duì)象存儲(chǔ)
縮小內(nèi)部部署和云存儲(chǔ)之間的差距有望簡(jiǎn)化IT管理并降低成本。
本質(zhì)上講,云存儲(chǔ)是分布式的。終端用戶(hù)不知道或不需要知道他們的數(shù)據(jù)存儲(chǔ)在哪里(除去任何基于法規(guī)約束性的限制外)。云供應(yīng)商通過(guò)使用對(duì)象存儲(chǔ)技術(shù)實(shí)現(xiàn)跨多個(gè)服務(wù)器甚至多個(gè)數(shù)據(jù)中心分割數(shù)據(jù),從而支持企業(yè)規(guī)模經(jīng)濟(jì)發(fā)展需求。
但是,問(wèn)題在于:大多數(shù)操作系統(tǒng)和應(yīng)用程序無(wú)法直接讀寫(xiě)對(duì)象存儲(chǔ)。他們希望看到NFS或SMB這樣的網(wǎng)絡(luò)協(xié)議,或者直接訪(fǎng)問(wèn)或者通過(guò)SAN(Storage Area Network,存儲(chǔ)區(qū)域網(wǎng)絡(luò))訪(fǎng)問(wèn)存儲(chǔ)。盡管供應(yīng)商們已經(jīng)創(chuàng)建了存儲(chǔ)網(wǎng)關(guān),并且提供更多的應(yīng)用程序與對(duì)象存儲(chǔ)兼容(如Oracle和Openstack),但仍存在很多應(yīng)用程序不兼容的情況。
因此,全局文件系統(tǒng)(GFS:Global File System)可能是目前解決上述矛盾的最佳答案,因?yàn)樗軌蛱峁┰频撵`活性、彈性和容量,同時(shí)還能夠保持NAS(Network Attached Storage:網(wǎng)絡(luò)附屬存儲(chǔ))的簡(jiǎn)單性(至少對(duì)于應(yīng)用程序和操作系統(tǒng)而言)。
IT產(chǎn)業(yè)研究機(jī)構(gòu)Freeform Dynamics的首席分析師布萊恩·貝茨表示:“任何規(guī)模的大多數(shù)組織都會(huì)將數(shù)據(jù)存儲(chǔ)在不同的位置和文件格式,這會(huì)使查找和使用變得非常困難。”“將全局文件系統(tǒng)置于首位意味著,所有具有訪(fǎng)問(wèn)權(quán)限的人都可以通過(guò)單一的標(biāo)準(zhǔn)格式看到您的所有數(shù)據(jù);如果您愿意,可以使用虛擬化的‘超級(jí)文件系統(tǒng)’。”
這種方案的好處包括:基于云的規(guī)模經(jīng)濟(jì)性、優(yōu)于通常通過(guò)內(nèi)部部署系統(tǒng)實(shí)現(xiàn)的冗余、快速添加(或刪除)存儲(chǔ)容量的能力,以及從資本支出轉(zhuǎn)向運(yùn)營(yíng)支出的支持等。
企業(yè)文件共享服務(wù)的其他優(yōu)點(diǎn)還包括:更輕松的協(xié)作,更好的安全性,等等。
從未來(lái)發(fā)展看,公司有可能轉(zhuǎn)向一個(gè)跨本地硬件(延遲和性能至關(guān)重要)和基于云的應(yīng)用程序的單一文件系統(tǒng)。
全局文件系統(tǒng)的常見(jiàn)功能
首先,全局文件系統(tǒng)通過(guò)將中央文件服務(wù)(通常在公共或私有云上)與本地網(wǎng)絡(luò)硬件相結(jié)合來(lái)進(jìn)行緩存并確保應(yīng)用程序兼容性。它們通過(guò)將所有存儲(chǔ)放在同一個(gè)命名空間中來(lái)實(shí)現(xiàn)這一目標(biāo)。這可以說(shuō)是,所有數(shù)據(jù)的單一“黃金”拷貝。
同時(shí),實(shí)現(xiàn)上述目標(biāo)需要借助緩存和同步技術(shù)以確保性能。該領(lǐng)域的供應(yīng)商之一CTRA表示,一家大型企業(yè)可能會(huì)在每個(gè)站點(diǎn)移動(dòng)超過(guò)30TB的數(shù)據(jù)。
其次,系統(tǒng)需要廣泛的兼容性。全局文件系統(tǒng)需要支持從傳統(tǒng)的本地NAS(存儲(chǔ)區(qū)域網(wǎng)絡(luò))硬件進(jìn)行遷移。操作系統(tǒng)和應(yīng)用程序需要能夠像以前使用NFS或SMB一樣輕松地訪(fǎng)問(wèn)全局文件系統(tǒng)。
最后,全局文件系統(tǒng)還需要確保易于使用。理想情況下,對(duì)最終用戶(hù)透明并且能夠擴(kuò)展。當(dāng)前的現(xiàn)實(shí)情況是,很少有公司能夠同時(shí)將所有內(nèi)容移動(dòng)到一個(gè)新的文件系統(tǒng);因此,一個(gè)能夠隨著應(yīng)用程序的移動(dòng)而增長(zhǎng)的全局文件系統(tǒng)至關(guān)重要。
全局文件系統(tǒng)、傳統(tǒng)文件系統(tǒng)及同步問(wèn)題
作為一種基于云的服務(wù),全局文件系統(tǒng)吸引了需要在站點(diǎn)之間共享信息的組織,或者在疫情期間經(jīng)常支持的使用案例中與業(yè)務(wù)范圍以外的用戶(hù)共享信息的組織。
然而,這會(huì)導(dǎo)致全局文件系統(tǒng)的功能與傳統(tǒng)的文件和同步服務(wù)之間的重疊。這些服務(wù)包括更加面向消費(fèi)者的服務(wù),如Dropbox和OneDrive,這些服務(wù)通常在新冠肺炎期間被投入服務(wù)以支持遠(yuǎn)程工作,還有SharePoint、Google Drive和企業(yè)級(jí)共享服務(wù),等等。
一些全局文件系統(tǒng)供應(yīng)商強(qiáng)調(diào),他們也可以提供這些服務(wù)。當(dāng)然,能夠在外部共享文件或者將桌面搜索擴(kuò)展到基于云的文件的話(huà),這是很有用的。然而,對(duì)于大多數(shù)企業(yè)來(lái)說(shuō),基本性能、兼容性和易遷移性方面可能更是優(yōu)先考慮的因素。
Freeform Dynamics公司的Betts說(shuō):“挑戰(zhàn)是,這可能會(huì)導(dǎo)致存儲(chǔ)規(guī)模變得非常大。例如,您的數(shù)據(jù)是全局分布式的,您(或您的全局文件系統(tǒng)開(kāi)發(fā)人員)需要決定如何處理文件鎖定(防止兩個(gè)人或系統(tǒng)同時(shí)更新同一數(shù)據(jù))和復(fù)制等問(wèn)題。”
附:全球知名全局文件系統(tǒng)供應(yīng)商列表
克特拉(CTERA)
位于以色列的云文件服務(wù)提供商克特拉(CTERA)公司通過(guò)Edge X系列產(chǎn)品、緩存文件管理器、CTERA驅(qū)動(dòng)器、端點(diǎn)設(shè)備代理和虛擬工作區(qū)VDI的組合工作。其全局文件系統(tǒng)支持將客戶(hù)文件鏈接到Amazon S3、Azure或IBM、HPE、Dell EMC和Scality提供的云服務(wù)。
克特拉聲稱(chēng),其緩存技術(shù)允許無(wú)限容量。此外,他們還提供來(lái)自Windows、Mac、Linux、Android和iOS的文件共享服務(wù)和設(shè)備級(jí)訪(fǎng)問(wèn)。
納蘇尼(Nasuni)
位于美國(guó)的云存儲(chǔ)網(wǎng)關(guān)廠(chǎng)商N(yùn)asuni自稱(chēng)為“云原生(cloud native)”存儲(chǔ)業(yè)務(wù)提供商,以其全局文件系統(tǒng)UniFS作為基礎(chǔ)構(gòu)建塊。UniFS系統(tǒng)支持NAS和文件服務(wù)器整合、備份和恢復(fù)、災(zāi)難恢復(fù)和協(xié)作工具。
此外,Nasuni還支持全局文件鎖定——兩個(gè)用戶(hù)不能同時(shí)寫(xiě)入一個(gè)文件,并為NFS和SMB服務(wù)以及重復(fù)數(shù)據(jù)消除提供邊緣設(shè)備支持。或者,用戶(hù)可以在其虛擬或超聚合基礎(chǔ)架構(gòu)上安裝虛擬機(jī)來(lái)代替NAS硬件。Nasuni聲稱(chēng),部署其全局文件系統(tǒng)的公司不再需要單獨(dú)的備份或?yàn)?zāi)難恢復(fù)。
潘祖拉(Panzura)
另一家位于美國(guó)的Panzura公司將他們的戰(zhàn)略定位為:數(shù)據(jù)管理供應(yīng)商和非結(jié)構(gòu)化數(shù)據(jù)的單一平臺(tái)。他們的核心全局文件系統(tǒng)是CloudFS,它創(chuàng)建了一個(gè)經(jīng)過(guò)優(yōu)化的單一數(shù)據(jù)集。該公司將CloudFS描述為一個(gè)全局性的混合云文件系統(tǒng)。
Panzura聲稱(chēng),這不僅取代了NAS硬件,還提供了數(shù)據(jù)管理和彈性存儲(chǔ)。該服務(wù)還直接支持能夠直接與云端同步的移動(dòng)設(shè)備。另外,該公司還提供云塊存儲(chǔ)服務(wù)。
錘子空間(Hammerspace)
位于美國(guó)的Hammerspace公司則專(zhuān)注于為客戶(hù)提供元數(shù)據(jù)的單一視圖。他們聲稱(chēng),這樣可以有效地存儲(chǔ)和訪(fǎng)問(wèn)數(shù)據(jù),甚至能夠提前預(yù)測(cè)哪些數(shù)據(jù)需要移動(dòng)。
Hammerspace打出的標(biāo)語(yǔ)是,通過(guò)其提供的全局?jǐn)?shù)據(jù)環(huán)境服務(wù)實(shí)現(xiàn)“本地訪(fǎng)問(wèn)全局?jǐn)?shù)據(jù)”。基于此方案,可以將來(lái)自于云端、數(shù)據(jù)中心和邊緣的數(shù)據(jù)匯集到一個(gè)數(shù)據(jù)集中。然后,全局?jǐn)?shù)據(jù)環(huán)境提供訪(fǎng)問(wèn)以及輔助服務(wù),包括數(shù)據(jù)分層、文件版本控制、重復(fù)數(shù)據(jù)消除、快照和防病毒。總之,他們的方案支持訪(fǎng)問(wèn)云、數(shù)據(jù)中心和舊式DAS、SAN和NAS文件存儲(chǔ),實(shí)現(xiàn)通過(guò)一個(gè)許可證涵蓋所有形式的存儲(chǔ)。
Peer軟件
Peer軟件公司提供的服務(wù)是具有混合和多云支持的全局文件服務(wù),并支持邊緣和數(shù)據(jù)中心。PeerGFS僅實(shí)現(xiàn)為軟件層,支持主動(dòng)-主動(dòng)同步(active-active sync),它們使用微軟DFSN支持的全局命名空間,并支持對(duì)象存儲(chǔ)集成。PeerGFS還支持S3和Azure Blob。對(duì)等代理(Peer Agent)在Windows文件服務(wù)器或Windows虛擬機(jī)上運(yùn)行,但用戶(hù)保留對(duì)其數(shù)據(jù)的直接訪(fǎng)問(wèn)權(quán)限。此外,PeerGFS還支持云備份和復(fù)制。
譯者介紹
朱先忠,51CTO社區(qū)編輯,51CTO專(zhuān)家博客、講師,濰坊一所高校計(jì)算機(jī)教師,自由編程界老兵一枚。早期專(zhuān)注各種微軟技術(shù)(編著成ASP.NET AJX、Cocos 2d-X相關(guān)三本技術(shù)圖書(shū)),近十多年投身于開(kāi)源世界(熟悉流行全棧Web開(kāi)發(fā)技術(shù)),了解基于OneNet/AliOS+Arduino/ESP32/樹(shù)莓派等物聯(lián)網(wǎng)開(kāi)發(fā)技術(shù)與Scala+Hadoop+Spark+Flink等大數(shù)據(jù)開(kāi)發(fā)技術(shù)。
原文標(biāo)題:??Global file systems: Hybrid cloud and follow-the-sun access???,作者:Stephen Pritchard?






















