分布式存儲分為文件存儲、對象存儲和塊存儲,但它們?nèi)N存儲方式的基本架構(gòu)都是大同小異的。即客戶端或應(yīng)用端、元數(shù)據(jù)(MDS)服務(wù)器和數(shù)據(jù)節(jié)點(diǎn)服務(wù)器??蛻舳撕驮獢?shù)據(jù)服務(wù)器之間交互是“信令交互”,而客戶端到數(shù)據(jù)節(jié)點(diǎn)是“媒體交互”。元數(shù)據(jù)服務(wù)器或通過數(shù)據(jù)節(jié)點(diǎn)服務(wù)器獲取各節(jié)點(diǎn)服務(wù)器的基本配置情況和狀態(tài)信息。比如,客戶端需要讀取某一個文件的信息,客戶端會將相應(yīng)的要求發(fā)給元數(shù)據(jù)服務(wù)器:“喂!我需要XXX,存在哪里了”,元數(shù)據(jù)服務(wù)器查詢后回答“你到xxx服務(wù)器的xxx地址+xxx服務(wù)器的xxx地址取”。客戶端拿到這個指示后,向這2臺服務(wù)器發(fā)出指令,數(shù)據(jù)節(jié)點(diǎn)獲得指令后,將相應(yīng)的數(shù)據(jù)返回給客戶端。 分布式存儲“避坑”指南。金華大數(shù)據(jù)分布式存儲的一般架構(gòu)
什么是分布式存儲呢?如果一個存儲系統(tǒng),不管是對象、塊、文件、kv、log、olap、oltp,只要對所管理的數(shù)據(jù)做了Partitioning&Replication,不管姿勢對不對,其實(shí)都可以歸納于分布式存儲。分布式存儲就是:Partitioning以多機(jī)scale,Replication以災(zāi)備容錯。復(fù)制是解決可用性,可擴(kuò)展性和高性能的關(guān)鍵。為了災(zāi)備,數(shù)據(jù)需要冗余存儲;為了高可用,服務(wù)需要hotstandby。缺乏災(zāi)備的系統(tǒng)難以在生產(chǎn)環(huán)境使用。元數(shù)據(jù)和數(shù)據(jù)的維護(hù)均離不開復(fù)制,復(fù)制可轉(zhuǎn)移而不可消除。復(fù)制引出了多副本一致性問題,而一致性保證需要考慮各種軟件和硬件故障,以及誤操作。 蘇州數(shù)據(jù)分布式存儲系統(tǒng)原理分布式存儲還能夠容忍服務(wù)器故障,存儲系統(tǒng)依然穩(wěn)定可用,可靠性更優(yōu)。
分布式存儲在大數(shù)據(jù)環(huán)境下,元數(shù)據(jù)的體量也非常大,元數(shù)據(jù)的存取性能是整個分布式文件系統(tǒng)性能的關(guān)鍵。常見的元數(shù)據(jù)管理可以分為集中式和分布式元數(shù)據(jù)管理架構(gòu)。集中式元數(shù)據(jù)管理架構(gòu)采用單一的元數(shù)據(jù)服務(wù)器,實(shí)現(xiàn)簡單.但是存在單點(diǎn)故障等問題。分布式元數(shù)據(jù)管理架構(gòu)則將元數(shù)據(jù)分散在多個結(jié)點(diǎn)上.進(jìn)而解決了元數(shù)據(jù)服務(wù)器的性能瓶頸等問題.并提高了元數(shù)據(jù)管理架構(gòu)的可擴(kuò)展性,但實(shí)現(xiàn)較為復(fù)雜,并引入了元數(shù)據(jù)一致性的問題。另外,還有一種無元數(shù)據(jù)服務(wù)器的分布式架構(gòu),通過在線算法組織數(shù)據(jù),不需要專yong的元數(shù)據(jù)服務(wù)器。但是該架構(gòu)對數(shù)據(jù)一致性的保障很困難.實(shí)現(xiàn)較為復(fù)雜。文件目錄遍歷操作效率低下,并且缺乏文件系統(tǒng)全局監(jiān)控管理功能。
無論如何波折,分布式存儲未來可期:正所謂不管白貓、黑貓,抓到老鼠的就是好貓。我們相信在較長一段時間內(nèi),分布式存儲軟硬件一體和軟硬件解耦會長期共存。總體而言,筆者認(rèn)為隨著數(shù)據(jù)價值的增高,場景對數(shù)據(jù)可靠性的要求隨之會越來越嚴(yán)苛,市場的天平就會更多偏向軟硬件一體;與此相反,場景對數(shù)據(jù)可靠性的敏感度越低、短期成本敏感度越高,市場的天平就會更多的偏向軟硬件解耦。分布式存儲的發(fā)展歷程無論如何波折,我們更愿意相信它終會是部正劇,在整個存儲市場中占據(jù)海量數(shù)據(jù)承載的主力軍位置,鏗鏘而立,并給人以無窮回味!布式存儲幫助企業(yè)打造智能化的數(shù)據(jù)治理平臺。
分布式存儲包含的種類繁多,除了傳統(tǒng)意義上的分布式文件系統(tǒng)、分布式塊存儲和分布式對象存儲外,還包括分布式數(shù)據(jù)庫和分布式緩存等,但其中架構(gòu)無外乎于三種;以Ceph為代biao的架構(gòu)是其典型的代biao。在該架構(gòu)中與HDFS不同的地方在于該架構(gòu)中沒有中心節(jié)點(diǎn)??蛻舳耸峭ㄟ^一個設(shè)備映射關(guān)系計算出來其寫入數(shù)據(jù)的位置,這樣客戶端可以直接與存儲節(jié)點(diǎn)通信,從而避免中心節(jié)點(diǎn)的性能瓶頸。以Ceph為代biao的架構(gòu)是其典型的代biao。在該架構(gòu)中與HDFS不同的地方在于該架構(gòu)中沒有中心節(jié)點(diǎn)??蛻舳耸峭ㄟ^一個設(shè)備映射關(guān)系計算出來其寫入數(shù)據(jù)的位置,這樣客戶端可以直接與存儲節(jié)點(diǎn)通信,從而避免中心節(jié)點(diǎn)的性能瓶頸。 分布式存儲系統(tǒng)需要使用多臺服務(wù)器共同存儲數(shù)據(jù),隨著服務(wù)器數(shù)量的增加,出現(xiàn)故障的概率也在不斷增加。湖州大道云行分布式存儲
分布式存儲系統(tǒng)中的多臺服務(wù)器通過網(wǎng)絡(luò)進(jìn)行連接。金華大數(shù)據(jù)分布式存儲的一般架構(gòu)
很多人可能從來沒有考慮過這個問題,為什么需要分布式存儲?實(shí)際上,使用分布式存儲是“被迫”的,因?yàn)殡S著互聯(lián)網(wǎng)的飛速發(fā)展、應(yīng)用越來越豐富、用戶數(shù)量越來越多、數(shù)據(jù)也成幾何級增長,海量數(shù)據(jù)的存儲給本地存儲帶了巨大壓力,存儲系統(tǒng)已經(jīng)不堪重負(fù),處于崩潰的邊緣,因此,必須通過其他手段分散存儲系統(tǒng)壓力,分布式存儲和分布式文件系統(tǒng)應(yīng)運(yùn)而生。實(shí)際上,如果可能,應(yīng)該是盡量不使用分布式的,因?yàn)檫@會增加系統(tǒng)的復(fù)雜度和管理難度,然而,雖然是這樣,但這些終歸是可以通過其他技術(shù)來解決,而如果不使用分布式,系統(tǒng)的可用性、穩(wěn)定性都無法保證,更談不上系統(tǒng)的高性能了。因此,說分布式是被迫使用的,一點(diǎn)也不夸張。 金華大數(shù)據(jù)分布式存儲的一般架構(gòu)
江蘇魏晉元興智能科技有限公司致力于數(shù)碼、電腦,是一家貿(mào)易型公司。公司業(yè)務(wù)分為網(wǎng)絡(luò)安全,VR,MR,VR,AI,視頻監(jiān)控安防,出入口門禁失控制等,目前不斷進(jìn)行創(chuàng)新和服務(wù)改進(jìn),為客戶提供良好的產(chǎn)品和服務(wù)。公司將不斷增強(qiáng)企業(yè)重點(diǎn)競爭力,努力學(xué)習(xí)行業(yè)知識,遵守行業(yè)規(guī)范,植根于數(shù)碼、電腦行業(yè)的發(fā)展。魏晉元興智能秉承“客戶為尊、服務(wù)為榮、創(chuàng)意為先、技術(shù)為實(shí)”的經(jīng)營理念,全力打造公司的重點(diǎn)競爭力。