什么是分布式存儲呢?如果一個存儲系統(tǒng),不管是對象、塊、文件、kv、log、olap、oltp,只要對所管理的數(shù)據(jù)做了Partitioning&Replication,不管姿勢對不對,其實都可以歸納于分布式存儲。分布式存儲就是:Partitioning以多機scale,Replication以災(zāi)備容錯。復(fù)制是解決可用性,可擴展性和高性能的關(guān)鍵。為了災(zāi)備,數(shù)據(jù)需要冗余存儲;為了高可用,服務(wù)需要hotstandby。缺乏災(zāi)備的系統(tǒng)難以在生產(chǎn)環(huán)境使用。元數(shù)據(jù)和數(shù)據(jù)的維護均離不開復(fù)制,復(fù)制可轉(zhuǎn)移而不可消除。復(fù)制引出了多副本一致性問題,而一致性保證需要考慮各種軟件和硬件故障,以及誤操作。 萬萬沒想到,分布式存儲系統(tǒng)的一致性是......!合肥大道云行分布式存儲系統(tǒng)架構(gòu)
分布式存儲的興起與互聯(lián)網(wǎng)的發(fā)展密不可分,互聯(lián)網(wǎng)公司由于其數(shù)據(jù)量大而資本積累少,而通常都使用大規(guī)模分布式存儲系統(tǒng)。與傳統(tǒng)的高duan服務(wù)器、高duan存儲器和高duan處理器不同的是,互聯(lián)網(wǎng)公司的分布式存儲系統(tǒng)由數(shù)量眾多的、低成本和高性價比的普通PC服務(wù)器通過網(wǎng)絡(luò)連接而成。其主要原因有以下三點(1)互聯(lián)網(wǎng)的業(yè)務(wù)發(fā)展很快,而且注意成本消耗,這就使得存儲系統(tǒng)不能依靠傳統(tǒng)的縱向擴展的方式,即先買小型機,不夠時再買中型機,甚至大型機?;ヂ?lián)網(wǎng)后端的分布式系統(tǒng)要求支持橫向擴展,即通過增加普通PC服務(wù)器來提高系統(tǒng)的整體處理能力。(2)普通PC服務(wù)器性價比高,故障率也高,需要在軟件層面實現(xiàn)自動容錯,保證數(shù)據(jù)的一致性。(3)另外,隨著服務(wù)器的不斷加入,需要能夠在軟件層面實現(xiàn)自動負(fù)載均衡,使得系統(tǒng)的處理能力得到線性擴展。 徐州魏晉元興分布式存儲系統(tǒng)架構(gòu)分布式存儲不僅是存儲,而是下一代互聯(lián)網(wǎng)。
軟硬件解耦的分布式存儲在性能設(shè)計上存在兩大天然缺陷:標(biāo)準(zhǔn)服務(wù)器不具備機房突然斷電時保護內(nèi)存數(shù)據(jù)的電池(BBU),所以只能用SSD卡/盤來做數(shù)據(jù)緩存。SSD的時延遠高于內(nèi)存,導(dǎo)致業(yè)界絕大多數(shù)的軟硬解耦的分布式存儲時延無法和生產(chǎn)存儲媲美。單獨采購的分布式存儲軟件無法和第三方服務(wù)器的SSD盤緊密配合,從而無法像業(yè)界先進的全閃存存儲一樣實現(xiàn)全局垃圾回收,控制數(shù)量眾多的SSD盤各自的垃圾回收導(dǎo)致的生產(chǎn)應(yīng)用時延波動。軟硬件一體的分布式存儲有機會克服如上兩大缺陷。我們看到業(yè)界先進的分布式存儲產(chǎn)品,采用了類似于全閃存存儲的電池保護(BBU)、系統(tǒng)級全局垃圾回收,達到了媲美傳統(tǒng)生產(chǎn)存儲的高并發(fā)壓力下的1ms穩(wěn)定時延,從而為分布式存儲進入企業(yè)生產(chǎn)應(yīng)用提供了性能的SLA保障。
得益于合理的分布式架構(gòu),分布式存儲可預(yù)估并且彈性擴展計算、存儲容量和性能。分布式存儲的水平擴展有以下幾個特性:1)節(jié)點擴展后,舊數(shù)據(jù)會自動遷移到新節(jié)點,實現(xiàn)負(fù)載均衡,避點過熱的情況出現(xiàn);2)水平擴展只需要將新節(jié)點和原有集群連接到同一網(wǎng)絡(luò),整個過程不會對業(yè)務(wù)造成影響;3)當(dāng)節(jié)點被添加到集群,集群系統(tǒng)的整體容量和性能也隨之線性擴展,此后新節(jié)點的資源就會被管理平臺接管,被用于分配或者回收。隨著分布式存儲的發(fā)展,存儲行業(yè)的標(biāo)準(zhǔn)化進程也不斷推進,分布式存儲優(yōu)先采用行業(yè)標(biāo)準(zhǔn)接口進行存儲接入。在平臺層面,通過將異構(gòu)存儲資源進行抽象化,將傳統(tǒng)的存儲設(shè)備級的操作封裝成面向存儲資源的操作,從而簡化異構(gòu)存儲基礎(chǔ)架構(gòu)的操作,以實現(xiàn)存儲資源的集中管理,并能夠自動執(zhí)行創(chuàng)建、變更、回收等整個存儲生命周期流程,從而降低了存儲采購和管理成本。 超大規(guī)模時空數(shù)據(jù)的分布式存儲與應(yīng)用。
為了保證分布式存儲系統(tǒng)的高可靠和高可用,數(shù)據(jù)在系統(tǒng)中一般存儲多個副本。當(dāng)某個副本所在的存儲節(jié)點出現(xiàn)故障時,分布式存儲系統(tǒng)能夠自動將服務(wù)切換到其他的副本,從而實現(xiàn)自動容錯。分布式存儲系統(tǒng)通過復(fù)制協(xié)議將數(shù)據(jù)同步到多個存儲節(jié)點,并確保多個副本之間的數(shù)據(jù)一致性??蛻舳藢懻埱蟀l(fā)送給主副本,主副本將寫請求復(fù)制到其他備副本,常見的做法是同步操作日志(CommitLog)。主副本首先將操作日志同步到備副本,備副本回放操作日志,完成后通知主副本。接著,主副本修改本機,等到所有的操作都完成后再通知客戶端寫成功。下圖中的復(fù)制協(xié)議要求主備同步成功才可以返回客戶端寫成功,這種協(xié)議稱為強同步協(xié)議。 布式存儲幫助企業(yè)打造智能化的數(shù)據(jù)治理平臺。鎮(zhèn)江大道云行分布式存儲系統(tǒng)架構(gòu)
分布式存儲系統(tǒng)通過復(fù)制協(xié)議將數(shù)據(jù)同步到多個存儲節(jié)點,并確保多個副本之間的數(shù)據(jù)一致性。合肥大道云行分布式存儲系統(tǒng)架構(gòu)
分布式存儲包含的種類繁多,除了傳統(tǒng)意義上的分布式文件系統(tǒng)、分布式塊存儲和分布式對象存儲外,還包括分布式數(shù)據(jù)庫和分布式緩存等,但其中架構(gòu)無外乎于三種;以Ceph為代biao的架構(gòu)是其典型的代biao。在該架構(gòu)中與HDFS不同的地方在于該架構(gòu)中沒有中心節(jié)點??蛻舳耸峭ㄟ^一個設(shè)備映射關(guān)系計算出來其寫入數(shù)據(jù)的位置,這樣客戶端可以直接與存儲節(jié)點通信,從而避免中心節(jié)點的性能瓶頸。以Ceph為代biao的架構(gòu)是其典型的代biao。在該架構(gòu)中與HDFS不同的地方在于該架構(gòu)中沒有中心節(jié)點??蛻舳耸峭ㄟ^一個設(shè)備映射關(guān)系計算出來其寫入數(shù)據(jù)的位置,這樣客戶端可以直接與存儲節(jié)點通信,從而避免中心節(jié)點的性能瓶頸。 合肥大道云行分布式存儲系統(tǒng)架構(gòu)
江蘇魏晉元興智能科技有限公司致力于數(shù)碼、電腦,是一家貿(mào)易型公司。公司業(yè)務(wù)分為網(wǎng)絡(luò)安全,VR,MR,VR,AI,視頻監(jiān)控安防,出入口門禁失控制等,目前不斷進行創(chuàng)新和服務(wù)改進,為客戶提供良好的產(chǎn)品和服務(wù)。公司從事數(shù)碼、電腦多年,有著創(chuàng)新的設(shè)計、強大的技術(shù),還有一批**的專業(yè)化的隊伍,確保為客戶提供良好的產(chǎn)品及服務(wù)。在社會各界的鼎力支持下,持續(xù)創(chuàng)新,不斷鑄造***服務(wù)體驗,為客戶成功提供堅實有力的支持。