分布式存儲(chǔ)早是由谷歌提出的,其目的是通過廉價(jià)的服務(wù)器來提供使用與大規(guī)模,高并發(fā)場(chǎng)景下的Web訪問問題。它采用可擴(kuò)展的系統(tǒng)結(jié)構(gòu),利用多臺(tái)存儲(chǔ)服務(wù)器分擔(dān)存儲(chǔ)負(fù)荷,利用位置服務(wù)器定位存儲(chǔ)信息,它不但提高了系統(tǒng)的可靠性、可用性和存取效率,還易于擴(kuò)展。分布式存儲(chǔ)的興起與互聯(lián)網(wǎng)的發(fā)展密不可分,互聯(lián)網(wǎng)公司由于其數(shù)據(jù)量大而資本積累少,而通常都使用大規(guī)模分布式存儲(chǔ)系統(tǒng)。與傳統(tǒng)的高duan服務(wù)器、高duan存儲(chǔ)器和高duan處理器不同的是,互聯(lián)網(wǎng)公司的分布式存儲(chǔ)系統(tǒng)由數(shù)量眾多的、低成本和高性價(jià)比的普通PC服務(wù)器通過網(wǎng)絡(luò)連接而成。 干貨:一文看懂分布式存儲(chǔ)架構(gòu)。湖州分布式存儲(chǔ)系統(tǒng)原理解析
分布式存儲(chǔ)系統(tǒng)具有如下特性:數(shù)據(jù)分為多個(gè)分片存儲(chǔ)在多臺(tái)服務(wù)節(jié)點(diǎn)上。每個(gè)分片有多個(gè)副本,存儲(chǔ)在不同的服務(wù)節(jié)點(diǎn)上。許多客戶端并發(fā)訪問系統(tǒng),執(zhí)行讀寫操作,每個(gè)讀寫操作在系統(tǒng)中需要花費(fèi)不等的時(shí)間。除非下文中特別注明和討論,讀寫操作是原子的。與數(shù)據(jù)庫事務(wù)一致性的區(qū)別:數(shù)據(jù)庫事務(wù)的ACID的中也有一個(gè)一致性(consistency),但彼一致性非此一致性。ACID中的一致性是指,數(shù)據(jù)庫的事務(wù)的執(zhí)行,或者說事務(wù)觀察到的數(shù)據(jù),總是要滿足某些全局的一致性約束條件,如性約束,外鍵約束等。這個(gè)概念和數(shù)據(jù)庫的數(shù)據(jù)是否多副本沒關(guān)系。而本文的一致性在多副本的語境下才有意義。所以,數(shù)據(jù)庫事務(wù)的一致性,是指數(shù)據(jù)項(xiàng)之間總是滿足某些約束條件,或者說整個(gè)數(shù)據(jù)庫在滿足約束條件的意義上是正確的。 湖州聯(lián)想分布式存儲(chǔ)原理難言之隱,分布式存儲(chǔ)軟硬件解耦究竟難在哪里?
說到分布式存儲(chǔ),我們先來看一下傳統(tǒng)的存儲(chǔ)是怎么個(gè)樣子。傳統(tǒng)的存儲(chǔ)也稱為集中式存儲(chǔ),從概念上可以看出來是具有集中性的,也就是整個(gè)存儲(chǔ)是集中在一個(gè)系統(tǒng)中的,但集中式存儲(chǔ)并不是一個(gè)單獨(dú)的設(shè)備,是集中在一套系統(tǒng)當(dāng)中的多個(gè)設(shè)備,比如下圖中的EMC存儲(chǔ)就需要幾個(gè)機(jī)柜來存放。在這個(gè)存儲(chǔ)系統(tǒng)中包含很多組件,除了核xin的機(jī)頭(控制器)、磁盤陣列和交換機(jī)等設(shè)備外,還有管理設(shè)備等輔助設(shè)備。結(jié)構(gòu)中包含一個(gè)機(jī)頭,這個(gè)是存儲(chǔ)系統(tǒng)中為核xin的部件。通常在機(jī)頭中有包含兩個(gè)控制器,互為備用,避免硬件故障導(dǎo)致整個(gè)存儲(chǔ)系統(tǒng)的不可用。
軟硬件解耦的分布式存儲(chǔ)在性能設(shè)計(jì)上存在兩大天然缺陷:標(biāo)準(zhǔn)服務(wù)器不具備機(jī)房突然斷電時(shí)保護(hù)內(nèi)存數(shù)據(jù)的電池(BBU),所以只能用SSD卡/盤來做數(shù)據(jù)緩存。SSD的時(shí)延遠(yuǎn)高于內(nèi)存,導(dǎo)致業(yè)界絕大多數(shù)的軟硬解耦的分布式存儲(chǔ)時(shí)延無法和生產(chǎn)存儲(chǔ)媲美。單獨(dú)采購的分布式存儲(chǔ)軟件無法和第三方服務(wù)器的SSD盤緊密配合,從而無法像業(yè)界先進(jìn)的全閃存存儲(chǔ)一樣實(shí)現(xiàn)全局垃圾回收,控制數(shù)量眾多的SSD盤各自的垃圾回收導(dǎo)致的生產(chǎn)應(yīng)用時(shí)延波動(dòng)。軟硬件一體的分布式存儲(chǔ)有機(jī)會(huì)克服如上兩大缺陷。我們看到業(yè)界先進(jìn)的分布式存儲(chǔ)產(chǎn)品,采用了類似于全閃存存儲(chǔ)的電池保護(hù)(BBU)、系統(tǒng)級(jí)全局垃圾回收,達(dá)到了媲美傳統(tǒng)生產(chǎn)存儲(chǔ)的高并發(fā)壓力下的1ms穩(wěn)定時(shí)延,從而為分布式存儲(chǔ)進(jìn)入企業(yè)生產(chǎn)應(yīng)用提供了性能的SLA保障。 分布式存儲(chǔ)提供豐富的API,根據(jù)業(yè)務(wù)應(yīng)用要求,自動(dòng)按需部署存儲(chǔ)資源,實(shí)現(xiàn)基于存儲(chǔ)策略的自動(dòng)化管理目標(biāo)。
無論如何波折,分布式存儲(chǔ)未來可期:正所謂不管白貓、黑貓,抓到老鼠的就是好貓。我們相信在較長一段時(shí)間內(nèi),分布式存儲(chǔ)軟硬件一體和軟硬件解耦會(huì)長期共存??傮w而言,筆者認(rèn)為隨著數(shù)據(jù)價(jià)值的增高,場(chǎng)景對(duì)數(shù)據(jù)可靠性的要求隨之會(huì)越來越嚴(yán)苛,市場(chǎng)的天平就會(huì)更多偏向軟硬件一體;與此相反,場(chǎng)景對(duì)數(shù)據(jù)可靠性的敏感度越低、短期成本敏感度越高,市場(chǎng)的天平就會(huì)更多的偏向軟硬件解耦。分布式存儲(chǔ)的發(fā)展歷程無論如何波折,我們更愿意相信它終會(huì)是部正劇,在整個(gè)存儲(chǔ)市場(chǎng)中占據(jù)海量數(shù)據(jù)承載的主力軍位置,鏗鏘而立,并給人以無窮回味!分布式存儲(chǔ)的由來、發(fā)展及未來市場(chǎng)前景。湖州大道云行分布式存儲(chǔ)哪家好
分布式存儲(chǔ)在數(shù)據(jù)治理場(chǎng)景中的價(jià)值定位及優(yōu)勢(shì)解讀。湖州分布式存儲(chǔ)系統(tǒng)原理解析
實(shí)際上分布式存儲(chǔ),高性能與高可用是矛盾的,比如要設(shè)計(jì)一個(gè)分布式存儲(chǔ)系統(tǒng),出于對(duì)性能的考慮,記錄數(shù)據(jù)時(shí)先寫一個(gè)份數(shù)據(jù)到某個(gè)機(jī)器上并立即返回,然后異步發(fā)起多個(gè)數(shù)據(jù)備份過程(副本)。這種設(shè)計(jì)的性能比較好,但存在“容錯(cuò)性”的風(fēng)險(xiǎn),即寫完數(shù)據(jù)后,目標(biāo)機(jī)器立即發(fā)生故障,會(huì)導(dǎo)致數(shù)據(jù)丟失!如果同時(shí)寫多個(gè)副本,每個(gè)副本寫成功以后再返回,則又導(dǎo)致性能下降,因?yàn)檫@個(gè)過程取決于慢的那臺(tái)機(jī)器的性能。這就是高性能與高可用之間的矛盾。而要真正從根本上克服這些矛盾,解決分布式存儲(chǔ)的高性能和高可用問題,更有效的是對(duì)于分布式文件系統(tǒng)和分布式存儲(chǔ)系統(tǒng)架構(gòu)進(jìn)行優(yōu)化和改進(jìn),從而從源頭解決這些問題。 湖州分布式存儲(chǔ)系統(tǒng)原理解析
江蘇魏晉元興智能科技有限公司致力于數(shù)碼、電腦,是一家貿(mào)易型公司。公司業(yè)務(wù)分為網(wǎng)絡(luò)安全,VR,MR,VR,AI,視頻監(jiān)控安防,出入口門禁失控制等,目前不斷進(jìn)行創(chuàng)新和服務(wù)改進(jìn),為客戶提供良好的產(chǎn)品和服務(wù)。公司將不斷增強(qiáng)企業(yè)重點(diǎn)競(jìng)爭力,努力學(xué)習(xí)行業(yè)知識(shí),遵守行業(yè)規(guī)范,植根于數(shù)碼、電腦行業(yè)的發(fā)展。魏晉元興智能立足于全國市場(chǎng),依托強(qiáng)大的研發(fā)實(shí)力,融合前沿的技術(shù)理念,飛快響應(yīng)客戶的變化需求。