從技術的角度,分布式存儲的發(fā)力點在大規(guī)模的擴展性,基于此逐步優(yōu)化性能、可靠性,讓海量數(shù)據(jù)存得下、用得起;集中式存儲的技術方向在于保持穩(wěn)定性的基礎上,利用更快的介質、更低時延的網(wǎng)絡為核xin業(yè)務提供加速,讓業(yè)務更穩(wěn)、效率更高。因此,從技術方向上來看,二者也是各有側重的。云和分布式存儲一樣,這些年正在大行其道、炙手可熱。CloudFirst、AllinCloud、CloudNative等概念風靡業(yè)界,CIO見面不提云貌似都不好意思打招呼。早期人們也習慣把分布式存儲叫做“云存儲”,那么分布式存儲和云是什么關系?筆者認為,分布式存儲是一種技術架構,而云是一種商業(yè)模式。分布式存儲可以被用作各種云的數(shù)據(jù)底座,也可以單獨成為數(shù)據(jù)底座,是配合的關系,而非替換和包含關系。 布式存儲幫助企業(yè)打造智能化的數(shù)據(jù)治理平臺。連云港大規(guī)模分布式存儲系統(tǒng)原理
什么是分布式存儲呢?如果一個存儲系統(tǒng),不管是對象、塊、文件、kv、log、olap、oltp,只要對所管理的數(shù)據(jù)做了Partitioning&Replication,不管姿勢對不對,其實都可以歸納于分布式存儲。分布式存儲就是:Partitioning以多機scale,Replication以災備容錯。復制是解決可用性,可擴展性和高性能的關鍵。為了災備,數(shù)據(jù)需要冗余存儲;為了高可用,服務需要hotstandby。缺乏災備的系統(tǒng)難以在生產環(huán)境使用。元數(shù)據(jù)和數(shù)據(jù)的維護均離不開復制,復制可轉移而不可消除。復制引出了多副本一致性問題,而一致性保證需要考慮各種軟件和硬件故障,以及誤操作。 杭州魏晉元興分布式存儲系統(tǒng)架構分布式存儲系統(tǒng)中的多臺服務器通過網(wǎng)絡進行連接。
Ceph:目前應用廣的開源分布式存儲系統(tǒng),已得到眾多廠商的支持,許多超融合系統(tǒng)的分布式存儲都是基于Ceph深度定制。而且Ceph已經成為LINUX系統(tǒng)和OpenStack的“標配”,用于支持各自的存儲系統(tǒng)。Ceph可以提供對象存儲、塊設備存儲和文件系統(tǒng)存儲服務。同時支持三種不同類型的存儲服務的特性,在分布式存儲系統(tǒng)中,是很少見的。a、Ceph沒有采用HDFS的元數(shù)據(jù)尋址的方案,而且采用CRUSH算法,數(shù)據(jù)分布均衡,并行度高。而且在支持塊存儲特性上,數(shù)據(jù)可以具有強一致性,可以獲得傳統(tǒng)集中式存儲的使用體驗。b、對象存儲服務,Ceph支持Swift和S3的API接口。在塊存儲方面,支持精簡配置、快照、克隆。在文件系統(tǒng)存儲服務方面,支持Posix接口,支持快照。但是目前Ceph支持文件的性能相當其他分布式存儲系統(tǒng),部署稍顯復雜,性能也稍弱,一般都將Ceph應用于塊和對象存儲。c、Ceph是去中心化的分布式解決方案,需要提前做好規(guī)劃設計,對技術團隊的要求能力比較高。特別是在Ceph擴容時,由于其數(shù)據(jù)分布均衡的特性。
那么現(xiàn)在問題來了,如果我們要選擇分布式存儲,選擇哪種好呢?其實它們各有各的優(yōu)勢和使用場景,具體要看需求。(1)HDFS:主要用于大數(shù)據(jù)的存儲場景,是Hadoop大數(shù)據(jù)架構中的存儲組件。HDFS在開始設計的時候,就已經明確的它的應用場景,就是大數(shù)據(jù)服務。(2)Ceph:目前應用廣的開源分布式存儲系統(tǒng),已得到眾多廠商的支持,許多超融合系統(tǒng)的分布式存儲都是基于Ceph深度定制。而且Ceph已經成為LINUX系統(tǒng)和OpenStack的“標配”,用于支持各自的存儲系統(tǒng)。Ceph可以提供對象存儲、塊設備存儲和文件系統(tǒng)存儲服務。同時支持三種不同類型的存儲服務的特性,在分布式存儲系統(tǒng)中,是很少見的。(3)Swift:主要面向的是對象存儲。和Ceph提供的對象存儲服務類似。主要用于解決非結構化數(shù)據(jù)存儲問題。它和Ceph的對象存儲服務的主要區(qū)別是。 分布式存儲系統(tǒng)需要使用多臺服務器共同存儲數(shù)據(jù),隨著服務器數(shù)量的增加,出現(xiàn)故障的概率也在不斷增加。
分布式存儲早期主要用于互聯(lián)網(wǎng)日志、企業(yè)備份歸檔、開發(fā)測試等場景,這些場景無疑是低價值場景,成本是第yi訴求甚至訴求。然此一時彼一時,士別三日也當刮目相看。首先是分布式存儲產品能力已今非昔比,逐漸具備了承載企業(yè)高價值業(yè)務的關鍵能力,例如毫秒級時延、TB/s級帶寬、雙活/3DC業(yè)務級容災、端到端DIF等,無論是結構化數(shù)據(jù)還是非結構化數(shù)據(jù)的承載,功能完備性的比較大短板早已補齊。其次,分布式存儲已走入眾多高價值關鍵業(yè)務,如運營商BOM業(yè)務、金融渠道類業(yè)務以及超算、油藏探測HPC等高價值業(yè)務,通過大規(guī)模應用實踐來檢驗成色。(小道消息,某些高價值場景全閃出貨價達到1000美金/TB以上啦)看完當下還要看看未來,筆者認為未來高價值的非結構化數(shù)據(jù)場景,分布式存儲的版圖還會持續(xù)擴展。如自動駕駛訓練、4K/8K超高清、5G日志留存等場景,對多協(xié)議訪問、極zhi帶寬、擴展性訴求強烈,分布式存儲已然成為這些未來業(yè)務的優(yōu)先架構。 可以從兩方面來理解分布式存儲:用戶側和實現(xiàn)側。杭州魏晉元興分布式存儲系統(tǒng)架構
五大主流分布式存儲技術對比分析,你 pick 哪一種?連云港大規(guī)模分布式存儲系統(tǒng)原理
分布式存儲系統(tǒng)需要使用多臺服務器共同存儲數(shù)據(jù),而隨著服務器數(shù)量的增加,服務器出現(xiàn)故障的概率也在不斷增加。為了保證在有服務器出現(xiàn)故障的情況下系統(tǒng)仍然可用。一般做法是把一個數(shù)據(jù)分成多份存儲在不同的服務器中。但是由于故障和并行存儲等情況的存在,同一個數(shù)據(jù)的多個副本之間可能存在不一致的情況。這里稱保證多個副本的數(shù)據(jù)完全一致的性質為一致性。分布式存儲系統(tǒng)需要多臺服務器同時工作。當服務器數(shù)量增多時,其中的一些服務器出現(xiàn)故障是在所難免的。我們希望這樣的情況不會對整個系統(tǒng)造成太大的影響。在系統(tǒng)中的一部分節(jié)點出現(xiàn)故障之后,系統(tǒng)的整體不影響客服端的讀/寫請求稱為可用性。 連云港大規(guī)模分布式存儲系統(tǒng)原理
江蘇魏晉元興智能科技有限公司主要經營范圍是數(shù)碼、電腦,擁有一支專業(yè)技術團隊和良好的市場口碑。魏晉元興智能致力于為客戶提供良好的網(wǎng)絡安全,VR,MR,VR,AI,視頻監(jiān)控安防,出入口門禁失控制,一切以用戶需求為中心,深受廣大客戶的歡迎。公司將不斷增強企業(yè)重點競爭力,努力學習行業(yè)知識,遵守行業(yè)規(guī)范,植根于數(shù)碼、電腦行業(yè)的發(fā)展。在社會各界的鼎力支持下,持續(xù)創(chuàng)新,不斷鑄造***服務體驗,為客戶成功提供堅實有力的支持。