請問磁盤陣列專用硬盤怎麽看出來
磁盤陣列(DiscArray)是由許多臺磁盤機或光盤機按壹定的規則,如分條(Striping)、分塊(Declustering)、交叉存取(Interleaving)等組成壹個快速,超大容量的外存儲器子系統。它在陣列控制器的控制和管理下,實現快速,並行或交叉存取,並有較強的容錯能力。從用戶觀點看,磁盤陣列雖然是由幾個、幾十個甚至上百個盤組成,但仍可認為是壹個單壹磁盤,其容量可以高達幾百~上千千兆字節,因此這壹技術廣泛為多媒體系統所歡迎。
盤陣列的全稱是:
RedundanArrayofInexpensiveDisk,簡稱RAID技術。它是1988年由美國加州大學Berkeley分校的DavidPatterson教授等人提出來的磁盤冗余技術。從那時起,磁盤陣列技術發展得很快,並逐步走向成熟。現在已基本得到公認的有下面八種系列。
1.RAID0(0級盤陣列)
RAID0又稱數據分塊,即把數據分布在多個盤上,沒有容錯措施。其容量和數據傳輸率是單機容量的N倍,N為構成盤陣列的磁盤機的總數,I/O傳輸速率高,但平均無故障時間MTTF(MeanTimeToFailure)只有單臺磁盤機的N分之壹,因此零級盤陣列的可靠性最差。
2.RAID1(1級盤陣列)
RAID1又稱鏡像(Mirror)盤,采用鏡像容錯來提高可靠性。即每壹個工作盤都有壹個鏡像盤,每次寫數據時必須同時寫入鏡像盤,讀數據時只從工作盤讀出。壹旦工作盤發生故障立即轉入鏡像盤,從鏡像盤中讀出數據,然後由系統再恢復工作盤正確數據。因此這種方式數據可以重構,但工作盤和鏡像盤必須保持壹壹對應關系。這種盤陣列可靠性很高,但其有效容量減小到總容量壹半以下。因此RAID1常用於對出錯率要求極嚴的應用場合,如財政、金融等領域。
3.RAID2(2級盤陣列)
RAID2又稱位交叉,它采用漢明碼作盤錯檢驗,無需在每個扇區之後進行CRC(CyclicReDundancycheck)檢驗。漢明碼是壹種(n,k)線性分組碼,n為碼字的長度,k為數據的位數,r為用於檢驗的位數,故有:n=2r-1r=n-k
因此按位交叉存取最有利於作漢明碼檢驗。這種盤適於大數據的讀寫。但冗余信息開銷還是太大,阻止了這類盤的廣泛應用。
4.RAID3(3級盤陣列)
RAID3為單盤容錯並行傳輸陣列盤。它的特點是將檢驗盤減小為壹個(RAID2校驗盤為多個,DAID1檢驗盤為1比1),數據以位或字節的方式存於各盤(分散記錄在組內相同扇區號的各個磁盤機上)。它的優點是整個陣列的帶寬可以充分利用,使批量數據傳輸時間減小;其缺點是每次讀寫要牽動整個組,每次只能完成壹次I/O。
5.RAID4(4級盤陣列)
RAID4是壹種可獨立地對組內各盤進行讀寫的陣列。其校驗盤也只有壹個。
RAID4和RAID3的區別是:RAID3是按位或按字節交叉存取,而RAID4是按塊(扇區)存取,可以單獨地對某個盤進行操作,它無需象RAID3那樣,那怕每壹次小I/O操作也要涉及全組,只需涉及組中兩臺磁盤機(壹臺數據盤,壹臺檢驗盤)即可。從而提高了小量數據的I/O速率。
6.RAID5(5級盤陣列)
RAID5是壹種旋轉奇偶校驗獨立存取的陣列。它和RAID1、2、3、4各盤陣列的不同點,是它沒有固定的校驗盤,而是按某種規則把其冗余的奇偶校驗信息均勻地分布在陣列所屬的所有磁盤上。於是在同壹臺磁盤機上既有數據信息也有校驗信息。這壹改變解決了爭用校驗盤的問題,因此DAID5內允許在同壹組內並發進行多個寫操作。所以RAID5即適於大數據量的操作,也適於各種事務處理。它是壹種快速,大容量和容錯分布合理的磁盤陣列。
7.RAID6(6級盤陣列)
RAID6是壹種雙維奇偶校驗獨立存取的磁盤陣列。它的冗余的檢、糾錯信息均勻分布在所有磁盤上,而數據仍以大小可變的塊以交叉方式存於各盤。這類盤陣列可容許雙盤出錯。
8.RAID7(7級盤陣列)
RAID7是在RAID6的基礎上,采用了cache技術,它使得傳輸率和響應速度都有較大的提高。Cache是壹種高速緩沖存儲器,即數據在寫入磁盤陣列以前,先寫入cache中。壹般采用cache分塊大小和磁盤陣列中數據分塊大小相同,即壹塊cache分塊對應壹塊磁盤分塊。在寫入時將數據分別寫入兩個獨立的cache,這樣即使其中有壹個cache出故障,數據也不會丟失。寫操作將直接在cache級響應,然後再轉到磁盤陣列。數據從cache寫到磁盤陣列時,同壹磁道的數據將在壹次操作中完成,避免了不少塊數據多次寫的問題,提高了速度。在讀出時,主機也是直接從cache中讀出,而不是從陣列盤上讀取,減少與磁盤讀操作次數,這樣比較充分地利用了磁盤帶寬。
這樣cache和磁盤陣列技術的結合,彌補了磁盤陣列的不足(如分塊寫請求響應差等缺陷),從而使整個系統以高效、快速、大容量、高可靠以及靈活、方便的存儲系統提供給用戶,從而滿足了當前的技術發展的需要,尤其是多媒體系統的需要。
解析磁盤陣列的關鍵技術
存儲技術在計算機技術中受到廣泛關註,服務器存儲技術更是業界關心的熱點。壹談到服務器存儲技術,人們幾乎立刻與SCSI(Small Computer Systems Interface)技術聯系在壹起。盡管廉價的IDE硬盤在性能、容量等關鍵技術指標上已經大大地提高,可以滿足甚至超過原有的服務器存儲設備的需求。但由於Internet的普及與高速發展,網絡服務器的規模也變得越來越大。同時,Internet不僅對網絡服務器本身,也對服務器存儲技術提出了苛刻要求。無止境的市場需求促使服務器存儲技術飛速發展。而磁盤陣列是服務器存儲技術中比較成熟的壹種,也是在市場上比較多見的大容量外設之壹。
在高端,傳統的存儲模式無論在規模上,還是安全上,或是性能上,都無法滿足特殊應用日益膨脹的存儲需求。諸如存儲局域網(SAN)等新的技術或應用方案不斷湧現,新的存儲體系結構和解決方案層出不窮,服務器存儲技術由直接連接存儲(DAS)向存儲網絡技術(NAS)方面擴展。在中低端,隨著硬件技術的不斷發展,在強大市場需求的推動下,本地化的、基於直接連接的磁盤陣列存儲技術,在速度、性能、存儲能力等方面不斷地邁上新臺階。並且,為了滿足用戶對存儲數據的安全、存取速度和超大的存儲容量的需求,磁盤陣列存儲技術也從講求技術創新、重視系統優化,以技術方案為主導的技術推動期逐漸進入了強調工業標準、著眼市場規模,以成熟產品為主導的產品普及期。
回顧磁盤陣列的發展歷程,壹直和SCSI技術的發展緊密關聯,壹些廠商推出的專有技術,如IBM的SSA(Serial Storage Architecture)技術等,由於兼容性和升級能力不盡如人意,在市場上的影響都遠不及SCSI技術廣泛。由於SCSI技術兼容性好,市場需求旺盛,使得SCSI技術發展很快。從最原始5MB/s傳輸速度的SCSI-1,壹直發展到現在LVD接口的160MB/s傳輸速度的Ultra 160 SCSI,320MB/s傳輸速度的Ultra 320 SCSI接口也將在2001年出現(見表1)。從當前市場看,Ultra 3 SCSI技術和RAID(Redundant Array of Inexpensive Disks)技術還應是磁盤陣列存儲的主流技術。
SCSI技術
SCSI本身是為小型機(區別於微機而言)定制的存儲接口,SCSI協議的Version 1 版本也僅規定了5MB/s傳輸速度的SCSI-1的總線類型、接口定義、電纜規格等技術標準。隨著技術的發展,SCSI協議的Version 2版本作了較大修訂,遵循SCSI-2協議的16位數據帶寬,高主頻的SCSI存儲設備陸續出現並成為市場的主流產品,也使得SCSI技術牢牢地占據了服務器的存儲市場。SCSI-3協議則增加了能滿足特殊設備協議所需要的命令集,使得SCSI協議既適應傳統的並行傳輸設備,又能適應最新出現的壹些串行設備的通訊需要,如光纖通道協議(FCP)、串行存儲協議(SSP)、串行總線協議等。漸漸地,“小型機”的概念開始弱化,“高性能計算機”和“服務器”的概念在人們的心目中得到強化,SCSI壹度成為用戶從硬件上來區分“服務器”和PC機的壹種標準。
通常情況下,用戶對SCSI總線的關心放在硬件上,不同的SCSI的工作模式意味著有不同的最大傳輸速度。如40MB/s的Ultra SCSI、160MB/s的Ultra 3 SCSI等等。但最大傳輸速度並不代表設備正常工作時所能達到的平均訪問速度,也不意味著不同SCSI工作模式之間的訪問速度存在著必然的“倍數”關系。SCSI控制器的實際訪問速度與SCSI硬盤型號、技術參數,以及傳輸電纜長度、抗幹擾能力等因素關系密切。提高SCSI總線效率必須關註SCSI設備端的配置和傳輸線纜的規範和質量。可以看出,Ultra 3模式下獲得的實際訪問速度還不到Ultra Wide模式下實際訪問速度的2倍。
壹般說來,選用高速的SCSI硬盤、適當增加SCSI通道上連接硬盤數、優化應用對磁盤數據的訪問方式等,可以大幅度提高SCSI總線的實際傳輸速度。尤其需要說明的是,在同樣條件下,不同的磁盤訪問方式下獲得的SCSI總線實際傳輸速度可以相差幾十倍,對應用的優化是獲得高速存儲訪問時必須關註的重點,而這卻常常被壹些用戶所忽視。按4KB數據塊隨機訪問6塊SCSI硬盤時,SCSI總線的實際訪問速度為2.74MB/s,SCSI總線的工作效率僅為總線帶寬的1.7%;在完全不變的條件下,按256KB的數據塊對硬盤進行順序讀寫,SCSI總線的實際訪問速度為141.2MB/s,SCSI總線的工作效率高達總線帶寬的88%。
隨著傳輸速度的提高,信號傳輸過程中的信號衰減和幹擾問題顯得越來越突出,終結器在壹定程度上可以起到降低信號波反射,改善信號質量的作用。同時,LVD(Low-Voltage Differential)技術的應用也越來越多。LVD工作模式是和SE(Single-Ended)模式相對應的,它可以很好地抵抗傳輸幹擾,延長信號的傳輸距離。同時,Ultra 2 SCSI和Ultra 3 SCSI模式也通過采用專用的雙絞型SCSI電纜來提高信號傳輸的質量。
在磁盤陣列的概念中,大容量硬盤並不是指單個硬盤容量大,而是指將單個硬盤通過RAID技術,按RAID 級別組合成更大容量的硬盤。所以在磁盤陣列技術中,RAID技術是比較關鍵的,同時,根據所選用的RAID級別的不同,得到的“大硬盤”的功能也有不同。
RAID是壹項非常成熟的技術,但由於其價格比較昂貴,配置也不方便,缺少相對專業的技術人員,所以應用並不十分普及。據統計,全世界75%的服務器系統目前沒有配置RAID。由於服務器存儲需求對數據安全性、擴展性等方面的要求越來越高,RAID市場的開發潛力巨大。RAID技術是壹種工業標準,各廠商對RAID級別的定義也不盡相同。目前對RAID級別的定義可以獲得業界廣泛認同的只有4種,RAID 0、RAID 1、RAID 0+1和RAID 5。
RAID 0是無數據冗余的存儲空間條帶化,具有低成本、極高讀寫性能、高存儲空間利用率的RAID級別,適用於Video / Audio信號存儲、臨時文件的轉儲等對速度要求極其嚴格的特殊應用。但由於沒有數據冗余,其安全性大大降低,構成陣列的任何壹塊硬盤損壞都將帶來數據災難性的損失。所以,在RAID 0中配置4塊以上的硬盤,對於壹般應用來說是不明智的。
RAID 1是兩塊硬盤數據完全鏡像,安全性好,技術簡單,管理方便,讀寫性能均好。但其無法擴展(單塊硬盤容量),數據空間浪費大,嚴格意義上說,不應稱之為“陣列”。
RAID 0+1綜合了RAID 0和RAID 1的特點,獨立磁盤配置成RAID 0,兩套完整的RAID 0互相鏡像。它的讀寫性能出色,安全性高,但構建陣列的成本投入大,數據空間利用率低,不能稱之為經濟高效的方案。
RAID 5是目前應用最廣泛的RAID技術。各塊獨立硬盤進行條帶化分割,相同的條帶區進行奇偶校驗(異或運算),校驗數據平均分布在每塊硬盤上。以n塊硬盤構建的RAID 5陣列可以有n-1塊硬盤的容量,存儲空間利用率非常高(見圖6)。任何壹塊硬盤上數據丟失,均可以通過校驗數據推算出來。它和RAID 3最大的區別在於校驗數據是否平均分布到各塊硬盤上。RAID 5具有數據安全、讀寫速度快,空間利用率高等優點,應用非常廣泛,但不足之處是1塊硬盤出現故障以後,整個系統的性能大大降低。
對於RAID 1、RAID 0+1、RAID 5陣列,配合熱插拔(也稱熱可替換)技術,可以實現數據的在線恢復,即當RAID陣列中的任何壹塊硬盤損壞時,不需要用戶關機或停止應用服務,就可以更換故障硬盤,修復系統,恢復數據,對實現HA(High Availability)高可用系統具有重要意義。
各廠商還在不斷推出各種RAID級別和標準。例如更高安全性的,從RAID控制器開始鏡像的RAID;更快讀寫速度的,為構成RAID的每塊硬盤配置CPU和Cache的RAID等等,但都不普及。用IDE硬盤構建RAID的技術是新出現的壹個技術方向,對市場影響也較大,其突出優點就是構建RAID陣列非常廉價。目前IDE RAID可以支持RAID 0、RAID 1和RAID 0+1三個級別,最多支持4塊IDE硬盤。由於受IDE設備擴展性的限制,同時,也由於IDE設備也缺乏熱可替換的技術支持的原因,IDE RAID的應用還不多。
總之,發展是永恒的主題,在服務器存儲技術領域也不例外。壹方面,壹些巨頭廠商嘗試推出新的概念或標準,來領導服務器及存儲技術的發展方向,較有代表性的如Intel力推的IA-64架構及存儲概念;另壹方面,致力於存儲的專業廠商以現有技術和工業標準為基礎,推動SCSI、RAID、Fibre Channel等基於現有存儲技術和方案快速更新和發展。在市場經濟條件下,檢驗技術發展的唯壹標準是市場的認同。市場呼喚好的技術,而新的技術必須起到推動市場向前發展作用時才能被廣泛接受和承認。隨著高性能計算機市場的發展,高性能比、高可靠性、高安全性的存儲新技術也會不斷湧現。
現在市場上的磁盤陣列產品有很多,用戶在選擇磁盤陣列產品的過程中,也要根據自己的需求來進行選擇,現在列舉幾個磁盤陣列產品,同時也為需要磁盤陣列產品的用戶提供壹些選擇。表2列出了幾種磁盤陣列的主要技術指標。
--------------------------------------------------------------------------------
小知識:磁盤陣列的可靠性和可用性
可靠性,指的是硬盤在給定條件下發生故障的概率。可用性,指的是硬盤在某種用途中可能用的時間。磁盤陣列可以改善硬盤系統的可靠性。從表3中可以看到RAID硬盤子系統與單個硬盤子系統的可靠性比較。
此外,在系統的可用性方面,單壹硬盤系統的可用性比沒有數據冗余的磁盤陣列要好,而冗余磁盤陣列的可用性比單個硬盤要好得多。這是因為冗余磁盤陣列允許單個硬盤出錯,而繼續正常工作;壹個硬盤故障後的系統恢復時間也大大縮短(與從磁帶恢復數據相比);冗余磁盤陣列發生故障時,硬盤上的數據是故障當時的數據,替換後的硬盤也將包含故障時的數據。但是,要得到完全的容錯性能,計算機硬盤子系統的其它部件也必須有冗余。