信息技術(shù)的迅猛發(fā)展使得數(shù)據(jù)存儲(chǔ)量呈爆炸式增長(zhǎng),數(shù)據(jù)量的激增又導(dǎo)致數(shù)據(jù)中心的規(guī)模不斷擴(kuò)大,能耗成本日益突出。據(jù)美國(guó)EPA(Environmental Protection Agency)的報(bào)告指出:2006 年美國(guó)數(shù)據(jù)中心消耗6.10×109 kW·h 電力,這相當(dāng)于580 萬(wàn)中等家庭的耗電量。此外在一個(gè)IT公司中,數(shù)據(jù)中心的年能源消耗成本已成為繼人力成本后的第二大成本支出,而且在隨后的幾年里將會(huì)持續(xù)增加。高能耗不僅帶來(lái)運(yùn)營(yíng)成本的增加,而且容易引起設(shè)備故障。最新結(jié)果表明,約50%的設(shè)備故障和環(huán)境過(guò)熱有關(guān)。每當(dāng)溫度上升15 ℃,則磁盤(pán)的故障率提高一倍。因此Google公司的首席執(zhí)行官EricSchmidt 就曾表示:“最影響Google 設(shè)計(jì)人員的不是計(jì)算機(jī)系統(tǒng)速度而是能耗,因?yàn)橐粋(gè)數(shù)據(jù)中心能消耗一座城市的電力”。
如何做到即降低能耗,節(jié)省成本,又能滿(mǎn)足實(shí)際性能的需要已經(jīng)成為迫切需要解決的難題,由此引入綠色存儲(chǔ)的概念。綠色存儲(chǔ)的最終目的是利用最少的存儲(chǔ)容量來(lái)滿(mǎn)足業(yè)務(wù)的需求,從而消耗最低的能源。
1.技術(shù)分類(lèi)
近年來(lái),存儲(chǔ)能耗問(wèn)題已經(jīng)引起人們的廣泛關(guān)注,國(guó)內(nèi)外的不少團(tuán)隊(duì)開(kāi)始對(duì)其進(jìn)行研究,并取得了豐碩成果。然而目前國(guó)內(nèi)尚未有人對(duì)其進(jìn)行系統(tǒng)總結(jié),因此本文從宏觀和微觀兩個(gè)角度對(duì)綠色存儲(chǔ)技術(shù)的發(fā)展現(xiàn)狀進(jìn)行了系統(tǒng)分析。
1.1 宏觀方面
(1)存儲(chǔ)虛擬化
以往數(shù)據(jù)中心的每臺(tái)服務(wù)器都有自己專(zhuān)屬的存儲(chǔ)空間,服務(wù)器之間很難“借用”存儲(chǔ)空間,造成不同設(shè)備的個(gè)體利用率差別很大而總體利用率偏低。虛擬化技術(shù)就是將實(shí)際的物理存儲(chǔ)實(shí)體和存儲(chǔ)的邏輯表示分離開(kāi),將不同設(shè)備的存儲(chǔ)資源整合到一個(gè)統(tǒng)一的虛擬化“存儲(chǔ)池”中,通過(guò)整合分散的存儲(chǔ)空間來(lái)解決容量和管理方面的制約。
(2)重復(fù)數(shù)據(jù)刪除
重復(fù)數(shù)據(jù)刪除技術(shù)是一種數(shù)據(jù)縮減技術(shù),消除分布在存儲(chǔ)系統(tǒng)中相同文件或數(shù)據(jù)塊,保留惟一的數(shù)據(jù)實(shí)例。利用重復(fù)數(shù)據(jù)刪除技術(shù)可以減少對(duì)存儲(chǔ)空間和網(wǎng)絡(luò)帶寬的占用,使硬盤(pán)存儲(chǔ)成為可能。
(3)自動(dòng)精簡(jiǎn)配置
傳統(tǒng)的存儲(chǔ)系統(tǒng)中,當(dāng)某用戶(hù)、某應(yīng)用需要存儲(chǔ)空間時(shí),需要事先預(yù)留足夠大的存儲(chǔ)空間以分配給該用戶(hù)或該應(yīng)用,其他用戶(hù)或應(yīng)用無(wú)法使用這些已經(jīng)分配但尚未使用的存儲(chǔ)空間,這將導(dǎo)致閑置空間不斷增大。因此實(shí)際上,往往采用自動(dòng)精簡(jiǎn)配置來(lái)進(jìn)行容量分配。自動(dòng)精簡(jiǎn)配置則可以根據(jù)某項(xiàng)應(yīng)用的實(shí)際需要,動(dòng)態(tài)并且實(shí)時(shí)地改變存儲(chǔ)容量資源的劃分,因此能更加充分有效地利用存儲(chǔ)資源,節(jié)約總成本。
(4)MAID
MAID(大規(guī)模非活動(dòng)磁盤(pán)陣列存儲(chǔ))最初的理論依據(jù)來(lái)自“80/20”定律,具體來(lái)說(shuō)就是80%的訪(fǎng)問(wèn)活動(dòng)圍繞著20%的物理存儲(chǔ)進(jìn)行。因此,那些暫時(shí)沒(méi)有數(shù)據(jù)被訪(fǎng)問(wèn)的磁盤(pán)驅(qū)動(dòng)器,完全可以進(jìn)入能耗相對(duì)較低的待機(jī)狀態(tài),甚至完全關(guān)閉,需要訪(fǎng)問(wèn)時(shí)再“喚醒”也來(lái)得及,從而達(dá)到節(jié)能的效果。
(5)分級(jí)存儲(chǔ)
數(shù)據(jù)分級(jí)存儲(chǔ),是指利用存儲(chǔ)設(shè)備的性能差異(磁盤(pán)、磁盤(pán)陣列、光盤(pán)庫(kù)、磁帶庫(kù)),將不同的數(shù)據(jù)存放在不同的存儲(chǔ)設(shè)備中。通常是根據(jù)數(shù)據(jù)的重要性、訪(fǎng)問(wèn)頻率、性能、容量、保留時(shí)間等因素確定的最佳存儲(chǔ)策略,通過(guò)分級(jí)存儲(chǔ)管理軟件實(shí)現(xiàn)數(shù)據(jù)客體在存儲(chǔ)設(shè)備之間的自動(dòng)遷移。一般方法就是將不經(jīng)常訪(fǎng)問(wèn)的數(shù)據(jù)遷移到存儲(chǔ)性能較低的層次(如磁帶),節(jié)省出性能較高的存儲(chǔ)空間(如磁盤(pán)陣列,磁盤(pán))存放被頻繁訪(fǎng)問(wèn)的數(shù)據(jù),以達(dá)到更好的系統(tǒng)性能。
1.2 微觀方面
(1)細(xì)分磁盤(pán)活動(dòng)狀態(tài)
基于低轉(zhuǎn)速消耗低能量的理論,將磁盤(pán)盤(pán)片轉(zhuǎn)速劃分為多個(gè)速度等級(jí),在系統(tǒng)負(fù)載較輕時(shí)使磁盤(pán)運(yùn)轉(zhuǎn)在低速旋轉(zhuǎn)狀態(tài);而當(dāng)系統(tǒng)負(fù)載變重時(shí),將磁盤(pán)相應(yīng)的調(diào)整到高速旋轉(zhuǎn)狀態(tài)。
缺陷:實(shí)現(xiàn)困難,僅有少數(shù)廠(chǎng)家能實(shí)現(xiàn)兩級(jí)轉(zhuǎn)速。
(2)減少磁頭定位開(kāi)銷(xiāo)
磁盤(pán)的性能和能耗越來(lái)越受到磁頭定位延遲的限制,例如尋道時(shí)間和查找時(shí)間,讓磁盤(pán)盡可能地進(jìn)行順序訪(fǎng)問(wèn)是減少磁頭定位開(kāi)銷(xiāo)的最有效方法,Huang等人為數(shù)據(jù)創(chuàng)建多個(gè)副本并將其存儲(chǔ)在文件系統(tǒng)的空閑塊上,通過(guò)I/O調(diào)度的方法使用戶(hù)請(qǐng)求盡可能地順序訪(fǎng)問(wèn)磁盤(pán)上的數(shù)據(jù)。
缺陷:未考慮冗余。
(3)延長(zhǎng)磁盤(pán)處于空閑狀態(tài)的周期
節(jié)省能耗的最常見(jiàn)的方法是當(dāng)磁盤(pán)沒(méi)有請(qǐng)求時(shí),讓磁盤(pán)處于等待狀態(tài)。然而服務(wù)器端面臨的請(qǐng)求太多,導(dǎo)致磁盤(pán)的平均空閑時(shí)間非常短無(wú)法滿(mǎn)足磁盤(pán)停止、啟動(dòng)
的時(shí)間需求。所以目的就是人為地提升磁盤(pán)的空閑時(shí)間,同時(shí)又不影響系統(tǒng)系能。
提高磁盤(pán)處于空閑狀態(tài)周期的因素有以下幾部分:
①cache命中率
cache管理策略能產(chǎn)生不同的磁盤(pán)請(qǐng)求序列,這將嚴(yán)重影響磁盤(pán)的耗能。比如說(shuō)一個(gè)讀請(qǐng)求所要的數(shù)據(jù)塊在cache中命中,它就不需要再去訪(fǎng)問(wèn)磁盤(pán),可以延長(zhǎng)磁盤(pán)的空閑時(shí)間。
②數(shù)據(jù)流特征
讀/寫(xiě)請(qǐng)求一起到來(lái)可能導(dǎo)致磁盤(pán)有較長(zhǎng)的空閑期,如果讀/寫(xiě)請(qǐng)求在時(shí)間上是均勻到來(lái),則可能因?yàn)榭?br /> 間隔太小而不能將磁盤(pán)轉(zhuǎn)到低功耗模式。對(duì)于多磁盤(pán),多個(gè)連續(xù)讀/寫(xiě)請(qǐng)求指向一簇磁盤(pán)節(jié)省的能耗要比分散指向所有磁盤(pán)節(jié)省的能耗多。
不同的磁盤(pán)有不同的數(shù)據(jù)流特征,例如請(qǐng)求到來(lái)的時(shí)間分布,冷未命中的數(shù)量,平均請(qǐng)求時(shí)間間隔等。這些數(shù)據(jù)流特征又對(duì)磁盤(pán)的能耗有著較大的影響。因?yàn)槿藗儫o(wú)法知道下一時(shí)刻數(shù)據(jù)流的到來(lái)情況,先前對(duì)數(shù)據(jù)流特征的研究主要是從兩個(gè)角度出發(fā):
預(yù)測(cè):eRAID根據(jù)前一時(shí)刻和當(dāng)前數(shù)據(jù)流狀態(tài),利用ARMA等模型預(yù)測(cè)未來(lái)工作流的可能變化。缺點(diǎn)是可靠性不高。
動(dòng)態(tài)變化:根據(jù)數(shù)據(jù)流到來(lái)的狀態(tài),動(dòng)態(tài)調(diào)整某些參數(shù),降低能耗。文獻(xiàn)給出了基于能耗感知的cache管理策略PA?LRU和PB?LRU。
③磁盤(pán)的冗余信息
利用磁盤(pán)間的冗余信息能夠?qū)?duì)一個(gè)非活躍磁盤(pán)的非阻塞讀平等的轉(zhuǎn)移成對(duì)其他活躍磁盤(pán)的讀請(qǐng)求(請(qǐng)求重定向)。
eRAID 利用RAID1的冗余特性來(lái)重定向I/O 請(qǐng)求,通過(guò)停止部分或整個(gè)冗余組來(lái)降低能耗,同時(shí)將系統(tǒng)性能的降低控制在一個(gè)可控的范圍內(nèi);當(dāng)鏡像磁盤(pán)處于等待狀態(tài),讀請(qǐng)求由主磁盤(pán)來(lái)完成,寫(xiě)請(qǐng)求由控制緩存或活躍磁盤(pán)來(lái)延遲,當(dāng)鏡像磁盤(pán)啟動(dòng)時(shí)再更新到鏡像磁盤(pán)里。
(4)數(shù)據(jù)布局
根據(jù)數(shù)據(jù)訪(fǎng)問(wèn)方式的改變?cè)诖疟P(pán)間遷移數(shù)據(jù),典型的代表就是PDC。PDC 模型根據(jù)數(shù)據(jù)訪(fǎng)問(wèn)頻率的差異性,周期性地將熱點(diǎn)數(shù)據(jù)遷移到部分磁盤(pán)上,并將訪(fǎng)
問(wèn)頻率較低的數(shù)據(jù)集中于剩下的磁盤(pán)中。但是由于PDC將大多數(shù)請(qǐng)求都集中到了一小部分磁盤(pán)上,這樣就容易形成系統(tǒng)瓶頸,增大系統(tǒng)響應(yīng)延遲。
(5)存儲(chǔ)介質(zhì)的改變
隨著存儲(chǔ)介質(zhì)的發(fā)展,新型存儲(chǔ)介質(zhì)日益受到人們的關(guān)注,其中的典型應(yīng)用就是固態(tài)盤(pán)。固態(tài)盤(pán)由控制單元和FLASH芯片組成,沒(méi)有可移動(dòng)的機(jī)械部件(如磁頭臂尋道,盤(pán)片旋轉(zhuǎn)),因此在性能和能耗方面有著明顯優(yōu)勢(shì),但是在小文件寫(xiě)入,使用壽命,性?xún)r(jià)比方面還有缺陷。
2.磁盤(pán)能耗的測(cè)量
通過(guò)對(duì)現(xiàn)有論文分析,對(duì)磁盤(pán)能耗的測(cè)試和優(yōu)化可以在已有磁盤(pán)能耗模型(2-參數(shù)模型,3-參數(shù)模型,粗糙-dempsey模型,dempsey模型)的基礎(chǔ)上利用磁盤(pán)仿真器disksim得到,已有磁盤(pán)能耗主要牽扯到兩方面的參數(shù),平均功率參數(shù)和時(shí)間參數(shù),平均功率參數(shù)可以通過(guò)磁盤(pán)規(guī)格得到,屬于已知內(nèi)容,需要求的是時(shí)間參數(shù),時(shí)間參數(shù)主要是靠disksim得到。
對(duì)于磁盤(pán)能耗的建;蛘呦到y(tǒng)的整體能耗建模一般是兩種方法:仿真或者黑盒建模,為了驗(yàn)證模型的正確性,需要真實(shí)的測(cè)量結(jié)果進(jìn)行校驗(yàn)。
3.結(jié)語(yǔ)
隨著信息技術(shù)的迅猛發(fā)展,數(shù)字信息呈爆炸式增長(zhǎng),數(shù)據(jù)中心的規(guī)模不斷擴(kuò)大,能耗成本日益突出。由此引入以提高所有網(wǎng)絡(luò)存儲(chǔ)技術(shù)的能源效率為最終目的的綠色存儲(chǔ)的概念,并從宏觀和微觀兩個(gè)方面,對(duì)綠色存儲(chǔ)技術(shù)進(jìn)行了分析。綠色存儲(chǔ)技術(shù)的發(fā)展不僅是IT產(chǎn)品供應(yīng)商的責(zé)任,也是終端用戶(hù)的責(zé)任,每一個(gè)用戶(hù)必須意識(shí)到自己既是綠色存儲(chǔ)技術(shù)發(fā)展的驅(qū)動(dòng)者又是綠色存儲(chǔ)技術(shù)發(fā)展的實(shí)踐者,有責(zé)任有義務(wù)為節(jié)能減排保護(hù)環(huán)境做貢獻(xiàn)?梢灶A(yù)見(jiàn)隨著終端用戶(hù)對(duì)綠色存儲(chǔ)的需求不斷提高,未來(lái)會(huì)有更多的綠色存儲(chǔ)產(chǎn)品和解決方案面世。
核心關(guān)注:拓步ERP系統(tǒng)平臺(tái)是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊(yùn)涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴(lài)品牌。
轉(zhuǎn)載請(qǐng)注明出處:拓步ERP資訊網(wǎng)http://m.sdyuan.com/
本文標(biāo)題:綠色存儲(chǔ)技術(shù)探析
本文網(wǎng)址:http://m.sdyuan.com/html/support/11121512792.html
























