亚洲午夜网_国产美女精品中文网蜜芽宝贝_亚洲国产福利成人一区_免费无码av片在线观看中文_国产高清在线精品一本大道

| 項目咨詢 |積分體系 | 加入收藏 | 設(shè)為首頁 | RSS
您當(dāng)前的位置:首頁 > 市場 > 百科 > 行業(yè)研究 > 專家專欄 > HIT專家 > 姜疆

存儲虛擬化及CDP技術(shù)在醫(yī)院信息化建設(shè)中的運(yùn)用

時間:2013-07-16 15:52:09  來源:  作者:姜疆
更多

 

上海愛數(shù)軟件有限公司醫(yī)衛(wèi)行業(yè)顧問姜疆
 
摘要:
9.11等事件造成的災(zāi)難性后果使人們更加深刻地認(rèn)識到數(shù)據(jù)信息的價值和意義,日益重視數(shù)據(jù)的保護(hù)。現(xiàn)代醫(yī)院對計算機(jī)的依賴性嚴(yán)重增強(qiáng),信息數(shù)據(jù)逐漸成為企業(yè)賴以生存的基礎(chǔ)。圍繞如何重復(fù)利用數(shù)據(jù),虛擬化技術(shù)正在大行其道。
服務(wù)器虛擬化用一虛多的技術(shù)可以充分發(fā)揮服務(wù)器的性能,特別適合于醫(yī)院日益增多的周邊業(yè)務(wù)系統(tǒng),服務(wù)器虛擬化可以加速應(yīng)用部署交付,動態(tài)擴(kuò)展計算和存儲資源。但是服務(wù)器虛擬化有一個問題就是將多個雞蛋又集中在了一個籃子里面,增加了系統(tǒng)運(yùn)行的風(fēng)險。隨著醫(yī)院日益增加的存儲需求,加上大量老化和即將淘汰的舊存儲,設(shè)備利舊和投資保護(hù)的問題、異構(gòu)存儲整合的問題、后端數(shù)據(jù)容災(zāi)的問題。等等這些問題困擾著醫(yī)院信息中心的決策者。為了解決這些問題,本文將從幾個方面來闡述醫(yī)院信息化中必不可少的技術(shù)——存儲虛擬化。CDP技術(shù)是這兩年醫(yī)院備份容災(zāi)領(lǐng)域關(guān)注的技術(shù)概念,我們知道CDP技術(shù)可以對數(shù)據(jù)進(jìn)行歷史回退,解決邏輯性的問題,比如病毒和人為刪除的問題,但這次本文重點不是容災(zāi)而是從新的角度來闡述CDP在醫(yī)院的運(yùn)用。
 
關(guān)鍵字:存儲虛擬化、CDP、備份容災(zāi)、ETL
 
存儲虛擬化(Storage Virtualization)最通俗的理解就是對存儲硬件資源進(jìn)行抽象池化。我們可以理解存儲虛擬化就是一種技術(shù),將現(xiàn)有的存儲都整合在一個存儲池中整合起來,然后再提供給前端應(yīng)用。但是存儲虛擬化的技術(shù)可以用多種運(yùn)用,我們運(yùn)用這些存儲虛擬化的特性可以讓存儲管理更加高效。
 
存儲虛擬化技術(shù)醫(yī)院的三個運(yùn)用
一、存儲虛擬化結(jié)合服務(wù)器虛擬化做異地容災(zāi)
服務(wù)器虛擬化在醫(yī)院日漸流行,但是我們知道一個服務(wù)器虛擬成了多個系統(tǒng)后,我們就要考慮服務(wù)器和存儲自身的穩(wěn)定性了,否則極易成為一個單點故障。對于虛擬化系統(tǒng)來說,可能會有虛擬化內(nèi)部數(shù)據(jù)的錯誤;可能會有虛擬化平臺系統(tǒng)自身的錯誤(比如VMESX本身的核心也是一個LINUX內(nèi)核的系統(tǒng));宿主服務(wù)器硬件的錯誤;虛擬磁盤文件VMDK及相關(guān)文件系統(tǒng)的錯誤;存儲硬件的錯誤。以上錯誤都可以導(dǎo)致虛擬機(jī)崩潰,盡管我們可以借助于虛擬化系統(tǒng)本身提供的容災(zāi)功能,但是這些基于虛擬機(jī)層面的文件克隆和復(fù)制技術(shù)的容災(zāi)功能效率都不高,無法滿足醫(yī)院的RPORTO需求。還有一個問題就是大部分醫(yī)院到目前為止虛擬化應(yīng)用并未深入到核心業(yè)務(wù)系統(tǒng),虛擬化和非虛擬化環(huán)境混搭是最常見的醫(yī)院系統(tǒng)架構(gòu)。對于UNIX平臺來說,主流虛擬化系統(tǒng)目前還未支持,所以一個更加底層的解決后端存儲單點故障的技術(shù)是我們迫切需要的。
存儲虛擬化有一個關(guān)鍵的功能就是可以做存儲間的鏡像,而且這種在虛擬卷之間的鏡像可以在兩個異構(gòu)存儲中進(jìn)行。虛擬機(jī)的關(guān)鍵數(shù)據(jù)借助于存儲虛擬化鏡像可以實現(xiàn)異地容災(zāi)的效果。假設(shè)我們在主機(jī)房安裝的存儲上面部署了虛擬化應(yīng)用,我們通過存儲虛擬化技術(shù)將其鏡像到異地災(zāi)備機(jī)房,當(dāng)主機(jī)房的存儲及鏈路出現(xiàn)問題,我們就可以瞬間切換到災(zāi)備機(jī)房,以保證虛擬化業(yè)務(wù)不中斷。結(jié)合服務(wù)器虛擬化技術(shù),我們不用擔(dān)心多個雞蛋集中在一個籃子里的風(fēng)險。
1.jpg
上圖中,我們的VDisk(虛擬卷)是映射在兩個物理陣列上的,左邊的主陣列假設(shè)安裝了虛擬機(jī),那么通過鏡像技術(shù)同步到災(zāi)備陣列中,對于Vdisk來說,我們看到的數(shù)據(jù)是有一份,但是物理上是有兩份(甚至是兩份以上)。其中任何節(jié)點出現(xiàn)故障,那么對于Vdisk來說,他能夠瞬間切換到可用的節(jié)點(只要不是所有節(jié)點崩潰)。我們可以粗略地形象理解這相當(dāng)于是在陣列之間做了RAID1的效果。
借助于數(shù)據(jù)重刪和壓縮,我們可以理解兩個陣列之間的距離可以足夠遠(yuǎn),甚至是成百上千公里,這樣就可以方便地做異地容災(zāi)。這種技術(shù)對于醫(yī)院目前流行的雙活數(shù)據(jù)中心尤為重要,一般情況下,本院不同樓宇之間形成雙活數(shù)據(jù)中心,利用存儲虛擬化鏡像技術(shù)已經(jīng)成為主流選擇。
 
二、存儲虛擬化實現(xiàn)混合存儲池滿足醫(yī)院多種應(yīng)用特性
醫(yī)院的存儲始終面臨逐步的升級和換代中,不同的應(yīng)用往往要求部署不同的存儲。我們知道HIS系統(tǒng)的特點就是I/O查詢寫入特別頻繁,并發(fā)訪問量大,但是數(shù)據(jù)流量不太大。PACS系統(tǒng)是數(shù)據(jù)流量大,對于I/O帶寬占用很大,存儲后端容量消耗大,但是查詢寫入頻度不算高。醫(yī)院的應(yīng)用其實還不僅僅是這些,如何將每個系統(tǒng)的運(yùn)行效率保持最高,充分發(fā)揮現(xiàn)有存儲的性能就是一個新的課題。存儲虛擬化正好有這樣的技術(shù)能夠把許多零散的存儲資源整合起來,從而提高整體利用率,同時降低系統(tǒng)管理成本。通過分層存儲的劃分,我們以最高的效率、最低的成本來滿足各類不同應(yīng)用在性能和容量等方面的需求。
2.jpg
 
如上圖所示:我們可以將現(xiàn)有的存儲池劃分為三個虛擬卷,我們假設(shè)將HISSDD存儲介質(zhì)進(jìn)行存取,EMR我們用SAS硬盤,PACSNLSAS硬盤,這樣就能夠充分將性價比發(fā)揮到極致。對于vdisk來說,可能PACS的存儲池是由3個陣列匯集成一個大的存儲池,對于PACS應(yīng)用來說,它只看到一個統(tǒng)一的存儲池。對于醫(yī)療業(yè)務(wù)也有我們不太清楚業(yè)務(wù)規(guī)律的系統(tǒng),當(dāng)我們不能確定是否用什么存儲池來應(yīng)對的時候,我們也可以使用自動分層技術(shù)來解決問題。自動分層就是根據(jù)I/O訪問頻度自動根據(jù)頻繁的程度匹配最適合(已定義)磁盤類型,以將存儲性能發(fā)揮到最佳。
 
對于PACS系統(tǒng)來說,在線擴(kuò)容和存儲升級將會帶來很多風(fēng)險,所以利用存儲虛擬化的在線擴(kuò)容功能對于PACS系統(tǒng)來說將會非常有價值。我們可以保證PACS系統(tǒng)24小時不停機(jī)的情況下就能完成存儲擴(kuò)容的動作。借助于自動精簡配置功能,我們可以將多個已經(jīng)整合的存儲給前端應(yīng)用分配盡可能充足的空間,讓前端應(yīng)用程序不會因為剩余空間不足導(dǎo)致運(yùn)行問題。自動精簡配置可以理解為超量預(yù)先分配,這塊對于虛擬化系統(tǒng)(如vmware也有),但是將分配出去的空間收回,vmware就不能做到了,借助存儲虛擬化技術(shù)可以實現(xiàn)在線資源回收,所以vmware結(jié)合存儲虛擬化將會如虎添翼。
三、如何選擇和搭建存儲虛擬化技術(shù)
對于醫(yī)院來說,如何選擇存儲虛擬化技術(shù)是一個問題。存儲虛擬化有幾種形式,第一種是基于主機(jī)的虛擬化,基于主機(jī)的虛擬存儲依賴于代理或管理軟件,它們被安裝在一個或多個主機(jī)上,實現(xiàn)存儲虛擬化的控制和管理。由于控制軟件運(yùn)行在主機(jī)上,這就會占用主機(jī)的CPU資源?赡芪覀冋J(rèn)為基于主機(jī)的虛擬化方法最容易實現(xiàn),其設(shè)備成本最低,其實安裝部署方面并非那么簡便,并且基于主機(jī)授權(quán)模式,以后的費用也比較高。第二種是依賴于存儲供應(yīng)商的存儲虛擬化技術(shù),當(dāng)然,利用這種方法意味著最終將鎖定某一家單獨的存儲供應(yīng)商。盡管某些存儲廠商聲稱他們的存儲自帶的虛擬化功能對于其他存儲也可以兼容。但是這種兼容性容易受到一些限制,存儲廠商提供的虛擬化技術(shù)是需要以存儲為中心的,如果主存儲節(jié)點出現(xiàn)問題,那這種虛擬化將不是牢靠的。第三種就是基于獨立網(wǎng)關(guān)的存儲虛擬化設(shè)備,由于不依賴于在每個主機(jī)上運(yùn)行的代理服務(wù)器,這種方法比基于主機(jī)或基于設(shè)備的方法具有更好的安全性。當(dāng)連接主機(jī)到存儲網(wǎng)絡(luò)的網(wǎng)關(guān)出現(xiàn)故障時,仍然可能導(dǎo)致主機(jī)上的數(shù)據(jù)不能被訪問。所以利用網(wǎng)關(guān)的冗余可以支持動態(tài)多路徑,來解決網(wǎng)關(guān)的單點故障,通常情況下方案都至少配置2臺網(wǎng)關(guān)。獨立網(wǎng)關(guān)的存儲虛擬化技術(shù)可以不需要在主機(jī)上安裝代理程序,不會占主機(jī)資源,也不需要依附于某個存儲廠商。對于有大量存儲設(shè)備要利舊使用,需要對各種異構(gòu)存儲進(jìn)行整合的情況,這種方案將是首選。從發(fā)展趨勢看,基于主機(jī)的和基于存儲的虛擬化技術(shù)目前已經(jīng)相對成熟,用戶可以充分享受到它們所帶來的好處,而且由于它們已經(jīng)進(jìn)入成熟期,基于獨立網(wǎng)關(guān)的存儲虛擬化技術(shù)是一種新的開始流行的虛擬化存儲技術(shù),它獨立于主機(jī)和存儲設(shè)備,因此,給用戶帶來了很大的靈活性,其未來的發(fā)展空間最大。
 
CDP技術(shù)醫(yī)院的運(yùn)用
在過去的20多年中,雖然計算機(jī)技術(shù)取得了巨大的發(fā)展,但是數(shù)據(jù)備份技術(shù)卻沒有長足進(jìn)步。數(shù)據(jù)備份操作代價和成本仍然比較高,并且消耗大量時間和系統(tǒng)資源,數(shù)據(jù)備份的恢復(fù)時間目標(biāo)和恢復(fù)點目標(biāo)比較長。
顯然,這種數(shù)據(jù)備份方式存在一個顯著的不足,即備份窗口問題。在數(shù)據(jù)備份期間,企業(yè)業(yè)務(wù)需要暫時停止對外提供服務(wù)。隨著企業(yè)數(shù)據(jù)量和數(shù)據(jù)增長速度的加快,這個窗口可能會要求越來越長,這對于關(guān)鍵性業(yè)務(wù)系統(tǒng)來說是無法接受的。對于醫(yī)院來說,信息系統(tǒng)要求24x7不間斷運(yùn)行,短時的停機(jī)或者少量數(shù)據(jù)的丟失都會導(dǎo)致巨大的損失。因此,就需要將數(shù)據(jù)備份窗口盡可能地縮小,甚至縮小為零,數(shù)據(jù)快照(Snapshot)、持續(xù)數(shù)據(jù)保護(hù)(CDP)等技術(shù),就是為了滿足這樣的需求而出現(xiàn)的數(shù)據(jù)保護(hù)技術(shù)
CDP持續(xù)數(shù)據(jù)保護(hù)(Continuous Data Protection)是一套方法,它可以捕獲或跟蹤數(shù)據(jù)的變化,并將其在生產(chǎn)數(shù)據(jù)之外獨立存放,以確保數(shù)據(jù)可以恢復(fù)到過去的任意時間點。持續(xù)數(shù)據(jù)保護(hù)系統(tǒng)可以基于塊、文件或應(yīng)用實現(xiàn),可以為恢復(fù)對象提供足夠細(xì)的恢復(fù)粒度,實現(xiàn)幾乎無限多的恢復(fù)時間點。這個是全球網(wǎng)絡(luò)存儲工業(yè)協(xié)會(SNIA)的定義。因為CDP技術(shù)有更細(xì)粒度的恢復(fù)能力,我們通常用它來解決不確定RPO的部分。為了讓丟失數(shù)據(jù)量達(dá)到最小,CDP基于I/O級的恢復(fù)粒度正好是我們需要的。當(dāng)我們誤刪除數(shù)據(jù)或者文件系統(tǒng)受到邏輯性損壞或者病毒,我們可以嘗試用CDP技術(shù)將損失降到最低。對于此外,對于醫(yī)院來說還有另外的妙用。列舉如下:
幫助新系統(tǒng)部署測試,快速驗證新系統(tǒng)運(yùn)行效果
 
醫(yī)院的信息系統(tǒng)是一個螺旋形不斷日益完善的系統(tǒng),修修補(bǔ)補(bǔ)已經(jīng)成為常態(tài)。并且新的應(yīng)用系統(tǒng)在上線的過程中都要進(jìn)行測試。按照HIS公司之前的做法,是在獨立搭建的服務(wù)器進(jìn)行邏輯性測試、壓力測試后再部署上線。將HIS現(xiàn)有的數(shù)據(jù)庫轉(zhuǎn)移到測試服務(wù)器中將是一個繁瑣的過程,因為數(shù)據(jù)庫的備份和恢復(fù)所花時間太多,為了保持測試系統(tǒng)能夠有驗證能力并且還要保證數(shù)據(jù)庫體積不能過于龐大,我們都要對原數(shù)據(jù)庫做出一些“截斷”工作。經(jīng)過多次迭代,如何在新的數(shù)據(jù)庫基礎(chǔ)上測試驗證是一個問題,F(xiàn)在有了CDP技術(shù),我們可以將目前CDP記錄的系統(tǒng)數(shù)據(jù)庫卷通過生成快照掛載出來。我們可以理解CDP就是錄像機(jī),快照技術(shù)就是照相,我們從CDP形成一個快照就是定格在某一時間點取出一個照片一樣。
我們只需要在生成的快照上直接寫入測試數(shù)據(jù)就可以實現(xiàn)我們的測試效果,測試完畢后釋放快照即可。原來需要花幾個小時甚至一整天搭建的測試環(huán)境,在CDP的幫助下只需要十幾二十分鐘就搭建好了。這種測試數(shù)據(jù)的搭建方式有個明顯的好處是保證被測數(shù)據(jù)環(huán)境的新鮮度。我們始終在更加貼近真實數(shù)據(jù)結(jié)構(gòu)環(huán)境上進(jìn)行測試,便于及時發(fā)現(xiàn)問題。如果結(jié)合服務(wù)器虛擬化技術(shù),在模擬群集環(huán)境下的測試將更加便利。我們還可以對當(dāng)前測試的過程再次形成快照,記錄各個測試數(shù)據(jù)前后變化的狀態(tài),便于進(jìn)行更加細(xì)致的測試。靈活運(yùn)用這種技術(shù)對于需求變化極快的醫(yī)療信息軟件是非常有價值的,加快應(yīng)用程序迭代和發(fā)布的速度,提升整體的開發(fā)效率。另外還有一個場景也可以重復(fù)利用CDP技術(shù),當(dāng)我們部署一個復(fù)雜的中間件系統(tǒng)或者在操作系統(tǒng)上做很多配置的時候,我們利用CDP記錄升級和配置的過程,當(dāng)出現(xiàn)問題我可以迅速回退,至少可以保證不會因為小小的升級失誤就推倒重來。
 
二、利用快照技術(shù)加速BI提升ETL效果
ETL,Extraction-Transformation-Loading的縮寫,中文名稱為數(shù)據(jù)提取、轉(zhuǎn)換和加載。為什么ETL這么重要呢?ETL負(fù)責(zé)將分散的、異構(gòu)數(shù)據(jù)源中的數(shù)據(jù)如關(guān)系數(shù)據(jù)、平面數(shù)據(jù)文件等抽取到臨時中間層后進(jìn)行清洗、轉(zhuǎn)換、集成,最后加載到數(shù)據(jù)倉庫數(shù)據(jù)集市中,成為聯(lián)機(jī)分析處理、數(shù)據(jù)挖掘的基礎(chǔ)。如果說數(shù)據(jù)倉庫的模型設(shè)計是一座大廈的設(shè)計藍(lán)圖,數(shù)據(jù)是磚瓦的話,那么ETL就是建設(shè)大廈的過程。在整個項目中最難部分是用戶需求分析和模型設(shè)計,而ETL規(guī)則設(shè)計和實施則是工作量最大的,約占整個項目的60%80%,這是國內(nèi)外從眾多實踐中得到的普遍共識。
為了能夠?qū)⑨t(yī)療數(shù)據(jù)深入進(jìn)行挖掘,我們需要建立數(shù)據(jù)集市(面向主題的數(shù)據(jù)集),這個前提是要做好ETL的過程。一般來說都是采用主動“拉取”方式,例如:如果是基于sqlserver數(shù)據(jù)倉庫的,那么借助于sqlserverSSISsqlserver內(nèi)置的抽取工具),對當(dāng)前業(yè)務(wù)數(shù)據(jù)進(jìn)行定時抽取。為了不影響當(dāng)前業(yè)務(wù)數(shù)據(jù),一般都是在夜間定時進(jìn)行抽取。這種情況下,我們就可以理解BI分析看到的數(shù)據(jù)都是昨天及以前的數(shù)據(jù)。我們并不能對當(dāng)前的數(shù)據(jù)進(jìn)行及時分析。當(dāng)我們做環(huán)比統(tǒng)計或者對當(dāng)天的數(shù)據(jù)進(jìn)行分析,比如當(dāng)天的用藥指標(biāo)監(jiān)控等,我們就不能看到新鮮的數(shù)據(jù)。
為了解決這個問題,我們可以通過編寫腳本,將ETL的抽取源制定到定時快照上面,因為快照的生成不會對當(dāng)前系統(tǒng)造成很多壓力,并且抽取源定向于快照,我們就可以不用擔(dān)心HIS主機(jī)的性能遭到影響。
3.jpg
 
從上圖我們可以看到我們整個BI的展現(xiàn)流程。在圖示的左邊,HIS、EMR,OPRHRP還有其他系統(tǒng)都是可以基于快照進(jìn)行抽取,而不是直接從業(yè)務(wù)系統(tǒng)抽取,這樣抽取策略可以保持BI數(shù)據(jù)抽取的新鮮度,并且不影響生產(chǎn)系統(tǒng)性能。對于即時分析要求越來越高的醫(yī)療輔助決策應(yīng)用,這是一個非常有效的方法?煺詹粌H僅可以為容災(zāi)提供服務(wù),還可以給各個醫(yī)院信息化層面帶來新的驅(qū)動力。
綜上所述,存儲虛擬化技術(shù)和CDP技術(shù)的誕生對于醫(yī)療信息化建設(shè)來說是一個強(qiáng)有力的工具,我們利用好了可以讓我們的工作事半功倍。醫(yī)院已經(jīng)進(jìn)入或者正在進(jìn)入大數(shù)據(jù)時代,在大數(shù)據(jù)時代背景下,利用新的技術(shù)將為醫(yī)院管理和輔助決策注入強(qiáng)勁的驅(qū)動力。
 
參考文獻(xiàn):
王樹鵬, 云曉春, 郭莉. 持續(xù)數(shù)據(jù)保護(hù)(CDP)技術(shù)的發(fā)展綜述. 信息技術(shù)快報, 2008年第6卷第6期.
王力華,依托統(tǒng)一規(guī)范提升大數(shù)據(jù)利用價值.北京大學(xué)人民醫(yī)院醫(yī)學(xué)信心中心,201368
來頂一下
返回首頁
返回首頁
發(fā)表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發(fā)表
欄目更新
    欄目熱門