|
作者:CHX 備份專家 備份系統(tǒng)搭建完成,運行一段時間后沒問題,接下來就需要匯總、編寫各種報告了。對備份系統(tǒng)整體架構(gòu)、體系以及策略等變更,都是維護一個備份系統(tǒng)的重中之重。尤其是在備份系統(tǒng)日益龐大之后,某天客戶問一個系統(tǒng)的數(shù)據(jù)是如何備份的,生產(chǎn)進行哪個調(diào)整影響備份嗎?如果沒有良好的維護記錄,很可能面對這一個問題就會手忙腳亂。 在此筆者分享一下個人的維護經(jīng)驗,主要聊一聊TSM備份和歸檔那些事,比如: 1. 我只是想備份我的數(shù)據(jù),不關(guān)心什么策略域、副本組? 對于客戶而言,客戶不大關(guān)注備份系統(tǒng)的架構(gòu)實質(zhì),更多的希望你能簡簡單單告訴他數(shù)據(jù)怎么備份的、保留多少份等等。但對于維護人員而言,可能不大關(guān)注客戶業(yè)務哪個系統(tǒng)如何如何,更多的可能是某個客戶端怎么備份而已。 這個問題,就是在考驗維護人員的整合能力。關(guān)于這一點,個人的處理方法是按照客戶的系統(tǒng)分類習慣制作備份信息策略表。舉個例子: EXCEL表第一列---系統(tǒng)類別,比如:BOSS系統(tǒng)、BI系統(tǒng)以及OA系統(tǒng)等; EXCEL表第二列開始將大系統(tǒng)細分,比如BOSS系統(tǒng)中計費系統(tǒng); EXCEL表第三列將系統(tǒng)內(nèi)的備份細分,數(shù)據(jù)庫備份、中間件備份、虛擬機備份、文件備份等; EXCEL表第四列開始精確到客戶端,接下來關(guān)于客戶端的一些信息,主機名、IP、備份方式(LAN or LAN-FREE)、備份腳本路徑、備份啟動時間、備份頻率(每周二全備份)、備份池名稱、備份目標介質(zhì)等等。 如此制表,無論是給客戶審批還是個人維護,不僅直觀、簡潔、高效,而且維護一段時間之后,也很有助于對客戶業(yè)務系統(tǒng)的深入理解。 2. 講了這么多概念,能不能告訴我,我想要的數(shù)據(jù)到底備份到了哪盤磁帶上? 如果有了1中的備份策略表,不管是客戶給了你一個IP,還是一個主機或系統(tǒng)名字,作為運維人員的你來回復客戶這個問題肯定很簡單:哪個系統(tǒng)、哪個數(shù)據(jù)庫、哪個備份如何進行、數(shù)據(jù)將備份到哪個目標介質(zhì)上的哪個備份池,一目了然。如果還需要細化備份具體使用的磁帶范圍,在控制臺查詢后也可以輕松應對。 3. 使用TSM備份Oracle,怎么設(shè)置通道會比較好? 不管是哪一款備份軟件,對備份數(shù)據(jù)備份流程的控制尤其重要,特別是采用消重技術(shù)的備份,對備份數(shù)據(jù)的控制效用將直接影響消重性能。 消重技術(shù)以變長、定長兩種為例,顧名思義變長是可以根據(jù)數(shù)據(jù)長度動態(tài)調(diào)整切片長度(如EMC DataDomain),定長僅僅是以固定長度對數(shù)據(jù)進行切片。 切片完成后,片(piece)的命中率直接決定消重性能。piece的命中率越高,消重越明顯。因此如何控制備份片(backup piece)單一度且相似度成為重點。 我們知道Oracle的Rman腳本里,有一個fileperset參數(shù)來控制每一個backup piece里會包含多少個data file。設(shè)想一下,如果fileperset越高,那每個backup piece就會包含更多的data file,backup piece的雜糅度就會越高(data file會被混亂隨機的組成一個backup piece,并不是每次都按照同一個順序擬成),那么消重切片后piece的重復率必然低。 綜合分析,一個合理的fileperset值將有效提升消重效率,fileperset越小越好,理論為1最好(如果沒有多路復用的情況,一個流會話會占用一個備份設(shè)備)。 接下來關(guān)注備份通道數(shù),Oracle的備份效率與數(shù)據(jù)結(jié)構(gòu)類型、數(shù)據(jù)大小以及備份配置等息息相關(guān)。 如何合理規(guī)劃備份通道數(shù)?關(guān)于此問題,我們需要了解一個概念——多路復用(multiplexing)。這個功能能夠讓多個oracle channel的備份流寫入一個磁帶機,如rman里分配了四個通道,但備份只有一個磁帶機在跑。對于單個磁帶機來講,連續(xù)、大量的數(shù)據(jù)流具有更高的寫入效率,如果單個backup piece數(shù)據(jù)量偏小就需要適當提高multiplexing的復用效率:允許x個會話同時寫入該設(shè)備(此操作提高數(shù)據(jù)雜糅度會降低后端消重效率)。 對于Oracle而言,如果數(shù)據(jù)庫性能允許,更多的channel會帶來更高的數(shù)據(jù)讀取效率,備份速度越快。然而考慮到備份對業(yè)務的影響以及并發(fā)性能的限制,最佳的通道數(shù)需要多次調(diào)整嘗試。 除此之外若是oracle的消重備份,如果設(shè)置rman讀取datafile時的讀取塊大小以及備份軟件寫數(shù)據(jù)的塊大小以及設(shè)備消重的最小長度呈倍數(shù)關(guān)系,在消重效率和備份速率上都會有一定提升。 4. 使用TSM備份我的Oracle和Db2,過期策略怎么設(shè)置,怎么感覺數(shù)據(jù)越來越多,一直刪不掉? 關(guān)于備份的過期策略,舉個簡單的例子: 就像書籍的目錄和章節(jié)內(nèi)容:備份軟件的索引保留策略相當于目錄,備份數(shù)據(jù)相當于章節(jié)內(nèi)容。全備份和增量備份的依賴關(guān)系,相當于大章節(jié)下的小章節(jié)。如此理解之后,備份的依賴關(guān)系以及周期關(guān)系就很明晰了,接下來就是根據(jù)實際情況來調(diào)整策略了。 在備份的一級存儲介質(zhì)上存儲長周期的備份,會降低該存儲的整體利用率。如果條件允許,可以在一級存儲上存儲一兩個周期的備份用于應急恢復,短期備份數(shù)據(jù)通過克隆到二級存儲上作長期保留。如果數(shù)據(jù)量大,可以考慮使用消重設(shè)備備份。 5. Lanfree是什么,我想使用磁盤存儲,可以使用Lanfree嗎? Lan Free,顧名思義,即釋放了LAN的壓力。數(shù)據(jù)流直接從備份節(jié)點經(jīng)過SAN switch備份到介質(zhì),而不經(jīng)過Lan網(wǎng)絡。但是數(shù)據(jù)仍然會通過備份節(jié)點的磁盤--內(nèi)存——SAN switch這步,因此仍然會消耗備份節(jié)點的資源。Server Free,與Lan Free的區(qū)別是:數(shù)據(jù)不落盤和內(nèi)存,直接由存儲經(jīng)過SAN switch向備份設(shè)備寫入。 若是使用NAS類磁盤存儲,可以通過NDMP進行LAN FREE備份的。還有一些特殊的磁盤類設(shè)備可以實現(xiàn)Lan Free,比如EMC Datadomain可以實現(xiàn)ddboost over fc。 6. 我想對我的重要應用備份離線長期保持,磁帶出庫方面如何設(shè)計,有什么值得注意的? 磁帶出入庫方面的設(shè)計,主要是詳細記錄,否則恢復數(shù)據(jù)時茫茫的磁帶海去找磁帶,那就刺激了。 在出庫方面,一定要記錄幾點必要的信息:哪些磁帶,什么時間出庫,保留至多久,是哪個備份的磁帶,存放地在哪兒(最好精確到磁盤柜編號)。建議對出庫磁帶在備份系統(tǒng)的標識均作好記錄,比如是哪個系統(tǒng)哪個客戶端什么時間的備份,標簽是什么。對于人員混雜的存處區(qū),切記在磁帶保存箱外面標注“重要數(shù)據(jù),請勿使用”等類似標識。 在入庫方面,需要注意的幾點信息:入庫的磁帶是否已經(jīng)是無效數(shù)據(jù),從哪兒獲得的磁帶,放入哪個磁帶庫,什么時間入庫等等。同時還需要在(出庫的)磁帶流向表里更新磁帶使用信息。 磁帶出入庫的管理,強烈建議固定人員操作,而且磁帶庫的鑰匙每次使用做好記錄,誰使用誰更新磁帶出入庫表。 磁帶庫的保存環(huán)境,溫度、濕度、磁場等,防磁化標準高的話,可以考慮防磁柜。
|
|
|