|
1、虛擬化平臺的運維中最關(guān)鍵的是什么? 運維中最關(guān)鍵的還是這幾點: 1、高效 主要還是根據(jù)你虛擬化平臺的規(guī)模來看,如果規(guī)模比較大,則使用python、PowerCLI(僅VMware)這類腳本運維方式會很省事,可以完成從虛擬化控制中心、主機、虛擬機、虛擬網(wǎng)絡、存儲等相關(guān)資源的新建、修改、刪除等操作,尤其是批量操作更是方便,比如批量新建虛擬機。 有實力的可以用puppt、ansible這種自動化配置工具對虛機進行日常運維操作; 2、隨時隨地全局掌控 主要依賴監(jiān)控和日志,zabbix、ELK之類或者商業(yè)版的,可以隨時了解虛擬化平臺健康狀態(tài)并作出響應; 3、安全 主要在虛擬機和數(shù)據(jù)備份,即使虛擬機或數(shù)據(jù)損壞,還有備份可以恢復。 2、虛擬機備份容量及快照原理 當你創(chuàng)建一個虛擬機快照時,這是一個特定的文件。它也是redo-log日志。delta文件是在基礎(chǔ)VMDK(虛擬機磁盤)上的變更位圖,因此,它不能增長到比VMDK還大。為虛擬機創(chuàng)建每一個快照時,都會創(chuàng)建一個delta文件。當快照被刪除或在快照管理里被恢復時,這些文件將自動刪除。 這些文件用于存儲關(guān)于快照的元數(shù)據(jù)和信息。這個文件是文本格式的,里面包括諸如快照顯示名稱、UID(編號)和磁盤文件名等信息。在你沒創(chuàng)建虛擬機快照之前,這個文件的初始大小為0字節(jié)。這樣說來,只要進行快照,這個文件就會增大和持續(xù)更新。 在快照被移開后,這個文件不能被完全清除。一旦你刪除了個快照,它將仍然在文件里為每個快照遺留位置,不過僅增加編號并在“Consolidate Helper”里放置名稱,這可能是用來整合備份*.vmsn file 這是快照狀態(tài)文件,里面存儲的是使用快照時,一臺虛擬機精確的運行狀態(tài)。這個文件大還是小取決于你選擇保留這臺虛擬機的存儲作為快照的一部分。如果你選擇保留虛擬機的存儲,那么,這個文件將比較大,然后分配給虛擬機最大化的RAM。 這個文件類似于VMware暫停狀態(tài)文件.vmss。虛擬機每個快照都將創(chuàng)建一個.vmss文件;當移動快照時,這些文件自動刪除。 大多數(shù)情況下,應該避免為同一臺虛擬機創(chuàng)建多個快照;每次為系統(tǒng)創(chuàng)建新的快照,其運行速度都會變慢。每個快照都會建立相應的delta磁盤文件,如果虛擬機需要讀取多個delta文件,必然會增加系統(tǒng)的I/O負載。這個過程無疑會延長虛擬機的響應時間,并且產(chǎn)生額外的磁盤操作。 如果你只想保存一系列快照當中的最新版本,可以將它們整合為單一快照。這種方式可以幫助提升系統(tǒng)運行速度和管理效率。選擇目標虛擬機,單擊鼠標右鍵,之后選擇整合。你可以在虛擬機和模板視圖當中查詢虛擬機是否需要整合,并且在列表當中顯示所有需要進行整合的虛擬機。 3、如何優(yōu)化VMware的網(wǎng)絡設計實現(xiàn)網(wǎng)絡高可用? 對于計算節(jié)點高可用來講,除了在資源數(shù)量上要保證其冗余性之外,策略設置也非常重要??梢詤⒖家韵聨讉€點: 1 Admission Control Policy:對于生產(chǎn)環(huán)境來講,一般認為選擇(Host Failure the cluster tolerates =1)比較合適,當然如果你的資源非??臻e,可以適當調(diào)大。 2 對于每一臺物理機上的虛擬機根據(jù)其重要程度不同,設置其啟動的優(yōu)先級(高中低)。 3 當一臺物理機上的虛擬機遠超過集群當中的物理機數(shù)量時,可以考慮設置虛擬機HA互斥分離規(guī)則。 4 生產(chǎn)環(huán)境當中盡量把DRS的策略設置的不要太激進。尤其是前段具有負載均衡設備的時候建議把DRS打成建議模式。 對于存儲來講,必須保證集群內(nèi)所有節(jié)點看到的外部存儲視圖是一樣的,完全共享的,才能很好保證其HA及DRS功能。另外說到存儲,有以下幾個點: 1 卷屬性里面,把Storage IO Control 選項Disable。不建議vwmare層干預底層IO,反而有尤其性能故障的風險。 2 將卷的多路勁策略設置為(Round Robin)。 VMware提供了VMware HA和FT兩種高可用,但只能做到esxi主機級別的故障監(jiān)測和恢復。一般會從應用級別上來做高可用,根據(jù)不同的業(yè)務角色,使用相應的群集或負載均衡,對于后端數(shù)據(jù)庫角色,一般會部署在物理機上,如果非要在虛擬機上可以考慮veritas公司的infoscale系列中的群集軟件(原vcs),可以與VMware的vmotion和其他管理手段有聯(lián)動,也可以不需要裸設備等支持來避免腦裂,還支持不同優(yōu)先級的應用按指定順序啟停。同類群集基本只能做到基礎(chǔ)的功能。 4、VMware逃逸問題 虛擬機逃逸是指利用虛擬機軟件或者虛擬機中運行的軟件的漏洞進行攻擊,以達到攻擊或控制虛擬機宿主操作系統(tǒng)的目的。 “VMware Workstation和Fusion的拖放(drag-and-drop,DnD)功能中存在一個越界內(nèi)存訪問漏洞。在運行Workstation或Fusion的操作系統(tǒng)上,攻擊者可以利用這個漏洞實現(xiàn)客戶機逃逸,在宿主機上執(zhí)行代碼。在Workstation Pro和Fusion上,如果拖放功能和復制粘貼(copy-and-paste,C&P)功能都被禁用,那么這個漏洞就無法利用”。 5、VMware快照刪除時的合并策略
如果回滾的快照不包含內(nèi)存狀態(tài),服務器將關(guān)閉,在重啟后使用前一快照狀態(tài)。如果快照中包含了內(nèi)存狀態(tài),虛擬機只是簡單中斷一下后恢復到之前快照的磁盤和內(nèi)存狀態(tài)。 當用戶對VMware虛擬機快照進行操作時,要注意,當需要刪除虛擬機所有快照時,所有創(chuàng)建的delta文件首先被合并到原VMDK文件然后進行刪除,如果您選擇僅刪除某個快照,那么只有該快照被合并到上一級快照中,如果選擇回滾快照,那么現(xiàn)有的磁盤和內(nèi)存狀態(tài)都被拋棄,系統(tǒng)恢復到所選擇的回滾時間點狀態(tài)。無論您選擇了哪一級的快照進行回滾,它都成為新的父級快照。而父級快照并非代表最新的快照,如果選擇之前的時間點進行回滾,虛擬機就恢復到老時間點的狀態(tài)。在Snapshot Manager中,父級快照總是帶有標簽“You are here”,代表虛擬機的當前狀態(tài)。 6、PowerVM備份方式與傳統(tǒng)的備份有哪些差別? VIO Server其實是一個經(jīng)過封裝的AIX,它的備份恢復有兩種方式,一種為NIM備份恢復,但在恢復時一定注意把“是否作為NIM server的client標記為否”,另一種是viosbr命令進行備份恢復。 VIO Client的備份與傳統(tǒng)的備份相同,操作系統(tǒng)可以通過NIM備份恢復,其它的也可以用備份軟件實現(xiàn)lan-free的備份恢復。 PowerVM不多的情況下,我覺得用磁帶機做個操作系統(tǒng)備份就可以了。畢竟操作系統(tǒng)級別的備份不用做得那么頻繁??蛻舴謪^(qū)可以采用磁帶機的方式,當然這會有很多次的設備映射操作,比較麻煩??梢栽赩IOS上做個虛擬鏡像庫。 7、PowerVM如何實現(xiàn)集中管理? PowerVC,這個是基于OpenStack架構(gòu)開發(fā)的,它可以對PowerVM進行納管,實現(xiàn)圖形化的快速部署與維護。 8、生產(chǎn)環(huán)境不能停機的情況下,PowerVM動態(tài)加個硬盤做鏡像如何操作? 實際上PV做鏡像,也就是在做PV中LV層次的鏡像,可以用lspv -l hdisk0,hdisk1查詢。比如說rootvg做鏡像的時候就有dumplv的鏡像。在已經(jīng)建好鏡像的rootvg中新建LV,默認是不選擇同步的,即此新建的lv只會在一個PV中建立,而另一個PV是不建有這個LV的。 9、如何處理Citrix平臺上發(fā)布的應用無法使用的問題? 發(fā)現(xiàn)Citrix上發(fā)布的應用程序用不了,登錄Citrix客戶端報CGP錯誤。登錄到Xenapp服務器檢查日志錯誤來源Reliability Server,描述為Unable to connect to the CGP tunnel destination (127.0.0.1:1494),服務器前一天晚上有自動重啟的記錄。前一天一切應用還是正常的,懷疑跟系統(tǒng)升級補丁有關(guān)系,選擇卸載掉所有前一天更新的補丁,重啟服務器,再測試Citrix 一切應用正常。因為當時急著用,所以沒有一個一個補丁去卸載做測試,初步判斷跟.net的補丁關(guān)系最大。隨后關(guān)掉了該服務器的自動更新。 |
|
|