VMware ESX服務(wù)器是在通用環(huán)境下分區(qū)和整合系統(tǒng)的虛擬主機(jī)軟件。它是具有高級資源管理功能高效,靈活的虛擬主機(jī)平臺(tái)。
VMware ESX Server 為適用于任何系統(tǒng)環(huán)境的企業(yè)級的虛擬計(jì)算機(jī)軟件。大型機(jī)級別的架構(gòu)提供了空前的性能和操作控制。它能提供完全動(dòng)態(tài)的資源可測量控制,適合各種要求嚴(yán)格的應(yīng)用程序的需要,同時(shí)可以實(shí)現(xiàn)服務(wù)器部署整合,為企業(yè)未來成長所需擴(kuò)展空間。
亦提供儲(chǔ)存虛擬化的能力。除可因兼并服務(wù)器減少設(shè)備購買及維護(hù)成本外,亦可因效能的尖峰離峰需求,以VMotion技術(shù)在各服務(wù)器或刀片服務(wù)器之刀板間彈性動(dòng)態(tài)遷移系統(tǒng)平臺(tái),讓IT人員做更有效的資源調(diào)度,并獲得更好且安全周密的防護(hù),當(dāng)系統(tǒng)發(fā)生災(zāi)難時(shí),可以在最短時(shí)間(毋需重新安裝操作系統(tǒng)),迅速復(fù)原系統(tǒng)的運(yùn)作。
用途介紹
完美匹配企業(yè)數(shù)據(jù)中心,通過提高資源使用率,擴(kuò)展計(jì)算機(jī)性能和優(yōu)化服務(wù)器,VMware ESX服務(wù)器幫助企業(yè)降低計(jì)算機(jī)基礎(chǔ)構(gòu)架的成本。VMware ESX服務(wù)器能實(shí)現(xiàn):
·服務(wù)器整合
VMware ESX服務(wù)器能在更少的高伸縮和高可靠企業(yè)級服務(wù)器上,包括刀片式服務(wù)器,整合運(yùn)行在不同操作系統(tǒng)上的應(yīng)用程序和基本服務(wù)
·提供高性能并擔(dān)保服務(wù)品質(zhì)
ESX服務(wù)器支持出于開發(fā)和測試為目的,在同一系統(tǒng)內(nèi)的虛擬主機(jī)集群;同樣也高性能的支持系統(tǒng)間的虛擬主機(jī)集群。VMware ESX服務(wù)器擔(dān)保服務(wù)器的CPU,內(nèi)存,網(wǎng)絡(luò)帶寬和磁盤I/O處于最優(yōu)化的狀態(tài),改進(jìn)對內(nèi)和對外的服務(wù)
·流水式測試和部署
VMware ESX服務(wù)器壓縮虛擬主機(jī)鏡像以便它們在環(huán)境間能被非常容易地遷移,確保軟件測試者和質(zhì)量檢驗(yàn)工程師在相對少的時(shí)間和硬件狀態(tài)下做更多有效的測試
·可伸縮的軟硬件構(gòu)架
威睿 ESX服務(wù)器包含支持VMware Virtual SMP,確保企業(yè)在靈活,安全和輕便的虛擬主機(jī)上運(yùn)行所有重要的應(yīng)用程序。
運(yùn)作介紹
VMware ESX服務(wù)器傳輸物理系統(tǒng)到邏輯資源池,系統(tǒng)和應(yīng)用程序被分離在包含多個(gè)虛擬機(jī)的單一硬件片上。系統(tǒng)資源按需動(dòng)態(tài)分配到任何操作系統(tǒng)上,提供大型機(jī)的性能和服務(wù)器資源控制。VMware ESX服務(wù)器通過在安全便捷的虛擬機(jī)上執(zhí)行分區(qū)和分割服務(wù)器資源來簡化服務(wù)器的基礎(chǔ)構(gòu)架。VMware ESX服務(wù)器確保服務(wù)器資源能被遠(yuǎn)程管理,自動(dòng)預(yù)制和標(biāo)準(zhǔn)化。高級資源管理控制通過企業(yè)擔(dān)保服務(wù)質(zhì)量。
直接運(yùn)行在系統(tǒng)硬件上的VMware ESX服務(wù)器為部署,管理和遠(yuǎn)程控制多虛擬機(jī)提供了一個(gè)安全,唯一的平臺(tái)。有了VMware ESX服務(wù)器:
·特定系統(tǒng)的應(yīng)用程序能被遷移到在更可靠和可伸縮的不同虛擬機(jī)上去。
·服務(wù)器能從任何地方被遠(yuǎn)程管理,簡化服務(wù)器維護(hù)。
·通過高級資源管理控制,服務(wù)質(zhì)量能得到保證。
·普通的監(jiān)控和管理任務(wù)是自動(dòng)腳本式的。
·無須添加新的物理系統(tǒng),性能得到明顯提升。
常見問題
Windows服務(wù)器的管理員早已熟悉了可怕的藍(lán)屏死機(jī)(BSOD),這就意味著服務(wù)器完全地終止。威睿 ESX也有類似的狀況,叫做紫屏死機(jī)(PSOD),典型的是由于硬件問題和VMware代碼中的bug造成的。
紫屏死機(jī)問題
當(dāng)一個(gè)PSOD出現(xiàn)時(shí),你需要做的第一件事情就是記錄下屏幕上顯示的信息,我建議用數(shù)碼相機(jī)或者手機(jī)拍一個(gè)快照。PSOD信息包括ESX的版本和構(gòu)建、異常類型、寄存器轉(zhuǎn)儲(chǔ)、在崩潰時(shí)每一個(gè)CPU在運(yùn)行什么、跟蹤信息、服務(wù)器正常運(yùn)行時(shí)間、錯(cuò)誤信息和內(nèi)存核心轉(zhuǎn)儲(chǔ)信息。這些信息對你沒用,但是威睿技術(shù)支持人員可以解碼上述信息,幫助測定崩潰的原因。
不幸的是,當(dāng)遭遇到PSOD,除了記錄屏幕上的信息,你唯一的選擇是關(guān)閉服務(wù)器重啟。一旦服務(wù)器重啟起來,你將在服務(wù)器的/root目枷路⑾kernel-zdump-*文件,這個(gè)文件對定位問題很有價(jià)值。你可以用vmkdump工具從該文件中提取vmkernel日志文件(vmkdump–l),然后定位引起PSOD的原因。VMware支持一般也需要這個(gè)文件。出現(xiàn)PSOD常見的原因是服務(wù)器內(nèi)存不足,那個(gè)轉(zhuǎn)儲(chǔ)文件將有助于識別導(dǎo)致問題的內(nèi)存模塊并替換這個(gè)模塊。
檢查你的RAM
如果你懷疑你系統(tǒng)的RAM可能有問題,可以用一個(gè)內(nèi)置的工具在后臺(tái)檢查你的RAM而不影響你正在運(yùn)行的虛擬機(jī)。該RAM檢查工具運(yùn)行在VMkernel里,通過登錄到服務(wù)器控制臺(tái),輸入Service Ramcheck Start開啟。
當(dāng)正在運(yùn)行RAM檢測時(shí),它把所有的活動(dòng)和任何錯(cuò)誤信息記錄到/var/log/威睿目錄下的文件ramcheck.log和ramcheck-err.log中。然而,它的一個(gè)缺陷是如果你有虛擬機(jī)正在運(yùn)行,用這個(gè)工具不能檢測所有的RAM,只能檢測在ESX系統(tǒng)中未用的RAM。一個(gè)比較徹底的檢測你的服務(wù)器中RAM的方法是關(guān)閉ESX,從CD引導(dǎo),然后運(yùn)行Memtest86+程序。
vmsupport工具
如果你聯(lián)系VMware技術(shù)支持人員,他們一般會(huì)要求你運(yùn)行vm-support工具,它將把所有的ESX server的日志和配置文件打包成一個(gè)文件。通過root權(quán)限登錄到服務(wù)控制臺(tái),然后不需要設(shè)置任何選項(xiàng),輸入“vm-support”就可以運(yùn)行這個(gè)工具。這個(gè)工具將創(chuàng)建一個(gè)Tar文件,以"esx---..tgz"格式命名。你可以通過斷點(diǎn)續(xù)傳把它發(fā)送給威睿技術(shù)支持人員。確保把該Tar文件從ESX服務(wù)器上刪除,這樣做可以節(jié)省磁盤空間,或者,你可以通過VI client生成同樣的文件。選擇Administration,然后選擇Export Diagnostic Data,選擇你的主機(jī)(VirtualCenter數(shù)據(jù)選項(xiàng))和一個(gè)本地PC目錄來存儲(chǔ)將要?jiǎng)?chuàng)建的文件。
排除故障
日志文件一般是排除各種類型問題的最好工具。ESX有許多的日志文件,你需要檢查哪個(gè)日志文件取決于你所遇到的問題。以下是ESX日志文件的列表,你通常可以用來定位ESX服務(wù)器的問題。VMkernel和主機(jī)日志文件一般都是你需要首先檢查的。
VMkernel-/var/log/vmkernel——與虛擬機(jī)和ESX服務(wù)器相關(guān)的活動(dòng)的記錄。帶擴(kuò)展名以數(shù)字循環(huán),當(dāng)前的日志沒有擴(kuò)展,最近的日志帶有“.1”擴(kuò)展。
VMkernel Warnings-/var/log/vmkwarning——記錄虛擬機(jī)的活動(dòng),VMkernel日志的子集,用同樣的循環(huán)模式。
VMkernel Summary-/var/log/vmksummary——用于確定ESX服務(wù)器正常運(yùn)行的時(shí)間和可用性統(tǒng)計(jì),可讀性的總結(jié)在/var/log/vmksummary.txt中。
ESX Server host agent log-/var/log/威睿/hostd.log——包含管理和配置ESX服務(wù)器主機(jī)和它的虛擬機(jī)代理信息。(查找文件的date/時(shí)間戳來找到最近輸出的日志文件,或者打開hostd.log,該文件連接到當(dāng)前的日志文件)。
ESX Firewall log-/var/log/vmware/esxcfg-firewall.log——記錄所有的防火墻規(guī)則事件。
ESX Update log-/var/log/vmware/esxupdate.log——記錄所有的通過esxupdate統(tǒng)計(jì)所在的更新。
Service Console-/var/log/messages——包括所有的用于排除虛擬機(jī)和ESX服務(wù)器故障的一般日志信息。
Web Access-/var/log/威睿/webAccess——記錄通過基于web訪問ESX服務(wù)器的信息。
Authentication log-/var/log/secure——包含所有的需要認(rèn)證的連接信息,例如VMware守護(hù)進(jìn)程和由xinetd守護(hù)進(jìn)程發(fā)起的動(dòng)作。
Vpxa log-/var/log/vmware/vpx——記錄和VirtualCenter通訊的代理的信息,通過查找文件的date/時(shí)間戳來找到最近輸出的文件或者打開hostd.log,該文件連接到當(dāng)前的日志文件。
作為解決故障過程的一部分,你經(jīng)常需要找出各種ESX組件的版本和使用的補(bǔ)丁,下面是一些命令,你可以從服務(wù)臺(tái)運(yùn)行來完成:
輸入威睿v來檢查ESX服務(wù)器的版本,例如VMware ESX Server 3.0.1 build-32039
輸入esxupdate–l query來查看安裝的補(bǔ)丁
輸入vpxa–v來檢查ESX服務(wù)器的管理版本,例如VMware VirtualCenter Agent Daemon 2.0.1 build-40644
輸入rpm–qa | grep VMware-esx-tools來檢查ESX服務(wù)器VMware Tools安裝的版本,例如VMware-esx-tools-3.0.1-32039
如果所有可能失敗,重啟Vmwate主機(jī)代理服務(wù)
許多的ESX問題可以通過重啟威睿主機(jī)代理服務(wù)(vmware-hostd)解決,該服務(wù)負(fù)責(zé)管理大部分ESX主機(jī)的操作,通過登陸服務(wù)控制臺(tái),輸入service mgmt-vmware restart來實(shí)現(xiàn)。
注意:ESX 3.0.1有一個(gè)bug,如果你的ESX服務(wù)器為你的VM配置了auto-startups選項(xiàng),它將重啟你所有的VM。這個(gè)bug在3.0.1和3.0.2中用一個(gè)補(bǔ)丁修復(fù),但是在ESX 3.5中用另一個(gè)發(fā)布的補(bǔ)丁修復(fù)。在運(yùn)行此命令時(shí)最好臨時(shí)禁止auto-startups選項(xiàng)。
在某些情況下,當(dāng)你重啟主機(jī)代理服務(wù),重啟威睿vpxa服務(wù)可以定位發(fā)生在ESX和VI Client之間以及ESX和VirtualCenter之間的問題。該服務(wù)是管理代理,處理ESX和它的客戶端的所有通訊。通過登陸ESX主機(jī),輸入service vmware-vpxa restart就可以完成。需要注意的是重啟哪種服務(wù)都不會(huì)影響你的虛擬機(jī)操作(除了上述提到的bug)。
VMware ESX服務(wù)器常見問題之修復(fù)凍結(jié)的服務(wù)控制臺(tái)
另一個(gè)會(huì)發(fā)生的問題是你的服務(wù)控制臺(tái)掛起,不允許你本地登入。硬件鎖定或者一個(gè)死鎖狀態(tài)都會(huì)導(dǎo)致這樣。當(dāng)發(fā)生這種狀況時(shí),你的VM可以繼續(xù)正常運(yùn)行,但是重啟ESX是通常恢復(fù)的唯一的方法。在你重啟之前,試著關(guān)閉你的客戶VM,或者用VMotion把它們遷移到另一個(gè)ESX主機(jī)上。通過SSH遠(yuǎn)程連接的VI Client或者alternate/emergency控制臺(tái)的其中之一來完成,可以先按Alt-F6,然后按Alt-F2鍵。你也可以按Alt-F12在控制臺(tái)的屏幕上顯示內(nèi)核信息。如果你可以關(guān)閉或者遷移你的VM,你就可以通過VI Client或者alternate控制臺(tái)發(fā)出重新引導(dǎo)的命令來試圖重啟服務(wù)器。如果不行,冷啟動(dòng)服務(wù)器就是你唯一的選擇了。
網(wǎng)絡(luò)配置丟失
可能出現(xiàn)的問題是你也許丟失了部分或所有的網(wǎng)絡(luò)配置。如果發(fā)生這種情況,由于你不能通過VI Client連接,你必須用ESX本地服務(wù)控制臺(tái)來重新構(gòu)建網(wǎng)絡(luò)。威睿已經(jīng)發(fā)布了相關(guān)知識的文章:如何使用esxcfg-*服務(wù)控制臺(tái)命令來重建你的網(wǎng)絡(luò)和如何驗(yàn)證你的網(wǎng)絡(luò)配置。
網(wǎng)絡(luò)配置
VMware ESX虛擬服務(wù)器網(wǎng)絡(luò)有一些特殊的考慮。下面將逐一介紹需考慮的基于物理服務(wù)器的配置選擇、VLAN標(biāo)記、麥金塔地址和系統(tǒng)管理等。
基本網(wǎng)絡(luò)
VMware ESX Server為優(yōu)化配置和虛擬網(wǎng)絡(luò)架構(gòu)提供了靈活性,滿足了多種不同的需求。但是,配置的靈活性可能會(huì)是一把雙刃劍,因?yàn)?a href="/hebeideji/3567089267740982151.html">威睿的基本網(wǎng)絡(luò)架構(gòu)提供了如此之多的選擇,可能反倒容易令人困惑。所以,為了優(yōu)化ESX網(wǎng)絡(luò),網(wǎng)絡(luò)管理員應(yīng)該先熟悉VMware在刀片和機(jī)架服務(wù)器上的基本網(wǎng)絡(luò)選擇。
塔式和機(jī)架服務(wù)器需要至少五個(gè)網(wǎng)絡(luò)適配器。因?yàn)榈镀?wù)器和底盤(chassis)從底盤到分布式/核心交換機(jī)的uplink端口數(shù)量有限,網(wǎng)絡(luò)管理員應(yīng)該從高階積架式交換器(Chassis Switch)配置uplink端口的鏈路聚集(Trunking),并且實(shí)施802.1q VLAN標(biāo)記,網(wǎng)絡(luò)至少為每秒1GB。
系統(tǒng)管理員可以使用多個(gè)以太網(wǎng)端口配置ESX。活躍(Active)或備用(Standby)的配置都應(yīng)該采用,以防主要的端口發(fā)生故障。同時(shí),網(wǎng)絡(luò)管理員應(yīng)該采用多個(gè)負(fù)載平衡配置組合端口配置,這將基于源端口IT、源麥金塔地址的散列值以及來源和目標(biāo)地基于IP的散列值。
觀察網(wǎng)絡(luò)故障,監(jiān)控適配器的連接狀態(tài),以及利用信標(biāo)(Beaconing)查找網(wǎng)絡(luò)上游的問題。同樣,可以對端口進(jìn)行配置,來通知網(wǎng)絡(luò)中的交換機(jī)某個(gè)端口已經(jīng)重新配置,因此ARP表格進(jìn)行更新,這樣可以最小化其他的錯(cuò)誤。
配置和實(shí)行VLAN
VLAN(虛擬LAN)并不是什么新概念,多數(shù)網(wǎng)絡(luò)架構(gòu)師和管理員都了解在傳統(tǒng)基礎(chǔ)設(shè)施中配置VLAN的方方面面。但是,使用威睿 VI3配置VLAN卻不盡相同。沒有虛擬化的工作過程和有虛擬化的工作過程是不一樣的。所以,在設(shè)置VLAN之前,網(wǎng)絡(luò)管理員需要了解一下事項(xiàng):
需要多少個(gè)物理NIC
一個(gè)臺(tái)新的虛擬服務(wù)器把哪一個(gè)VLAN叫做home
VLAN如何工作
多數(shù)VMware專家談到在VMware Infrastructure(VI3)中使用虛擬LAN(VLAN)時(shí),他們通常是指VLAN Trunk的使用。不過,VI3使用的VLAN配置還有其他三種類型:Virtual Switch Tagging(虛擬交換機(jī)標(biāo)記,縮寫VST)、External Switch Tagging(外部交換機(jī)標(biāo)記,縮寫EST)和Virtual Guest Tagging(虛擬guest標(biāo)記,簡稱VGT)。VLAN標(biāo)記允許把一個(gè)VLAN直接連接到一個(gè)子虛擬機(jī)。管理員應(yīng)該對什么是VST、EST和VGT以及如何使用進(jìn)行了解。
對于子虛擬機(jī)而言,vst通常是最佳的選擇,但要取決于具體的業(yè)務(wù)需求。VST使用VLAN Trunk。物理交換機(jī)把ESX Server的交換機(jī)當(dāng)作一臺(tái)物理交換機(jī)看待,在跨Trunk傳遞通信到服務(wù)器NIC的過程中,對通信進(jìn)行相應(yīng)的標(biāo)記。然后ESX Server利用標(biāo)記引導(dǎo)通信到其端口。
如果組織內(nèi)的服務(wù)器是插入到分布式層的交換機(jī),交換機(jī)連接到一個(gè)核心交換機(jī),那么EST或VGT可能更加適合。在這種情況下使用VST標(biāo)記就幾乎不可能。你可能需要使用EST標(biāo)記。
此外,如果某一個(gè)具體的虛擬機(jī)需要同時(shí)在多個(gè)VLAN上的話,VGT就更加合理。你將需要子操作系統(tǒng)支持VLAN驅(qū)動(dòng),這種情況在unix和Unix相似的操作系統(tǒng)很常見,如Solaris、OpenBSD和某些Linux分布系統(tǒng)。
網(wǎng)絡(luò)冗余性
至少要兩個(gè)接口分配到ESX服務(wù)控制端口。如果你只分配了一個(gè)接口,VirtualCenter 2.5會(huì)警告你。但VirtualCenter之前的版本不會(huì)。
VirtualCenter2.5的錯(cuò)誤信息將會(huì)造成集群顯示器錯(cuò)誤標(biāo)志出現(xiàn),可能從找不到的連接ESX 3.01和3.02主機(jī)的接口發(fā)出,更有可能是3.5主機(jī)。這一點(diǎn)很重要,因?yàn)槿绻愕奶摂M服務(wù)器碰到一個(gè)新的或額外的錯(cuò)誤,你可能不會(huì)立刻注意到。為了解決這個(gè)問題,在不需要冗余性的虛擬機(jī)網(wǎng)絡(luò)使用一個(gè)集合的vSwitch,將它在網(wǎng)絡(luò)和VirtualCenter中重新進(jìn)行配置,與服務(wù)控制端口位于同一個(gè)網(wǎng)絡(luò)。
斷開的網(wǎng)絡(luò)適配器
如果你使用ESX進(jìn)行物理到虛擬的遷移,要知道你可以配置虛擬服務(wù)器,讓網(wǎng)絡(luò)適配器在啟機(jī)時(shí)就斷開。你將能夠從子操作系統(tǒng)看到硬件的清單,但是它顯示好像網(wǎng)絡(luò)斷開了。使用一臺(tái)不連網(wǎng)的虛擬機(jī),雖然你無法測試IP地址,但你可以配置你的IP尋址和DNS信息。
這個(gè)選項(xiàng)很有用,因?yàn)樵谀承┣闆r下,在網(wǎng)絡(luò)上具有一個(gè)后備的虛擬機(jī),并運(yùn)行預(yù)設(shè)的任務(wù)可能會(huì)產(chǎn)生各種錯(cuò)誤,例如,IP地址重復(fù),虛擬機(jī)應(yīng)用程序與另一臺(tái)運(yùn)行的系統(tǒng)同時(shí)獲取數(shù)據(jù),業(yè)務(wù)系統(tǒng)更新的版本傳送到其他系統(tǒng)產(chǎn)生的格式問題等等。
ESX的網(wǎng)絡(luò)提供了很大的靈活性,但是靈活性也為錯(cuò)誤留有空間。通過本文以及文章中的對其他文章鏈接,你應(yīng)該可以很好地理解如何以及為什么為你的虛擬服務(wù)器進(jìn)行網(wǎng)絡(luò)配置,對冗余性、速度及可用性進(jìn)行優(yōu)化,以滿足你計(jì)算環(huán)境的具體需求。
參考資料 >