數(shù)據(jù)中心電源是設(shè)計(jì)和運(yùn)行數(shù)據(jù)中心的基本要素。一次簡(jiǎn)單的電源故障可能是一場(chǎng)大災(zāi)難,造成嚴(yán)重影響,尤其是隨著越來(lái)越多的公司轉(zhuǎn)向托管服務(wù)和云解決方案,數(shù)據(jù)中心的數(shù)量正在飆升。一個(gè)可靠的供配電系統(tǒng)是保持?jǐn)?shù)據(jù)中心的高效和安全,并將經(jīng)濟(jì)損失降到最低的必要條件。這篇文章是為那些想了解數(shù)據(jù)中心的電力系統(tǒng)、電力故障的原因以及應(yīng)對(duì)方法的你準(zhǔn)備的。
供配電系統(tǒng)是數(shù)據(jù)中心最多的子系統(tǒng)之一。通過(guò)不同的設(shè)備,系統(tǒng)可以根據(jù)數(shù)據(jù)中心的大小和規(guī)模而變化。
確定數(shù)據(jù)中心的可靠性有一個(gè)四級(jí)等級(jí)系統(tǒng),從一級(jí)到四級(jí)。Tier I 通常用于小型企業(yè),而 Tier IV 數(shù)據(jù)中心通常用于提供額外發(fā)電機(jī)組以實(shí)現(xiàn)冗余的企業(yè)。下圖將以Tier IV數(shù)據(jù)中心的簡(jiǎn)化圖示為例,展示數(shù)據(jù)中心內(nèi)的電源系統(tǒng)。
圖 1:數(shù)據(jù)中心的電力系統(tǒng)
通常,來(lái)自電力設(shè)施的功率可能非常高。有一個(gè)變壓器通過(guò)自動(dòng)轉(zhuǎn)換開關(guān) (ATS) 將高壓降低到安全水平。由于電力供應(yīng)商無(wú)法保證隨時(shí)隨地的完美供電,且無(wú)法冗余接入公用電網(wǎng),因此數(shù)據(jù)中心至少連接一臺(tái)柴油或燃?xì)鈧溆冒l(fā)電機(jī),為支持的服務(wù)器或服務(wù)器提供備用電源。其他數(shù)據(jù)中心設(shè)備。一旦電源中斷,轉(zhuǎn)換開關(guān)將向備用發(fā)電機(jī)發(fā)出信號(hào)以啟動(dòng),以便為數(shù)據(jù)中心設(shè)備提供發(fā)電。
但是,從啟動(dòng)發(fā)電機(jī)到提供全功率需要一點(diǎn)時(shí)間。不間斷電源(UPS)作為備用電源起到彌合時(shí)間差距的作用。想了解更多關(guān)于UPS的詳細(xì)信息,可以參考什么是不間斷電源或UPS。通常有一個(gè)維護(hù)旁路面板 (MBP),使 UPS 可以運(yùn)行到維護(hù)旁路模式,并在系統(tǒng)斷電進(jìn)行維修時(shí)實(shí)現(xiàn)無(wú)負(fù)載中斷。最終,電源將連接到配電單元 (PDU),配電單元連接到一系列遠(yuǎn)程配電盤 (RPP)。然后將不同的機(jī)架 PDU 插入 RPP 的不同插座盒中,作為冗余電源鏈的一部分。這就是供電系統(tǒng)的工作原理。
數(shù)據(jù)中心的電力系統(tǒng)故障可能以系統(tǒng)停止、數(shù)據(jù)丟失、變壓器發(fā)熱、損壞停機(jī)或其他任何形式發(fā)生。這些現(xiàn)象會(huì)引發(fā)一系列前所未有的事件,從而導(dǎo)致數(shù)據(jù)中心的巨大損失。那么供配電系統(tǒng)怎么會(huì)出現(xiàn)停電呢?既有雷電天氣或硬件故障等自然因素,也有人為災(zāi)害,其中人為因素占停電原因的很大一部分。此處列出了導(dǎo)致數(shù)據(jù)中心電源故障的一些常見人為因素。
在設(shè)計(jì)數(shù)據(jù)中心的過(guò)程中,數(shù)據(jù)中心功率容量的估計(jì)不準(zhǔn)確。它可以走向兩個(gè)極端:電力容量未充分利用或需求超過(guò)電力供應(yīng)。高估容量可能會(huì)導(dǎo)致容量未被使用,這意味著數(shù)據(jù)中心將用其整個(gè)生命周期來(lái)支持設(shè)備的過(guò)高安裝成本和維護(hù)。而低估所需的電力容量可能會(huì)在耗電 IT 設(shè)備和電力消耗增長(zhǎng)時(shí)導(dǎo)致電力中斷。
動(dòng)力設(shè)備選擇不當(dāng)與上述估算因素有關(guān)。為了跟上不斷增長(zhǎng)的業(yè)務(wù),許多數(shù)據(jù)中心正在部署越來(lái)越多的高密度服務(wù)器,這促使配電系統(tǒng)接近峰值容量。當(dāng)?shù)凸阑蚋吖离娏ω?fù)荷時(shí),電壓值不合適的電力設(shè)備將影響數(shù)據(jù)中心的正常運(yùn)行。例如,UPS 的電源電壓值與服務(wù)器的電源電壓值不匹配會(huì)導(dǎo)致過(guò)載并導(dǎo)致 UPS 剝離。另一方面,有時(shí)客戶會(huì)被一些電力設(shè)備廠商的廣告所誤導(dǎo),而忽略了對(duì)可靠性的實(shí)際檢驗(yàn)。質(zhì)量問(wèn)題或最大性能指標(biāo)不準(zhǔn)確都會(huì)影響配電系統(tǒng)。
不合理的電力系統(tǒng)設(shè)計(jì)和建設(shè)有其隱患,可能引發(fā)隱患。如果設(shè)計(jì)將多個(gè)電源設(shè)備連接到電源線中的一個(gè)點(diǎn),則可能會(huì)因負(fù)載過(guò)大而導(dǎo)致電源故障。例如,如果只有單個(gè) PDU 連接多個(gè)大功率組件,一旦單個(gè) PDU 發(fā)生故障,數(shù)據(jù)中心電源系統(tǒng)將停止運(yùn)行。布線不良也可能使系統(tǒng)出現(xiàn)故障。如果電纜長(zhǎng)度不符合保持設(shè)備正常性能的要求或布局混亂,則可能導(dǎo)致過(guò)熱導(dǎo)致系統(tǒng)關(guān)閉。
電力系統(tǒng)的可靠性對(duì)數(shù)據(jù)中心來(lái)說(shuō)非常重要,那么如何保證優(yōu)質(zhì)的電力呢?以下是一些關(guān)于防止數(shù)據(jù)中心電力系統(tǒng)故障的建議。
這通常是設(shè)計(jì)數(shù)據(jù)中心時(shí)首先要問(wèn)的問(wèn)題之一:“數(shù)據(jù)中心在預(yù)期壽命期間的功率容量是多少?” 通常,典型數(shù)據(jù)中心設(shè)施的生命周期將跨越幾代 IT 設(shè)備。做好數(shù)據(jù)中心容量規(guī)劃,使IT設(shè)備的電力需求與電力設(shè)備的容量保持一致,對(duì)數(shù)據(jù)中心的有效性至關(guān)重要。評(píng)估當(dāng)前電力容量的第一步是了解 IT 設(shè)備、冷卻系統(tǒng)、照明和關(guān)鍵電力負(fù)載的電力需求。隨著大功率設(shè)備越來(lái)越多地被采用,平均功耗也在上升。管理人員應(yīng)該為 IT 設(shè)備機(jī)架提供越來(lái)越多的數(shù)據(jù)中心電源容量,這就是我們看到部署越來(lái)越多機(jī)架 PDU 的原因。
在準(zhǔn)確評(píng)估了數(shù)據(jù)中心的電力容量需求之后,就到了為數(shù)據(jù)中心配備合適設(shè)備的過(guò)程。合適的電源系統(tǒng)可以最大限度地降低電源故障的風(fēng)險(xiǎn)。雙電源組件,如雙PDU,建議支持冗余。此外,必須考慮 IT 設(shè)備產(chǎn)生的諧波電流。可以應(yīng)用隔離變壓器來(lái)減輕諧波電流的影響。
電力設(shè)備和IT設(shè)備的日常物理檢查是確保所有系統(tǒng)處于良好工作狀態(tài)的必要過(guò)程。例如,UPS 和電池的定期維護(hù)對(duì)于最大程度地減少停電問(wèn)題的可能性至關(guān)重要。確定基礎(chǔ)設(shè)施的變化,以免遺漏一些對(duì)整個(gè)系統(tǒng)產(chǎn)生重大影響的細(xì)節(jié),減少電能使用量,延長(zhǎng)設(shè)備壽命,從而避免人工成本和更換設(shè)備的成本。
確保您的數(shù)據(jù)中心擁有強(qiáng)大的電力系統(tǒng)對(duì)于促進(jìn)業(yè)務(wù)的平穩(wěn)運(yùn)行至關(guān)重要。一些數(shù)據(jù)中心電力系統(tǒng)的問(wèn)題可以通過(guò)采取以上一些措施得到控制。因此,重要的是對(duì)電力系統(tǒng)進(jìn)行有效的準(zhǔn)備,盡可能降低風(fēng)險(xiǎn),從而提高競(jìng)爭(zhēng)力并為企業(yè)獲得更多利潤(rùn)。