2019-03-22 13:52:20分類:行業資訊6391
隨著云計算與大數據技術的廣泛應用,數據中心產業正飛速發展,數據中心的規模也越來越大,幾十上百萬臺服務器的超大規模數據中心已經屢見不鮮。面對龐大的設備規模、復雜的系統架構、苛刻的安全要求,越來越多的專家認為,未來的數據中心只有借助各種新技術新方案,只有做到自動化、智能化,才能提高數據中心的運維效率,做到高效、安全的運營。
一、什么是數據中心資產管理
1、為什么數據中心要進行資產管理?
數據中心是目前為止IT行業最復雜的系統,其內部涵蓋了數十個專業領域,數百個細分行業,上千種不同品牌和類型的產品。這些來自不同廠家和品牌的物理產品就是數據中心的“資產”。“U位資產”特指安裝在數據中心機柜內部的IT硬件產品,如服務器、存儲、網絡設備等,這些產品是數據中心的核心部件,它們擔任了數據中心的數據采集、處理、傳輸、儲存的功能,是保證整個數據中心運行的核心資產。
隨著數字時代的來臨,數據中心也從早期的生產輔助系統變成了整個社會生產與生活的中心。但面對著成千上萬的IT設備,運維人員普遍面臨著設備變更頻繁、資產查詢困難、盤點耗時耗力、故障上報不及時、空間規劃不合理、資源利用率不高、運營成本高等問題。數據中心資產管理的重要性和嚴峻性越發突出,只有管理好這些核心資產才能真正讓數據中心發揮出最大的作用,為企業生產和我們的生活做出貢獻。(本文關于數據中心資產的描述中,如無特別說明,將主要指針對機柜內使用的“U位資產”)
2、數據中心資產管理的難點和現狀
數據中心根據用途可分為自用型和運營型數據中心。
對于各企業的自用型數據中心來說,大多面臨著設備復雜、運維人力和運維水平不足、管理水平不高等問題。因為歷史遺留問題的存在,數據中心資產往往也成了一筆糊涂賬。更嚴重的是,很多時候因為管理不善,運維人員自己也不清楚機房中有哪些設備,甚至不知道哪些服務器是正在使用的,哪些服務器是可以下架報廢的。這不僅造成了極大的能源和物資的浪費,也給數據中心帶來了數不清的安全隱患。
對運營型數據中心來說,數據中心的運營商向用戶提供機柜位置或設備托管租賃服務,從而收取租金來獲利。用戶的變化導致了數據中心內的設備總是處于變動之中,而只有實時了解數據中心的實際使用情況,數據中心的運營商才能及時的為用戶提供所需的服務。但運營型數據中心普遍規模較大,傳統依賴人力的資產統計和盤點方式會浪費大量的時間,并因此提高數據中心的運營成本。
因此,相對于傳統人工管理方式,自動化的資產管理技術可以顯著降低數據中心運營難度、減少運營開支、提升服務水平、提高安全可用性。
二、數據中心資產管理技術簡介
傳統的數據中心資產管理大多是通過設備SN號、設備條形碼等來進行資產標識,并通過人工記錄或手動掃描的方式來記錄設備的位置和資產信息。當設備位置和狀態出現變動時,運維人員必須在管理系統中手動更新信息,否則就會導致后臺數據和實際使用情況不一致,給運維工作帶來風險。目前國內數據中心的資產管理大多還停留在人工方式的階段。
數據的采集:
數據中心的自動化資產管理技術,通常采用“設備電子標簽+采集控制模塊”的方案進行數據采集與管理。
電子標簽通常固定在IT資產的外表面上,用于記錄設備的相關信息,并通過主動或被動的方式發射信號給自動讀取系統。
采集模塊接收到信號后,將設備的資產信息和位置信息傳輸給管理系統進行處理,從而實現對資產信息的實時監控和及時更新。
數據的處理:
根據采集到的資產和位置信息,數據中心資產管理系統通??蓪崿F以下功能:
1、資產物理位置的實時監控;
2、資產的實時盤點;
3、機柜空間使用情況實時監控;
4、資產異動實時告警。
數據中心的資產可以使用獨立的管理系統進行管理,也可以將資產管理作為某一項功能,集成到數據中心的基礎設施管理平臺中。目前很多數據中心管理平臺都支持資產管理功能,并基于上述主要功能不斷衍生出諸如容量管理、生命周期管理等新的功能。國內大多數DCIM、3D可視化等軟件企業都可以提供相應的數據處理平臺。
自動化資產管理技術的難點,主要集中在資產數據的采集上,也就是設備電子標簽以及對應的讀取方式上。從歷史發展來看,電子標簽技術主要可以分為三個階段:
1、電路連接傳輸方式(又稱接觸式)
這種技術誕生于上世紀80-90年代,電子標簽內部一般采用接觸式ID/IC芯片,接觸式ID/IC卡工作時是通過IO連接線路連接電源和數據線,一般有數個接觸點連接到電路上。目前國內部分廠家采用的單總線接觸式電子標簽EIC(1-wire技術)就屬于此類技術。
電子標簽采集信息后,必須通過連接線路進行傳輸。在使用時,電子標簽必須插入到讀取系統的接口處,形成穩定的電氣連接,然后才能采集到信號。目前該技術的芯片供應廠家較少,已處于逐漸淘汰階段。
優點:定位比較準確,不會造成位置偏差。
缺點:電子標簽接觸點松動、氧化、灰塵和油污都可能造成接觸不良,無法傳輸信號;抗靜電能力差,容易受靜電影響造成電路故障,所以一般產品故障率高使用壽命較短、后期維護成本高;據了解,因技術落后,很多芯片供應商已經停產,目前芯片供應商全球只有一家(美國達拉斯半導體),不具備大規模推廣使用的條件。
2、RFID無線傳輸方式(又稱非接觸式)
RFID非接觸式電子標簽技術使用了無線數字通信技術來傳輸數據,無需IO連接線路連接,有效的解決了接觸式電子標簽維可靠性低、觸點故障率高、容易受靜電擊穿等問題。RFID非接觸式技術的主流產品是工作頻率為13.56MHZ、符合ISO14443A/B國際標準的 RFID電子標簽和閱讀器,目前已經廣泛應用于全球金融銀行卡、手機NFC、辦公和住宅、酒店等等領域。
但是在數據中心高密度的U位(每個U只有44.45mm)管理應用場景中,RFID技術會出現臨近的讀卡器誤讀、傳輸距離容易受到電磁環境干擾、讀取信號的距離不穩定等問題。所以采用RFID技術方案的U位產品,其數據準確性通常只能做到80%左右,難以做到100%準確。
除此之外,無源RFID電子標簽要依賴讀卡器發出的電磁場來提供能量工作。只有當讀卡器發射功率達到一定能量時才能驅動無源RFID電子標簽工作,而由于機房內部的IT設備眾多、電磁干擾多,而且場強變化大,無源RFID電氣與讀卡器的有效讀卡距離不穩定。所以安裝標簽的時候每個標簽與讀卡器的距離需要嚴格的調試,即使調試好后,在以后的使用過程中容易出現標簽讀不到的情況。(比如地鐵卡經常會刷不到)
優點:產業鏈較成熟,應用廣泛;無線傳輸方式,不受電氣連接穩定性干擾,不存在接觸不良問題。
缺點:定位不準確,做不到100%數據準確;容易受到復雜電磁環境干擾產生誤讀;有效讀取距離不穩定,需要現場進行產品調試。
3、改進型RFID方式
前兩種技術誕生于不同的年代和領域,在數據中心實際應用中均出現了不少問題,并不能完全滿足數據中心場景的復雜應用。因此,近年來又出現了針對數據中心場景的改進型RFID電子標簽技術。此類技術以數碼人于2013年發明的MC-RFID無源主動式技術為代表,下面以此技術進行介紹。
采用這種技術時,讀卡器一般不會主動發射信號。只有當電子標簽與讀卡器接觸后,兩者距離小于一定距離(一般2毫米以內),讀卡器才會主動發射信號來讀取電子標簽內的芯片數據。而在讀取完畢后,讀卡器會進入休眠狀態,不再發射信號,直到下次再次被激活(標簽脫離或接受到指令)。這種技術不依賴電氣連接傳輸數據,不受接觸點氧化、松動、接觸不良的影響;同時避免了傳統RFID一直發射信號對設備的干擾。通常電子標簽會采用磁鐵吸附的方式安裝到指定U位的讀卡器上,所以也不會出現臨近讀卡器誤讀的情況。
優點:定位準確,不會產生誤讀數據;不受觸點氧化、接觸不良影響,可靠性高;不會干擾機房設備運行;長期工作性能穩定,后期維護不需要二次調試。
缺點:可能價格較高。
目前國內U位資產管理產品采用的技術主要有上述三種,前兩種因技術難度低、出現年代早,目前相關產品較多,但因實際使用效果不佳,未能大規模普及。第三種技術雖然出現較晚,但性能優異,目前發展較快。
三、如何選擇數據中心資產管理產品?
1、產品功能選擇
對于U位資產管理產品來說,除了最基本的物理位置定位之外,通常還具備多種功能,用戶可以在實際使用中根據自身的需要進行合理選擇。
資產管理功能:資產管理是最基本的產品功能,通常包括定位、變更、查詢等操作。
實時定位-可以對資產物理位置進行實時準確定位,精確到機柜內每一U位,準確率要達到99.99%以上;
自動變更-資產物理位置發生變化時,如上架、下架、遷移等,系統可以及時更新資產物理位置信息,無需手工記錄;
資產查詢:維護人員可以根據資產編號、設備型號或其他已記錄信息,快速查詢定位到設備的具體安裝位置,方便現場人員及時維護;
資產盤點:通過資產管理系統,可以快速(秒級)實現數據中心全網資產自動盤點,準確性可達100%;
庫存管理:通過資產管理系統,可以對數據中心設備庫存進行管理,實時查詢不同設備的使用狀態,存放位置等信息。在設備狀態發生變化時,系統可以自動記錄,無需手動修改。
安全管理功能:安全管理同樣是用戶比較關心的問題之一,通常包括自動告警、授權等操作。
機柜內安全管理:在U位資產出現異常時,管理系統可以及時進行現場聲光告警,并通過操作系統、短信、郵件等多種方式通知維護人員。異常狀況一般有:
非法下架-未經過授權的設備下架,系統可自動產生告警;
位置侵占-設備安裝在未獲得授權的U位時,系統可自動產生告警;
標簽損毀-電子標簽在遭到人為故意損毀時(如撕毀、剪斷),系統可自動產生告警;
離線告警-因為網絡狀況或其他原因,后臺管理系統無法與現場監控設備通訊時,U位檢測設備在設備位置變動時也應能自動產生聲光告警;
非授權告警-其他非授權操作,系統均應自動產生告警。
除此之外,還有用戶希望具備區域(機柜外部)安全管理的功能:在受控資產進出某個區域時,系統應該自動進行信息記錄或給出相關告警。區域管理功能通常可以和庫存管理相結合,實時對資產的存放位置、使用狀態進行監控。
容量與環境管理功能:即對機柜的空間使用情況、機柜內的溫濕度環境等數據進行實時統計和查詢。
容量分析-資產管理系統可以對每個機柜以及整個機房的U位空間使用情況進行統計和分析,方便運維人員統籌規劃;
容量查詢-根據不同IT設備的所需U位空間,可以在系統中快速查詢到實際可安裝位置(實際使用中通常用戶還會結合供電容量、制冷容量進行進一步的位置匹配);
環境監控-可以對機柜內的溫度、濕度等環境參數進行實時監控,在出現異常時(如溫度過高、濕度過高等)及時進行告警;
其他運維與運營管理功能:作為整體管理平臺的重要組成部分,資產管理系統可結合現有的維護流程,幫助用戶提升運維效率,節省運營成本。
設備信息錄入-結合手持終端,資產管理系統可以實現設備上架后的信息快速錄入,后臺數據自動更新;
聲光定位-當需要對某臺設備進行維護操作時,可通過后臺管理系統,對具體U位下發指令,產生聲光告警,引導維護人員快速找到該設備;
遠程可視化管理-可實現遠程可視化管理,無需進入機房即可對全網設備使用情況、機柜使用情況進行統計,管理系統支持多平臺操作;
2、產品外觀設計選擇
U位資產管理系統一般由電子標簽、采集模塊(又稱資產條)、管理系統三部分組成。
電子標簽的要求:電子標簽一般由“資產條連接端 + 連接繩 + 服務器連接端”三部分組成。
電子標簽應采用無源長壽命設計,從而實現整個生命周期的免維護。
服務器連接端應能快速固定到服務器等IT資產的外表面上,固定牢固不易脫落(通常采用3M膠固定)。
連接繩采用可伸縮設計,方便用戶調整不同的安裝距離。
因機柜內安裝位置狹窄、光線不足等問題,所以資產條連接端不能采用USB、連接端子等插接方式(不方便操作),可采用磁吸附等方式,方便在實際使用中快速固定;
表面應打印有二維碼等全球唯一標識,方便手持終端等設備快速進行掃描識別。
對采集模塊(資產條)的要求:
為方便運輸和備件存儲,采集模塊應采用模塊化設計,可根據實際機柜高度進行不同組合安裝,如5U模塊、6U模塊等。不建議使用單一整條設計,如42U、47U等;
采集模塊尺寸應盡量小巧輕便,方便在不同機柜內部的安裝,一般厚度不超過20mm,寬度不超過50mm;
采集模塊每一U位應與實際使用位置一一對應;
每U位都要有獨立指示燈可以顯示不同狀態。一般要提供在位、離位、故障、預占位、狀態指示等至少5種以上色彩,并支持用戶自定義設置;
安裝位置隱蔽,安裝后不影響開關門操作,不影響服務器上下架操作;
如需要使用額外控制器對采集數據進行處理,則控制器本身不應占據太多空間。
管理系統差異較大,這里不做贅述。不同客戶的要求也不盡相同,一般除了主要功能外,還需要界面美觀、操作簡便、可支持不同終端進行訪問等。
3、技術方案選擇
整體技術方案:如上所述,目前U位資產管理的電子標簽主要有三種技術,綜合考慮下應選擇第三代改進型的RFID技術,避免采用高故障率、準確率低、抗干擾能力差的技術;
通訊傳輸方案:通常每個機柜會部署一套資產管理硬件,資產信息采集后通過有線或無線方式傳輸給管理平臺。目前業界主流是采用有線方式進行傳輸,也有少量產品通過ZigBee等無線方式傳輸;
系統供電方案:對于采集模塊一般有PDU供電、POE供電、電池供電三種方式。PDU供電一般需要占用機柜內一個或多個PDU端口;POE供電一般由交換機網線直接給采集模塊供電,使用比較簡單,不需要占用PDU端口;電池供電不需要占用PDU端口,但要考慮實際電池的使用壽命,一般機柜較多的情況下,電池定期更換可能會占用較多時間。用戶可根據實際情況進行選擇;
信息存儲方案:電子標簽根據內部可存儲的信息量,目前主要有兩類:
1、僅存儲一個固定標簽ID號。ID號對應的設備資產信息必須通過與管理平臺的數據庫關聯后,才能在系統中進行查詢和讀取,這種標簽一般不支持用戶寫入信息;
2、可存儲一定字節信息(通常500~1000字節)。通常這類電子標簽的內部芯片可根據用戶自定義存儲包括資產設備品牌、型號、托管單位、MAC 地址、IP 地址、存放起止日期、入庫時間、機房信息、機柜信息、存放人員等關鍵信息。這種標簽內的信息可以反復讀寫,同時支持離線管理,用戶可通過手持終端直接讀取芯片內部儲存的信息,而不需通過網絡從后臺讀取數據。
信息處理方案:資產信息的處理方式目前主要有集中式和分布式兩種。對于集中式設計,各機柜內部署的采集模塊和電子標簽僅負責信息的采集和傳輸,由集中控制器來統一負責處理信息,接入的機柜數量越多,系統響應速度越慢;對于分布式設計,各機柜內自帶獨立控制器,除了采集和傳輸數據,同時也對大多數信息進行處理,僅僅將處理結果傳輸給管理平臺。響應速度基本不受機柜數量的影響。對于幾十柜的中小型數據中心,兩種設計方案的響應時間相差不大,100柜以上規模數據中心,建議采用分布式設計來提升響應速度。通常來說,在資產位置發生變動時,系統給出告警的響應時間應小于3秒。
組網與協議:資產管理硬件大多支持IP組網,廠家一般會提供通用協議如TCP/IP,Modbus等。目前也有少量產品采用無線方式組網,如ZigBee等。
擴展端口:部分用戶可能會希望資產管理采集模塊同時也能收集機柜內部的溫濕度等信息,所以采集模塊有時也需要提供RS485等擴展接口。
4、其他:產品專利、應用規模等
除上述選擇方式外。用戶在實際使用中還應考慮其他方面。
技術專利:數據中心行業發展迅速,各種新技術層出不窮,難免有技術侵權、仿冒產品的存在。而用戶大多是知名企事業單位,一旦采用仿冒產品可能會引發一系列的法律糾紛,同時影響自身聲譽。建議采用正規廠家提供的產品,在項目采購中也應要求供應商提供相關技術專利,并在合同約束條件中規避此類風險;
應用規模:數據中心資產自動化管理領域屬于新興行業,目前該領域發展迅速,新技術新產品不斷出現。從使用安全角度考慮,建議用戶在采購時應注意選擇已經規?;渴鸬某墒飚a品,謹慎選擇新進入廠家的初代產品。
四、總結
據Gartner報道,全球每年數據中心領域的投資已達到1900億美元,大型、超大型數據中心、邊緣數據中心在未來幾年中仍會保持高速增長,但隨之而來的資產管理問題也日益突出。筆者相信,在未來數據中心的發展中,U位資產管理技術將會快速進步并在越來越多的數據中心中發揮不可替代的作用。