十年網(wǎng)站開發(fā)經驗 + 多家企業(yè)客戶 + 靠譜的建站團隊
量身定制 + 運營維護+專業(yè)推廣+無憂售后,網(wǎng)站問題一站解決
2020年8月27日,國內云計算和數(shù)據(jù)中心領域規(guī)模、最具影響力的中國IDC行業(yè)標志性盛會——第十五屆中國IDC產業(yè)年度大典第二站“IDCC2020 長三角新基建(數(shù)據(jù)中心)產業(yè)發(fā)展論壇”在上海隆重舉辦。
本次“IDCC2020融合線下、線上會議優(yōu)點,首次以現(xiàn)場會議+線上多平臺直播的方式,讓任意地點的觀眾隨時參與,實現(xiàn)了一場真正同時覆蓋全球的行業(yè)盛會。
下午的論壇精彩繼續(xù),在主持人劉源的開場之后,進入了演講環(huán)節(jié),中金數(shù)據(jù)集團有限公司首席架構師李京川先生為與會觀眾帶來了《智能化運維中的精細化管理和新技術應用》為題的精彩分享。
中金數(shù)據(jù)集團有限公司首席架構師李京川先生
李京川:大家好,非常感謝會議主辦方對中金數(shù)據(jù)的邀請,我在這里多說一句,非常感謝兩點多鐘最困的時候來聽我說話的大家。
我講一下中金數(shù)據(jù)在數(shù)據(jù)化運維的思考,大家看有很多技術名詞,精細化管理和新技術應用,今天下午我就是講一下中金數(shù)據(jù)的故事,講一下數(shù)字化運維方面的思考,我們的心路歷程和我們正在做的一些事情,跟大家做一個匯報。
第十五屆,讓我浮想聯(lián)翩,為什么呢?正好中金數(shù)據(jù)到今天也是15歲,2005年中金數(shù)據(jù)成立,成立以后,兩年之后在北京的第一個數(shù)據(jù)中心落成,2006年是奠基,2008年投產。15年歷程走過來,中金數(shù)據(jù)是第三方數(shù)據(jù)中心運營的最好實踐者,我們也在反思,最根本的就是在數(shù)據(jù)中心領域用情過于專一,在互聯(lián)網(wǎng)風潮起來之后,依然是巋然不動,非常執(zhí)著。
15年走過來中金數(shù)據(jù)專注于為大家提供一條龍的服務,從拿地,到規(guī)劃,到建設,到測試,到運營等等,我們都可以提供服務。
大家可能會提到中金數(shù)據(jù)四個點,但是我在這里給大家展示的已經是五個點了,好像一夜之間中金數(shù)據(jù)又冒出來一個新的點就是天津園區(qū),這是我們最新開始籌建的300畝的園區(qū),中金數(shù)據(jù)在全國范圍之內,大概有1000多畝地,168萬平方米的規(guī)劃,機柜是接近15萬,這是我們整個的規(guī)模。
最開始在2006年動工奠基的數(shù)據(jù)中心就是最上面這個亦莊的,100畝,現(xiàn)在看來是非常小,但是這個數(shù)據(jù)中心可以說是我們最能體現(xiàn)中金數(shù)據(jù)當中金融的數(shù)據(jù)中心,因為這里面有大量的,待會兒我可以給大家看到金融客戶在這里落戶。天津是我們新投建的300畝,重點講到的就是華東昆山數(shù)據(jù)中心,在煙臺、武漢也有非常大規(guī)模的數(shù)據(jù)中心。
這個是整個客戶群,給大家簡單的梗概,在這里所有的大銀行、商業(yè)銀行在這里都有合作,現(xiàn)在的互聯(lián)網(wǎng)企業(yè)、騰訊、百度,還有當紅的華為跟我們都有非常深入的合作。同時我們也會涉及很多的政府領域、政府機構、非金融領域,我們都是有所涉足。
15年走過來,剛才說的都是中金相關的介紹,讓大家知道站在臺上講的人究竟是什么背景,言歸正傳,我們講到數(shù)字化運營,中金15年走過來,說實在的,時間長,經歷的事兒也多,15年前當?shù)谌酵獍臄?shù)據(jù)中心類型剛剛出現(xiàn)的時候,大家都是摸著石頭過河,就有第一個階段就是被動的階段,因為那個時候根本就不知道該怎么運營一個第三方的數(shù)據(jù)中心,基本上我把它稱之為頭痛醫(yī)頭,腳痛醫(yī)腳,但是這個持續(xù)過程并不是特別長,大家覺得日子不能這么過,這樣就毀掉了。于是就進入第二階段,就是規(guī)范階段,那個時候更多的規(guī)范來自于國外的一些規(guī)范到中國的落地,這個過程當中由于中金參與的比較早,確實有這個需求,所以最開始相關規(guī)范的治理當中都看到中金的影子,而且一直到現(xiàn)在相關的規(guī)范中金都有所參與。
有了規(guī)范下一步就變得容易一些,怎么容易呢?我們可以把規(guī)范電子化,變成軟件實施下來,這就是成熟階段。我們有動環(huán)的監(jiān)控系統(tǒng)和DCIM運維手段,就進入了一個比較平順的階段,多數(shù)數(shù)據(jù)中心目前所處的階段。但是眼光要遠一點,就是所謂的智能化階段,我們已經逐步的進入到今天的主題,到底智能化階段是什么,達到什么樣的目的。其實智能化階段就是要使得運維系統(tǒng)具有前瞻性和可預見性,如果達不到這一點就停留在第三階段,這個是我們目前正在做的事情。
如果說我們問你一個數(shù)據(jù)中心的運營者,在座的很多同仁也是這方面的領導或者專家,最頭疼的是什么?其實在我看來最頭疼的無非兩類事,一類是對內,對領導有交代,有運營的問題,我如何優(yōu)化策略,如何進行客戶管理,如何進行預測投資,投資回報率是多少,這些都是內部頭疼的事情。還有一塊就是運維相關的問題,運維的相關問題大家都非常清楚。我們給用戶一個交代,用戶把這么重要的數(shù)據(jù)放在這里,我們要管好,有一個制度,這就是相關運維的問題。講到這兩塊以后,當你頭疼的時候,我看其實很多同事都在發(fā)名片,你頭疼的時候,一定有人在發(fā)名片,告訴你我們公司就是搞這個軟件的,你過來用用我們公司的軟件,又便宜又好。但是有這種事嗎?確實是這種軟件有可取之處,但是這就像定制衣服和現(xiàn)成衣服的區(qū)別,定制衣服符合你的需求,現(xiàn)成的衣服多少有一些問題。
運維角度設計的場景太過僵化,都是典型場景,但是典型場景未必是你要的場景,另外一些產品有一些實際的場景契合度不夠。另外最核心的一點就是沒有辦法把基礎數(shù)據(jù)轉換成價值,數(shù)據(jù)會貫穿我講的始終,我們所有的東西都要圍繞數(shù)據(jù)來展開。
中金怎么做呢?我們自己搞自己的一套平臺,中金的自信心來自于哪里?來自于兩塊,一塊我們干了十幾年了,什么都見過,而且我們有研發(fā)隊伍,最關鍵的我們還有相關的專利在里面,我們深耕在這個領域很長時間了,更大程度上就是要把現(xiàn)成的東西轉換成另外一種形式,這是第一個信心所在。第二個信心,我們所有的運維體系,一體化響應的平臺,包括相關的認證我們都做了,什么都有了,其實我們有時候內部聊到這兒的時候,其實中金搞這個東西,稍微吹大一點就是類似于中國當時搞兩彈一星,甚至比兩彈一星還要牛,這個東西是我們蹦起來跳著高做的事情,并不是水到渠成的事情,也很多壓力、阻力和困難。第二,如果兩彈一星如果有人愿意賣給中國,中國愿意花錢買。但是(運維體系)有大量的人賣給我們,我們不要,我們堅持走自己的路,因為我們看不上那些現(xiàn)成的產品,這也是中金對金融領域有一種執(zhí)著,對技術也有一種執(zhí)著在里面,也算是一種工匠精神的體現(xiàn)吧。
再說一下中金的運維平臺,我們一定是要走上AI的道路,AI是什么,是若干種技術,很多種技術的組合,是一個概念,并不是某一個技術,所以最終我們要實現(xiàn)的是什么呢?我們的需求最終是浸潤在整個AI的概念當中,并不是說我們把某一個AI的技術拿過來放過來就用,而是浸潤在里面,浸入式的概念。所以有了整體的思想以后,所以我們所做的每一件事情都是為了未來能夠更好的把這個東西放入到AI的大環(huán)境當中去,最終實現(xiàn)所有AI看似非常夢幻的場景的實現(xiàn)。
這個是中金運維平臺大概的架構,在這里大家看最核心的就是黃色這部分,運維管理子系統(tǒng),這是我們最核心的,這里面有大家熟悉相關的東西,在周邊都是相關的支撐性系統(tǒng),這些系統(tǒng)對所有運維子系統(tǒng)實現(xiàn)一個數(shù)據(jù)的輸入和交互,最終實現(xiàn)一個個人的工作平臺,每個人從整個系統(tǒng)當中所提取的數(shù)據(jù)是不一樣的,所以每個人最終的工作平臺是不一樣的,但是最終的展現(xiàn)可能是通過有不同的終端來進行展現(xiàn),同時也有相關的國際標準來做支撐,最終使得我們這個系統(tǒng)在最終的互聯(lián)互通上面,或者展示上面都沒有任何的問題。
這個是一個通用的系統(tǒng)也能夠實現(xiàn),不是說不能實現(xiàn),在這個系統(tǒng)當中就是所謂的電子流,當時華為提的比較多,華為整個內部或者管理都是通過電子流實現(xiàn)的,我們這邊也是一樣,只有通過電子流,所以整個的數(shù)據(jù),我們過去的經驗都通過這種電子報表的形式輸入進去,最終用不同的方式進行呈現(xiàn),這個是整個運維軟件的基礎。
給大家講一個具體的例子,整個電子流怎么實現(xiàn)呢?比如說運維當中,我們可以做到一年當中,我們把一年相關的運維任務整個輸入到系統(tǒng)當中去,整個系統(tǒng)會做什么工作呢?會把所有的任務進行拆分、打散,變成一天一天的,就變成每天的任務,每天的任務做完以后,到這一步的時候,我們通過移動終端,每天的任務怎么做呢?終端里面有相關的說明書,統(tǒng)統(tǒng)在這里面,確保每一個運維人員最終用一種非常標準化的流程進行操作,最終在后臺系統(tǒng)形成相關的維護日志,相關的風險單進行分析,你這么做有可能會產生什么風險,會做出相關的提示。
這個希望大家特別要注意的,也是整個系統(tǒng)中的一個特點,就是所謂的跨對象的容量管理。大家經常聽到所謂的容量管理,可以做什么?對電器制冷、相關的空間獨自來空間的管理,我們做的是什么呢?把所有的相關的資源都統(tǒng)一的進行管理,有相關的算法來做支撐,最終在不同的對象之間實現(xiàn)聯(lián)動。
這里再舉一個例子,就是大家說到非常多的概念就是PUE的管理,這里我特別強調一點,該吹的??梢源?,不該吹的不能胡說八道。PUE的管理一定有一個所謂的理論值,大家講到數(shù)據(jù)中心的PUE更多是理論值,我這里講的是什么呢?跨對象的聯(lián)動來實現(xiàn)什么呢?實現(xiàn)整個能耗管理的,讓它盡量的接近理論值,但是我們不可能突破理論值,比如說PUE理論值達到1.5,如果沒有這套系統(tǒng),可能1.55,有了這一套系統(tǒng)1.53、1.52。怎么做到的呢?實際上就是一個精細化的聯(lián)動,在每一個子系統(tǒng),每一個子設備、每一個模塊,同時從時間的維度,月、周、天、小時、分鐘的能耗,在不同的系統(tǒng)當中,不同的對象當中進行傳遞、調整,這有點像什么呢?有點像開車時候的自動巡航,為什么開自動巡航呢?相對來說省油一點,因為有一個最優(yōu)的油量配比,這只是在大的系統(tǒng)當中實現(xiàn)自動巡航,使得我們的能耗管理達到相對來說的最優(yōu),但是這里強調肯定不可能突破理論值,一個物理的極限。
每個設備在運行的過程當中,同時還是一個資產,所以在運營的過程當中,對每一個設備進行相關的管理,同時也就是對資產進行相關的管理,這兩個是可以非常好的融合在一起的,這個就不必多說,所有的設備,從出庫、維保等等,用多長時間等等,這些統(tǒng)統(tǒng)在數(shù)據(jù)庫當中都能夠自動的形成相關的數(shù)據(jù)。
上面所說的一切最終構成的是什么呢?是一個中金的知識庫,為什么我在這里特別強調這個呢,其實中金知識庫里面有兩類內容,一類就是SOP、MOP、EOP比較固定的東西,同時我們知識庫里面還有一些什么內容?實際上就是每天發(fā)生的事情,每個系統(tǒng)所上報的數(shù)據(jù),在數(shù)據(jù)庫當中統(tǒng)統(tǒng)都有保存,每天發(fā)生的事情,系統(tǒng)在做什么事情,基于相關的知識庫正在做的事情是什么呢?相關數(shù)據(jù)的挖掘,邏輯的挖掘,為什么要有這個工作呢?這個就是在為未來的AI,我們現(xiàn)在做的就是大數(shù)據(jù)的分析,大數(shù)據(jù)是把原來一些看似沒有用的東西,一些非關系型的數(shù)據(jù)庫的東西分析以后,最后產生一個相關的邏輯,這個是我們做的事情。
我可以告訴大家,整個中金相關的知識庫當中,始終在做的數(shù)據(jù)的挖掘的工作,當然這個算法我們一直在進行相關的優(yōu)化。做了這些以后,就為我們未來的演進打下了非常良好的基礎這意味著我們的數(shù)據(jù)就像金礦一樣,就是在這么一個過程當中,由于采取了相關的開放式的架構,所以最終客戶新的技術、新的技術統(tǒng)統(tǒng)可以非常容易的進入到這個系統(tǒng)當中來,最終使得我們盤活相關的資產,最終實現(xiàn)AI化。
在這里我想跟大家最后說一句,我說這些并不是對那種通用性的軟件、平臺的否定,絕對不是這樣,我們整個平臺當中也非常多的借鑒了市場上的一些通用平臺的優(yōu)點,同時我們非常愿意跟各個友商進行溝通,因為大家在這塊都有相關的想法,如果在這塊大家有一些碰撞,可能有一些更新的想法,更新的點子出來。
我們始終是一個開放的態(tài)度,希望大家今后能有更多的機會,跟中金合作,謝謝大家!