91亚洲国产成人久久精品网站精品国产乱码久久夜夜嗨|中文字幕精品一区二区年下载91麻豆自拍视频|国产成人久久一区二区不卡精品久久久久久人妻蜜桃|欧美国产精品久久久久久免费色综合久久久综合|果冻传媒一二三产区|麻豆果冻传媒|夜噜噜久久国产欧美日韩精品|欧美日韩在线精品一区二区|91亚洲精品中文字幕|国产精品亚洲片在线观看不卡,粉嫩高清一区二区三区精品视频av中文字幕亚洲最新 ,色老板中文字幕,欧美午夜精品人妻久久久久久

網(wǎng)站首頁

您現(xiàn)在的位置是:首頁 > 服務支持 > 公司新聞

公司新聞

數(shù)據(jù)中心基礎設施高可用提升研究與實踐

一舟線纜2023-02-28公司新聞
伴隨國家對金融安全的關(guān)注度不斷提高,數(shù)據(jù)中心基礎設施作為業(yè)務安全的關(guān)鍵節(jié)點,其高可用能力成為實現(xiàn)銀行業(yè)務連續(xù)性目標的核心關(guān)鍵因素。本文以數(shù)據(jù)中心基礎設施的網(wǎng)絡系統(tǒng)為

伴隨國家對金融安全的關(guān)注度不斷提高,數(shù)據(jù)中心基礎設施作為業(yè)務安全的關(guān)鍵節(jié)點,其高可用能力成為實現(xiàn)銀行業(yè)務連續(xù)性目標的核心關(guān)鍵因素。本文以數(shù)據(jù)中心基礎設施的網(wǎng)絡系統(tǒng)為例,結(jié)合網(wǎng)絡架構(gòu)和網(wǎng)絡運維能力的現(xiàn)狀,從技術(shù)架構(gòu)、運營能力兩個方面開展案例分析,總結(jié)提出系統(tǒng)分層級的高可用提升方法,并圍繞高可用技術(shù)、運營能力轉(zhuǎn)型實踐展開了分析說明。

近年來,隨著國家對金融安全的關(guān)注度不斷提高,以及銀行業(yè)數(shù)字化轉(zhuǎn)型的持續(xù)深入,金融科技領域的業(yè)務連續(xù)性水平成為衡量銀行服務品牌競爭力與行業(yè)聲譽的一項重要指標。與此同時,數(shù)據(jù)中心基礎設施的高可用能力作為確保生產(chǎn)業(yè)務安全穩(wěn)定的重要支柱,不僅是商業(yè)銀行達成監(jiān)管要求的必備條件之一,而且對保障社會穩(wěn)定、控制金融風險也有著極為重要的現(xiàn)實意義。

一、商業(yè)銀行數(shù)據(jù)中心可用性分析

在信息科技領域,可用性主要指基于各類計算機設備的連接組合,使構(gòu)建的企業(yè)信息系統(tǒng)可以穩(wěn)定支撐業(yè)務連續(xù)運作,并在系統(tǒng)級的生命周期內(nèi)不發(fā)生影響業(yè)務辦理的故障。對于商業(yè)銀行而言,數(shù)據(jù)中心基礎設施本身是一套極為復雜的技術(shù)體系,綜合部署包括設備、網(wǎng)絡、服務器等在內(nèi)的各類資源,其可用性能力主要由各類基礎設施的系統(tǒng)可用性決定,并同時受到設備產(chǎn)品、架構(gòu)設計、運營能力等多種因素的影響。在量化評估方面,系統(tǒng)可用率的指標評價通常遵從業(yè)界常用的衡量方法,即從99%到99.999%俗稱“幾個9”的量化指標體系,數(shù)據(jù)中心可用性示例見表1。

表1 數(shù)據(jù)中心可用性示例

表1 數(shù)據(jù)中心可用性示例

當前,隨著商業(yè)銀行數(shù)字化轉(zhuǎn)型的不斷深入,各種新技術(shù)、新架構(gòu)持續(xù)迭代更新,并對轉(zhuǎn)型過程中的系統(tǒng)高可用能力帶來了極大挑戰(zhàn)。對此,商業(yè)銀行在進行高可用設計時不僅要對產(chǎn)品、技術(shù)、架構(gòu)等進行可用性評估,加強對新技術(shù)、新架構(gòu)的風險控制,還需要引入高效的自動化工具提供自主可控的運營服務,特別是強化出現(xiàn)生產(chǎn)故障時的應急處置能力,減少和消除意外出現(xiàn)的生產(chǎn)故障中斷時間。尤其在運營能力方面,首先要打造一支思想統(tǒng)一、技能齊備的技術(shù)團隊,既能夠遵從安全第一的工作要求,具備嚴謹、審慎的合規(guī)意識,同時還需掌握專業(yè)技術(shù)、具備創(chuàng)新意識,能夠通過DevOps、SRE的方法打造適合自身使用的特色化工具。此外,運營能力建設離不開配套的自動化工具支持,以更好地滿足數(shù)據(jù)中心云化后的大規(guī)模運維需求以及數(shù)據(jù)中心高可用要求。

二、數(shù)據(jù)中心基礎設施高可用提升方法及案例說明

本文以數(shù)據(jù)中心基礎設施中的網(wǎng)絡系統(tǒng)為例,結(jié)合網(wǎng)絡架構(gòu)和網(wǎng)絡運維能力的現(xiàn)狀,從技術(shù)架構(gòu)、運營能力兩方面開展案例分析,總結(jié)提出系統(tǒng)分層級的高可用提升方法,并圍繞高可用技術(shù)、運營能力轉(zhuǎn)型實踐等展開了分析說明。

1.基礎設施可用性提升

網(wǎng)絡系統(tǒng)作為數(shù)據(jù)中心基礎設施的核心組件之一,其系統(tǒng)可用性內(nèi)容大致可劃分為設備級可用指標、功能級可用指標、區(qū)域級可用指標、園區(qū)級可用指標等四個層級,并依次自下而上構(gòu)成了數(shù)據(jù)中心的高可用能力之一(如圖1所示)。其中,網(wǎng)絡架構(gòu)高可用設計以增加網(wǎng)元、線路、節(jié)點、區(qū)域等結(jié)構(gòu)冗余度為核心思路,旨在使每一層均能夠充分應用技術(shù)路線的可擴展能力,進而基于各層級的高可用能力建設,最終順利到達并具備業(yè)務可用層能力。在這一階段,業(yè)務連續(xù)性指標可達到99.999%的可用率,并作為核心能力之一,支持向用戶提供高價值的數(shù)字化產(chǎn)品和服務。

數(shù)據(jù)中心系統(tǒng)可用性分級

數(shù)據(jù)中心系統(tǒng)可用性分級

設備級可用重點強調(diào)單臺網(wǎng)絡設備的產(chǎn)品級可用率及支持網(wǎng)絡單元(NU)的可用性。單設備可用性即網(wǎng)元層級可用性指標,起步按99.99%可用指標要求部署網(wǎng)元,落實產(chǎn)品技術(shù)和部件冗余的技術(shù)要求。同時,該層級可用能力還需關(guān)注設備的運行時長因素,設備可用性指標在超過5年以上時會逐年下降,需及時更新置換對應節(jié)點的設備。舉例來說,核心環(huán)節(jié)交換機、路由器設備基于自身雙電源、多端口、雙引擎等硬件技術(shù)冗余,應支持設備連續(xù)運行保持在年度99.999%及以上的可用率。

功能級可用重點強調(diào)一個網(wǎng)絡區(qū)域內(nèi)多臺同等功能的網(wǎng)絡單元對外服務的可用率。功能節(jié)點可用性即核心節(jié)點層級的可用性指標,按照網(wǎng)絡技術(shù)發(fā)展的支持情況,擴展核心功能節(jié)點的網(wǎng)元設備群組可支持的冗余數(shù)量,如目前已有功能節(jié)點在技術(shù)上支持部署2臺以上設備,包括交換核心、互聯(lián)網(wǎng)接入、數(shù)據(jù)中心互聯(lián)等環(huán)境。舉例來說,基于技術(shù)產(chǎn)品的發(fā)展成熟度,生產(chǎn)網(wǎng)絡中的區(qū)域核心交換機按照雙機雙活搭建,交換核心、路由器等設備可按照2~4臺的數(shù)量搭建,互聯(lián)網(wǎng)接入渠道功能節(jié)點按照單園區(qū)6臺搭建,而上述措施均為通過架構(gòu)設計的冗余,旨在賦予設備在故障情況下的網(wǎng)絡功能節(jié)點高可用能力。

區(qū)域級可用重點強調(diào)多臺網(wǎng)絡設備通過特定方式互接提供網(wǎng)絡連通服務的區(qū)域可用率。網(wǎng)絡區(qū)域可用性即單個網(wǎng)絡區(qū)的可用性指標,網(wǎng)絡區(qū)主要由不同網(wǎng)絡單元的功能節(jié)點互相連接而成,泛指提供服務器接入、訪問控制、路由轉(zhuǎn)發(fā)、負載均衡、存儲連接等多種網(wǎng)絡服務的網(wǎng)絡系統(tǒng)。從冗余設計的角度來看,“雞蛋不要放在一個籃子里”,因此需要對網(wǎng)絡區(qū)的部署規(guī)模進行控制,如數(shù)據(jù)中心可按照多個網(wǎng)絡區(qū)冗余進行架構(gòu)設計,以及將應用分布到多個區(qū)域運行,以避免因單個網(wǎng)絡區(qū)異常產(chǎn)生全局影響。舉例來說,在數(shù)據(jù)中心規(guī)模持續(xù)增長的情況下,提供計算資源接入服務的網(wǎng)絡區(qū)域建設按照冗余架構(gòu)的設計考慮,可搭建2個以上的邏輯隔離區(qū)域,以支撐應用單元化部署和計算資源的分布式部署,同時應將云資源域規(guī)模限制在1000臺左右,并搭建2個以上的基礎服務功能相同的資源域。

園區(qū)級可用重點強調(diào)數(shù)據(jù)中心不同網(wǎng)絡區(qū)組合支持大規(guī)模計算資源正常運轉(zhuǎn)服務的可用率。園區(qū)可用性即數(shù)據(jù)中心單個園區(qū)網(wǎng)絡的可用性指標,在該層級中,網(wǎng)絡的可用性能力取決于網(wǎng)絡架構(gòu)設計的耦合程度,以及區(qū)域間出現(xiàn)異常后的隔離能力。在園區(qū)級的網(wǎng)絡中,如果下一個層級出現(xiàn)的異常事件與多個網(wǎng)絡區(qū)存在耦合,則往往不能及時隔離影響,進而導致產(chǎn)生園區(qū)級的網(wǎng)絡可用性問題。舉例來說,網(wǎng)絡架構(gòu)可在多個園區(qū)間復制搭建,用以支撐數(shù)據(jù)中心多個園區(qū)的同等網(wǎng)絡服務支撐能力,并按松耦合結(jié)構(gòu)進行設計,保持多個園區(qū)間的互聯(lián)互通,以實現(xiàn)園區(qū)級網(wǎng)絡在異常情況下的高可用切換。

2.運營能力提升路徑

運營能力提升涉及ITIL流程中的變更、應急等各個方面,其中針對變更實施、應急實施的自動化工具是保持可用率的核心關(guān)鍵,而不同生產(chǎn)運維能力上限對應的可用率指標大致可分為人工級、自動級、智能級等三個層級。

人工級是指通過預設操作命令,手工實施部署。該層級可用率在資源充分投入的情況下,一般可以支持3個9到4個9的專業(yè)系統(tǒng)可用率。例如,在運維操作全生命周期的管理和技術(shù)流程中,大量生產(chǎn)維護工作均由人工處理,當出現(xiàn)影響業(yè)務的重大故障時,問題的定位效率較低,應急處置時間多數(shù)超過30分鐘,且部分情況下或?qū)㈤L達1~2個小時。

自動級是指通過工具實現(xiàn)自動化操作、人工按鍵式處理或告警觸發(fā)式處理。該層級可用率在資源充分投入的情況下,可以支持4個9以上的專業(yè)線系統(tǒng)可用率。例如,生產(chǎn)運營中的標準運維操作大多通過自動化工具完成,包括管理流程、技術(shù)操作、日常運維等內(nèi)容,當出現(xiàn)影響業(yè)務故障時,即可通過一鍵式應急自動化工具進行隔離、切換等應急操作,從而將業(yè)務影響時間控制在30分鐘之內(nèi)。

智能級是指通過引入AI弱智能技術(shù),預防式發(fā)現(xiàn)隱患,并在發(fā)生故障時工具自主開展全鏈條自愈恢復。該層級可用率在資源充分投入和技術(shù)發(fā)展成熟后,可以支持5個9以上的專業(yè)系統(tǒng)可用率。例如,在生產(chǎn)運營的運維工作中,在標準操作被自動化完成后,針對非標準運維操作,則可以基于智能化工具開展預防性監(jiān)測,進而在故障隱患影響到業(yè)務前,執(zhí)行有效預判并開展計劃性維護,提前解決影響業(yè)務運行的問題。

三、未來展望

綜上,數(shù)據(jù)中心可用率在以一年為周期統(tǒng)計的高可用模式下,其可用率指標應保持在99.99%以上,而最終目標是提升至99.999%的世界一流水平,全年網(wǎng)絡宕機時間控制在5.4分鐘以內(nèi)。然而,上述指標對當前信息系統(tǒng)的可用性要求可謂非常之高,而在前述網(wǎng)絡系統(tǒng)案例中,通過對可用性進行分層設計,并結(jié)合架構(gòu)設計和運營團隊建設,將可有效支持數(shù)據(jù)中心的高可用提升。未來,隨著運維智能化等IT技術(shù)的持續(xù)演進,數(shù)據(jù)中心的高可用提升路徑也將愈加豐富,通過“技術(shù)+運營”兩方面創(chuàng)新,將不斷驅(qū)動數(shù)據(jù)中心基礎設施的高可用水平提升,進而更好地保障國家網(wǎng)絡安全和社會金融穩(wěn)定。

資訊評論