訂閱
糾錯(cuò)
加入自媒體

新“三體”—AI時(shí)代數(shù)據(jù)中心交換機(jī)的崛起

新“三體”——AI時(shí)代數(shù)據(jù)中心交換機(jī)的崛起

毫無(wú)疑問(wèn),這將是一個(gè)邊邊角角都被AI(人工智能)所覆蓋和影響的世界!而加速推動(dòng)這一時(shí)代到來(lái)的三個(gè)關(guān)鍵因子是計(jì)算力、算法和數(shù)據(jù),三位一體。在算法領(lǐng)域,一批又一批創(chuàng)新創(chuàng)業(yè)者不斷涌現(xiàn);數(shù)據(jù)的爆炸性增長(zhǎng)為分析、預(yù)測(cè)提供了充足的原材料;那么,計(jì)算力又如何呢?

源源不斷的計(jì)算力來(lái)自基礎(chǔ)設(shè)施的持續(xù)升級(jí)和優(yōu)化。而基礎(chǔ)設(shè)施的三大支柱是計(jì)算、存儲(chǔ)和網(wǎng)絡(luò),又是三位一體。

為了提升AI的運(yùn)行效率,數(shù)據(jù)中心的計(jì)算和存儲(chǔ)已經(jīng)發(fā)生了巨大的技術(shù)變革:存儲(chǔ)介質(zhì)從機(jī)械硬盤(HDD)演進(jìn)到閃存盤(SSD),以滿足實(shí)時(shí)存取的要求;在計(jì)算方面采用GPU甚至專用的AI芯片,以滿足高效計(jì)算的需求。在存儲(chǔ)介質(zhì)和計(jì)算能力大幅提升的同時(shí),網(wǎng)絡(luò)成了AI時(shí)代必須突破的最后一個(gè)瓶頸。

你不好奇,AI時(shí)代的數(shù)據(jù)中心交換機(jī)是什么樣嗎?

AI時(shí)代數(shù)據(jù)中心新挑戰(zhàn)

華為率先給出了一個(gè)答案——業(yè)界首款面向AI時(shí)代的數(shù)據(jù)中心交換機(jī)CloudEngine 16800,它堪稱業(yè)界交換容量最大、性能最高的交換機(jī),更獨(dú)樹一幟地裝上了“AI大腦”。

CloudEngine 16800為何能夠“直通”AI時(shí)代?

以AI為引擎的第四次技術(shù)革命正將我們帶入萬(wàn)物感知、萬(wàn)物互聯(lián)、萬(wàn)物智能的全新紀(jì)元。根據(jù)華為GIV(Global Industry Vision)2025的預(yù)測(cè),到2025年,新增數(shù)據(jù)量將達(dá)到180ZB,其中95%的非結(jié)構(gòu)化數(shù)據(jù)(包括語(yǔ)音/視頻等)將依賴AI進(jìn)行處理;企業(yè)對(duì)AI的采用率將從2018年的25%猛增至2025年的86%;越來(lái)越多的企業(yè)將利用AI助力決策、重塑商業(yè)模式與生態(tài)系統(tǒng),并重建客戶體驗(yàn)。華為網(wǎng)絡(luò)產(chǎn)品線總裁胡克文指出,數(shù)據(jù)中心從云時(shí)代向AI時(shí)代演進(jìn)成為必然。

那么問(wèn)題來(lái)了,AI時(shí)代的數(shù)據(jù)中心將迎來(lái)哪些新的挑戰(zhàn)?

第一大挑戰(zhàn),我們普遍使用的傳統(tǒng)以太網(wǎng),其丟包率為千分之一左右,這還是比較好的情況。就是這在其他領(lǐng)域看來(lái)微不足道的千分之一意味著,網(wǎng)絡(luò)算力只能達(dá)到50%。華為通過(guò)實(shí)際測(cè)試洞察了這一情況。在AI時(shí)代,網(wǎng)絡(luò)應(yīng)該做到零丟包。

第二大挑戰(zhàn),做到了網(wǎng)絡(luò)零丟包,帶寬不足也不行!拔磥(lái)五年,數(shù)字洪流依舊洶涌澎湃。AI數(shù)據(jù)越來(lái)越集中,數(shù)據(jù)中心規(guī)模越來(lái)越大,對(duì)帶寬的需求更多,互訪也會(huì)更頻繁!焙宋谋硎荆胺⻊(wù)器的網(wǎng)絡(luò)端口從10G到25G再到100G,升級(jí)速度之快超乎想象,尤其是25G到100G在中國(guó)的增長(zhǎng)速度遠(yuǎn)遠(yuǎn)超越全球其他區(qū)域!狈⻊(wù)器算力的增長(zhǎng)是非常重要的需求,而服務(wù)器間的互聯(lián)也發(fā)生了巨大變化,即使是100G網(wǎng)絡(luò)也很難滿足AI時(shí)代的業(yè)務(wù)需求。

第三大挑戰(zhàn),在數(shù)據(jù)中心里,計(jì)算網(wǎng)絡(luò)、存儲(chǔ)網(wǎng)絡(luò)和數(shù)據(jù)網(wǎng)絡(luò)已經(jīng)三網(wǎng)合一,這意味著計(jì)算、存儲(chǔ)與網(wǎng)絡(luò)是融合在一起的。如果沒(méi)有大帶寬,融合有可能是一場(chǎng)災(zāi)難。還有一個(gè)讓網(wǎng)管員頭痛的問(wèn)題,就是在遇到故障時(shí)如何快速準(zhǔn)確地定位故障點(diǎn)并及時(shí)消除故障。傳統(tǒng)人工運(yùn)維手段已難以為繼,亟需引入創(chuàng)新的技術(shù)提升智能化運(yùn)維的能力。

胡克文表示:“過(guò)去一年我拜訪了很多客戶,他們普遍反映,在過(guò)去三年,幾乎所有精力都放在如何部署一朵‘云’上,但是在云系統(tǒng)真的建立起來(lái)后,突然發(fā)現(xiàn)網(wǎng)絡(luò)成了新的瓶頸。用戶迫切想知道,未來(lái)數(shù)據(jù)中心的網(wǎng)絡(luò)應(yīng)該是什么樣的?”

AI時(shí)代的數(shù)據(jù)中心網(wǎng)絡(luò)究竟應(yīng)該什么樣?華為CloudEngine 16800定義了AI時(shí)代數(shù)據(jù)中心交換機(jī)的三大特征:內(nèi)嵌AI芯片、單槽48×400GE,以及向自動(dòng)駕駛網(wǎng)絡(luò)演進(jìn)的能力,仍是三位一體,便可輕松化解上述AI時(shí)代數(shù)據(jù)中心的三大挑戰(zhàn)。

AI芯片來(lái)了,100%發(fā)揮AI算力還難嗎?

既然是AI時(shí)代的數(shù)據(jù)中心交換機(jī),又怎能沒(méi)有一顆AI的“芯”?

CloudEngine 16800是業(yè)界首款搭載了高性能AI芯片的數(shù)據(jù)中心交換機(jī)。交換機(jī)主控板上內(nèi)嵌高性能的AI芯片——華為Ascend(昇騰)AI芯片。該AI芯片采用12ns工藝,最大功耗只有8W,浮點(diǎn)計(jì)算能力高達(dá)8T Flops,尤其擅長(zhǎng)運(yùn)行各種深度學(xué)習(xí)的AI算法。據(jù)測(cè)算,一顆這樣的AI芯片的能力甚至超過(guò)當(dāng)前主流的25臺(tái)雙路CPU服務(wù)器的計(jì)算能力。

CloudEngine 16800基于華為獨(dú)創(chuàng)的iLossless智能無(wú)損交換算法,能夠?qū)θW(wǎng)流量進(jìn)行實(shí)時(shí)的學(xué)習(xí)訓(xùn)練,并根據(jù)不同業(yè)務(wù)流量模型的特點(diǎn)動(dòng)態(tài)設(shè)置最優(yōu)的網(wǎng)絡(luò)參數(shù),更精準(zhǔn)地控制流量,實(shí)現(xiàn)百萬(wàn)流和基于應(yīng)用的隊(duì)列自適應(yīng)不同場(chǎng)景的全局網(wǎng)絡(luò)自優(yōu)化能力,保證數(shù)據(jù)中心網(wǎng)絡(luò)在傳輸無(wú)丟包的基礎(chǔ)上達(dá)到最高的吞吐量。這樣的智能無(wú)損數(shù)據(jù)中心網(wǎng)絡(luò)克服了傳統(tǒng)以太網(wǎng)丟包導(dǎo)致的算力損失,將AI算力直接從50%提升到100%,數(shù)據(jù)存儲(chǔ)IOPS(Input/Output Operations Per Second)性能提升30%。

100GE已經(jīng)來(lái)了,400GE還遠(yuǎn)嗎?

數(shù)據(jù)中心是互聯(lián)網(wǎng)業(yè)務(wù)流量匯聚點(diǎn),企業(yè)AI等新型業(yè)務(wù)驅(qū)動(dòng)了數(shù)據(jù)中心服務(wù)器從10G到25G甚至100G的切換。如今,以BAT為代表的大型互聯(lián)網(wǎng)企業(yè)以及電信運(yùn)營(yíng)商基本都實(shí)現(xiàn)了100G的切換。很多企業(yè)之所以采用100G的服務(wù)器,很主要的原因是AI訓(xùn)練涉及到大量模型參數(shù)的同步,對(duì)網(wǎng)絡(luò)帶寬和吞吐提出了很高的挑戰(zhàn)。數(shù)字化趨勢(shì)以及AI業(yè)務(wù)驅(qū)動(dòng)下的“新摩爾定律”——流量摩爾定律已經(jīng)開始發(fā)揮作用,每24個(gè)月數(shù)據(jù)中心的流量將翻一番。為了應(yīng)對(duì)AI時(shí)代大數(shù)據(jù)量、混合業(yè)務(wù)的需求,網(wǎng)絡(luò)從100G升級(jí)到400G指日可待。400GE接口標(biāo)準(zhǔn)化工作已于2015年啟動(dòng),目前針對(duì)數(shù)據(jù)中心應(yīng)用已經(jīng)完成標(biāo)準(zhǔn)化。

CloudEngine 16800全面升級(jí)了硬件交換平臺(tái),在正交架構(gòu)基礎(chǔ)上,突破超高速信號(hào)傳輸、超強(qiáng)散熱、高效供電等多項(xiàng)技術(shù)難題,使得單槽位可提供業(yè)界最高密度48端口400GE線卡,單機(jī)提供業(yè)界最大的768端口400GE交換容量,交換能力高達(dá)業(yè)界平均水平的5倍,完全可以滿足AI時(shí)代流量倍增的需求。

CloudEngine 16800采用了諸多新材料、新工藝,目的就是保證從100G到400G全生命周期的兼容演進(jìn)。舉例來(lái)說(shuō),從100G到高密400G,首先考驗(yàn)的是信號(hào)高速傳輸能力。400G接口系統(tǒng)內(nèi)互連信號(hào)頻率為53G以上,信號(hào)的頻率每翻一倍,PCB線路板信號(hào)衰減就會(huì)增大20%以上。而傳統(tǒng)的電路板由于采用的普通銅箔材料及制造工藝問(wèn)題,當(dāng)信號(hào)傳輸速率提升的時(shí)候,損耗和高頻干擾非常嚴(yán)重,存在速率極限。華為采用新型亞微米無(wú)損材料及高分子鍵合技術(shù)的制作工藝,將電信號(hào)的傳輸效率提升30%。再比如,華為采用業(yè)界首個(gè)雙路輸入智能切換的電源模塊,通過(guò)SuperPower實(shí)現(xiàn)了能效優(yōu)化,電源空間節(jié)省50%,供電效率提升90%。

運(yùn)維都自動(dòng)化了,自動(dòng)駕駛網(wǎng)絡(luò)還差什么?

當(dāng)前,計(jì)算、存儲(chǔ)與網(wǎng)絡(luò)正快速融合,數(shù)據(jù)中心服務(wù)器集群規(guī)模越來(lái)越大,分析的流量成千倍增長(zhǎng),信息上報(bào)或者獲取頻度從分鐘級(jí)壓縮至毫秒級(jí),再加上信息的冗余,這些都使得智能運(yùn)維平臺(tái)的規(guī)模擴(kuò)大,性能壓力陡增。如何減輕智能運(yùn)維平臺(tái)的壓力?讓最靠近服務(wù)器、最靠近數(shù)據(jù)的網(wǎng)絡(luò)設(shè)備具有智能分析和決策功能,成為提升運(yùn)維效率的關(guān)鍵。

CloudEngine 16800基于內(nèi)置的AI芯片,可大幅度提升網(wǎng)絡(luò)邊緣即設(shè)備級(jí)的智能化水平,使得交換機(jī)具備本地推理和實(shí)時(shí)快速?zèng)Q策的能力;通過(guò)本地智能結(jié)合集中的FabricInsight網(wǎng)絡(luò)分析器,構(gòu)建分布式AI運(yùn)維架構(gòu),從而實(shí)現(xiàn)秒級(jí)故障識(shí)別和分鐘級(jí)故障自動(dòng)定位,使能自動(dòng)駕駛網(wǎng)絡(luò)加速到來(lái)。同時(shí),該架構(gòu)還可大幅提升運(yùn)維系統(tǒng)的靈活性和可部署性。

為什么又是華為?

在ICT時(shí)代每個(gè)變革的“風(fēng)口”,似乎總能看到華為的身影。

2012年8月8日,華為面向云計(jì)算時(shí)代發(fā)布了CloudEngine 12800數(shù)據(jù)中心交換機(jī),正式邁入數(shù)據(jù)中心網(wǎng)絡(luò)領(lǐng)域。CloudEngine 12800交換機(jī)領(lǐng)先的架構(gòu)引領(lǐng)了高密度100G平臺(tái)數(shù)據(jù)中心交換機(jī)的設(shè)計(jì)潮流,其正交架構(gòu)、前后風(fēng)道、面板進(jìn)風(fēng)等先進(jìn)設(shè)計(jì)理念被業(yè)界后續(xù)推出的數(shù)據(jù)中心交換機(jī)競(jìng)相模仿。

以CloudEngine 12800推出為開端,華為數(shù)據(jù)中心網(wǎng)絡(luò)解決方案受得到了業(yè)界的熱捧,銷售收入連續(xù)6年保持高速增長(zhǎng)。IDC的報(bào)告顯示,從2016年開始,華為網(wǎng)絡(luò)產(chǎn)品已穩(wěn)居國(guó)內(nèi)市場(chǎng)份額第一;在全球范圍內(nèi),華為網(wǎng)絡(luò)產(chǎn)品在2013年~2017年間復(fù)合增長(zhǎng)率排名第一。華為還進(jìn)入了2018 Forrester Wave領(lǐng)導(dǎo)者象限。

在AI時(shí)代到來(lái)之際,華為身先士卒,首推AI數(shù)據(jù)中心交換機(jī)CloudEngine16800,再次為業(yè)界樹立了一個(gè)標(biāo)桿。

寶劍鋒從磨礪出,梅花香自苦寒來(lái)。任何一個(gè)明星產(chǎn)品的誕生,無(wú)不是經(jīng)過(guò)千錘百煉,精雕細(xì)琢每一個(gè)細(xì)節(jié)。CloudEngine16800看似橫空出世,但如果沒(méi)有從2012年就開始的積累、創(chuàng)新和反復(fù)磨練,就不會(huì)有CloudEngine16800今天的一鳴驚人。如今,華為CloudFabric智簡(jiǎn)云數(shù)據(jù)中心網(wǎng)方案已在全球6400多家企業(yè)成功商用,助力金融、互聯(lián)網(wǎng)、運(yùn)營(yíng)商等諸多行業(yè)客戶數(shù)字化轉(zhuǎn)型,使能數(shù)據(jù)中心成為商業(yè)價(jià)值創(chuàng)造中心。

2019年1月9日,這一刻將被銘記——數(shù)據(jù)中心網(wǎng)絡(luò)從此邁入AI時(shí)代!

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)