日耳曼神話中,有一種名叫戈蘭林(Gremlin)的小精靈。傳說這種精靈熟悉各種工具和機(jī)械,可以幫助能工巧匠完成種種工作,還可以提升工匠的技術(shù),啟迪他們的發(fā)明精神。很多時(shí)候,工匠們的傳統(tǒng)方式方法到達(dá)一定瓶頸,就會(huì)祈禱小精靈出現(xiàn),能夠幫助他們解決難題。
在我們這個(gè)時(shí)代,數(shù)據(jù)中心就是偉大的工匠,肩負(fù)著為千行百業(yè)打造計(jì)算、智能基礎(chǔ)設(shè)施的重任。當(dāng)數(shù)據(jù)中心遇到了工作瓶頸,可能也需要精靈加入到他們的工作中。
近日,英特爾攜手百度智能云,發(fā)布了《為基礎(chǔ)設(shè)施提供加速引擎 助力塑造未來數(shù)據(jù)中心》英特爾IPU平臺(tái)解決方案白皮書,主要解析了英特爾IPU架構(gòu)的功能和應(yīng)用,以及如何與百度智能云通力合作打造其全新DPU架構(gòu),幫助云數(shù)據(jù)中心充分釋放算力,全面賦能云服務(wù)創(chuàng)新。
AI與大數(shù)據(jù)時(shí)代,云數(shù)據(jù)中心走向計(jì)算架構(gòu)變革成為當(dāng)務(wù)之急。英特爾IPU的發(fā)布與實(shí)踐,可以保持基礎(chǔ)設(shè)施高性能、高利用率的同時(shí),實(shí)現(xiàn)更靈活地資源調(diào)配,并使云服務(wù)提供商能更快地轉(zhuǎn)向完全虛擬化存儲(chǔ)和網(wǎng)絡(luò)架構(gòu),從而極大滿足云數(shù)據(jù)中心的升級需求。
在白皮書當(dāng)中,我們可以通過云計(jì)算中心的發(fā)展與挑戰(zhàn)-IPU的架構(gòu)與技術(shù)優(yōu)勢解析-英特爾與百度智能云攜手進(jìn)行的實(shí)踐,三個(gè)維度來審視IPU的發(fā)展藍(lán)圖與價(jià)值期待。
數(shù)據(jù)中心里,小精靈正待起舞。
云數(shù)智變革:數(shù)據(jù)中心的壓力與瓶頸
云時(shí)代正在蓬勃發(fā)展,全新的技術(shù)與產(chǎn)業(yè)變革正醞釀在云計(jì)算產(chǎn)業(yè)中。對于云服務(wù)商來說,企業(yè)創(chuàng)新應(yīng)用對云數(shù)據(jù)中心既有能力提出更高需求。隨著 5G、AI、邊緣計(jì)算等前沿技術(shù)在更多行業(yè)獲得落地應(yīng)用,企業(yè)級云服務(wù)出現(xiàn)了許多新的變化與趨勢。比如說:
更呈分布式的云服務(wù)部署:邊緣計(jì)算等技術(shù)的發(fā)展推動(dòng)著云服務(wù)由傳統(tǒng)的中心云逐漸向“云邊端”協(xié)同演進(jìn),更多云服務(wù)被部署在貼近應(yīng)用的邊緣端;
更為廣泛的云服務(wù)應(yīng)用場景:云服務(wù)正成為更多行業(yè)的 IT 基礎(chǔ)設(shè)施之一,在智能制造、智慧零售、云游戲等新業(yè)態(tài)中作為主力,支撐企業(yè)的數(shù)字化、智能化創(chuàng)新。
在這些變化的推動(dòng),云數(shù)據(jù)中心服務(wù)器在管理與應(yīng)用上面臨更多挑戰(zhàn)。
例如更多虛擬機(jī)(Virtual Machine,VM)的部署使虛擬機(jī)管理等管理任務(wù)變得更加復(fù)雜。同時(shí),其能力輸出也逐漸從傳統(tǒng)單體式應(yīng)用向微服務(wù)化發(fā)展,這也進(jìn)一步提高了云數(shù)據(jù)中心管理任務(wù)的復(fù)雜程度,進(jìn)而占用大量處理器資源。
既要對虛擬機(jī)、微服務(wù)等開展高效管理,又要對相關(guān)的云數(shù)據(jù)中心的網(wǎng)絡(luò)、存儲(chǔ)等基礎(chǔ)設(shè)施實(shí)現(xiàn)加速,其中的復(fù)雜性和資源開銷水平不斷增加,傳統(tǒng)基礎(chǔ)架構(gòu)已經(jīng)很難滿足未來數(shù)據(jù)中心要求。
隨著微服務(wù)模型越來越多地用于云數(shù)據(jù)中心的應(yīng)用、存儲(chǔ)和網(wǎng)絡(luò)工作負(fù)載。可以預(yù)測的是,未來數(shù)據(jù)中心需要進(jìn)行以下方面的轉(zhuǎn)型和升級:
1、云原生應(yīng)用的出現(xiàn)和快速增長推高了對專用基礎(chǔ)設(shè)施的需求,并大幅提高云服務(wù)的敏捷性以及云數(shù)據(jù)中心的效率。
2、云服務(wù)的微服務(wù)化,推動(dòng)了分布式異構(gòu)計(jì)算環(huán)境的發(fā)展,而每個(gè)微服務(wù)都應(yīng)在更適合其的加速節(jié)點(diǎn)上運(yùn)行。
3、微服務(wù)模型的廣泛采用也催生出數(shù)據(jù)中心編排系統(tǒng),使各異構(gòu)計(jì)算服務(wù)器之間實(shí)現(xiàn)微服務(wù)分發(fā)的自動(dòng)化及管理。
4、使用微服務(wù)、虛擬機(jī)、容器以及容器編排的場景不斷增加,推動(dòng)了服務(wù)網(wǎng)格的開發(fā)。服務(wù)網(wǎng)格能夠簡化微服務(wù)到微服務(wù)的通信,并使其更加高效。服務(wù)網(wǎng)格已經(jīng)成為云原生堆棧的標(biāo)準(zhǔn)組成部分。
因此,未來數(shù)據(jù)中心的架構(gòu)將更多地面向于微服務(wù)且日益分散的應(yīng)用環(huán)境而設(shè)計(jì),以此來更好利用異構(gòu)計(jì)算帶來的加速處理能力。整體而言,未來數(shù)據(jù)中心架構(gòu)需要面向微服務(wù)與分散應(yīng)用環(huán)境設(shè)計(jì),通過異構(gòu)計(jì)算的方式來使數(shù)據(jù)中心算力設(shè)施各司其職,適應(yīng)分布式部署的特點(diǎn)和需求,以此來應(yīng)對云時(shí)代的產(chǎn)業(yè)升級壓力。
這種情況下,IPU的誕生與發(fā)展就成為了順理成章的事情。
精靈起舞:IPU為數(shù)據(jù)中心獻(xiàn)上時(shí)代之變
數(shù)據(jù)中心在目前階段必須要完成新的升級與演變,尤其要有新的計(jì)算機(jī)構(gòu)出現(xiàn)。未來的數(shù)據(jù)中心,需要實(shí)現(xiàn)大規(guī)模分布式異構(gòu)計(jì)算協(xié)同工作、無縫連接。尤其是處理基礎(chǔ)設(shè)施加速的計(jì)算單元可以有效負(fù)載分擔(dān)CPU的工作,對于數(shù)據(jù)中心效率提升至關(guān)重要。
2021年,英特爾推出了基礎(chǔ)設(shè)施處理器(IPU)。作為一種可編程網(wǎng)絡(luò)設(shè)備,英特爾IPU能夠助力云和通信服務(wù)提供商以及企業(yè)提高安全性、節(jié)約開銷并充分釋放中央處理器(CPU)的性能。借助英特爾IPU平臺(tái),數(shù)據(jù)中心可以通過安全、穩(wěn)定、可編程的解決方案更好地釋放計(jì)算資源,并實(shí)現(xiàn)更高的安全性和隔離性。IPU這個(gè)幫助數(shù)據(jù)中心釋放算力的小精靈,可以為云數(shù)據(jù)中心的微服務(wù)創(chuàng)新帶來多項(xiàng)優(yōu)勢。
(圖示:英特爾? IPU架構(gòu))
作為全新的產(chǎn)品形態(tài)。英特爾IPU在涵蓋智能網(wǎng)卡功能的同時(shí),更能為未來云數(shù)據(jù)中心帶來更高級別的安全性和控制力。其優(yōu)勢包括:
1、減少了主機(jī)側(cè)處理器中虛擬機(jī)管理程序和基礎(chǔ)設(shè)施堆棧的開銷,使更多的處理器資源可用于應(yīng)用和租戶工作負(fù)載;
2、從主機(jī)側(cè)處理器中卸載了存儲(chǔ)堆棧,從而為應(yīng)用和租戶工作負(fù)載釋放更多處理器資源;
3、卸載了高密集的基礎(chǔ)設(shè)施任務(wù),如加密和解密以及數(shù)據(jù)包處理;
4、在極端情況下,英特爾IPU可以卸載整個(gè)虛擬機(jī)管理程序,釋放 處理器所有內(nèi)核為應(yīng)用和微服務(wù)提供支持,這對于裸金屬服務(wù)產(chǎn)品來說至關(guān)重要;
5、為裸金屬和云主機(jī)統(tǒng)一云管控創(chuàng)造了可能。
從技術(shù)架構(gòu)角度思考, 英特爾IPU能夠?yàn)樵茢?shù)據(jù)中心帶來一系列發(fā)展優(yōu)勢,是因?yàn)閿?shù)據(jù)中心能夠有效地將網(wǎng)絡(luò)、存儲(chǔ)、安全以及基礎(chǔ)設(shè)施管理等多種能力從處理器卸載到 英特爾IPU,從而實(shí)現(xiàn)算力釋放,并加速多種基礎(chǔ)設(shè)施能力。這些能力包括:
1、網(wǎng)絡(luò)加速:將承載網(wǎng)絡(luò) I/O、數(shù)據(jù)轉(zhuǎn)發(fā)等功能的虛擬交換機(jī)軟件,如 OVS 等從主機(jī)側(cè)處理器卸載到 IPU,提升網(wǎng)絡(luò)吞吐量,減少網(wǎng)絡(luò)處理時(shí)延。
2、存儲(chǔ)加速:將 virtio-blk、NVMe-oF 等存儲(chǔ)接口、協(xié)議棧從主機(jī)側(cè)處理器轉(zhuǎn)移到 IPU,提高存儲(chǔ)彈性和靈活性,并降低系統(tǒng)復(fù)雜性和開銷。
3、安全加速:從主機(jī)側(cè)處理器卸載大量加密/解密、壓縮和其他安全功能。
4、基礎(chǔ)設(shè)施處理: 將云服務(wù)管理功能從主機(jī)側(cè)處理器卸載到英特爾 IPU,使虛擬機(jī)、容器或裸金屬服務(wù)的分配和管理更為高效。
(圖示:英特爾? IPU面向不同基礎(chǔ)功能卸載的場景)
除了引入性能更強(qiáng)、且具備靈活可編程特性的硬件來面向特定功能進(jìn)行優(yōu)化加速,釋放更多寶貴算力之外,英特爾也賦予了 IPU 產(chǎn)品豐富的軟件生態(tài)。目前,英特爾正以加速開發(fā)平臺(tái)(Acceleration Development Platform,ADP)為抓手,通過更優(yōu)生態(tài)系統(tǒng)的構(gòu)建,助力合作伙伴實(shí)現(xiàn)云數(shù)據(jù)中心性能加速解決方案的快速開發(fā)和部署。在規(guī)劃中,ADP 平臺(tái)將為用戶提供通過英特爾開放式 FPGA 堆棧(英特爾OFS)實(shí)現(xiàn)的板卡硬件設(shè)計(jì)、軟件、驅(qū)動(dòng)程序以及技術(shù)設(shè)計(jì)支持。用戶可以利用這些軟件工具與技術(shù)支持,加速 IPU 相關(guān)產(chǎn)品的開發(fā),并迅速將產(chǎn)品推向市場。
此外,需要注意的是處理器是數(shù)據(jù)中心的心臟。將英特爾IPU納入云數(shù)據(jù)中心架構(gòu),可以有效發(fā)揮其與處理器之間的系統(tǒng)能力與平臺(tái)化價(jià)值。通過對接英特爾至強(qiáng)可擴(kuò)展處理器,英特爾IPU能夠有效提升云數(shù)據(jù)中心算力,充分釋放異構(gòu)算力。
在英特爾為用戶提供的高效能云數(shù)據(jù)中心生態(tài)方案中,不僅可以通過 IPU 開展能力卸載,對基礎(chǔ)設(shè)施進(jìn)行性能加速,也可以引入英特爾至強(qiáng)可擴(kuò)展處理器來進(jìn)一步加強(qiáng)算力。通過對算力的“開源節(jié)流”,實(shí)現(xiàn)更快的數(shù)據(jù)處理速度、更大的帶寬接入能力以及更低的網(wǎng)絡(luò)時(shí)延。
第三代英特爾至強(qiáng)可擴(kuò)展處理器能夠?yàn)榉?wù)器帶來的性能增強(qiáng)包括:
1、更多的內(nèi)核、更優(yōu)的架構(gòu)帶來算力性能的大幅提升,可有效應(yīng)對高密度計(jì)算所需;
2、支持更多內(nèi)存,支持 PCIe-Gen4,可實(shí)現(xiàn)更高的每核 I/O 帶寬;
3、多項(xiàng)內(nèi)置加速技術(shù),如英特爾深度學(xué)習(xí)加速技術(shù)(英特爾? DL Boost)等可在人工智能等場景提供強(qiáng)大加速能力。
在算力架構(gòu)中引入英特爾至強(qiáng)可擴(kuò)展處理器的另一個(gè)優(yōu)勢是能夠有效提升能力卸載的效率和平滑性。由于主機(jī)側(cè)和 IPU 都采用基于英特爾架構(gòu)的處理器,就能夠非常方便地將主機(jī)側(cè)運(yùn)行應(yīng)用遷移到 IPU ,甚至無需編譯即可遷移,大幅提升開發(fā)、部署和測試的效率。
在基于IPU帶來的一系列價(jià)值之下,云數(shù)據(jù)中心可以持續(xù)邁向微服務(wù)創(chuàng)新時(shí)代,打通未來數(shù)據(jù)中心之路。
助力巧匠:百度智能云的先驅(qū)探索
在白皮書中,我們可以看到英特爾IPU與百度智能云的合作案例與行業(yè)示范價(jià)值。從雙方合作中可以看出,百度智能云成功實(shí)現(xiàn)了提升服務(wù)器效率,提升安全水平,降低算力綜合成本等價(jià)值。
在云與AI帶來的數(shù)智化大潮中,云服務(wù)持續(xù)向各個(gè)領(lǐng)域延伸,并承載越來越多核心業(yè)務(wù)能力。這也導(dǎo)致云計(jì)算服務(wù)商正面臨著需要更強(qiáng)算力資源、更大帶寬接入和更低網(wǎng)絡(luò)時(shí)延的挑戰(zhàn)。與此同時(shí),云服務(wù)品牌也需要從計(jì)算架構(gòu)革新中獲得價(jià)值,來確保自身的競爭優(yōu)勢。為此,百度智能云提出云智一體戰(zhàn)略,大力發(fā)展AI云業(yè)務(wù)。而AI云服務(wù)帶來的算力需求指數(shù)級提升。面向未來的元宇宙等需求,算力釋放還將面臨更多挑戰(zhàn)。
在這一進(jìn)程中,百度智能云借助英特爾FPGA 與英特爾至強(qiáng)D處理器帶來的高效軟硬件可編程的加速,首次推出了自研 DPU 設(shè)備——百度太行 DPU1.0。其支持太行彈性裸金屬服務(wù),包括網(wǎng)絡(luò)卸載、PCIe 設(shè)備熱插拔等功能,讓云計(jì)算的虛擬化開銷很大程度沉淀在網(wǎng)卡上,使云產(chǎn)品的性能大大提升。目前,太行 DPU1.0 產(chǎn)品已在太行彈性裸金屬等多種云服務(wù)場景中開展應(yīng)用,并獲得了用戶的良好評價(jià)。實(shí)踐證明,百度自主研發(fā)的百度太行 DPU1.0 可以有效解決云數(shù)據(jù)中心管理及虛擬化的局限性。
百度太行 DPU1.0 產(chǎn)品配備了 2 個(gè) 25G 帶寬的光口,并引入英特爾的FPGA 與英特爾至強(qiáng)D處理器作為算力核心,來實(shí)現(xiàn)了各項(xiàng)虛擬化功能的卸載,在為用戶提供彈性網(wǎng)卡、彈性存儲(chǔ)能力之余,還支持 1024 個(gè)設(shè)備的熱插拔。同時(shí),通過將云管控平面卸載到百度太行 DPU1.0 中,實(shí)現(xiàn)虛擬云主機(jī)和裸金屬共池,即裸金屬可與虛擬云主機(jī)被統(tǒng)一靈活調(diào)度。來自百度智能云的測試驗(yàn)證表明,百度太行DPU1.0 產(chǎn)品能夠?yàn)橛脩籼峁?1000 萬 PPS 的轉(zhuǎn)發(fā)率以及 20 萬 IOPS 的存儲(chǔ)性能。
面向未來,DPU 產(chǎn)品也將成為智能云服務(wù)的核心組件,助力IaaS資源的統(tǒng)一彈性底座,進(jìn)而為用戶依托百度智能云開展各類業(yè)務(wù)創(chuàng)新、實(shí)施產(chǎn)業(yè)智能化轉(zhuǎn)型提供可靠保證。
IPU帶來的架構(gòu)革新,可以從基座層確保算力最大化釋放,釋放數(shù)據(jù)中心的核心競爭優(yōu)勢。從2016年開始,“互聯(lián)網(wǎng)下半場”開始成為被廣泛討論的命題。如今,在規(guī)?;偁庍M(jìn)入收尾階段,技術(shù)創(chuàng)新與精細(xì)化服務(wù)成為主要競爭點(diǎn)的階段,“云計(jì)算下半場”似乎也已經(jīng)到來。
在這一產(chǎn)業(yè)周期,云計(jì)算服務(wù)商的競爭力不僅在于基礎(chǔ)設(shè)施性價(jià)比,而是要面向客戶提供服務(wù)創(chuàng)新、技術(shù)創(chuàng)新以及綜合價(jià)值。這種情況下,云計(jì)算數(shù)據(jù)中心的基礎(chǔ)架構(gòu)創(chuàng)新變得至關(guān)重要。它既是算力集約化的保障,也是業(yè)務(wù)創(chuàng)新的基石。
隨著英特爾 IPU 以及基于其參考設(shè)計(jì)研發(fā)的相關(guān)產(chǎn)品,在云數(shù)據(jù)中心的基礎(chǔ)架構(gòu)革新中展現(xiàn)出顯著性能優(yōu)勢和市場價(jià)值,并逐步形成可持續(xù)發(fā)展的生態(tài)鏈,英特爾與百度智能云等深度合作伙伴也正圍繞云服務(wù)的未來發(fā)展方向,從軟硬件層面開拓更多優(yōu)化方案。例如通過新的英特爾IPU 平臺(tái)提供更大網(wǎng)絡(luò)吞吐量,實(shí)現(xiàn)對硬件資源的全面解耦,以及以極低時(shí)延實(shí)現(xiàn)端到端的加速等。
面向未來,英特爾計(jì)劃在 IPU 產(chǎn)品體系上持續(xù)發(fā)力。英特爾在 2022 年推出兩款第二代 200 G 的可編程 IPU, 代號(hào)分別為“Oak Springs Canyon”和“Mount Evans”。其中Oak Springs Canyon 搭載了英特爾至強(qiáng)D 處理器與英特爾Agilex? FPGA 芯片。而Mount Evans 則是英特爾首款基于ASIC 芯片的IPU產(chǎn)品。這兩款產(chǎn)品都將具有卸載 200 G工作負(fù)載所需的基礎(chǔ)設(shè)施加速能力,且都可與英特爾至強(qiáng)可擴(kuò)展處理器協(xié)同工作。未來兩到三年內(nèi),英特爾將推出支持 400 G的 IPU產(chǎn)品,并且再2025年或晚些時(shí)候,推出新一代基于 FPGA 芯片和 ASIC 芯片的 800G IPU 產(chǎn)品。
與此同時(shí),英特爾也正進(jìn)一步背靠豐富的開源軟件,如基礎(chǔ)架構(gòu)編程人員開發(fā)套件(International Package and Development Kit ,IPDK)、SPDK、DPDK 等),致力于通過開放的生態(tài)系統(tǒng)、多方位的行業(yè)協(xié)作以及積極的社區(qū)互動(dòng),讓百度等云服務(wù)提供商、云服務(wù)最終用戶以及其它合作伙伴能加速 IPU 相關(guān)解決方案的構(gòu)建,從云數(shù)據(jù)中心基礎(chǔ)架構(gòu)的持續(xù)革新中擷取更大價(jià)值。
未來數(shù)據(jù)中心正在加速到來,而IPU正在成為其中翩然起舞的精靈。
版權(quán)聲明:本文內(nèi)容由互聯(lián)網(wǎng)用戶自發(fā)貢獻(xiàn),該文觀點(diǎn)僅代表作者本人。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如發(fā)現(xiàn)本站有涉嫌抄襲侵權(quán)/違法違規(guī)的內(nèi)容, 請發(fā)送郵件至 舉報(bào),一經(jīng)查實(shí),本站將立刻刪除。