人工智能和軟件如何推動5G數據中心轉型
人工智能和軟件如何推動5G數據中心轉型
如今,我們正在見證計算領域巨大的創新階段,全球5G的快速部署與數據密集型工作負載以及生成型人工智能的突破性發展交織在一起。整個計算生態系統對靈活性的需求從未如此強烈,以創新和探索新型加速、新穎的系統架構以及滿足不斷增長的數據消費需求的新方法。半導體設計成本上升和全球能源預算收緊帶來的額外挑戰意味著我們正處於全球計算基礎設施轉型之中。
5G與人工智能的結合蘊藏著巨大的機遇。5G技術可以提供人工智能應用收集、傳輸和處理大量數據所需的高吞吐量、低延遲和可靠的連接。作為回報,人工智能可以幫助5G網絡動態分配資源、管理流量和檢測異常。人工智能還可以利用5G為用戶和設備提供個性化、情境化的智能服務。這兩項技術將共同真正改變我們的溝通、工作和生活方式。
但每個故事都有兩個方面。5G 和人工智能給數據中心運營商和客戶帶來了重大挑戰,因為兩者都會產生大量數據,需要以靈活、及時、經濟和節能的方式存儲、處理和分析。為了充分利用這個機會,數據中心架構師需要圍繞計算的設計、構建和部署方式尋找變革性方法。
5G虛擬RAN:邊緣數據中心的關鍵推動者
支持5G的關鍵創新之一是虛擬無線接入網絡(vRAN)。vRAN 是一種相對較新的部署模型,正在流行。它將蜂窩基帶處理功能與硬件解耦,並將其作為軟件在通用服務器上運行。
這可以在部署和管理5G網絡時提供更大的靈活性、可擴展性和效率。虛擬化5G基礎設施的規模經濟可以通過多種方式實現。第一,結合相同的計算基礎設施來服務5G連接和邊緣應用,使連接和數據處理更接近源;其次,軟件驅動的雲原生基礎設施可實現動態資源分配、負載平衡、更快的配置和自動化網絡管理,這對運營效率產生巨大影響。第三,借助光纖連接,vRAN可以將多個基站匯集到一個集中式服務器池中,從而降低5G基礎設施的成本和復雜性。
通過使計算能力更接近最終用戶及其設備,vRAN可以促進邊緣計算,同時減少延遲並提高性能。
但為了充分發揮其潛力,vRAN需要計算平台能夠支持高吞吐量、低延遲和確定性的無線電信號處理,同時保持非常高的計算效率。它還需要高速網絡接口來處理服務器、無線電和終端設備之間的大量數據流量,這進一步強調了對變革性方法的需求。
當今的5G數據中心:CPU和DPU
傳統通用CPU無法處理5G vRAN堆棧複雜且多樣化的工作負載。通過將所有網絡功能虛擬化為軟件,包括操作系統、網絡層、應用程序和協議,數據中心內的流量急劇增加,從而降低了CPU效率。為了應對這一挑戰,CPU需要一個補充性的專用加速設備,可以卸載CPU的網絡任務,以提高性能和效率。當今5G數據中心最流行的加速設備之一是數據處理單元(DPU)。
人工智能和軟件如何推動5G數據中心轉型
5G 基礎設施中的人工智能(來源:Arm)
DPU是具有嵌入式處理器或可編程邏輯的網卡,可以執行網絡功能,例如數據包處理、加密/解密、壓縮/解壓縮、負載平衡、防火牆、路由/交換和服務質量(QoS)。DPU可以通過接管部分網絡相關任務來幫助降低服務器的CPU利用率和功耗,從而實現根據不同場景配置和優化網絡功能的靈活性和可編程性。
異構計算為未來的工作負載增加了更多靈活性
雖然當今的5G數據中心已經利用CPU和DPU來支持vRAN和其他5G應用,但下一代5G數據中心將需要在硬件架構、軟件平台和服務模型方面提供更大的靈活性。例如,數據中心可能使用GPU來處理複雜的數學、圖形、視頻或其他大型數據集;用於機器學習工作負載的GPU或TPU;以及用於可編程邏輯的FPGA,以解決更多自定義工作負載。
這種類型的異構計算有助於提高融合智能邊緣數據中心的性能、效率和可擴展性,這些數據中心可以提供更接近最終用戶的RAN服務、雲計算能力和人工智能應用服務。最終,將更專業的計算移至更靠近設備和最終用戶的位置,可以改善延遲並實現5G 所承諾的許多下一代用例。
軟銀、英偉達和Arm最近宣布合作,旨在為人工智能和高性能計算(HPC) 創建世界上最先進的數據中心。它是當前此類數據中心轉型的最佳示例之一,具有專門的處理功能。此次合作預計將為基於Nvidia GH200 Grace Hopper超級芯片的生成式AI和5G/6G應用提供一個開創性的平台,軟銀計劃在日本各地新的分佈式AI 數據中心推出該平台。與過去使用的數據中心相比,新數據中心的分佈將更加均勻,並可處理人工智能和5G 工作負載。這將使他們能夠以低延遲更好地以峰值容量運行,並大幅降低總體能源成本。
軟銀將與Nvidia合作建立數據中心,為在全球範圍內快速部署生成式AI應用和服務鋪平道路,該數據中心可以在多租戶通用服務器平台上託管生成式AI 和無線應用,從而高效節能、降低成本並提供更多服務。
此類創新代表了5G和人工智能的重要拐點。整個數據中心圍繞專業處理提供的目標性能而構建,為運營商提供實現vRAN潛力所需的運營效率。此外,專業處理使運營商能夠在同一物理位置共同託管計算密集型服務,例如人工智能或3D視頻會議- 更靠近數據,更靠近用戶。這一點至關重要,因為靈活性、低延遲和性能效率確保了計算資源及其所需資本和能源成本的最佳利用,從而改變了整個數據中心的TCO(總擁有成本)。
當我們展望下一代5G數據中心時,對靈活高效的計算平台的需求至關重要。為了滿足在5G 和人工智能的推動下對數據中心服務不斷增長的需求,下一代數據中心將被定義為適應新技術和工作負載的能力,並提供企業和消費者所需的性能和效率。因此,我們將繼續將高效、專業的芯片視為該領域創新和轉型的基礎。