關於“算力”,這篇文章值得一看

2022.10.15

關於“算力”,這篇文章值得一看


究竟到底什麼是算力?算力包括哪些類別,分別有什麼用途?目前,全球算力正處於怎樣的發展狀態?

今天這篇文章,我們來聊聊算力。

這兩年,算力可以說是ICT行業的一個熱門概念。在新聞報導和大咖演講中,總會出現它的身影。

那麼,究竟到底什麼是算力?算力包括哪些類別,分別有什麼用途?目前,全球算力正處於怎樣的發展狀態?

接下來,小棗君就給大家詳細科普一下。

什麼是算力

算力的字面意思,大家都懂,就是計算能力(Computing Power)。

更具體來說,算力是通過對信息數據進行處理,實現目標結果輸出的計算能力。

我們人類,其實就具備這樣的能力。在我們的生命過程中,每時每刻都在進行著計算。我們的大腦,就是一個強大的算力引擎。大部分時間裡,我們會通過口算、心算進行無工具計算。但是,這樣的算力有點低。所以,在遇到復雜情況時,我們會利用算力工具進行深度計算。遠古時期,我們的原始工具是草繩、石頭。後來,隨著文明的進步,我們有了算籌(一種用於計算的小棍子)、算盤等更為實用的算力工具,算力水平不斷提升。

到了20世紀40年代,我們迎來了算力革命。1946年2月,世界上第一台數字式電子計算機ENIAC誕生,標誌著人類算力正式進入了數字電子時代。


ENIAC,1946年

再後來,隨著半導體技術的出現和發展,我們又進入了芯片時代。芯片成為了算力的主要載體。


世界上第一個集成電路(芯片),1958年

時間繼續推移。

到了20世紀70-80年代,芯片技術在摩爾定律的支配下,已經取得了長足進步。芯片的性能不斷提升,體積不斷減小。終於,計算機實現了小型化,PC(個人電腦)誕生了。


世界上第一台PC(IBM5150),1981年

PC的誕生,意義極為深遠。它標誌著IT算力不再僅為少數大型企業服務(大型機),而是昂首走向了普通家庭和中小企業。它成功打開了全民信息時代的大門,推動了整個社會的信息化普及。在PC的幫助下,人們充分感受到IT算力帶來的生活品質改善,以及生產效率提升。PC的出現,也為後來互聯網的蓬勃發展奠定了基礎。進入21世紀後,算力再次迎來了巨變。這次巨變的標誌,是雲計算技術的出現。


雲計算,Cloud Computing

在雲計算之前,人類苦於單點式計算(一台大型機或一台PC,獨立完成全部的計算任務)的算力不足,已經嘗試過網格計算(把一個巨大的計算任務,分解為很多的小型計算任務,交給不同的計算機完成)等分佈式計算架構。雲計算,是分佈式計算的新嘗試。它的本質,是將大量的零散算力資源進行打包、匯聚,實現更高可靠性、更高性能、更低成本的算力。具體來說,在雲計算中,中央處理器(CPU)、內存、硬盤、顯卡(GPU)等計算資源被集合起來,通過軟件的方式,組成一個虛擬的可無限擴展的“算力資源池”。

用戶如果有算力需求,“算力資源池”就會動態地進行算力資源的分配,用戶按需付費。

相比於用戶自購設備、自建機房、自己運維,雲計算有明顯的性價比優勢。


雲計算數據中心

算力雲化之後,數據中心成為了算力的主要載體。人類的算力規模,開始新的飛躍。

算力的分類

雲計算和數據中心之所以會出現,是因為信息化和數字化的不斷深入,引發了整個社會強烈的算力需求。

這些需求,既有來自消費領域的(移動互聯網、追劇、網購、打車、O2O等),也有來自行業領域的(工業製造、交通物流、金融證券、教育醫療等),還有來自城市治理領域的(智慧城市、一證通、城市大腦等)。不同的算力應用和需求,有著不同的算法。不同的算法,對算力的特性也有不同要求。通常,我們將算力分為兩大類,分別是通用算力和專用算力。


大家應該都聽說過,負責輸出算力的芯片,就有分為通用芯片和專用芯片。像x86這樣的CPU處理器芯片,就是通用芯片。它們能完成的算力任務是多樣化的,靈活的,但是功耗更高。

而專用芯片,主要是指FPGA和ASIC。

FPGA,是可編程集成電路。它可以通過硬件編程來改變內部芯片的邏輯結構,但軟件是深度定制的,執行專門任務。

ASIC,是專用集成電路。顧名思義,它是為專業用途而定制的芯片,其絕大部分軟件算法都固化於矽片。

ASIC能完成特定的運算功能,作用比較單一,不過能耗很低。FPGA,介於通用芯片和ASIC之間。


我們以比特幣挖礦為例。

以前,人們都是用PC(x86通用芯片)挖礦,後來越挖難度越大,算力不夠。於是,開始使用顯卡(GPU)去挖礦。再後來,顯卡的能耗太高,挖出來的幣值還抵不上電費,就開始採用FPGA和ASIC集群陣列挖礦。

在數據中心裡,也對算力任務進行了對應劃分,分為基礎通用計算,以及HPC高性能計算(High-performance computing)。

HPC計算,又繼續細分為三類:

科學計算類:物理化學、氣象環保、生命科學、石油勘探、天文探測等。工程計算類:計算機輔助工程、計算機輔助製造、電子設計自動化、電磁仿真等。智能計算類:即人工智能(AI,Artificial Intelligence)計算,包括:機器學習、深度學習、數據分析等。科學計算和工程計算大家應該都聽說過,這些專業科研領域的數據產生量很大,對算力的要求極高。以油氣勘探為例。油氣勘探,簡單來說,就是給地表做CT。一個項目下來,原始數據往往超過100TB,甚至可能超過1個PB。如此巨大的數據量,需要海量的算力進行支撐。智能計算這個,我們需要重點說一下。AI人工智能是目前全社會重點關注的發展方向。不管是哪個領域,都在研究人工智能的應用和落地。

人工智能的三大核心要素,就是算力、算法和數據。


大家都知道,AI人工智能是一個算力大戶,特別“吃”算力。在人工智能計算中,涉及較多的矩陣或向量的乘法和加法,專用性較高,所以不適合利用CPU進行計算。在現實應用中,人們主要用GPU和前面說的專用芯片進行計算。尤其是GPU,是目前AI算力的主力。GPU雖然是圖形處理器,但它的GPU核(邏輯運算單元)數量遠超CPU, 適合把同樣的指令流並行發送到眾核上,採用不同的輸入數據執行,從而完成圖形處理或大數據處理中的海量簡單操作。因此,GPU更合適處理計算密集型、高度並行化的計算任務(例如AI計算)。這幾年,因為人工智能計算的需求旺盛,國家還專門建設了很多智算中心,也就是專門進行智能計算的數據中心。


成都智算中心(圖片來自網絡)

除了智算中心之外,現在還有很多超算中心。超算中心裡面,放的都是“天河一號”這樣的超級計算機,專門承擔各種大規模科學計算和工程計算任務。


(圖片來自網絡)

我們平時看到的數據中心,基本上都屬於雲計算數據中心。


任務比較雜,基礎通用計算和高性能計算都有,也有大量的異構計算(同時使用不同類型指令集的計算方式)。因為高性能計算的需求越來越多,所以專用計算芯片的比例正在逐步增加。前幾年逐漸開始流行起來的TPU、NPU和DPU等,其實都是專用芯片。


大家現在經常聽說的“算力卸載”,其實不是刪除算力,而是把很多計算任務(例如虛擬化、數據轉發、壓縮存儲、加密解密等),從CPU轉移到NPU、DPU等芯片上,減輕CPU的算力負擔。

近年來,除了基礎通用算力、智能算力、超算算力之外,科學界還出現了前沿算力的概念,主要包括量子計算、光子計算等,值得關注。

算力的衡量

算力既然是一個“能力”,當然就會有對它進行強弱衡量的指標和基准單位。大家比較熟悉的單位,應該是FLOPS、TFLOPS等。

其實,衡量算力大小的指標還有很多,例如MIPS、DMIPS、OPS等。


MFLOPS、GFLOPS、TFLOPS、PFLOPS等,都是FLOPS的不同量級。具體關係如下:


浮點數有FP16、FP32、FP64不同的規格

不同的算力載體之間,算力差異是非常巨大的。為了便於大家更好地理解這個差異,小棗君又做了一張算力對比表格:


前面我們提到了通用計算、智算和超算。從趨勢上來看,智算和超算的算力增長速度遠遠超過了通用算力。根據GIV的數據統計,到2030年,通用計算算力(FP32)將增長10倍,達到3.3 ZFLOPS。而AI智算算力(FP16),將增長500倍,達到105 ZFLOPS。

算力的現狀與未來

早在1961年,“人工智能之父”約翰·麥卡錫就提出Utility Computing(效用計算)的目標。他認為:“有一天,計算可能會被組織成一個公共事業,就像電話系統是一個公共事業一樣”。如今,他的設想已經成為現實。在數字浪潮下,算力已經成為像水、電一樣的公共基礎資源,而數據中心和通信網絡,也變成了重要的公共基礎設施。這是IT行業和通信行業辛苦奮斗大半個世紀的成果。    

對於整個人類社會來說,算力早已不是一個技術維度的概念。它已經上升到經濟學和哲學維度,成為了數字經濟時代的核心生產力,以及全社會數智化轉型的基石。

我們每個人的生活,還有工廠企業的運轉,政府部門的運作,都離不開算力。在國家安全、國防建設、基礎學科研究等關鍵領域,我們也需要海量的算力。算力決定了數字經濟發展速度,以及社會智能發展高度。根據IDC、浪潮信息、清華大學全球產業研究院聯合發布的數據顯示,計算力指數平均每提高1點,數字經濟和GDP將分別增長3.5‰和1.8‰。


全球各國的算力規模與經濟發展水平,已經呈現出顯著的正相關關係。一個國家的算力規模越大,經濟發展水平就越高。


世界各國算力和GDP排名(來源:遲九虹,華為算力時代峰會演講)

在算力領域,國家之間的競爭博弈日益激烈。2020年,我國算力總規模達到135 EFLOPS,同比增長55%,超過全球增速約16個百分點。目前,我們的絕對算力,排名世界第二。但是,從人均角度來看,我們並不佔優勢,僅處於中等算力國家水平。


世界各國人均算力對比(來源:唐雄燕,華為算力時代峰會演講)

尤其是在芯片等算力核心技術上,我們與發達國家還有很大的差距。很多掐脖子技術未能解決,嚴重影響了我們的算力安全,進而影響了國家安全。所以,腳下的路還有很長,我們還需要繼續努力。


最近,對手又打起了光刻機的主意(圖片來自網絡)

未來社會,信息化、數字化和智能化將會進一步加快。萬物智聯時代的到來,大量智能物聯網終端的引入,AI智能場景的落地,將產生難以想像的海量數據。這些數據,將進一步刺激對算力的需求。根據羅蘭貝格的預測,從2018年到2030年,自動駕駛對算力的需求將增加390倍,智慧工廠需求將增長110倍,主要國家人均算力需求將從今天的不足500 GFLOPS,增加20倍,變成2035年的10000 GFLOPS。根據浪潮人工智能研究院的預測,到2025年,全球算力規模將達6.8 ZFLOPS,與2020年相比提升30倍。

新一輪的算力革命,正在加速啟動。

結語

算力是如此重要的資源,但事實上,我們對算力的利用仍然存在很多問題。

比如算力利用率問題,以及算力分佈均衡性問題。根據IDC的數據顯示,企業分散的小算力利用率,目前僅為10%-15%,存在很大的浪費。

摩爾定律從2015年開始放緩,單位能耗下的算力增速已經逐漸被數據量增速拉開差距。我們在不斷挖掘芯片算力潛力的同時,必須考慮算力的資源調度問題。那麼,我們該如何對算力進行調度呢?現有的通信網絡技術,能夠滿足算力的調度需求嗎?

敬請期待下集:到底什麼是“算力網絡”?