英特爾突襲英偉達H100,新AI晶片訓練快40%,推理快50%,CEO蹦迪慶祝

2024.04.10

英特爾,開始正面硬剛英偉達了。

就在深夜,英特爾CEO帕特·基辛格手舞足蹈地亮出了最新AI晶片—— Gaudi 3

圖片

他為什麼開心到現場直接蹦迪?

看下Gaudi 3的性能結果,就一目了然了:

  • 訓練大模式:比英偉達H100快40%
  • 推理大模型:比英偉達H100快50%

圖片

不僅如此,雖然基辛格沒有在現場給出直接的數據,但他也說:

Gaudi 3的性能將與英偉達H200相當,在某些領域的性能甚至會更好。

圖片

如此直面對標英偉達,到底效果如何,我們繼續往下看。

硬剛英偉達的Gaudi 3

英特爾表示,Gaudi 3已經在Llama上做了測試,可以有效地訓練或部署AI大模型,包括文生圖的Stable Diffusion和語音辨識的Whisper等等。

圖片
圖片

在現場,基辛格也展示了整合最新英特爾晶片的AI PC,能夠快速處理的多項任務,例如快速處理郵件

圖片

再如語音處理

圖片

以及影像渲染

圖片

英特爾示範操作的同事也非常調皮地展示了用AI PC產生的卡通版基辛格:

圖片

據了解,Gaudi 3採用5奈米製程製造,與歷代Gaudi其它性能上的具體對比,如下表所示:

圖片

圖片

英特爾表示,Gaudi 3晶片將在今年的第三季向客戶大規模提供,包括戴爾、惠普和超微電腦在內的公司將使用該晶片。

至於具體的價格,目前英特爾方面還並未透露。

不過更令人意外的是,Gaudi 3還只是在這次英特爾Vision活動中發表的產品之一。

Xeon,步入第六代

沒錯,去年年底英特爾剛上市第五代Xeon,僅時隔數月,第六代Xeon又來了!

(英特爾這次還真沒有擠牙膏)

在現場,基辛格還親切地叫它「little baby」

圖片

第六代Xeon包含兩種架構,分別是Sierra ForestGranite Rapids

Sierra Forest基於英特爾較小、低功耗的E-cores,而Granite Rapids則由更大但性能更高的P-cores 組成。

基辛格在現場稱二者像雙胞胎

圖片

更具體而言,Sierra Forest架構的英特爾Xeon 6處理器,其機架密度提高2.7倍。

客戶能以近3:1的比例取代舊系統,大幅降低能耗,協助其實現永續發展目標。

而Sierra Forest架構的英特爾Xeon 6處理器包含了對MXFP4資料格式的軟體支援。

與使用FP16的第四代Xeon處理器相比,可將下一個token的延遲時間縮短最多6.5倍,能夠運行700億參數的Llama-2模型。

圖片

至於英特爾Xeon 6處理大模型的速度有多快,基辛格做了更直接的比較。

他將第四代、第五代和最新的第六代Xeon放到了一起,來了一個現場速度的大比拼。

圖片

從直覺的生成速度來看,第六代Xeon明顯比「前任們」快上許多。

具體到精確的延時數值,第六代Xeon運行Llama 2 70B只有82ms

圖片

同等條件下,第六代Xeon與「前任們」的延時數值比較如下:

圖片

據了解,Sierra Forest架構的第六代Xeon處理器將於今年第二季推出。

網友揭秘英特爾“秘方”

這場硬剛英偉達的記者會,同樣也激起了不少網友們的熱議。

例如Gaudi 3封裝的一個細節,即使用HBM2e記憶體晶片,有網友對此表示驚訝:

他們使用的是HBM2e,這是英偉達A100在2020年使用的。

而最先進的HBM3e英特爾原本也計劃採用,但很可能因為供應不足,這次沒能搶到足夠的訂單。

圖片

對此,這位網友進一步表示:

這是英特爾的秘方之一。

他們總是能靠著舊技術趕上/超越新技術,直到目前的技術在生產、取得和整合上變得更容易。

事實上,製造優勢也是英特爾在半導體領域的關鍵優勢之一,而身為半導體產業的開創者之一,英特爾幾乎擁有晶片產業的所有資源和要素能力。

但何時能和英偉達全面一較高下?這也是不少網友關注的問題:

這次英特爾硬剛的是H100/H200,那什麼時候可以對標英偉達最新的「核彈」B200?

或許答案只有交給時間回答。

但無論如何,英特爾這次的發布,確實是給AIGC時代的算力,多提供了一個「快好省」的選擇。