八國聯軍攻輝達,UALink挑戰NVLink
綜觀當前AI市場中,輝達(Nvidia)無疑是目前全球AI的主要領導者之一。其以遊戲顯卡起家,在過去的十年裡以黑馬之姿,從一家價值僅約100億美元的新創公司,茁壯成一間市值超越3兆美元的科技巨頭;且輝達崛起的速度在美股可以說是數一數二的,1年前市值還僅4000多億美元,短短1年時間就從1兆美元衝上3兆美元,不僅如此,近期市值更一度超越微軟(Microsoft)及蘋果(Apple)登頂寶座。
輝達憑藉其於1999年發明的圖形處理器(GPU),搖身一變成為「AI軍火商」,並在AI晶片領域享有90%以上的市占;隨著全球對AI晶片需求的爆炸式增長,輝達的GPU早已是各界瘋搶的當紅炸子雞。
當然,在龐大的AI商機面前,除輝達外,其他科技大廠亦想一爭寶座。近期美國八大科技巨擘包括英特爾(Intel)、超微(AMD)、博通(Broadcom)、思科(Cisco)、Google、慧與科技(HPE)、Meta及微軟(Microsoft)共組UALink推廣組織,將攜手開發新的互聯技術UALink,旨在提供高速、低延遲網路互連,且開放式的產業標準,運用開放協定促成加速器晶片之間的有效通訊,並能輕易擴增單一伺服器機櫃內的加速器晶片數量,同時提供運算密集工作負載的必要效能。
UALink促進小組就指出,隨著AI運算需求大增,企業需要能建立低延遲、高效率的向上擴充(scale-up)網路,以便為單一執行個體加入運算資源。UALink和產業規格目的即在為AI和機器學習、HPC和雲端應用的建立和實作,建立標準介面。
進一步來看,UALink提議的第1個版本「UALink 1.0」將在單一運算「pod」中連接多達1024個AI加速器(僅限GPU)。UALink 1.0基於「開放標準」,包括超微的無限架構,將允許AI加速器附加的記憶體之間進行直接載入和儲存,並且與現有的互連規格相比,總體上將提高速度並降低資料傳輸延遲的作用。簡單來說,UALink可以將大量加速器連接在一起,共同完成大規模計算任務。
此外,這8家公司預計第3季創建1個「UALink聯盟(UALink Consortium)」,負責監督UALink規範的未來發展,UALink 1.0也將釋出給屆時加入的企業,至於更高頻寬的升級版規格UALink 1.1則預定第4季問世。超微資料中心解決方案總經理諾洛德(Forrest Norrod)表示,第1批UALink將在「未來幾年」推出。
UALink的問世可以說意在對抗輝達的NVLink技術,希望打破輝達的壟斷。根據外媒分析指出,輝達寡占AI加速器至少80%至95%市占率,且近乎掠奪式的高毛利,亦早就讓全美科技巨頭不安,因此這次的合縱手段,也被視為是「AI產業為了打破輝達壟斷地位所做的最新努力」。
輝達執行長黃仁勳先前受訪時就回應,NVLink已經發展到第5代,而UALink只是1個提案,在未來幾年內都無法與NVLink競爭;且黃仁勳亦表示,當UALink第1代推出時,NVLink可能已經發展到第7或第8代。而產業人士也認為,輝達的成功,並非只單在晶片本身,除有強大的GPU技術外,完善的軟體生態系統如CUDA平台,以及NVLink串聯頻寬,都是其他業者難以在短期內超越的「護城河」。
NVLink是輝達開發的一種高速GPU互連技術,主要目的是取代PCIe來提供更快的傳輸速度與溝通模式。回顧NVLink的發展,由於計算需求不斷增長之下,多GPU的系統配置越來越普及,然而,在此趨勢下,作為連結的PCIe之頻寬逐漸成為瓶頸,而為了速度更快、拓展性更強的互連,輝達於14年的GTC大會上首次提出了NVLink技術,並於16年發布了第1款搭載NVLink的產品P100,單個GPU具有160GB/s的頻寬,相當於PCIe 3的5倍頻寬。
也就是說,NVLink可以讓GPU與GPU跳過CPU直接溝通,亦讓CPU與GPU的溝通模式變得更直接,並且同時藉由統一存取記憶體技術整合CPU與GPU的記憶體,能更有效的利用運算資源。簡單來說,NVLink是1個能夠在GPU與GPU之間以及GPU與CPU之間實現高速大帶寬直連通訊的快速互連機制。
而自NVLink問世以來,目前已發展到第5代,單個GB200 Tensor核心GPU最高可支援18個每秒速度100GB的NVLink連線,總頻寬可達每秒1.8TB,比前一代頻寬高出兩倍,超過第5代PCIe頻寬14倍。另,NVSwitch是NVLink的關鍵推動者,透過NVLink Switch,NVLink連接可以跨節點擴展,以創建無縫、高頻寬、多節點GPU集群,有效形成資料中心大小的GPU。在NVLink發展的這十年時間中,輝達已奠定了自身大型多GPU運算系統的優勢基礎。
不過,雖說輝達已有多年構築起的護城河,但亦有機構分析師認為,UALink的出現是希望在乙太網路標準之上打造成本較低的技術,加上科技大廠急欲擺脫對輝達高度依賴的景況,因此UALink未來仍有打破輝達在AI資料中心網路中壟斷的可能性;且當前AI才正要蓬勃發展,因此隨著後市UALink逐步推進、系統製造商採用開放的產業標準後,行業內的競爭勢必更加激烈,也就是說,各家公司都仍有機會在此領域取得新的突破。至於對於用戶而言,這也意味著將有更多高性能、低成本的選擇可供使用。
由此來看,這場AI大戰可以說才正要開打,究竟輝達能否坐穩寶座,抑或是八國聯軍有望崛起,將無疑是市場未來一大焦點。