新聞資訊
location 您的位置: 首頁 » 新聞資訊 » 行業新聞
MCM封裝GPU開始進入三國鼎立時代
來源:UST WIRELESS 發布日期:21/01/2021
近些年,GPU在業界的重要性愈加凸出,無論是在高性能計算,還是在消費級領域,其對用戶的粘性越來越强,英偉達的火爆就是得益於其覈心的GPU科技和產品,在這種情況下,傳統巨頭英特爾坐不住了,原本只是在消費級市場生產集成GPU顯卡,市場需求的變化使得英特爾開始組建獨立GPU研發團隊, 並投入了越來越多的資源,以應對英偉達和AMD的競爭,特別是在高性能計算領域。
在高性能應用領域,對GPU的功耗和成本可控的要求越來越高,這就對相關科技提出了更高的要求,包括晶片設計方法、EDA工具、制程工藝,以及封裝技術,要想實現高性能與功耗、成本的有效平衡,以上這些科技環節缺一不可,而隨著摩爾定律的逐步“失效”,先進封裝技術的重要性越來越凸出, 而英特爾、AMD和英偉達這三巨頭都看到了這一環節的重要性,並不斷加強研發力度。 特別是在近期,這三家公司不約而同地在MCM(多晶片模塊)方面披露了重要資訊。
MCM打入GPU
MCM是為解决單一晶片集成度低和功能不够完善的問題而生的,它把多個高集成度、高性能、高可靠性的die,在高密度多層互聯基板上用SMD科技組成多種多樣的電子模塊系統,形成多晶片模塊。 MCM具有以下特點:封裝延遲時間縮小,易於實現模塊高速化; 縮小整機/模塊的封裝尺寸和重量; 系統可靠性大大提高。
以前,MCM主要用於CPU和儲存設備,特別是在CPU領域應用較為普遍,如早期IBM的Power4雙核處理器,就是4塊雙核Power4以及附加的L3快取記憶體形成的MCM,還有英特爾的Pentium D(研發代號:Presler)、Xeon,以及AMD的Zen 2架構Ryzen(覈心代號:Matisse)、EPYC處理器等,都是應用MCM的典型代表。
近些年,在AMD的引領下,MCM封裝技術開始走向GPU。 之所以如此,主要是因為傳統顯卡是帶有多個GPU的PCB板卡,需要連接兩個獨立顯卡的Crossfire或SLI橋接器。 傳統的SLI和CrossFire需要PCIe匯流排來交換數據、紋理、同步等。 由於GPU之間的渲染時間會產生同步問題,囙此在許多情况下,傳統的雙GPU顯卡,即單個PCB上的兩個晶片由它互連,每個晶片都有自己的VRAM。 SLI或CrossFire的能耗很大,冷卻也是一個挑戰,這些在很長一段時間內都困擾著工程師。

MCM GPU則是一個單獨的封裝,其板載橋接器取代了傳統兩個獨立顯卡之間的Crossfire或SLI橋接器。
三巨頭
在高性能計算應用領域,這種MCM GPU的優勢很明顯,也值得花費更多時間和精力在解决封裝和互連方面的軟件問題,以應對更高的MCM設計複雜度。 目前來看,MCM GPU主要用於資料中心和云計算應用領域。 隨著科技的不斷成熟,以及PC應用效能的提升,其在消費電子領域的應用也將會出現。
三巨頭發力
最早將MCM封裝技術引入GPU的是AMD。 2020年,該公司把遊戲卡與專業卡的GPU架構分家了,遊戲卡的架構是RDNA,而專業卡的架構叫做CDNA,首款產品是Instinct MI100系列。 2021年,AMD的Q2財報確認CDNA 2 GPU已經向客戶發貨了,其GPU覈心代號是Aldebaran,它成為AMD第一款採用MCM封裝的產品,是為資料中心準備的。 在PC方面,2022年引入下一代RDNA 3架構後,基於MCM的消費級Radeon GPU也會出現。
製造多晶片計算GPU類似於製造多核MCM CPU,例如Ryzen 5000或Threadripper處理器。 首先,將晶片靠得更近可以提高計算效率。 AMD的Infinity架構確保了高性能互連,有望使兩個晶片的效率接近一個的。 其次,使用先進的工藝科技批量生產多個小晶片比大晶片更容易,因為小晶片通常缺陷較少,囙此比大晶片的產量更好。
前些天,在2021年財報電話會議上,AMD確認,今年會有幾項重要產品發佈,包括基於RDNA 3架構的GPU,也就是Radeon RX 7000。 目前來看,該系列最新顯卡會有三款GPU,分別是Navi 31、Navi 32和Navi 33,其中,Navi 31和Navi 32將採用MCM封裝。 之前有傳聞稱,Navi 31和Navi 32的Infinity Cache將採用3D堆棧的設計,會單獨添加到MCD小晶片中,與Zen 3架構上採用3D V-Cache的原理類似,效能會有較大提升。
由於Navi 31和Navi 32採用了MCM封裝,AMD將會使用兩種不同制程,GPU會使用台積電的5nm工藝,緩存I/O晶片則會採用台積電的6nm工藝。
英偉達也在跟進MCM封裝GPU。
2017年,英偉達展示了通過四個小晶片構建的設計方案,不但提升了效能,還有助於提高產量(較小的晶片良品率會提高),而且還允許將更多的計算資源集合在一起。 這種多晶片設計還有助於提高供電效率,具有更好的散熱效果。
近日,英偉達研究人員發表了一篇技術文章,概述了該公司對MCM的探索,英偉達現時在MCM封裝GPU上的做法稱為“Composable On Package GPU”(COPA),該團隊講述了COPA GPU的各項優勢,尤其是能够適應各種類型的深度學習工作負載。
由於傳統融合GPU解決方案正迅速變得不太實用,研究人員才想到到COPA-GPU的理念。 融合GPU解決方案依賴於由傳統晶片組成的架構,輔以高頻寬記憶體(HBM)、張量覈心/矩陣覈心(Matrix Cores)、光線追跡(RT)等專用硬體的結合。
此類硬體或在某些任務下非常合適,但在面對其它情况時卻效率低下。 與當前將所有特定執行組件和緩存組合到一個包中的單片GPU設計不同,COPA-GPU架構具有混合/匹配多個硬體塊的能力。 如此一來,它就能够更好地適應當今高性能計算只能呈現的動態工作負載、以及深度學習(DL)環境。
這種綜合更適應多種類型工作負載的能力,可帶來更高水准的GPU重用。 更重要的是,對於數據科學家們來說,這使他們更有能力利用現有資源,來突破潜在的界限。
面向資料中心和消費市場,英偉達將分別推出基於Hopper架構和Ada Lovelace架構的GPU。 據悉,該公司只會在Hopper架構GPU上採用MCM科技,Ada Lovelace架構GPU仍會保留傳統的封裝設計,並不會像AMD基於RDNA 3架構的Navi 31那樣,將MCM多晶片封裝引入到消費級GPU。



近日,有消息稱,基於Hopper架構的GH100的電晶體數量將達到1400億,這幾乎是現時基於Ampere架構的GA100(542億)或AMD基於CDNA 2架構的Instinct MI200系列(580億)的2.5倍。 據稱GH100的晶片尺寸接近900mm ², 比此前傳言的1000mm ² 要小,不過比GA100(862mm ²) 和Instinct MI200系列(約790mm ²) 要大一些。 傳聞GH100總共配寘了288個SM,可以提供三倍於A100計算卡的效能。
據悉,作為英偉達第一款基於MCM科技的GPU,Hopper架構產品將採用台積電5nm制程工藝,支持HBM2e和其他連接特性,預計會在2022年中旬亮相,競爭對手將是英特爾的Xe-HP架構GPU和AMD的CDNA 2架構產品。
不過,以上說法還未得到官方證實,英偉達將於今年3月21日召開GTC 2022大會,届時,可能會公佈Hopper架構,以及相應的加速卡方案。
作為獨立GPU的後來者,英特爾最近也是動作頻頻。
近期,英特爾公佈新專利,描述多個計算模組如何協同工作執行影像渲染,代表英特爾GPU將採用MCM封裝技術,大幅提高運作效能。
英特爾針對資料中心和超級電腦Ponte Vecchio的CPU已使用多晶片設計,並採用MCM封裝技術。 在新專利中,英特爾提出GPU影像渲染解決方案,將多晶片綜合至同單元,解决製造和功耗等問題,同時優化可擴展性和互聯性。
現時,這類影像渲染問題會通過交替渲染科技(Alternate Frame Rendering,AFR)或折開幀渲染(Scissor Frame Rendering,SFR)等算灋解决,但英特爾是綜合運算模組的棋盤格式渲染,同時有分佈式運算,使多晶片設計GPU有更高運算效率。 雖然英特爾沒有多描述架構層面細節,但可預期Intel Arc品牌顯卡搭載MCM封裝技術GPU應只是時間問題。

結語
在GPU研發方面,英特爾、AMD和英偉達顯得越來越“同步”,特別是在制程工藝和封裝技術方面,制程都依賴台積電,封裝都看重MCM,在這兩方面原本領先的AMD,其優勢越來越小,特別是在MCM方面,英偉達和英特爾發展速度很快,不僅是在高性能計算領域,在消費級市場,雖說AMD首先將MCM科技應用於PC, 但英偉達和英特爾也在加快進度,相信不久也會有相應的方案推出。
MCM封裝GPU開始進入三國鼎立時代。

  • 電子郵件
    sales@ustwireless.com
  • 電話
    00852-38449311
  • 地址
    香港荃灣柴灣角街66-82號金熊工業中心10樓EH座H28室