芯東西(公眾號:aichip001)
作者 |? 云鵬
編輯 |? 李水青
芯東西9月20日消息,近日英特爾與智東西在內的少數業內媒體進行了深入交流,針對最新Meteor Lake處理器在工藝、架構、封裝、AI等方面的技術新特性進行了深入解構分析。

新一代Meteor Lake處理器采用了Intel 4制程工藝,Intel 4利用了用極紫外光刻技術(EUV),重點在于優化能效;架構層面其首次增加了“低功耗島能效核”;Foveros封裝技術的應用成為了架構改革的基礎;同時英特爾在AI方面首次將神經網絡處理器(NPU)集成到了客戶端芯片中。
一、重點押寶EUV,簡化工藝提升良率,能效比成Intel 4關鍵優勢
具體來看,在工藝制程方面,根據英特爾IDM 2.0戰略,英特爾計劃在四年里實現五個制程節點的迭代,并在2025年走到領先的位置。目前臺積電和三星兩大芯片代工巨頭也在先進制程方面投入較大,英特爾實現這一目標面臨著不小的壓力。

Intel 4這一代工藝利用EUV技術改善了芯片良率,同時縮小了晶片面積,以實現更高的能效。在交流中英特爾提到,Intel 4這代工藝對他們來說十分重要,對后續幾個制程節點的推進十分關鍵。

與Intel 7相比,Intel 4的面積微縮在2倍左右,邏輯庫性能更高,對EUV光刻技術的工藝進行了簡化,同時其專門針對高性能計算應用進行了優化,相比上代,iso功率性能提升了20%。基于Intel 4工藝的高密度MIM電容器,其供電性能相比上代也有一定提升。

據稱英特爾在EUV光刻技術方面進行了大量投資,目標是簡化、改進互連架構設計。
根據公開數據,一臺典型EUV光刻機的價格為1.8億英鎊,重量為180噸,需要四架波音747和35輛卡車運輸,目前EUV光刻機的獨家供應商為荷蘭ASML。
EUV光刻技術可以顯著簡化互連架構的制程工藝,同時支持微縮,可以讓Intel 4工藝中的掩碼減少20%,工藝步驟減少5%。
值得一提的是,Intel 4兼容EMIB和Foveros等先進封裝技術。
二、先進封裝成新架構實現基礎,讓“芯片DIY”更自由
提到先進封裝技術,英特爾從Meteor Lake開始,將Foveros技術引入到客戶端產品中。
Foveros能做什么?
實際上目前英特爾大部分客戶端處理器的單片式晶片中都包含CPU、GPU、PCH等眾多功能模塊,隨著這些功能日益多樣化且變得越來越復雜,設計和制造這些單片式系統級芯片的難度越來越大,成本也越來越高。
Foveros封裝技術可以利用高密度、高帶寬、低功耗互連等特性,把采用多種制程工藝制造的這些模塊組合成“大型分離式模塊架構”,從而組成晶片復合體。

具體來看,Meteor Lake主要包含三個大的模塊,包括圖形模塊、使用Foveros 36X間距晶片間互連的SoC模塊以及采用Intel 4制程工藝制造的計算模塊。
在技術指標方面,Foveros封裝技術可以實現36u的凸點間距,跡線寬度在1微米以內,凸點密度提高了近8倍,跡線長度在2毫米以內。同時Foveros封裝技術可以實現160GB/s/mm的帶寬,功耗小于0.3Pj/位。

比較直觀的來看,相比12代的Raptor Lake,Foveros封裝減少了低功耗晶片互連的分區開銷,更小的區塊提高了晶圓良率,英特爾甚至可以為每個區塊選擇更適合的硅工藝,同時,這一封裝對于SKU創建的簡化也有利于英特爾提升定制服務能力。

據英特爾介紹,他們正在大力投資晶圓級組裝的Meteor Lake以及未來的新項目,這些新產線可以為Foveros Direction 9微米等項目提供產能。
三、40年來重大架構轉變,能效依然是提升重點
在架構方面,英特爾稱基于Intel 4制程工藝的Meteor Lake是英特爾迄今為止能效最高的客戶端處理器,并且可以提供多種AI功能。
英特爾甚至將Meteor Lake稱為“40年來重大的架構轉變,為未來PC創新奠定基礎”,可見其對于此次架構升級的重視。

Meteor Lake的“分離式模塊架構”由四個模塊組成,通過英特爾的Foveros 3D封裝技術進行連接。
其中計算模塊(Compute Tile)同樣是“能效核+性能核”的微架構,在功能方面有所增強,采用了Intel 4制程工藝,在能耗比方面提升比較明顯。
SoC模塊(SoC Tile)集成了神經網絡處理器(NPU),可以提升PC運行AI應用時的能效表現,同時兼容OpenVINO等標準化程序接口,便于AI的開發和應用普及。

比較值得注意的是,英特爾此次在直連到SoC結構的SoC模塊上添加了新的低功耗島能效核,這一變化適合應對新的低功耗工作負載,優化了節能和性能間的平衡。
在英特爾看來,新增的低功耗島能效核是混合架構的第一個重大進展,該架構的首次引入是在12代Alder Lake上。新的3D混合架構和計算模塊上的能效核、性能核進行協同,進一步提升了整個處理器的能效比表現。
Meteor Lake架構中的SoC模塊支持Wi-Fi 6E、支持8K HDR和AVI編解碼器以及HDMI 2.1和Display Port 2.1標準。
在圖形模塊(GPU Tile),新架構集成了英特爾獨立顯卡中的“同款”圖形架構,性能相比傳統集顯有比較明顯的提升,性能是上一代的2倍。此外,IO模塊(IO Tile)集成了Thunderbolt 4和PCle Gen 5.0。
四、NPU與處理器內部各模塊協同,拆解NPU內部兩大“秘密武器”
AI是今天每家芯片公司都繞不過去的一個重要方向。
此次英特爾第一次在客戶端平臺中集成了NPU,同時該模塊與處理器內所有計算引擎的內置AI功能結合,從而實現更高能效的AI計算。

比如GPU的高性能并行性和高吞吐量適合在媒體、3D應用程序和渲染管線中引入AI功能,而NPU則是專用低功耗AI引擎,更適合用于維持AI運行和AI卸載,CPU則具有更快的響應能力,適合輕量級、單推理、低延遲的AI任務。
Meteor Lake中的這個NPU采用了多引擎架構,配備了兩個神經計算引擎,可以共同處理單一負載也可以各自處理不同的負載。

對神經計算引擎進一步拆分,其兩個重要的計算組件包括推理管道和SHAVE DSP。推理管道由一個乘積累加運算(MAC)陣列、一個激活功能塊和一個數據轉換塊組成,通過減少數據移動并利用固定功能運作來處理常見的大計算量任務,實現更高能效。

SHAVE DSP是專門為AI設計的超長指令字/數字信號處理器,其流式混合架構向量引擎(SHAVE)可以與推理管道、直接內存訪問(DMA)引擎一起協同,在NPU上進行并行異構計算,提高性能。
英特爾相關高管在英特爾馬來西亞科技巡展上提到,AI正在融入我們生活的方方面面,云端AI存在其局限性,AI正逐漸走向邊緣,在行業的關鍵轉折時期,英特爾選擇將AI引入PC端。

Meteor Lake的AI計算與連接無關,成本更低,同時可以更好地保護隱私。
結語:能效和AI成英特爾新架構突出特點
縱觀此次Meteor Lake的一系列工藝、架構、封裝、AI能力升級,我們可以鮮明地看到能效比提升以及AI能力的下放是其兩大核心特點。
如今能效比幾乎是所有先進芯片競爭焦點中的焦點,而消費電子終端產品AI能力的提升,也已經成為行業大勢所趨,邊緣側的AI落地,離不開芯片廠商們的推動。
面向未來五年,英特爾能否按照自己的節奏穩步迭代工藝,面向競爭激烈的芯片市場,英特爾還有怎樣的大招要放出,我們拭目以待。