當 Apple 未如所料推出 M2 處理器,難免引起市場人士的猜測: Apple 是否技止此耳?尤其 Intel CEO Pat Gelsinger 在去年 10 月公開表示想贏回 Apple 的訂單。正是「外行人看熱鬧,內行人看門道」, Intel 是否還有機會呢?本文將先從 Apple M1 系列 CPU 的發展分析開始,比較 Apple 及 Intel CPU 的優勢與不足,再大膽估算 Intel 成功的機會。
我們的文章從 Intel 一份攻擊 M1 的 PDF 檔案開始。在 Intel 12 代 Core CPU 的 PDF 文件中, Intel 先以 Power-Performance 比較 Core i9-12900HK 及 M1 Max ,表示在同為 35W 功耗時,前者略快於後者,而 Core i9-12900HK 在 75W 時效能較 M1 Max (35W Max) 高 50% 。隨後, Intel 更以多項測試作比較,包括在《 Adobe Premiere Pro 》、《 Autodesk AutoCAD 》、《 Blender 》( Rendering 時間測試)及《 CrossMark – Creative Scenario 》測試軟件,大力指出 Apple M1 Pro 及 Max 的絕對效能不如 Core i9-12900HK 。
從 Intel PPT 說 M1 的不足
雖然這是 Intel 有意攻擊對手的技倆,但從中我們可以見到 M1 Pro 及 Max 存在的一些不足。首先是 M1 Max 雖然工作功耗較低,但若用家不介意功耗的話,那麼 Core i9-12900HK 的絕對效能會較高,那怕需要付出更高功耗的代價。其次, M1 Pro 與 Max 之間效能距離不大,主要因為兩者 CPU 的 Cores 數目同為 8 P-cores + 2 E-cores ,分別主要在於記憶體頻寬 (204GB/s 對 408GB/s) 及 GPU 數目 (16 對 32)所致。 結果是在 Intel 設計的測試內容中, M1 Max 不比 Pro 快多少,若要繼續維持 M1 CPU 的優勢, Apple 需尋求提升效能之法,以免為對手趕上。
M1 Ultra 是極限嗎?
在 Intel 的 PPT 中看到 Apple M1 的問題後,現在讓我們回到 M2 不出的問題。談及 M2 , Apple 似乎有意繼續發佈更多 M1 系列的新型號,這次便發佈號稱最強的 M1 Ultra ,然而 M1 Ultra 是否極限呢?筆者認為,儘管不少分析認為 M1 Ultra 將是極限,但筆者預期 M1 還有終極版本可以推出。另外, Apple 的優勢是沒有 Intel 過去的包袱,即不用考慮舊軟件的兼容性及表現,可以放手一搏作出新嘗試。不過 M1 發展到 Ultra ,將遇上不少挑戰。
一年一架構的困難
M1 在 2020 年 11 月登場,現今不足 2 年時間已推出 M1 Pro 、 Max 及 Ultra 版本,可說是進步神速。但 CPU 微架構設計需時,即使強如 Intel 也拋出 2 年一架構的 Tick-Tock 策略,但也十分吃力,例如代號 Raptor Lake 的 13 代 Core 便屬於 12 代 Core 的加強版,主要是把最大核心數目從 16 核心增至 24 核心。若要把整個架構推倒重來,更非要 5 至 7 年不可;另一例子如 AMD Ryzen(Zen) ,在 2012 年正式立項,於 2017 年 3 月才正式開售,直至 Zen2 於 2019 年 7 月登場才獲得大成, 可見更新微架構之困難,至於 M1 往後之路如何,請先看 Apple 目前已做的改動,及顯現的不足說起。
時脈卡死在 3.2GHz
Apple 很少強調 M1 的運作時脈,因為 M1 採用 ARM 架構, 時脈一般在 3GHz 左右,而 M1 的 P-core 能於 3.2GHz 下工作已屬不易。網上流傳, M1 的 E-core 工作時脈僅 2GHz 左右。當然 Apple 也深明 M1 的不足,所以在 M1 Pro 及 Max 時改動 P-core 及 E-core 的比例,即從 4×P-core + 4×E-core 改成 8×P-core + 2×E-core 。 P-core 的數目一下子增加 1 倍,反而作用不大的 E-core 數目減半,無形中大幅提升處理器的工作時脈。但這也反映出兩大問題,一是 3.2GHz 的最高時脈令單核性能無法提升, 這從《 Geekbench 5 》數據庫中, M1 Max 在 Single-Core 的表現未較原始版的 M1 有所提升可見一斑。另外, M1 受 ARM 架構所限,很難突破 10 核心上限的問題(主要是優化方面的考慮),所以從 M1 到 M1 Max , CPU 核心總數只得從 8 核心增至 10 核心,而 M1 Ultra 更改用雙晶片的方式提升至 2 × 10 核心,主要是考慮到 10 核心以上優化的問題,不若視作雙 CPU 架構優化來得簡易。
192KB 快取指令的得失
筆者認為, Apple M1 代表各方面的完美平衡,所以才有此高效能及低功耗並重的表現,所以 M1 採用多項獨特設計,如 P-core 採用少見的 192KB L1 指令快取 + 128KB L1 數據快取的設計,而 E-core 也有 128KB L1 指令快取 + 64KB L1 數據快取的設計,對比 Intel 12 代 Core P-core 為 48KB+32KB 、 E-core 為 32KB+64KB,而 AMD Ryzen 為 32KB+32KB ,至於 ARM Cortex-A 的建議是 32-64KB+32KB ,可見 Apple M1 的設計並不尋常。
為甚麼 Intel 不也採用 M1 的 192KB L1 指令快取 + 128KB L1 數據快取呢?不如讓我們先重溫 L1 Cache 的作用。顧名思義, L1 指令快取是用作儲存最先執行的指令微碼,原本不需要那麼大的容量。筆者以 AMD Athlon 為例子,那時採用了 64KB+64KB 設計,但在 Ryzen 時改為 32KB+32KB 設計。大致上來說, L1 指令快取愈大,可以用作儲存將要執行的指令微碼愈多,但代價是會有較高的 Latency ,不利高時脈工作。可以說,M1 獨特的 L1 Cache 架構成就高性能,但不利日後的升級工作。
功耗是一大問題
另一項困擾 M1 發展的是功耗問題。第一代 M1 功耗屬 15W ,但發展至 M1 Max 因為 GPU 功耗大大加強了,在 CPU Only 時為 30W , CPU+GPU 時猛增至 55W 。至於最新的 M1 Ultra ,在 CPU Only 時為 60W , CPU+GPU 時達 110W ,相當於原本 M1 的 7 倍。 110W 的功耗也許遠不及 Intel Core i9-12900K 的 125-241W,但已響起了警號。
4 晶片 M1 Ultra×2 可行嗎?
現在再來探討 M1 Ultra 是否為終極版本的問題。若以現今 CPU 技術來說,筆者認為 M1 Ultra 之上存在 ×2 之可能。對照 AMD 及 Intel CPU 的發展,已先後採用 Chiplets 等技術,使每顆 CPU 可容下 4 晶片,打破單晶片的限制。眼下 M1 Max 晶片面積已達到驚人的 432mm2 , M1 Ultra 估計為 864mm2 ,未來若改用 TSMC 3nm 製程,可望縮小最多 30% 晶片面積,再考慮採用雙 M1 Ultra 晶片的做法,那麼 M1 的運算能力可望繼續倍增。
談到多晶片的支援方面, Apple 可說是下了重本。 M1 Ultra 所用的 UltraFusion 架構傳輸頻寬達到 2.5TB/s 的新高。作為對比, Intel 12 代 Core 的 InterConnect 僅有 1TB/s 頻寬,可見 UltraFusion 架構的巨大優勢。
有限度合作的可能
從事情的發展來看, Intel 處理器在今年內重返 Apple 市場的機會不大,但明年推出的Meteor Lake 14 代 Core 架構,由於採用混合模組等新技術,將大大提升顯示效能(傳聞為 320EUs 設計),似為重返 Apple 市場作準備。
由於 M1 Ultra 集成繪圖核心性能宣稱超越 RTX 3090 ,似在說明 Apple 不會因為圖形晶片而轉「 芯 」。但科技公司之可貴在於領先的技術,在商言商 Apple 不會拒絕好的技術,尤其是 Apple 目前未有 Hardware Ray-Tracing 等方案,是否有機會採購 Intel Arc 圖形核心呢?又或如 Meteor Lake 的 CPU Tile 採用模組化設計,是否有機會換上 Apple M1 晶片呢?又或如隨著 Intel 大力發展製程業務,加上美國政府的支持,是否有機會把 M1 晶片委託於 Intel 生產呢?這都是全無不可能。
Conclusion
按目前 Apple M1 的發展速度來看,筆者認為還有推出 M1 Ultra×2 的可能。但 M1 架構的潛力也被發揮得七七八八,未來將面臨高功耗及時脈增加困難的問題。筆者認為,自 Apple 推出自己的 CPU 後, Intel 要重回 Apple 電腦市場的機會不大,但若進行有限度的合作並非全無可能。作為龍頭 CPU 廠商, Intel 擁有豐富的技術儲備、完整的生產體系等等,而這些都是 Apple 所欠缺的。說不定未來找 Intel 代工生產 CPU ,或採用部分 Intel CPU 、 GPU 或晶片組技術也是可行的。