歡迎回來

網頁已經閒置了一段時間,為確保不會錯過最新的內容。請重新載入頁面。立即重新載入

查看更多「香港好去處」精彩內容

22
五月
尖沙咀香港文化中心|吳冠中藝術贊助跨界系列: 大型舞蹈詩《之間──吳冠中水墨行》 尖沙咀香港文化中心|吳冠中藝術贊助跨界系列: 大型舞蹈詩《之間──吳冠中水墨行》
尖沙咀香港文化中心|吳冠中藝術贊助跨界系列: 大型舞蹈詩《之間──吳冠中水墨行》
推介度:
22/05/2026 - 24/05/2026
24
五月
九龍寨城公園衙門|「九龍城寨光影之旅」電影場景展 九龍寨城公園衙門|「九龍城寨光影之旅」電影場景展
九龍寨城公園衙門|「九龍城寨光影之旅」電影場景展
推介度:
24/05/2025 - 24/05/2028

AI代理引爆推論需求!為何最先升溫不是GPU?NVIDIA、Arm同時押注CPU,誰將主導下一代AI基建?

AI代理引爆推論需求!為何最先升溫不是GPU?NVIDIA、Arm同時押注CPU,誰將主導下一代AI基建?

方展策
智城物語

  2026年3月,半導體業連續兩週發生兩件足以改寫產業格局之事:先是輝達(NVIDIA)在GTC大會上高調展示由「Vera CPU」組成的伺服器機架,執行長黃仁勳更高喊CPU獨立銷售將是「數十億美元規模的業務」;接著,晶片技術授權龍頭安謀(Arm)宣布,首度推出自研處理器「AGI CPU」,搶攻數據中心市場。一家以賣GPU起家的公司,以及一家素來只賣晶片技術授權的公司,為甚麼在同一時間搶著賣CPU?

 

Read More:

AI競賽新戰線!Meta擁抱自研晶片,Arm製作自家CPU,全球半導體市場面臨大洗牌? 

PC產業第三勢力成形中?NVIDIA、聯發科推「加速處理器」,衝擊Intel、AMD CPU雙雄霸權!

 

AI產業重心從模型訓練轉向推論

 

  要理解這場CPU爭奪戰,必須先理解AI產業正在發生的結構性轉向。過去3年,AI運算的主戰場集中在模型訓練:把海量數據塞進大型語言模型,藉由數以千計的GPU推動神經網絡反覆分析和學習。在這個訓練階段,GPU大規模並行運算的能力至關重要,發售GPU的NVIDIA也因而此躍居為全球最高市值企業。

 

  不過,隨著AI公司逐漸將重心從模型訓練,轉向「代理式AI」(Agentic AI)部署和推論,CPU就開始翻紅起來。AI代理系統瓶頸不是GPU擅長的並行運算,而是轉移到任務協調、數據搬運、工具呼叫、網絡和記憶體調度等「非GPU」環節。如果CPU無法有效承接資源調度與任務分派,GPU便會閒置著,令整座AI數據中心的投資回報率被大幅拉低。

 

  Arm執行長瑞恩·哈斯(Rene Haas)以一個比喻說明了AI運算分工的轉變:「昂貴的加速器(GPU)負責生成Token(詞元),就像砂石車倒下大量的泥土,但總得有人把這些泥土搬走,CPU就是負責搬運泥土的設備。」

 

  

AI代理引爆推論需求!為何最先升溫不是GPU?NVIDIA、Arm同時押注CPU,誰將主導下一代AI基建?

Arm執行長哈斯表示,AI數據中心市場仍處於擴張階段,並未出現飽和跡象,有足夠空間容納不同玩家。(圖片來源:翻攝Arm官方YouTube影片)

 

CPU 決定整體AI系統運算效率

 

  哈斯預估,AI代理的推論運算將讓Token需求增加15倍,而每十億瓦(Gigawatt)數據中心所需的CPU核心數量,則會從2025年的3,000萬顆增至2026年的1.2億顆,增幅高達4倍,並補充說這個數字可能還被低估了。

 

  事實上,自2025 年底起,CPU供需失衡的跡象已悄然浮現:交貨週期延長至六個月,英特爾(Intel)與超微(AMD)皆向客戶發出供應短缺預警。美國銀行預測, CPU 市場規模可能從 2025 年的 270 億美元(約2,106億港元),成長至 2030 年的 600 億美元(約4,680億港元),更有分析指 CPU 市場增長率到 2028 年可能超越 GPU。

 

  這也是為甚麼NVIDIA在2026 年 3 月 16 日舉行的GTC大會上,高調發表Vera CPU;同月24 日,安謀也宣布,公司成立35年來首度推出自研處理器AGI CPU,並預估這項新業務到2031年將創造150億美元(約1,170億港元)的營收。兩家公司均在傳達同一個訊號:在AI代理推論時代下,CPU不再只是配角,而是決定整體系統效率的重要角色。

 

AI代理引爆推論需求!為何最先升溫不是GPU?NVIDIA、Arm同時押注CPU,誰將主導下一代AI基建?

NVIDIA Vera CPU內置88個運算核心,採用LPDDR5X記憶體架構,使其記憶體頻寬高達1.2TB/s,整體效率達到傳統CPU的兩倍,運算速度提升約50%。(圖片來源:NVIDIA官網)

 

Vera 定位為AI代理專用處理器

 

  其實早於2021年,NVIDIA已發表旗下首款伺服器處理器 Grace CPU,只是外界一直視之為GPU的輔助晶片,焦點仍放在Hopper、Blackwell等GPU之上。但進入2026年,輝達對CPU的敘事明顯升級:把Vera CPU定義為「首款專為代理式AI與強化學習時代打造的處理器」,強調其效能是傳統機架級CPU的1.5倍,效率則是2倍。

 

  黃仁勳認為,當AI公司從模型訓練轉向AI代理部署,傳統由英特爾主導的CPU不再是現代運算架構的預設基礎,而只是眾多選項之一。換言之,輝達目標不是單純搶佔CPU市場,而是要把CPU重新定位為AI數據中心內一個與GPU深度契合的關鍵零件。Vera CPU 機架也已被納入新一代 AI 運算平台Vera Rubin的產品線,與GPU、HBM記憶體、網絡晶片合組成一套機架級基礎設施。

 

  

AI代理引爆推論需求!為何最先升溫不是GPU?NVIDIA、Arm同時押注CPU,誰將主導下一代AI基建?

黃仁勳指出,現時已有客戶單獨採購NVIDIA CPU,預計相關業務有望擴展至數十億美元規模。(圖片來源:翻攝NVIDIA官方YouTube影片)

 

  倘若GPU、CPU、互連介面、以至軟件堆疊均由輝達主導,那麼客戶買到的就不再是零件,而是一整座可擴展的AI工廠。這比只賣GPU更能鞏固議價能力,也更能防止客戶轉用Intel CPU、AMD CPU、Google TPU或Broadcom ASIC晶片,逐步稀釋NVIDIA在AI基建中的影響力。

 

Arm打破中立,推出AGI CPU

 

  如果說輝達的CPU布局是「副業守護主業」,安謀的轉型則是商業模式變革,因為販售CPU,等於親手動搖公司一直以來的商業定位。Arm長年扮演著技術授權的中立角色,讓NVIDIA、Google、微軟(Microsoft)、亞馬遜(Amazon)、Meta等客戶在其晶片架構上各自發揮,從不會親自落場銷售晶片,以免跟客戶競爭。

 

  這種商業模式的好處是,Arm幾乎可以吃到整個AI晶片生態系的成長紅利,惟卻不必承擔生產晶片的風險。然而,如此細水長流的穩定收入,已不太符合Arm在2023年IPO上市後追求業務擴展的敍事。自生成式AI爆紅後,安謀發現數據中心對AI晶片的龐大需求,故此決定轉向晶片設計和銷售,瞄準AI基建市場。

 

  財雄勢大的雲端巨頭如Google、微軟、亞馬遜,在購入Arm晶片技術授權後,能夠投入大量資源研發和製造自家AI晶片,惟資金有限的二線廠商卻需要現成、可用的運算解決方案。這正是Arm看到的市場缺口,於是毅然推出AGI CPU,為那些沒能力自己生產CPU、卻又急著進軍AI領域的客戶,提供一個高能效、又能快速部署的選項。

 

  

AI代理引爆推論需求!為何最先升溫不是GPU?NVIDIA、Arm同時押注CPU,誰將主導下一代AI基建?

ARM AGI CPU採用Neoverse V3架構,擁有136個運算核心,單核心記憶體頻寬達6GB/s,功耗則為300瓦,較傳統CPU可提供約2倍的效能功耗比。(圖片來源:翻攝Arm官方YouTube影片)

 

NVIDIA、Arm陷入共生競爭關係

 

  可是,此舉也標誌著Arm與既有客戶正式進入競爭關係。哈斯以Google Pixel手機與Microsoft Surface電腦為類比,強調這不是與客戶爭食,而是透過「示範品」壯大整個平台生態。Meta是AGI CPU共同開發與早期合作夥伴,OpenAI、Cloudflare、SAP、SK Telecom等亦表態採用或導入,商用系統則由Lenovo、ASRock Rack與Supermicro提供。

 

  目前AI CPU市場似乎仍是開放格局,沒有像GPU市場般由輝達一家獨大,因此競爭將更顯激烈。長遠來說,當Arm聯合Meta構建新的AI伺服器生態系,並進一步謀求AI晶片「直銷商」的地位時,不只搶奪Intel與AMD的市場份額,也會跟輝達AI產品線發生衝突。雙方的關係已從單純的「合作夥伴」滑向「共生競爭」的微妙地帶了。

Add a comment ...Add a comment ...
最新
人氣
etnet TV
財經新聞
評論
專題透視
生活
DIVA
健康好人生
香港好去處

Comment

暫無回應

最新
人氣
etnet TV
財經新聞
評論
專題透視
生活
DIVA
健康好人生
香港好去處