
當全世界都在爭相搶購英偉達價格高昂的GPU,投資人焦急地審視著被資本支出(Capex)拖累的大型科技公司資產負債表時,亞馬遜卻打出了它的最大牌。這並非一種新的語言模型,而是其底層的「引擎」: AWS Trainium 3。這裡的「3」指的是奈米級的尺寸;3比4更勝一籌…
在 re:Invent 大會上亮相的這款全新3 奈米晶片,不僅是工程技術的精湛嘗試,更是一項意義深遠的經濟和戰略舉措。其目標是什麼?大幅降低人工智慧的訓練和推理成本,讓更多人能夠獲得目前只有少數人才能享有的資源。
亞馬遜對「晶片大戰」的回應
坦白說,目前基於規模越來越大、成本越來越高的GPU集群的AI開發模式,對許多公司來說已經難以為繼。亞馬遜深知這一點,並秉持其一貫的務實精神,決定自主建構基礎設施。
Trainium3是全新 Trn3 UltraServer 的核心。這不僅僅是簡單的升級,而是一次世代飛躍,旨在實現可擴展的效率。以下是剔除行銷宣傳後,所有關註生產力的人士都感興趣的關鍵數據:
- 運算能力:比上一代(Trainium2)快 4.4 倍。
- 能源效率提升40% 。在資料中心能源消耗量堪比小型國家的時代,這個數字足以讓財務長們喜笑顏開。
- 密度:每台伺服器最多可容納144 個Trainium3 晶片,從而創建一個能夠處理大型模型的整合系統。
- 網路:晶片間延遲降低至 10 微秒以下,這對於需要即時資料流的混合專家(MoE) 設計至關重要。
經濟影響:成本降低,競爭加劇
真正的新聞不在於失敗次數,而在於錢包。像Anthropic (ChatGPT 的競爭對手 Claude 的開發商)這樣的客戶,以及像Decart和Splash Music這樣的新興公司,都已經在使用 Trainium,降低了高達50% 的成本。
這會產生有趣的連鎖反應:
- 擺脫對英偉達的依賴:亞馬遜減少了自身(及其客戶)對事實上的壟斷供應商英偉達的依賴,從而提高了利潤率。
- 降低進入門檻:如果推理成本減半,就會出現先前虧損的新型商業模式(例如,即時產生視訊)。
- 面向所有人的基礎設施:借助EC2 UltraClusters ,AWS 最多可連接一百萬個晶片。這種強大的運算能力足以訓練未來的基礎模型,不再是預算無限者的專屬。
展望未來:Trainium4 與對英偉達的開放性
亞馬遜此舉可謂是「技術現實政治」的體現,他們已經提前展示了Trainium4 處理器。令人驚訝的是,它將支援英偉達的NVLink Fusion技術。這意味著,亞馬遜雖然在晶片層面與英偉達展開競爭,但卻允許自家晶片與英偉達晶片混用。這是一種混合且務實的策略:既然無法徹底擊敗對手,那就讓對手的晶片在自己的平台上更好地發揮作用。
問答
與市場上的其他晶片相比,亞馬遜為AWS開發的晶片有哪些創新之處?其主要創新之處在於採用了3奈米製程工藝,從而確保了更高的密度和能源效率。與通用GPU(例如英偉達的產品)不同,Trainium3是一款ASIC晶片,這意味著它是專為人工智慧客製設計的。這消除了架構中不必要的“冗餘”,從而提供了精準的性能(性能比上一代產品提升了4.4倍),更重要的是,對於需要訓練大型模型的用戶來說,運營成本降低了一半。
它能挑戰 Gemini 和 ChatGPT 嗎?不能直接挑戰,但間接地,它對它們構成了威脅。 Gemini 運行在Google的專有晶片(TPU)上,而 ChatGPT 主要依賴微軟/英偉達的基礎設施。然而,Trainium3 是亞馬遜為 Gemini 和 ChatGPT的競爭對手(例如 Anthropic/Claude)提供的利器。透過大幅降低這些競爭對手的訓練和推理成本,亞馬遜加劇了競爭,迫使Google和 OpenAI 無法再固守現有的利潤空間。
這是否是類似谷歌之前為Meta開發的那款ASIC晶片?是的,從概念上講,兩者發展路徑相同。谷歌多年來一直擁有自己的TPU(張量處理單元),而Meta正在開發自己的MTIA晶片。 Trainium3是亞馬遜的ASIC(專用積體電路)。不同之處在於,Google主要將TPU用於自身用途(並將其出租給雲端),而亞馬遜則積極推廣Trainium,將其作為所有AWS客戶的市場標準,試圖打破英偉達GPU在雲端的實際壟斷地位。
文章《亞馬遜發起矽晶片挑戰:Trainium3問世。 3nm製程效率將刺穿AI成本泡沫》來自Scenari Economici 。
這是在 Wed, 03 Dec 2025 12:00:11 +0000 在 https://scenarieconomici.it/amazon-lancia-la-sfida-del-silicio-arriva-trainium3-efficienza-a-3nm-per-sgonfiare-la-bolla-dei-costi-ai/ 的報紙 “Scenari Economici” 上發表的文章的翻譯。
