澳洲幸運5app下載 微軟推出Maia 200 進步 AI 推理門檻

微軟(Microsoft) 推出了 Maia 200,這是其用于驅動 AI 責任負載的自研芯片的最新迭代版塊。Maia 200 領有一些令東談主印象潛入的數據,包括 10 petaflops 的 FP4 算力和 216GB 的HBM3,這讓 Microsoft 止境 Azure 云在 AI Token 生成方面得回了立竿見影的進步。更緊迫的是,這給了 Microsoft在自研 AI 加快器方面越過 AWS 和 Google Cloud 的底氣。

Microsoft 暗示,Maia 200 是其首款挑升處治 AI 性能挑戰的芯片。除了原始的數字運算能力,AI 推理還需要多數高速內存,以及內存和處理器之間的高速貫穿。Maia 200 似乎在這兩個方面齊有所斬獲。
Maia 200 給與臺積電 3nm (納米)工藝栽種,功耗瞎想(TDP)為 750 瓦。Maia 200 的中樞包含兩個試驗引擎:一個是用于高隱隱量矩陣乘法和卷積的 Tile Tensor Unit(TTU:Tile 張量處理單位),復舊 FP8、FP6和 FP4 精度;另一個是用于 SIMD(單提示多數據)提示的 Tile Vector Processor(TVP:Tile 向量處理器),提供 FP8、BF16和 FP32 處理能力。TTU 和 TVP 試驗引擎聯接到 216GB 的高帶寬內存(HBM3)以及 272MB 的片上TSRAM(Tile 靜態就地存取存儲器)。
Maia 200 配備了一個徑直內存看望(DMA)子系統,用于在 TSRAM 和TTU 之間保握數據流動,以及一個小的 Tile Control Processor(TCP:Tile 截至處理器)來合營TTU 和 DMA 之間的責任。
憑據 Azure 工程博客中 Saurabh Dighe(系統與架構副總裁)和 Artour Levin(AI 硅工程副總裁)撰寫的 Maia 200 深度默契,Maia 200 架構的一個決定性特征是其豐富的內存和內存脈絡結構。“這種雄壯的片上內存資源復舊無為的各式低蔓延、高帶寬的數據照看戰略。”他們寫談。“CSRAM 和 TSRAM齊是完好意思軟件照看的,允許栽種者——或編譯器/啟動時——詳情味地舍棄和固定數據,以精準截至數據的局部性和遷移。”

Maia 200 芯片配備了片上以太網收集接口卡(NIC),與相鄰芯片之間提供每秒 2.8 TB 的雙向帶寬。據 Dighe 和 Levin 先容,Maia 200 給與了“兩層、縱向彭脹”拓撲結構,蟻合了基于以太網的縱向彭脹互連,可在包含多達 6,144 個加快器的集群中提供高帶寬、低蔓延通訊。
Microsoft 暗示,它不錯在一個“兩層、縱向彭脹”集群拓撲中聯接多達6,144 個 Maia 200 加快器。
據 Dighe 和Levin 稱,Maia 200 的 Tile 級處理能力,蟻合 DMA 和片上收集能力,使芯片或者達到現在大限度 AI 責任負載所需的無為限度。“DMA 引擎專為多通談、高帶寬傳輸而瞎想,復舊 1D/2D/3D 步進遷移,使常見的 ML 張量布局或者在片上 SRAM、HBM和外部接口之間高效遷移,同期終了數據遷移與籌謀的重復,”他們寫談。“同期,NoC 在集群和內存子系統之間提供可彭脹、低蔓延的通訊,并復舊單播和多播傳輸——這是分發張量塊和合營并行試驗的緊迫能力。”
{jz:field.toptypename/}距離 Microsoft 推出 Maia 100——其首款挑升用于 AI 推理的第一代 AI 加快器——剛剛往時兩年多。Maia 100 給與臺積電 5 納米工藝栽種,提供每秒 1.8 TB 的雙向內存帶寬和 64GB SRAM。它提供 3.2 petaflops 的 MXFP4 性能和 1.6 petaflops 的 FP8 或 MXInt8 性能,茍簡是Maia 200 的三分之一。
Maia 200 的能力與其他頂級 AI 加快器相稱,使其成為“AI 推理能源源”,Microsoft 云和 AI 試驗副總裁 Scott Guthrie 暗示:“本色上,Maia 200 不錯爽直啟動現在最大的模子,并為改日更大的模子留出迷漫的空間。”“Maia 200 是來自任何超大限度云勞動商的最遒勁的第一方硅芯片,其 FP4 性能是第三代 Amazon Trainium 的三倍,FP8 性能高于 Google 第七代 TPU。”他還補充說:“Maia 200 亦然 Microsoft 部署過的最高效的推理系統,與咫尺咱們機群中的最新代硬件比較,性能進步了 30%。”

Maia 200 可在風冷和水冷環境中啟動。它的瞎想旨在與 Azure 的第三方 GPU 機群協同責任,并死守機架、電源和機械架構的法式。它集成到 Azure 的原生截至平面中,Microsoft 這使得部署和勞動變得安若泰山,同期與歸并數據中心空間內的其他 AI 加快器融合共存。
Microsoft 籌算使用其 Maia 200 芯片啟動各式模子,包括最新的 OpenAI GPT-5.2 模子。它還將用于生成合成數據,供 AI 模子用于考試方向。新芯片咫尺部署在 Microsoft 位于愛荷華州得梅因近鄰的 Central 數據中心區域。它接下來將部署在亞利桑那州鳳凰城近鄰的 US West 3 數據中心區域,改日還會有更多區域跟進。

備案號: