arzh-CNenfrdejakoplptesuk
Suche finde 4120  disqus socia  tg2 f2 lin2 in2 X-Symbol 3 y2  p2 Tik steam2

Pegatron führte 128-GPU AMD Instinct MI350X-basiertes System – bis zu 1177 PFLOPS und 36,8 TB HBM3E-Speicher

Auf der Ausstellung Computex 2025 Pegatron zeigt einzigartige Rackmount-Lösung, das verwendet 128 AMD Instinct MI350X-Beschleuniger, entwickelt für ressourcenintensive KI-Inferenz- und HPC-Rechenaufgaben. Dieses massive System ist den proprietären Rack-Scale-Plattformen von AMD eine Generation voraus und wird die Grundlage für zukünftige MI450X-basierte Lösungen bilden, die im nächsten Jahr erwartet werden.

Pegatron

Modell Pegatron AS501-4A1/AS500-4A1 basiert auf acht 5U-Modulen, jedes mit einem Prozessor ausgestattet AMD EPYC 9005 und vier MI350X-Beschleuniger. Alle Computerkomponenten flüssigkeitsgekühlt, wodurch eine stabile Leistung auch bei hoher Belastung gewährleistet wird. Das Chassis wird im Format 51OU ORV3, wodurch es mit Rechenzentren kompatibel ist, die nach Standards gebaut wurden OCP (einschließlich Meta).

Die Gesamtsystemleistung erreicht 1177 PFLOPS im FP4-Modus, unter der Annahme einer nahezu linearen Skalierbarkeit. Jeder MI350X-Beschleuniger ist ausgestattet mit 288 GB HBM3E-Speicher, was insgesamt ergibt 36,8 TB ultraschneller Speicher – das ist mehr als aktuelle Lösungen auf Basis von Nvidia Blackwell. Dadurch kann es KI-Modelle verarbeiten, die nicht in das Gedächtnis anderer passen. GPU-Systeme.

Allerdings ist die Plattform verwendet nicht AMDs eigene Infinity Fabric-Switches, wie es von Nvidia mit NVLink implementiert wird, basiert aber auf Kommunikation über 400 GbE Ethernet zwischen den Gebäuden. Dies begrenzt die maximale Scale-up-Architektur auf 8 GPU, was die Effizienz bei hochsynchronisierten Aufgaben wie dem Trainieren großer LLM-Modelle verringert.

Die Lösung von Pegatron zeigt jedoch, wie Sie können eine produktive und speicherreiche GPU-Cluster basierend auf AMD Instinct, geeignet für parallele Inferenz, skalierbare Aufgaben und Architektur-Prototyping. Das System wird innerhalb der OCP-Community bereits eingesetzt und dient als Grundlage für die Entwicklung zukünftiger Lösungen. AMD Instinct MI450X, einschließlich der kommenden IF64- und IF128-Konfigurationen.