
GB300 NVL72: Nvidia Blackwell Ultra mit beeindruckenden 288 GB HBM3e
2025-03-18
Autor: Sofia
Nvidia hat kürzlich auf der GTC 2025 die neueste Entwicklung der Blackwell-Architektur vorgestellt - die Blackwell Ultra. Diese neue GPU führt ein gewaltiges Upgrade ein, indem sie den Speicher um 50 Prozent auf bis zu 288 GB HBM3e vergrößert. Diese Maßnahme zielt darauf ab, Data-Center-Lösungen besser für die steigenden Anforderungen im Bereich der KI-Reasoning-Modelle, die höhere Verarbeitungsanforderungen bei der Inferencing aufweisen, auszurüsten.
Die B300-GPU ist eine Weiterentwicklung der im letzten Jahr auf der GTC präsentierten B200-GPU, mit der Nvidia die Blackwell-Architektur eingeführt hat – eine Architektur, die sich bereits als effizient und leistungsstark in Rechenzentren bewährt hat. Blackwell Ultra nutzt die gleiche Architektur und ist somit ebenfalls in zwei Dies unterteilt, die über einen innovativen Die-to-Die-Link miteinander verbunden sind.
Der Fokus auf KI-Reasoning
Blackwell Ultra wurde speziell für die anspruchsvollen Anforderungen beim Inferencing von KI-Reasoning-Modellen entwickelt, die in der Lage sein müssen, mehrere Hunderttausend Tokens pro Anfrage in Echtzeit zu verarbeiten und auszugeben. Diese Systeme sind darauf ausgelegt, dem Nutzer den Gedankengang hinter der Anfrage verständlich darzustellen, was eine erhebliche Erhöhung der Rechenleistung und Effizienz erfordert.
Erweiterte Speicherkapazitäten mit HBM3e
Um den steigenden Anforderungen gerecht zu werden, hat Nvidia den Speicher von Blackwell Ultra auf beeindruckende 288 GB HBM3e erhöht, was eine Steigerung von 192 GB bei der bisherigen Blackwell B200-GPU darstellt. Der High Bandwidth Memory wird dabei über acht Stapel um die GPU verteilt; die neue Architektur verdoppelt die Anzahl der DRAM-Chips pro Stapel auf 12, wodurch eine höhere Speicherdichte auf derselben Fläche erreicht wird.
Steigende FP4-Inferencing-Leistung
Laut Nvidia wird die Blackwell Ultra die 1,5-fache FP4-Inferencing-Leistung im Vergleich zu ihrer Vorgängergeneration erreichen, mit beeindruckenden 15 PetaFLOPS für FP4 Dense – das bedeutet ohne die Sparsity-Beschleunigung, die sogar 30 PetaFLOPS ermöglichen kann. Zum Vergleich: Die ursprüngliche Blackwell-GPU erreichte nur 10 PetaFLOPS.
GB300 NVL72: Eine Leistungsstarke Lösung
Die neue GB300 NVL72-Lösung, die in der zweiten Jahreshälfte 2025 verfügbar sein wird, ist eine Weiterentwicklung des beliebten Racks GB200 NVL72. Dieses Rack kombiniert 72 Blackwell-GPUs mit 36 Grace-CPUs im wassergekühlten Serverschrank. Bei GB300 NVL72 gibt es keine Veränderungen – 36 Boards mit je zwei GPUs und einer CPU bilden weiterhin das Rückgrat der Lösung. Ein GB300 NVL72 wird eine FP4-Leistung von insgesamt 1,1 ExaFLOPS erreichen und somit die Leistungsanforderungen extrem anspruchsvoller Rechenzentren erfüllen.
Erstklassiges NVLink für optimale Verbindung
Das NVLink der fünften Generation, das die verschiedenen Chips zu einer „großen GPU“ verbindet, erreicht eine Bandbreite von 1,8 TB/s pro GPU und insgesamt 130 TB/s. Diese Technologie ermöglicht es Nvidia, auch Multi-Node-Verbindungen zu verwirklichen, was zuvor nur mit InfiniBand möglich war und einen drastischen Anstieg der Leistung um das 18-fache bedeutet. Zusätzlich wird der NVLink Switch 7.2T in den Racks integriert, der über 50 Milliarden Transistoren verfügt und so für eine unvergleichbare Leistung sorgt.
HGX B300 für x86-Prozessoren
Nvidia bietet zusätzlich mit der HGX B300 NVL16 eine Lösung an, die ohne die hauseigene Arm-CPU auskommt. Diese Option bringt 16 B300-GPUs mit x86-Prozessoren zusammen, wobei sowohl AMD als auch Intel für die Prozessoren in Betracht gezogen werden.
Partnerschaften mit führenden Anbietern
Im ersten Schritt haben bedeutende Firmen wie Cisco, Dell und Hewlett Packard Enterprise bereits angekündigt, eine breite Palette von Blackwell-Ultra-Produkten anzubieten. Später werden auch Unternehmen wie Aivres und ASRock folgen. Unter den Cloud-Service-Anbietern, die Blackwell Ultra integrieren möchten, sind namhafte wie AWS, Google Cloud und Microsoft Azure. Diese breit angelegte Partnerschaft wird den Einsatz der neuen GPUs in verschiedensten Bereichen revolutionieren und die Möglichkeiten für innovative Anwendungen im Bereich der künstlichen Intelligenz erheblich erweitern.