Nvidia präsentiert revolutionäres Weltmodell für Physik-KI-Entwicklung – Neue Ära der Robotik und autonomen Fahrzeuge?
2025-01-07
Autor: Sofia
Nvidia hat mit der Einführung von Cosmos eine bahnbrechende Plattform für Welt-Grundlagenmodelle entwickelt. Diese neue Technologie ist darauf ausgelegt, KI-Anwendungen zu fördern, die ein tiefes Verständnis von physikalischen Prinzipien besitzen. Dadurch können sie in verschiedenen Bereichen, insbesondere in der Robotik und bei autonomen Fahrzeugen, eingesetzt werden. Aber das ist noch nicht alles – Nvidia hat auch eine neue Familie von Sprachmodellen namens Nemotron vorgestellt, die entwickelt wurde, um KI-Agenten für Unternehmen zu schaffen. Diese Agenten könnten in Bereichen wie Kundensupport, Betrugserkennung und der Verwaltung von Lieferketten und Beständen eingesetzt werden.
Nvidias Weltmodell generiert präzise Trainingsdaten für Physik-KI
Die Entwicklung von KI-Modellen, die mit physikalischen Konzepten vertraut sind, erfordert eine enorme Menge an Trainingsdaten. Cosmos ermöglicht es Entwicklern, durch die Eingabe von Text, Bildern, Videos sowie Sensor- und Bewegungsdaten physikalisch akkurate Trainingsvideos zu generieren. Diese dürfen als Ersatz für Tests in der realen Welt genutzt werden. Darüber hinaus können in Nvidias Omniverse geschaffene 3D-Szenarien auch in Videos konvertiert werden. Nvidia verspricht, dass Cosmos durch die Nutzung von Nvidia Blackwell in der Lage ist, innerhalb von nur zwei Wochen 20 Millionen Stunden Videomaterial zu verarbeiten – eine beispiellose Effizienz!
Die Modellfamilie umfasst nicht nur das große Sprachmodell Llama Nemotron, sondern auch Cosmos Nemotron, ein visuelles Sprachmodell, welches auf die leistungsstarken Erkennungs- und Analysefähigkeiten von Cosmos zurückgreift.
Diese Kombination ermöglicht es Unternehmen, KI-Anwendungen zu entwickeln, die beispielsweise aktuelle Lagerbestände über Kameras erfassen und automatisiert überprüfen.
KI-Vorlagen für eine neue Dimension der Anwendungsfälle
Neben den neuen KI-Modellen hat Nvidia auch eine Vielzahl von Vorlagen, sogenannten Blueprints, für KI-Agenten vorgestellt. Einige dieser Vorlagen wurden in Zusammenarbeit mit Partnern entwickelt und decken gängige Anwendungsfälle ab. Diese Vorlagen erleichtern es Entwicklern, maßgeschneiderte KI-Anwendungen für Unternehmen zu erschaffen, ohne dass sie die Grundfunktionen selbst programmieren müssen. Eine besonders interessante Vorlage stellt die Umwandlung von PDF-Inhalten in Podcasts dar. Ein KI-Agent, der auf dieser Vorlage basiert, kann Texte, Tabellen und Grafiken aus PDF-Dateien vereinen und den Nutzern als informative Monologe oder Dialoge zur Verfügung stellen. Nvidia betont, dass damit das Lernen für Anwender effizienter und individueller gestaltet werden kann.
Entwickler können diese Blueprints auf verschiedenen Plattformen, seien es Endgeräte, Rechenzentren oder Cloud-Lösungen, implementieren und anpassen.
Nvidia bietet ihre KI-Modelle in drei verschiedenen Größenordnungen mit 4 bis 14 Milliarden Parametern an.
Das kleinste Modell, Nano, ist für PCs und andere Endgeräte gedacht, während die Ultra-Version speziell für den Einsatz in Rechenzentren konzipiert ist. Trotz der Open-Model-Lizenz, die eine kommerzielle Nutzung erlaubt, sind die Cosmos- und Nemotron-Modelle nicht quelloffen. Unternehmen können diese Modelle in Zukunft über die Nvidia AI-Enterprise-Plattform und als Teil der NIM Microservices beziehen. Einige Modelle stehen bereits in einer Vorschau-Phase zur Verfügung.
Seien Sie gespannt auf die Entwicklungen von Nvidia, die die Grenzen der KI-Technologie weiter verschieben könnten!