USDZ vs glTF — Unterschiede der AR-Dateiformate

USDZ vs glTF — Unterschiede der AR-Dateiformate

„Die Zukunft des HTML — das dreidimensionale Internet wird nicht mehr mit HTML gebaut, sondern mit USD.”

USDZ und glTF: zwei Open-Source-Standards, zwei verschiedene Welten — Gerhard erklärt den Unterschied:

  • glTF aus der Browser-Welt: klein, kompakt, für einfache 3D-Objekte im Web
  • USD aus der Filmwelt: Pixars Lösung für Interoperabilität zwischen Animationsstudios
  • Was USD kann, was glTF nicht kann: Animationen, Logik, Multi-Objekt, Container
  • Skalierbarkeit von USD: vom iPhone bis zum Flugzeugträger in einer Datei
  • Metaverse-Standard: warum beide Formate koexistieren und USD die zentrale Basis ist
Was sind USD-Updates?

Kurze Videos und Talks von Gerhard Schröder rund um OpenUSD, USDZ und Augmented Reality im Apple-Universum — seit 2022.

Alle USD-Updates

Worum es geht

USDZ und glTF — das klingt nach Tech-Abkürzungen ohne Bedeutung. Aber hinter beiden steckt eine Geschichte, die erklärt, warum die eine Technologie für komplexe AR-Anwendungen geeignet ist und die andere nicht.

glTF entstand 2015 in der Browser-Welt: das Ziel war kleinstmögliche 3D-Dateien für das Web. Es kann einfache Geometrien, Oberflächeneigenschaften, grundlegende Darstellung. Alles, was darüber hinausgeht, muss über den Browser geladen werden. USD dagegen entstand bei Pixar — als Lösung für den Workflow-Alptraum großer Animationsstudios, wo viele verschiedene Softwaresysteme Daten austauschen müssen, ohne Verluste. USD wurde 2016 vorgestellt, von vornherein auf Mobilgeräte und Skalierbarkeit ausgelegt.

Der Unterschied im Feature-Set ist fundamental: glTF kann ein einzelnes 3D-Objekt. USD kann das auch — plus vollständige Animationen, Logik, Multi-Objekt-Szenen, Container-Format, und massive Skalierbarkeit. Von einem Stuhl auf dem iPhone bis zur kompletten Konstruktionsdaten eines Flugzeugträgers. Und laut Jensen Huang, Nvidia-CEO, ist USD die Grundlage des dreidimensionalen Internets.

Kapitel

  • 0:00 — Intro: USDZ und glTF — eine kleine Geschichte, die mit einer Bürolampe anfängt
  • 1:00 — Pixars Problem: Interoperabilität zwischen Animationssoftware
  • 2:00 — USD: Universal Scene Description, 2016 vorgestellt
  • 2:45 — glTF: der Browser-Standard von 2015
  • 3:30 — Was glTF kann — und wo es aufhört
  • 4:15 — Was USD / USDZ darüber hinaus kann: Animationen, Logik, Container
  • 5:30 — Live-Beispiel: kompletter Bürostuhl-Konfigurator in einer USDZ-Datei
  • 6:15 — Skalierbarkeit: vom iPhone bis zum Flugzeugträger
  • 7:15 — Metaverse-Standard: USD als zentrale Basis, glTF als Ergänzung

Erwähnt

Typische Fragen

Was kann USDZ, was glTF grundsätzlich nicht kann?

USDZ basiert auf Pixars Universal Scene Description und unterstützt vollständige Animationen, Logik (Wenn-Dann-Maschinen), Multi-Objekt-Szenen und Container-Format für mehrfach verwendbare Objekte. glTF kann ein einzelnes 3D-Objekt mit Oberflächeneigenschaften darstellen — alles darüber hinaus muss über den Browser nachgeladen werden. Für einen interaktiven Produktkonfigurator ist glTF deshalb ungeeignet.

Kann ich eine USDZ-Datei auf verschiedenen Geräten nutzen — vom iPhone bis zur VR-Installation?

Ja. Das USDZ-Format (Z = ZIP) kann in einer Datei verschiedene Detailstufen enthalten. Das iPhone lädt nur, was es darstellen kann. Eine VR-Installation oder Nvidia Omniverse nimmt dieselbe Datei und nutzt höhere Detailstufen. Diese Skalierbarkeit — von der Maschine in der Hosentasche bis zu ganzen Städten oder Flugzeugträgern — ist einer der zentralen Vorteile gegenüber glTF.

Warum ist USD die Basis des Metaverse-Standards — und nicht glTF?

Das Metaverse Standards Forum berücksichtigt beide Formate: USD als zentrale Basis für komplexe 3D-Szenarien, glTF als Ergänzung für webbasierte Ausgabeformate. Nvidia-CEO Jensen Huang formulierte es so: Das dreidimensionale Internet wird nicht mehr mit HTML, sondern mit USD gebaut. glTF fehlen die nötigen Features für Interoperabilität auf diesem Niveau.

Wozu brauche ich einen Dienstleister, wenn glTF einfacher zu handhaben ist?

glTF ist tatsächlich einfacher für einfache Webdarstellungen. Sobald aber Konfiguratoren, Animationen, Logik oder skalierbare Produktdaten gefragt sind, reicht glTF nicht aus. Dann braucht es USD — und damit strukturierte Masterdaten, korrekte Konvertierung aus CAD sowie Qualitätssicherung auf Zielgeräten. Genau das ist der Kern der viSales-Arbeit.

Lohnt es sich jetzt in OpenUSD zu investieren — oder ist der Standard noch zu früh?

OpenUSD ist seit 2016 produktionsreif, wird von Apple, Nvidia und Siemens aktiv eingesetzt und ist die Grundlage von AR Quick Look auf jedem iPhone. Wer heute in OpenUSD-Masterdaten investiert, schafft Assets, die sich auf WebApps und WebXR erweitern lassen — sobald glTF 2.1 (geschätzt 2027) nachzieht. Die Investition ist keine Sackgasse, sondern ein Vorsprung.

Einordnungsgespräch buchen

Transkript (KI-bereinigt)

USDZ und glTF — das hört sich an wie Textteile aus irgendeinem Rap-Song von den Fantastischen Vier — hat damit aber gar nichts zu tun. Sondern das sind zwei verschiedene Technologien, die Abkürzung dafür, für Augmented-Reality-Inhalte im Internet.

Wir gehen jetzt mal zurück in das Jahr 2015. Ich erzähle einfach mal, wie das Ganze zusammenhängt und warum wer was da gemacht hat. Eine kleine Geschichte, die mit einer Bürolampe anfängt. Vielleicht kennt der eine oder andere diese Bürolampe: Pixar.

Pixars Problem: Interoperabilität

Das Animationsstudio unter anderem von dem Film Toy Story — und gerade aktuell von diesem Buzz Lightyear Film. Dieses Animationsstudio und alle anderen Unternehmen aus der gleichen Branche haben alle das gleiche Problem: Die nutzen nicht nur eine einzige Software, um diese tollen computeranimierten Filme herzustellen. Sondern verschiedene Software-Systeme, weil das kann der eine gut, das kann der andere gut.

Das hat einen Nachteil. Ich habe Dateien, die ich mit Software A bearbeitet habe. Die muss ich so speichern, dass ich sie in Software B weiterverarbeiten kann. Und dieses Zusammenarbeiten ist ein bisschen problematisch — man muss manchmal ein bisschen mit der Brust durchs Auge nach hinten um die Ecke über die Software speichern. Diese ganzen Zwischenschritte kosten erstens Zeit, zweitens Geld, drittens läuft nicht alles rund. Fehler will keiner haben.

Das führte zur Entwicklung eines Datei-Standards für 3D-Daten. Der Standard nennt sich USD — Universal Scene Description. Von Pixar, so gesehen, auf den Weg gebracht mit dem Gedanken: ich muss viele verschiedene Dateien von verschiedenen Software-Systemen zusammenbekommen, Schnittstellen bilden.

Die Leute von Pixar wollten ja nicht nur etwas haben, was für große Animationsstudios funktioniert, sondern gleich von vornherein auch für das Smartphone. Dieser Standard ist auch sehr stark darauf getrimmt, effizient zu sein und interoperabel. 2016 wurde er offiziell vorgestellt.

glTF: der Browser-Standard von 2015

2015 wurde ein Standard vorgestellt aus einer ganz anderen Ecke — der Standard heißt glTF. Dieser Standard für 3D-Daten hat folgendes Mindset: Er kommt aus der Welt der Internetbrowser. Das heißt, ich muss 3D-Daten von vornherein ganz, ganz klein komprimieren — so ähnlich wie ich einen TIFF zu einem JPEG komprimiere.

Dieses Dateiformat glTF kann also sehr kleine kompakte Dateien erzeugen — was USDZ übrigens auch kann. Und da ist das Ende: glTF kann 3D-Daten darstellen, kann die entsprechenden Oberflächen und kann Zusatzinformationen zu Oberflächen — wie Rauheit oder Glanz — im Dateisystem speichern. Wenn ich also ein einzelnes 3D-Objekt habe, wie zum Beispiel so eine Tasse — mit dem Glanz und allem passt rein. Super.

Alles Weitere wird nicht mehr in dieser Datei gespeichert, sondern sind Zusatzinformationen, die mit dem Browser mit jeder Anwendung neu heruntergeladen werden müssen.

Was USD / USDZ darüber hinaus kann

Kommen wir jetzt zum Standard USD. USD kann das alles auch — kann aber noch mehr. Ich kann auch komplexe und komplette Animationen in diesem Dateiformat mitspeichern. Was passiert mit der Tasse? Rutscht die von A nach B über meinen Tisch, oder kriegt die Beine? Alles Mögliche. Und ich kann die Information der Logik mitspeichern: Hat dieses Objekt noch eine Funktion, so eine berühmte Wenn-Dann-Maschine? Wenn ich jetzt hier auf den Bildschirm tippe — was passiert dann?

Ein Beispiel: hier als QR-Code eingeblendet — ein kompletter Bürostuhl-Konfigurator, komplett in einer kleinen 3D-Datei. Alles enthalten. Funktioniert über den eben angesprochenen AR Quick Look als Ausgabesystem auf dem iPhone und iPad.

USD bietet auch die Möglichkeit als Container-Format. Das heißt, ich brauche nur ein 3D-Objekt einmal in dieser ZIP-Datei abspeichern und kann es mehrfach in der Szene verwenden. Oder ich kann Objekte auch einzeln positionieren. Beispiel: Stuhl, Sofa, Hocker — ich kann sie alle einzeln bewegen. Das sind echt große Vorteile.

Skalierbarkeit: vom iPhone bis zum Flugzeugträger

Und jetzt kommen wir zur echten Magie — zum Thema Skalierbarkeit. USD ist in der Lage, auf einem kleinen Mobiltelefon zu funktionieren, mit den dort begrenzten Rechenkapazitäten. Aber wenn ich richtig große 3D-Szenarien verwalten will — ganze Städte, Konstruktionsdaten vom Haus oder von der ganzen Stadt oder vom Flugzeugträger — dafür ist natürlich ein Smartphone nicht mehr in der Lage. Aber das Dateiformat von USD ist in der Lage, von bis alles abbilden zu können.

Das jeweilige Ausgabegerät — meine VR-Brille oder mein iPhone — sucht sich die entsprechenden Informationen aus dem Gesamtpackage heraus, die es brauchen kann. Das ist natürlich nicht beliebig skalierbar — ich kann nicht eine ganze Stadt auf das Handy bekommen. Aber das generelle System ist verdammt flexibel.

Metaverse-Standard: USD als Basis

Beide sind Open-Source-Standards. Beide werden auch von der Metaverse-Standardisierungsgruppe im Rahmen ihrer Definition für das Metaverse — nicht das Metaverse von Mark Zuckerberg, sondern die Gesamtidee — berücksichtigt. USD ist dabei die zentrale Basis, und für gewisse webbasierte Ausgabeformate gibt es dann noch glTF als Ergänzung.

Das heißt, egal in welcher Zukunft wir uns bewegen des dreidimensionalen Internets — ob das jetzt Metaverse heißt oder nicht — USD ist eine zentrale Kerntechnologie.

Es gibt eine berühmte Aussage vom Geschäftsführer von Nvidia, von einer Keynote, wo er gesagt hat: Die Zukunft des HTML — das dreidimensionale Internet wird nicht mehr mit HTML gebaut, sondern mit USD. Ich kann nur sagen: Sieht ganz danach aus.

Wenn Sie jetzt in einem entsprechenden Unternehmen tätig sind und sich Gedanken machen, sollte ich mich über dieses Thema beschäftigen — kann ich nur sagen: ja, machen Sie das. Wenn Sie Fragen haben, einfach melden. Auf den üblichen Kanälen. Ich sage vielen Dank. Over and out.

Häufige Fragen

Was ist der Ursprung von USD und warum wurde es entwickelt?

USD — Universal Scene Description — wurde von Pixar entwickelt, um das Interoperabilitätsproblem großer Animationsstudios zu lösen: Viele verschiedene Softwaresysteme mussten Dateien austauschen, ohne Qualitäts- und Datenverluste. USD wurde 2016 offiziell vorgestellt und von vornherein für Mobilgeräte und Skalierbarkeit ausgelegt.

Was ist der Ursprung von glTF und wofür ist es optimiert?

glTF kam 2015 aus der Browser-Welt. Das Mindset: 3D-Daten müssen so klein wie möglich komprimiert werden, damit sie im Web schnell laden. Es unterstützt einfache Geometrien und Oberflächeneigenschaften gut — alles Weitergehende wie Animationen, Logik oder Szenen-Komposition kommt nicht mit.

Was kann USD / USDZ, was glTF nicht kann?

USD unterstützt komplexe Animationen, Logik (Wenn-Dann-Maschinen), Multi-Objekt-Szenen mit einzeln positionierbaren Objekten, Container-Format für mehrfach verwendbare Objekte und massive Skalierbarkeit — von Smartphone bis zu Flugzeugträgern oder ganzen Städten. Das alles ist in glTF nicht vorgesehen.

Wie skaliert USD von Smartphone bis zum Supercomputer?

Das USDZ-Format (Z = ZIP) kann in einer Datei verschiedene Detailstufen für verschiedene Ausgabegeräte enthalten. Das iPhone lädt nur, was es darstellen kann. Eine VR-Installation oder Nvidia Omniverse nimmt dieselbe Datei und nutzt höhere Detailstufen. Das generelle System ist flexibel — von Mobilgerät bis Nvidia Omniverse.

Welche Rolle spielen glTF und USD im Metaverse-Standard?

Beide Formate werden von der Metaverse-Standardisierungsgruppe berücksichtigt. USD ist dabei die zentrale Basis — und für webbasierte Ausgabeformate ergänzt glTF. Nvidia-CEO Jensen Huang sagte in einer Keynote, das dreidimensionale Internet werde nicht mehr mit HTML, sondern mit USD gebaut.