OpenUSD Core 1.0, WWDC-Vorschau & Reality Composer Pro 3

OpenUSD Core 1.0, WWDC-Vorschau & Reality Composer Pro 3 — USD-Updates

Ein Update nach ca. einem halben Jahr Pause: Gerhard Schröder und Thomas Kumlehn wieder live — kurz vor der WWDC 2026.

Worum es geht

Zum ersten Mal seit Weihnachten 2024 sind Gerhard und Thomas wieder gemeinsam online — diesmal mit einem technischen Upgrade: Thomas ist als Persona über die Apple Vision Pro zugeschaltet, Gerhard in seinem Homeoffice in Velbert. Das gibt dem Gespräch sofort einen praktischen Unterton: Spatial Computing ist nicht Zukunft, sondern Arbeitsmittel.

Der Ausgangspunkt ist die wichtigste Meldung aus dem OpenUSD-Ökosystem der letzten Monate: Am 17. Dezember 2025 hat die Alliance for OpenUSD (AUSD) ihre Core Specs 1.0 verabschiedet — die definitive Grundlage für den Weg zum Industriestandard. Gleichzeitig läuft der OpenUSD-Pixar-Standard schon bei Version 26.05 Beta. Thomas erklärt den Unterschied: Die 1.0 ist eine Meilensteinzusammenfassung der Dachorganisation, die jetzt durch Spezialisten für Industriestandard-Dokumentation aufbereitet wird. Eingereicht zum eigentlichen ISO-ähnlichen Industriestandard wird erst eine spätere Version.

Dann die WWDC-Vorschau: Thomas hat eine Wunschliste für Reality Composer Pro 3 — die intern bei Apple schon längst existierende Version 3, die durch versehentliche Hinweise in Fehlermeldungen aufgetaucht ist. Ganz oben: Mesh Instancing direkt in USD (paralleles Rendern identischer Geometrien auf GPU-Ebene statt sequenzieller Draw Calls), Hover- und Manipulation-Components als USD-Datenstrukturen, und eine Spatial-Version des Tools, die direkt auf der Vision Pro in 3D bearbeitet werden kann. Außerdem steht auf der Liste: Displacement Maps — ein neues Kompressionsverfahren der Alliance for Open Media macht OpenUSD-Meshes bis zu 42% kleiner als Draco (GLTF-Standard), was Apples jahrelangem Argument für SubD-Oberflächen eine neue Schlagkraft verleiht.

Zum Abschluss zwei Ausblicke in Zukunftstechnologien: Der CSS-Spatial-Vorschlag von W3C-Konsortiumsmitgliedern aus dem Apple-Umfeld — Webseiten, die selbst steuern, welche Elemente räumlich vor oder hinter der Seite schweben — und Gerhards eigenes Open-Source-Vibe-Coding-Projekt Mosaic 2.0: eine Apple-Vision-Pro-App, die nahtlose Übergänge zwischen Webseiten mit Web-Backdrops ermöglicht. Meta hat das Metaverse versprochen und nicht geliefert. Apple liefert es gerade still als Nebenprodukt.

USD-Updates – Direkt auf YouTube: youtube.com/watch?v=qhWnd3QpIQU

Kapitel

00:00 Intro — Update nach einem halben Jahr
02:00 Thomas' neues Setup: Apple Vision Pro im Livestream
03:30 OpenUSD Core 1.0 — was wurde verabschiedet?
06:00 Pixar-Versionsnummer 26.05 vs. AUSD Core 1.0 erklärt
07:50 Stichwort RCP3 — Reality Composer Pro 3
09:00 Was ist Reality Composer Pro? (Xcode-Produktfamilie)
11:00 Version 3 intern bei Apple schon im Einsatz
13:00 Wunsch: Spatial-Editing direkt auf der Vision Pro
15:00 Hover- & Manipulation-Components in USD
18:00 Mesh Instancing — Parallelisierung via GPU erklärt
22:00 Mesh-Komprimierung: Draco vs. neues OpenUSD-Verfahren
26:00 USD kann Vierecke — GLTF nur Dreiecke (der hingende Vergleich)
29:00 Alliance for Open Media: 42% effizienter als Draco
31:00 Displacement Maps — das fehlende Häkchen in der Tabelle
35:00 Apple liefert Displacement erst wenn alle Geräte schnell genug
38:00 Verschiedene Renderer: Scene Kit, Reality Kit, Storm
40:00 WWDC-Plan: Keynote-Livestream + USD-Deep-Dive eine Woche später
43:00 CSS Spatial — W3C-Vorschlag für räumliche Webseiten
46:00 Android XR vs. Apple: KI-gesteuert vs. Webseiten-kontrolliert
49:00 Mosaic 2.0 — Gerhards Vibe-Coding-Projekt (Open Source)
52:00 Web Backdrops: 3D-Szene statt Hintergrundbild, bis 3m begehbar
55:00 Meta-Versprechen Metaverse vs. Apples stilles Nebenprodukt

Erwähnt

  • Alliance for OpenUSD (AUSD) — Core Specs 1.0 (17. Dezember 2025)
  • OpenUSD 26.05 Beta (Pixar Animation Studios)
  • Reality Composer Pro 3 (intern bei Apple)
  • RealityKit (Apple Framework)
  • Christian Dias — Clone von Reality Composer Pro (Open Source, GitHub)
  • Draco (Google, Mesh-Komprimierung für GLTF)
  • Alliance for Open Media — neue Mesh-Quantisierung für OpenUSD
  • IGUS-AR-Projekt (viSales — Mesh Instancing Beispiel)
  • CSS Spatial — W3C-Vorschlag
  • Android XR (Google)
  • Web Backdrops / Environments (visionOS)
  • Mosaic 2.0 — Gerhards Open-Source-Vibe-Coding-Projekt (GitHub)
  • EnBW Ladepark — Website Environment Demo

Transkript (KI-bereinigt)

Hallo und herzlich willkommen zu einer neuen Folge USD Updates oder auch OpenUSD Updates. Das ist ja inzwischen auch schon wieder eine Weile her, dass wir den Namen ergänzen mussten, weil da hat sich was getan. Für alle die nicht wissen, worum es überhaupt geht: es geht um 3D-Datenstandard, einfach umschrieben, mit dem Namen OpenUSD — und das Dateiformat dazu ist USDZ.

Wir wollen jetzt ein Update machen — und zwar ein Update zu einer Folge von vor ungefähr einem Jahr, weil so lange ist es her, dass Thomas und Gerd gemeinsam dazu online waren.

Thomas sitzt gerade unten bei Stuttgart, ich bin hier oben bei Bochum, bei Essen, in Velbert. Und damals haben wir das immer so gelöst, dass wir beide im Zoom-Call zusammengeschaltet waren. Wir haben das Ganze jetzt mal aufgerüstet. Thomas nimmt damit mit seiner Persona und seiner Apple Vision Pro gerade so gesehen Anschluss an uralte Zeiten.

Von unserem letzten Gespräch — ich habe jetzt nochmal nachgeschaut — Weihnachten 2024. Heute haben wir uns wieder mal nach dieser langen Phase einen kurzen Up-to-Date vorbereitet. Kurz zum Einstieg: Thomas hatte im letzten Jahr einen Talk, den wir auch aufgezeichnet hatten in Bochum, wo er über die Roadmap der AUSD gesprochen hat. Und inzwischen ist diese von ihm skizzierte Roadmap auch Realität geworden. Im Dezember 2025, am 17. Dezember genau genommen, hat die Alliance for OpenUSD ihre offizielle Version 1.0, ihre Core Specs definiert.

Das ist so gesehen die Grundlage für das Stichwort Industriestandard, damit auch alle in die gleiche Richtung marschieren können. Tatsächlich ist aber der OpenUSD-Standard aktuell bei der 26.05 Beta.

Thomas, wo ist ein Unterschied zwischen 1.0 Core und 26 irgendwas? Das eine ist die offizielle Versionsnummer, die alle paar Monate wechselt, weil immer dann eine neue Version von dem Hauptentwicklungsstudio namens Pixar Animation Studios kommt. Die zählen in ihren Releases jahresmäßig und dann die nächste Zahl hinter dem Punkt ist dann der nächste Monat — deswegen Mai 2026.

Das USD-Projekt ist ja aus dem Firmenstandard entstanden und dann wurde versucht, das Ganze so glatt zu ziehen, dass es auch zu einem Industriestandard gemacht werden kann. Und in dem Prozess fielen halt manche Sachen auch auf. Man gibt den Core 1.0 jetzt erstmal an erfahrene Spezialisten — Anwalts- und Technik-Documentation-Spezialisten, die gewohnt sind, in Industriestandard-Sprache zu formulieren und zu dokumentieren. Das wird jetzt zurechtgezurrt. Zum Industriestandard wird wahrscheinlich erst die 1.1 oder 1.2 eingereicht.

Dann das erste Stichwort auf unserer Liste: RCP3. Der Reality Composer Pro ist von Apple — ein Apple-Tool, ein Apple-Programm, eine Anwendung, die Teil der Entwicklungsanwendung namens Xcode ist. Der Reality Composer war ursprünglich eine Anwendung, die es ermöglichen sollte, 3D-Szenen für rein Augmented Reality, für den Gebrauch in AR-Quicklook zu bauen. Der Reality Composer Pro, das war dann eine Namensänderung mit Versionsnummer 2.0, war dann zusätzlich noch für das Vorbereiten von 3D-Daten für immersive oder Spatial Apps.

Es ist durchgesickert, dass Apple schon seit fast einem Jahr intern mit der Version 3 schon arbeitet, weil bei bestimmten Fehlermeldungen für Version 2 kam dann knapp: oh, das ist in der Version 3 gefixt. Und alle sagen, wir haben aber keine 3, wo bleibt die?

Mein Wunsch: wenn sie schon so viel Arbeit reingesteckt haben, mit Vorbereitung für Spatial Computing, dass es auch eine Version gibt, die Spatial arbeitet — dass es auf der Vision Pro funktioniert. Dann sieht man sofort räumlich die Szene oder die Unterszene, die man gerade bearbeitet. Das macht das Arbeiten schneller.

Dann: Hover, Manipulation, Mesh Instances. Es gibt in den Programmierframeworks von Apple, also dem RealityKit, einige Sachen, die haben es nicht herübergeschafft in den Reality Composer Pro. Die muss man in Swift direkt von Hand programmieren. Das bedeutet, man kann es nicht für AR-Quicklook benutzen, weil für AR-Quicklook braucht man eine USDZ-Datei.

Mesh Instances: Ich habe eine Maschine, die ist intern zusammengeschraubt, da sind hunderte von Schrauben. Der Normalfall ist, jede Schraube bekommt einen eigenen Draw Call. Wenn ich das hunderte Male mache, dann ruckelt es. Die USD-Strategie sind Instanzen: Es gibt eine Master-Schraube im Speicher und der Rest sind nur Pointer darauf — nicht hundertmal dasselbe speichern.

Und dann hat Apple gesagt: Wir haben doch diese modernen GPU-Kerne. Mit Mesh Instancing sagt man: Die Schraube soll 100 Mal an verschiedenen Positionen kommen. Dann kann die Masse der GPU-Kerne parallel darauf angesetzt werden — ein gemeinsamer einzelner Draw Call. Das geht in Swift zu programmieren, fehlt aber noch als USD-Komponente.

Mesh-Komprimierung: GLTF kann nur Dreiecke. USD kann Vierecke und Dreiecke — dieser Vergleich hat immer gehinkt. Draco ist der Google-Kompressionsstandard für GLTF-Meshes. Jahrelang haben alle gesagt: GLTF kann das, USD kann das nicht. Die Alliance for Open Media hat jetzt im November eine Quantisierung ähnlich wie Draco für OpenUSD Open Source gemacht — bis zu 42 Prozent effizienter. Eine kleinere Datei heißt schnellere Übertragung vom Server. Und zeitgleich hat Apple Displacement Maps angekündigt: Apple konvertiert hochkomplexe Oberflächen in eine glatte Grundgeometrie plus eine extrem fein aufgelöste Displacement Map. Wird lokal auf dem Gerät zur Laufzeit neu tesselliert. Alles was nicht zu sehen ist, wird gar nicht angefasst.

Dann steht noch CSS Spatial auf unserer Liste. Der CSS-Standard ist Teil der Web-Initiativen. Apple hat vor Jahren die Expertin, die damals den Webstandard für Spatial und WebXR betreut hat — eine frühere Samsung-Mitarbeiterin — überzeugt, für sie zu arbeiten. Die hat jetzt mit Kollegen vorgeschlagen: Wie könnte CSS ergänzt werden, damit es auch räumlich wirkt auf Geräten, die das können? Damit Webseitenbesucher auf der Vision Pro sehen, welcher Teil der Seite vorne, welcher hinten ist — gesteuert vom Webseitenbetreiber selbst, nicht durch KI auf dem Gerät. Kein Standard — bis solche Vorschläge verabschiedet sind, vergehen typischerweise ein paar Jahre.

Und zum Abschluss mein Vibe-Coding-Projekt: Es gibt Environments für die Apple Vision Pro — 3D-Szenen, die dich umgeben. Das kann das Betriebssystem mitliefern, eine App, oder eine Webseite. Das heißt Web Backdrop. Ich habe mir überlegt: Was wäre, wenn ich nahtlos von Webseite zu Webseite in verschiedene Räume reisen kann? Reines Vibe-Coding-Projekt, auf GitHub. Ich habe es Mosaic 2.0 genannt — in Anlehnung an einen uralten ersten Internetbrowser. Eine Technikdemo: von Webseite zu Webseite im 3D-Raum reisen. Keine App nötig. Meta hat das Metaverse versprochen und bis heute nicht geliefert. Apple liefert es gerade als Nebenprodukt — ohne es so zu nennen.

Fragen zur Folge

Was ist OpenUSD Core 1.0 und warum ist das wichtig?

Am 17. Dezember 2025 hat die Alliance for OpenUSD (AUSD) die Core Specs 1.0 verabschiedet — die Grundlage für einen offiziellen Industriestandard. Zum Industriestandard eingereicht wird erst Version 1.1 oder 1.2, sobald Anwaltskanzleien und Documentation-Spezialisten die Texte in die richtige Standardsprache gebracht haben. Der laufende OpenUSD-Standard von Pixar ist derweil schon bei Version 26.05 Beta.

Was ist Reality Composer Pro 3 und was erhofft sich Thomas davon?

Reality Composer Pro ist Apples visuelles 3D-Authoring-Tool für visionOS-Apps. Die Version 3 ist intern bei Apple schon im Einsatz — bekannt durch versehentliche Hinweise in Fehlermeldungen. Thomas wünscht sich: Mesh Instancing direkt in USD (Parallelisierung via GPU statt einzelner Draw Calls), Hover- und Manipulation-Components direkt als USD-Komponenten, und vor allem eine Spatial-Version, die auf der Apple Vision Pro direkt in 3D bearbeitet wird.

Was ist (USD-)Mesh-Komprimierung und was hat das mit glTF-Draco zu tun?

Draco ist Googles Open-Source-Kompressionsstandard für 3D-Meshes im GLTF-Format, der GLTF jahrelang einen Vorteil bei Dateigrößen verschaffte. Die Alliance for Open Media hat im November 2025 eine eigene Mesh-Quantisierung für OpenUSD veröffentlicht — bis zu 42% effizienter als Draco, für Vierecks-Polygone optimiert statt rein für Dreiecke.

Was ist CSS Spatial und was bedeutet das für Webseiten?

Ein Vorschlag von Apple-nahen W3C-Konsortiumsmitgliedern: CSS soll um räumliche Eigenschaften erweitert werden, damit Webseiten-Betreiber selbst steuern können, welche Elemente einer Seite bei der Darstellung in Spatial-Computing-Geräten (Vision Pro, Android XR usw.) vor oder hinter der Seite schweben. Noch kein Standard — bis zur Verabschiedung vergehen typischerweise mehrere Jahre.

CSS Spatial: Wenn Apple das Web in den Raum holt

Was ist das Mosaic 2.0 Vibe-Coding-Projekt?

Gerhard hat als Open-Source-Vibe-Coding-Projekt eine App für die Apple Vision Pro gebaut, die nahtlose Übergänge zwischen verschiedenen Webseiten mit Web Backdrops ermöglicht — also zwischen 3D-Umgebungen, die Webseiten als USDZ im HTML-Header mitliefern. Name in Anlehnung an Mosaic, den ersten grafischen Webbrowser. Auf GitHub veröffentlicht.

Mosaic 2: Spatial Web Browser für visionOS 26. Alpha auf GitHub

Read more

Fallbeispiel DeterTech: Wie Animationsvideo & AR Entscheidungen im Vertrieb vorbereiten

Fallbeispiel DeterTech: Wie Animationsvideo & AR Entscheidungen im Vertrieb vorbereiten

* Visuelle Werkzeuge wie 3D-Animationen und AR helfen dort, wo Entscheidungen vorbereitet werden, d.h. sie schaffen ein "gemeinsames mentales Modell", bevor über konkrete Details gesprochen wird. * Im Fallbeispiel von DeterTech wurde eine bestehende 3D-Datenbasis pragmatisch genutzt, um AR-Modelle bereits vor Ort = im Vertrieb einzusetzen, wodurch Abstimmungen direkt möglich

By Gerhard Schröder

2 Minuten statt 2 Stunden: Warum Time-to-Understanding eigentlich die wichtigste Metrik im B2B-Vertriebsgespräch ist

* Time-to-Understanding (TTU) misst, wie lange ein Käufer braucht, um ein erklärungsbedürftiges Produkt wirklich zu verstehen — nicht zu nicken, sondern es selbst erklären zu können. * Erklärungsintensive Produkte verlieren Aufträge nicht am Preis, sondern an der Verständnislücke — der Käufer kauft beim Wettbewerber, dessen Produkt früher eine Schublade im Kopf findet. * Visualisierung verkürzt

By Gerhard Schröder
Warum ich keine KI-Buttons auf die viSales-Startseite baue (jedenfalls so nicht)

Warum ich keine KI-Buttons auf die viSales-Startseite baue (jedenfalls so nicht)

* KI-Buttons auf der B2B-Startseite klingen modern, schwächen aber oft die Positionierung, d.h. der Sparringspartner kommodifiziert sich selbst. * Conversion-Leak und Brand-Voice-Verlust sind die größten Risiken, wenn der User in einen externen ChatGPT/Claude/Perplexity-Tab abspringt. * Eigener Chat statt externer Buttons plus GEO-Hebel über llms.txt ist der saubere Weg — UX-Risiko

By Gerhard Schröder

viSales GmbH – Agentur für 3D-Visualisierung, Augmented Reality & Digital Twin auf OpenUSD-Basis – Bochum, NRW · 44789