OpenAI’s Sora: New AI Tool for Realistic Video Generation


OpenAI hat eine neue generative Künstliche Intelligenz namens Sora entwickelt, die realistisch wirkende Videos ohne Ton erstellen kann. Sora kann auf Anweisung bis zu 20 Sekunden lange Videos generieren. Der Dienst ist derzeit nur in Nordamerika verfügbar, wo bestehende ChatGPT-Abonnenten Anweisungen in Form von Text, Standbildern oder Videos eingeben können. Die Videos sind in einer Auflösung von bis zu 1080p verfügbar und können in quadratischem, hochkantem oder Querformat erstellt werden.

Zusätzlich zu Sora hat OpenAI ein kleineres Modell namens Sora Turbo veröffentlicht. Dieses Modell arbeitet schneller, erzeugt jedoch Videos von geringerer Qualität. Abonnenten von ChatGPT Plus können monatlich 50 Videos in niedriger Auflösung (480p) oder weniger Videos in mittlerer Auflösung (720p) generieren. Das ChatGPT Pro-Abonnement, das 200 Dollar kostet, erlaubt es Nutzern, zehnmal so viele Videos in höherer Auflösung und längerer Dauer zu bestellen. OpenAI plant, Anfang nächsten Jahres weitere Tarifmodelle einzuführen, um verschiedene Nutzergruppen anzusprechen.

Die von Sora erzeugten Videos variieren in ihrer Qualität. Einige sind beeindruckend realistisch, während andere offensichtliche Fehler aufweisen. OpenAI gibt zu, dass Sora nicht perfekt ist und oft unrealistische Physik darstellt oder mit komplexen Szenen Schwierigkeiten hat. Alle Videos sind mit einem Wasserzeichen der C2PA (Coalition for Content Provenance and Authenticity) versehen, und eine OpenAI-Animation ist sichtbar.

Es gibt strenge Regeln für die Nutzung von Sora. Der Upload von Aufnahmen Minderjähriger ist nicht gestattet. Bilder anderer Personen dürfen nur verwendet werden, wenn die abgebildeten Personen zugestimmt haben. Nutzer müssen bestätigen, dass sie über alle notwendigen Rechte verfügen. Gewaltdarstellungen und nicht jugendfreies Material sind verboten. Bei Verstößen gegen die Vorschriften kann der Zugang zu Sora gesperrt werden, ohne dass bereits gezahlte Gebühren zurückerstattet werden.

Das Nutzerinterface von Sora zeigt Videos, die von anderen Nutzern erstellt wurden. Nutzer können die genauen Anweisungen einsehen, die zu einem bestimmten Video geführt haben. Dies bietet einen Einblick in die Kunst des KI-Prompting. Die Sora-Videos können nicht nur mit einzelnen Anweisungen erstellt werden, sondern das Interface ermöglicht es, ein Storyboard zu erstellen, um ein fortlaufendes Video mit verschiedenen Szenen zu generieren.

Der US-amerikanische Youtuber Marques Brownlee durfte Sora eine Woche lang testen. In seinen Beispielen ist nicht immer erkennbar, ob eine Szene real gefilmt oder von Sora generiert wurde. Es gibt jedoch auch Fehler, wie unleserliche Texteinblendungen oder plötzlich verschwindende Tiere und Objekte. Sora hat Schwierigkeiten mit der Darstellung von Bewegungen und physikalischen Gegebenheiten, insbesondere bei realistischen Szenen. Bei abstrakten oder zeichentrickartigen Videos fallen diese Unzulänglichkeiten weniger auf.

OpenAI bietet Downloads der Sora-Videos auf Wunsch auch ohne Wasserzeichen an, wobei unklar ist, ob dies nur die sichtbare Animation betrifft. Die Veröffentlichung von Sora ist Teil von OpenAIs “Shipmas”, einer Reihe von neuen Produktvorstellungen über zwölf Tage.