Google hat kürzlich mit Veo 2 eine neue Video-KI vorgestellt, die als Antwort auf OpenAIs Sora entwickelt wurde. Diese Ankündigung kommt nur wenige Tage, nachdem Sora für Nutzer zugänglich gemacht wurde. Veo 2 bietet die Fähigkeit, minutenlange Clips in 4K-Auflösung zu generieren. Die KI soll Bewegungen von Personen, Tieren oder Objekten sowie die “Kamerabewegungen” besser darstellen können. Dies eröffnet Filmemachern viele Möglichkeiten, ihre Szenen genau nach ihren Vorstellungen zu erstellen.
Google hat interne Vergleichstests zwischen Veo 2 und anderen Video-KI-Tools durchgeführt. Obwohl solche Tests mit Vorsicht zu genießen sind, da Unternehmen ihre Produkte nicht in einem schlechten Licht präsentieren würden, soll Veo 2 bei der Qualität des Video-Outputs und der Genauigkeit der Umsetzung der Eingaben gut abgeschnitten haben. Zu den Konkurrenten im Test zählten Meta Movie Gen, Kling v1.5, Minimax AI und Sora Turbo. Google behauptet, dass 67 Prozent der Teilnehmer den Output von Veo 2 bevorzugten und viele meinten, dass die KI von Google die Eingaben besser umsetzte.
Allerdings hat Veo 2 noch einige Einschränkungen. Nutzer haben festgestellt, dass die KI im Vergleich zu Sora und anderen Video-KIs bessere Darstellungen von physikalischen Bewegungen erzeugen kann, wie das Schneiden einer Tomate oder das unfallfreie Essen von Spaghetti. Dennoch gibt es Probleme bei der Konsistenz innerhalb von Szenen, insbesondere wenn diese länger sind. Personen im Hintergrund können plötzlich verschwinden, verschmelzen oder aus dem Nichts auftauchen. Auch bei der Darstellung von physikalischen Eigenschaften gibt es Herausforderungen, wie ein Beispiel mit einem Angler zeigt, dessen Angelrute wie aus Gummi wirkt. Google plant, diese Probleme anhand des Nutzerfeedbacks zu verbessern.
Der Zugriff auf Veo 2 erfolgt derzeit über eine Warteliste. Leider ist der Dienst in einigen Ländern noch nicht verfügbar. Selbst Nutzer, die bereits Zugang haben, stoßen auf Einschränkungen. Derzeit können nur Clips mit einer maximalen Auflösung von 720p und einer Länge von acht Sekunden generiert werden. Im Vergleich dazu bietet Sora eine Auflösung von 1080p und eine Länge von 20 Sekunden.
Zusammenfassend lässt sich sagen, dass Veo 2 eine vielversprechende Video-KI ist, die in einigen Bereichen bereits beeindruckende Ergebnisse liefert, jedoch noch Raum für Verbesserungen hat. Google arbeitet daran, die Funktionalität und Verfügbarkeit der KI zu erweitern, um mehr Nutzern den Zugang zu ermöglichen. Es bleibt abzuwarten, wie sich Veo 2 im Vergleich zu anderen Video-KIs weiterentwickeln wird und ob es Google gelingt, die bestehenden Herausforderungen zu meistern.