AI Innovations: OpenAI's Video-KI, DeepMind's 3D Worlds, and Robotic Rat Experiments

OpenAI hat kürzlich seine neue Video-KI namens Sora vorgestellt. Diese Technologie kann auf Basis von Textanweisungen realistische Videos mit einer Länge von bis zu 20 Sekunden erzeugen. Der Dienst ist zunächst nur in Nordamerika für Abonnenten von ChatGPT verfügbar. Neben dem Hauptmodell gibt es auch eine schnellere Version namens Sora Turbo, die jedoch eine geringere Qualität aufweist.

Die Nutzung von Sora unterliegt strengen Richtlinien, die unter anderem die Darstellung von Gewalt und den Schutz von Persönlichkeitsrechten verbieten. Obwohl die KI beeindruckend realistische Videos erzeugt, hat sie noch Schwierigkeiten mit physikalischen Darstellungen und komplexen Bewegungsabläufen. Alle generierten Videos sind mit einem Wasserzeichen versehen, um sie als KI-Inhalte zu kennzeichnen.

Innerhalb von OpenAI gibt es interne Kritik bezüglich der Zusammenarbeit mit dem Rüstungskonzern Anduril. Einige Mitarbeiter äußern Bedenken hinsichtlich der militärischen Nutzung der KI-Technologie. Die Partnerschaft sieht vor, dass OpenAI-KI-Modelle mit Daten von Andurils Drohnen trainiert werden, um die Erkennung und Abwehr unbemannter Flugsysteme für die US-Streitkräfte zu verbessern. OpenAI-CEO Sam Altman verteidigt die Zusammenarbeit und betont, dass sie sich auf Verteidigungssysteme beschränkt, die demokratischen Staaten den Zugang zu fortschrittlicher Technologie ermöglichen sollen.

DeepMind hat ein neues KI-System namens “Genie 2” entwickelt, das in der Lage ist, aus einem einzigen Bild komplexe 3D-Umgebungen zu generieren. Diese Welten sind sowohl für Menschen als auch für KI-Agenten zugänglich und bieten physikalische Effekte wie Gravitation und Wasserreflexionen. Im Vergleich zu früheren Versionen, die auf 2D-Spiele beschränkt waren, stellt dies einen erheblichen Fortschritt dar. Eine nicht optimierte Version läuft bereits in Echtzeit. Das System soll unter anderem dazu dienen, KI-Agenten zu trainieren, obwohl es noch Herausforderungen bei der Ausgabequalität gibt.

Der AGI-Benchmark ARC-AGI hat 2024 einen Leistungssprung von 33 auf 55,5 Prozent verzeichnet. Das Ziel von 85 Prozent für den Hauptpreis von 600.000 Dollar wurde jedoch nicht erreicht. Im Wettbewerb dominierten Ansätze wie KI-gestützte Programmsynthese und Test-Time-Training. Die besten Ergebnisse erzielten Teams, die beide Methoden kombinierten. Für 2025 ist ein neuer Benchmark namens ARC-AGI-2 geplant, da der aktuelle Datensatz mit 100 Aufgaben als zu klein angesehen wird.

Das Start-up Ruliad hat ein neues Sprachmodell namens DeepThought-8B veröffentlicht. Dieses Modell dokumentiert seine Schlussfolgerungen in einem strukturierten JSON-Format. Trotz seiner geringen Größe von 8 Milliarden Parametern erreicht es in Benchmarks ähnliche Leistungen wie größere Modelle. Es basiert auf Llama-3.1 und läuft auf Grafikkarten ab 16 GB Speicher. Eine Besonderheit ist die Möglichkeit, in die Argumentationsketten einzugreifen. Das Modell wurde als Open Source veröffentlicht und kann kostenlos getestet werden.

In einem weiteren interessanten Projekt haben Forscher des Beijing Institute of Technology zusammen mit der Technischen Universität München einen Rattenroboter entwickelt. Dieser Roboter wurde mit einer KI trainiert, um soziale Verhaltensweisen von echten Ratten zu imitieren. Dazu gehören Reaktionen in stressigen und glücklichen Situationen. In Labortests wurde festgestellt, dass echte Ratten den Roboter akzeptieren, da er sich in verschiedenen Situationen angemessen verhält.

Dies war das aktuelle KI-Update. Bleiben Sie gespannt auf weitere Entwicklungen in der faszinierenden Welt der künstlichen Intelligenz.