Google DeepMind hat Genie 3 vorgestellt, ein KI-Modell, das interaktive 3D-Umgebungen in Echtzeit aus einfachen Texteingaben generiert. Nutzer können dynamische Welten mit 720p und 24 Bildern pro Sekunde erkunden, wobei das Modell Objekte und Ereignisse minutenlang konsistent darstellt. Neue Funktionen wie erweiterter Speicher und steuerbare Ereignisse ermöglichen Anpassungen in Echtzeit, etwa das Hinzufügen von Charakteren oder das Ändern des Wetters. Die Anwendung wurde mit einem Agenten für komplexe Aufgaben getestet, zeigt aber noch Einschränkungen bei Karten-Genauigkeit und Mehragenten-Interaktionen. Die Veröffentlichung erfolgt zunächst in einer kleinen Forschungsvorschau.
