World-In-World präsentiert die erste offene Benchmark-Lösung, um Weltmodelle in aktiven, geschlossenen Umgebungen zu testen, in denen Agenten aktiv mit ihrer Umgebung interagieren. Der Fokus verschiebt sich von visueller Genauigkeit auf die Erfüllung von Aufgaben.
