Aktuelle große Sprachmodelle sind sprachlich versiert, besitzen jedoch keine räumliche Intelligenz, eine wesentliche menschliche Fähigkeit. „Weltmodelle“ schaffen geometrisch und physikalisch konsistente Simulationen, verarbeiten multimodale Eingaben und sagen Zustandsänderungen voraus. Diese Technologie könnte bedeutende Fortschritte bei Robotik, Videomodellierung und Arzneimittelentwicklung ermöglichen.
