Die Untersuchung kategorisiert Methoden des LLM-Reasonings nach zwei Dimensionen: Inferenzzeit versus Training und autonom agierende versus eigenständige Systeme. Der Trend geht von reiner Inferenzskalierung hin zu lernbasierten Reasoning-Ansätzen und agentenbasierten Workflows.
