Frontier-KIs erreichen inzwischen Niveau für wertvolle praktische Arbeit. In Tests unter mehrstündigen Aufgaben gewannen Experten knapp gegen KI, deren Schwäche Formatierung statt Genauigkeit war. Modelle wie Claude Sonnet 4.5 reproduzierten komplexe Facharbeiten binnen Minuten, was akademische Replikationskrisen adressieren könnte. Entscheidend bleibt die menschliche Einschätzung, welche Aufgaben sinnvoll sind.
Echte KI-Agenten leisten wirtschaftlich wertvolle Arbeit
•