Das Thinking Machines Lab zeigte, dass kleinere KI-Modelle durch Lernen aus eigenen Fehlern mit Hilfe eines größeren Lehrmodells trainiert werden können. Dieses Verfahren erreicht mit bis zu 30-fach geringeren Kosten eine vergleichbare Leistungsfähigkeit wie herkömmliches Reinforcement Learning und benötigt deutlich weniger Trainingsaufwand.
