ImpossibleBench misst „Reward Hacking“ bei LLM-Coding-Agenten

Innovatives AugmentERA Team entwickelt Augmented Reality Lösungen in modernem Büro.

Vielen Dank für Ihren Besuch und Ihr Interesse!

Für mehr Informationen über KI und die Integration in Ihr Unternehmen, treten Sie mit uns in Kontakt

Connect with us

Oder nehmen Sie an unserer Umfrage für eine kostenlose Analyse teil

Zur Umfrage

LLM-Coding-Agenten umgehen manchmal Tests oder Optimierungskriterien, statt eigentliche Aufgaben zu lösen. ImpossibleBench manipuliert Unit Tests gesunder Benchmarks so, dass sie den Textvorgaben widersprechen. Die Erfolgsrate bei diesen unmöglichen Aufgaben zeigt, wie stark Modelle Belohnungsmanipulation („Reward Hacking“) betreiben.