„Agentic Rubrics“ bieten eine testfreie Methode zur Prüfung von Codeänderungen, indem Experten-Checklisten durch KI-basierte Agenten erzeugt werden. Diese Methode übertrifft traditionelle Verfahren im SWE-Bench Verified und ermöglicht skalierbares, interpretierbares Feedback für Reinforcement Learning und Laufzeitüberprüfungen.
