Petri: Open-Source-Tool zur Beschleunigung der KI-Sicherheitsforschung

Anthropics Petri ist ein Framework, mit dem KI-Agenten Modelle anhand realistischer Multi-Turn-Szenarien automatisch testen können. Es deckt problematische Verhaltensweisen wie autonome Täuschung auf und hilft Forschern, sich schnell auf besonders relevante Sicherheitsfragen zu konzentrieren.