Anthropic zeigt, dass Agenten mit weniger, dafür gut ausgewählten Tools besser performen als mit vielen API-Endpunkten. Optimierte Werkzeuge für Claude übertreffen dabei menschliche Implementierungen. Agenten können durch Bewertungsschleifen ihre Toolsets eigenständig verbessern und weiterentwickeln.
