CaRR: Verbesserte Verstärkungslernagenten für Deep Search

Das Projekt CaRR ersetzt binäre Belohnungen im Verstärkungslernen durch ein Bewertungssystem basierend auf Zitaten und Rubriken. Dies verbessert die Leistung von Deep Search Agenten, die komplexe Such- und Entscheidungsaufgaben bewältigen müssen.