Das Projekt CaRR ersetzt binäre Belohnungen im Verstärkungslernen durch ein Bewertungssystem basierend auf Zitaten und Rubriken. Dies verbessert die Leistung von Deep Search Agenten, die komplexe Such- und Entscheidungsaufgaben bewältigen müssen.
CaRR: Verbesserte Verstärkungslernagenten für Deep Search
•