R-Zero ist ein Framework für selbst entwickelnde LLMs, die autonom Trainingsdaten generieren und daraus lernen. Das System verbessert die Reasoning-Fähigkeiten diverser Basis-Modelle ohne großen menschlichen Kurationsaufwand und adressiert so den Engpass manuell erstellter Trainingsdaten.
