Stax ist ein experimentelles Entwicklerwerkzeug, das den Evaluierungsprozess von großen Sprachmodellen (LLMs) automatisiert und verbessert. Es liefert klare Metriken, die eine datenbasierte Entscheidungsfindung ermöglichen, vermeidet mühsames subjektives Testen und erlaubt die Erstellung individueller Bewertungsmetriken und automatischer Bewertungssysteme.
