Große Sprachmodelle als faire Bewertungssysteme untersuchen

Innovatives AugmentERA Team entwickelt Augmented Reality Lösungen in modernem Büro.

Vielen Dank für Ihren Besuch und Ihr Interesse!

Für mehr Informationen über KI und die Integration in Ihr Unternehmen, treten Sie mit uns in Kontakt

Connect with us

Oder nehmen Sie an unserer Umfrage für eine kostenlose Analyse teil

Zur Umfrage

Eine Untersuchung prüft, wie fair große Sprachmodelle bei der Bewertung anderer LLMs sind, unter Verwendung eines modifizierten MT-Bench Benchmarks. Dabei zeigte sich, dass Faktoren wie Hersteller, Modellklasse und Input-Hinweise die Bewertungen innerhalb der Bereiche Coding, logisches Denken und Textproduktion beeinflussen.