AA-Omniscience bewertet KI-Modelle hinsichtlich ihres Wissens und der Neigung zu Halluzinationen in über 40 Themengebieten. Modelle werden bestraft, wenn sie raten anstatt Unwissenheit zuzugeben. Aktuelle Tests zeigen Benchmark-Ergebnisse führender KI-Modelle.
