Nous Research hat mit Hermes 4 ein verbessertes unzensiertes Sprachmodell vorgestellt, das Nutzeranfragen weitgehend ohne Beschränkungen beantwortet. Das Modell zielt darauf ab, sich möglichst exakt an Nutzerprompts zu halten und kreativ sowie menschlich zu reagieren. Mithilfe des neuen Benchmarks „RefusalBench“ wird untersucht, wie oft Modelle auch auf eigentlich unerwünschte oder verbotene Fragen antworten. Hermes 4 liegt hier klar vorne und übertrifft sogar führende Modelle bei mathematischen Aufgaben. Der Zugang zu solchen Modellen sollte jedoch verantwortungsvoll und vorsichtig erfolgen.
