PACT (Pairwise Auction Conversation Testbed) ist ein Benchmark, der Verhandlungsfähigkeiten von Sprachmodellen untersucht. Er umfasst über 5.000 Spiele mit je 20 Runden und zeigt Ergebnisse aktueller Top-Modelle, um Forschungen im Bereich konversationsbasierte KI zu fördern.
