Das Verfahren GAD ermöglicht das „Distillieren“ von Wissen aus Black-Box-Sprachmodellen nur anhand generierter Texte, ohne Zugriff auf deren Wahrscheinlichkeitsausgaben. Ein Studentenmodell wird durch adversariales Lernen gegen einen Diskriminator trainiert und kann dadurch effizient auf Policy-basierte Weise imitieren.
