Eine neue Sampling-Methode erlaubt es Basismodellen, mit nur einem Durchlauf bei der Beantwortung komplexer Aufgaben ähnliche Leistungen wie bei Reinforcement Learning zu erzielen. Dabei bleiben gleichzeitig Vielfalt der Antworten und Genauigkeit bei mehrfachem Durchlauf erhalten, ohne dass Modelle neu trainiert oder externe Prüfer benötigt werden.
