Reinforcement Learning ist deutlich ineffizienter als angenommen

Innovatives AugmentERA Team entwickelt Augmented Reality Lösungen in modernem Büro.

Vielen Dank für Ihren Besuch und Ihr Interesse!

Für mehr Informationen über KI und die Integration in Ihr Unternehmen, treten Sie mit uns in Kontakt

Connect with us

Oder nehmen Sie an unserer Umfrage für eine kostenlose Analyse teil

Zur Umfrage

Die Studie erklärt, dass Reinforcement Learning (RL) viel mehr Rechenaufwand pro Probe benötigt als überwachte Lernverfahren. RL muss lange Entscheidungsfolgen abrollen, um eine einzige Belohnung zu erhalten, während beim Pretraining jeder Token ein Signal liefert. Dadurch ist die Informationsdichte bei RL in der Regel deutlich geringer.