E2E ist ein Ansatz für langanhaltende Sprachmodellierung, bei dem die Lernaufgabe als kontinuierliches Testzeit-Training formuliert wird. Das Modell nutzt Standard-Transformers mit gleitendem Fenster-Attention, lernt durch Vorhersage des nächsten Tokens während des Tests und optimiert seine Initialisierung während des Trainings durch Meta-Lernen.
