Grundlagen zur Ausbildung großer Sprachmodelle: Teil 1

Innovatives AugmentERA Team entwickelt Augmented Reality Lösungen in modernem Büro.

Vielen Dank für Ihren Besuch und Ihr Interesse!

Für mehr Informationen über KI und die Integration in Ihr Unternehmen, treten Sie mit uns in Kontakt

Connect with us

Oder nehmen Sie an unserer Umfrage für eine kostenlose Analyse teil

Zur Umfrage

Ein Forscher erläutert den Aufbau von Basisinfrastruktur zum Pre-Training und wie er ein 1-Milliarde-Parameter Llama-3-ähnliches Modell auf 8 H100 GPUs trainierte. Das Modell ist nicht state-of-the-art, bietet jedoch eine nachvollziehbare Implementierung mit Potenzial zur weiteren Abstraktion.