Durch Neuentwicklung des Mixture-of-Experts-Layers mit CUDA und PTX erzielte Cursor eine 3,5-fache Beschleunigung der MoE-Berechnungen. Dies führt zu einer 1,5-fachen End-to-End-Trainingsgeschwindigkeit im Vergleich zu früheren GPUs wie Hopper bei Einsatz von Blackwell-GPUs.
