Qwen3-Next ist ein neues Modell mit sparse Mixture-of-Experts-Architektur, die hybride Aufmerksamkeit und Multitoken-Vorhersage kombiniert. Das 80-Milliarden-Parameter-Modell aktiviert bei der Ausführung nur 3 Milliarden Parameter, was die Verarbeitung von Aufgaben mit langem Kontext um das Zehnfache beschleunigt.
