OpenAI nutzt MXFP4, ein neues Datenformat, das Speicher- und Rechenaufwand deutlich verringert. Dadurch können Modelle mit 120 Milliarden Parametern auf GPUs mit 80GB VRAM oder kleinere Versionen auf nur 16GB laufen. Die gpt-oss-Modelle sind Vorreiter in der Nutzung dieses Formats.
