Perplexity beschreibt die technische Integration der gpt-oss-20b und 120b Modelle in ihre ROSE Inferenzengine. Dabei wurden Anpassungen an Kernel und Quantisierung vorgenommen, während nur geringe Infrastrukturänderungen für nicht-FP4-Hardware nötig waren.
