Microsoft AI hat MAI-Voice-1 präsentiert, ein Sprachgenerierungsmodell, das eine Minute Audio in unter einer Sekunde erzeugen kann. Zudem wurde MAI-1-preview vorgestellt, ein „Mixture-of-Experts“-Basis-Modell, trainiert mit etwa 15.000 NVIDIA H100 GPUs. Die technischen Details sind noch unklar, doch zeigen die Modelle Microsofts Absicht, unabhängiger von OpenAI zu werden.
