OpenAI’s neue Realtime API ist nun allgemein verfügbar und unterstützt MCP-Server, Bildinputs und Telefonate. Das Modell gpt-realtime ist das fortschrittlichste Speech-to-Speech-Modell von OpenAI, mit verbesserter Fähigkeit, komplexe Befehle auszuführen und natürliche, ausdrucksstarke Sprache zu erzeugen. Durch Kombination von Audioeingabe und -ausgabe in einem Modell werden Latenz verringert und Nuancen erhalten.
