•
OpenAI’s KI o3 gewann das Finale gegen Grok 4 im Kaggle AI Chess Exhibition Tournament dank besserem Verständnis des Endspiels und überlegenen Spielzügen. Der Drittplatzierte, Gemini 2.5 Pro, besiegte o4-mini mit 3,5 zu 0,5.
•
Stability AI hat eine neue Enterprise-Offerte präsentiert, die maßgeschneiderte generative KI-Modelle und Workflows für kreative Produktionen bietet.
•
Anthropic nennt seine Sicherheitsorientierung, hochwertige Forschung und Top-Expertenteam als Gründe, warum Talente das Unternehmen bevorzugen.
•
KI wählt jedes Token basierend auf Wahrscheinlichkeiten im Kontext zuvor generierter Inhalte und denkt nicht im herkömmlichen Sinne. Dies erklärt, warum KI-Ausgaben selten beim ersten Versuch perfekt sind.
•
Notte ist ein Framework für die schnelle, kosteneffiziente und skalierbare Entwicklung zuverlässiger KI-Webagenten. Es kombiniert KI-Agenten mit klassischem Scripting und ermöglicht Entwicklern, AI-gesteuerte Webautomatisierungen und Agenten über eine einzige API zu erstellen, bereitzustellen und zu skalieren.
•
Octo ist ein freundlicher Open-Source-Coding-Assistent, der mit jeder OpenAI- oder Anthropic-kompatiblen LLM-API funktioniert. Entwicklern wird ermöglicht, Modellwechsel mitten im Gespräch vorzunehmen, falls ein Modell an seine Grenzen stößt. Gleichzeitig kann man eigene trainierte Modelle zur Unterstützung nutzen – ohne jegliche Telemetrie.
•
Ein neuer, skalierbarer Kurationprozess für aktives Lernen ermöglicht es, die Menge der benötigten Trainingsdaten zur Feinabstimmung großer Sprachmodelle drastisch zu reduzieren – von 100.000 auf unter 500 Beispiele. Gleichzeitig verbessert sich die Übereinstimmung mit menschlichen Experten um bis zu 65%.
•
Eine neue Trainingsmethode kombiniert Sicherheitskontraindikatoren, die Verstöße mit Schweregrad bestrafen, und eine Maximierung der Hilfsbereitschaft, die sowohl direkte Befolgung als auch informative, sichere Ablehnungen belohnt. GPT-5 zeigte dadurch bei sicherheitsrelevanten Prüfungen bessere Ergebnisse und weniger schwere Fehler als Vorgängermodelle.
•
GPT-5 erweitert die KI-Programmierung grundlegend, indem es nicht nur Werkzeuge nutzt, sondern mit ihnen denkt. Es löst komplexe Abhängigkeitskonflikte durch interaktives Forschen und Iterieren. Obwohl es beim Schreiben etwas schwächer als GPT-4.5 ist, ist es das beste Modell für Coding, das komplette produktionsbereite Webseiten inklusive Datenbanken mit einem Durchlauf generiert.
•
Die METR-Organisation hat GPT-5 vor dessen externer Veröffentlichung auf potenzielle katastrophale Risiken geprüft. Die detaillierte Analyse bestätigt, dass GPT-5 derzeit nicht über die notwendigen Fähigkeiten verfügt, um ein solches Risiko darzustellen.