Wissenswertes

  • OpenAI stellt GPT-5.2-Codex für verbessertes agentenbasiertes Programmieren vor

    Der neue agentenbasierte Programmier-Modell GPT-5.2-Codex von OpenAI erzielt Spitzenwerte bei Software-Engineering-Benchmarks mit verbesserter Langzeitplanung. Zusätzlich startet OpenAI ein Pilotprojekt für vertrauenswürdigen Zugang, das geprüften Cybersicherheitsexperten Zugang zu künftigen, leistungsfähigeren Modellen bietet.

  • John Schulman über Forschungsansätze, RL-Skalierung und OpenAI-Historie

    John Schulman schätzt, dass ein kleines Team bereits 2018-2019 ein ChatGPT-3.5-ähnliches Modell hätte mit wenigen GPUs entwickeln können. Er beschreibt OpenAI anfangs als Mischung aus kleinen Forschungsprojekten und größeren Engineering-Initiativen. Er erwartet ein Comeback für Value Functions und Offline-Reinforcement Learning und warnt, dass Aufholjagden die Explorationskultur in der Forschung erschweren.

  • Neues Evaluations-Framework zur Überwachung von KI-Denkprozessen

    OpenAI hat ein Bewertungsset entwickelt, um zu messen, wie zuverlässig die Überwachung von Modellüberlegungen mittels Chain-of-Thought gelingt. Die Studie in 24 verschiedenen Umgebungen zeigt, dass die Transparenz des Denkens durch Faktoren wie Modellgröße, Reinforcement Learning und zur Laufzeit eingesetzte Rechenleistung stark variiert.

  • Agent Skills wird offener Standard für KI-Agentenfähigkeiten

    Agent Skills, das bei Anthropic entwickelte Format für Ordner mit Anweisungen, Skripten und Ressourcen zur Erweiterung von KI-Agenten, ist jetzt offen und wird von verschiedenen Anbietern wie Cursor, GitHub, VS Code, Claude Code und OpenAI unterstützt. Diese Skills ermöglichen es Teams, Fachwissen und Abläufe als versionierte Pakete bereitzustellen, die agentenübergreifend funktionieren.

  • OpenAI startet Finanzierungsrunde mit möglichem Wert von 830 Milliarden US-Dollar

    OpenAI befindet sich in einer frühen Phase einer Finanzierungsrunde, die bis zu 100 Milliarden US-Dollar einbringen und das Unternehmen auf bis zu 830 Milliarden US-Dollar bewerten könnte. Die Runde soll frühestens Ende des ersten Quartals abgeschlossen sein. Es ist jedoch unklar, ob genug Investoreninteresse besteht, um das Ziel zu erreichen. Dies wird einer der…

  • Meta entwickelt neues KI-Model für Bild und Video namens „Mango“

    Meta arbeitet an einem neuen KI-Modell namens Mango, das sich auf die Erzeugung von Bildern und Videos konzentriert. Die Veröffentlichung des Modells ist für die erste Hälfte des Jahres 2026 geplant. Bildgenerierung ist ein entscheidender Wettbewerbspunkt zwischen großen KI-Anbietern und ist für viele Nutzer ein wichtiger Grund, die Plattformen regelmäßig zu nutzen.

  • 💰 Neue Finanzierungsrunden im KI-Sektor

    Adaptive sicherte sich 81 Millionen US-Dollar in einer Series B Runde zum Kampf gegen KI-getriebene Betrugsmaschen. MoEngage erhielt 180 Millionen US-Dollar in einer Series F zur Verbesserung der Kundenbindung. Lovable gewann 330 Millionen US-Dollar in einer Series B Runde, um Apps mittels KI-Chats zu erstellen.

  • 💼 Aktuelle KI-Stellenangebote

    Sierra (San Francisco, CA) sucht einen AI Agent Development Intern für Sommer 2026. NVIDIA (Hillsboro, OR) benötigt einen Systems Software Engineer auf Einstiegsniveau. Figure AI (San Jose, CA) stellt einen IQC Quality Technician (mittleres Level) ein. Google (Sunnyvale, CA) bietet eine Position als Senior Software Engineer für TorchTPU.

  • 🛠 Trendige KI-Tools der Woche

    Neue spannende KI-Anwendungen: Cresh unterstützt bei der Geschäftsideenentwicklung, Cluely erstellt heimlich Echtzeit-Meetingnotizen, Trullion automatisiert Finanzprozesse für Prüfungs-Teams, NovelVision AI hilft Autoren beim Narrativ-Editing, BetterLegal reduziert juristischen Aufwand auf Minuten. Zudem stellte Meta „SAM Audio“ vor, das Geräusche aus komplexen Aufnahmen isoliert, OpenAI präsentierte das „App Directory“ für ChatGPT-Integrationen, xAI brachte die „Grok Voice Agent…

  • 🔮 2026: Von Hype zu aussagekräftigen Benchmarks in der KI

    Stanford HAI prognostiziert für 2026 eine Verschiebung von KI-Hype hin zu messbarer Leistung und konkretem Nutzen. Anstelle der Frage „Kann KI das?“ wird gefragt „Wie gut kann KI das?“, unterstützt durch standardisierte Benchmarks und sektorspezifische Metriken. Experten erwarten zudem, dass Länder verstärkt KI-Souveränität anstreben, um Abhängigkeiten und Datenschutzrisiken zu minimieren. Im medizinischen Bereich wird…