Wissenswertes

  • Claude Skills überall verfügbar machen im Codex CLI

    Dieser Ansatz behandelt Claude Skills und ihren Enumerator als globale Ressourcen, die im Installationsordner von Codex hinterlegt sind. Ein Skript, das Skills auflistet, wird in den Systempfad gelegt, so dass Codex Skills in jedem Repository durch Ausführen dieses Skripts entdecken kann. Dadurch werden Claude Skills plattformübergreifend nutzbar.

  • Vorstellung von SWE-1.5: schnelles Modell für Softwareentwicklung

    SWE-1.5 ist ein Modell mit mehreren hundert Milliarden Parametern, das speziell auf Softwareentwicklung optimiert ist. Es erzielt fast state-of-the-art Leistung bei Codegenerierung und legt eine neue Messlatte für Geschwindigkeit. Eingesetzt in Windsurf, analysiert es große Codebasen, erstellt Full-Stack-Anwendungen und unterstützt einfache Konfigurationsänderungen.

  • Agent Labs verändern die Softwarewelt

    Agent Labs fokussieren sich darauf, schnell Produkte zu liefern und Infrastruktur erst später auszubauen. Sie transformieren KI-Modelle zu zielgerichteten Systemen, welche die tatsächlichen Abläufe automatisieren. Wesentliche Kompetenzen verschieben sich vom Modellbau hin zu Systemdesign, Evaluation und branchenspezifischer Workflow-Optimierung. Der Wettbewerbsvorteil liegt heute vor allem in Daten und Feedbackschleifen.

  • Wie AI-Labs mit Mercor an sonst verschlossene Daten gelangen

    Mercor verbindet ehemalige Experten aus Investmentbanken, Consulting und Rechtsberatung mit KI-Labs, die diese Branchen automatisieren wollen. Kunden sind große KI-Anbieter wie OpenAI, Anthropic und Meta. Experten werden mit bis zu 200 US-Dollar pro Stunde bezahlt, um Trainingsdaten durch Berichte und Formularausfüllungen zu liefern. Der Jahresumsatz liegt innerhalb von drei Jahren bei ca. 500 Millionen…

  • Warum Foundation-Modelle in der Pathologie scheitern und der nächste Schritt

    Der Fokus auf falsche Ziele führt zwar zu guten Ergebnissen in der Begrenzung, verfehlt aber das tatsächliche Problem. Pathologie braucht Modelle, die klinischen Nutzen, Generalisierbarkeit über Institutionen hinweg und Robustheit für reale Bedingungen optimieren. Künftige KI-Modelle werden kleiner, interpretierbarer, rigoroser validiert sein und ihre eigenen Grenzen besser einschätzen.

  • Anzeichen von Introspektion in großen Sprachmodellen

    Forschende bei Anthropic injizierten künstlich neuronale Aktivitätsmuster in das Modell Claude, um dessen Fähigkeit zur Selbstwahrnehmung zu testen. Claude Opus erkannte die eingefügten Konzepte etwa 20 % der Zeit und zeigte manchmal Vorahnungen eines „Fehlers“ vor der expliziten Nennung. Dies deutet auf erste introspektive Fähigkeiten in solchen Modellen hin.

  • MiniMax M2: Open-Source schneller Agent für Coding

    MiniMax M2 ist ein auf Agenten und Codierung spezialisierter KI-Model, der doppelt so schnell arbeitet und nur 8% der Kosten von Claude Sonnet verursacht. Er ermöglicht intelligentes Erstellen, Programmieren und Deployen mit selektiver Parameteraktivierung und ist als Open-Source und API verfügbar.

  • Einführung von gpt-oss-safeguard für angepasste Sicherheitsrichtlinien

    Die gpt-oss-safeguard Modelle mit 120 Milliarden und 20 Milliarden Parametern erlauben Entwicklern, Sicherheitsrichtlinien während der Inferenz anzuwenden, ohne aufwändige Klassifikatoren zu trainieren. Mittels Chain-of-Thought Reasoning können Entscheidungen verständlich erklärt werden.

  • Cursor 2.0 startet mit Composer und Multi-Agenten-Suite

    Cursor 2.0 führt das erste Programmiermodell Composer ein, das die meisten Aufgaben in unter 30 Sekunden erledigt und komplexe Codebasen gezielt versteht. Die neue Multi-Agenten-Oberfläche ermöglicht paralleles Arbeiten mehrerer Agenten, die über git worktrees oder Remote-Maschinen verwaltet werden. Die Version zielt darauf ab, die Herausforderungen moderner Entwickler-Workflows zu adressieren.

  • Nvidia erreicht als erstes Unternehmen 5 Billionen Dollar Bewertung

    Nvidias Umsatz für 2025 verdoppelte sich mit 130,5 Milliarden Dollar im Vergleich zum Vorjahr. CEO Jensen Huang kündigte KI-Chip-Bestellungen im Wert von 500 Milliarden Dollar an und den Bau von sieben staatlichen Supercomputern. Die Chips bleiben ein zentraler Streitpunkt im US-chinesischen Handelskonflikt und werden von Trump und Xi Jinping diskutiert.