•
Mercor verbindet ehemalige Experten aus Investmentbanken, Consulting und Rechtsberatung mit KI-Labs, die diese Branchen automatisieren wollen. Kunden sind große KI-Anbieter wie OpenAI, Anthropic und Meta. Experten werden mit bis zu 200 US-Dollar pro Stunde bezahlt, um Trainingsdaten durch Berichte und Formularausfüllungen zu liefern. Der Jahresumsatz liegt innerhalb von drei Jahren bei ca. 500 Millionen…
•
Dieser Ansatz behandelt Claude Skills und ihren Enumerator als globale Ressourcen, die im Installationsordner von Codex hinterlegt sind. Ein Skript, das Skills auflistet, wird in den Systempfad gelegt, so dass Codex Skills in jedem Repository durch Ausführen dieses Skripts entdecken kann. Dadurch werden Claude Skills plattformübergreifend nutzbar.
•
Der Fokus auf falsche Ziele führt zwar zu guten Ergebnissen in der Begrenzung, verfehlt aber das tatsächliche Problem. Pathologie braucht Modelle, die klinischen Nutzen, Generalisierbarkeit über Institutionen hinweg und Robustheit für reale Bedingungen optimieren. Künftige KI-Modelle werden kleiner, interpretierbarer, rigoroser validiert sein und ihre eigenen Grenzen besser einschätzen.
•
Forschende bei Anthropic injizierten künstlich neuronale Aktivitätsmuster in das Modell Claude, um dessen Fähigkeit zur Selbstwahrnehmung zu testen. Claude Opus erkannte die eingefügten Konzepte etwa 20 % der Zeit und zeigte manchmal Vorahnungen eines „Fehlers“ vor der expliziten Nennung. Dies deutet auf erste introspektive Fähigkeiten in solchen Modellen hin.
•
MiniMax M2 ist ein auf Agenten und Codierung spezialisierter KI-Model, der doppelt so schnell arbeitet und nur 8% der Kosten von Claude Sonnet verursacht. Er ermöglicht intelligentes Erstellen, Programmieren und Deployen mit selektiver Parameteraktivierung und ist als Open-Source und API verfügbar.
•
Die gpt-oss-safeguard Modelle mit 120 Milliarden und 20 Milliarden Parametern erlauben Entwicklern, Sicherheitsrichtlinien während der Inferenz anzuwenden, ohne aufwändige Klassifikatoren zu trainieren. Mittels Chain-of-Thought Reasoning können Entscheidungen verständlich erklärt werden.
•
Cursor 2.0 führt das erste Programmiermodell Composer ein, das die meisten Aufgaben in unter 30 Sekunden erledigt und komplexe Codebasen gezielt versteht. Die neue Multi-Agenten-Oberfläche ermöglicht paralleles Arbeiten mehrerer Agenten, die über git worktrees oder Remote-Maschinen verwaltet werden. Die Version zielt darauf ab, die Herausforderungen moderner Entwickler-Workflows zu adressieren.
•
Nvidias Umsatz für 2025 verdoppelte sich mit 130,5 Milliarden Dollar im Vergleich zum Vorjahr. CEO Jensen Huang kündigte KI-Chip-Bestellungen im Wert von 500 Milliarden Dollar an und den Bau von sieben staatlichen Supercomputern. Die Chips bleiben ein zentraler Streitpunkt im US-chinesischen Handelskonflikt und werden von Trump und Xi Jinping diskutiert.
•
Wikipedia war lange die wichtigste Wissensquelle, doch mit dem neuen Projekt Grokipedia entsteht eine rein KI-generierte Enzyklopädie, die von Menschen kontrolliert wird. Grokipedia bietet Echtzeit-Updates, automatische Vertrauensbewertungen und eine „Frag Grok“-Funktion in jedem Artikel. Im Unterschied zu Wikipedia, die manuell editiert wird und oft Verzögerungen bei Aktualisierungen hat, nutzt Grokipedia KI zur schnellen Skalierung…
•
Google stellte mit „Pomelli“ ein neues experimentelles KI-Tool vor, das vollständige, markengerechte Social-Media-Kampagnen automatisch erstellt. Nach Eingabe der Website erfasst Pomelli die Brand-DNA und generiert Kampagnenvorschläge inklusive Creatives, die direkt bearbeitet werden können. Zwar ist das Tool vorerst nur mit US-IP verfügbar, liefert aber in wenigen Minuten beeindruckende, publikationsfähige Inhalte. Der einfache Workflow verspricht…