•
Die Fähigkeiten von Claude Code haben stark zugenommen, was für Entwickler zwar großes Potenzial bietet, aber auch einen höheren Lernaufwand bedeutet. Die Plattform ist aktuell auf Power-User optimiert, versucht aber zugleich, Nicht-Experten nicht zu überfordern. Trotzdem wächst die Komplexität mit jeder neuen Funktion, sodass die Gefahr besteht, dass man selbst erst lernen muss, wie…
•
Das neue Modell Kimi K2 1T nutzt 4-Bit-Quantisierung und läuft auf zwei 512GB M3 Ultra Systemen mit mlx-lm und mx.distributed. Es bietet eine leistungsstarke Infrastruktur für KI-Anwendungen.
•
Die kostspieligsten Spitzentechnologien im Bereich AGI dürften innerhalb eines Jahres erheblich günstiger werden. Der Artikel beleuchtet diese Effizienzentwicklungen, die von vielen Rankings und Leaderboards noch nicht reflektiert werden.
•
Googles AI-Mode scheint Inhalte aus einem proprietären Content-Store zu beziehen, der getrennt vom klassischen Suchindex liegt. Dies eröffnet neue Möglichkeiten der Inhaltssuche und -verarbeitung.
•
Claude Code implementiert eine warteschlangenbasierte Steuerung, bei der neue Nutzeranfragen an natürlichen Pausenpunkten eingereiht werden, um laufende Prozesse fließend zu beeinflussen. OpenAI Codex arbeitet hingegen mit einer Post-Turn-Warteschlange, die erst nach Beendigung der aktuellen Aufgabe neue Nachrichten verarbeitet. Agenten-Tools sollten beide Varianten anbieten, um parallele Agenten effektiver steuern zu können.
•
Die einfachste Methode, um mit Tools zu arbeiten, besteht darin, dass Agenten ihre eigenen Tools als Skills programmieren. Das gibt Nutzern Kontrolle und ermöglicht Anpassungen bei Bedarf. Während dynamisches Toolloading mit MCP wahrscheinlich künftig kommt, sind dafür noch zahlreiche Protokolländerungen nötig, etwa für skillähnliche Zusammenfassungen und integrierte Anleitungen zu den Tools.
•
Google nutzt sein Video-Generierungsmodell Veo als Welt-Simulator, um vorherzusagen, wie Robotik-Algorithmen in neuen Umgebungen ohne physische Tests abschneiden. Über 1.600 simulierte Abläufe ermöglichten das präzise Ranking von acht Policy-Versionen und deckten Sicherheitsrisiken auf, etwa wie ein Roboter einen Laptop umstößt oder eine Flasche zu fest greift.
•
OpenAI hat die zuvor bestehende Regel abgeschafft, nach der Mitarbeiter erst nach sechs Monaten im Unternehmen ihre Aktienoptionen erhalten konnten. Diese Änderung soll neue Mitarbeiter motivieren, Risiken einzugehen, ohne Angst vor einem frühen Ausscheiden zu haben. Bereits im April hatte OpenAI die Vesting-Periode von zwölf auf sechs Monate verkürzt. Ähnliche Änderungen wurden von xAI…
•
Obwohl große Sprachmodelle nützlich sind, fehlen ihnen kognitive Fähigkeiten auf menschlichem Niveau, etwa im Umgang mit arithmetischen Aufgaben. Die aktuellen Modelle werden kaum darauf trainiert, präzise Urteile zu fällen, selbst bei kleinen Datensätzen. Effizientere Methoden, um Daten ohne hohe Token-Kosten einzubinden und an Tools weiterzugeben, sind nötig, um die Effektivität der Werkzeugnutzung deutlich zu…
•
Viele Unternehmen scheitern daran, verlässliche Ergebnisse mit KI-Agenten zu erzielen, weil sie sich zu sehr auf das Feinjustieren von Prompts konzentrieren. Eine Anleitung von You.com beschreibt die fünf Entwicklungsstufen erfolgreicher KI-Agenten und zeigt, warum viele Organisationen diese noch nicht erreicht haben. Der Artikel bietet wertvolle Einblicke in modernes Agentenmanagement.