Augmentor

  • Claude Code’s Plan Mode: Nutzerkontrolle vor Ausführung

    Plan Mode bei Claude Code pausiert die Ausführung, bis der Nutzer einen von KI generierten Plan überprüft und genehmigt hat. Dies erhöht die Komplexität der Nutzeroberfläche und macht den Prozess weniger intuitiv, bietet aber mehr Steuerungsmöglichkeiten.

  • Opal: Interaktive KI-Miniprogramme in der Gemini-App erstellen

    Opal ist ein Tool zur Entwicklung KI-gestützter Minianwendungen und ist jetzt direkt in der Gemini Web-App verfügbar. Nutzer können damit experimentelle „Gems“ erstellen, um personalisierte Gemini-Erfahrungen zu erweitern.

  • Grok Voice Agent API öffnet Teslas Sprach-Stack für Entwickler

    xAI hat die Sprachtechnologie hinter Grok in Tesla-Fahrzeugen als API für Entwickler freigegeben. Das Modell erreicht Spitzenwerte beim Big Bench Audio Benchmark mit einer Reaktionszeit unter einer Sekunde zu halb so hohen Kosten wie die Konkurrenz.

  • Aktienrückgang bei Oracle trotz großer OpenAI-Verträge

    Obwohl Oracle 523 Mrd. USD an „verbleibenden Leistungsansprüchen“ meldet, fiel der Aktienkurs seit September um 43 %. Rund 300 Mrd. USD stammen aus einem fünfjährigen Vertrag mit OpenAI, dessen Zahlungsfähigkeit von Analysten bezweifelt wird. Zudem verzögert sich Nvidias 100-Milliarden-Dollar-Investment in OpenAI, was Befürchtungen über die komplexen Verflechtungen in der KI-Infrastruktur verstärkt.

  • Computationaler Blick auf die Machbarkeit von AGI

    Aktuelle KI-Modelle nutzen die Hardware unzureichend: Beim Training erreichen DeepSeek-V3 und Llama-4 nur etwa 20 % der FLOP-Leistung, bei der Inferenz sind es sogar einstellige Prozentsätze. Modelle basieren oft auf älterer Hardware und sind daher ein verzögerter Indikator für den aktuellen Stand der Technik.

  • Wie KI-Agenten traditionelle Marktplatzstrukturen bedrohen

    Künstliche Intelligenz übernimmt zunehmend zentrale Prozesse wie Entdeckung, Transaktionen und Angebotsmanagement und zerstört so traditionelle Marketingtrichter. Marktplätze müssen sich durch optimierte Marken- und Kundenerfahrungen sowie neue Monetarisierungsmodelle wie Abos oder Datenlizensierung neu positionieren. Gründern wird geraten, sich auf vielgenutzte Märkte und Kundentreue zu konzentrieren.

  • Google stellt Gemini 3 Flash vor: Schnelles und leichtes KI-Modell

    Google hat Gemini 3 Flash präsentiert, ein schnelles, ressourcenschonendes KI-Modell mit niedriger Latenz. Es bietet fortschrittliche Intelligenz und unterstützt Nutzer dabei, alltägliche Aufgaben und Anwendungen effektiv zu planen und umzusetzen.

  • Google und Meta verstärken Zusammenarbeit gegen Nvidias Softwarevorteil

    Google arbeitet mit Meta zusammen, um die Tensor Processing Units (TPUs) für PyTorch besser nutzbar zu machen. Mit dem Projekt TorchTPU soll eine entscheidende Hürde für die TPU-Adoption beseitigt werden, indem bestehende PyTorch-Infrastrukturen vollständig kompatibel gemacht werden. Teile der Software könnten offen zugänglich gemacht werden, um die Verbreitung zu beschleunigen.

  • Neues OpenAI Bildmodell fordert Google Nano heraus

    OpenAI verkündet nach dem „Code Red“-Moment von CEO Sam Altman rasante Fortschritte. Das neue Bildmodell GPT Image 1.5 konkurriert auf Augenhöhe mit Google Nano Banana Pro und FLUX.2 und führt derzeit im Image Arena Vergleich, besonders bei schneller Generierung und präziser Bearbeitung. Nutzer finden das Modell im ChatGPT-Reiter „Bilder“ mit vielen Styles und Inspirationen.…

  • Verstecktes neues ChatGPT-Feature: Skills

    OpenAI führt still und heimlich „Skills“ ein, ein Feature, das bisher vor allem vom KI-Anbieter Anthropic mit Claude bekannt ist. Skills sind spezialisierte Fähigkeiten, die ChatGPT automatisch nutzt, wenn sie passend sind – etwa zur Dokumentenerstellung oder Dateiverarbeitung. Sie können neben Textanweisungen auch Dateien und Vorlagen enthalten und erlauben den parallelen Einsatz mehrerer Skills.