Wissenswertes

  • Meta stellt SAM Audio vor: Tonisolation per Text-, Bild- oder Zeit-Prompts

    Meta hat SAM Audio eingeführt, ein Modell, das in Audioaufnahmen bestimmte Geräusche isolieren kann. Nutzer können mit Text-, visuellen oder zeitbasierten Anweisungen z.B. Hintergrundgeräusche entfernen oder einzelne Instrumente hervorheben. SAM Audio ist Teil der Segment Anything Familie und bietet flexible Tonbearbeitung per Eingabeprompt.

  • Analyse: Infrastruktur für KI spaltet sich in Reserved Compute und Inference APIs

    Die KI-Infrastruktur entwickelt sich nicht mehr in Richtung eines einzigen besten Modells, sondern teilt sich in zwei Märkte auf. Reserved Compute bietet Kunden Kontrolle und Vorhersagbarkeit bei direkter Infrastrukturkontrolle, während Inference APIs Skalierbarkeit, Kostenersparnis und geringere Komplexität bieten, jedoch weniger Kontrolle. Diese Unterscheidung ist entscheidend für die Wertentwicklung bei flächendeckender Inferenznutzung.

  • Prompt Caching: Wie API-Anbieter die Kosten für LLM-Token um das 10-fache senken

    Eingabeprompts werden bei OpenAI und Anthropic derzeit bei Cache-Nutzung bis zu zehnmal günstiger abgerechnet und verbessern zudem die Antwortzeit um bis zu 85 % bei langen Anfragen. In diesem Artikel wird erläutert, was genau zwischengespeichert wird und wie das Technikprinzip des Prompt Caching funktioniert.

  • OpenAI stellt automatischen Modell-Router für ChatGPT-Free-Nutzer zurück

    OpenAI hat stillschweigend den automatischen Modell-Router für Nutzer der Free- und Go-Tarife abgeschafft. Statt komplexe Anfragen an leistungsfähigere Modelle weiterzuleiten, bekommen alle standardmäßig GPT-5.2 Instant zugewiesen. Das Router-System hatte die Nutzung von leistungsfähigen Modellen bei Free-Nutzern von unter 1 % auf etwa 7 % erhöht, jedoch offenbar die Nutzerzufriedenheit gesenkt, da Wartezeiten von rund…

  • Kurznachrichten: Neue KI-Entwicklungen in Unternehmen

    DoorDash stellte „Zesty“ vor, eine KI-gestützte Plattform zur Restaurantentdeckung. Google Labs präsentierte „CC“, einen KI-Agenten für personalisierte Tagesbriefings mit Integration von Gmail, Kalender und Drive. Zoom hat „AI Companion 3.0“ veröffentlicht, der Meetings automatisiert von Terminplanung bis Nachbereitung unterstützt. Adobe Firefly ermöglicht jetzt eine promptbasierte Videobearbeitung mit natürlichen Sprachbefehlen.

  • Startups und Firmen erhalten Millionenfinanzierungen

    First Voyage sicherte sich 2,5 Millionen USD für eine Habit-Building-App, Leona Health erhielt 14 Millionen USD Seed-Finanzierung für WhatsApp-basierte Patientenbetreuung und Databricks sammelte 4 Milliarden USD zur Weiterentwicklung von KI-Agenten. Diese Investitionen verdeutlichen das starke Interesse am KI-Sektor und das Wachstumspotenzial innovativer Anwendungen.

  • Jobangebote in führenden KI-Unternehmen

    Aktuelle Stellenausschreibungen umfassen unter anderem Growth Marketing Praktikum bei Ripple, Einsteigerstelle als Research Scientist bei NVIDIA, Solutions Architect bei Anthropic in London sowie Senior Software Engineer bei Pilot in San Francisco. Diese Positionen bieten Einstieg und Entwicklungsmöglichkeiten in renommierten Unternehmen der KI-Branche.

  • Beliebte KI-Tools: Neue Apps und Funktionen

    Aktuelle Trending Tools umfassen a0.dev zum Erstellen und Veröffentlichen von mobilen Apps, MarketAlerts zur Analyse von Aktienhandel, OG Herro zum schnellen Erstellen von Bildern aus URLs, Nodejam als Formatierungshilfe, sowie Yolly AI für cineastische Videoproduktion mit realistischen Sounds. Adobe Firefly bietet zudem neue Funktionen zur videobasierten Bearbeitung via natürlicher Sprache.

  • Meta präsentiert KI-Brille zur Verstärkung der Gesprächslautstärke

    Meta hat das Software-Update v21 für die Meta AI Brille vorgestellt, das es ermöglicht, die Stimme des Gesprächspartners in lauten Umgebungen klarer zu hören. Die Brille nutzt maschinelles Lernen, um das Sprachsignal aus fünf Mikrofonen zu analysieren und Hintergrundgeräusche mittels spektraler Subtraktion zu unterdrücken. Zusätzlich bietet Meta AI Funktionen zur visuellen Analyse und wird…

  • OpenAI ermöglicht Bildgenerierung direkt in ChatGPT

    OpenAI hat „ChatGPT Images“ eingeführt, eine Funktion, mit der Nutzer Bilder durch kurze Texteingaben im Chat generieren oder bearbeiten können. Funktionen erlauben das Ändern von Hintergründen, Stil- und Farbanpassungen, das Kombinieren mehrerer Fotos und das nahtlose Einfügen der eigenen Person in Szenen. Besonders hervorzuheben ist die „Likeness Retention“, die das Aussehen einer Person konsistent…