Wissenswertes

  • 11Labs startet KI-Musikgenerierung

    11Labs erweitert sein Angebot um die KI-basierte Musikproduktion. Nutzer können Stilrichtungen beschreiben und erhalten in Echtzeit generierte Texte samt Instrumentalbegleitung. Die Plattform eignet sich ideal für Jam-Sessions, Demo-Erstellung und genre-spezifische Tracks auch ohne Gesang. Musiker können Begleitungen erstellen und darüber eigene Solos spielen.

  • Weitere wichtige KI-Neuigkeiten und Tools

    Qwen-Image beeindruckt als eines der besten kostenlosen Bildmodelle mit realistischer und stilisierter Bildgenerierung sowie genauer Texterkennung. Leonardo.ai bietet nun auch Bild-zu-Video-Generierung. Grok erlaubt das Erstellen kurzer animierter Videos mit Ton, Gemini Storybooks produziert illustrierte Kinderbücher aus kurzen Texten. Google Kaggle startet ein KI-Schachturnier zur Evaluierung von Modellfähigkeiten, und Midjourney stellt hochauflösende Videooptionen bereit.

  • DeepMind präsentiert Genie 3 – Interaktive KI-Spielwelten

    Google DeepMind stellte Genie 3 vor, ein KI-Modell, das in Echtzeit spielbare, dynamische Welten erzeugt. Nutzer steuern die Umgebung per Pfeiltasten, während neue Bildsequenzen generiert werden. Anwendungsbereiche reichen von Bildung über immersive Geschichten bis zu simuliertem Gameplay. Die Entwicklung könnte die Entstehung einer neuen Gaming-Plattform ähnlich Roblox einleiten.

  • GPT-5 ist da – Eine neue Ära der KI

    GPT-5 wurde am 7. August 2025 veröffentlicht und setzt mit herausragender Leistung in den Bereichen Mathematik, Naturwissenschaften, Programmierung und allgemeiner Intelligenz neue Maßstäbe. Es passt seine Komplexität automatisch an und unterstützt verschiedene Persönlichkeiten. Die Nutzung ist für alle kostenlos, mit erweitertem Zugriff für Pro- und Team-Abonnenten. Die Integration in Microsoft Copilot und Entwicklerwerkzeuge ist…

  • OpenAI öffnet GPT-Modelle mit GPT-OSS

    OpenAI hat zwei leistungsstarke Open-Weight-Modelle veröffentlicht: GPT-OSS 20B und GPT-OSS 120B. Diese sind vollständig herunterladbar, laufen lokal oder in der Cloud und weisen eine Leistung auf GPT-4-Niveau auf. Nutzer können sie frei feinjustieren und einsetzen, ohne Daten an OpenAI senden zu müssen. Ideal für Unternehmen und Entwickler, die volle Kontrolle über KI-Lösungen benötigen.

  • Diskussion über OpenAI-Preispolitik

    Es wird vermutet, dass OpenAI Marktwert durch die Preisgestaltung von ChatGPT bei 20 US-Dollar teilweise verloren hat. Die Kurzfassung bietet dazu eine schnelle Einschätzung.

  • Physikalisch steuerbare Neu-Beleuchtung von Fotografien

    Die Studie präsentiert eine selbstüberwachte Methode zur realistischen und physikalisch akkuraten Bildneu-Beleuchtung „in freier Wildbahn“. Sie kombiniert traditionelle Rendering-Physik mit neuronalen Darstellungen und ermöglicht so präzise Lichtsteuerung, bekannt aus 3D-Grafikwerkzeugen, auf realen Fotos.

  • Analyse: Wie gut ist das Open-Source-Modell gpt-oss-120b wirklich?

    Eine Untersuchung zeigte, dass gpt-oss-120b im privaten Benchmark LiveBench besonders schlecht abgeschnitten hat, obwohl es bei der Veröffentlichung vielversprechend wirkte. Dies wirft Fragen zur Benchmark-Überprüfung und möglichen Anpassungen bei OpenAI auf, ohne jedoch eindeutige Beweise für Manipulation zu liefern.

  • Elon Musks xAI stellt Grok 4 weltweit kostenlos bereit

    Grok 4 von xAI ist jetzt global für alle Nutzer kostenlos mit großzügigen Nutzungslimits verfügbar. Es bietet einen Auto-Modus, der selbständig die Tiefe der Antwort wählt, und einen Experten-Modus für manuelle eingehendere Antworten. Der leistungsstärkere Grok 4 Heavy bleibt hingegen Premium-Abonnenten vorbehalten.

  • OpenAI-Rechenpriorisierung in den kommenden Monaten

    OpenAI wird zuerst die Nutzung für zahlende ChatGPT-Nutzer verbessern, danach die API-Nachfrage entsprechend Kapazität und Kundenverpflichtungen priorisieren. Anschließend sollen Qualität und Verfügbarkeit des kostenlosen ChatGPT-Tarifs verbessert und weitere API-Anfragen bedient werden.