•
ElevenLabs hat eine KI vorgestellt, die individuelle Musikstücke passend zu Video-Uploads erstellt. Anwender laden Videos hoch, die KI analysiert die Szenen und generiert automatisch einen Soundtrack. Dies ist ideal, um TikTok-Videos, Werbespots oder Präsentationen schnell zu vertonen.
•
Alibaba hat mit Qwen Image Edit ein Open-Source-Tool veröffentlicht, das Bildbearbeitung per natürlicher Sprache ermöglicht – ganz ohne Photoshop. Nutzer können Perspektiven ändern, Stile austauschen und kontextuelle Änderungen wie Objekte oder Hintergründe integrieren. Dies verspricht Freiheiten für Kreative und Startups ohne Adobe-Abhängigkeit.
•
Neue AI-Modelle wie das Nano-Banana-Modell von Google und Alibabas Qwen-Image-Edit ermöglichen einfache Bildbearbeitung per Textanweisung. Nano-Banana eignet sich besonders für Bildkombinationen, während Qwen schrittweise Bearbeitung bietet, erfordert aber genaue Prompts. Für Unternehmen sind insbesondere Anpassungen von Produktfotos und Markenelementen interessant. Bei deutschen Texten gibt es noch Schwächen.
•
Das AI-Unternehmen Higgsfield, gegründet vom früheren AI-Leiter bei Snapchat, bietet ein „Draw-to-Video“-Tool, mit dem Nutzer per Text, Zeichnungen und Bildern dynamische Videos erschaffen können. Die Funktion ermöglicht vielfältige kreative Effekte und Produktplatzierungen. Die Nutzung erfolgt über ein kostenpflichtiges Abo, bietet aber unbegrenzte Videokreationen mit dem Minimax-Modell und setzt neue Standards in der AI-Videoentwicklung.
•
Die AInauten haben über 40 spezialisierte GPT-Modelle entwickelt, die bei vielen täglichen Aufgaben unterstützen – von Schreibstil-Emulation über Marketing bis Video-Prompt-Erstellung. Alle Tools sind kostenlos und sofort einsatzbereit. Wer selbst GPTs entwickeln möchte, wird auf ein entsprechendes Prompting-Training verwiesen.
•
Perplexity Comet ist ein AI-gestützter Chromium-basierter Browserassistent, der eigenständig vielfältige Aufgaben wie Ticketbearbeitung, E-Mail-Verwaltung und Reisebuchungen durchführt. Mit Sprach-Features und starkem Tracking-Schutz stellt Comet eine ernstzunehmende Konkurrenz zu Google, Microsoft und OpenAI dar. Besonders für Power-User eignet sich das Tool zur Automatisierung von Routineaufgaben.
•
Google erweitert NotebookLM um Deep Research Funktionen, wodurch Nutzer Quellen über das Web und Google Drive einfacher suchen und relevante Forschungsinhalte direkt in ihre Notizen einfügen können.
•
Produktive KI-Systeme wie Google Gemini CLI können durch versteckte, in Bildern eingebettete Aufforderungen dazu verleitet werden, gegen ihre Richtlinien zu handeln. Solche Bildskalierungsangriffe sind derzeit eine Sicherheitslücke.
•
Die mittlere Befehlsausführung bei Gemini verbraucht etwa 0,24 Wattstunden – vergleichbar mit einer Sekunde Mikrowellenbetrieb oder neun Sekunden Fernsehschauen. Dies gibt erstmals Einsicht in den realen Energieverbrauch von KI-Anwendungen.
•
Laut David Luan, Leiter von Amazons AGI-Forschungslabor, ist die Entwicklung von KI von Chatbots hin zu verlässlich die realen Aufgaben erfüllenden Agenten ein zentrales Thema. Aktuell sind diese Agenten noch unzuverlässig, aber die Branche arbeitet intensiv an Verbesserungen.