•
Alibaba hat mit Qwen Image Edit ein Open-Source-Tool veröffentlicht, das Bildbearbeitung per natürlicher Sprache ermöglicht – ganz ohne Photoshop. Nutzer können Perspektiven ändern, Stile austauschen und kontextuelle Änderungen wie Objekte oder Hintergründe integrieren. Dies verspricht Freiheiten für Kreative und Startups ohne Adobe-Abhängigkeit.
•
Neue AI-Modelle wie das Nano-Banana-Modell von Google und Alibabas Qwen-Image-Edit ermöglichen einfache Bildbearbeitung per Textanweisung. Nano-Banana eignet sich besonders für Bildkombinationen, während Qwen schrittweise Bearbeitung bietet, erfordert aber genaue Prompts. Für Unternehmen sind insbesondere Anpassungen von Produktfotos und Markenelementen interessant. Bei deutschen Texten gibt es noch Schwächen.
•
Das AI-Unternehmen Higgsfield, gegründet vom früheren AI-Leiter bei Snapchat, bietet ein „Draw-to-Video“-Tool, mit dem Nutzer per Text, Zeichnungen und Bildern dynamische Videos erschaffen können. Die Funktion ermöglicht vielfältige kreative Effekte und Produktplatzierungen. Die Nutzung erfolgt über ein kostenpflichtiges Abo, bietet aber unbegrenzte Videokreationen mit dem Minimax-Modell und setzt neue Standards in der AI-Videoentwicklung.
•
Perplexity Comet ist ein AI-gestützter Chromium-basierter Browserassistent, der eigenständig vielfältige Aufgaben wie Ticketbearbeitung, E-Mail-Verwaltung und Reisebuchungen durchführt. Mit Sprach-Features und starkem Tracking-Schutz stellt Comet eine ernstzunehmende Konkurrenz zu Google, Microsoft und OpenAI dar. Besonders für Power-User eignet sich das Tool zur Automatisierung von Routineaufgaben.
•
Google erweitert NotebookLM um Deep Research Funktionen, wodurch Nutzer Quellen über das Web und Google Drive einfacher suchen und relevante Forschungsinhalte direkt in ihre Notizen einfügen können.
•
Produktive KI-Systeme wie Google Gemini CLI können durch versteckte, in Bildern eingebettete Aufforderungen dazu verleitet werden, gegen ihre Richtlinien zu handeln. Solche Bildskalierungsangriffe sind derzeit eine Sicherheitslücke.
•
Die mittlere Befehlsausführung bei Gemini verbraucht etwa 0,24 Wattstunden – vergleichbar mit einer Sekunde Mikrowellenbetrieb oder neun Sekunden Fernsehschauen. Dies gibt erstmals Einsicht in den realen Energieverbrauch von KI-Anwendungen.
•
Laut David Luan, Leiter von Amazons AGI-Forschungslabor, ist die Entwicklung von KI von Chatbots hin zu verlässlich die realen Aufgaben erfüllenden Agenten ein zentrales Thema. Aktuell sind diese Agenten noch unzuverlässig, aber die Branche arbeitet intensiv an Verbesserungen.
•
GM hat in den letzten acht Monaten fast ein Dutzend Fachkräfte aus führenden Tech-Unternehmen eingestellt, um ein kleines, aber exklusives AI Center of Excellence zu etablieren. Das Team unterstützt Führungskräfte bei der effektiven KI-Nutzung in Produktion und Technik und berät bei Partnerschaften und Lieferantenverträgen.
•
Während internetbasierte Daten gute Dienste leisten, stoßen sie an Grenzen. Für die nächste Generation von LLM- und NLP-Modellen sind hochwertige, menschlich kuratierte Lexikaldaten entscheidend. Ein Whitepaper der Oxford Languages bietet vertiefte Einblicke.