Wissenswertes

  • Token-Verflechtung in subliminalem Lernen von Sprachmodellen

    Beim subliminalen Lernen übernimmt ein Model durch Feinabstimmung auf scheinbar irrelevante Daten versteckte Verhaltensweisen seines Lehrmodells. Dabei werden bestimmte Konzepte und Tokens eng miteinander verknüpft, sodass das Auftauchen eines Tokens eine höhere Wahrscheinlichkeit für einen anderen erzeugt. Experimente mit Qwen-2.5 7B zeigen, wie diese Verflechtung Themenpräferenzen beeinflussen kann.

  • Robustes Lernen mit verrauschten Labels durch ε-softmax

    Einfaches Verfahren namens ε-softmax verbessert die Toleranz von tiefen neuronalen Netzwerken gegenüber verrauschten Trainingsdaten (falschen Labels). Diese Anpassung der Softmax-Funktion erhöht die Robustheit beim Lernen und kann zu zuverlässigeren Modellen führen.

  • Elon Musk holt Meta-Ingenieure zu xAI – Potenzial höher als bei Meta

    Elon Musk berichtet, dass viele Top-Ingenieure von Meta auf Einladung zu xAI wechseln, ohne hohe Anfangsgehälter zu verlangen. Während Mark Zuckerberg intensiv bei OpenAI und anderen Firmen rekrutiert, wirbt Musk mit einer stark leistungsorientierten Firmenkultur und der Aussicht auf deutlich höhere Vergütungen für herausragende Leistungen.

  • Startup Cognition fordert von übernommenem Team 80-Stunden-Wochen

    Nach der Übernahme von Windsurf hat Cognition dem 200-köpfigen Team angeboten, entweder an Wochenenden zu arbeiten oder eine Abfindung von neun Monatsgehältern anzunehmen. Der CEO betont, dass er kein Konzept von Work-Life-Balance kenne und die Mission, die Zukunft der Softwareentwicklung zu gestalten, oberste Priorität habe. Viele Mitarbeiter sind regelmäßig auch nachts und am Wochenende…

  • Chinas Bemühungen um eigene KI-Strategie gegen USA

    China intensiviert den Aufbau eines eigenen KI-Ökosystems, das ohne westliche Technologie auskommt. Trotz US-Beschränkungen bei Kapital, Talenten und Technologie baut China seine Infrastruktur und Ausbildungsmöglichkeiten massiv aus. Künstliche Intelligenz gilt als entscheidend für zukünftige wirtschaftliche und militärische Macht.

  • ChatGPT nun für alle US-Bundesbehörden verfügbar

    OpenAI stellt ChatGPT allen US-Bundesbehörden zur Verfügung, inklusive Zugang zu GPT-4. Dabei wurden speziell auf Regierungsbedürfnisse zugeschnittene Sicherheits- und Compliance-Standards integriert, um einen sicheren und konformen Einsatz zu gewährleisten.

  • Unabhängige Benchmarks von OpenAIs gpt-oss-Modellen

    Ein aktueller Bericht vergleicht OpenAIs neues Modell gpt-oss-120b mit anderen Open-Weights-Modellen. Das US-Modell ist das intelligenteste seiner Art aus den USA, liegt in puncto Intelligenz hinter DeepSeek R1 und Qwen3 235B, bietet aber Effizienzvorteile.

  • Überblick zur Forschung an KI-„Schaltkreisen“ und Interpretierbarkeit

    Ein interaktives Lehrbuch erklärt neue Forschungsmethoden, mit denen Wissenschaftler einzelne Rechenschritte („Schaltkreise“) in KI-Modellen nachvollziehen können – ähnlich neuronaler Aktivierungsmuster im Gehirn. Darin wird gezeigt, wie Sprachmodelle zunächst sprachunabhängig argumentieren, bevor sie sprachspezifische Merkmale hinzufügen, sowie Erkenntnisse zu Reimbilderkennung und geografischem Denken.

  • Automatisierte Sicherheitsüberprüfungen mit Claude Code

    Anthropic hat eine neue Funktion in Claude Code vorgestellt, die Sicherheitsprüfungen im Code automatisiert. Durch Integration mit GitHub Actions und dem Befehl /security-review können Entwickler schnell Sicherheitslücken erkennen und beheben.

  • ElevenLabs startet KI-Musikservice „Eleven Music“

    ElevenLabs hat „Eleven Music“ vorgestellt, einen Dienst zur Generierung von Musik mittels KI. Nutzer geben einfache Textaufforderungen ein, woraufhin das KI-Modell innerhalb von Minuten ein Musikstück mit Gesang und Instrumenten erstellt. Das Modell wurde mit Künstlerrechten abgestimmten Daten trainiert und enthält Schutzmechanismen, um missbräuchliche Inhalte wie gewaltverherrlichende oder obszöne Texte zu vermeiden.