Beim subliminalen Lernen übernimmt ein Model durch Feinabstimmung auf scheinbar irrelevante Daten versteckte Verhaltensweisen seines Lehrmodells. Dabei werden bestimmte Konzepte und Tokens eng miteinander verknüpft, sodass das Auftauchen eines Tokens eine höhere Wahrscheinlichkeit für einen anderen erzeugt. Experimente mit Qwen-2.5 7B zeigen, wie diese Verflechtung Themenpräferenzen beeinflussen kann.
