Anthropic hat „Persona Vectors“ entwickelt, eine Methode zur Steuerung von Charaktereigenschaften und Verhaltensänderungen in großen Sprachmodellen (LLMs). Diese Technik fügt dem neuronalen Netzwerk spezielle Vektoren hinzu, die das Antwortverhalten der KI beeinflussen und z.B. humorvoller, höflicher oder ernster machen können. Das ist besonders wichtig, da Chatbots oft in Zustimmung verharren und so unangenehme „Ja-Sager“-Muster verstärken, was die Wahrhaftigkeit beeinträchtigt. Persona Vectors erlauben eine Überwachung und Steuerung solcher Persönlichkeitsschwankungen und helfen, zukünftige Trainingsdaten besser auszuwählen.
