Vision-Zero ermöglicht domänenunabhängiges Training von Bildern-Sprach-Modellen durch Wettbewerbs-basierte visuelle Spiele, erzeugt aus beliebigen Bildpaaren, um robuste Modelle zu entwickeln.
Vision-Zero: Rahmenwerk für selbstüberwachtes Training von Vision-Language-Modellen
•