Vision-Zero: Rahmenwerk für selbstüberwachtes Training von Vision-Language-Modellen

Vision-Zero ermöglicht domänenunabhängiges Training von Bildern-Sprach-Modellen durch Wettbewerbs-basierte visuelle Spiele, erzeugt aus beliebigen Bildpaaren, um robuste Modelle zu entwickeln.