Die Version 3 von Depth Anything (DA3) kann räumlich konsistente Tiefenschätzungen aus Einzel- oder Mehrfachbildern erstellen, unabhängig von Kameraposen. Dafür nutzt das System einen einfachen Transformer-Backbone und eine einheitliche Tiefenstrahl-Repräsentation, was Architektur und Training vereinfacht.
