Die einfachste Darstellung eines 3D-Objektes auf eine 2D-Oberfläche ist die Projektion des 3D-Objektes auf die xy-Ebene. Mit anderen Worten: Das Objekt wird im 3D-Raum korrekt in allen Koordinaten berechnet. Anschließend werden nur die x- bzw. y-Koordinaten dargestellt.
Abbildung 26 zeigt einen Würfel (die Vorderseite ist durch zwei sich kreuzende Linien gekennzeichnet). Der Würfel wurde vor der Darstellung in der xy-Ebene um die x-Achse (-11,25°) und die y-Achse (22,5°) rotiert. Dabei entsteht, wie die Abbildung zeigt, ein räumliches Gebilde, das aber nicht perspektivisch verzerrt ist. Das entspricht nicht den Sehgewohnheiten und wird daher als unnatürlich empfunden.
Eine verbesserte Darstellung ergibt sich mit der Einführung einer perspektivischen Verzerrung des Objektes. Die Erfahrung lehrt, dass die Perspektive vom Blickwinkel und der Entfernung des Beobachters vom Objekt abhängig ist. Dem wird durch die Einführung eines „Kamerastandortes“ und einer „Kamerabrennweite“ Rechnung getragen. Der Kamerastandort ist parallel zur z-Achse verschiebbar (Distance d). Sollten auch Winkelvariationen gewünscht sein, werden diese den jeweiligen Rotationswinkeln des Objektes additiv zugeschlagen.
Das ist erlaubt, da Kamerabewegung und Objektbewegung relativ zueinander erfolgen und es dem Beobachter nicht möglich ist, beide Bewegungen voneinander zu trennen. Für die abstandsrichtige Darstellung eines Objektes ist also die Translation des Objektes parallel zur z-Achse genügend:
\( D = \left( {\begin{array}{cc}1&0&0&0\\0&1&0&0\\0&0&1&d\\0&0&0&1\end{array} } \right) \) Gl. 243
Komplexer ist die perspektivisch bedingte Verzerrung des Objektes in der Tiefe. Offenbar verjüngt sich das wahrgenommene Objekt mit zunehmender Entfernung vom Betrachter. Das hat seine Ursache darin, dass im Auge des Betrachters Höhe und Breite eines Objektes winkelproportional auf der Netzhaut abgebildet werden:
Nach Abbildung 27 ergibt sich die wahrgenommene Objekthöhe h´ aus dem Verhältnis von Brennweite f zu Objektentfernungz multipliziert mit der wirklichen Objekthöhe h:
\( h':h = f:z \) Gl. 244
In der Metrizenwelt stellt sich diese Operation als eine Skalierung des Objektes dar, die von der Objekttiefe z abhängt:
\( s(z) = \frac{f}{z} \) Gl. 245
D.h. zunächst wird das Objekt einschließlich der vom Kamerastandort herrührenden Verschiebung in der Tiefe berechnet. Dann kann die Tiefe z jedes Objektpunktes getrennt bestimmt werden, die wiederum zu einer individuellen Skalierung gemäß Gl. 245 führt:
\( S = \left( {\begin{array}{cc} {s(z)} & 0 & 0 & 0 \\ 0 & {s(z)} & 0 & 0 \\ 0 & 0 & 1 & 0 \\ 0 & 0 & 0 & 1 \end{array} } \right) \) Gl. 246
Anschließendes Ausmultiplizieren der Vektoren mit der Skalierungsmatrix führt dann zum Endergebnis:
Abbildung 28 zeigt das gleiche Objekt wie in Abbildung 26, allerdings aus einer Entfernung von 10 Einheiten bei einer Brennweite von ebenfalls 10 Einheiten.