概述
在学习法线贴图的过程中,有几个比较难以理解的概念,这里记录一下。特别说一下,本文的法线贴图是切线空间下的法线贴图。
空间变换
如上图所示,简单表达了在使用法线贴图的过程中,涉及到的几个空间变换:
切线空间:从法线贴图中采样得到的法线,在切线空间中;
对象空间:物体的本地坐标空间,顶点的相关信息,在对象空间;
世界空间:光源位置、观察者位置等,在世界空间中。
在空间变换的过程中,主要涉及到了两个变换矩阵:
\(TBN\)矩阵:从切线空间变换到对象空间;
\(Model\)矩阵:从对象空间变换到世界空间。
对于上述概念,大部分都是比较熟悉的,只有法线贴图、切线空间和\(TBN\)矩阵比较陌生。下面,将分别介绍一下。
法线贴图
在3D计算机图形学中,法线贴图是一种用于伪造凹凸光照的技术,是凹凸贴图的一种实现。它用于添加细节,而不使用更多的多边形。这种技术的一个常见用途是,通过从高精度多边形或高度图生成法线贴图,来极大地增强低精度多边形的外观和细节。下图来自Paolo Cignoni,图中对比了两种方式:
法线贴图通常存储为常规RGB图像,其中RGB分量分别对应于表面法线的X,Y和Z坐标。
法线的每个分量的值的范围是\([-1,1]\),而RGB分量的值的范围是\([0,1]\)。所以,在将法线存储为RGB图像时,需要对每个分量做一个映射: \[ vec3 \quad rgb\_normal = normal * 0.5 + 0.5 \] 这里要注意,将法线存储到法线贴图的过程中,需要进行上述操作。当我们从法线贴图中读取到法线数据后,需要进行上述变换的逆变换,即从\([0,1]\)映射到\([-1,1]\)。
切线空间
那么,法线向量应该相对于哪个坐标系呢?我们可以选择模型顶点的的坐标系,即对象空间;也可以选择模型纹理所在的坐标系,即切线空间,也称为纹理空间。
对象空间中,法线信息是相对于对象空间的朝向的,各个方向的法线向量都有,所有贴图看起来色彩比较丰富;而在切线空间中,法线是相对于顶点的,大致指向顶点信息中的法线方向,即法线向量接近于\((0,0,1)\),映射到RGB是\((0.5,0.5,1)\),这是一种偏蓝的颜色。下图分别是对象空间和切线空间下的法线纹理。
那么,怎么进行选择呢?考虑一下二者的优缺点:
重用性:对于对象空间的法线贴图,它是相对于特定对象的,假如应用到其他的对象上,可能效果就不正确了;而切线空间中的法线贴图,记录的是相对法线信息,所以可以把它应用到其他对象上,也能得到正确的结果。
可压缩:考虑到法线向量是单位向量,而且Z分量总是正的,可以只存储XY方向,而推导出Z方向。
综上所述,我们一般选择切线空间下的法线贴图。
\(TBN\)矩阵
在光照的计算过程中,需要用到光线方向、视线方向和法线方向等,为了得到正确的结果,这些变量必须在同一坐标系下计算。参考一下本文开头的“坐标变换示意图”。
在纹理坐标系中,x和y分量与2D图片的水平方向和垂直方向对齐,而z分量指向图片外部的上方。如下图所示:
为了正确使用贴图中的纹理信息,我们必须找到一种方法——从切线坐标空间变换到对象空间。这可以通过指定切线坐标系的坐标轴在对象空间中的方向来达到。
对一个单独的三角形面片来说,我们可以认为纹理贴图覆盖在三角形的表面上,如下图所示:
根据上图,可以得出:三角面片和纹理贴图是共面的。那么,根据平行四边形法则,可以得出: \[ \begin{matrix} E_{1} = \Delta U_{1}U + \Delta V_{1}V \\ E_{2} = \Delta U_{2}U + \Delta V_{2}V \\ \end{matrix} \] 其中,\(E_{1}\)和\(E_{2}\)是两个顶点之间的向量差,可以根据顶点的坐标计算出来;\(\Delta U_{1}\)、\(\Delta V_{1}\)、\(\Delta U_{2}\)和\(\Delta V_{2}\)分别是纹理坐标的水平和垂直方向的差,可以根据纹理坐标计算得到。\(U\)和\(V\)分别是纹理的水平和垂直坐标轴,是要计算的未知量。
写成坐标表示: \[ \begin{matrix} \left( E_{1x},E_{1y},E_{1z} \right) = \Delta U_{1}\left(U_{x},U_{y},U_{z}\right) + \Delta V_{1}\left( V_{x},V_{y},V_{z} \right) \\ \left( E_{2x},E_{2y},E_{2z} \right) = \Delta U_{2}\left(U_{x},U_{y},U_{z}\right) + \Delta V_{2}\left( V_{x},V_{y},V_{z} \right) \\ \end{matrix} \] 上面的方程,也可以写成矩阵乘法的形式: \[ \begin{bmatrix} E_{1x} & E_{1y} & E_{1z} \\ E_{2x} & E_{2y} & E_{2z} \\ \end{bmatrix}= \begin{bmatrix} \Delta U_{1} & \Delta V_{1} \\ \Delta U_{2} & \Delta V_{2} \\ \end{bmatrix} \begin{bmatrix} U_{x} & U_{y} & U_{z} \\ V_{x} & V_{y} & V_{z} \\ \end{bmatrix} \]
两边同时乘以\(\Delta U \Delta V\)的逆矩阵,可得: \[ \begin{bmatrix} U_{x} & U_{y} & U_{z} \\ V_{x} & V_{y} & V_{z} \\ \end{bmatrix}= \begin{bmatrix} \Delta U_{1} & \Delta V_{1} \\ \Delta U_{2} & \Delta V_{2} \\ \end{bmatrix}^{-1} \begin{bmatrix} E_{1x} & E_{1y} & E_{1z} \\ E_{2x} & E_{2y} & E_{2z} \\ \end{bmatrix} \]
求逆矩阵不太方便,可以使用伴随矩阵法: \[ \begin{bmatrix} U_x & U_y & U_z \\ V_x & V_y & V_z \end{bmatrix} = \frac{1}{\Delta U_1 \Delta V_2 - \Delta U_2 \Delta V_1} \begin{bmatrix} \Delta V_2 & -\Delta V_1 \\ -\Delta U_2 & \Delta U_1 \end{bmatrix} \begin{bmatrix} E_{1x} & E_{1y} & E_{1z} \\ E_{2x} & E_{2y} & E_{2z} \end{bmatrix} \]
至此,我们求出了\(U\)和\(V\)向量。但是我们需要的构成\(TBN\)空间的坐标轴是正交的,这里求出的\(U\)和\(V\)并不一定能满足正交的条件。这里,顶点的法线\(N\)是已知的,我们可以根据\(U\)、\(V\)和\(N\),根据格拉姆-施密特正交化方法,求出与\(N\)正交的\(T\)和\(B\)(此处假设切线空间是右手坐标系): \[ \begin{aligned} T &= normalize \left( U - dot \left( U,N \right) * N \right) \\ B &= normalize \left( cross \left( N,T \right) \right) \\ TBN &= mat3 \left( T,B,N \right) \end{aligned} \]
这样,我们获得了坐标轴相互正交的\(TBN\)矩阵。
实际使用中的法线贴图
看完上面计算切线空间的\(TBN\)矩阵的部分,估计也是头大。不禁想到,每次使用法线贴图的过程,真的如此麻烦吗?
幸运的是,答案是否定的。
一般情况下,模型存储的顶点信息中,都包含了顶点的法线和切线的数据,这样,我们就不用进行上面的复杂计算了,直接使用法线和切线的叉乘,求出副切线,从而构成\(TBN\)矩阵。