DirectX 11 3D 核心原理与着色器

之前提到了 MVP 变换，这里需要深入讲解为什么以及怎么做。这是 3D 引擎的数学心脏。

在 3D 图形学中，物体的运动（位移、旋转、缩放）都是通过4x4 矩阵来实现的。

齐次坐标 (Homogeneous Coordinates)：为了让平移（加法）也能用矩阵乘法表示，我们将 3D 向量 $(x,y,z)$ 扩展为 4D 向量 $(x,y,z,1)$ 。
变换顺序：矩阵乘法不满足交换律。标准的变换顺序是 $(Scale \time Rotation \times Translation)$ ** (SRT)**。
原理：先缩放（改变大小），再自转（改变朝向），最后平移（放到世界中的位置）。
如果先平移再缩放，物体会一边移动一边变大，产生错误的位移偏差。

在计算机图形学中，摄像机是不存在的。

相对运动原理：当你向左移动摄像机时，数学上等价于整个世界向右移动。
LookAt 矩阵：你需要提供三个向量——眼位置 (Eye)、目标点 (At/Focus)、头顶朝向 (Up)。DirectXMath 库会通过向量叉乘（Cross Product）构建出一个正交基，算出一个矩阵，将世界里的所有物体搬到摄像机面前。

为什么会有“近大远小”？这是由投影矩阵决定的。

视锥体 (Frustum)：摄像机能看到的空间是一个被切掉尖顶的金字塔形状。
FOV (Field of View)：视野角度。
非线性深度：投影后的 Z 值不是均匀分布的。近处的精度极高，远处的精度极低。这就是为什么要设置 NearZ (0.01) 和 FarZ (100.0)。如果 NearZ 设为 0，会导致 Z-Fighting（深度冲突，画面闪烁）。

C++ 代码（CPU）怎么告诉 Shader（GPU）这一帧的内容？

GPU 的寄存器是 SIMD（单指令多数据）架构，每个寄存器宽 128 位（16 字节，即 float4）。

如何把一张 2D 的纹理图贴在 3D 的球面上？

当 3D 物体离摄像机很近或很远时，一个屏幕像素可能对应纹理上的 0.1 个像素，也可能对应 100 个像素。

显卡如何保证不会发生透视，透过前面的物体看到后面的模型？

当像素着色器算出一个像素的颜色和深度 $Z_{new}$ 时：

这也是为什么每帧开始要 ClearDepthStencilView，把深度全部重置为 1.0（无限远）。

High Level Shading Language (HLSL) 是运行在显卡上的 C 语言变体。

在 HLSL 中，变量名不重要，重要的是冒号后面的标签。

float4 Pos : POSITION：告诉 GPU，这个变量存放的是顶点位置。
float2 Tex : TEXCOORD：告诉 GPU，这个变量存放的是纹理坐标。
float4 Pos : SV_POSITION：System Value。这是 Vertex Shader 的必须输出。它告诉光栅化器：“这就是我要你在屏幕上画的位置”。

从 Vertex Shader 输出的数据，传到 Pixel Shader 时，会发生线性插值。