1. 定位导航上一篇建立了数据容器(标量→张量)的概念。本篇进入运算——矩阵乘法是深度学习中最高频、最耗计算的操作。一个全连接层的前向传播y = Wx + b,其中Wx就是一次矩阵-向量乘法。整个神经网络的训练过程,从前向传播到反向传播,本质上就是一连串矩阵乘法和逐元素运算的组合。本篇覆盖三个核心知识点:矩阵乘法(含点积和 Hadamard 乘积)、逆矩阵、线性方程组的解的存在性。2. 核心问题给定一个训练好的神经网络权重矩阵 W 和一个输入向量 x,如何计算输出?这就是矩阵乘法。反过来,如果已知输出 b 和权重 A,能否反推输入 x?这就是求解线性方程组 Ax = b。这个问题的答案取决于矩阵 A 的性质——它可能有唯一解、无穷多解、或者无解。3. 矩阵乘法3.1 定义两个矩阵 A 和 B 的乘积 C = AB,要求A 的列数等于 B 的行数。如果 A 的形状是 m×n,B 的形状是 n×p,那么 C 的形状是 m×p。每个元素的计算公式:Ci,j=∑kAi,kBk,jC_{i,j} =